오늘은 실무에서 마주하는 대표적인 빅데이터 프로젝트 3가지에 대해 알아보려고한다.
1. 플랫폼 구축형 프로젝트
목표: 대용량 데이터를 안정적으로 적재하고, 분석가들이 마음껏 데이터를 추출할 수 있는 '데이터 놀이터' 완성
- 전형적인 빅데이터 SI(System Integration) 구축형 사업
- 빅데이터의 하드웨어와 소프트웨어를 설치 및 구성
- 수집 → 적재 → 처리 → 탐색 → 분석의 기능을 구현
- 3~6 개월정도로 추진 (※ 규모에 따라 차이)
2. 빅데이터 분석 프로젝트
목표: "다음 달 매출은?" 또는 "이 고객이 이탈할까?"와 같은 구체적인 비즈니스 질문에 대한 해답 도출
- 빅데이터 플랫폼 구축 완료후 수행
- 빅데이터 탐색으로 데이터의 이해가 높아질때 시작
- 조직의 가치사슬 중, 대규모 분석이 필요한 시점에 추진
- 1~3개월 일정으로 추진
- 분석주제영역 – 마케팅/고객 , 상품/서비스 개발, 리스크 관리
- 장시간에 걸쳐 많은 실패와 시도가 있어야 가치가 높아짐
3. 빅데이터 운영 프로젝트
목표: 24시간 장애 없는 시스템 가용성 보장 및 데이터 신뢰도 유지
- 구축 완료된 플랫폼을 중장기적으로 유지 관리
- 대규모 하드웨어/소프트웨어로 운영 비용 높음
- 빅데이터 분야별 전문가 그룹이 확보 되야 함
- 빅데이터 거버넌스 체계를 수립 해야 함
- 여러 부서 업무 담당자들이 빅데이터 시스템에 들어와서 분석하는 거버넌스 시스템
💡 프로젝트 유형별 한눈에 비교
| 구분 | 플랫폼 구축 (Build) | 빅데이터 분석 (Insight) | 인프라 운영 (Operation) |
| 비유 | 고속도로 건설 | 자동차 경주 및 분석 | 도로 유지보수 및 순찰 |
| 핵심 가치 | 확장성, 안정성 | 정확도, 비즈니스 가치 | 가용성, 데이터 품질 |
| 산출물 | 데이터 레이크, 파이프라인 | 예측 모델, 인사이트 보고서 | 모니터링 시스템, 운영 매뉴얼 |
4. 빅데이터 프로젝트에 대한 최신 동향
최근 트렌드는 이 세 가지 영역의 경계가 점점 허물어지고 있다는 점이다. 클라우드와 K8s(Kubernetes) 같은 인프라 기술이 발전하면서, 굳이 팀을 나누지 않아도 파이프라인 위에서 모든 과정을 자동화할 수 있게 된 것이 이 트렌드를 이끄는 원동력이다. 이를 대표하는 용어가 바로 DataOps와 MLOps다.
과거에는 "누가 이 시스템을 만들었는가?"가 중요했다면, 이제는 "데이터가 얼마나 빠르고 안전하게 비즈니스 가치로 변환되어 고객에게 도달하는가?"가 핵심이 되었다.
0 댓글