[Architecture] 빅데이터 프로젝트의 3가지 유형: 구축부터 운영까지


 오늘은 실무에서 마주하는 대표적인 빅데이터 프로젝트 3가지에 대해 알아보려고한다. 


1. 플랫폼 구축형 프로젝트

목표: 대용량 데이터를 안정적으로 적재하고, 분석가들이 마음껏 데이터를 추출할 수 있는 '데이터 놀이터' 완성
  • 전형적인 빅데이터 SI(System Integration) 구축형 사업
  • 빅데이터의 하드웨어와 소프트웨어를 설치 및 구성
  • 수집 → 적재 → 처리 → 탐색 → 분석의 기능을 구현
  • 3~6 개월정도로 추진 (※ 규모에 따라 차이)

2. 빅데이터 분석 프로젝트

목표: "다음 달 매출은?" 또는 "이 고객이 이탈할까?"와 같은 구체적인 비즈니스 질문에 대한 해답 도출
  • 빅데이터 플랫폼 구축 완료후 수행
  • 빅데이터 탐색으로 데이터의 이해가 높아질때 시작
  • 조직의 가치사슬 중, 대규모 분석이 필요한 시점에 추진
  • 1~3개월 일정으로 추진
  • 분석주제영역 – 마케팅/고객 , 상품/서비스 개발, 리스크 관리
  • 장시간에 걸쳐 많은 실패와 시도가 있어야 가치가 높아짐

3. 빅데이터 운영 프로젝트

목표: 24시간 장애 없는 시스템 가용성 보장 및 데이터 신뢰도 유지
  • 구축 완료된 플랫폼을 중장기적으로 유지 관리
  • 대규모 하드웨어/소프트웨어로 운영 비용 높음
  • 빅데이터 분야별 전문가 그룹이 확보 되야 함
  • 빅데이터 거버넌스 체계를 수립 해야 함
  • 여러 부서 업무 담당자들이 빅데이터 시스템에 들어와서 분석하는 거버넌스 시스템

💡 프로젝트 유형별 한눈에 비교

구분플랫폼 구축 (Build)빅데이터 분석 (Insight)인프라 운영 (Operation)
비유고속도로 건설자동차 경주 및 분석도로 유지보수 및 순찰
핵심 가치확장성, 안정성정확도, 비즈니스 가치가용성, 데이터 품질
산출물데이터 레이크, 파이프라인예측 모델, 인사이트 보고서모니터링 시스템, 운영 매뉴얼

4. 빅데이터 프로젝트에 대한 최신 동향  

최근 트렌드는 이 세 가지 영역의 경계가 점점 허물어지고 있다는 점이다. 클라우드와 K8s(Kubernetes) 같은 인프라 기술이 발전하면서, 굳이 팀을 나누지 않아도 파이프라인 위에서 모든 과정을 자동화할 수 있게 된 것이 이 트렌드를 이끄는 원동력이다. 이를 대표하는 용어가 바로 DataOps와 MLOps다.

과거에는 "누가 이 시스템을 만들었는가?"가 중요했다면, 이제는 "데이터가 얼마나 빠르고 안전하게 비즈니스 가치로 변환되어 고객에게 도달하는가?"가 핵심이 되었다.




댓글 쓰기

0 댓글