코드 위의 하루 (A Day on the Code)

📊 ADsP 실시간 기록 | 2일차 – 빅데이터 전략과 분석 기획의 시작 본문

📊 ADsP 실시간 기록

📊 ADsP 실시간 기록 | 2일차 – 빅데이터 전략과 분석 기획의 시작

code.with.siyeon 2025. 6. 28. 20:13

📅 2025년 5월 20일 (2일차)
🎓 데이터 분석 준전문가(ADsP) 자격과정 실시간 기록


✨ 오늘의 주제

“빅데이터를 어떻게 실전에서 활용할 것인가?”
“분석은 기획에서 시작된다.”

이날은 단순히 데이터를 모으는 걸 넘어서,
그 데이터를 어떻게 활용하고 전략화할 것인가에 집중했다.


📌 오늘 배운 핵심 내용

✅ 1. 빅데이터 활용 기법 & 위기요인

  • 활용 기법: 고객 세분화, 추천 시스템, 사기 탐지, 스마트 팩토리 등
  • 위기 요인:
    • 개인정보 유출
    • 데이터 편향
    • 해석 오류
  • 통제 방안:
    • 가명처리/비식별화
    • 알고리즘 투명성 확보
    • 거버넌스 체계 수립

✅ 2. 개인정보 비식별화

  • 비식별 조치: 개인정보를 직접 식별할 수 없도록 처리
  • 대표 기법:
    • 총계처리: 구간화
    • 데이터 마스킹
    • 노이즈 추가
    • k-익명성: 특정 집단 내 구별되지 않도록 설계

✅ 3. 빅데이터 활용 사례

  • 🎯 마케팅: 개인 맞춤 광고, 이탈 예측
  • 🏥 의료: 질병 예측, 환자 위험군 분석
  • 🚗 교통: 혼잡도 예측, 실시간 내비게이션
  • 🛍 유통: 수요 예측, 재고 최적화

💡 활용의 핵심은 “데이터 기반 의사결정”


✅ 4. 분석 기획과 전략 인사이트

🧭 분석 기획이란?

  • 데이터 분석을 수행하기 전,
    목표와 방법을 명확히 정의하는 사전 설계 과정

🎯 목표 시점별 분석 기획

시점 기획 관점
사전 목적/데이터 확인, 문제 정의
수행 중 일정 조율, 추가 데이터 고려
완료 후 개선 사항 도출, 인사이트 정리
 

✅ 기획 시 고려사항

  • 분석 목적의 명확성
  • 실현 가능성 (데이터 존재 여부)
  • 이해관계자 요구사항 반영
  • 시간/비용/기술적 제약 고려

✅ 5. 데이터 유형과 저장 방식

구분 설명 저장 방식
정형 엑셀, DB RDBMS
반정형 JSON, XML NoSQL
비정형 이미지, 음성 빅데이터 시스템 (Hadoop 등)
 

✅ 6. 데이터 분석 방법론

방법론 설명
KDD 데이터 → 패턴 탐색 → 지식 도출
CRISP-DM 비즈니스 이해 → 데이터 준비 → 모델링 → 평가
빅데이터 분석 방법론 대규모 분산 환경 기반의 분석 기획 흐름 포함
 

🔁 분석도 계획→수집→정제→탐색→모델링→활용의 순환 과정임을 이해하는 것이 중요!


🧠 오늘의 느낀 점

  • 데이터 분석은 단순히 ‘데이터를 돌리는 일’이 아니라, 전략적으로 문제를 푸는 일이라는 걸 실감했다.
  • 특히 비식별화는 기술적 조치일 뿐 아니라, 데이터 윤리를 위한 필수 요소임을 배웠고,
  • 분석 기획’의 개념은 내가 참여하는 프로젝트 기획과도 밀접하게 닿아 있었다.

💬 인상 깊었던 문장

“데이터가 아니라, 데이터를 바라보는 관점이 경쟁력이다.”

이 문장이 계속 마음에 남는다.
분석 기획은 결국 질문을 잘 던지는 것에서 시작된다는 것을 깨달은 하루였다.