1. KPI (Key Performance Indicator) – 핵심 성과 지표
목표 달성을 평가하기 위한 주요 지표.
예시: 광고 클릭률, 회원가입 전환율 등 비즈니스 목표와 연결된 지표
2. ETL (Extract, Transform, Load) – 데이터 처리 과정
데이터를 추출(Extract) → 변환(Transform) → 적재(Load)하는 과정.
예시: MySQL에서 데이터를 가져와 클린징 후 데이터 웨어하우스에 저장
3. A/B 테스트 – 실험 기반 의사 결정
두 개 이상의 버전을 비교하여 최적의 성과를 찾는 실험.
예시: 버튼 색상을 A(파란색)와 B(빨간색)로 나누어 클릭율 비교
4. Cohort Analysis (코호트 분석) – 특정 그룹의 행동 분석
같은 특성을 가진 사용자 그룹을 나누어 분석하는 방법.
예시: 2024년 1월 가입자의 3개월 후 재방문율 분석
5. Funnel Analysis (퍼널 분석) – 사용자 전환 과정 분석
사용자가 목표 행동(구매, 회원가입 등)을 수행하는 과정에서 이탈률을 분석하는 방법.
예시: 장바구니 → 결제 페이지 → 결제 완료까지의 단계별 이탈률 확인
6. Retention Rate (리텐션율) – 사용자 유지율
일정 기간 후에도 서비스를 유지하는 사용자 비율.
예시: 앱을 설치한 사용자 중 7일 후에도 사용하는 비율
7. Churn Rate (이탈률) – 서비스 이탈 비율
서비스를 떠난 사용자 비율.
예시: 한 달간 구독을 해지한 고객 비율
8. SQL (Structured Query Language) – 데이터베이스 쿼리 언어
데이터베이스에서 데이터를 조회하고 처리하는 언어.
예시: SELECT * FROM users WHERE country = 'Korea';
9. Data Pipeline (데이터 파이프라인) – 자동화된 데이터 처리 과정
데이터를 수집, 가공, 저장하여 분석할 수 있도록 만드는 시스템.
예시: Airflow를 이용한 매일 새벽 3시 자동 데이터 적재
10. BI (Business Intelligence) – 데이터 시각화 및 분석 도구
데이터를 시각화하고 인사이트를 도출하는 도구.
예시: Power BI, Tableau, Looker를 사용한 대시보드 생성
11. DAU (Daily Active Users) – 일간 활성 사용자 수
하루 동안 서비스를 이용한 사용자 수.
예시: 하루 평균 DAU가 50만 명
12. MAU (Monthly Active Users) – 월간 활성 사용자 수
한 달 동안 한 번이라도 서비스를 이용한 사용자 수.
예시: 한 달간 앱을 이용한 사용자가 100만 명
13. CAC (Customer Acquisition Cost) – 고객 획득 비용
한 명의 고객을 유치하는 데 드는 평균 비용.
예시: 광고비 500만 원으로 1000명의 고객을 유치 → CAC = 5,000원
14. LTV (Lifetime Value) – 고객 생애 가치
한 명의 고객이 서비스에 머무는 동안 창출하는 총 매출.
예시: 평균적으로 한 고객이 1년 동안 30만 원을 소비하면 LTV = 30만 원
15. ROI (Return on Investment) – 투자 대비 수익률
투자한 비용 대비 수익을 측정하는 지표.
예시: 광고비 100만 원을 투자해 300만 원 매출 발생 → ROI = 200%
16. Conversion Rate (전환율) – 목표 행동 완료 비율
사이트 방문자 중 목표 행동(구매, 가입 등)을 완료한 비율.
예시: 방문자 1000명 중 50명이 구매 → 전환율 5%
17. Bounce Rate (이탈률) – 한 페이지 방문 후 즉시 이탈하는 비율
사용자가 추가 페이지 이동 없이 사이트를 떠나는 비율.
예시: 방문자의 40%가 첫 페이지에서 바로 나감
18. Session (세션) – 방문자 활동 단위
사용자가 웹사이트에서 활동하는 시간 단위.
예시: 평균 세션 지속 시간 3분 20초
19. Pageviews (페이지뷰) – 특정 페이지가 조회된 총 횟수
웹사이트에서 특정 페이지가 조회된 횟수.
예시: 블로그 글이 한 달간 10만 회 조회됨
20. Heatmap (히트맵) – 사용자 행동 시각화
사용자가 웹사이트에서 많이 클릭하거나 머무르는 영역을 시각화.
예시: 결제 버튼 주변이 가장 많이 클릭됨
21. Outlier (이상치) – 일반적인 패턴에서 벗어난 데이터
데이터에서 비정상적으로 튀는 값.
예시: 평균 매출 10만 원인 가게에서 하루 매출 1억 원 발생
22. Data Wrangling (데이터 정제) – 데이터 가공 및 전처리
분석을 위해 데이터를 깨끗하게 정리하는 과정.
예시: 결측값 제거, 중복 데이터 삭제
23. Feature Engineering (특징 엔지니어링) – 모델 성능 향상 기법
머신러닝 모델의 성능을 높이기 위해 데이터를 변환하는 작업.
예시: 날짜 데이터를 '요일'과 '월'로 분리하여 추가 변수 생성
24. Normalization (정규화) – 데이터 범위 조정
데이터를 0~1 사이의 범위로 변환하여 모델 학습을 돕는 기법.
예시: (값 - 최소값) / (최대값 - 최소값)
25. Standardization (표준화) – 평균과 표준편차를 이용한 데이터 변환
데이터를 평균 0, 표준편차 1로 변환하는 과정.
예시: (값 - 평균) / 표준편차
26. API (Application Programming Interface) – 데이터 호출 인터페이스
서로 다른 시스템이 데이터를 주고받을 수 있도록 해주는 도구.
예시: 날씨 API를 호출해 실시간 기온 가져오기
27. Web Scraping (웹 스크래핑) – 웹 데이터 수집
웹사이트에서 데이터를 자동으로 가져오는 기술.
예시: Python의 BeautifulSoup을 사용해 뉴스 데이터 수집
28. Data Warehouse (데이터 웨어하우스) – 정제된 데이터 저장소
분석 목적으로 정제된 데이터를 저장하는 시스템.
예시: Google BigQuery, AWS Redshift
29. Streaming Data (스트리밍 데이터) – 실시간 생성 데이터
실시간으로 발생하는 데이터를 즉시 처리하는 방식.
예시: SNS 댓글, 실시간 주식 거래 데이터
30. Predictive Analytics (예측 분석) – 데이터 기반 미래 예측
과거 데이터를 바탕으로 미래를 예측하는 기법.
예시: 사용자 구매 패턴을 분석하여 맞춤 추천 제공
'빅데이터 관련 자료' 카테고리의 다른 글
AWS 기반 데이터 ETL 구축하기 (0) | 2025.04.03 |
---|---|
2025 빅 데이터 분석 사이트 모음 추천 | Python, SQL | AI | 학습 데이터 (1) | 2025.04.02 |
시계열 데이터(Time Series Data)에 대한 이해와 분석 방법 (0) | 2025.04.01 |
AB 테스트 가이드 (0) | 2025.03.29 |
비정형 데이터란? 빅 데이터 로그 데이터 (2) | 2025.03.28 |