-
[멋쟁이사자처럼 부트캠프 그로스 마케팅] 데이터수집 및 전처리 : 그래프 시각화 with SeabornTIL 2025. 2. 21. 15:55
학습목표
- 그로스 마케팅 관점에서 사용 목적에 따른 그래프 적용
- Matplotlib, Seaborn을 사용한 그래프 작성
1. 히스토그램 (Histogram) - sns.histplot( )
: 데이터의 분포 파악
import pandas as pd import numpy as np import matplotlib.pyplot as plt import koreanize_matplotlib import seaborn as sns plt.figure(figsize=(8, 5)) sns.histplot(df["분포 데이터"], bins=막대 개수, kde=True) plt.title("차트 제목") plt.xlabel("x축 레이블") plt.ylabel("y축 레이블") plt.show()
예) 고객별 광고 클릭 수 분석
2. 선형 그래프 (Line Chart) - sns.lineplot( )
: 시간 변화에 따 트렌드 분석
plt.figure(figsize=(10, 5)) sns.lineplot(x=df["x축 컬럼명"], y=df["y축 컬럼명"], estimator=np.mean, ci=None) # 평균 계산 plt.xticks(range(0, 24)) # 눈금 0-23 plt.title("차트 제목") plt.xlabel("x축 레이블") plt.ylabel("y축 레이블") plt.show()
예) 월별 매출 변화, 신규 가입자의 월별 유지율(Retention Rate), A/B 테스트: 일정 기간 동안 각 페이지의 전환율 변화 추적
3. 막대 그래프 (Bar Chart) - sns.barplot( )
: 범주형 데이터 비교
plt.figure(figsize=(8, 5)) sns.barplot(x=df["x축 컬럼명"], y=df["y축 컬럼명"], estimator=np.mean) #평균 계산 plt.title("차트 제목") plt.xlabel("x축 레이블") plt.ylabel("y축 레이블") plt.show()
예) 광고 채널별 전환율 비교, 광고 시청 여부 분포, 광고 채널별 응답자 수, 제품 만족도 평균값, 캠페인별 광고 효과 비교
4. 산점도 (Scatter Plot) - sns.scatterplot( )
: 두 변수 간의 상관 관계 분석
plt.figure(figsize=(6, 5)) sns.scatterplot(x=df["x축 컬럼명"], y=df["y축 컬럼명"], alpha=0.5) plt.title("차트 제목") plt.xlabel("x축 레이블") plt.ylabel("y축 레이블") plt.show()
예) 광고비와 전환율 간의 관계를 시각화
5. 파이 차트 (Pie Chart) - plt.pie( )
: 비율(%) 비교
plt.figure(figsize=(6, 6)) df["비율 데이터"].value_counts().plot.pie(autopct="%.1f%%", labels=["항목1 레이블", "항목2 레이블"], colors=["색깔1", "색깔2"]) plt.title("차트 제목") plt.ylabel("") plt.show()
파이 차트는 sns.함수가 없다 예) 신규 고객 유입 채널 비율 분석, 재구매 의향 비율 (Repurchase Intent)
6. 박스 플롯 (Box Plot) - sns.boxplot( )
: 데이터 분포 (중앙값, 사분위수 Q1, Q3, 이상치) 확인
plt.figure(figsize=(6, 5)) sns.boxplot(x=df["독립변수"], y=df["종속변수"]) plt.xticks([0, 1], ["독립변수n", "독립변수y"]) plt.title("차트 제목") plt.xlabel("x축 레이블") plt.ylabel("y축 레이블") plt.show()
예) 고객 세그먼트별 평균 구매 금액(이상치 포함) 비교, 일반적인 클릭당 비용(CPC)보다 너무 높은 비용이 발생한 캠페인 감지
7. 히트맵 (Heatmap) - sns.heatmap( )
: 다차원 데이터의 간의 패턴 시각화
plt.figure(figsize=(8, 6)) sns.heatmap(df.corr(), annot=True, cmap="coolwarm", fmt=".2f") plt.title("차트 제목") plt.show()
예) 웹사이트 방문자들이 랜딩 페이지에서 어느 버튼을 가장 많이 클릭하는지 행동 패턴 분석, 온라인 쇼핑몰에서 고객들이 가장 많이 구매하는 시간대를 분석, 광고 영향도 vs 제품 만족도 상관관계 분석
마케팅 지표 예시
신규 고객 vs 기존 고객 비율신규 유입과 기존 고객의 비율 분석파이 차트(Pie Chart)고객별 LTV 분석고객 생애 가치(Lifetime Value) 분석히스토그램(Histogram)이탈률(Churn Rate) 분석이탈한 고객과 유지된 고객 비교박스플롯(Box Plot)광고 채널별 전환율광고 채널별 고객 전환율 비교바 차트(Bar Chart)소득 vs 구매액 상관관계소득이 높은 고객이 구매를 많이 하는지 분석산점도(Scatter Plot)장바구니 이탈률 분석장바구니에 상품을 담았지만 결제하지 않은 고객 비율 분석파이 차트(Pie Chart)구매 빈도 분석고객의 구매 횟수 분포를 분석히스토그램(Histogram)회원 vs 비회원 구매 패턴 비교회원과 비회원의 평균 구매 금액 비교박스플롯(Box Plot)마케팅 캠페인별 전환율 분석캠페인별 고객 반응을 비교바 차트(Bar Chart)사이트 방문 시간대별 구매율 분석특정 시간대에 구매가 많이 이루어지는지 확인선 그래프(Line Chart)기술통계를 활용한 데이터 요약데이터 분포 및 특성 분석히스토그램, 평균/표준편차변수 간 관계 분석변수 간 상관관계 분석상관 행렬, 산점도, 바 차트결론 도출 및 마케팅 전략 수립분석 결과를 바탕으로 마케팅 최적화맞춤형 프로모션, 광고 최적화
오늘 배운 건 아니지만 복습 필요해서 ㅎ.ㅎ
'TIL' 카테고리의 다른 글
[멋쟁이사자처럼 부트캠프 그로스 마케팅] 통계 분석 기초 (1) 2025.02.24 [멋쟁이사자처럼 부트캠프 그로스 마케팅] 데이터수집 및 전처리 : 데이터 구조 파악(EDA) (0) 2025.02.21 [멋쟁이사자처럼 부트캠프 그로스 마케팅] 데이터수집 및 전처리 : 데이터 변환 (0) 2025.02.19 [멋쟁이사자처럼 부트캠프 그로스 마케팅] 데이터수집 및 전처리 : 설문조사 (1) 2025.02.19 [멋쟁이사자처럼 부트캠프 그로스 마케팅] 데이터수집 및 전처리 : API (1) 2025.02.17