ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [멋쟁이사자처럼 부트캠프 그로스 마케팅] 데이터수집 및 전처리 : 그래프 시각화 with Seaborn
    TIL 2025. 2. 21. 15:55

     

     

    학습목표

    • 그로스 마케팅 관점에서 사용 목적에 따른 그래프 적용
    • Matplotlib, Seaborn을 사용한 그래프 작성

     

     

    1. 히스토그램 (Histogram) - sns.histplot( )

    : 데이터의 분포 파악

    import pandas as pd
    import numpy as np
    import matplotlib.pyplot as plt
    import koreanize_matplotlib
    import seaborn as sns
    
    plt.figure(figsize=(8, 5))
    sns.histplot(df["분포 데이터"], bins=막대 개수, kde=True)
    plt.title("차트 제목")
    plt.xlabel("x축 레이블")
    plt.ylabel("y축 레이블")
    plt.show()

    예) 고객별 광고 클릭 수 분석

     

     

    2. 선형 그래프 (Line Chart) - sns.lineplot( )

    : 시간 변화에 따 트렌드 분석

    plt.figure(figsize=(10, 5))
    sns.lineplot(x=df["x축 컬럼명"], y=df["y축 컬럼명"], estimator=np.mean, ci=None) # 평균 계산
    plt.xticks(range(0, 24)) # 눈금 0-23
    plt.title("차트 제목")
    plt.xlabel("x축 레이블")
    plt.ylabel("y축 레이블")
    plt.show()

    예) 월별 매출 변화, 신규 가입자의 월별 유지율(Retention Rate), A/B 테스트: 일정 기간 동안 각 페이지의 전환율 변화 추적

     

     

    3. 막대 그래프 (Bar Chart) - sns.barplot( )

    : 범주형 데이터 비교

    plt.figure(figsize=(8, 5))
    sns.barplot(x=df["x축 컬럼명"], y=df["y축 컬럼명"], estimator=np.mean) #평균 계산
    plt.title("차트 제목")
    plt.xlabel("x축 레이블")
    plt.ylabel("y축 레이블")
    plt.show()

    예) 광고 채널별 전환율 비교, 광고 시청 여부 분포, 광고 채널별 응답자 수, 제품 만족도 평균값, 캠페인별 광고 효과 비교

     

     

    4. 산점도 (Scatter Plot) - sns.scatterplot( )

    : 두 변수 간의 상관 관계 분석

    plt.figure(figsize=(6, 5))
    sns.scatterplot(x=df["x축 컬럼명"], y=df["y축 컬럼명"], alpha=0.5)
    plt.title("차트 제목")
    plt.xlabel("x축 레이블")
    plt.ylabel("y축 레이블")
    plt.show()

    예) 광고비와 전환율 간의 관계를 시각화

     

     

    5. 파이 차트 (Pie Chart) - plt.pie( )

    : 비율(%) 비교

    plt.figure(figsize=(6, 6))
    df["비율 데이터"].value_counts().plot.pie(autopct="%.1f%%", labels=["항목1 레이블", "항목2 레이블"], colors=["색깔1", "색깔2"])
    plt.title("차트 제목")
    plt.ylabel("")
    plt.show()

    파이 차트는 sns.함수가 없다

    예) 신규 고객 유입 채널 비율 분석, 재구매 의향 비율 (Repurchase Intent)

     

     

    6. 박스 플롯 (Box Plot) - sns.boxplot( )

    : 데이터 분포 (중앙값, 사분위수 Q1, Q3, 이상치) 확인

    plt.figure(figsize=(6, 5))
    sns.boxplot(x=df["독립변수"], y=df["종속변수"])
    plt.xticks([0, 1], ["독립변수n", "독립변수y"])
    plt.title("차트 제목")
    plt.xlabel("x축 레이블")
    plt.ylabel("y축 레이블")
    plt.show()

    예) 고객 세그먼트별 평균 구매 금액(이상치 포함) 비교, 일반적인 클릭당 비용(CPC)보다 너무 높은 비용이 발생한 캠페인 감지

     

     

    7. 히트맵 (Heatmap) - sns.heatmap( )

    : 다차원 데이터의 간의 패턴 시각화

    plt.figure(figsize=(8, 6))
    sns.heatmap(df.corr(), annot=True, cmap="coolwarm", fmt=".2f")
    plt.title("차트 제목")
    plt.show()

    예) 웹사이트 방문자들이 랜딩 페이지에서 어느 버튼을 가장 많이 클릭하는지 행동 패턴 분석, 온라인 쇼핑몰에서 고객들이 가장 많이 구매하는 시간대를 분석, 광고 영향도 vs 제품 만족도 상관관계 분석

     

     

     

    마케팅 지표 예시

    신규 고객 vs 기존 고객 비율
    신규 유입과 기존 고객의 비율 분석
    파이 차트(Pie Chart)
    고객별 LTV 분석
    고객 생애 가치(Lifetime Value) 분석
    히스토그램(Histogram)
    이탈률(Churn Rate) 분석
    이탈한 고객과 유지된 고객 비교
    박스플롯(Box Plot)
    광고 채널별 전환율
    광고 채널별 고객 전환율 비교
    바 차트(Bar Chart)
    소득 vs 구매액 상관관계
    소득이 높은 고객이 구매를 많이 하는지 분석
    산점도(Scatter Plot)
    장바구니 이탈률 분석
    장바구니에 상품을 담았지만 결제하지 않은 고객 비율 분석
    파이 차트(Pie Chart)
    구매 빈도 분석
    고객의 구매 횟수 분포를 분석
    히스토그램(Histogram)
    회원 vs 비회원 구매 패턴 비교
    회원과 비회원의 평균 구매 금액 비교
    박스플롯(Box Plot)
    마케팅 캠페인별 전환율 분석
    캠페인별 고객 반응을 비교
    바 차트(Bar Chart)
    사이트 방문 시간대별 구매율 분석
    특정 시간대에 구매가 많이 이루어지는지 확인
    선 그래프(Line Chart)
    기술통계를 활용한 데이터 요약
    데이터 분포 및 특성 분석
    히스토그램, 평균/표준편차
    변수 간 관계 분석
    변수 간 상관관계 분석
    상관 행렬, 산점도, 바 차트
    결론 도출 및 마케팅 전략 수립
    분석 결과를 바탕으로 마케팅 최적화
    맞춤형 프로모션, 광고 최적화

     

     

     


     

     

    오늘 배운 건 아니지만 복습 필요해서 ㅎ.ㅎ

     

     

     

Designed by Tistory.