본문 바로가기

전체 글

(14)
# 린분석 요약(1) chapter 1. 우리는 모두 거짓말 쟁이 누구나 거짓말은 한다. "만약 자신의 거짓말이 만들어낸 거품을 스스로 믿기 시작하면 더는 살아남을 수 없다." "측정할 수 없는 것은 관리할 수 없다". 거짓말로 왜곡되는 현실왜곡장에 "린 분석"라는 구멍을 만들어 분석적이고 올바른 사고로 목표에 다가가야 한다. 컨시지어 MVP 최소 존속 제품 : 시장에 약속한 가치를 제공하는 최소한의 제품 chapter 2. 다양한 지표 1. 좋은 지표란? 상대적 직관적 비율로 표현 행동양식을 바꿈 2. 정성지표 vs 정량 지표 정성 지표 ​ '왜?'에 대한 대답을 제공 ​ "잠재 고객들의 재답을 유도하거나 왜곡하지 않으면서 구체적인 질문을 던져야 한다." 정량 지표 ​ '무엇'과 '얼마나'에 대한 대답을 제공 3. 허상 지..
# 마케팅 데이터 분석 용어 정리 1. 수익과 관련된 용어 ​ ARPU / ARPPU ​ 사용자 1명에 대한 평균 수익 / 결제한 사용자 1명에 대한 평균 수익 ​ LTV ​ 고객 생애 주기 동안의 수익 ​ CAC ​ 신규 고객 확보 비용 ​ CPI ​ 1개의 앱 설치에 쓰인 광고 비용 ​ ROAS ​ 광고비 대비 매출 ​ Time of customer breakeven ​ 고객 손익분기점 도달시간 2. 사용자 수 와 관련된 용어 ​ DAU / MAU ​ 일간 / 월간 이용 사용자 수 ​ UV ​ 사이트를 방문한 유니크 사람의 수(사용자 수) 3. 클릭과 관련된 용어 ​ CTR ​ 클릭률(클릭 수 / 노출 수) ​ CVR / Bound Rate ​ 클릭에서 구매로 전환 되는 비율 / 클릭 후 아무것도 안하고 이탈 한 사용자 비율 ​ De..
# scikit-learn의 pipeline(sklearn.pipeline) 사이킷런을 이용하여 data의 Nan값을 해당 feature의 중앙값으로 대체하고, 모든 feature들의 scale을 조정하는 전처리 코드를 작성해 보겠습니다. 우선 SimpleImputer로 train_set을 estimate -> trasform하고, MinmaxScaler로 다시 한번 estimate-> transform의 과정을 거칩니다. 전처리를 한 train_set으로 모델을 훈련한다면, 새로운 test_set을 모델에 넣기 위해서는 test_set 또한 동일하게 imputing과정과 scaleing과정을 거처야 합니다. 연속적으로 (추정 -> 변환)의 과정을 거친다면 이 과정을 하나로 묶을 수 있다 생각에서 파이프라인이 등장하였습니다. 사이킷런의 파이프라인은 imputer와 scaler의 ..