전체 글 (14) 썸네일형 리스트형 # 린분석 요약(1) chapter 1. 우리는 모두 거짓말 쟁이 누구나 거짓말은 한다. "만약 자신의 거짓말이 만들어낸 거품을 스스로 믿기 시작하면 더는 살아남을 수 없다." "측정할 수 없는 것은 관리할 수 없다". 거짓말로 왜곡되는 현실왜곡장에 "린 분석"라는 구멍을 만들어 분석적이고 올바른 사고로 목표에 다가가야 한다. 컨시지어 MVP 최소 존속 제품 : 시장에 약속한 가치를 제공하는 최소한의 제품 chapter 2. 다양한 지표 1. 좋은 지표란? 상대적 직관적 비율로 표현 행동양식을 바꿈 2. 정성지표 vs 정량 지표 정성 지표 '왜?'에 대한 대답을 제공 "잠재 고객들의 재답을 유도하거나 왜곡하지 않으면서 구체적인 질문을 던져야 한다." 정량 지표 '무엇'과 '얼마나'에 대한 대답을 제공 3. 허상 지.. # 마케팅 데이터 분석 용어 정리 1. 수익과 관련된 용어 ARPU / ARPPU 사용자 1명에 대한 평균 수익 / 결제한 사용자 1명에 대한 평균 수익 LTV 고객 생애 주기 동안의 수익 CAC 신규 고객 확보 비용 CPI 1개의 앱 설치에 쓰인 광고 비용 ROAS 광고비 대비 매출 Time of customer breakeven 고객 손익분기점 도달시간 2. 사용자 수 와 관련된 용어 DAU / MAU 일간 / 월간 이용 사용자 수 UV 사이트를 방문한 유니크 사람의 수(사용자 수) 3. 클릭과 관련된 용어 CTR 클릭률(클릭 수 / 노출 수) CVR / Bound Rate 클릭에서 구매로 전환 되는 비율 / 클릭 후 아무것도 안하고 이탈 한 사용자 비율 De.. # scikit-learn의 pipeline(sklearn.pipeline) 사이킷런을 이용하여 data의 Nan값을 해당 feature의 중앙값으로 대체하고, 모든 feature들의 scale을 조정하는 전처리 코드를 작성해 보겠습니다. 우선 SimpleImputer로 train_set을 estimate -> trasform하고, MinmaxScaler로 다시 한번 estimate-> transform의 과정을 거칩니다. 전처리를 한 train_set으로 모델을 훈련한다면, 새로운 test_set을 모델에 넣기 위해서는 test_set 또한 동일하게 imputing과정과 scaleing과정을 거처야 합니다. 연속적으로 (추정 -> 변환)의 과정을 거친다면 이 과정을 하나로 묶을 수 있다 생각에서 파이프라인이 등장하였습니다. 사이킷런의 파이프라인은 imputer와 scaler의 .. 이전 1 2 3 4 5 다음