목차
1. 자신을 자유롭게 소개해 주세요.
2. LINE에서 왜 자신을 채용해야 하는지, 자신의 경쟁력에 대해 구체적으로 적어 주세요.
3. 가장 깊이 있게 탐구했던 전공과목 또는 전공서적을 선택하고, 그 이유를 설명해 주세요.
4. 대표적인 프로젝트를 기술하고, 프로젝트에서 어떤 기여를 했는지 구체적으로 설명해 주세요.
2. LINE에서 왜 자신을 채용해야 하는지, 자신의 경쟁력에 대해 구체적으로 적어 주세요.
3. 가장 깊이 있게 탐구했던 전공과목 또는 전공서적을 선택하고, 그 이유를 설명해 주세요.
4. 대표적인 프로젝트를 기술하고, 프로젝트에서 어떤 기여를 했는지 구체적으로 설명해 주세요.
본문내용
반에는 수십만 건의 로그 데이터를 수집하고, 사용자별 세션을 정의하여 구매 여부에 따른 라벨링을 진행했습니다. 이후 페이지뷰 수, 평균 체류 시간, 상품 상세페이지 클릭 횟수, 장바구니 담기 이후 미결제 여부 등 다양한 feature를 구성하고, 전처리 및 정규화를 통해 모델 학습을 위한 기반을 다졌습니다.
모델링 과정에서는 Random Forest, XGBoost, Logistic Regression 등을 활용해 성능을 비교했으며, 최종적으로는 F1-score가 가장 높았던 XGBoost를 선택했습니다. 모델의 해석력을 높이기 위해 SHAP 값을 활용하여 예측에 영향을 주는 주요 feature들을 시각화했고, 특히 ‘심야 시간대 단시간 방문’, ‘반복적인 장바구니 추가 후 미결제’, ‘신규 방문자’ 등이 이탈과 높은 상관관계를 가진다는 것을 확인했습니다.
제가 프로젝트에서 가장 주도적으로 기여한 부분은 모델링 이후 인사이트를 도출하고, 마케팅팀이 활용할 수 있는 형태로 분석 결과를 정리한 것이었습니다. 분석 결과를 단순 수치나 그래프에 그치지 않고, ‘어떤 유형의 고객에게 어떤 리텐션 전략이 필요한지’를 설명하는 스토리로 연결하였고, 실제 이 결과는 타겟 알림 메시지 발송 시나리오에 반영되어 A/B 테스트로 이어졌습니다.
이 프로젝트는 단순히 좋은 예측 모델을 만드는 것을 넘어, 데이터가 실질적인 비즈니스 전략으로 연결되는 과정을 경험할 수 있었기에 더욱 값진 시간이었습니다. 동시에 데이터 사이언티스트로서 문제를 정의하고, 해결하고, 결과를 전달하는 전 과정을 스스로 체득할 수 있었던 중요한 계기였습니다.
모델링 과정에서는 Random Forest, XGBoost, Logistic Regression 등을 활용해 성능을 비교했으며, 최종적으로는 F1-score가 가장 높았던 XGBoost를 선택했습니다. 모델의 해석력을 높이기 위해 SHAP 값을 활용하여 예측에 영향을 주는 주요 feature들을 시각화했고, 특히 ‘심야 시간대 단시간 방문’, ‘반복적인 장바구니 추가 후 미결제’, ‘신규 방문자’ 등이 이탈과 높은 상관관계를 가진다는 것을 확인했습니다.
제가 프로젝트에서 가장 주도적으로 기여한 부분은 모델링 이후 인사이트를 도출하고, 마케팅팀이 활용할 수 있는 형태로 분석 결과를 정리한 것이었습니다. 분석 결과를 단순 수치나 그래프에 그치지 않고, ‘어떤 유형의 고객에게 어떤 리텐션 전략이 필요한지’를 설명하는 스토리로 연결하였고, 실제 이 결과는 타겟 알림 메시지 발송 시나리오에 반영되어 A/B 테스트로 이어졌습니다.
이 프로젝트는 단순히 좋은 예측 모델을 만드는 것을 넘어, 데이터가 실질적인 비즈니스 전략으로 연결되는 과정을 경험할 수 있었기에 더욱 값진 시간이었습니다. 동시에 데이터 사이언티스트로서 문제를 정의하고, 해결하고, 결과를 전달하는 전 과정을 스스로 체득할 수 있었던 중요한 계기였습니다.
소개글