목차
I. 서 론 1
1. 연구 배경 및 의의 1
2. 연구목적 2
3. 연구방법 및 절차 2
II. 고객세분화에 관한 이론적 고찰 3
1. 고객세분화의 중요성 3
2. 고객세분화를 위한 방법론 5
(1) 데이터베이스 마케팅관점에서의 고객세분화 5
(2) 신경망을 이용한 고객세분화 6
III. 데이터마이닝을 이용한 고객세분화 7
1. 데이터마이닝의 개요 7
2. 연구방법 9
(1) 자료의 구성 10
(2) 실험데이터의 기초 분석 10
3. 변수선정 11
(1) 성별과 연 구매회수와의 독립성 검정 12
(2) 입력변수 특성 13
4. 신경망 모형의 구성 17
5. 실험결과와 분석 17
(1) 신경망 결과 17
(2) 로지스틱 회귀분석 18
(3) 실험 결과비교 19
IV. 결론 및 추후연구과제 21
※ 참고문헌 22
1. 연구 배경 및 의의 1
2. 연구목적 2
3. 연구방법 및 절차 2
II. 고객세분화에 관한 이론적 고찰 3
1. 고객세분화의 중요성 3
2. 고객세분화를 위한 방법론 5
(1) 데이터베이스 마케팅관점에서의 고객세분화 5
(2) 신경망을 이용한 고객세분화 6
III. 데이터마이닝을 이용한 고객세분화 7
1. 데이터마이닝의 개요 7
2. 연구방법 9
(1) 자료의 구성 10
(2) 실험데이터의 기초 분석 10
3. 변수선정 11
(1) 성별과 연 구매회수와의 독립성 검정 12
(2) 입력변수 특성 13
4. 신경망 모형의 구성 17
5. 실험결과와 분석 17
(1) 신경망 결과 17
(2) 로지스틱 회귀분석 18
(3) 실험 결과비교 19
IV. 결론 및 추후연구과제 21
※ 참고문헌 22
본문내용
지 고객층 보다 다소 높은 것으로 나타났다. 이 변수는 구매력과 어느정도 상관성이 있는 변수이지만 아직까지 인터넷을 이용하는 계층이 한정되어 있음을 알 수 있었다.
학력
인터넷 쇼핑몰 가입자의 학력을 알 수 있는 변수이다. 학력변수의 구성은 1.고졸, 2.대학 재학, 3.대학 졸업자 등으로 구성되어 있다.
연간구매횟수가 1-4회까지인 고객그룹과 5회 이상의 고객그룹 모두 학력 수준이 매우 높은 것으로 나타났다. 인터넷을 사용하는 계층이 학생, 직장인 등으로 많이 한정되어 있어 학력 역시 높은 것으로 나타난 것 같다.
결혼여부
인터넷 쇼핑몰 이용자의 결혼여부를 알 수 있는 변수이다. 결혼여부 변수의 구성은 1.미혼, 2.기혼, 3.기타 등으로 구성 되어있다.
연간구매횟수가 1-4회까지인 고객그룹에서는 미혼인 경우가 61.9%, 기혼인 경우는 37.7%였다. 그리고 5회 이상 고객그룹에서는 미혼의 경우가 51.7%, 기혼인 경우가 47.8%으로 나타났다. 여기서 알 수 있는 것은 구매력이 높은 집단에 기혼자가 많은 것을 알 수 있다.
나이
인터넷 쇼핑몰 이용자의 나이를 나타내는 변수이다. 연간구매횟수가 1-4회까지인 고객그룹에서는 평균연령이 29세이고, 최빈치 값은 26세로 나타났다. 그리고 5회 이상의 고객그룹에서는 평균연령이 31세이고, 중위수 값은 30세로 나타났다. 두 고객그룹 모두 젊은 층 위주로 구성되어 있지만 구매력이 높다고 판단되는 5회 이상의 고객층이 다소 연령이 높은 것으로 나타났다.
지역
인터넷 쇼핑몰 이용자의 지역성향을 나타내는 변수이다. 연간구매횟수가 1-4회까지인 고객그룹과 5회 이상의 고객그룹 모두 서울, 경기에 집중되어 있음을 알 수 있었다. 이는 타 지역들보다 인터넷 인프라가 잘 구축되어 있으며, 직장과 학교가 상대적으로 많기 때문에 나타난 경향인 것 같다.
연간구매횟수가 1-4회까지인 고객그룹의 경우 부산, 경남 지역이 타 지역보다 많았고, 5회 이상 고객그룹의 경우는 경북지역이 타 지역보다 많았다. 그리고 행정구역상 ‘도’ 보다는 ‘광역시’에서 이용이 활발히 일어났음을 알 수 있었다.
자동차 소지여부
인터넷 쇼핑몰 이용자의 자동차소유 여부를 나타내는 변수이다. 자동차소유여부 변수의 구성은 0.없다, 1.있다 등으로 구성되어 있다.
연간구매횟수가 1-4회까지인 고객그룹의 경우 자동차를 소유한 경우가 59.3%, 소유하지 않은 경우는 40.7%로 나타났다. 그리고 연간구매횟수가 5회 이상인 고객그룹에서는 자동차를 소유한 경우가 66.1%, 소유하지 않은 경우는 33.9%로 나타났다. 구매력이 높다고 생각되는 고객그룹이 상대적으로 자동차를 많이 소유하고 있는 것으로 나타났다.
지불수단
인터넷 쇼핑몰 이용자의 지불수단 형태를 나타내는 변수이다. 지불수단 변수의 구성은 1.무통장(온라인 입금)입금, 2.신용카드 등으로 구성되어 있다. 연간구매횟수가 1-4회까지인 고객그룹의 경우 무통장입금이 60.5%, 신용카드 사용은 39.5%로 나타났다. 그리고 5회 이상 고객그룹은 무통장입금이 52.8%, 신용카드 사용은 47.1%로 나타났다. 구매력이 높다고 판단되는 고객그룹에서 신용카드 사용이 많았음을 알 수 있다.
구매수단
인터넷 쇼핑몰 이용자의 구매수단 성향을 나타내는 변수이다. 구매수단 변수의 구성은 1.전화주문, 2.웹상에서 주문 등으로 구성되어 있다. 인터넷 쇼핑몰임에도 불구하고 전화주문이 99%가량 되었다. 그리고 양쪽 그룹 모두 비슷하게 전화주문을 더 선호하는 것을 알 수 있었다. 이러한 현상은 웹상에서의 주문의 번거로움과 보안에 대한 생각이 작용한 것으로 판단된다.
거주형태
인터넷 쇼핑몰 이용자의 거주형태를 나타내는 변수이다. 거주형태 변수의 구성은 아파트, 단독주택, 연립/빌라, 기타 등 총7개로 구성되어 있다. 연간구매횟수 분류기준에 상관없이 양쪽 그룹 모두 아파트에 거주하는 사람이 제일 많은 것으로 나타났다. 이는 서울, 경기 등 대도시 위주의 사람들이 주로 이용하였기 때문에 그런 것 같다.
개인 월소득
인터넷 쇼핑몰 이용자의 개인 월 소득 형태를 나타내는 변수이다. 변수의 구성은 100만원 이하, 101-200만원, 201만원 이상 등 총10개로 구성되어 있다. 연간구매횟수가 1-4회까지인 고객그룹은 평균 100만원에서 150만원 사이인 사람이 많았으며, 100만원이하 사람들도 12.6%정도 되는 것으로 조사되었다. 그리고 5회 이상 고객그룹에서는 평균150만원에서 200만원인 사람들이 많았으며, 200만원이상의 경우도 약20%정도 되는 것으로 조사되었다.
가구 월 소득
인터넷 쇼핑몰 이용자의 가구당 월 소득을 나타내는 변수이다. 변수의 구성은 100만원 이하, 101-200만원, 201-300만원, 301만원 이상 등 총11개로 구성되어있다. 연간구매횟수가 1-4회까지인 고객그룹은 월 소득 100만원 이하가 10.3%로 나왔고, 5회 이상 고객그룹에서는 월 소득 301만원에서 350만원이 9.4%로 조사되었다. 양쪽 그룹 모두 가구당 월 평균소득은 거의 차이가 없지만 5회 이상 고객그룹에서 고소득자가 많은 것으로 조사되었다.
신용카드 소지 여부
인터넷 쇼핑몰 이용자의 신용카드 소지 여부를 나타내는 변수이다. 변수의 구성은 없다, 1개, 2개 등으로 구성되어 있다. 연간구매횟수가 1-4회까지인 고객그룹에서는 신용카드가 없는 경우가 19.7%, 신용카드가 1개인 사람이 22.4%, 2개인 사람이 25.2%로 조사되었다. 그리고 5회 이상 고객그룹에서는 신용카드가 없는 경우가 10.0%이며, 2개이상 소지한 사람이 약40%정도 되었다. 카드를 소지한 개수가 많을수록 구매력의 차이가 있는 것으로 나타났다.
신경망 모형의 구성
본 연구에서는 신경망 기법중의 하나인 오류 역전파(back propagation)알고리즘을 이용하여 예측 모델링을 실시한다. 그리고 전체 모집단 29,854명 중에서 이벤트 상품 지급 고객을 제외한 10,754명을 기준으로 연구매횟수 1회-4회 고객군과 5회 이상 고객군으로 분류하였다. 본 연구에서 고객세분화 분류기준은 인터넷 쇼핑몰임을 감안하여 접속횟수를 기준으로 하려고 하였으나, 자료의 통합과정의 어려움
학력
인터넷 쇼핑몰 가입자의 학력을 알 수 있는 변수이다. 학력변수의 구성은 1.고졸, 2.대학 재학, 3.대학 졸업자 등으로 구성되어 있다.
연간구매횟수가 1-4회까지인 고객그룹과 5회 이상의 고객그룹 모두 학력 수준이 매우 높은 것으로 나타났다. 인터넷을 사용하는 계층이 학생, 직장인 등으로 많이 한정되어 있어 학력 역시 높은 것으로 나타난 것 같다.
결혼여부
인터넷 쇼핑몰 이용자의 결혼여부를 알 수 있는 변수이다. 결혼여부 변수의 구성은 1.미혼, 2.기혼, 3.기타 등으로 구성 되어있다.
연간구매횟수가 1-4회까지인 고객그룹에서는 미혼인 경우가 61.9%, 기혼인 경우는 37.7%였다. 그리고 5회 이상 고객그룹에서는 미혼의 경우가 51.7%, 기혼인 경우가 47.8%으로 나타났다. 여기서 알 수 있는 것은 구매력이 높은 집단에 기혼자가 많은 것을 알 수 있다.
나이
인터넷 쇼핑몰 이용자의 나이를 나타내는 변수이다. 연간구매횟수가 1-4회까지인 고객그룹에서는 평균연령이 29세이고, 최빈치 값은 26세로 나타났다. 그리고 5회 이상의 고객그룹에서는 평균연령이 31세이고, 중위수 값은 30세로 나타났다. 두 고객그룹 모두 젊은 층 위주로 구성되어 있지만 구매력이 높다고 판단되는 5회 이상의 고객층이 다소 연령이 높은 것으로 나타났다.
지역
인터넷 쇼핑몰 이용자의 지역성향을 나타내는 변수이다. 연간구매횟수가 1-4회까지인 고객그룹과 5회 이상의 고객그룹 모두 서울, 경기에 집중되어 있음을 알 수 있었다. 이는 타 지역들보다 인터넷 인프라가 잘 구축되어 있으며, 직장과 학교가 상대적으로 많기 때문에 나타난 경향인 것 같다.
연간구매횟수가 1-4회까지인 고객그룹의 경우 부산, 경남 지역이 타 지역보다 많았고, 5회 이상 고객그룹의 경우는 경북지역이 타 지역보다 많았다. 그리고 행정구역상 ‘도’ 보다는 ‘광역시’에서 이용이 활발히 일어났음을 알 수 있었다.
자동차 소지여부
인터넷 쇼핑몰 이용자의 자동차소유 여부를 나타내는 변수이다. 자동차소유여부 변수의 구성은 0.없다, 1.있다 등으로 구성되어 있다.
연간구매횟수가 1-4회까지인 고객그룹의 경우 자동차를 소유한 경우가 59.3%, 소유하지 않은 경우는 40.7%로 나타났다. 그리고 연간구매횟수가 5회 이상인 고객그룹에서는 자동차를 소유한 경우가 66.1%, 소유하지 않은 경우는 33.9%로 나타났다. 구매력이 높다고 생각되는 고객그룹이 상대적으로 자동차를 많이 소유하고 있는 것으로 나타났다.
지불수단
인터넷 쇼핑몰 이용자의 지불수단 형태를 나타내는 변수이다. 지불수단 변수의 구성은 1.무통장(온라인 입금)입금, 2.신용카드 등으로 구성되어 있다. 연간구매횟수가 1-4회까지인 고객그룹의 경우 무통장입금이 60.5%, 신용카드 사용은 39.5%로 나타났다. 그리고 5회 이상 고객그룹은 무통장입금이 52.8%, 신용카드 사용은 47.1%로 나타났다. 구매력이 높다고 판단되는 고객그룹에서 신용카드 사용이 많았음을 알 수 있다.
구매수단
인터넷 쇼핑몰 이용자의 구매수단 성향을 나타내는 변수이다. 구매수단 변수의 구성은 1.전화주문, 2.웹상에서 주문 등으로 구성되어 있다. 인터넷 쇼핑몰임에도 불구하고 전화주문이 99%가량 되었다. 그리고 양쪽 그룹 모두 비슷하게 전화주문을 더 선호하는 것을 알 수 있었다. 이러한 현상은 웹상에서의 주문의 번거로움과 보안에 대한 생각이 작용한 것으로 판단된다.
거주형태
인터넷 쇼핑몰 이용자의 거주형태를 나타내는 변수이다. 거주형태 변수의 구성은 아파트, 단독주택, 연립/빌라, 기타 등 총7개로 구성되어 있다. 연간구매횟수 분류기준에 상관없이 양쪽 그룹 모두 아파트에 거주하는 사람이 제일 많은 것으로 나타났다. 이는 서울, 경기 등 대도시 위주의 사람들이 주로 이용하였기 때문에 그런 것 같다.
개인 월소득
인터넷 쇼핑몰 이용자의 개인 월 소득 형태를 나타내는 변수이다. 변수의 구성은 100만원 이하, 101-200만원, 201만원 이상 등 총10개로 구성되어 있다. 연간구매횟수가 1-4회까지인 고객그룹은 평균 100만원에서 150만원 사이인 사람이 많았으며, 100만원이하 사람들도 12.6%정도 되는 것으로 조사되었다. 그리고 5회 이상 고객그룹에서는 평균150만원에서 200만원인 사람들이 많았으며, 200만원이상의 경우도 약20%정도 되는 것으로 조사되었다.
가구 월 소득
인터넷 쇼핑몰 이용자의 가구당 월 소득을 나타내는 변수이다. 변수의 구성은 100만원 이하, 101-200만원, 201-300만원, 301만원 이상 등 총11개로 구성되어있다. 연간구매횟수가 1-4회까지인 고객그룹은 월 소득 100만원 이하가 10.3%로 나왔고, 5회 이상 고객그룹에서는 월 소득 301만원에서 350만원이 9.4%로 조사되었다. 양쪽 그룹 모두 가구당 월 평균소득은 거의 차이가 없지만 5회 이상 고객그룹에서 고소득자가 많은 것으로 조사되었다.
신용카드 소지 여부
인터넷 쇼핑몰 이용자의 신용카드 소지 여부를 나타내는 변수이다. 변수의 구성은 없다, 1개, 2개 등으로 구성되어 있다. 연간구매횟수가 1-4회까지인 고객그룹에서는 신용카드가 없는 경우가 19.7%, 신용카드가 1개인 사람이 22.4%, 2개인 사람이 25.2%로 조사되었다. 그리고 5회 이상 고객그룹에서는 신용카드가 없는 경우가 10.0%이며, 2개이상 소지한 사람이 약40%정도 되었다. 카드를 소지한 개수가 많을수록 구매력의 차이가 있는 것으로 나타났다.
신경망 모형의 구성
본 연구에서는 신경망 기법중의 하나인 오류 역전파(back propagation)알고리즘을 이용하여 예측 모델링을 실시한다. 그리고 전체 모집단 29,854명 중에서 이벤트 상품 지급 고객을 제외한 10,754명을 기준으로 연구매횟수 1회-4회 고객군과 5회 이상 고객군으로 분류하였다. 본 연구에서 고객세분화 분류기준은 인터넷 쇼핑몰임을 감안하여 접속횟수를 기준으로 하려고 하였으나, 자료의 통합과정의 어려움
소개글