목차
Ⅰ. 국가통계의 정의 및 종류
Ⅱ. 인구 통계의 종류 및 설명
Ⅲ. 정규분포 및 예시
Ⅳ. 가설검정 문제 해결
Ⅴ. 데이터마이닝과 그 분석방법 및 활용사례
Ⅱ. 인구 통계의 종류 및 설명
Ⅲ. 정규분포 및 예시
Ⅳ. 가설검정 문제 해결
Ⅴ. 데이터마이닝과 그 분석방법 및 활용사례
본문내용
하다.
H0 : 새로운 치료약의 치료율은 기존 치료약의 치료울보다 높지 않다.
H1 : 새로운 치료약의 치료율은 기존 치료약의 치료울보다 높다.
만약, 치료율을 p라 하고 기존의 치료율이 0.4라고 한다면, 위의 가설을 모수로 사용하여 표현할 수 있으며 이는 다음과 같이 표현된다.
H0 : p=0.4(p≤0.4)
H1 : p 〉0.4
만약, 설문 4와 같은 상황에서 귀무가설과 대립가설을 구성하자면 다음과 같다. 단, 여기에서 p는 공정에 이상이 없다면 25개 가운데 4개 이상의 불량품이 나올 확률을 의미한다.
H0 : 25개 가운데 4개 이상의 불량품이 나올 확률이 0.0034라면 함량검사 시 불량률이 5% 이하이다.
H1 : 25개 가운데 4개 이상의 불량품이 나올 확률이 0.0034라면 함량검사 시 불량률이 5% 이상이다.
그리고 검정과정은 이 두 가지 가설 중 하나를 선택하는 방향으로 진행되며 H0이 선택된다면 공정에 이상이 없다는 결과가 나오게 되고 H1이 선택된다면 공정에 이상이 있는 것으로 나타나게 된다.
Ⅴ. 데이터마이닝과 그 분석방법 및 활용사례
데이터 마이닝(data mining)이란 대규모로 존재하고 저장되는 데이터 안에서 체계적이고 자동적인 과정을 통해 통계적 규칙이나 패턴을 찾아내는 과정과 그 결과를 의미한다. 다른 말로는 데이터베이스 속의 지식 발견(knowledge-discovery in databases : KDD)라고 하기도 한다.
구체적인 데이터 마이닝의 방법이자 기법은 통계학 분야에서 발전한 탐색적자료분석, 가설 검정, 다변량분석, 시계열 분석, 일반선형모형 등의 방법론이 존재하며 데이터베이스 쪽에서 발전한 온라인분석처리(OLAP), 인공지능 방면에서 발전한 SOM, 신경망, 전문가 시스템 등의 방법론이 존재한다.
그 중에서도 가장 대표적인 데이터마이닝 분석 방법으로는 지도학습모형을 들 수 있다. 연역적 방법에 속하는 이 방법은 통계적 수량적 모형으로서 회귀(Regression)방법을 통해 개별고객을 수치화 하거나 점수화 하고 고객 기여도 평가 및 예측과 같은 경영 및 마케팅 분야에서 사용되고는 한다. 구체적 도구로는 로지스틱 회귀분석을 들 수 있다.
또한 분류(classification)으로 가치 있는 고객과 가치 없는 고객 및 시장 타겟팅 등과 같은 경영활동에 사용되며 사전에 미리 정의된 집단 중 어디 해당할 것인지를 예측하는 방법이라 할 수 있다. 구체적 도구로는 의사결정나무와 인공신경망 분석 등이 사용 된다.
데이터마이닝이 사용되는 분야별로 설명하자면 우선 상기한 바와 같이 마케팅이나 CRM 등을 들 수 있다. 데이터마이닝의 탐색적 자료 분석과 다변량 분석 등을 사용하여 기업이 가진 대량의 고객정보와 데이터베이스를 중심으로 하여 고객 인구 통계 자료나 구매 패턴 정보를 기반으로 고객을 세분화 하고 특성을 요약하여 타켓 마케팅에 활용하는 것이다.
그 외에도 은행에서는 사기행위를 색출하거나 고객집단을 분류하고 라이프 사이클에 따른 고객가치 관리 등 다양한 분야에 데이터마이닝을 사용하고 있다.
H0 : 새로운 치료약의 치료율은 기존 치료약의 치료울보다 높지 않다.
H1 : 새로운 치료약의 치료율은 기존 치료약의 치료울보다 높다.
만약, 치료율을 p라 하고 기존의 치료율이 0.4라고 한다면, 위의 가설을 모수로 사용하여 표현할 수 있으며 이는 다음과 같이 표현된다.
H0 : p=0.4(p≤0.4)
H1 : p 〉0.4
만약, 설문 4와 같은 상황에서 귀무가설과 대립가설을 구성하자면 다음과 같다. 단, 여기에서 p는 공정에 이상이 없다면 25개 가운데 4개 이상의 불량품이 나올 확률을 의미한다.
H0 : 25개 가운데 4개 이상의 불량품이 나올 확률이 0.0034라면 함량검사 시 불량률이 5% 이하이다.
H1 : 25개 가운데 4개 이상의 불량품이 나올 확률이 0.0034라면 함량검사 시 불량률이 5% 이상이다.
그리고 검정과정은 이 두 가지 가설 중 하나를 선택하는 방향으로 진행되며 H0이 선택된다면 공정에 이상이 없다는 결과가 나오게 되고 H1이 선택된다면 공정에 이상이 있는 것으로 나타나게 된다.
Ⅴ. 데이터마이닝과 그 분석방법 및 활용사례
데이터 마이닝(data mining)이란 대규모로 존재하고 저장되는 데이터 안에서 체계적이고 자동적인 과정을 통해 통계적 규칙이나 패턴을 찾아내는 과정과 그 결과를 의미한다. 다른 말로는 데이터베이스 속의 지식 발견(knowledge-discovery in databases : KDD)라고 하기도 한다.
구체적인 데이터 마이닝의 방법이자 기법은 통계학 분야에서 발전한 탐색적자료분석, 가설 검정, 다변량분석, 시계열 분석, 일반선형모형 등의 방법론이 존재하며 데이터베이스 쪽에서 발전한 온라인분석처리(OLAP), 인공지능 방면에서 발전한 SOM, 신경망, 전문가 시스템 등의 방법론이 존재한다.
그 중에서도 가장 대표적인 데이터마이닝 분석 방법으로는 지도학습모형을 들 수 있다. 연역적 방법에 속하는 이 방법은 통계적 수량적 모형으로서 회귀(Regression)방법을 통해 개별고객을 수치화 하거나 점수화 하고 고객 기여도 평가 및 예측과 같은 경영 및 마케팅 분야에서 사용되고는 한다. 구체적 도구로는 로지스틱 회귀분석을 들 수 있다.
또한 분류(classification)으로 가치 있는 고객과 가치 없는 고객 및 시장 타겟팅 등과 같은 경영활동에 사용되며 사전에 미리 정의된 집단 중 어디 해당할 것인지를 예측하는 방법이라 할 수 있다. 구체적 도구로는 의사결정나무와 인공신경망 분석 등이 사용 된다.
데이터마이닝이 사용되는 분야별로 설명하자면 우선 상기한 바와 같이 마케팅이나 CRM 등을 들 수 있다. 데이터마이닝의 탐색적 자료 분석과 다변량 분석 등을 사용하여 기업이 가진 대량의 고객정보와 데이터베이스를 중심으로 하여 고객 인구 통계 자료나 구매 패턴 정보를 기반으로 고객을 세분화 하고 특성을 요약하여 타켓 마케팅에 활용하는 것이다.
그 외에도 은행에서는 사기행위를 색출하거나 고객집단을 분류하고 라이프 사이클에 따른 고객가치 관리 등 다양한 분야에 데이터마이닝을 사용하고 있다.
키워드
추천자료
품질관리기사 1차 기출문제 공정상태 해석용 관리도 작성 이상
이혼의 원인과 문제점 및 해결방안
노인의 정신건강대책연구(노년기 정신장애와 치매)
가정폭력에 대한 고찰(A+ 최고레포트)
가정폭력에 관한 고찰
인터넷 문화 - 인터넷 동호회, 싸이월드(미니홈피), 블로그, 지식검색
이혼후의 부양
예술 교육이 청소년의 창의성 발달에 미치는 영향
사회복지실천을 이루어가는 사회복지실천 과정
신재생에너지 활용 및 실용화 방안
초등학교 3학년 국어과(국어교육), 도덕과(도덕교육), 사회과(사회과교육), 초등학교 3학년 ...
보건교육계획안[유방암]
치매의 현황과 문제점 및 사회복지적 해결방안
소개글