-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
-
13
-
14
-
15
-
16
-
17
-
18
-
19
-
20
-
21
-
22
-
23
-
24
-
25
-
26
-
27
-
28
-
29
-
30
-
31
-
32
-
33
-
34
-
35
-
36
-
37
-
38
-
39
-
40
-
41
-
42
-
43
-
44
-
45
-
46
목차
제 1장 : Introduction
제 2장 : Data Warehouse and OLAP
제 3장 : Data Preprocessiong
제 4장 : Data Mining Primitives, Languages, and System Architectures
제 5장 : Concept Description Characterization and Comparison
제 6장 : Mining Association Rules in Large Databases
제 7장 : Classification and Prediction
제 8장 : Cluster Analysis
제 9장 : Mining Complex Types of Data
제10장 : Applications and Trends in Data Mining
제 2장 : Data Warehouse and OLAP
제 3장 : Data Preprocessiong
제 4장 : Data Mining Primitives, Languages, and System Architectures
제 5장 : Concept Description Characterization and Comparison
제 6장 : Mining Association Rules in Large Databases
제 7장 : Classification and Prediction
제 8장 : Cluster Analysis
제 9장 : Mining Complex Types of Data
제10장 : Applications and Trends in Data Mining
본문내용
데이터 마이닝 연구 배경
방대한 정보를 포함한 대용량 데이터베이스
데이터 양의 폭발적 증가=> 유용한 지식 부재
다양하고 새로운 유형의 데이터타입 사용
트랜잭션 데이터 분석 및 마케팅에 적용
시간 데이터 주식, 의료 및 과학데이터 분석
웹 데이터 인터넷 정보/구조 및 컨텐츠 분석
생명 정보 구조 분석, 패턴 및 유사성 분석
멀티미디어 데이터
시공간 데이터 시공간 현상 분석 및 응용 서비스
기존의 마이닝 기법 적용의 한계
데이터량의 크기
데이터의 고차원화
데이터의 이질성 및 분산성 증대
데이터마이닝 연구 동기: 데이터베이스 관점
데이터 마이닝의 주요 이슈
마이닝 방법과 사용자 상호 작용
성능 향상
다양한 데이터 타입의 처리
마이닝 방법 및 사용자 상호작용 문제
마이닝될 지식의 유형 ?
다중레벨 추상 지식의 반복적 마이닝 ?
배경지식의 사용 ?
데이터 마이닝 질의어의 사용?
마이닝 결과의 표현 및 가시화 ?
불완전하고 오류가 있는 데이터의 처리 가능?
유용성 측정은?
기타 이슈
성능 향상문제
효율성(efficiency)과 확장성(scalability)
병렬처리, 분산처리 및 점진적 마이닝 고려
다양한 유형의 데이터 처리 문제
관계형 및 복합 타입의 처리
이질적 데이터베이스로부터의 마이닝
지식 탐사 프로세스
데이터 마이닝: 지식 탐사에서의 핵심 프로세스
데이터 마이닝 기법
연관규칙(association)
순차패턴(sequential patterns)
분류(classification)
클러스터링(clustering)
시계열 분석(time series analysis)
탐사된 지식 패턴의 예
연관 규칙
기저기를 구입하는 98%의 고객은 또한 맥주를 산다.
분류
25세 미만이고 급여가 100 이하인 사람의 신용등급은 낮다.
유사 시퀀스
DNA시퀀스 A와 B는 서로 유사하다.
예외탐사(outlier detection)
이 네트웍 연결은 공격이다.
시간데이터 마이닝
정의(Roddick, 1999)
시간 값을 포함하는 이력 데이터로부터 중요하고 의미있는 규칙의 탐사
시간정보의미에 따른 다양한 마이닝 가능
시간 패턴: 주기성, 순차성
시간 연관규칙: 연관규칙 + 시간제약조건
시간 관계규칙: 시간 관계성
시간 마이닝 문제
가정
시간 도메인 T에 대한 타임 스탬프 데이터 셋 D
시간 표현식: TimeExp
탐사
시간 표현식을 포함하는 패턴
: min_f%
예) 시간연관규칙(temporal association rule)
Y,TimeExp> : (c%,s%,f%)
규칙의 예
사례의 60%에서 대기압의 저하가 있은 후에 비가 온다.
방대한 정보를 포함한 대용량 데이터베이스
데이터 양의 폭발적 증가=> 유용한 지식 부재
다양하고 새로운 유형의 데이터타입 사용
트랜잭션 데이터 분석 및 마케팅에 적용
시간 데이터 주식, 의료 및 과학데이터 분석
웹 데이터 인터넷 정보/구조 및 컨텐츠 분석
생명 정보 구조 분석, 패턴 및 유사성 분석
멀티미디어 데이터
시공간 데이터 시공간 현상 분석 및 응용 서비스
기존의 마이닝 기법 적용의 한계
데이터량의 크기
데이터의 고차원화
데이터의 이질성 및 분산성 증대
데이터마이닝 연구 동기: 데이터베이스 관점
데이터 마이닝의 주요 이슈
마이닝 방법과 사용자 상호 작용
성능 향상
다양한 데이터 타입의 처리
마이닝 방법 및 사용자 상호작용 문제
마이닝될 지식의 유형 ?
다중레벨 추상 지식의 반복적 마이닝 ?
배경지식의 사용 ?
데이터 마이닝 질의어의 사용?
마이닝 결과의 표현 및 가시화 ?
불완전하고 오류가 있는 데이터의 처리 가능?
유용성 측정은?
기타 이슈
성능 향상문제
효율성(efficiency)과 확장성(scalability)
병렬처리, 분산처리 및 점진적 마이닝 고려
다양한 유형의 데이터 처리 문제
관계형 및 복합 타입의 처리
이질적 데이터베이스로부터의 마이닝
지식 탐사 프로세스
데이터 마이닝: 지식 탐사에서의 핵심 프로세스
데이터 마이닝 기법
연관규칙(association)
순차패턴(sequential patterns)
분류(classification)
클러스터링(clustering)
시계열 분석(time series analysis)
탐사된 지식 패턴의 예
연관 규칙
기저기를 구입하는 98%의 고객은 또한 맥주를 산다.
분류
25세 미만이고 급여가 100 이하인 사람의 신용등급은 낮다.
유사 시퀀스
DNA시퀀스 A와 B는 서로 유사하다.
예외탐사(outlier detection)
이 네트웍 연결은 공격이다.
시간데이터 마이닝
정의(Roddick, 1999)
시간 값을 포함하는 이력 데이터로부터 중요하고 의미있는 규칙의 탐사
시간정보의미에 따른 다양한 마이닝 가능
시간 패턴: 주기성, 순차성
시간 연관규칙: 연관규칙 + 시간제약조건
시간 관계규칙: 시간 관계성
시간 마이닝 문제
가정
시간 도메인 T에 대한 타임 스탬프 데이터 셋 D
시간 표현식: TimeExp
탐사
시간 표현식을 포함하는 패턴
예) 시간연관규칙(temporal association rule)
규칙의 예
사례의 60%에서 대기압의 저하가 있은 후에 비가 온다.
추천자료
- 사례를 통한 CRM 구축방안
- 의사결정지원시스템(DSS Decision Support System)사례
- 고객 관계 관리CRM (Customer Relationship Mana gement)논문
- 정부기관경영평가시스템의회고와발전방안
- 고객관계관리
- 성공적인 CRM(고객관계관리)전략수립 방안
- 경영학콘서트 독후감-요약 및 느낀점
- 소프트웨어공학의 개념과 적용사례
- 고객만족과 CRM의 실천방안에 대해서 서술
- 경영정보시스템
- selc 인강 CRM 고객관계관리전략 (01강~15강)
- 의료정보학 중요 정리 - 전자 의무 기록, 병원정보시스템(HIS), 보건의료정보 표준화, 의료영...
- CRM(Customer Relationship Management : 고객관계관리) 개요와 사례 보고서 (CRM 정의·개념·...
- selc 고객관계관리 기말자료 족보 (09주차~15주차)