본문내용
아마도 정의(definition)가 혼동을 없애주는 데 도움을 줄 것이다.
데이터 마이닝의 방법론은 대용량 데이터베이스에 숨겨져있는 예측가능한 정보의 추출을 수반한다. 그러나, 이와같은 광의의 정의로는 온라인 분석 처리 OLAP 제품도 데이터 마이닝 툴로써 자격을 갖추었다고 말할 수 있다. 그 것은 시장에 그러한 기술이 쓰이기 시작했다는 것이므로, 진정한 지식 탐사가 되기위해서는 자동적으로 데이터 마이닝 툴이 이러한 은닉된 정보에 이르도록 해야 한다.
그럼에도 OLAP과 데이터 마이닝 사이의 또하나의 차이점은 데이터 상에서 운용하는 방법이다. 통계학의 방향성과 비슷하게, OLAP은 데이터 분석에 대하여 하향식(top-down) 접근법이다. 데이터에서 패턴을 찾아내는 데 촛점을 맞춘 데이터 마이닝 툴들에 비하여, 데이터에 관해 보고서를 작성하는 데 OLAP 툴들은 성능이 우수하고 빠른 툴이다. 예를 들면, OLAP은 다수의 데이터베이스를 극도로 복잡한 테이블들로 요약하는 것에 연관된다; OLAP 툴들은 집합을 처리하고 기본적으로 달러 총액이나 현금과 같은 숫자 값들의 더하기와 합산에 관련되어 있다. 비즈니스의 형태에 따라 계층화된 구역 판매 보고서와 같이, 수작업인 OLAP은 사실을 알아야할-필요성(need-to-know)에 기반으로 할것이고, 반면에 자동적인 데이터 마이닝은 이런 판매에 영향을 미치는 인자가 무엇인가를 탐사하기위한 필요성에 기반으로 한다.
OLAP 툴은 데이터 마이닝 툴이 아니다. 왜냐하면 질의가 사용자에게서 시작되기 때문이다. 다른 한 편으로 신경망, 기계-학습, 그리고 유전자 알고리즘은 진정한 자동적인 데이터 마이닝 툴로 인정한다. 그것들은 패턴을 찾기위해 데이터를 자동적으로 조사하기 때문이다. 이것은 교사-학습(supervised learning)으로 알려져 있고, 반면에 데이터 마이닝의 다른 덜 일반 형식은 "군집화(clustering)" 또는 비교사-학습(unsupervised learning)으로 불리운다. 그렇지만, 두 경우에서 데이터 분석에 대한 상향식(bottom-up) 접근법은 데이터 마이닝을 OLAP으로 부터 구별하게 한다.
마이닝에서 얻을 수 있는 지식에는 연관규칙, 분류규칙, 요약규칙, 클러스터링 등 여러 가지가 있다.
참 고
☆강현철, 한상태, 최종후, 김은석, 김미경 (2000).『SAS Enterprise
Miner를 이용한 데이터마이닝 - 방법론 및 활용 -』, 서울,
자유아카데미.
☆최종후, 한상태, 강현철, 김은석, 김미경 (2000).『SAS Enterprise
Miner를 이용한 데이터마이닝 - 기능과 사용법 -』, 서울,
자유아카데미.
☆최종후, 한상태, 강현철, 김은석 (1998).『AnswerTree를 이용한
데이터마이닝 의사결정나무분석 -』, 서울, SPSS 아카데미.
☆Michael J. A. Berry and Gordon Linoff (1997). Data Mining
Techniques for Marketing, Sales, and Customer Support, New
York: John Wiley & Sons, Inc.
☆Pieter Adriaans and Dolf Zantinge, (1998). 『데이타마이닝』,
서울, 그린.
★ http://www.research.microsoft.com/research/datamine/ KDD홈페이지
★ http://www.cs.uah.edu/~infotech/mineproj.html
데이타 마이닝 프로젝트들의 목록 및 정보에 대한 링크들과 데이타 마이닝과 관련된 KDD 국제 회의에 대한 링크들을 포함
★ http://www.digital.com/info/datamine/index.html
올바른 의사 결정을 위해 Digital사에서 연구하는 데이타 마이닝에 관한 홈페이지로서 데이타 마이닝, 예제 연구, 기술, FAQ, 연락처 등에 관해 기술
★ http://www.dbms.mfi.com/9608d53.html
데이타 마이닝의 정의, 분석 도구와의 차이점, 필요성, 데이타 마이닝 도구와 기술 등에 관한 기사들을 포함
★ http://www.cs.bham.ac.uk/~anp/TheDataMine.html
데이타 마이닝과 관련된 관련 문헌, 저널, 회의, 소프트웨어 등 다양한 분야에 대한 링크들을 포함
★ http://inchinn.infj.ulst.ac.uk/htdocs/white.html
데이타 마이닝에 대한 전반적인 내용이 소개
★ http://db.cs.sfu.ca/DBMiner
관계형 데이타 마이닝 시스템인 DBMiner에 관한 홈페이지
★ http://info.gte.com/~kdd/kdd-at-gte.html
셀룰러폰 사용자의 행동을 분석하는 CHAMP (Churn Analysis, Modeling, and Prediction) 등의 연구 프로젝트에 대한 내용이 포함
★ http://www.cwi.nl/cwi/projects/datamining.html Mornet
데이타베이스를 사용하는 Data Surveyor 프로젝트에 관한 홈페이지로서 관련된 논문들도 포함
★ http://www.mathsoft.com/splus.html
분석 도구인 S-Plus에 관한 홈페이지
★ http://www.think.com/html/products/darwin/scal_dat.htm
크기나 복잡성에 영향을 받지 않는 확장가능한 (scalable) 데이타 마이닝을 위한 도구인 DARWIN에 대한 홈페이지
★ http://www.almaden.ibm.com/cs/quest/index.html
IBM에서 개발하는 Quest 데이타 마이닝 시스템과 관련된 홈페이지
★ http://www.gr-fx.com/graffx5.htmat
MS-Access를 사용하는 데이타 마이닝 도구에 대한 홈페이지
★ http://www.sgi.com/Products/software/MineSet
실리콘 그래픽스사의 데이타 마이닝과 시각화를 위한 MineSet에 대한 홈페이지
★ http://myhome.netsgo.com/dbknowhow/db/frame.htm
데이터 마이닝의 방법론은 대용량 데이터베이스에 숨겨져있는 예측가능한 정보의 추출을 수반한다. 그러나, 이와같은 광의의 정의로는 온라인 분석 처리 OLAP 제품도 데이터 마이닝 툴로써 자격을 갖추었다고 말할 수 있다. 그 것은 시장에 그러한 기술이 쓰이기 시작했다는 것이므로, 진정한 지식 탐사가 되기위해서는 자동적으로 데이터 마이닝 툴이 이러한 은닉된 정보에 이르도록 해야 한다.
그럼에도 OLAP과 데이터 마이닝 사이의 또하나의 차이점은 데이터 상에서 운용하는 방법이다. 통계학의 방향성과 비슷하게, OLAP은 데이터 분석에 대하여 하향식(top-down) 접근법이다. 데이터에서 패턴을 찾아내는 데 촛점을 맞춘 데이터 마이닝 툴들에 비하여, 데이터에 관해 보고서를 작성하는 데 OLAP 툴들은 성능이 우수하고 빠른 툴이다. 예를 들면, OLAP은 다수의 데이터베이스를 극도로 복잡한 테이블들로 요약하는 것에 연관된다; OLAP 툴들은 집합을 처리하고 기본적으로 달러 총액이나 현금과 같은 숫자 값들의 더하기와 합산에 관련되어 있다. 비즈니스의 형태에 따라 계층화된 구역 판매 보고서와 같이, 수작업인 OLAP은 사실을 알아야할-필요성(need-to-know)에 기반으로 할것이고, 반면에 자동적인 데이터 마이닝은 이런 판매에 영향을 미치는 인자가 무엇인가를 탐사하기위한 필요성에 기반으로 한다.
OLAP 툴은 데이터 마이닝 툴이 아니다. 왜냐하면 질의가 사용자에게서 시작되기 때문이다. 다른 한 편으로 신경망, 기계-학습, 그리고 유전자 알고리즘은 진정한 자동적인 데이터 마이닝 툴로 인정한다. 그것들은 패턴을 찾기위해 데이터를 자동적으로 조사하기 때문이다. 이것은 교사-학습(supervised learning)으로 알려져 있고, 반면에 데이터 마이닝의 다른 덜 일반 형식은 "군집화(clustering)" 또는 비교사-학습(unsupervised learning)으로 불리운다. 그렇지만, 두 경우에서 데이터 분석에 대한 상향식(bottom-up) 접근법은 데이터 마이닝을 OLAP으로 부터 구별하게 한다.
마이닝에서 얻을 수 있는 지식에는 연관규칙, 분류규칙, 요약규칙, 클러스터링 등 여러 가지가 있다.
참 고
☆강현철, 한상태, 최종후, 김은석, 김미경 (2000).『SAS Enterprise
Miner를 이용한 데이터마이닝 - 방법론 및 활용 -』, 서울,
자유아카데미.
☆최종후, 한상태, 강현철, 김은석, 김미경 (2000).『SAS Enterprise
Miner를 이용한 데이터마이닝 - 기능과 사용법 -』, 서울,
자유아카데미.
☆최종후, 한상태, 강현철, 김은석 (1998).『AnswerTree를 이용한
데이터마이닝 의사결정나무분석 -』, 서울, SPSS 아카데미.
☆Michael J. A. Berry and Gordon Linoff (1997). Data Mining
Techniques for Marketing, Sales, and Customer Support, New
York: John Wiley & Sons, Inc.
☆Pieter Adriaans and Dolf Zantinge, (1998). 『데이타마이닝』,
서울, 그린.
★ http://www.research.microsoft.com/research/datamine/ KDD홈페이지
★ http://www.cs.uah.edu/~infotech/mineproj.html
데이타 마이닝 프로젝트들의 목록 및 정보에 대한 링크들과 데이타 마이닝과 관련된 KDD 국제 회의에 대한 링크들을 포함
★ http://www.digital.com/info/datamine/index.html
올바른 의사 결정을 위해 Digital사에서 연구하는 데이타 마이닝에 관한 홈페이지로서 데이타 마이닝, 예제 연구, 기술, FAQ, 연락처 등에 관해 기술
★ http://www.dbms.mfi.com/9608d53.html
데이타 마이닝의 정의, 분석 도구와의 차이점, 필요성, 데이타 마이닝 도구와 기술 등에 관한 기사들을 포함
★ http://www.cs.bham.ac.uk/~anp/TheDataMine.html
데이타 마이닝과 관련된 관련 문헌, 저널, 회의, 소프트웨어 등 다양한 분야에 대한 링크들을 포함
★ http://inchinn.infj.ulst.ac.uk/htdocs/white.html
데이타 마이닝에 대한 전반적인 내용이 소개
★ http://db.cs.sfu.ca/DBMiner
관계형 데이타 마이닝 시스템인 DBMiner에 관한 홈페이지
★ http://info.gte.com/~kdd/kdd-at-gte.html
셀룰러폰 사용자의 행동을 분석하는 CHAMP (Churn Analysis, Modeling, and Prediction) 등의 연구 프로젝트에 대한 내용이 포함
★ http://www.cwi.nl/cwi/projects/datamining.html Mornet
데이타베이스를 사용하는 Data Surveyor 프로젝트에 관한 홈페이지로서 관련된 논문들도 포함
★ http://www.mathsoft.com/splus.html
분석 도구인 S-Plus에 관한 홈페이지
★ http://www.think.com/html/products/darwin/scal_dat.htm
크기나 복잡성에 영향을 받지 않는 확장가능한 (scalable) 데이타 마이닝을 위한 도구인 DARWIN에 대한 홈페이지
★ http://www.almaden.ibm.com/cs/quest/index.html
IBM에서 개발하는 Quest 데이타 마이닝 시스템과 관련된 홈페이지
★ http://www.gr-fx.com/graffx5.htmat
MS-Access를 사용하는 데이타 마이닝 도구에 대한 홈페이지
★ http://www.sgi.com/Products/software/MineSet
실리콘 그래픽스사의 데이타 마이닝과 시각화를 위한 MineSet에 대한 홈페이지
★ http://myhome.netsgo.com/dbknowhow/db/frame.htm
추천자료
- 데이터 웨어하우스
- 데이터 웨어하우스
- 데이터 베이스에 대한 시장 전망과 기술동향
- 데이터베이스 란 무엇인가
- 데이터통신과 네트워킹 3판 2장 연습문제
- 데이터통신과 네트워킹 6장 연습문제
- 데이터베이스 DB를 활용한 마케팅 전략수립과 성공케이스 분석
- 데이터베이스 마케팅(Database Marketing)
- 데이터베이스 시스템총론(이재호 저) 1장 연습문제
- 데이터베이스 시스템의 종류 및 특성과 장단점
- 데이터베이스 & 자바 연동 병원 의사,환자 관리 프로그램 jdbc
- 빅데이터.ppt
- 빅데이터(Big Data) 산업의 이해, 투자 현황 계획 & 기업의 활용사례분석 PPT자료
- 빅데이터(BIGDATA) 활용한 대학교 수강신청시스템 개선방안 제안
소개글