[e-비즈니스 개론] 데이터마이닝
본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

[e-비즈니스 개론] 데이터마이닝에 대한 보고서 자료입니다.

목차

Ⅰ. 개요

Ⅱ. 데이터마이닝의 개념

Ⅲ. 데이터마이닝의 특징

Ⅳ. 데이터마이닝의 작업유형과 활용
1. 분류규칙(Classification)
2. 예측작업(Prediction)
3. 연관규칙(Association rules)
4. 군집화(Clustering)

Ⅴ. 데이터마이닝의 기법
1. 연관성측정(ASSOCIATIONS)
2. 순차적 패턴발견(SEQUENCES)
3. 클러스터링(CLUSTERING)
4. 의사결정수(Decision Trees)
5. 신경망모형(Neural Networks)

Ⅵ. 데이터마이닝의 기술 활용
1. 비즈니스 데이터마이닝(Business Data mining)
2. 웹 텍스트 마이닝(Web Text Mining)
3. 지식관리시스템(Knowledge Management System)
1) Dateware
2) Sovereign Hill Software, Inc.
3) Semio
4) Relevance Technologies,
4. 검색엔진 (Search Engine)
1) Northern Light
2) InFind
3) Google

참고문헌

본문내용

이 특수한 통제어와 함께 미리 정해진다. 일단 정보원에 있는 개념이 확인되면 적합한 정보를 추출하기 위하여 경영 프로파일은 경영 관련 개념을 모델에 적용한다.
4. 검색엔진 (Search Engine)
웹 검색엔진에 텍스트 마이닝의 응용이 대두되고 있으며 이것은 좀 더 정확하고 일관성 있는 검색으로 특별하거나 망라적인 결과를 제공할 것이다. 텍스트 마이닝 기법을 활용하고 있는 검색엔진으로 노던 라이트 (Northern Light), 데이터웨어 (Dataware), 익사이트 (Excite(Magellan)), 인화인드 (InFind), 구글 (Google) 등을 들 수 있다.
1) Northern Light
Northern Light는 1995년 개발된 검색엔진으로서 1400억 이상의 웹페이지와 5,400여 개의 원문데이터베이스를 제공하고 있다. 5,400여 개의 전문 저널, 도서, 잡지, 뉴스와이어 및 참고정보원을 제공하는 특별한 집서를 구성하고 있다. 다른 검색엔진에서는 잘 제공하지 못하는 자료들을 제공한다. 이 엔진은 비교적 학술적 자료 검색에 유용하다. 보통 웹 상에서 무료로 정보를 검색할 수 있고 원하는 자료를 결정하기 전에 자료의 요약을 무료로 볼 수 있으나, 원문을 원할 때는 $1-$4정도의 이용요금을 지불하게 된다. 다른 검색엔진과는 달리 Northern Light는 웹과 특별한 집서의 정보원를 조직화하기 위하여 데이터마이닝을 사용하여 질이 높은 정보를 제공한다. 다시 설명하면, Northern Light는 전문 사서에 의해 만들어진 폴더 (folder)에 각 정보를 배열하는 데이터마이닝의 분류 모델을 사용한 검색엔진이라 하겠다. 네 가지 유형의 폴더는 주제, 문서형식, 소스, 언어별로 분류되며. 대략 20,000이상의 광범위한 계층적 관계어와 200,000-300,000에 이르는 첨가어로 수록된다. 이러한 색인은 사람에 의해 수작업으로 생성되지만, 데이터베이스에 있는 논문들은 컴퓨터에 의해 자동적으로 색인된다. Northern Light에서는 미리 지정된 검색결과의 색인을 조사한 알고리즘에 근거하여 검색 결과를 적용하고 폴더에 연결한다. 이러한 데이터마이닝 기술의 도입으로 이용자는 통제어를 배우거나 적용하지 않고도 정확한 검색 결과를 얻을 수 있다. 한편 데이터베이스 생산자 입장에서는 거대한 검색 데이터베이스를 만들 때 인력의 개입을 줄일 수 있다. 이용자는 검색 결과 페이지의 왼쪽에서 주제명의 폴더 리스트가 제시되므로 각각의 폴더를 통해서 좀 더 관련된 정보를 쉽게 확인할 수 있다.
2) InFind
데이터마이닝 기법을 검색엔진에 활용한 또 다른 예로 InFind를 들 수 있다. 인터넷 상에서 가장 잘 알려진 여섯 개 엔진 (Altavista, Excite, Infoseek, Yahoo!, Webcrawler, Lycos)들을 동시에 검색하는 메타검색엔진인 InFind의 가장 큰 특징 중에 하나는 클러스터링이라고 볼 수 있다. InFind는 각각의 검색엔진에서 검색한 결과물들을 제목의 간략한 리스트를 제시하며 URL없이 유사한 아이템을 모아서 출력한다. 다른 검색엔진들은 질의어와의 유사도에 따라 검색 결과들을 나열하고 있으나, InFind는 모든 적합한 결과를 모아서 관련 있는 아이템끼리 모아 그룹화 한다. 이러한 클러스터링 작업은 많은 결과물을 이해하기 쉽게 해주고 이용자로 하여금 자신이 찾고자 하는 정보에 어느 것이 관련이 있고, 어느 것이 관련이 적은가를 빨리 파악하게 해 준다. 예를 들면 \'The David Letterman show\'에 대해서 찾고자 할 경우 InFind는 CBS\' official site에서 검색한 페이지와 팬으로부터의 페이지를 따로 분류하여 빨리 볼 수 있게 해 준다. 그러나 다른 검색엔진들은 이러한 결과들을 질의어와의 관련성 순서대로 혼합하기 때문에 직접 수백 가지의 아이템들을 훑어보아야 한다.
3) Google
Google은 googol에서 따온 이름으로 10의 100제곱 혹은 천문학적인 숫자를 의미한다. 즉 이 검색엔진의 궁극적 목표는 전 세계의 모든 망라적인 정보를 조직화하여 접근하고 유용하게 사용할 수 있도록 하는데 있다고 한다. Google은 1998년 Stanford 대학 박사과정에 있던 Larry Page와 Sergey Brin가 데이터마이닝과 웹의 링크 구조에 기초하여 만들었다. Google의 주요 특징은 관련성 피드백 (relevance feedback)검색, PageRank라는 사이트 순위 선정 방법, 그리고 다국어 검색 서비스를 들 수 있다. Google은 정확도 측정을 문서에서 발생하는 키워드 정보에 의존하지 않고 해당문서를 링크하고 있는 다른 문서 수에 의해 결정한다. 또한 \"PageRank\"기술은 수많은 웹 페이지가 서로 하이퍼링크로 이어져 있다는 웹의 기본 구조와 인기 있는 사이트는 링크가 많이 되고 있다는 가정에 기초를 두고 사이트 순위를 매기는 것이다. Google의 다국어 검색 서비스는 이용자가 원하는 언어의 페이지를 선택해서 검색할 수 있도록 하여 지역화(localization)를 함께 제공한다. Google에서만 찾아 볼 수 있는 특징으로 Link to cached page를 검색결과 페이지에 제공한다. 이것은 이미 없어진 사이트나 서버/네트워크의 일시장애나 중단 등으로 접속이 잘 되지 않는 상황을 어느 정도 막아주기도 한다.
참고문헌
김광용·김명섭(2005), 고객관계관리를 위한 데이터마이닝의 활용과 실습
김지현(1999), 데이터마이닝의 의사결정나무분석을 이용한 사례분석, 이화여자대학교 대학원 석사학위 논문
시시도 노리오 저, 유승옥 역(1997), 데이터 웨어하우스, 대청 출판사
알렉스 버슨 외 저, 홍성완 외 역(2000), CRM을 위한 데이터마이닝, 대청
이혜명(2001), 점진적 프로잭션 기반의 고차원 데이터 클러스터링 기법, 명지대학교 대학원 석사학위논문
장동인(1999), 한국오라클 기술본부 이사, 실무자를 위한 데이터 웨어하우스, 대청 출판사
최종후(1999), 데이터마이닝 : 기능과 사용법, 자유아카데미
허명회(2003), 데이터마이닝 모델링과 사례, 데이타 솔루션
  • 가격1,500
  • 페이지수10페이지
  • 등록일2010.05.16
  • 저작시기2010.3
  • 파일형식한글(hwp)
  • 자료번호#611256
본 자료는 최근 2주간 다운받은 회원이 없습니다.
다운로드 장바구니