[인터넷 정보검색][검색엔진][인터넷][정보검색][검색][정보검색엔진]인터넷 정보검색의 정의, 인터넷 정보검색의 분류, 인터넷 정보검색의 적합성, 인터넷 정보검색의 변천, 인터넷 정보검색과 검색엔진 분석
본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

[인터넷 정보검색][검색엔진][인터넷][정보검색][검색][정보검색엔진]인터넷 정보검색의 정의, 인터넷 정보검색의 분류, 인터넷 정보검색의 적합성, 인터넷 정보검색의 변천, 인터넷 정보검색과 검색엔진 분석에 대한 보고서 자료입니다.

목차

. 개요

Ⅱ. 인터넷 정보검색의 정의

Ⅲ. 인터넷 정보검색의 분류
1. 주제검색(Subject Search)
2. 주제어검색(keyword Search)

Ⅳ. 인터넷 정보검색의 적합성

Ⅴ. 인터넷 정보검색의 변천
1. 정보검색 구현 방법
2. 내부 데이터 검색에서 웹으로 발전

Ⅵ. 인터넷 정보검색과 검색엔진
1. 정보검색엔진 기능
2. 검색엔진 구축 방법
3. 검색엔진에서 사용하는 용어
1) 부울 연산자(boolean)
2) 우선 연산자
3) 인접 연산자
4) 어구검색
5) 영문의 경우
6) 절단(Truncation), 와일드(wild)카드
7) 불용어(Stop Word)
8) 시소러스(Thesaurus)

참고문헌

본문내용

검색 방법이다. 이러한 색인어 검색을 구현하는 기술은 다음과 같이 발전해 왔다.
1. 정보검색 구현 방법
초기의 정보검색 시스템은 사용자가 찾고자 하는 색인어에 대하여 원문의 내용을 스캐닝 하면서 단순히 찾는 단어의 패턴 매칭(PATTERN MATCHING)을 통하여 이루어졌다. 이는 문서 내용의 분량이 적을 경우 어느 정도의 효과가 있고 색인 정보를 미리 구축해야할 필요가 없기 때문에 저렴하게 시스템을 구현할 수 있는 장점이 있다. 일반적으로 문서 편집기에 많이 이용되고 있으며 유닉스의 GREP 명령어 등이 이러한 역할을 수행한다. 그러나 이러한 단순 패턴 매칭 검색은 정보의 양에 밀접하게 반응하여 정보량이 증가할수록 검색 속도가 현저히 떨어지는 약점이 있다. 또한 이는 단순히 한번에 하나의 단어에 대한 검색이 이루어질 수밖에 없으며 원하는 단어에 대한 AND, OR 등의 BOOL검색, 시소러스 검색 등의 다양한 정보검색 시스템 구현이 거의 불가능하다.
따라서 이와 같은 패턴 매칭 검색은 다량의 문서로부터 원하는 정보를 추출하기 위한 용도보다는 소량의 자료로부터 특정한 하나의 단어를 찾는데 많이 이용되고 있다. 한편 원하는 패턴을 매칭시키는 방법에도 각각의 글자를 전체 STRING의 SUB-STRING 시작점으로 간주하여 패턴 매칭 속도를 현저히 증가시키는 PAT 파일 방법을 정보검색 시스템에 적용하는 기술도 발전되고 있다.
다량의 데이터를 다양한 방법으로 정보검색 시스템을 구현한 것이INVERTED 파일구조에 의한 정보검색 시스템이다. 데이터에 대한 색인 정보를 미리 구축해 놓고 원하는 색인어에 대한 질의가 입력되었을 때 미리 구축된 색인 정보를 이용해 신속히 정보를 찾아줄 수 있는 시스템으로 정보의 양이 증가하더라도 검색속도가 크게 영향을 받지 않고 BOOL 검색, 시소러스 검색, 근접 검색 등 다양한 검색 기능 구현이 가능하며 현재 가장 널리 사용되고 있는 방법이기도 하다. 다만 미리 구축되어야 할 색인 정보는 INVERTED 파일 구조의 정보검색 시스템 성능에 지대한 영향을 주어, 특히 색인 정보를 관리하기 위한 오버헤드가 크고 색인 추출 방법 또한 시스템 성능을 좌우하는 핵심 부분으로 한글과 같이 품사간 결합, 띄어쓰기의 애매성, 어미변환 및 복합 명사의 다양성이 있는 언어에 대해 색인 추출의 중요성을 고려해야 한다.
2. 내부 데이터 검색에서 웹으로 발전
그럼에도 불구하고 INVERTED 파일 구조의 정보검색 시스템이 널리 사용되고 있는 이유는 하드웨어의 가격이 상대적으로 싸지고 있기 때문에 색인 정보를 위한 오버헤드가 큰 부담이 되지 않고 색인을 자동으로 추출하는 기술이 발전하고 있으며 다량의 데이터로부터 정보를 검색하는데 효율이 좋기 때문으로 분석된다. 한글의 경우 한글형태소 분석기 및 태깅(Tagging) 시스템을 도입하여 자동 색인하는 방법이 가장 널리 사용되고 있다.
정보검색 시스템은 데이터 보관 저장 장소로 오라클, 인포믹스 등의 DBMS 활용 추세가 급증하면서 INVERTED 파일 구조의 정보검색 시스템과 DBMS의 정형 데이터를 결합하여 검색을 지원하는 시스템으로 발전하고 있다. 일례로 신문 기사 정보에 대하여 기사의 분류 체계, 일자, 기고자 등 의 일반적인 서지 사항을 위한 정형 필드와 기사 내용의 비정형 필드를 결합하여 검색할 수 있는 방법으로 발전되며, 이를 위하여 정보검색 시스템이 DBMS와의 인터페이스를 제공하게 된다.
정보화 시대에 접어들면서 정보 활용층이 다양해지고 특히 인터넷이라는 거대한 네트워크의 활용이 급증하면서 다양한 정보에 접근하는 사람들이 폭발적으로 늘고 있다. 정보 요구 또한 다양해져서 단순한 문서 정보 외에 화상, 음성, 비디오 정보 등이 요구되고 있으며, 이를 위한 인터넷의 웹 서비스는 기하급수적으로 확산되고 있다. 그래서 정보검색 시스템은 기존의 단순한 내부 데이터베이스에 있는 내용 검색에서 벗어나 인터넷의 웹 서비스에까지 발전되고 있고 이는 웹 서비스를 위한 각 WEB사이트의 HTML 파일들에 대한 자동 색인 및 검색 기능을 제공할 수 있게 되었다.
Ⅵ. 인터넷 정보검색과 검색엔진
정보검색엔진이란 인터넷의 정보를 찾아주는 서비스를 제공하는 곳이다.
1. 정보검색엔진 기능
① 로봇 프로그램에 의해 정보를 수집한다.
② 사용자가 검색을 통해 원하는 정보를 찾도록 자료를 정리해 놓는다.
③ Portal Service로 검색기능 이외의 부가서비스를 제공하여 검색엔진을 사용하는 동기를 부여한다.
2. 검색엔진 구축 방법
① 스파이더(spider), 로봇(robot), 크롤러(Crawler), 웜( worm)이라고 불리는 프로그램에 의해 정보를 수집한다.
② 로봇 프로그램 또는 자료 정리프로그램으로 키워드 검색을 위해 웹 문서의 내용을 색인 작업한다.
③ 정리된 자료를 사용자가 원하는 것을 찾아 볼 수 있도록 데이터베이스를 구축한다.
3. 검색엔진에서 사용하는 용어
1) 부울 연산자(boolean)
AND, OR, NOT
2) 우선 연산자
괄호() 지정
3) 인접 연산자
키워드들이 위치한 거리를 참조하는 연산자로 NEAR, ADJ를 사용
4) 어구검색
연속된 두개 이상의 단어를 하나로 취급하는 것으로 큰따옴표()를 사용
5) 영문의 경우
대소문자를 지키는 검색엔진도 있다.
6) 절단(Truncation), 와일드(wild)카드
*나 ?등을 이용하여 단어의 일부분을 대신하는 경우
7) 불용어(Stop Word)
검색시 무시되는 단어
8) 시소러스(Thesaurus)
유의어 검색
참고문헌
◈ 강운이, 정보검색엔진의 기능성 평가항목의 선정 및 적용, 전북대학교, 2000
◈ 박순철 외 1명, 구술문서 자료분석을 위한 정보검색기술의 응용, 한국산업정보학회, 2008
◈ 박정아 외 1명, 정보검색에서의 사용자 중심 적합성 판단 모형, 한국감성과학회, 2009
◈ 박창호 외 2명, 탐색환경으로서 정보검색엔진에 대한 평가, 한국심리학회, 2002
◈ 서은경, 정보검색분야의 지적구조와 변화에 관한 연구, 한국정보관리학회, 1992
◈ 정아, 정보 검색에서의 사용자 중심 적합성 판단 모형 개발 및 평가, 연세대학교, 2010
  • 가격6,500
  • 페이지수10페이지
  • 등록일2013.07.15
  • 저작시기2021.3
  • 파일형식한글(hwp)
  • 자료번호#860861
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니