[웹문서, 웹문서 분류체계, 웹문서 탐색도구, 웹문서와 연계시스템, 웹문서와 웹검색엔진, 웹문서 전망]웹문서의 분류체계, 웹문서의 탐색도구, 웹문서와 연계시스템, 웹문서와 웹검색엔진, 웹문서의 전망 분석
본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

[웹문서, 웹문서 분류체계, 웹문서 탐색도구, 웹문서와 연계시스템, 웹문서와 웹검색엔진, 웹문서 전망]웹문서의 분류체계, 웹문서의 탐색도구, 웹문서와 연계시스템, 웹문서와 웹검색엔진, 웹문서의 전망 분석에 대한 보고서 자료입니다.

목차

Ⅰ. 개요

Ⅱ. 웹문서의 분류체계
1. 주제간 비연계성
2. 체계의 기계성
3. 전개의 불균등성
4. 동위 및 상하관계의 모호성
5. KDC는 기억을 도와 분류작업과 검색작업을 용이하게 하도록 조기표를 설계하여 조기성이 필요한 항목을 일관성 있게 적용하고 있다
1) 웹문서분류체계
2) 분류표제항
3) 분류체계의 상하관계

Ⅲ. 웹문서의 탐색도구
1. 디렉터리(directory)
2. 탐색엔진
3. 메타서치(Meta-search)

Ⅳ. 웹문서와 연계시스템
1. 식별자
2. 메타데이타
3. 변환 메카니즘

Ⅴ. 웹문서와 웹검색엔진
1. 주제 검색엔진
2. 키워드 검색엔진
3. 메타 검색 엔진
4. 통합 검색 엔진

Ⅵ. 웹문서의 전망

참고문헌

본문내용

구이다.
이 탐색도구는 분명한 주제의 범주에 속해 있는 정보를 찾고자 할 경우에 가장 효과적이며, 어떤 주제분야에 대하여 좀더 광의적인 정보를 얻고자 할 경우에도 매우 효과적이다.
2. 탐색엔진
탐색도구는 퀴리를 사용하여 정보를 탐색하며, 그 결과에 대한 리스트를 제공한다. \'AltaVista\'가 많이 알려져 있다. 이것은 웹 문서의 일부분 또는 전체에 포함되어 있는 단어를 색인하여, 이용자가 탐색엔진에 쿼리를 입력하면 자체의 데이터베이스에 들어있는 레코드와 쿼리를 대조한 다음에, 이용자의 요구를 만족시키는 웹 문서의 리스트를 제공한다.
이 탐색도구는 보다 까다로운 주제분야를 탐색하거나 주제탐색용 탐색도구에서 분류하기가 까다로운 복합주제 분야를 탐색하는 데 가장 효과적이며, 주제탐색용 탐색도구보다 데이터베이스가 크고 그 속에 들어있는 정보도 최신의 것이지만, 정보를 검색하고 색인하는 방법이 주제탐색도구에 비교하여 정교하지 않기 때문에 때때로 한 쿼리에 수백만 건의 웹 문서를 검색결과로 제공함으로써 적절한 문서를 발견하기가 보다 어려울 때도 있다. 또한 가장 커다란 탐색엔진이라할 지라도 인터넷의 공개된 문서의 약 1/3정도만을 색인하고 있으므로, 탐색자는 자신이 원하는 문서를 찾기 위하여 여러 개의 탐색엔진을 사용하여야 하는 경우도 발생한다.
3. 메타서치(Meta-search)
이것은 복수 엔진 탐색도구(multi-engine search tool)라고 부르기도 하며, 하나의 쿼리를 입력하여 여러 가지 탐색엔진을 동시에 기동시키는 탐색도구이다. 이것의 탐색은 키워드를 통하여 이루어지며, 그 결과는 소속된 탐색엔진별로 리스트되거나 하나의 리스트안에 모든 결과를 통합하여 제공된다. \'사비서치(SavvySearch)\'와 \'미스다찾니\'가 잘 알려져 있다. 이것은 탐색의 속도를 높일 수 있고, 중복된 결과를 피할 수 있으나, 까다로운 탐색과 관련해서는 단일 탐색엔진만큼 효과적이지 못하다.
위에서 언급한 3종류의 탐색도구를 기능적인 측면에서 살펴보면, 크게 두 가지의 탐색기능으로 양분할 수 있다. 하나는 주제탐색기능이고 또 하나는 키워드 탐색기능이다. 따라서 탐색도구 역시 이러한 기능을 근거로 구분하면, 디렉터리와 탐색엔진으로 양분할 수 있다. 그렇지만, 이러한 구분은 현재 점점 더 모호하게 되고 있는 데, 그 이유는 대부분의 주요 탐색도구가 주제탐색과 키워드 탐색을 병행(coordinated)하고 있기 때문이다.
탐색자가 디렉터리를 사용할 것인가 또는 탐색엔진을 사용할 것인가는 찾고자 하는 정보의 내용이 일반적인 것인가 또는 전문적인 것인가에 따라 결정되며, 또한 탐색자의 탐색경험에 의해 결정된다. 그렇지만, 대부분의 탐색도구는 검색결과의 적합성(relevancy) 즉, 정확률(precision), 재현율(recall), 그리고 포획률(coverage)에 의해 그것의 탐색성능이 결정된다.
정확률이란 탐색도구에 의하여 검색된 웹 문서가 쿼리와 얼마나 잘 부합(hits)되느냐를 측정하는 척도이며, 재현율이란 탐색도구에 의하여 검색된 웹 문서 중에서 적합한 문서가 어느 정도인가를 측정하는 척도이고, 포획률이란 웹에 저장되어 있는 모든 적절한 문서 집단, 즉 전체 모집단에서 몇 퍼센트가 그 탐색도구에 의해 색인되어져 있는가를 나타내는 척도이다. 예를 들어, 100개의 웹 문서에 대한 색인정보 데이터베이스를 갖고 있는 하나의 탐색엔진이 있고, 이 색인 중에서 50건은 \'디지털 도서관\'에 관한 것이라고 가정해 보자. 만약 웹에서 찾을 수 있는 \'디지털 도서관\'에 관한 문서의 총 수가 500건이라고 한다면, 이 탐색엔진의 포획률은 0.10이다. 또한, 만일 이 탐색엔진에 \'디지털 도서관\'이란 쿼리를 입력하고 얻어진 결과중 관련된 문서가 40건이고 관련이 없는 문서가 20건, 총 60건이 검색되었다면, 이 탐색엔진의 정확률은 약 0.67이며, 이 탐색엔진의 재현율은 0.80이다.
디렉터리나 탐색엔진을 선택하는 데 있어서, 포획률은 가장 중요한 기준이 된다. 포획률이 높다는 것은 탐색도구의 데이터베이스에 적절한 웹 문서가 보다 많이 색인되어 있다는 것을 의미한다. 따라서 포획률이 높은 탐색도구를 선택하는 것이 보다 만족스러운 결과를 얻을 수 있는 가능성을 높인다. 특히, 광의적 키워드로 탐색하고자 할 경우에는 가장 규모가 큰 탐색엔진조차도 공개적으로 이용가능한 모든 웹 문서의 약 1/3에서 1/2 정도만을 색인하고 있기 때문에, 복수의 탐색엔진을 기동시키는 메타서치를 사용하는 것도 포획률을 높일 수 있다.
정확률과 재현율은 부적절한 문서의 출력빈도를 줄일 수 있다면 그 비율을 높일 수 있다. 웹의 탐색에서 부적절한 문서를 얻게 되는 중요한 원인중의 하나는 탐색엔진의 스파이더(spider)나 로봇(robot)이 웹 문서를 색인하는 데 있어서 발생하는 에러이다. 따라서, 이러한 에러를 줄일 수 있는 스파이더나 로봇을 사용하는 탐색도구를 선택하는 것이 효과적인 탐색결과를 얻는 데 도움이 된다.
Ⅳ. 웹문서와 연계시스템
1. 식별자
디지털 자원에 대한 식별자는 SICI(Serial Item and Contribution Identifier)[14], ISWC(International Standard Work Code) 등을 포함한 다양한 형태가 있으나[15], DOI는 이들 식별자와 다르게, 식별자 기능뿐만 아니라 부가적 특징을 가지고 있다. 그것은 DOI 내부에 기존의 식별자를 포함할 수 있다는 것이며, URN의 한 사례이며, 또한 저작권자 정보를 간직하고 있는 것이다.
전통적 URL이 인터넷 환경에서는 검색을 통하여 디지털 정보대상물의 위치를 찾아내고 원문으로 연계하기 위한 방법으로 사용되었지만, 시스템 주소 변경 혹은 대상물의 위치가 변경되면 더 이상 존재하지 않는 URL을 가리키게 되므로 계속적으로 관리하지 않으면 이전 URL을 사용하는 사람들은 원하는 대상물을 얻을 수 없게 된다. 그러므로 URL의 경우는 디지털 대상물에 대한 영구적인 식별자로서의 기능을 제대로 수행하지 못하기 때문에 W3C(http://www.w3c.org/)의 IETF는 범세계적으로 유일하게 식별가능하고, 영구적인 식별자
  • 가격6,500
  • 페이지수11페이지
  • 등록일2013.07.18
  • 저작시기2021.3
  • 파일형식한글(hwp)
  • 자료번호#862270
본 자료는 최근 2주간 다운받은 회원이 없습니다.
다운로드 장바구니