목차
1. That이 relative clause를 나타내는지 알아보는 Algorithm 기술하고, tagger가 몇 % error 인지를 나타냄.
2. That 문의 끝을 알아내는 Algorithm 기술.
3. 2번 알고리즘을 사용시의 정확도.
2. That 문의 끝을 알아내는 Algorithm 기술.
3. 2번 알고리즘을 사용시의 정확도.
본문내용
면 That이하 절의 끝을 알아 내기 위해서는 관계 대명사의
that이 온 이후에는 반드시 동사구가 따라 오던지 인칭 대명사와 같은 명사구가 온 후에
동사구, 부사구, 명사구 등이 연이어 와야 한다. 그러나 동사구가 문장 내에서 두번이
오는 경우는 두 번째 동사구의 앞 까지가 That이하 절의 끝이 되게 됨.
Algorithm 기술:
char str_buf[_MAXLEN]; //한 단어 저장을 위한 버퍼
BOOL Within_That = FALSE: //현재의 단어가 That절 안의 단어 인지 확인하기
// 위한 변수
While ( There is a phrase to parse){
read a word and store str_buf
if( (str_buf == "that") || ( Within_That = TRUE) {
Within_That = TRUE:
read a next word and store str_buf
search the dictionary and determine the part of speech
if(str_buf equals VP) {
read a next word and store str_buf
if( No word exists) {
Within_That = FALSE; // that절을 빠져 나왔음
break; //while문을 빠져 나온다.
}
search the dictionary and determine the part of speech
if(str_buf equals NP or ADVP or ADJP) {
read a next word and store str_buf
if( No word exists) {
Within_That = FALSE;//that절을 빠져 나왔음
break; //while문을 빠져 나온다.
}
search the dictionary and determine the part of speech
if(str_buf equals VP) {
Within_That = FALSE; // that절을 빠져 나왔음
read a previous word and store str_buf
}
}
else if(str_buf equals VP) {
Within_That = FALSE; // that절을 빠져 나왔음
read a previous word and store str_buf
}
}
else if(str_buf equals NP)
read a next word and store str_buf
search the dictionary and determine the part of speech
if(str_buf equals VP) {
read a next word and store str_buf
if( No word exists)
Within_That = FALSE;//that절을 빠져 나왔음
continue; //다음 단어를 읽는다.
search the dictionary and determine the part of speech
if(str_buf equals PP) {
Within_That = FALSE;// that절을 빠져 나왔음
continue; //다음 단어를 읽는다.
}
}
else
continue
}
else {
read a next word and store str_buf
}
}
printf(" 이 %s 가 That clause절의 끝 Word\n", str_buf);
That 포함 전체 문장 수
약 260문장
관계대명사 문장의 수
54
error rate
10
알고리즘 정확도
약80%
3. 2번 알고리즘을 사용시의 정확도.
* 알고리즘의 세밀화가 부족하여, 정확도가 많이 떨어 질수 있음.
that이 온 이후에는 반드시 동사구가 따라 오던지 인칭 대명사와 같은 명사구가 온 후에
동사구, 부사구, 명사구 등이 연이어 와야 한다. 그러나 동사구가 문장 내에서 두번이
오는 경우는 두 번째 동사구의 앞 까지가 That이하 절의 끝이 되게 됨.
Algorithm 기술:
char str_buf[_MAXLEN]; //한 단어 저장을 위한 버퍼
BOOL Within_That = FALSE: //현재의 단어가 That절 안의 단어 인지 확인하기
// 위한 변수
While ( There is a phrase to parse){
read a word and store str_buf
if( (str_buf == "that") || ( Within_That = TRUE) {
Within_That = TRUE:
read a next word and store str_buf
search the dictionary and determine the part of speech
if(str_buf equals VP) {
read a next word and store str_buf
if( No word exists) {
Within_That = FALSE; // that절을 빠져 나왔음
break; //while문을 빠져 나온다.
}
search the dictionary and determine the part of speech
if(str_buf equals NP or ADVP or ADJP) {
read a next word and store str_buf
if( No word exists) {
Within_That = FALSE;//that절을 빠져 나왔음
break; //while문을 빠져 나온다.
}
search the dictionary and determine the part of speech
if(str_buf equals VP) {
Within_That = FALSE; // that절을 빠져 나왔음
read a previous word and store str_buf
}
}
else if(str_buf equals VP) {
Within_That = FALSE; // that절을 빠져 나왔음
read a previous word and store str_buf
}
}
else if(str_buf equals NP)
read a next word and store str_buf
search the dictionary and determine the part of speech
if(str_buf equals VP) {
read a next word and store str_buf
if( No word exists)
Within_That = FALSE;//that절을 빠져 나왔음
continue; //다음 단어를 읽는다.
search the dictionary and determine the part of speech
if(str_buf equals PP) {
Within_That = FALSE;// that절을 빠져 나왔음
continue; //다음 단어를 읽는다.
}
}
else
continue
}
else {
read a next word and store str_buf
}
}
printf(" 이 %s 가 That clause절의 끝 Word\n", str_buf);
That 포함 전체 문장 수
약 260문장
관계대명사 문장의 수
54
error rate
10
알고리즘 정확도
약80%
3. 2번 알고리즘을 사용시의 정확도.
* 알고리즘의 세밀화가 부족하여, 정확도가 많이 떨어 질수 있음.
추천자료
- 언어의 이해(언어와 실재, 존재와 언어, 시성와 문법성, 시 작품 속 언어 분석)
- [사회학] 한국의 환경정책 및 자연환경훼손사례 분석연구
- 언어의 의미, 언어의 구조, 언어의 특성, 들뢰즈와 가타리의 언어론, 발터 벤야민의 언어론, ...
- 사회언어학의 의의, 국어방언의 사회언어학, 드라마의 청자대우법에 대한 사회언어학, 인터넷...
- 언어습득이론의 개념, 언어습득이론의 종류, 언어습득이론의 견해, 언어습득이론으로 본 교수...
- [환경교육론]환경 매트릭스 (환경문제,자연 환경,환경 운동,환경 보호등 내용정리,분석)
- [영어교육]영어과교육 챈트학습지도, 영어과교육 문형학습지도, 영어과교육 게임학습지도, 영...
- 기하학 학습, 고지혈증 환자교육 코스웨어설계, 초등학교 과학 편리한 도구 단원 코스웨어설...
- [케이스스터디][만성신부전]만성폐쇄성폐질환 케이스스터디(CaseStudy), 만성신부전 케이스스...
- [고전문학A+] 시조분석 및 문화콘텐츠화 - 이현보의「어부단가를 통해 보는 강호가도와 강호...
- [언어지도] 유아의 음성언어 발달과정(또는 문자언어 발달과정)을 기초로 관련 자료를 수집하...
- 자연수의 곱셈과 나눗셈에 대한 교재 내용 분석 및 지도안 작성
- 3~5세 누리과정의 5개 영역 중 자연탐구 영역과 관련된 문학작품 1권을 선정한 후 다음의 내...
- 유아의 음성언어 발달과정, 유아의 문자언어발달 과정을 기초로 관련 자료를 수집하여 분석해...
소개글