목차
1. That이 relative clause를 나타내는지 알아보는 Algorithm 기술하고, tagger가 몇 % error 인지를 나타냄.
2. That 문의 끝을 알아내는 Algorithm 기술.
3. 2번 알고리즘을 사용시의 정확도.
2. That 문의 끝을 알아내는 Algorithm 기술.
3. 2번 알고리즘을 사용시의 정확도.
본문내용
면 That이하 절의 끝을 알아 내기 위해서는 관계 대명사의
that이 온 이후에는 반드시 동사구가 따라 오던지 인칭 대명사와 같은 명사구가 온 후에
동사구, 부사구, 명사구 등이 연이어 와야 한다. 그러나 동사구가 문장 내에서 두번이
오는 경우는 두 번째 동사구의 앞 까지가 That이하 절의 끝이 되게 됨.
Algorithm 기술:
char str_buf[_MAXLEN]; //한 단어 저장을 위한 버퍼
BOOL Within_That = FALSE: //현재의 단어가 That절 안의 단어 인지 확인하기
// 위한 변수
While ( There is a phrase to parse){
read a word and store str_buf
if( (str_buf == "that") || ( Within_That = TRUE) {
Within_That = TRUE:
read a next word and store str_buf
search the dictionary and determine the part of speech
if(str_buf equals VP) {
read a next word and store str_buf
if( No word exists) {
Within_That = FALSE; // that절을 빠져 나왔음
break; //while문을 빠져 나온다.
}
search the dictionary and determine the part of speech
if(str_buf equals NP or ADVP or ADJP) {
read a next word and store str_buf
if( No word exists) {
Within_That = FALSE;//that절을 빠져 나왔음
break; //while문을 빠져 나온다.
}
search the dictionary and determine the part of speech
if(str_buf equals VP) {
Within_That = FALSE; // that절을 빠져 나왔음
read a previous word and store str_buf
}
}
else if(str_buf equals VP) {
Within_That = FALSE; // that절을 빠져 나왔음
read a previous word and store str_buf
}
}
else if(str_buf equals NP)
read a next word and store str_buf
search the dictionary and determine the part of speech
if(str_buf equals VP) {
read a next word and store str_buf
if( No word exists)
Within_That = FALSE;//that절을 빠져 나왔음
continue; //다음 단어를 읽는다.
search the dictionary and determine the part of speech
if(str_buf equals PP) {
Within_That = FALSE;// that절을 빠져 나왔음
continue; //다음 단어를 읽는다.
}
}
else
continue
}
else {
read a next word and store str_buf
}
}
printf(" 이 %s 가 That clause절의 끝 Word\n", str_buf);
That 포함 전체 문장 수
약 260문장
관계대명사 문장의 수
54
error rate
10
알고리즘 정확도
약80%
3. 2번 알고리즘을 사용시의 정확도.
* 알고리즘의 세밀화가 부족하여, 정확도가 많이 떨어 질수 있음.
that이 온 이후에는 반드시 동사구가 따라 오던지 인칭 대명사와 같은 명사구가 온 후에
동사구, 부사구, 명사구 등이 연이어 와야 한다. 그러나 동사구가 문장 내에서 두번이
오는 경우는 두 번째 동사구의 앞 까지가 That이하 절의 끝이 되게 됨.
Algorithm 기술:
char str_buf[_MAXLEN]; //한 단어 저장을 위한 버퍼
BOOL Within_That = FALSE: //현재의 단어가 That절 안의 단어 인지 확인하기
// 위한 변수
While ( There is a phrase to parse){
read a word and store str_buf
if( (str_buf == "that") || ( Within_That = TRUE) {
Within_That = TRUE:
read a next word and store str_buf
search the dictionary and determine the part of speech
if(str_buf equals VP) {
read a next word and store str_buf
if( No word exists) {
Within_That = FALSE; // that절을 빠져 나왔음
break; //while문을 빠져 나온다.
}
search the dictionary and determine the part of speech
if(str_buf equals NP or ADVP or ADJP) {
read a next word and store str_buf
if( No word exists) {
Within_That = FALSE;//that절을 빠져 나왔음
break; //while문을 빠져 나온다.
}
search the dictionary and determine the part of speech
if(str_buf equals VP) {
Within_That = FALSE; // that절을 빠져 나왔음
read a previous word and store str_buf
}
}
else if(str_buf equals VP) {
Within_That = FALSE; // that절을 빠져 나왔음
read a previous word and store str_buf
}
}
else if(str_buf equals NP)
read a next word and store str_buf
search the dictionary and determine the part of speech
if(str_buf equals VP) {
read a next word and store str_buf
if( No word exists)
Within_That = FALSE;//that절을 빠져 나왔음
continue; //다음 단어를 읽는다.
search the dictionary and determine the part of speech
if(str_buf equals PP) {
Within_That = FALSE;// that절을 빠져 나왔음
continue; //다음 단어를 읽는다.
}
}
else
continue
}
else {
read a next word and store str_buf
}
}
printf(" 이 %s 가 That clause절의 끝 Word\n", str_buf);
That 포함 전체 문장 수
약 260문장
관계대명사 문장의 수
54
error rate
10
알고리즘 정확도
약80%
3. 2번 알고리즘을 사용시의 정확도.
* 알고리즘의 세밀화가 부족하여, 정확도가 많이 떨어 질수 있음.
추천자료
언어의 이해(언어와 실재, 존재와 언어, 시성와 문법성, 시 작품 속 언어 분석)
[사회학] 한국의 환경정책 및 자연환경훼손사례 분석연구
언어의 의미, 언어의 구조, 언어의 특성, 들뢰즈와 가타리의 언어론, 발터 벤야민의 언어론, ...
사회언어학의 의의, 국어방언의 사회언어학, 드라마의 청자대우법에 대한 사회언어학, 인터넷...
언어습득이론의 개념, 언어습득이론의 종류, 언어습득이론의 견해, 언어습득이론으로 본 교수...
[환경교육론]환경 매트릭스 (환경문제,자연 환경,환경 운동,환경 보호등 내용정리,분석)
[영어교육]영어과교육 챈트학습지도, 영어과교육 문형학습지도, 영어과교육 게임학습지도, 영...
기하학 학습, 고지혈증 환자교육 코스웨어설계, 초등학교 과학 편리한 도구 단원 코스웨어설...
[케이스스터디][만성신부전]만성폐쇄성폐질환 케이스스터디(CaseStudy), 만성신부전 케이스스...
[고전문학A+] 시조분석 및 문화콘텐츠화 - 이현보의「어부단가를 통해 보는 강호가도와 강호...
[언어지도] 유아의 음성언어 발달과정(또는 문자언어 발달과정)을 기초로 관련 자료를 수집하...
자연수의 곱셈과 나눗셈에 대한 교재 내용 분석 및 지도안 작성
3~5세 누리과정의 5개 영역 중 자연탐구 영역과 관련된 문학작품 1권을 선정한 후 다음의 내...
유아의 음성언어 발달과정, 유아의 문자언어발달 과정을 기초로 관련 자료를 수집하여 분석해...
소개글