자연언어처리
자연언어처리 시스템
자연언어의 이론적인 연구만이 아니라, 이것을 응용하여 실제로 사용하는 자연언어 처리 시스템을 만들려는 시도도 활발하다. 현재까지 개발된 자연언어 시스템은?
- 질의응답 시스템(컴퓨터와 인간 사이에 질문과 응답을 반복하는 시스템)
- 문제해결 시스템(산수 응용문제 등의 해답을 구하는 시스템)
- 데이터베이스 조작 시스템(데이터베이스를 검색, 갱신하는 시스템)
- 문장해석 시스템(문장의 의미를 이해하는 시스템)
- 기계번역 시스템(언어 사이의 번역을 행하는 시스템)
자연어 처리 시스템
분야 | 시스템명 | 개발 | 기능 |
---|---|---|---|
질의 응답 시스템 | Ninmuzz | Ninmuzz | 대화형 웹어플리케이션 |
SHRDLU | MIT | 나무쌓기의 QA시스템 | |
GUS | 제롯스사 | 여행계획의 QA시스템 | |
ELIZA | ditto | 정신분석의 QA시스템 | |
SCHOLOR | MIT | 지리학습용 CAI | |
문제해결 시스템 | STUDENT | MIT | 산수 문제해결 시스템 |
Newton | MIT | 물리 문제해결 시스템 | |
Isaoc | 텍사스대 | 지리 문제해결 시스템 | |
문장해석 시스템 | MARGIE | 스탠퍼드대 | 영문해석 시스템 |
TOPLE | MIT | 대화이해 시스템 | |
LINGOL | MIT | 영문해석 시스템 | |
데이터베이스 검색 시스템 | YDK Version 2000 | 영남대학교 | 전문용어 용언 사전개발 시스템 |
YDK-Term Version 2000 | 영남대학교 | 전문용어 용언 다국어통합사전 갤발 시스템 | |
LADDER | SRI | 대규모 분산 데이터베이스 조회 시스템 | |
RENDEZOUS | CODD | 관계 데이터베이스 조작 시스템 | |
LUNAR | BBN | 지질학에 관한 질의응답 시스템 | |
REQUEST | IBM | 데이터베이스 검색 시스템 | |
PLANS | 일리노이대 | 항공편에 관한 질의응답 시스템 |
자연어처리 단계
형태소해석
- 형태소해석 규칙 : verb+s=sg, 3p (명사+조사, 동사+어미), 감기는 tries, 형태소해석 사전(try : verb, 감기 : 명사(n), 감다/감기다 : 동사(V), 는 : 조사(i)/어미(e), 기 : 명사형 어미(ne)
- 형태소 해석기
- try+s : v, sg, 3p
- 감기(n)+는(i)
- 감(v)+감(ne)+기(e)
- 감기(v)+는(e)
구문해석
- 각 단어의 문법적 역할을 분석하는 것
- 단어의 성분분석 : 어느 단어가 주어이며, 어느 단어가 목적어, 보어, 술어동사인가?
- 수식관계분석 : 어느 전치사구가 어느 명사와 동사를 수식하고 있는가 분석
- 구문해석의 개념도
I climb a mountaion 구문해석
의미해석
- C. Fillmore의 격문법(1968)
- 문장은 동사를 중심으로 만들어져 있음.
- 문장의 각 주요 명사(구)가 술어동사에 대해 어떤 격으로 역할하는가.
- 격관계를 의미적으로(심층적으로) 해석
- 동사의 격프레임(Case Frame)
- He opened the door by key
- open
- agent : He
- object : door
- instrument : key
- open
- He opened the door by key
- open
- agent : He
- object : door
- instrument : key
- open
- He opened the door by key
- 의미소(semantic feature)
- <human>, <animal>, <action> 등과같이 추상적인 세계로 의미를 표현한것.
- 목적: 같은의미소가 부여된 단어의 집합을 단위로 언어현상을 기술 가능 하게함.
- ALT/JE에서의 의미소체계
- 일반명사 : 최대 2800여종, 최대 12단, 상위 4단을 표시
- 구체
- 주체
- 사람, 조직
- 장소
- 지역, 지역, 지역
- 구체물
- 생물, 무생물
- 주체
- 추상
- 추상물
- 제도ㆍ습관ㆍ결혼
- 문화
- 일
- 인간활동
- 사상
- 자연현상
- 추상적관계
- 존재, 관련, 성질, 상태, 형상, 수량, 장소, 시간
- 추상물
- 구체
- 일반명사 : 최대 2800여종, 최대 12단, 상위 4단을 표시
참고도서
- 자연언어처리 : 마코토 나가오 외 | 황도삼, 최기선, 김태석 역 | 홍릉과학출판사 | 2007.03.15
- 자연언어처리의 응용 : 다나카 호츠미 저 | 황도삼 역 | 두양사 | 2002.10.20