언어, 컴퓨터, 코퍼스언어학

2004년 문화관광부 우수학술도서

저자 : 강범모

판형 : 신국판 면수 : 292 쪽

발행년월일 : 2003-09-10

ISBN : 89-7641-489-6

학술연구총서 65

가격 : 10,000

오늘날의 정보사회에서 컴퓨터는 일상생활뿐 아니라, 많은 학문 영역에서도 큰 영향을 미치게 되었다. 자연과학의 여러 분야는 말할 것도 없고, 컴퓨터 음악, 컴퓨터 그래픽스 등 예술 분야, 나아가 전통적인 인문학의 여러 분야에서도 컴퓨터는 기존의 연구 과제에 대한 새로운 접근법을 제시하는 동시에, 새로운 연구 과제를 창출해 왔다.
언어의 연구도 예외는 아니다. 컴퓨터의 등장은 수천 년 전부터 호기심의 대상이었던 언어의 여러 가지 문제를 컴퓨터를 이용하여 해결하려는 새로운 방법을 제시하였을 뿐만 아니라 자연언어의 컴퓨터 처리와 관련된 이론적인, 그리고 실제적인 연구 과제들을 던져 주었다. 이러한 맥락에서, 컴퓨터에 저장된 전자 텍스트 자료를 기반으로 컴퓨터를 이용하여 자연언어를 연구하는 접근법이 근래 언어학과 국어학계의 큰 관심사이다. 이러한 접근법을 코퍼스 언어학(corpus linguistics)이라고 부르며, 국어에 국한하여 언급할 경우에는 국어정보학이라는 이름으로 부르기도 한다. 이 책은, 주로 국어의 자료를 이용하여, 코퍼스 언어학, 즉 컴퓨터를 이용한 언어 연구의 이론과 실제적 방법, 그리고 연구 결과를 제시하는 것을 목적으로 한다.
이 책은 전체적으로 세 부분으로 구성되어 있다. 제1부(제1장~제5장)는 컴퓨터를 이용한 언어 연구 방법의 기초를 상세히 설명하여, 독자가 실제로 언어 자료를 이용하면서 기초적인 연구를 수행할 수 있도록 안내한다. 제2부(제6장~제10장)는 컴퓨터 코퍼스를 이용하여 언어 연구를 수행하는 코퍼스 언어학의 이론과 연구 방법 및 결과를 제시한다. 마지막의 제3부(제11장~제12장)는 컴퓨터를 이용한 언어 연구를 위해 유용한 여러 가지 정보를 얻는 방법에 대한 안내이다.
이 책은 언어학 및 국어학 분야에서 새롭게 관심을 끌고 있는 코퍼스 언어학의 연구 방법, 즉 컴퓨터에 저장된 전자 텍스트 자료를 기반으로 컴퓨터 프로그램을 이용하여 필요한 정보를 추출하고 언어 기술을 하는 방법을 본격적으로 소개, 안내하고 논의한다는 점에서 나름대로의 가치가 있다. 특히 이 책의 제1부에서는 전자 텍스트로부터 언어학적 정보를 추출하는 방법을 구체적으로 제시하고, 제3부에서는 코퍼스 언어학과 관련된 실제적이고 다양한 정보를 제공함으로써, 이 분야를 처음 공부하고자 하는 언어학과 국어학 전공의 학생과 학자들에게 유용한 지침서가 될 수 있다. 한편, 이 책의 제2부에서 논의하는 코퍼스 언어학의 여러 가지 주제는 이 책이 친절한 교과서로서의 역할뿐 아니라 깊이 있는 개설서로서의 역할을 동시에 수행할 수 있음을 보여 준다.

제1부 컴퓨터를 이용한 언어 연구의 기초

제1장 컴퓨터와 언어
1. 컴퓨터와 언어 연구
2. 컴퓨터 이용의 장단점
3. 실제 과제: 문장의 평균 길이
4. 컴퓨터 이용이 가치 있는가?

제2장 언어 자료
1. 코퍼스
2. 자료의 입수
3. 파일 형식과 자료의 전처리

제3장 빈도
1. 빈도 목록
2. 타입/토큰 비율
3. 빈도 목록 만들기의 실제

제4장 용례
1. 용례의 필요
2. 두 종류의 용례 검색 프로그램
3. 프로그램의 사용
4. 워드프로세서를 이용하여 용례 검색하기
5. 불충분한 용례, 불필요한 용례

제5장 연어
1. 연어란?
2. 연어값의 계산
3. 결과의 해석
4. 문제점

제2부 코퍼스 언어학의 이론과 실제

제6장 코퍼스 언어학
1. 코퍼스와 코퍼스 언어학
2. 컴퓨터 이전의 코퍼스 언어학
3. 영어 코퍼스
4. 코퍼스의 이용
5. 한국어 코퍼스

제7장 코퍼스의 가공과 주석
1. 원시 코퍼스와 주석 코퍼스
2. 주석의 방법
3. 품사 태깅
4. 형태소 분석 코퍼스
5. 트리뱅크
6. 다른 종류의 주석

제8장 텍스트 부호화와 문서 표준
1. 필요성
2. TEI와 SGML
3. TEI DTD 기본 구조와 이용
4. 기본 문서 구조
5. 헤더 정보
6. 본문
7. 그 밖의 태그들
[참고자료] TEI 라이트 요소 목록

제9장 하이퍼텍스트
1. 하이퍼텍스트와 하이퍼미디어
2. 인터넷과 WWW
3. HTML: 웹 문서 만들기

제10장 컴퓨터를 이용한 국어 연구의 실제

1. 빈도와 언어 기술
2. 음운과 문자
3. 형태론: 파생접사의 생산성
4. 문법과 의미: 재귀사의 선행사
5. 텍스트와 담화

제3부 컴퓨터를 이용한 언어 연구 안내

제11장 코퍼스 언어학 가이드
1. 연구 기관
2. 관련 학회와 학술회의
3. 문헌
4. 용례 검색 서비스
5. 전자사전 및 어휘 데이터베이스
6. 소프트웨어

제12장 국어정보학과 코퍼스 언어학

참고 문헌

찾아보기

저자 : 강범모

고려대학교 언어학과 교수 주요 저서/역서 한국어 데이터베이스의 설계 및 응용 (공저) 한글 사용 빈도의 분석 (공저) 형식의미론과 한국어 기술 (공저) 한국어의 텍스트 장르와 언어 특성 한국어 형태소 및 어휘 사용 빈도 (공저) 범주문법 한국어 연어 관계 연구 (공저) 영화마을 언어학교 언어: 풀어 쓴 언어학 개론 언어학의 역사 (번역) 한국어 사용 빈도 (공저) 의미론 1, 의미론 2 (번역)... more

댓글을 달 수 없는 글입니다.