表題番号:2004A-203 日付:2005/03/25
研究課題現代英語コロケーションの自動抽出とその応用
研究者所属(当時) 資格 氏名
(代表者) 国際教養学術院 助教授 森山 秀
研究成果概要
本研究課題においては、先行研究(2002A-553)で得られた実験データに基づき、現代英語コロケーションの自動抽出システムの改良と、ユーザを意識した検索システムの構築を試みた。近年増大するコーパス言語学および関連分野の文献の中で、G. Sampson and D. McCarthy, Corpus Linguistics: Readings in a Widening Discipline (2004) などにより、これまでの言語研究の流れの中で本研究の意義と位置づけの確認を行った。データの言語分析を中心とするため、ひとつ二つの堅固な既存の言語理論をそのままの形で応用することはほぼ不可能である。このため、コンピュータのプログラミングが可能になるような語と語群の新たな解釈と分類法の模索が必要であった。この点は、J. Sinclair, S. Jones and R. Daley, English Collocation Studies: The OSTI Report (2004), S. Bartsch, Structural and Functional Properties of Collocations in English (2004) などの最新文献でも指摘されているように、抽出のターゲットとなるコロケーションの規模・形態(2語連接形、隔離語群などのパタン)により論理構成は多様である。また、コロケーションの抽出には、各語の出現頻度調査のみならず、他の高頻度結合語群とは有意な差が認められる評価基準が必要となる。目下開発中の自動評価システムの実装には更なる実験データの集積が必須である。最終的には、コロケーションの自動検索システムの構築を目指し、ユーザインタフェースの開発までを視野にいれている。母国語話者であっても判断が難しいと言われる語群の結合力の知識を獲得することは、特に中・上級英語学習者(大学生レベル)の英語運用能力(特に作文力)を飛躍的に向上させるものと思われる。従来のコンコーダンス表示型の検索から、語群の意味領域ネットワークを用いたエンサイクロペディア型の検索が可能なシステムの構築法を検討中である。J. Sinclair, How to Use Corpora in Language Teaching (1996) などの文献の精査を行っている。自動評価システムについては、プロトタイプが完成次第、成果の一部を論文として発表する準備を行っている。