表題番号:2017B-069 日付:2018/02/28
研究課題語の形態-意味対応と音韻-意味対応の一貫性効果
研究者所属(当時) 資格 氏名
(代表者) 文学学術院 文学部 教授 日野 泰志
研究成果概要
 最近,語の意味類似性の評価にベクトル空間モデル(VSM)が利用されるようになってきた(e.g., Marelli, Amenta & Crepaldi, 2015)。語の意味類似性を評価するVSMでは,文中に出現する語を,その前後に隣接する他の語の統計情報を使って符号化し,語ベクトルを作成する。Harris (1954)のdistributional hypothesis によれば,類似の文脈中に出現する語は,類似の意味を持つ可能性が高いため,前後に隣接する語が類似している語同士は,類似の意味を持つ可能性が高い。この仮説に従えば,上記の方法で作成した語ベクトルの類似度を計算すると,語ペア間の意味類似性を反映した値を得ることができる。また,Buchanan, Westbury & Burgess (2001)及びSiakaluk, Buchanan & Westbury (2003)は,VSMモデルを使って,ある語の語ベクトルから意味空間上で10番目に近い位置にある語ベクトルまでの”意味距離”を計算し,それを実験変数として操作したところ,語彙判断課題やカテゴリー判断課題の成績に有意な”意味距離”効果が観察されたことを報告している。そこで,本研究では,Mikolov, Chen, Corrado & Dean (2013)によって開発された“word2vec”を使って,2017 年 2月 22 日時点の日本語wikipedia全文と現代日本語書き言葉均衡コーパス(Maekawa, Yamazaki, Ogiso, Maruyama, Ogura, Kashino, Yamaguchi, Tanaka & Den, 2014)とを結合して作成したコーパスを学習させることで語ベクトルを作成した。この語ベクトルを使って,Hino, Miyamura & Lupker (2011)が収集した12,378個の語ペアに対する意味類似性評定値と,語ベクトル・データから計算したコサイン類似度とを比較したところ,有意な正の相関が観察された(r = .619, p < .001)。そこで,これらの語ベクトルを使って,語の“意味距離”の操作を試みたところ,語彙判断課題において有意な“意味距離”効果を再現することができた。“意味距離”が近い語に対する反応の方が,“意味距離”が遠い語に対する反応よりも有意に反応時間が短かった。これらの結果は,“word2vec”を使って日本語コーパスを学習させて作成した語ベクトルは,人が持つ語の意味に関する知識をある程度反映していることを示唆するものであった。