表題番号:2004A-174 日付:2005/03/18
研究課題符号化技術のディジタルライブラリーへの応用
研究者所属(当時) 資格 氏名
(代表者) 理工学術院 教授 平澤 茂一
研究成果概要
 文書データベースを対象に情報検索・分類・クラスタリングについて検討した.特に,確率モデルに分類されるPLSI
(Probabilistic Latent Semantic Indexing)モデルを用いたシステムの評価と応用を行った.
(1)「PLSIモデルを用いた文書分類・クラスタリング法」は小規模のデータベースに対し優れた性能を持つ[1]
(2)「PLSIモデルを用いた情報検索システム」はベクトル空間モデルを用いたものとほぼ同等の性能を持ち,計算量削減が可能
  である[5]
(3)「学生の授業改善アンケート解析」に重要文抽出・文章要約・PLSIに基づく文書クラスタリング法を適用した結果,統計処理を
  併用することにより学生の授業満足度・最終成績などを説明する有効な指標を得た[4]

 PLSIモデル以外のモデル(主としてベクト空間モデル)についても検討し
(4)情報検索・分類・クラスタリングの各手法の性能改善を行った