表題番号:1997A-158 日付:2002/02/25
研究課題情報源符号化と統計的モデル選択の基礎理論
研究者所属(当時) 資格 氏名
(代表者) 理工学部 助手 後藤 正幸
研究成果概要
近年、情報源符号化と統計的学習理論を関連づける研究において、ベイズ統計理論が中心的な役割を演じていることが指摘されている。とくに、J.Rissanen の提唱した MDL、あるいは Stochastic Complexity の概念はベイズ理論と密接に関係する。本研究では、統計的モデル選択、ベイズ的学習、情報源符号化をベイズ統計の枠組みから体系的にとらえ、その普遍的性質の解明および現実問題への適用を目的としており、主
に以下のような成果を得た。
(1) ベイズ決定理論に基づくモデル選択の漸近一致性の解析
(2) ベイズ決定理論に基づくモデル選択の選択誤り率の上界の解析
(3) 情報量規準に基づくモデル選択の選択誤り率の上界の解析
(4) ベイズ符号(混合モデル)の漸近的性質の解析
(1)に関しては、まずベイズ決定理論に基づき統計的モデル選択問題を一般的に定式化し、その漸近的一致性について考察した。前年の結果では、予測を目的とする場合でも、漸近的一致性を持つことが明らかとなっていたが、本年度はさらに一致性を弱一致性と強一致性に分け、どのような条件のもとで両者の差異が生じるかを論じた。
(2)では、主に真のモデルを発見することを目的とするベイズ規準によるモデル選択に対し、その誤り率の上界を導出できた。
(3)では、情報量規準を用いたモデル選択に対し、その誤り率の上界を導出できた。
(4)では、Clarke and Barron の漸近解析に関して、階層モデル族であるFSMXモデルへの拡張を検討し、ベイズ符号の漸近符号長、漸近平均符号長を示した。
なお、本研究による1997年度の研究発表は以下の通りである。
[1] A Study on Difference of Codelengths between MDL Codes and Bayes Codes on Case Different Priors Are Assumed, IEEE International Symposium on Information Theory 97, (1997,6)
[2] ベイズ決定理論に基づく統計的モデル選択について、 電子情報通信学会 技術研究報告 IT97-21, (1997,7)
[3] On Theory and Application of Statistical Model Selection Based on Bayes Decision Theory, ICPR Production Research 97, (1997,8)
[4] 階層モデル族に対するモデル選択の選択誤り率について, 電子情報通信学会 技術研究報告 IT97, (1998,1)