特定課題報告書印刷(Print out of Special Research Projects)

表題番号：2025C-426 日付：2026/04/03

研究課題空間上で区分的に変化する木構造モデルを用いた理論最適かつ効率的なベイズ予測アルゴリズム

	研究者所属（当時）	資格	氏名
（代表者）	理工学術院基幹理工学部	助手	島田　航志
（連携研究者）	理工学術院	教授	松嶋敏泰

研究成果概要: 情報理論においてはデータが情報源と呼ばれる確率変数から発生したものと考え、データを符号化した符号語の長さを確率変数の期待値(期待符号長)で評価する。このとき確率変数の従う確率分布が未知である場合、多くの研究では未知の確率分布を推定して符号化が行われる。この推定においては、例えば確率分布のある集合を定め、その中から期待符号長を最も短くする確率分布を選ぶモデル選択的なアプローチが考えられる。ただし、情報源が複数の確率変数による階層的な構造から発生しているなど複雑な場合には、膨大な候補から一つを選択することになり、計算量的な問題や期待符号長に関する最適性が保証されない問題が生じる。
　[Shimada,2024]では、時系列上で区間毎に異なる文脈木モデルという情報源を考えている。文脈木モデルが時系列上で未知の変化点において変化し、さらに各区間における文脈木モデルも未知という非定常な情報源を仮定すると、モデル選択的アプローチの困難性は先述の通りである。そこで、変化点や文脈木モデルを発生させる事前分布を与え、期待符号長をさらに事前分布で加重平均したベイズ期待符号長の最小化(=ベイズ符号)を行う。ベイズ符号化には変化点や文脈木モデルの事後確率を計算し、その加重平均を行うので、こちらも計算量的な問題が発生する。これに対して事前分布の工夫により事後確率計算を解析的に行うことができ、加重平均の計算オーダーを削減しながらベイズ期待符号長の最適性は失われないというアルゴリズムの導出している。
　本研究では、時系列上の逐次的なベイズ符号化を、n時点までのデータを得たもとでn+1時点の情報源の確率分布を予測するという問題に拡張し、「区間ごとに確率モデルが変化する問題における予測の最適化」として体系的に整理した。また、2変数による回帰分析といった2次元空間において、説明変数の区間毎に確率モデルが異なる場合における予測への拡張も行った。