表題番号:2013A-049 日付:2014/04/13
研究課題ベイズ符号による無歪み画像圧縮に関する研究
研究者所属(当時) 資格 氏名
(代表者) 理工学術院 教授 松嶋 敏泰
研究成果概要
 従来の無歪画像圧縮に関する研究は,アドホックな方法によるアルゴリズムの開発と,試行錯誤を繰り返すことによるアルゴリズムの改良というアプローチを採っており、理論的最適性などが保証されていることはあまりない.これらの研究は,この根本的問題を解決しない限り,画像圧縮の研究が大きな進展を得ることは期待できない.これに対し,本研究ではまず,画像に対して適した確率モデルを構築し,その確率モデル上で最適性を保証するベイズ符号を構成するアプローチをとることで,上記の根本的問題の解決を試みるものである.
まず,本年は研究目的のため,画像データには特化せず,より基本的な情報源を考え,ベイズ符号やベイズ符号を用いた予測についての理論的な解析と画像データの確率モデルの基礎となるいくつかの確率モデルに対して,最適または近似最適な効率的なアルゴリズムの構成とその性能評価をおこなった.

(1) 真のモデルとベイズ符号が仮定したモデルの符号長における影響の漸近解析
 ベイズ符号は,パラメタライズされた分布を仮定しその確率パラメータを未知としてベイズ基準で符号長最小の符号化となっているが,もし仮定した分布で真の分布が表現できない場合,ベイズ基準の意味での最適性は保証されない.しかし,真の分布と仮定した分布の中でK-L情報量的に最も近い分布とのK-L情報量だけ漸近符号長が長くなるものの,ベイズ符号が優れた性質もつことを証明した.
 特に,画像データのように階層的な確率モデルが仮定される場合に,真の画像データの分布がその仮定した階層確率モデル族で表現できない場合でも,階層モデルの中で,平均符号長を最小とするモデルに漸近収束することが示され,真の分布を,仮定した確率モデルが含まない場合でも,ベイズ符号が優れた性質を持っていることを示した.

(2) ベイズ符号のオーバーフロー確率の理論評価
 ベイズ符号が平均符号長を評価基準としてベイズ基準,minimax基準,maxmin基準において漸近的に最適な符号であることはよく知られているが,オーバーフロー確率の面での評価は今までに行なわれていなかった.実用的な見地からは,平均符号長における評価のみならず,符号長が,あるメモリー量をオーバーしてしまう確率であるオーバーフロー確率も重要な評価指標である.そこで,符号長の2次モーメントや自己エントロピーの2次モーメントを用い,オーバーフロー確率の漸近解析を行なった.その結果この面においてもベイズ符号が優れた特性を有することが示された.

(3) 文脈木モデル以外の拡張された情報源に対するベイズ符号アルゴリズムの構築
 情報源符号化の研究の多くは,情報源の確率的な性質は時間によって変化しないとする定常情報源を対象としている.文脈木モデルも例外ではない.ところが,実データにおいては,幾つかの性質が異なるコンテンツが1つのファイルに含まれていることも多く,そのようなファイルを情報源として見た場合には,非定常な情報源と考えるのが自然である.情報源が非定常であるにも関わらず,定常情報源の場合と同様の符号化アルゴリズムを使用すれば,良い圧縮性能を望むことは出来ない.情報源が非定常であれば,符号化アルゴリズムもその変化を追従するアルゴリズムを構築する必要がある.一言に非定常情報源と言っても,モデル化の方法は一意ではなく,幾つかのモデルが考えられる.本研究グループは,これらのモデルの内の一部である区間で定常な非定常情報源やパラメータが時間によって変化する文脈木情報源に対するベイズ符号を提案し,性能に関する理論解析を行い,さらにベイズ符号を実現する効率的アルゴリズムを提案した.
 また,実データに対する符号化を考えると,データのサイズが小さい場合には,全種類の情報源アルファベットが出てこない場合が考えられる.このような場合に,従来と同様の符号化をしてしまうと,圧縮の性能が劣化してしまうことが知られている.本研究グループは,情報源アルファベットの出現パターンを考慮した情報源モデルに対するベイズ符号を提案し,性能に理論解析を行い,さらにベイズ符号を実現する効率的なアルゴリズムを提案した.
 それらの研究の拡張として,画像データや言語データ等にも適した非定常な情報源モデルや情報源アルファベットが部分的に出現する情報源モデルの検討を行い,ベイズ符号の性能に関する理論解析及び,ベイズ符号を実現する効率的アルゴリズムの構築を行った.