表題番号:2013A-6329 日付:2014/04/11
研究課題読み聞かせロボットの高精度画像認識に関する研究
研究者所属(当時) 資格 氏名
(代表者) 理工学術院 教授 鎌田 清一郎
研究成果概要
二宮金治郎をイメージしてデザインを考え、薪のかわりにパソコンを背負うというコンセプトにより、感情を込めて本の読み聞かせを行うロボット「二宮くん」を開発している。「二宮くん」は、目にカメラを搭載しているため、一般照明の影響、本のフォントの多様性により文字認識がうまくいかず、認識率があまり良くないという問題があった。本研究では、「二宮くん」の高精度認識を実現することを目的としてこれらの問題を解決するため、次のような研究成果を得た。(1)照明等による影響による画像の変動を吸収するために、カラーコントラスト補正法を開発した。これはRGBカラー空間の輝度情報に着目し、大域処理と局所処理の2段階の階調マッピングを実現する階層的ヒストグラム表現を用いるものである。NASA Langley Research Centerのデータセットを使った評価実験の結果、提案手法は代表的な従来手法よりPSNRによる評価において約10%、エントロピー評価においても同等の画質改善ができることを確認した。(2)本などの画像から文字部分を高精度に抽出し認識する必要がある。本研究では、Gaborフィルタを拡張し、新たに局所Gaborテクスチャ特徴を提案した。これは画像中における局所領域のコーナー点の周辺の色とテクスチャを用いた特徴量である。色情報はHSV色空間から得られる画像中の色彩と色相の情報から抽出し、テクスチャ情報は明度情報からガボールフィルターを用いて抽出する。また、テクスチャ情報は離散フーリエ変換を適用し、画像の回転に対して不変の値にすることで、画像中のテキストにおいて頑健な特徴量を抽出した。文字認識・文書理解国際会議にて一般公開されている画像データセットを用いてテキスト領域の検出性能を評価した場合、提案手法の性能は他手法の性能よりも再現率において約10%、F値において数パーセント高いことを示した。これらの研究成果により、独自に収集したデータセットを使った認識実験の結果、従来の文字認識法に比べて数パーセントの認識精度の向上を図ることができた。