表題番号:2023C-178 日付:2024/03/12
研究課題最大事後推定を用いたクラスの分布推定によるFew-Shot画像分類に関する研究
研究者所属(当時) 資格 氏名
(代表者) 理工学術院 大学院情報生産システム研究科 教授 古月 敬之
研究成果概要

深層学習は、データから直接特徴表現を学習する強力な能力により、多くの課題解決にブレークスルーを起こしている。画像分類は、大規模な人手によるラベル付け学習データを用いることで高精度に実現できるが、学習データが少ない場合には困難と言われている。一方、人間であれば、過去少数回しか見たことのない物体が、目の前に同じような物体が現れたとき、それを思い出して認識することが可能である。本研究では、このような人間の能力を深層学習で模倣するために、基本クラスと呼ぶ豊富なラベル付きサンプルから学習し、ベイズ推定法により少ないラベル付け例で新規クラスに汎化するシンプルかつ効果的な分布推定モデルを獲得し、Few-Shot画像分類を行う。具体的に、まず、Box-Cox変換を用いて、特徴表現空間における基本クラスおよび新規クラスのデータを正規分布に従うように変換し、確率的枠組みにおける最大事後(MAP)法による点推定法で、基本クラスの事前分布を効果的に取り込める新規クラスの分布推定モデルを構築する。次に、セマンティック特徴を活用することで、特徴抽出器による新規クラスの画像特徴と基本クラスの画像特徴の間にある偏りを対処し、事前分布の選択を改善したMAP法を構築する。さらに、MAP法で推定した新規クラスの分布でサンプリングして得た学習データを活用した対照学習で、識別性の高い特徴表現空間を再構築する。これらのことにより、高性能なFew-Shot画像分類を実現する。成果の性能評価では、複数のベンチマークデータセットにおいて従来法の最良結果よりも1.09%13.09%向上し、最先端手法を大幅に上回ることが示されている。