表題番号:2023C-495 日付:2024/02/20
研究課題一般物体を対象とした6DoF姿勢推定技術の高精度化と高速化
研究者所属(当時) 資格 氏名
(代表者) 理工学術院 大学院情報生産システム研究科 教授 池永 剛
(連携研究者) 東南大学 准教授 Songlin Du
研究成果概要

多様なFAシステムやスポーツ解析などの応用を想定し、人物(頭や腕など)から任意の物体(工業生産物など)を対象とした6自由度(6DoF)の姿勢推定技術を図った。入力はビデオカメラから撮影した映像とし、深層学習を用いた学習に必須となる多様な正解値付きデータ取得に必須のため、センサーを用いた独自の評価環境を実現した。頭部を対象とした姿勢推定技術に関しては、Vision Transformer (ViT)をベースラインとして用い、プログレッシブ空間重み付け、時間集約モジュール、多段階の分類と回帰などの独自な提案により、Mean Absolute Errorを従来と比較して、1度以上改善可能なアルゴリズムを実現した。また、履歴を用いた時空間ニューラルネットにより、300m秒先の頭部の姿勢を予測する技術を考案した。一方、工業生産物に関しては、変形する物体、透明な物体、反射のある物体などを対象とした取り組みや1msで物体の姿勢推定が行える技術等の検討を行なった。本研究に関連する成果として、IEEE Transactions on Automation Science and Engineering, Multimedia Tools and Applications (Springer)Pattern Recognition (Elsevier)の3件の原著学術論文に採択された。また国際会議としては、18th IAPR International Conference on Machine Vision Applications (MVA2023)3で発表した。さらに、関連企業との議論を通じて本技術の有効性を示し、将来の産業化に向けた取り組みを行った。