表題番号:2024C-189 日付:2025/04/08
研究課題⾳環境の認識と理解のための⾰新的マイクロホンアレー基盤技術の研究
研究者所属(当時) 資格 氏名
(代表者) 理工学術院 大学院情報生産システム研究科 特任教授 牧野 昭二
研究成果概要
 観測信号に含まれる音声信号の数がマイク数を上回る劣決定条件下において,複数チャネルの観測信号から単一の目的音声信号を抽出する新しい手法を提案した.従来のビームフォーマや空間正則化を用いたブラインド音源分離は,このような状況では干渉音声信号の抑圧が困難であった.スイッチング最小出力歪み応答 (Switching Minimum Power Distortionless Response: Sw-MPDR) ビームフォーマは,スイッチング機構を用いることで劣決定条件に対応可能だが,目的音声の到来方向によって決定されるステアリングベクトルに過適合すると推定精度が大幅に低下する.空間正則化独立ベクトル抽出 (Spatially-Regularized Independent Vector Extraction : SRIVE) は,到来方向のみに基づいて目的音声を頑健に強調できるが,劣決定条件下では性能が劣化する.本研究では,これらの従来法を拡張し,その限界を克服した.まず,Sw-MPDRビームフォーマに時間変動ガウス音源モデルを導入し,到来方向のみに基づいた目的音声の強調を効果的に行った.次に,SRIVEにスイッチング機構を導入し,劣決定条件下での音声強調性能を向上させた.これらの提案法をそれぞれスイッチング加重MPDR (Sw-wMPDR) ビームフォーマおよびスイッチングSRIVE (Sw-SRIVE) と呼ぶ.実験により,両提案法が劣決定条件下において到来方向を用いた目的音声の強調性能で従来法を上回ることを示した.本研究は,2024 IEEE福岡支部 学生研究奨励賞を受賞した.