音声対話システムにおける発話タイミング制御

2230
研究者名
所属
専門分野
知能ロボティクス
キーワード
特許名称
対話システムおよびプログラム
公開番号
特開2021-51172
出願人
学校法人早稲田大学
出願国・地域
日本

シーズ概要

システム発話タイミング検出手段は、ユーザの発話権維持又は譲渡/放棄かをパターン認識処理により逐次推定し、次発話準備手段は、システム発話タイミング検出手段と非同期、かつ開始タイミング検出前に、システムの次発話の内容データを準備する。
そして、システム発話の開始タイミングの検出後に、次発話準備手段により準備された次発話を用いて、遅れなくシステム発話を再生する対話システムである。





効果

ユーザ発話に対するシステムの次発話の内容データを、当該ユーザ発話の進行中に、または、それよりも前の段階である当該ユーザ発話の開始前に準備するので、対話相手であるユーザが発話権を譲渡/放棄し、発話タイミング検出された場合は、その検出直後に、発話生成手段により、タイミングよくシステム発話を開始できるので、システムの応答性が向上する。

応用・展開

◆音声対話によるニュース記事アクセスシステムでの活用
◆音声対話によるカーナビシステムでの活用
◆チャットボット・スマートスピーカー等のAI会話メディアシステムでの活用

優位性

従来会話システムは、1.(VAD)ユーザ発話の途切れを手がかりに発話を検出し、2.(発話理解)検出したユーザ発話の意味を推定し、3.(次発話決定)推定意味に応じてシステム次発話を決め、4.(応答)応答するもので、少なくとも,VADより前に次発話決定を行うものはない。
これでは,ユーザとシステムとの発話間に「長い間」が空き,タイミングの良い応答ができない。また,システムが次発話内容を決める間に,ユーザが再度話し始める場合,システムとユーザ発話が重なってしまう。
本発明では、システムが発話すべき内容を早期確定したうえで,ユーザが発話権を譲渡するタイミングを待って応答するため,長い間が空くことも,両者の発話が重なることもない。

提供目的

知財ライセンス

資料

  •  

関連論文

  • 音声対話情報提供システムにおけるシステム応答速度の情報伝達効率への影響の分布,情報処理学会研究報告,Vol2019-SLP-128 No.3 (2019/7/19)
掲載日: 2021/09/06