表題番号:2022C-099 日付:2023/03/26
研究課題深層強化学習による調整行動学習の解釈性に関する研究
研究者所属(当時) 資格 氏名
(代表者) 理工学術院 基幹理工学部 教授 菅原 俊治
研究成果概要
近年のマルチエージェント深層強化学習の研究で、協調行動の学習の獲得が進んだが、獲得した学習行動の根拠が不明確である。本研究では、各エージェントが環境内で、学習の結果として着目している情報を同定し、その解釈性の向上を試みた。具体的には、(1) 環境内の情報に意図的に部分的揺らぎを導入し、信頼できる情報を同定できること、(2) 自分のタスクの目的に合わせて、周辺環境に応じて着目点を変えることを示した。また、ゲーム(将棋)を例に、学習したゲームプログラムが判断した場面の形成や、次の手を判断するにあたり、着目した情報(ここでは駒)を判断の正負の寄与に分類して抽出することを試みた。