表題番号:2024C-117 日付:2025/04/10
研究課題コントローラビリティを埋め込んだマルチエージェント学習法の研究
研究者所属(当時) 資格 氏名
(代表者) 理工学術院 基幹理工学部 教授 菅原 俊治
研究成果概要

本研究は、AI(人工知能)技術の進展によりエージェントが社会に浸透し、人間の代理として機能する状況を想定し、複数のエージェントが利害を共有または対立する環境において、社会的に受容可能な意思決定や組織的行動を獲得する学習手法の提案を目的とする。近年、マルチエージェント深層強化学習(MADRL)が注目されており、エージェントは協調的かつ合理的な行動を学習可能となっている。しかし、グループや組織での学習においては、他のエージェントにより学習機会が奪われる、あるいは他者に任せれば自分は行動しなくてよいと学習してしまうといった課題がある。また、コストの高さや報酬の低さといった理由から、全てのエージェントに無視されるタスクが発生することもある。これらの問題は、人間の意図とは異なり、導入されたエージェント(ロボットなど)が公平に作業を分担し、全体として最大限の能力を発揮することを妨げる要因となる。

この課題に対し、本研究では、MADRLにおけるエージェントの学習過程に人間の介入を可能とする手法を提案し、作業の見逃しや不公平性の解消を目指す。具体的には、「destination channel」と呼ばれる指示書に相当する情報を導入することで、すべての作業をバランスよく経験させ、タスクの見逃しを防ぎつつ、他のエージェントの学習進行に影響を与えないような学習機会を提供する。本手法の初期的な有効性を実験により検証し、その結果を論文として整理し、国内外の学会で発表した。