表題番号:2024Q-012 日付:2025/04/10
研究課題コントローラビリティを持つエージェントの組織学習アルゴリズムの研究
研究者所属(当時) 資格 氏名
(代表者) 理工学術院 基幹理工学部 教授 菅原 俊治
研究成果概要

  本研究は、AI(人工知能)技術の高度な発展により、人間の代理として機能するエージェントが社会に広く普及した未来を想定し、複数のエージェントが相互に利害関係を持つ環境において、社会的に受容可能な組織的行動の学習手法を探究することを目的とする。近年では、マルチエージェント深層強化学習(MADRL)が注目されており、エージェントが協調的な行動を学習することが可能となっている。しかしながら、こうした行動は必ずしも人間の意図と一致せず、また、学習された行動は画一的で、環境の変化や人間の要求の多様性に対する柔軟性を欠いている。このため、従来の手法では環境が変化するたびに学習を初期化し、再構築する必要があった。

  本研究では、こうした課題に対処するため、エージェントの学習過程に人間の介入を組み込む手法を提案し、その有効性を検証した。具体的には、「destination channel」と呼ばれる情報をエージェントに付与し、その内容に応じた人間による制御を可能とする枠組みを構築した。さらに、指示を受けていないエージェントにおいても、他のエージェントへの指示を観察することによって自律的に行動を適応させ、協調的な行動が促進されることを確認した。

  これらの成果は論文として取りまとめ、国内外の学会にて発表を行った。また、本研究課題に関連する初期実験の成果に基づき、今後の研究計画を策定し、その結果として外部資金の獲得にも成功したことを報告する。