表題番号:2024C-297 日付:2025/02/07
研究課題有機固体研究における大規模言語モデルの活用探索
研究者所属(当時) 資格 氏名
(代表者) データ科学センター 准教授 谷口 卓也
研究成果概要
有機固体は創薬や材料科学など幅広い領域でその機能性が注目されている素材である。しかしながら、有機固体の構造最適化を図るには膨大なトライアンドエラーが不可避であり、研究開発の過程で多大なリソースを要する。その効率化を目指す上では、実験前に分子をスクリーニングし、候補を絞り込む手法が極めて有効である。本研究では、このスクリーニング工程に大規模言語モデルを組み込む可能性を検討した。具体的には、Pythonプログラムを作成する際にChatGPTおよびClaudeを活用し、分子SMILES情報をChatGPTのAPIによってエンコーディングしたうえで、その回帰性能を検証した。得られた結果から、言語モデルにおける自然言語処理技術は分子構造の特徴抽出にも有用であり、有機固体に関する物性予測の高精度化や研究開発効率の向上に寄与する可能性が示唆された。今後は、より大規模な分子データセットや高度な最適化手法との連携を進めることで、探索の高速化と的確なデザイン戦略の確立を目指す所存である。