表題番号:2023R-049
日付:2024/04/04
研究課題ベイズ決定理論型APIを備えた機械学習ライブラリBayesMLの開発,普及促進
研究者所属(当時) | 資格 | 氏名 | |
---|---|---|---|
(代表者) | データ科学センター | 講師 | 中原 悠太 |
- 研究成果概要
- 我々はこれまで,典型的なベイズ機械学習モデルとそれに対する高速推論アルゴリズムを合わせて実装し,オープンソースPythonライブラリBayesMLとして公開してきた.その際,単にモデルを寄せ集めて公開するのではなく,すべてのモデルを統一的なインターフェースで実装してきた.このインターフェースにはベイズ決定理論の基本構造が反映されており,事前分布からのパラメータ生成,データ生成モデルからのデータ生成,データに基づくパラメータ事後分布の更新,パラメータ事後分布を用いた予測分布の導出,損失関数の設定に応じたパラメータ推定や新規データ予測などを直感的に記述,実行できるようになっている.また,モデルの特徴を確認しやすいように可視化するための関数もすべてのモデルに対して実装されている.本年度は,決定木モデルのベイズ推論を行うアルゴリズムをこのBayesML上で実装した成果が電子情報通信学会の英文論文誌に採択された.このアルゴリズムでは,これまで逐次的に処理してきたデータを一括で処理することによって処理の高速化を図っている.このような処理は特にNumPyを利用したPythonコードでは速度の差が顕著に現れる.論文上で行ったごく小さな規模の実験でも,数倍程度の効率改善が認められている.また,これによりこれまであらかじめ決めておく必要のあった決定木の深さをデータに対して動的に決定することも可能となった.また,ライブラリ普及活動の一環として,Webサイトの修正も行った.Webサイトは https://yuta-nakahara.github.io/BayesML/ で公開されている.