表題番号:2019E-122 日付:2020/05/08
研究課題様々な品質のデータからの機械学習に関する研究
研究者所属(当時) 資格 氏名
(代表者) データ科学総合研究教育センター 講師 安田 豪毅
(連携研究者) 早稲田大学 社会科学総合学術院 准教授 須子統太
(連携研究者) 早稲田大学 グローバルエデュケーションセンター 准教授 堀井俊佑
(連携研究者) 早稲田大学 データ科学センター 教授 小林学
(連携研究者) 早稲田大学 理工学術院 教授 松嶋敏泰
研究成果概要
本研究では,ラベルノイズを含むデータからの学習について,理論的な性能と実際に分類アルゴリズムによって得られる性能の比較,および潜在クラスによってラベルノイズが異なる場合の分類アルゴリズムの開発を行った.性能の比較では,理論的な性能の限界式の値を数値計算によって算出し,EMアルゴリズムによる分類アルゴリズムの性能と比較した.性能の比較から,その分類アルゴリズムによって理論的な性能の限界に十分近い性能が得られることが確認できた.また,分類アルゴリズムの開発については,人工データによる実験により,その有効性が確認された.これらの研究成果について,国内学会にて2件の発表を行った.