表題番号:2023C-466 日付:2024/02/08
研究課題欠損値補完手法を用いた異常検知手法に関する研究
研究者所属(当時) 資格 氏名
(代表者) 理工学術院 創造理工学部 講師 岩本 大輝
(連携研究者) 早稲田大学創造理工学部経営システム工学科 教授 永田 靖
(連携研究者) 早稲田大学創造理工学部経営システム工学科 助教 王 緒
(連携研究者) 早稲田大学創造理工学部経営システム工学科 教授 蓮池 隆
研究成果概要
近年,さまざまなデータ取得が容易になるにつれ,大量のデータに含まれる異常サンプルを自動的に検出する異常検知の重要性が高まっている.マハラノビス・タグチ(MT)法は,パターン認識や異常検出などの問題に対する多変量解析法であり,データ群から異常値を検出する. 大量取得したデータの中に不適切な解答が紛れてしまうという課題を抱えるアンケート調査も異常検知が重要な分野である.しかし,アンケート調査などでよく用いられる順序尺度データでは,MT法の異常検出精度が低下することが指摘されている.そこで,順序尺度データに対し,MT法を利用した異常検知手法を提案した.提案手法は,順序尺度の背景に連続分布を仮定し,順序尺度を欠損データの一種とみなし.欠損値の補完後に異常検出を行う. 人工データを用いたシミュレーションにより,提案手法の検出精度は,順序尺度の中心付近の回答が多いという限られた環境ではあるが,単位空間が異常データで汚染されているか否かに関わらず,MT法を上回ることを示した. 手法提案と実証結果などの研究成果は,国際会議21th Asian network for quality congress 2023にて報告した. 予定していた研究に加え,異常検知後に使用する手法として有効なData Envelopment Analysis (DEA)の改善目標の検証を行った.DEAは複数の入力と出力を持つ意思決定単位(DMU)の相対効率を評価する数理計画法であり,指標の単位を勘案せずに分析が可能なため経営分野において良く用いられている.しかし,相対効率を測定するため,異常サンプルの影響を受けやすいという問題がある.そのため,異常検知後のデータに手法を適用するのが望ましい.DEAには代表的な効率値の測定・改善目標の設定法として,加算法と最短距離法がある.この2法を日本の小売企業86社からなる時系列データセットに対して用いることで,手法による改善目標の違いを検証した.結果として,最短距離法の改善目標が非効率なDMUの改善目標において優位であることを示した. 研究成果は,国際会議IEEE International Conference on Industrial Engineering and Engineering Management 2023にて報告した.