表題番号:2024C-596 日付:2025/04/03
研究課題データサイエンスの手法を用いた個別最適化管理手法の開発
研究者所属(当時) 資格 氏名
(代表者) 国際学術院 国際教養学部 教授 汪 金芳
(連携研究者) Hosaka Clinic Shigetoshi Hosaka
研究成果概要
本研究は、特定の健康状態、特に糖尿病や糖尿病予備群を対象とした最適な個別化管理のために、統計的推論と機械学習的予測を統合するプロジェクトの一環として行われたものである。本研究では、従来のクラスタリング手法の限界を克服し、個人レベルでのT2D(2型糖尿病)リスクの不均一性をより精緻に捉える新しい予測型クラスタリング法を提案した。この手法は、個人ごとの特徴量の重要度プロファイルをもとに集団を分割し、個別化された予防および治療戦略の基盤を提供する。

本研究では、民間医療データ会社JMDCより提供された19,953人分の健康診断データを用いた。このうち、空腹時血糖値の基準(126 mg/dL以上)により3,196人がT2D患者と判定された。まず、ランダムフォレスト分類器を用いてT2Dの有無を予測した後、LIME(Local Interpretable Model-agnostic Explanations)を用いて各個人における特徴量の重要度を算出した。これらの重要度ベクトルに対してK-meansクラスタリングを適用し、類似した重要度パターンを持つ個人をグループ化した。さらに、各クラスタのセントロイドに対してロジスティック回帰を適用することで、クラスタごとのT2Dリスクを推定した。また、各クラスタにおける併存疾患(高血圧症、脂質異常症など)の有病率も分析対象とした。

LIMEを用いた予測型クラスタリングにより、7つのT2Dリスクフェノタイプが同定された。これらは順に、「健康型」、「軽度脂質異常型」、「脂質異常型」、「高血圧型」、「軽度代謝異常型」、「中等度代謝異常型」、「重度代謝異常型」と命名され、それぞれT2Dのリスクが漸増する傾向にあった。この分類は、従来の単純なクラスタリングとは異なり、臨床的な解釈可能性および介入対象の特定において優れており、将来的には個別化された予防や治療戦略の設計に資する有力な手法となる可能性がある。