表題番号:2025R-031 日付:2026/04/03
研究課題転写制御ネットワークを利用したダークエンザイム機能予測技法の開発
研究者所属(当時) 資格 氏名
(代表者) 理工学術院 先進理工学部 教授 由良 敬
研究成果概要
 高度好熱菌の機能未知タンパク質から、その機能を推定することを試みた。その手法として、AIを用いて酵素のEnzyme Commission number (EC番号)を直接予測する方法と、酵素遺伝子の転写を司る転写因子の結合部位を予測することで、同時に転写制御される遺伝子群を予測し、それらの共通性から機能を推定する方法の開発を試みた。
 EC番号の予測においては、既存のタンパク質言語モデルを利用して、アミノ酸配列からそのタンパク質が酵素であるかないか、酵素の場合はどのEC番号をもっているかを推定することを試みた。EC番号は4桁の数字で階層的に形成されていることから、一番大きな分類群を意味する第1桁目(7グループ)を推定することを試みた。既知情報をUniProtデータベースから収集したところ、約253,000本の酵素アミノ酸配列を得ることができた。それらは第7番目のグループを除き、それぞれ2万〜9万個の配列が所属していた。この情報の90%程度を利用し、ニューラルネットワークを強化学習し、残りの10%のEC番号を予測したところ、予測精度は50%未満となり、芳しい結果を得ることができなかった。現在、どこに問題点があるかを見いだしている段階である。一方で、決定木による予測方法を用いたところ、90%以上の精度をもつ予測器を構築することができた。ここで作成した予測器と既存予測方法を組み合わせることで、高度好熱菌からポリアミン生合成系と細胞膜脂質生合成系に関わる酵素をコードしている遺伝子を推定することができた。現在この推定が正しいかどうかを実際の実験によって確かめている段階である。
 転写制御にもとづく予測においては、転写因子が結合するDNA配列の推定方法の構築から取りかかった。転写因子とDNAとの関係をタンパク質立体構造データベースPDBに収められているタンパク質とDNAとの複合体構造から抽出した。計算にもとづきアミノ酸残基と塩基との相互作用関係を自動的に抽出する方法を構築することができた。その方法を用いて相互作用データを抽出したところ、約386万個の相互作用情報を得ることができた。この情報を用いて、転写因子の立体構造からターゲットとなるDNAの配列を推定する方法の開発に取りかかることができた。相互作用するDNAが推定できれば、その下流に配置されている遺伝子がコードするタンパク質を明らかにし、ある転写因子が制御するタンパク質群を見いだすことができるはずである。