表題番号:2012B-165 日付:2013/05/03
研究課題タンパク質間相互作用モチーフの情報論的推定手法の開発
研究者所属(当時) 資格 氏名
(代表者) 理工学術院 准教授 井上 真郷
研究成果概要
 タンパク質の多くは体内で特定の化学反応を促進する酵素として働く.また,酵素としての機能を発揮するには,同種または異種のタンパク質と立体的に結合することが必要なものも多い.タンパク質同士が結合する際は,一般に結合モチーフと呼ばれる数~数十アミノ酸配列が重要であることが分かっている.この配列は,それぞれのタンパク質の組合せに固有であるが,同じタンパク質の同じ部位に結合するタンパク質同士には,似たアミノ酸配列から成る結合モチーフがあると思われる.特定のタンパク質と他の多数のタンパク質が結合する/しないというデータから,この結合モチーフを推定することが本研究の最終的な目的である.
 これに対し,いくつかのアプローチを試みた.まず,近年はshort linear motifと呼ばれる,10アミノ酸程度の短い配列についての研究が進んでおり,例えば真核細胞のlinear motifデータベースには2000ほどのモチーフが登録されている.これらの中から,特定のタンパク質に結合するタンパク質が共通に持つ結合モチーフを推定することを考えた.結合モチーフは一種類とは限らないため,また,各結合モチーフは正確に同じアミノ酸配列でなくとも,少々の変異を許すため,20種類のアミノ酸の離散分布をアミノ酸数だけ繋げ,更にこれをいくつか混合させた確率モデルを構築した.これにより,これまで結合する/しないの二値分類を行っていたアプローチよりも,より正確に結合モチーフを推定できることが期待できる.また,この問題を変分Bayes法用いて近似解を得る際に,1次のTaylor近似を用いたため,解の収束性が悪く,交互に極端な値を行ったり来たりする現象が見られたため,これを防ぐために更新割合を限定するような修正を加えた.
 また,やや異なる問題設定であるが,多数のタンパク質について,互いに結合する/しないの二値データから成る行列が与えられた際に,これを互いに結合する者同士でクラスタリングする問題についても研究を行った.互いに結合するタンパク質同士は,同じもしくは似たような機能を担っている可能性が高いため,機能未知のタンパク質の機能推定に有用である.従来法として,Markov chain Monte Carlo (MCMC)法を用いて解く方法があったが,これを平均場近似を用いて高速に解くアルゴリズムを構築した.この手法は,初期値のみランダムで設定する必要があるが,収束解の初期値依存性が強く,解を求める試行を多数行わなければならないという欠点が分かった.
 上記研究は,英国King’s College LondonのACC Coolen教授との共同研究で進めた.