JP3843260B2

JP3843260B2 - 誘導適合を含めたタンパク質の立体構造構築方法およびその利用

Info

Publication number: JP3843260B2
Application number: JP2002558170A
Authority: JP
Inventors: 秀明梅山; 克一郎小松
Original assignee: IN-SILICO SCIENCES, INC.
Current assignee: IN-SILICO SCIENCES, INC.
Priority date: 2001-01-19
Filing date: 2002-01-17
Publication date: 2006-11-08
Anticipated expiration: 2022-01-17
Also published as: JPWO2002057954A1; WO2002057954A1

Description

技術分野
本発明は、誘導適合を含めたタンパク質の立体構造構築方法およびその利用に関し、さらに詳しくは、参照タンパク質の立体構造とその原子座標を変位させた複数の立体構造セットを参照タンパク質の立体構造として目的タンパク質の複数の立体構造セットを作成することよりなるタンパク質の立体構造構築方法、該立体構造セットを用いるタンパク質−リガンド複合体の立体構造構築方法、およびタンパク質のリガンド結合部位の特定方法等に関する。
本発明の方法により提供される目的タンパク質の立体構造は、誘導適合（ｉｎｄｕｃｅｄｆｉｔ）を含めた立体構造であり、医農薬の分子設計に極めて有用である。
背景技術
立体構造が既知のタンパク質に関する情報を利用し、立体構造が未知の目的タンパク質とのアライメントを得て、このアライメント情報に基づいて目的タンパク質の立体構造を、コンピュータを用いて作成することが可能であり、この手法は、通常ホモロジーモデリング（ｈｏｍｏｌｏｇｙｍｏｄｅｌｉｎｇ）と呼ばれている。ホモロジーモデリングにより構築される立体構造の精度は、近年目覚ましく向上しているが、未だ解決すべき問題点も多い。
この方法を用いて受容体タンパク質の立体構造を構築する場合、リガンドが結合する空間の確保が不可欠である。しかしながら、従来の立体構造構築法ではリガンドが存在する空間や結合部位に構築された立体構造の主鎖または側鎖がパッキングされ、その空間が塞がれてしまい、リガンドが受容体タンパク質と接触し、その結合部位に存在できない等の問題が生じていた。
また、タンパク質−リガンド複合体の立体構造構築方法において、目的受容体タンパク質の立体構造が実験的に求まっていない場合、単にホモロジーモデリング（ｈｏｍｏｌｏｇｙｍｏｄｅｌｉｎｇ）法により構築された受容体タンパク質の立体構造自身にリガンドをドッキングさせ、分子力場計算や分子動力学計算で、それらを最適化することにより受容体タンパク質−リガンド複合体の立体構造を得ていた。また、ＭｕｌｔｉｐｌｅＣｏｐｙＳｉｍｕｌｔａｎｅｏｕｓＳｅａｒｃｈ（ＭＣＳＳ）法を用いた研究においても、受容体タンパク質側の立体構造には基準振動モードは考慮されておらず、とくに分子の時間的にピコオーダーの振動を主とする長周期の熱揺らぎ（以下これを単に「熱揺らぎ」または「分子揺らぎ」と称することがある）は無視されていた。
更に、従来から、遠距離まで影響を及ぼす静電ポテンシャルによるタンパク質のリガンド結合部位を特定する方法や、類似化合物に基づいたタンパク質−リガンド複合体の立体構造の構築が行われているが、いずれも信頼性が低く、類似化合物の無い場合には信頼性のあるタンパク質−リガンド複合体の立体構造を導くことは困難であった。
発明の開示
本発明は、上記の状況を鑑みて、任意のタンパク質の立体構造を精度良く構築する方法、またタンパク質−リガンド複合体の立体構造を精度良く構築する方法等の提供を目的としてなされたものである。
本発明者等は、上記課題を達成すべく鋭意検討した結果、参照タンパク質の原子座標を基準振動解析法から得られる固有ベクトル方向に変位した原子座標を参照して受容体タンパク質の立体構造を構築すれば、リガンドが存在する空間や結合部位に立体構造の主鎖または側鎖がパッキングされてその空間が塞がれることが無く、受容体タンパク質の立体構造の精度を格段に向上させることができることを見出した。すなわち、基準振動モードに基づいて分子の熱揺らぎを考慮した複数の受容体タンパク質モデルが構築できることを見出した。
また、かくして構築された受容体タンパク質モデルにドッキングしたリガンドの立体構造を用いて、ＭｕｌｔｉｐｌｅＣｏｐｙＳｉｍｕｌｔａｎｅｏｕｓＳｅａｒｃｈ（ＭＣＳＳ）法の分子力学計算と分子動力学計算を適用して、分子の熱揺らぎを考慮した精度の高いタンパク質−リガンド複合体の立体構造構築が可能であることを見出した。
更に、本発明者等は、タンパク質−リガンド複合体には水溶液中での現象を考えると静電力よりも疎水相互作用の方が重要でないかという結論に達した。そこでタンパク質周囲および内部に溶媒を配置し、分子動力学による溶媒挙動（溶媒の拡散・集積）の解析からタンパク質に溶媒が集積する部位または溶媒が拡散しにくい部位が、リガンド結合部位と一致することを見出した。
本発明はこれらの知見に基づいて成し遂げられたものである。
即ち、本発明の方法により、（１）参照タンパク質と目的タンパク質とのアライメントを導き出し、該アライメントおよび参照タンパク質の立体構造情報に基づいて目的タンパク質の立体構造を構築する方法において、参照タンパク質の立体構造とその原子座標を変位させた複数の立体構造を参照タンパク質の立体構造として目的タンパク質の複数の立体構造セットを作成することを特徴とする誘導適合を含めたタンパク質の立体構造構築方法が提供される。
この発明の好ましい態様により（２）参照タンパク質の原子座標の変位が、基準振動解析法により行われることを特徴とする上記（１）に記載の方法、（３）立体構造の構築が、（ｉ）アミノ酸中のＣα原子について参照タンパク質の立体構造から座標を取得し、目的関数を最小化するようにＣα原子座標を最適化し、（ｉｉ）最適化されたＣαの原子座標に主鎖の他の原子を付加して目的関数を最小化するように主鎖の原子座標を最適化し、（ｉｉｉ）最適化された主鎖の原子座標に側鎖の他の原子を付加し目的関数を最小化するように最適化することにより行われることを特徴とする上記（１）又は（２）に記載の方法が提供される。
本発明の別の態様により、（４）（ｉ）上記（１）〜（３）のいずれかに記載の方法により得られる目的タンパク質の複数の立体構造とリガンドとのドッキング操作を行い、（ｉｉ）目的タンパク質の１つの構造とリガンドとの構造の経験的分子エネルギー計算を、目的タンパク質の構造の数だけ行い、その際、（ｉｉｉ）目的タンパク質側は、複数の構造それぞれのポテンシャルエネルギー勾配に応じて原子座標を動かし、（ｉｖ）リガンド側は、複数個算出されたポテンシャルエネルギー勾配を平均化した方向にリガンドの原子座標を動かして、（ｖ）目的タンパク質の複数の立体構造に基づくリガンドの立体構造を求めることを特徴とするタンパク質−リガンド複合体の立体構造構築方法が提供される。
この発明の好ましい態様により、（５）経験的分子エネルギー計算において、目的タンパク質の初期Ｃα原子座標の位置をオプションＨａｒｍｏｎｉｃ関数として加えるか、あるいは目的タンパク質の主鎖のねじれ角を拘束するポテンシャル関数を加えることを特徴とする上記（４）に記載の方法が提供される。
本発明の別の態様により、（６）（ｉ）タンパク質の立体構造の周囲に低分子化合物を配置し、（ｉｉ）それらの周囲にさらに水分子を配置し、水溶媒中での経験的分子エネルギー計算を行って、タンパク質と低分子化合物との原子座標を得、（ｉｉｉ）得られた原子座標について、タンパク質の周囲および内部の、低分子化合物の挙動解析を行い、リガンドの結合部位を判定することを特徴とするタンパク質のリガンド結合部位の特定方法、および、（７）（ｉ）タンパク質およびリガンドの立体構造の周囲に低分子化合物を配置し、（ｉｉ）それらの周囲にさらに水分子を配置し、水溶媒中での経験的分子エネルギー計算を行って、タンパク質と低分子化合物との原子座標を得、（ｉｉｉ）得られた原子座標について、タンパク質およびリガンドの周囲および内部の、低分子化合物の挙動解析を行い、タンパク質−リガンド複合体の結合部位を判定することを特徴とするタンパク質−リガンド複合体の結合部位の特定方法が提供される。
この発明の好ましい態様により、（８）低分子化合物の挙動解析が、低分子化合物を対象としたクラスター解析により行われ、得られたクラスターのサイズをリガンドの結合可能性部位の順位として結合部位を判定することを特徴とする上記（６）または（７）に記載の方法が提供される。
本発明の別の態様により、（９）上記（６）〜（８）のいずれかに記載の方法により特定したタンパク質のリガンド結合部位にリガンドをドッキングし、経験的分子エネルギー計算によりタンパク質−リガンド複合体の立体構造を得ることを特徴とするタンパク質−リガンド複合体の立体構造構築方法が提供される。
本発明の別の態様により、（１０）上記（１）〜（５）および（９）のいずれかに記載の方法により得られるタンパク質の立体構造および／またはタンパク質−リガンド複合体の立体構造を規定する原子座標が記録されていることを特徴とするコンピュータ読みとり可能な記録媒体、または、該原子座標を含むことを特徴とするデータベースが提供される。
本発明の別の態様により、（１１）上記（１０）に記載の記録媒体またはデータベースから得られるタンパク質の立体構造を規定する原子座標を用いて、薬物候補分子の立体構造との相互作用に基づいて、目的とする薬物分子を同定、検索、評価または設計することを特徴とする薬物分子設計方法が提供される。
発明を実施するための最良の形態
以下、本発明を更に詳細に説明する。本明細書において、幾つかの用語を使用するが、特に明記しない限り、次の意味を有する。
「目的タンパク質」とは、Ｘ線結晶解析やＮＭＲ解析等により完全な立体構造が決定されておらず、本発明において立体構造構築の対象となる任意のタンパク質を意味する。このタンパク質には、部分構造は解析されているが完全な立体構造が得られていないものも含まれる。本発明においては、立体構造が未知の受容体タンパク質、酵素等を目的タンパク質とするのが好ましい。ここで、Ｘ線結晶解析には、Ｘ線のみならず電子線および中性子線解析等も含まれる。
「受容体タンパク質」とは、細胞に存在し、外来性の物質あるいは物理的刺激を認識して、細胞に応答を誘起するタンパク質を意味する。この受容体タンパク質は、リガンドを特異的に結合する能力を有する。また、「リガンド」とは、タンパク質と特異的に結合する能力を有する物質を意味する。リガンドには、医農薬分子の様な低分子物質のみならず、抗体やタンパク質と相互作用をする特定のペプチドやタンパク質等の高分子物質も含まれる。
「参照タンパク質」とは、その立体構造の詳細がＸ線結晶解析やＮＭＲ解析等により既に決定されており、目的タンパク質の立体構造を規定する原子座標を構築するために参照するタンパク質を意味する。また「アライメント」とは、２種類以上のタンパク質についてアミノ酸配列の対応関係をつけることを意味する。
「原子座標」とは、三次元空間上で立体構造を記述するものである。それは空間上のある点を原点とする互いに垂直な三方向の相対的な距離であり、タンパク質中に存在する水素原子を除く原子一つあたりに３個の数字からなるベクトル量である。
「誘導適合（ｉｎｄｕｃｅｄｆｉｔ）」とは、タンパク質の立体構造は柔軟であり、リガンド、例えば医農薬分子と結合すると、それとより良く結合するようにタンパク質の立体構造が変化することを意味する。「誘導適合（ｉｎｄｕｃｅｄｆｉｔ）を含めた立体構造」とは、誘導適合により生じるタンパク質の立体構造変化を、例えば基準振動解析法で得られる固有ベクトルで表せると仮定し、誘導適合前の立体構造にこの固有ベクトルを加えて生成する立体構造を意味する。
「目的タンパク質−リガンド複合体」とは、Ｘ線結晶解析やＮＭＲ解析等により複合体の完全な立体構造が解明されておらず、本発明において立体構造の構築対象となるタンパク質−リガンド複合体を意味する。もちろんタンパク質としてＸ線結晶解析やＮＭＲ解析等により得られた立体構造を含むことは当然である。この複合体には、部分構造が解析されているが完全な立体構造が得られていないものも含まれる。タンパク質に結合したリガンド双方の複合体を意味する。
「ＭｕｌｔｉｐｌｅＣｏｐｙＳｉｍｕｌｔａｎｅｏｕｓＳｅａｒｃｈ（ＭＣＳＳ）法」とは、複数リガンドの立体構造を基にして目的タンパク質−リガンド複合体の立体構造を、経験的分子エネルギー計算法、すなわち分子力学、分子動力学計算で受容体タンパク質の立体構造を求める方法である。本発明では、それとは逆に、複数のタンパク質の立体構造を１つのリガンドの立体構造を基に目的とするタンパク質−リガンド複合体の立体構造を求める方法を意味する。
「経験的分子エネルギー計算」とは、分子力学計算と分子動力学計算を意味する。両者とも経験ポテンシャルを使った分子エネルギー計算である。
「ＭＳＡＳ（ＭａｘｉｍｕｍＳｏｌｖｅｎｔＡｃｃｅｓｓｉｂｉｌｉｔｙｏｆＳｉｄｅｃｈａｉｎ）」とは、最大溶媒接触表面積のことであり、タンパク質を構成している各アミノ酸の側鎖の溶媒接触表面積と、そのアミノ酸がタンパク質を構成していない単独に存在する状態のときの側鎖の溶媒接触表面積との比を意味する。ＭＳＡＳの詳細は、Ｋ．Ａｋａｈａｎｅ，Ｙ．ＮａｇａｎｏａｎｄＨ．Ｕｍｅｙａｍａ，Ｃｈｅｍ．Ｐｈａｒｍ．Ｂｕｌｌ．，１９８９，３７（１）８６−９２に記載されている。
後記Ｉ〜ＩＩＩの方法は、ホモロジーモデリングを行うことができる適当なコンピュータを用いて、後記方法を実行させる適当なプログラムを利用して実施することができる。
Ｉ．誘導適合を含めた立体構造の構築方法
先ず、本発明の誘導適合を含めた立体構造の構築方法について説明する。
第１図は、本発明の誘導適合（ｉｎｄｕｃｅｄｆｉｔ）を含めた立体構造構築方法の一例を示すフローチャートである。
ステップＩ−１０において、目的タンパク質の配列を入力し、目的タンパク質の立体構造の構築に用いる参照タンパク質を選定し、参照タンパク質の立体構造から原子座標を収得し、目的関数を最小化するように原子座標を最適化する。ステップＩ−２０において、最適化した原子座標の基準振動解析法を行う。ステップＩ−３０において、固有ベクトル方向に参照タンパク質の原子座標を変位し、その構造を参照タンパク質に加え、参照タンパク質のセットを作成する。ステップＩ−４０において、適当なホモロジー・モデリング・プログラム、例えばＦＡＭＳによりアライメント情報や参照タンパク質セットの各立体構造情報から目的タンパク質の立体構造のセットを構築する。かくして、目的タンパク質の誘導適合（ｉｎｄｕｃｅｄｆｉｔ）を含めた立体構造を精度良く構築することができる。以下、各ステップについて更に詳細に説明する。
ステップＩ−１０：参照タンパク質の初期座標の最適化
先ず、目的タンパク質の立体構造の構築において、目的タンパク質のアミノ酸配列を入力し、参照するタンパク質（参照タンパク質）を選定する。参照タンパク質の選定は、それ自体既知の通常用いられるアライメントソフトウエアを用いて行われる。この参照タンパク質の原子座標を、適当な立体構造データベースから収得する。この原子座標には、アミノ酸の骨格を作る窒素原子等に結合している水素原子はなく、ステップＩ−２０の基準振動解析法の計算に水素原子が必要な場合は水素原子を発生させる。参照タンパク質の原子座標から構成される目的関数を用いて原子座標を最適化する。
ここで、用いられる目的タンパク質のアミノ酸配列としては、データベースに登録されているもの、配列が始めて解析されたもの等の如何なる由来の配列であってもよい。用いられるアミノ酸配列データベースとしては、例えば、″ＡｎＩｎｔｅｒｎｅｔｒｅｖｉｅｗ：ｔｈｅｃｏｍｐｌｅｔｅｎｅｕｒｏｓｃｉｅｎｔｉｓｔｓｃｏｕｒｓｔｈｅＷｏｒｌｄＷｉｄｅＷｅｂ．″ＢｌｏｏｍＦＥ，Ｓｃｉｅｎｃｅ１９９６；２７４（５２９０）：１１０４−９に詳細が記載されているＧＣＲＤｂ（ＴｈｅＧ−ｐｒｏｔｅｉｎ−ｃｏｕｐｌｅｄＲｅｃｅｐｔｏｒＤａｔａｂａｓｅ）：ｈｔｔｐ：／／ｗｗｗ．ｇｃｒｄｂ．ｕｔｈｓｃｓａ．ｅｄｕ／、ＧＰＣＲＤＢ：ｈｔｔｐ：／／ｗｗｗ．ｇｐｃｒ．ｏｒｇ／７ｔｍ／、ＥｘＰＡＳｙ：ｈｔｔｐ：／／ｗｗｗ．ｅｘｐａｓｙ．ｃｈ／ｃｇｉ−ｂｉｎ／ｓｍ−ｇｐｃｒ．ｐｌ、ＯＲＤＢ：ｈｔｔｐ：／／ｙｃｍｉ．ｍｅｄ．ｙａｌｅ．ｅｄｕ／ｓｅｎｓｅｌａｂ／ｏｒｄｂ／、ＧｅｎｅＢａｎｋ：ｆｔｐ：／／ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｇｅｎｂａｎｋ／ｇｅｎｏｍｅｓ／、ＰＩＲ：ｈｔｔｐ：／／ｗｗｗ−ｎｂｒｆ．ｇｅｏｒｇｅｔｏｗｎ．ｅｄｕ／ｐｉｒ／（ＮａｔｉｏｎａｌＢｉｏｍｅｄｉｃａｌＲｅｓｅａｒｃｈＦｏｕｎｄａｔｉｏｎ（ＮＢＲＦ））、ＳｗｉｓｓＰｌｏｔ：ｈｔｔｐ：／／ｗｗｗ．ｅｘｐａｓｙ．ｃｈ／ｓｐｒｏｔ／ｓｐｒｏｔ−ｔｏｐ．ｈｔｍｌ（ＳｗｉｓｓＩｎｓｔｉｔｕｔｅｏｆＢｉｏｉｎｆｏｒｍａｔｉｃｓ（ＳＩＢ），ＥｕｒｏｐｅａｎＢｉｏｉｎｆｏｍａｔｉｃｓＩｎｓｔｉｔｕｔｅ（ＥＢＩ））、ＴｒＥＭＢＬ（ＵＲＬ及び管理者ともにＳｗｉｓｓＰｌｏｔと同じ）、ＴｒＥＭＢＬＮＥＷ（ＵＲＬ及び管理者ともにＳｗｉｓｓＰｌｏｔと同じ）、ＤＡＤ：ｆｔｐ：／／ｆｔｐ．ｄｄｂｊ．ｎｉｇ．ａｃ．ｊｐ（日本ＤＮＡデータバンク）等のデータベースに登録されているヒト（Ｈ．ｓａｐｉｅｎｓ）、ショウジョウバエ（Ｄ．ｍｅｌａｎｏｇａｓｔｅｒ）、線虫（Ｃ．ｅｌａｇａｎｓ）、酵母（Ｓ．ｃｅｒｅｖｉｓｉａｅ）、シロイヌナズナ（Ａ．ｔｈａｌｉａｎａ）等を挙げることができる。これらのデータベースは単なる例示であり、タンパク質のアミノ酸配列が登録されているものであれば如何なるデータベースを用いることもできる。
また、参照タンパク質の原子座標の収得に用いられる立体構造データベースとしては、例えばＰＤＢ（ＰｒｏｔｅｉｎＤａｔａＢａｎｋ）：ｈｔｔｐ：／／ｗｗｗ．ｒｃｓｂ．ｏｒｇ／ｐｄｂ／、ＣＣＤＣ（ＣａｍｂｒｉｄｇｅＣｒｙｓｔａｌｌｏｇｒａｐｈｉｃＤａｔａＣｅｎｔｒｅ：ｈｔｔｐ：／／ｗｗｗ．ｃｃｄｃ．ｃａｍ．ａｕ．ｕｋ／、ＳＣＯＰ（ＳｔｒｕｃｔｕｒｅＣｌａｓｓｉｆｉｃａｔｉｏｎｏｆＰｒｏｔｅｉｎ）：ｈｔｔｐ：／／ｓｃｏｐ．ｍｒｃ−ｌｍｂ．ｃａｍ．ａｃ．ｕｋ／ｓｃｏｐ、ＣＡＴＨ：ｈｔｔｐ：／／ｗｗｗ．ｂｉｏｃｈｅｍ．ｕｃｌ．ａｃ．ｕｋ／ｂｓｍ／ｃａｔｈ等を挙げることができる。これらの立体構造データベースは、単独または組み合わせて用いることことができる。上記データベース中、ＳＣＯＰおよびＣＡＴＨは、ドメイン単位（タンパク質の立体構造で、３次構造の単位）に区切った立体構造データベースである。
アライメント用ソフトウエアとしては、例えばＦＡＳＴＡもしくはＰＳＩ−ＢＬＡＳＴ（Ｐｏｓｉｔｉｏｎ−ＳｐｅｃｉｆｉｃＩｔｅｒａｔｅｄＢＬＡＳＴ）を使うのが好ましい。ＦＡＳＴＡは目的配列と一致度の高い配列を立体構造データベースから探索し、最終的な目的配列と参照タンパク質との一致度をｅ値として算出するプログラムである。ＦＡＳＴＡの詳細は″Ｅｆｆｅｃｔｉｖｅｐｒｏｔｅｉｎｓｅｑｕｅｎｃｅｃｏｍｐａｒｉｓｏｎ．″ＰｅａｒｓｏｎＷＲ，（１９９６）ＭｅｔｈｏｄｓＥｎｚｙｍｏｌ；２６６：２２７−５８に記載されている。
ＰＳＩ−ＢＬＡＳＴはプロファイルアライメントを行うようにプログラムされている。ＰＳＩ−ＢＬＡＳＴの詳細は、″ＭａｔｃｈｉｎｇａｐｒｏｔｅｉｎｓｅｑｕｅｎｃｅａｇａｉｎｓｔａｃｏｌｌｅｃｔｉｏｎｏｆＰＳＩ−ＢＬＡＳＴ−ｃｏｎｓｔｒｕｃｔｅｄｐｏｓｉｔｉｏｎ−ｓｐｅｃｉｆｉｃｓｃｏｒｅｍａｔｒｉｃｅｓ．″ＳｃｈａｆｆｅｒＡＡ，ＷｏｌｆＹＩ，ＰｏｎｔｉｎｇＣＰ，ＫｏｏｎｉｎＥＶ，ＡｒａｖｉｎｄＬａｎｄＡｌｔｓｃｈｕｌＳＦ，Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ１９９９，１２，１０００−１１に記載されている。
参照タンパク質の原子座標の最適化を達成するための方法、座標系、目的関数等は特に制限されないが、例えば、最大傾斜法、共役勾配法、Ｎｅｗｔｏｎ−Ｒａｐｈｓｏｎ法等で行うのが好ましい。最大傾斜法は、数値的に計算された目的関数の１次微分を利用し、原子座標の目的関数に対する最適化を行う。共役勾配法には、多くの方式があるが、Ｆｌｅｔｃｈｅｒ−Ｒｅｅｖｅｓ法（Ｆｌｅｔｃｈｅｒ，Ｒ．，ａｎｄＲｅｅｖｅｓ，Ｃ．Ｍ．（１９６４）ＦｕｎｃｔｉｏｎＭｉｎｉｍｉｚａｔｉｏｎｂｙＣｏｎｊｕｇａｔｅＧｒａｄｉｅｎｔｓ．ＣｏｍｐｕｔＪ，７：１４９−１５４）が標準的に用いられており、目的関数の１次微分を利用し、目的関数がｎ個の変数の厳密な二次関数である場合、多くともｎ回の繰り返しにより最適化に到達することが保証されている。Ｎｅｗｔｏｎ−Ｒａｐｈｓｏｎ法は、１次微分に加えて２次微分を利用し、初期構造が最適化構造に近い場合に効率が良い。これらの方法の詳細は、江口至洋「タンパク質工学の物理・化学的基礎（共立出版１９９１）」とその中の文献に記載されている。
以下、上記の通り最適化した構造および座標を、それぞれ最適化構造および最適化座標として引用する。
ステップＩ−２０：最適化座標の基準振動解析法
上記ステップＩ−１０で作成された最適化座標を用いて、その原子座標の変位を行う。原子座標の変位は、基準振動解析法を行い、各固有値の固有ベクトルを得ることにより行うのが好ましい。その際、最適化した自由度の一部を自由度とする座標系を用いても良い。この場合、一部の自由度に対しても最適化が達成されている。
ここで、「基準振動解析法」とは、ポテンシャルエネルギーを変位の２次関数として近似し、運動方程式を厳密に解き、最適化構造の周りの微小な振動を解析する方法を意味する。「固有値」とは、微小な振動の周期を意味する。「固有ベクトル」とは、振動の方向を意味する。
基準振動解析法の解くべき固有値方程式は、下記式（１）または（２）である。

ここでω_ｋは固有値、Ｕ_ｉｋは固有ベクトルであり、δ_ｉｊはクロネッカーのデルタである。Ｔ_ｉｊとＶ_ｉｊはそれぞれ運動エネルギ−Ｅ_ｋとポテンシャルエネルギーＶに関係し、下記式（３）および（４）の通りである。

よる微分である。Ａ_ｊｋは集団運動Ｑ_ｋと個々の原子運動ｑ_ｊを結ぶ係数であり、下記式（５）の通りである。

ここで、α_ｋとδ_ｋは初期条件で定められる。
上記した基準振動解析法の詳細は、Ｗｉｌｓｏｎ，Ｅ．Ｂ．，Ｄｅｃｉｕｓ，Ｊ．Ｃ．，ａｎｄＣｒｏｓｓ，Ｐ．Ｃ．１９５５．ＭｏｌｅｃｕｌａｒＶｉｂｒａｔｉｏｎｓ．ＭｃＧｒａｗ−Ｈｉｌｌ．に記載されている。
ステップＩ−３０：新規参照タンパク質の生成
上記ステップＩ−２０で得られた固有値、固有ベクトルを用いて、ある温度・ある固有値でのＣα原子の位置ゆらぎを計算する。固有値の数と等しい位置ゆらぎが得られる。参照タンパク質のＣα原子の温度因子を位置ゆらぎに換算し、各Ｃα原子について基準振動解析法の位置ゆらぎとの比を計算し、平均の比を求める。この平均の比は、使用した固有値の数だけあり、この比を掛けたこの固有値に属する固有ベクトルを構造最適化前の参照タンパク質の原子座標に加え、この変位させた原子座標からなる立体構造、即ち、誘導適合（ｉｎｄｕｃｅｄｆｉｔ）を含めた立体構造を参照タンパク質の立体構造の１つとする。以下これを、誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型参照タンパク質、立体構造、座標として引用する。
平均の比を２倍して同様に参照タンパク質の誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型立体構造を作成する。固有ベクトルには順・逆の方向があり、固有ベクトルに−１を掛けた逆方向にも同様に変位させる。すなわち、誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型には使用した固有値の数の４倍だけある。誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型と非誘導適合（ｎｏｉｎｄｕｃｅｄｆｉｔ）型参照タンパク質の立体構造を参照タンパク質立体構造セットとする。
ここで、温度因子と位置ゆらぎの関係は下記式（６）のとおりである。

ここで、Ｂ_ｉはＰＤＢファイルから得られる原子の温度因子であり、πは円周率、Ｄ_ｉは位置ゆらぎに相当する。本発明ではＣα原子に関してのみである。
基準振動法から得られる位置ゆらぎとＰＤＢファイルの温度因子を換算した位置ゆらぎの比は下記式（７）のとおりである。

ここでＦ_ｉ ^ｖは基準振動解析法から得られるｖ番目の固有値に対するｉ番目の原子の位置ゆらぎである。本発明では、Ｃα原子のみに対して行う。
比の平均は下記式（８）のとおりである。

ここでＮは原子数であり、和は原子に対して行う。Ｍ^ｖはｖ番目の固有値に対する平均の比である。本発明では、Ｃα原子に対して行う。
誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型参照タンパク質立体構造の原子座標は下記式（９）および（１０）のとおりである。

ここでＣ_ｉｋ ^０は参照タンパク質の原子座標、Ｖ_ｉｋ ^ｖはｖ番目の固有値に属する固有ベクトルの成分をあらわす。
ステップＩ−４０：目的タンパク質のモデリング
上記ステップＩ−３０で得られた参照タンパク質の立体構造セットを参照して、適当なホモロジー・モデリング・プログラム、例えばＦＡＭＳにより目的タンパク質の立体構造セットを構築する。参照タンパク質の立体構造の数と同じ数の目的タンパク質の立体構造が構築される。即ち、使用した固有値の数の４倍だけある誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型と非誘導適合（ｎｏｉｎｄｕｃｅｄｆｉｔ）型目的タンパク質立体構造が構築され、これらを、目的タンパク質立体構造セット、すなわち誘導適合（ｉｎｄｕｃｅｄｆｉｔ）を含めた立体構造とする。
次に、モデリング（立体構造の構築）手法の好適な一例としてＦＡＭＳの各ステップについて説明する。なお、下記のステップＩ−４１〜４３において記載されている計算回数、定数、カットオフ値等は、本発明者が最も好ましいと考えているパラメータの一例を示すものであり、本発明の範囲を何ら限定するものではない。なお、ＦＡＭＳの詳細は、ＫｏｊｉＯｇａｔａａｎｄＨｉｄｅａｋｉＵｍｅｙａｍａ，“Ａｎａｕｔｏｍａｔｉｃｈｏｍｏｌｏｇｙｍｏｄｅｌｉｎｇｍｅｔｈｏｄｃｏｎｓｉｓｔｉｎｇｏｆｄａｔａｂａｓｅｓｅａｒｃｈｅｓａｎｄｓｉｍｕｌａｔｅｄａｎｎｅａｌｉｎｇ”ＪｏｕｒｎａｌｏｆＭｏｌｅｃｕｌａｒＧｒａｐｈｉｃｓａｎｄＭｏｄｅｌｉｎｇ１８，２５８−２７２，２０００に記載されている。
ステップＩ−４１：Ｃα原子の初期座標の構築及び最適化
ステップＩ−３０からの参照タンパク質セットおよびアライメント情報を受けて、参照タンパク質から挿入および欠損のあるアミノ酸残基についての情報をえる。アライメントにおいて連続して三残基以上のアミノ酸が対応しているギャップの無い領域を選び出し、その領域においては、これらの残基ペアにおいて、目的タンパク質のＣα原子は参照タンパク質と同一のものを当てはめておく。Ｃα原子が求められなかった場合には、予め作成してある断片のデータベースから座標を当てはめる（第２図参照）。
ここで、本明細書においてＣα原子とは、各アミノ酸の骨格の中心となる炭素原子を意味する。Ｃβ原子とは、Ｃα原子の側鎖側に結合する炭素原子を意味し、Ｃγ原子とは、Ｃβ原子の側鎖側に結合する炭素原子を意味する。また、Ｃ原子とは、カルボニル基の炭素原子を意味する。
ステップＩ−４１（１）：Ｃα原子のシミュレーティッドアニーリング法による構築
上記ステップＩ−４１で作成されたＣα原子はシミュレーティッドアニーリングのプロセスを用いて参照タンパク質の座標から構成される関数を用いて最適化される。この目的関数は下記式（１１）のとおりである。

ここでＵ_ｌｅｎは、配列上隣の残基およびＣｙｓ残基のペアのＣα原子間の距離に関するもので下記式（１２）のように設定される。

ここでＤ_{ｉ，ｉ＋１}は残基ｉと残基ｉ＋１のＣα間距離である。Ｄ_ｉ ^ｓｓはジスルフィド結合を形成するＣｙｓ残基のペア同士の距離である。Ｋ_ｌとＫ_ｓｓは定数でありそれぞれ２および５と設定される。
Ｕ_ａｎｇはＣα原子の結合角の関数であり下記式（１３）のとおりである。

ここでθ_ｉ（ｒａｄ）はｉ，ｉ＋１，ｉ＋２番目の残基Ｃα原子の角度である。θ_０はＰＤＢのＸ線構造から（１００／１８０）・π（ｒａｄ）と設定される。Ｋ_ａは定数であり１とする。
Ｕ_ｐｏｓは、Ｃα原子の位置に関する関数であり、下記式（１４）のとおりである。

ここで‖・‖が意味する所はノルムであり、Ｍ_ｉは構造を基にしたアライメント上で構造的に等価な位置にあるＣα原子間の平均距離である。残基ｉについてＭ_ｉの値が求められないとき、Ｍ_ｉの値は１０と設定される。ここでは、Ｃα原子の平均座標であり下記式（１５）のとおりである。

ここでＸ^ｊ _ｉはｊ番目の参照タンパク質のｉ番目の残基のＣαの原子座標である。Ｗ^ｊ _ｉは、ｊ番目の参照タンパク質のｉ番目の残基の重みである。この重みは目的タンパク質の大体の形を決定するため重要なパラメータであるが、これはローカルスペースホモロジー（ＬＳＨ）と呼ばれる着目部位の１２Å以内の空間的近傍の局所的な値によって決定している（第３図参照）。ＬＳＨと構造がよく保存されている部位（ＳＣＲｓ：ＳｔｒｕｃｔｕｒａｌＣｏｎｓｅｒｖｅｄＲｅｇｉｏｎｓ）に存在する残基のペアの比率との相関は第４図に示されているように非常に高い。これは、高いＬＳＨ値を持つときは統計的にＣα原子の位置が参照タンパク質構造と比べて１．０Å以内にあることを意味する。
Ｕ_ｖｄｗは下記式（１６）のとおりである。

ここでＫ_ｖｄｗは０．０１（Ｄ_ｉ，ｊ〈３．２Å）と０．００１（Ｄ_ｉ，ｊ〉３．２Å）と設定され６Åをカットオフ値とした。
Ｃα原子は式（１１）に従って、シミュレーティッドアニーリング法を用いて最適化される。この最適化の段階でＣα原子の摂動は１．０Å以内になるように設定する。またこのアニーリングの段階は全てのＣα原子について、１００回づつ計算される。そして、温度に相当するパラメータは、２５から０．５回ごとに０．０１減らし、そのパラメータは以後一定とした。
この大きな２つの段階、構造情報の取得とＣα原子の構築は１０回繰り返され、最小の目的関数値をもつＣα原子の座標が最適解として算出される。
ステップＩ−４２：主鎖原子座標の構築及び最適化
ステップＩ−４１（１）のＣαの原子座標に主鎖の他の原子を付加し、シミュレーティッドアニーリング法によって目的関数を最小化するようにする。まず、Ｃα原子の立体的な重ねあわせを行い、Ｃαの原子間距離が２．５Å以下の残基が取り上げられる。Ｃαを除く主鎖の原子座標はＣα原子間距離が最小になるように参照タンパク質の座標から取得しモデル構造とする。
参照タンパク質の中に相当する残基が無い場合、主鎖の原子座標はデータベース中の相当する４残基のタンパク質断片から作成される。この過程の中で、残基ｉの主鎖原子はｉ−１番目からｉ＋２番目までのＣα原子間の最小のｒｍｓｄ値を持つ残基から選ばれる。その際Ｎ末端の残基では、Ｃα原子座標の重ね合わせ範囲がｉ番目からｉ＋３番目までとなり、Ｃ末端の残基およびそのひとつ前の残基では同様にｉ−３番目からｉ番目までおよびｉ−２番目からｉ＋１番目までとなる。
主鎖原子の目的関数を元にシミュレーティッドアニーリング法によって最適化される。
目的関数は下記式（１７）のとおりである。

Ｕ_ｂｏｎｄは下記式（１８）のとおりである。

ここでｂ_ｉ ^０は、標準の結合長でありそれぞれの化学結合の種類によって異なる。Ｋ_ｂは定数であり２２５とする。
Ｕ_ａｎｇは結合角の関数で、下記式（１９）のとおりである。

ここでθ_ｉはｉ番目の結合角であり、化学結合の種類によって異なる。Ｋ_ａは定数で４５と設定される。
Ｕ_{ｎｏｎ−ｂｏｎｄ}は非結合の相互作用の関数で、下記式（２０）のとおりである。

ここでε_ｉ，ｊとｒ_ｉ，ｊ ^＊は定数で原子の種類によって異なる。
Ｋ_ｎｏｎは定数で０．２５とし、カットオフは８Åとする。
Ｕ_ｓｓはＣｙｓ残基が生成するジスルフィド結合の関数で、下記式（２１）のとおりである。

ここでＫ^ｓｓ _ＣαおよびＫ^ｓｓ _Ｃβは定数であり７．５である。
Ｕ_ｐｏｓは原子の位置に関する関数で、下記式（２２）のとおりである。

ここで＜Ｗ_ｉＸ_ｉ＞は下記式（２３）のように与えられる。

式（２２）の＜Ｗ_ｉＸ_ｉ＞は、目的タンパク質および参照タンパク質の間の構造の重ねあわせから求める。
Ｋ_ｐｏｓは定数であり０．３である。
Ｕ_ｔｏｒは主鎖のねじれ角のものであり、下記式（２４）のとおりである。

ここでφ_ｉ ^０とψ_ｉ ^０はＲａｍａｃｈａｎｄｒａｎマップ上での最も近いねじれ角のφ_ｉおよびψ_ｉとする。またω_ｉ ^０は０としてｃｉｓ−Ｐｒｏ残基の場合のみπ（ｒａｄｉａｎ）とする。Ｋ_ｔおよびＫ_ωは定数であり、それぞれ１０および５０とする。
Ｕ_ｃｈｉはＣαのキラリティーに関するものであり、下記式（２５）のとおりである。

ここでτ_ｉはＮ−Ｃα−Ｃβ−Ｃで定められるねじれ角でありＫ_ｃｈｉは５０とする。
Ｕ_ｈｙｄｒはホモロガスなタンパク質中で保存された主鎖の水素結合に関するもので、下記式（２６）のとおり定められる。

水素結合は、Ｎ原子とＯ原子の距離が２．９±０．５Åにあるときに設定される。
複数の参照タンパク質中で水素結合があるか否かを判定するときは、７５％以上の参照タンパク質が存在すると認めた場合に水素結合ありと判定する。Ｋ_ｈｙｄｒは定数であり０．６である。
次にＣβを含む主鎖原子の最適化がシミュレーティッドアニーリングによって行われる。このアニーリングの過程で主鎖とＣβの原子の摂動が初期の位置に対して１．０Å以内になるようにする。このアニーリングの段階は主鎖とＣβの原子に対して２００回行われる。温度に相当するパラメータは５０もしくは２５から始まり一回毎に０．５倍にしてゆき０．０１になるまで続け、その後一定値とする。
主鎖の立体配置を幅広くサンプリングするために、本発明の方法では、好ましくは上記の方法を６回行い、最小の目的関数値を持つ主鎖の原子座標を最適解とする。そして、温度に相当するパラメータは、はじめの２回は５０からスタートして３回目から２５からスタートすることとする。
ステップＩ−４３：側鎖原子座標の構築及び最適化
側鎖の構築は、大きく２段階に分かれており、「構造保存部位の側鎖構築」（スッテプＩ−４３（１））と「全体の側鎖構築」（スッテプＩ−４３（２））に分けられる。
ステップＩ−４３（１）：構造保存部位の側鎖構築
算出された主鎖原子に対して、以前の研究における方法を用いてホモロガスなタンパク質から側鎖のねじれ角を得る。この方法の詳細は、″Ｔｈｅｒｏｌｅｏｆｐｌａｙｅｄｂｙｅｎｖｉｒｏｎｍｅｎｔａｌｒｅｓｉｄｕｅｓｉｎｓｉｄｅ−ｃｈａｉｎｔｏｒｓｉｏｎａｌａｎｇｌｅｓｗｉｔｈｉｎｈｏｍｏｌｏｇｏｕｓｆａｍｉｌｉｅｓｏｆｐｒｏｔｅｉｎｓ：Ａｎｅｗｍｅｔｈｏｄｏｆｓｉｄｅｃｈａｉｎｍｏｄｅｌｉｎｇ．″ＯｇａｔａＫａｎｄＵｍｅｙａｍａＨ，Ｐｒｏｔ．Ｓｔｒｕｃｔ．Ｆｕｎｃｔ．Ｇｅｎｅｔ．１９９８，３１，２５５−３６９に記載されている。
この方法の中でホモロガスなタンパク質中で保存されている側鎖の割合を算出し、この情報を元にして側鎖のモデリングを行う。側鎖の保存された部位の側鎖の原子座標は固定した主鎖原子に対して置かれる。例えば、ホモロガスなタンパク質中でアルギニン残基のχ^１角が保存されていれば、Ｃγ原子の座標を置くことができ、Ｐｈｅ残基でχ^１とχ^２角が保存されていれば、全ての側鎖原子を置くことができる。式（１７）を用いたシミュレーティッドアニーリングの最適化の過程は、主鎖とＣβの原子のみ行われて、原子の摂動は１．０Å以内となるようにした。この主鎖とＣβの原子のアニーリングの段階は２００回行われる。そして、温度に相当するパラメータは２５からスタートして一回毎に０．５倍にしてゆき０．０１になるまで小さくなるようにする。式（１７）の中のＵ_{ｎｏｎ−ｂｏｎｄ}は主鎖原子と部分的に作成された側鎖原子について行われる。そのとき側鎖原子の座標は最適化の過程を通じて保存されるようにする。
構造の情報であるＭ_ｉと水素結合のＮ−Ｏのペアは最適化の過程で用いられる。主鎖原子の配置を得るために、上記プロセスを３回繰り返し、目的関数の最小の主鎖原子の座標を算出構造とする。
ステップＩ−４３（２）：全体の側鎖の構築
側鎖の構築は固定した主鎖およびＣβ原子のもとで行う。これは上記したＯｇａｔａＫａｎｄＵｍｅｙａｍａＨ，Ｐｒｏｔ．Ｓｔｒｕｃｔ．Ｆｕｎｃｔ．Ｇｅｎｅｔ．１９９８，３１，２５５−３６９に開示されている研究成果をもって行われ、それを用いることにより短時間で正確なモデルを与えることができる。次に主鎖構造は低温におけるモンテカルロ法によって最適化され、温度は０．００１に設定され式（１７）の目的関数Ｕ_{ｎｏｎ−ｂｏｎｄ}を用い、全ての主鎖と側鎖の原子で計算される。そして、Ｎ、Ｃα、Ｃ、Ｃβ原子の最適化の過程で側鎖のねじれ角を最適化された状態を保つように側鎖の座標を再配置する。原子の摂動は０．５Å以内とする。次に側鎖は削除され、上記の側鎖構築が繰り返される。このプロセスは２．４Åの原子同士のぶつかり合いがなくなり、且つＮ−Ｃα−Ｃβ−Ｃのねじれ角が−１２０±１５°の範囲に収まるまで繰り返される。
ステップＩ−４４：最終構造の構築
かくして、任意の目的タンパク質の非誘導適合（ｎｏｉｎｄｕｃｅｄｆｉｔ）型と誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型の立体構造を規定する原子座標を得ることができる。
ＩＩ．タンパク質−リガンド複合体の立体構造構築方法
次に、本発明の別の態様であるタンパク質−リガンド複合体の立体構造構築方法について、図面を参照して説明する。第５図は、目的とするタンパク質−リガンド複合体の立体構造構築方法、即ち誘導適合（ｉｎｄｕｃｅｄｆｉｔ）を含んだ複合体の立体構造構築方法の一例を示すフローチャートである。
まず、ステップＩＩ−１０において、目的タンパク質のモデリングされた原子座標を得る。最適化された参照タンパク質の基準振動解析法を行なうことにより、基準振動モードが得られる。そして固有ベクトル方向に主に実験で得られた目的タンパク質の原子座標を変位し、複数の参照タンパク質のセットを作成する。それらの座標を参照して目的タンパク質の立体構造をホモロジーモデリング（ｈｏｍｏｌｏｇｙｍｏｄｅｌｉｎｇ）により構築する。
ステップＩＩ−２０で、得られた目的タンパク質の立体構造に対してリガンドをドッキングさせる操作を行なう。ステップＩＩ−３０において、目的タンパク質のセットにドッキングしたリガンドに基づきＭＣＳＳ法による経験的分子エネルギー計算を行ない、目的とするタンパク質−リガンド複合体の立体構造をシミュレートする。かくして得られる目的タンパク質−リガンド複合体の立体構造は、目的タンパク質の誘導適合（ｉｎｄｕｃｅｆｉｔ）、すなわち周期的熱運動（分子揺らぎ）を含めた立体構造であり、医農薬の精度の高い分子設計に用いることができる。
以下、各ステップについて更に詳しく説明する。
ステップＩＩ−１０：目的タンパク質のモデリング
目的タンパク質のモデリングは、次の３つのステップＩＩ−１１：参照タンパク質の初期座標の最適化、ＩＩ−１２：最適化座標の基準振動解析、ＩＩ−１３：目的タンパク質のモデリングに分けられる。このステップは、前記Ｉ−１０〜Ｉ−４４と同様に行われる。かくして、基準振動解析法の振動モードに基づく立体構造、すなわち誘導適合（ｉｎｄｕｃｅｄｆｉｔ）を含んだ目的タンパク質の立体構造が構築できる。
ステップＩＩ−２０：目的タンパク質へのリガンドのドッキング
基準振動モードを考慮した目的タンパク質の複数の立体構造モデルに対してリガンドのドッキングを行なう。目的タンパク質のリガンド結合サイトと考えられる位置にドッキングさせる。このステップは、ＰＤＢ形式のファイルが入出力できる市販のソフトウエア、例えばＢＩＯＣＥＳ（ＮＥＣ社製）、Ｃｅｒｉｕｓ２（Ａｃｃｅｌｒｙｓ社製）、ＳＹＢＹＬ（ＴＲＩＰＯＳ社製）、ＨｙｐｅｒＣｈｅｍ（Ｈｙｐｅｒｃｕｂｅ社製）等を用いて行なう。一般的にはドッキングはステレオ表示が可能なディスプレイ上でリガンドを回転、並進して行なう。また簡易的エネルギー計算手法を含めたドッキングを行なってもよい。
用いるリガンドの結合部位は、特に限定されず、既に判明している結合部位、新たに特定した結合部位のいずれも用いることができる。リガンドの結合部位が未知のタンパク質については、後記ＩＩＩで述べる方法により、その部位を特定することもできる。
ステップＩＩ−３０：目的タンパク質−リガンド複合体の立体構造の最適化
ステップＩＩ−２０で得られたタンパク質−リガンド複合体構造モデルについて、目的タンパク質の１つの構造とリガンドとの構造の経験的分子エネルギー計算を、目的タンパク質の構造の数だけ行い、その際、目的タンパク質側は、複数の構造それぞれのポテンシャルエネルギー勾配に応じて原子座標を動かし、リガンド側は、複数個算出されたポテンシャルエネルギー勾配を平均化した方向にリガンドの原子座標を動かして、目的タンパク質の複数の立体構造に基づくリガンドの構造を求める。
このステップＩＩ−３０は、例えばＭｕｌｔｉｐｌｅＣｏｐｙＳｉｍｕｌｔａｎｅｏｕｓＳｅａｒｃｈ（ＭＣＳＳ）法により行われ、リガンドにより複数の複合体構造が経験的分子エネルギー計算（分子力場法）により同時に最適化され、それらの原子座標は経験的分子エネルギー計算（分子動力学法）により、構造が、例えば温度３００°Ｋで１０ｐｓ間緩和され、さらにその原子座標は分子力場法により最適化されることにより行われる。もちろん温度、時間は計算している対象系によって変わることはある。
ＭＣＳＳ法は、複数のリガンドを用いて受容体タンパク質とリガンド双方の立体構造を最適化する手法としてＡ．ＭｉｒａｎｋｅｒａｎｄＭ．Ｋａｒｐｌｕｓ（Ｐｒｏｔｅｉｎｓ，１９９１，１１，２９−３４）により提案されている。手法としては、個々のリガンドとタンパク質の経験的分子エネルギー計算を同時に行ない、受容体タンパク質のグラジエントについては平均をとるため、受容体タンパク質側は１つの立体構造として動く。
これに対して、本発明の方法では、タンパク質側は複数の分子構造、リガンド側は１つの分子構造を用いて、複数のタンパク質構造に基づくリガンドの構造を求めるものである。この時の経験的分子エネルギー計算において、タンパク質１構造とリガンド１構造の計算を、タンパク質構造の数だけ行い、リガンド側は、複数個算出されたポテンシャルエネルギー勾配を平均化した方向にリガンドの原子座標を動かす。一方、目的タンパク質側は、複数の構造それぞれのポテンシャルエネルギー勾配に応じて原子座標を動かし、目的タンパク質の複数の立体構造に基づくリガンドの構造が求められる。
上記の経験的分子エネルギー計算の方法は、特に限定されずそれ自体既知の方法で行えば良いが、発明者らが開発したａｐｒｉｃｏｔプログラム（Ｙｏｎｅｄａ，Ｓ．，ａｎｄＵｍｅｙａｍａ，Ｈ．，ＪＣｈｅｍＰｈｙｓ１９９２；９７：６７３０−６７３６）を改良したａｐｒｉｃｏｔ−ＭＣＳＳプログラムを用いるのが好ましい。経験的ポテンシャル関数としてはＡＭＢＥＲタイプのポテンシャル関数（Ｓ．Ｊ．Ｗｅｉｎｅｒ，Ｐ．Ａ．Ｋｏｌｌｍａｎ，Ｄ，Ａ．Ｃａｓｅ，Ｕ．ＣｈａｎｄｒａＳｉｎｇｈ，Ｃ．Ｇｈｉｏ，Ｇ．Ａｌａｇｏｎａ，Ｓ．Ｐｒｏｆｅｔａ，Ｊｒ．，Ｐ．Ｗｅｉｎｅｒ，Ｊ．Ａｍ．Ｃｈｅｍ．Ｓｏｃ．，１９８４，１０６，７６５−７８４）を、パラメータとしてはｐａｒｍ８９ａＲｅｖＡを用いるのが好ましい。もちろん他の経験ポテンシャルの使用も可能である。
分子動力学計算では、通常のエネルギー項の他にＣα原子位置に対する拘束ポテンシャルを、例えば下記式（２７）のようにＨａｒｍｏｎｉｃ関数として加えることにより、目的タンパク質の初期立体構造が大きく壊れないようにするのが好ましい。これは計算の近似の粗さを補う意味で大切であるが、拘束ポテンシャルの範囲を主鎖全体に広げたりしてもよく、これに限定されるものではない。

ここでＵｘｙｚは目的タンパク質におけるＣα原子位置に掛ける拘束のポテンシャルエネルギーで、Ｃαのオリジナル座標値がｘ０、更新された座標値がｘ、Ｋｘｙｚが原子をどの程度拘束させるかのパラメータである。ここではＫｘｙｚとして１０．０ｋｃａｌ／ｍｏｌ／Å^２を用いたが、一例であるので、式の形を含めて本発明の範囲を限定するものではない。
また、Ｃα原子のＸ、Ｙ、Ｚ座標に対する拘束ポテンシャルの代りに、式（２４）に示す目的タンパク質の主鎖のねじれ角に対する拘束を用いて、すなわち経験的分子エネルギー計算において目的タンパク質の主鎖のねじれ角を拘束するポテンシャル関数を加えることにより、初期立体構造が大きく壊れないようにしてもよい。
かくして、目的タンパク質として誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型の立体構造モデルを使えば、分子揺らぎを考慮した目的タンパク質−リガンド複合体の原子座標を得ることができる。
また、リガンド分子がタンパク質の場合には、上記と同様の方法で、リガンドの基準振動モードを含む複数の立体構造とタンパク質の単一立体構造からリガンド側の誘導適合（ｉｎｄｕｃｅｄｆｉｔ）を考慮したリガンド−タンパク質複合体の立体構造の構築も可能である。
ＩＩＩ．タンパク質のリガンド結合部位の特定方法
次に、本発明の別の態様である、タンパク質のリガンド結合部位の特定方法について説明する。第６図は、タンパク質のリガンド結合部位の特定方法と、得られた結合部位にリガンドを結合させて、タンパク質−リガンド複合体の立体構造を構築する方法の一例を示すフローチャートである。
ステップＩＩＩ−１０で、タンパク質とリガンドの結合部位の特定（予測）を行う。このステップにおいて、タンパク質および／またはリガンドの周囲および内部、例えば疎水性表面に、低分子化合物、例えば非極性溶媒を発生させ、さらにそれら周囲に多数の水分子を追加して見かけ上水溶液中の分子動力学計算を行う。それらの結果に基づき、タンパク質および／またはリガンド表面の低分子化合物、例えば非極性溶媒の挙動から、タンパク質とリガンドの結合部位を検索する。ステップＩＩＩ−２０ではステップＩＩＩ−１０で得られたタンパク質とリガンドの結合推定部位を参考にして、それらをドッキングさせ、タンパク質−リガンド複合体の立体構造の初期原子座標を求める。そしてステップＩＩＩ−３０ではステップＩＩＩ−２０で得られたタンパク質−リガンド複合体の初期立体構造の周囲に水分子を発生させ、見かけ上水溶媒中の分子力学と分子動力学法を用いてタンパク質−リガンド複合体の立体構造の精密化を行う。
以下、各ステップについて更に詳しく説明する。
ステップＩＩＩ−１０：タンパク質のリガンド結合部位の特定
タンパク質とリガンドの結合部位の特定は、次の３つのステップ、ＩＩＩ−１１：タンパク質周囲および／またはリガンド周囲への低分子化合物の発生、ＩＩＩ−１２：タンパク質および／またはリガンドの水溶媒中での経験的分子エネルギー計算（分子力学、分子動力学計算）による低分子化合物（例えば非極性溶媒等）の挙動検索、ＩＩＩ−１３：低分子化合物（例えば非極性溶媒等）の挙動から、タンパク質へのリガンド結合部位および／またはリガンドのタンパク質への結合部位の判定に分けられる。
ステップＩＩＩ−１１：タンパク質周囲および／またはリガンド周囲への低分子化合物の発生
先ず、タンパク質および／またはリガンドの周囲に水分子を発生させたのち、タンパク質周囲、リガンド周囲、ならびに低分子化合物が入り込める内部周囲にある水分子を低分子化合物で置換する。その場合、これらの置換はそれら周囲全体にわたり低分子化合物を配置してもよいし、疎水性や水素結合能を有するアミノ酸や官能基の周りにだけ低分子化合物を配置してもよい。ここで、リガンドがペプチドやタンパク質等の高分子物質である場合には、リガンド周囲へも低分子化合物を発生させ、タンパク質の場合と同様に経験的分子エネルギー計算による低分子化合物の挙動解析を行う。リガンドが医農薬分子等の分子量が小さい物質である場合は、どの部分が疎水性領域か等の判別できるので、通常、結合部位の特定の必要性は無い。しかし、リガンドが高分子物質である場合は、リガンド側の結合部位もタンパク質側の結合部位と同様に解析し、複合体の結合部位を特定することが必要である。
低分子化合物としては、例えば、エタン、シクロペンタン、ベンゼン等の非極性溶媒、Ｎ−メチルアセタミド、ベンズアミド等の水素結合能性溶媒、あるいは医農薬化合物でもよく特に限定されない。だがそれら配向の任意性を考えると、対象性を有する化合物が好ましい。非極性溶媒を用いると疎水性部分を有するタンパク質やリガンドの結合部位を特定することができる。また水素結合能性溶媒である酸アミド基を有する化合物を用いると、酸アミド基と水素結合しうる部分、すなわちβシート構造の露出部分やオキシアニオンホールを含むリガンドの結合部位を特定することができる。更に医農薬分子を用いると、医農薬分子が特異的に結合しうる部分を特定することができる。
具体的には、例えばベンゼン等の非極性溶媒をタンパク質の周囲に配置させる場合は、タンパク質の中でＭＳＡＳの値が３０％以上のアミノ酸残基により形成される３．５Å以内の表面にある水分子を非極性溶媒（ベンゼン）で置換すれば良い。また非極性溶媒（ベンゼン）同士が１．５Å以内になるような場合には水分子の非極性溶媒への置換は行わなくて良い。非極性溶媒に置換されなかった水分子は一回すべて消去する。上記した水分子の非極性溶媒への置換基準は、ベンゼンを用いた場合の一例であり、本発明の範囲を限定するものではない。
ステップＩＩＩ−１２：タンパク質および／またはリガンドの水溶媒中での経験的分子エネルギー計算による低分子化合物の挙動検索
上記ステップＩＩＩ−１１で作成されたタンパク質（および／またはリガンド）と低分子化合物の原子座標を用いて、それら周囲に周期境界条件で水分子を発生させたのち、経験的分子エネルギー計算である分子力学計算で立体構造を最適化し、続いて分子動力学計算を行う。分子動力学計算が終了したのち、水分子を除去してタンパク質（および／またはリガンド）と低分子化合物との原子座標を得る。例えば、低分子化合物として非極性溶媒（ベンゼン）を配置した場合は、温度３００°Ｋ、１０〜２０ｐｓ程度の分子動力学計算を行えば良い。これにより、タンパク質の周囲や内部への低分子化合物の拡散や集積が起こる。この拡散や集積の状態、即ち低分子化合物の挙動を、後記ステップＩＩＩ−１３の方法で解析することにより、タンパク質側のリガンド結合部位、リガンド側のタンパク質結合部位を特定することができる。
上記の経験的分子エネルギー計算の方法は、特に限定されないが、本発明者らが開発したａｐｒｉｃｏｔプログラムを用いるのが好ましい。経験的ポテンシャル関数としてはＡＭＢＥＲタイプのポテンシャル関数を用いるのが好ましい。もちろん他の経験ポテンシャルの使用も可能である。
ステップＩＩＩ−１３：低分子化合物の挙動からのリガンド結合部位の判定
上記ステップＩＩＩ−１２で求まったタンパク質周囲および／またはリガンド周囲の低分子化合物、例えば非極性溶媒の分布について、これを対象としたクラスター解析を行い、得られたクラスターの大きさからリガンドがタンパク質にドッキングしやすい部位を判定する。
ここで、クラスター解析とは、多次元空間において与えられたデータ集合を個体間の類似度（あるいは相違度）によってクラスター（塊）化する多変量解析法である。ここでは３次元空間における非極性溶媒の重心（ベンゼンでは６炭素原子の座標平均）間同士のユークリッド距離を計算し、閾値以内の距離の非極性溶媒があれば、距離が短い非極性溶媒同士からクラスター化していく。そのときクラスター化された非極性溶媒の集合についても、通常のクラスター解析と異なり、クラスターの重心からの距離ではなく、その中で最短距離の非極性溶媒同士が閾値以内であるかどうかを調べることにより、それらをクラスター化するか否かを判定する。非極性溶媒のベンゼンの場合、閾値については６Åを用いたが、その値は単なる例示であり本発明の範囲を限定するものではない。
例えば非極性溶媒（ベンゼン）を用いた場合、それらはいくつかのクラスターに分類されるが、大きなクラスターほどリガンドやタンパク質へのドッキング部位である可能性が高いと考えられる。クラスター化された非極性溶媒群はその形状を楕円球で表現できるが、座標の固有値問題を解くことにより、クラスターの長短方向が求まる。タンパク質側とリガンド側双方のクラスター同士を楕円球の長短方向を参考にしてドッキングし、タンパク質−リガンド複合体のモデルをいくつか作成する。もちろんタンパク質とリガンドが重なる配置になる複合体構造は自動的に取り除く。ドッキングされたモデルはステップＩＩ−２０で記述したソフトウエアでタンパク質とリガンド配置の微調整を行う。
ステップＩＩＩ−２０：タンパク質へのリガンドのドッキング
上記ステップＩＩＩ−１３で得られた低分子化合物、例えば非極性溶媒（ベンゼン）のクラスタリングで大きなクラスターとなったサイト同士をドッキングし、タンパク質−リガンド複合体構造の初期データとする。この際、低分子化合物、例えば非極性溶媒（ベンゼン）データはドッキングに際して除かれる。
本ステップはＰＤＢ形式のファイルが入出力できる市販のソフトウエアを用いて行なうことができる。一般的にはドッキングはステレオ表示が可能なディスプレイ上でリガンドの回転、並進等により行なわれる。また簡易的エネルギー計算手法を含めたドッキングを行なってもよい。
ステップＩＩＩ−３０：タンパク質−リガンド複合体の立体構造の構築
上記ステップＩＩＩ−２０で得られたタンパク質−リガンド複合体の初期原子座標データは、それら周囲に周期境界条件で水分子を発生させたのち、分子力学計算で初期立体構造を最適化し、続いて分子動力学計算を行い、そして最終ステップの座標軌跡から水分子を取り除くことによりタンパク質−リガンド複合体の立体構造が得られる。
分子動力学計算の方法は、特に限定されず、例えば、温度３００°Ｋ、１０から２０ｐｓ程度で行えばよい。用いるプログラムも特に限定されないが、発明者らが開発したａｐｒｉｃｏｔで、経験力場もＡＭＢＥＲタイプを用いるのが好ましい。しかし使用プログラム、力場とも単なる例示であり、本発明の範囲を限定するものではない。
かくして、タンパク質−リガンド複合体の生成過程が水溶液中であることを考慮して、水溶媒中での低分子化合物、例えば非極性溶媒の集積、拡散を利用して、タンパク質とリガンドの疎水性表面を見い出し、それら同士をドッキングするという方法でこれまでより精密なタンパク質−リガンド複合体の原子座標を得ることができる。
ＩＶ．タンパク質の立体構造を規定する原子座標が記録されている記録媒体、データベース
上記方法で得られたタンパク質の立体構造またはタンパク質−リガンド複合体の立体構造を規定する原子座標を、コンピュータが利用可能な所定の形式で適当な記録媒体に格納することにより、目的タンパク質の立体構造データベースが構築できる。本発明のデータベースは、好ましくは、上記原子座標とともに参照タンパク質と目的タンパク質のアライメント情報を含んでいても良い。また、データベースには、所望によりコード番号、参照タンパク質の参照領域の情報、目的タンパク質の情報、Ｃα原子間距離等が含まれる。
本発明においてデータベースとは、上記原子座標を適当な記録媒体に書き込み、所定のプログラムに従って検索を行うコンピュータシステムをも意味する。ここで適当な記録媒体としては、例えば、フロッピーディスク、ハードディスク、磁気テープ等の磁気媒体；ＣＤ−ＲＯＭ、ＭＯ、ＣＤ−Ｒ、ＣＤ−ＲＷ等の光ディスク、半導体メモリ等を挙げることができる。
Ｖ．薬物の分子設計方法
医農薬等の薬物分子設計を行うことができる適当なプログラムが動作するコンピュータで、上記方法で得られた薬物分子の標的となるタンパク質（以下これを「標的タンパク質」と称することがある）の構造座標の全て若しくは一部、又はそれらが記録されたデータベース若しくは記録媒体の構造座標の全て若しくは一部を使用して、標的タンパク質と相互作用をする薬物分子（拮抗薬または作動薬）を同定、検索、評価又は設計等を行うことができる。
薬物分子の同定、検索、評価又は設計は、本発明の方法で得られた立体構造座標と薬物分子の立体構造座標との相互作用の有無やその程度に基づいて行われる。本明細書において、薬物分子の同定、検索、評価又は設計等を、単に薬物の分子設計ということがある。
タンパク質の立体構造座標と薬物候補分子の立体構造座標との相互作用に基づいて分子設計を行う際に用いられるコンピュータとしては、適当なプログラムが動作するように調整されているコンピュータであれば特に制限はない。また、コンピュータの記憶媒体にも特に制限はない。分子設計に用いるプログラムは、例えばアクセルリス（Ａｃｃｅｌｒｙｓ）社製のコンピュータ・プログラムＩｎｓｉｇｈｔＩＩ等を挙げることができる。特に、この目的のために特別に作成されたＬｕｄｉやＤＯＣＫといったプログラムを単独又は組み合わせて用いることで、より容易に薬物分子を同定、検索、評価又は設計することができる。また、タンパク質の立体構造座標と薬物分子とのドッキング評価は、例えば前記ステップＩＩ−２０に記載したＮＥＣ社製のＢＩＯＣＥＳ等のソフトウエアを用いて行うことができる。
ここで、薬物分子は、既知のものであっても、新たに合成された新規な化学構造を有する薬物分子であっても、その立体構造が得られるものであれば、いずれの薬物分子も本発明の方法で用いることができる。薬物分子の立体構造座標は、Ｘ線結晶解析やモデリング等のいずれの方法で得られたものでも良い。３次元構造座標が決定されているものは、適当なデータベース、例えばＣＣＤＣ（ＣａｍｂｒｉｄｇｅＣｒｙｓｔａｌｌｏｇｒａｐｈｉｃＤａｔａＣｅｎｔｒｅ：ｈｔｔｐ：／／ｗｗｗ．ｃｃｄｃ．ｃａｍ．ａｃ．ｕｋ／）やＰＤＢ（ＰｒｏｔｅｉｎＤａｔａＢａｎｋ：ｈｔｔｐ：／／ｗｗｗ．ｒｃｓｂ．ｏｒｇ／ｐｄｂ／）等から収得することができる。
更には、標的タンパク質の立体構造を用いて、例えば特開２０００−１７８２０９号公報に記載されている方法によっても、薬物分子を設計することができる。この様に、本発明の方法で得られたタンパク質の立体構造座標を用いることで、薬物分子のコンピュータによる分子設計が可能となる。ただし、本発明の分子設計方法は、これらのプログラムや手法を用いるものに限定されるものではない。
薬物の分子設計には、通常、概念的に２つの段階がある。最初の段階は、リード化合物を見つけだすものであり、次の段階はリード化合物の最適化である。どちらの段階も、標的タンパク質の立体構造座標を使用して、それ自体既知の方法により行うことができる。これにより最適な医農薬候補分子を得ることができる。
ＶＩ．分子設計方法により得られる医農薬候補分子のスクリーニング方法
上記方法により同定、検索、評価又は設計された医農薬候補分子は、その分子の性質に応じて、例えばそれ自体既知の化学合成法により得ることができる。しかしながら、薬物分子は、天然化合物、合成化合物のいずれでも良く、また、高分子化合物、低分子化合物のいずれでも良い。得られた医農薬候補分子は、更に、それ自体既知の方法により、試験管内や生体内における薬理学的または生理学的試験によりその活性を調べ、所望の活性を有する医農薬候補分子を選抜することにより実際に医農薬として応用可能なものを得ることができる。
ＶＩＩ．医農薬組成物の製造方法
上記スクリーニング方法により選択された医農薬等の薬物分子、例えば医薬分子は、それ自体単独で治療対象となる疾患等の患者に投与することができるが、これらの有効成分の１種又は２種以上を混合して投与することもできる。また、薬理学的に許容される製剤用添加物等を用いて該物質を医薬品組成物として製剤化し、これを投与するのが好ましい。例えば、必要に応じて糖衣を施した錠剤、カプセル剤、顆粒剤、細粒剤、散剤、丸剤、マイクロカプセル剤、リポソーム製剤、トローチ、舌下剤、液剤、エリキシル剤、乳剤、懸濁剤等として経口的に、あるいは無菌の水性液もしくは油性液として製造した注射剤や、座剤、軟膏、貼付剤等として非経口的に使用できる。これらは、例えば、該物質を生理学的に認められる担体、香味剤、賦形剤、ベヒクル、防腐剤、安定剤、結合剤などとともに一般に認められた製剤実施に要求される単位用量形態で混和し、充填又は打錠等の当業界で周知の方法を用いて製造することができる。これらの医薬組成物における有効成分量は指示された範囲の適当な容量が得られるようにするものである。
農薬分子について、実際に農薬として使用する場合には、担体若しくは希釈剤、添加剤および補助剤等と公知の方法で混合して、通常農薬として用いられている製剤形態（組成物）、例えば粉剤、粒剤、水和剤、乳剤、水溶剤、フロアブル剤等に調製して使用される。
実施例
以下、実施例を挙げて本発明を更に具体的に説明するが、下記の実施例は、本発明の具体的な認識を得る一助と見なすべきであり、本発明の範囲を何ら制限するものではない。
実施例１ β２アドレナリンレセプターの立体構造の構築
上記発明の実施形態のＩ−１０〜Ｉ−４０で詳述した方法に従って、次の通りヒト由来β２アドレナリンレセプターの誘導適合を含めた立体構造を構築した。第７図にフローチャートを示す。
立体構造モデルの構築は、ＮＥＣ社製ワークステーション（機種：Ｅｘｐｒｅｓｓ５８００／１２０Ｒｃ−２、ＣＰＵ：ＰｅｎｔｉｕｍＩＩＩ９３３ＭＨｚｘ２、ＯＳ：ＲｅｄＨａｔＬｉｎｕｘ６．２Ｊ、メモリ：１０２４Ｍｂｙｔｅｓ）を用いて行った。目的としたβ２アドレナリンレセプターのアミノ酸配列は、ＰＩＲ；ｈｔｔｐ：／／ｗｗｗ−ｎｂｒｆ．ｇｅｏｒｇｅｔｏｗｎ．ｅｄｕ／ｐｉｒ／のＩＤ：ＱＲＨＵＢ２より得た。
このβ２アドレナリンレセプターのアミノ酸配列を目的タンパク質の配列としてＰＳＩ−ＢＬＡＳＴ（Ｐｏｓｉｔｉｏｎ−ＳｐｅｃｉｆｉｃＩｔｅｒａｔｅｄＢＬＡＳＴ）によるアライメントを行った。その際、モチーフプロファイルは、ＧＣＲＤｂ；ｈｔｔｐ：／／ｗｗｗ．ｇｃｒｄｂ．ｕｔｈｓｃｓａ．ｅｄｕ／の全配列８９２個を用いた。β２アドレナリンレセプターのアミノ酸配列を、ＳＥＱＩＤＮｏ．１に示す。
参照するタンパク質の立体構造として、ＰＤＢ（ｈｔｔｐ：／／ｗｗｗ．ｒｃｓｂ．ｏｒｇ／ｐｄｂ／）のＩＤ：１Ｆ８８（ロドプシン）のＢ鎖の構造を用い、このＢ鎖に対してのアライメントを得た。１Ｆ８８（ロドプシン）のＢ鎖の配列をＳＥＱＩＤＮｏ．２に、アライメント結果を第８図に示す。１Ｆ８８（ロドプシン）の結晶格子中にはＡ鎖及びＢ鎖よりなるほぼ同一の立体構造を持つ２量体があり、Ｂ鎖を参照構造として用いた。またＡ鎖とＢ鎖の座標にはそれぞれ大きな欠損があり完全ではなく、前記ステップＩ−４０で詳述したモデリング・プログラムＦＡＭＳを用いて１Ｆ８８構造のモデリングを行い、構築された立体構造をβ２アドレナリンレセプターの参照タンパク質立体構造とした。
ＰＤＢファイルおよびＦＡＭＳでは適当な残基に水素原子が付加されないため、この参照タンパク質立体構造の適当な残基に水素原子を発生させ、基準振動解析法の入力座標となる初期原子座標を得た。
前記ステップＩ−１０〜Ｉ−２０のとおり、得られた初期原子座標のデカルト座標系による最適化、ＳＳ結合のポテンシャルパラメータの一部をゼロにしてデカルト座標系で再最適化、２面角座標系による基準振動解析法を行い、固有値・固有ベクトルを得た。
この際、パラメータはＡＭＢＥＲのｐａｒｍ８９ａＲｅｖＡを用いた。非結合相互作用のカットオフ値は内側９．０Å、外側１０．０Åとし、１−４相互作用のパラメータは非結合相互作用のそれに１／２を乗じたものを使用し、誘電率は距離依存型（１／ｒÅ）とした。最適化は、Ｆｌｅｔｃｈｅｒ−Ｒｅｅｖｅｓの共役勾配法を用いた。得られた初期原子座標のデカルト座標系による最適化をしたあと、ＳＳ結合の結合角、２面角のパラメータをゼロにする以外は同じ条件を使用してデカルト座標系で再最適化し、２面角座標系による基準振動解析法を行い、固有値・固有ベクトルを得た。
使用した最適化の条件は、Ｓｕｍｉｋａｗａ，Ｈ．，Ｓｕｚｕｋｉ，Ｅ．−Ｉ．，Ｆｕｋｕｈａｒａ，Ｋ．−Ｉ．，Ｎａｋａｊｉｍａ，Ｙ．，Ｋａｍｉｙａ，Ｋ．，ａｎｄＵｍｅｙａｍａＨ．１９９８．Ｄｙｎａｍｉｃｓｓｔｒｕｃｔｕｒｅｏｆｇｒａｎｕｌｏｃｙｔｅｃｏｌｏｎｙ−ｓｔｉｍｕｌａｔｉｎｇｆａｃｔｏｒｐｒｏｔｅｉｎｓｓｔｕｄｉｅｄｂｙｎｏｒｍａｌｍｏｄｅａｎａｌｙｓｉｓ：Ｔｗｏｄｏｍａｉｎ−ｔｙｐｅｍｏｔｉｏｎｓｉｎｌｏｗｆｒｅｑｕｅｎｃｙｍｏｄｅｓ．ＣｈｅｍＰｈａｒｍＢｕｌｌ４６：１０６９−１０７７に記載されている方法を用いた。また、２面角座標系による基準振動解析法の詳細は、Ｎｏｇｕｔｉ，Ｔ．，ａｎｄＧｏ，Ｎ．１９８３．Ｄｙｎａｍｉｃｓｏｆｎａｔｉｖｅｇｌｏｂｕｌａｒｐｒｏｔｅｉｎｓｉｎｔｅｒｍｓｏｆｄｉｈｅｄｒａｌａｎｇｌｅｓ．ＪＰｈｙｓＳｏｃＪｐｎ５２：３２８３−３２８８およびＮｏｇｕｔｉ，Ｔ．，ａｎｄＧｏ，Ｎ．１９８３．Ａｍｅｔｈｏｄｏｆｒａｐｉｄｃａｌｃｕｌａｔｉｏｎｏｆａｓｅｃｏｎｄｄｅｒｉｖａｔｉｖｅｍａｔｒｉｘｏｆｃｏｎｆｏｒｍａｔｉｏｎａｌｅｎｅｒｇｙｆｏｒｌａｒｇｅｍｏｌｅｃｕｌｅｓ．ＪＰｈｙｓＳｏｃＪｐｎ５２：３６８５−３６９０に記載されている方法を用いた。
前記ステップＩ−３０のとおり、温度を３００°Ｋとし、３０ｃｍ^−１以下の各固有値に対するＣα原子のゆらぎを求め、ＰＤＢＩＤ：１Ｆ８８（ロドプシン）のＡ鎖とＢ鎖の平均の温度因子から換算されるＣα原子のゆらぎとの比をとり、各固有値に対する平均の比を得た。平均の比をこの固有値に属する固有ベクトルに掛けて、参照タンパク質の原子座標に加えて変位を行い、誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型参照タンパク質の立体構造を規定する座標を得た。同様に固有ベクトルに−１を掛けた変位、２倍した平均の比を固有ベクトルに掛けた変位、さらに−１を掛けた変位を行った。ただし、ここで加える固有ベクトルは２面角座標からデカルト座標に変換してある。１つの固有値・固有ベクトルから４つの誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型参照タンパク質の立体構造セットが得られる。用いた３０ｃｍ^−１以下の固有値の数は１１８個であり、得られた誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型の参照タンパク質の数は４７２個である。例として、第９図に最低固有値４．４７ｃｍ^−１のＭ^ｖ（＝２６．４）倍したゆらぎと換算した温度因子を示す。
前記ステップＩ−４０のとおり、非誘導適合（ｎｏｉｎｄｕｃｅｄｆｉｔ）型参照タンパク質立体構造と誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型参照タンパク質立体構造セットからＦＡＭＳにより目的タンパク質であるβ２アドレナリンレセプターの立体構造をモデリングした。目的タンパク質の立体構造と参照タンパク質の立体構造は１対１の関係にあり、４７２個の誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型目的タンパク質立体構造と従来の方法から得られる１個の非誘導適合（ｎｏｉｎｄｕｃｅｄｆｉｔ）型目的タンパク質立体構造を得た。例として、第１０図に、上記で得られた非誘導適合（ｎｏｉｎｄｕｃｅｄｆｉｔ）型参照タンパク質から構築された非誘導適合（ｎｏｉｎｄｕｃｅｄｆｉｔ）型目的タンパク質立体構造と最低固有値の固有ベクトルを±２×Ｍ^ｖ（±２×２６．４）倍した誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型参照タンパク質立体構造から構築された誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型目的タンパク質の立体構造の一部を示す。図中、中央の構造が非誘導適合型目的タンパク質である。
実施例２トリプシン単体およびトリプシン・インヒビター単体からの複合体の立体構造の構築
本例では受容体、リガンド、受容体−リガンド複合体のＸ線結晶解析が既知である牛膵臓由来のβ−Ｔｒｙｐｓｉｎ（トリプシン）とトリプシン・インヒビター（ＢＰＴＩ）の系を用いて、本発明のタンパク質−リガンド複合体の立体構造構築方法の検証を行った。ここではトリプシンが受容体タンパク質（目的タンパク質）、ＢＰＴＩがリガンドである。
用いたトリプリンのアミノ酸配列をＳＥＱＩＤＮｏ．３に、トリプシン・インヒビター（ＢＰＴＩ）のアミノ酸配列をＳＥＱＩＤＮｏ．４に示す。なお、トリプシンのアミノ酸番号は、キモトリプシノーゲン（キモトリプシンの前駆体）のアミノ酸配列番号で記述するので、次に示す通り、アミノ酸番号１６〜２４５までの２２３残基になる。途中、アミノ酸番号３５、３６、６８、１２８、１３１、１８８、２０５、２０６、２０７、２０８に欠落が、１８４、１８８、２２１に重複（１８４Ａ、１８８Ａ、２２１Ａで表示）がある。

前記ステップＩＩ−１０〜ＩＩ−３０で詳述した方法に従って、次の手順でトリプシン−ＢＰＴＩ複合体の立体構造モデルを構築し、複合体活性部位の位置をそのＸ線結晶解析データと比較検討した。
受容体タンパク質−リガンド複合体の立体構造モデルの構築は、ＤＥＬ社製パーソナルコンピュータ（機種：ＤｉｍｅｎｓｉｏｎＸＰＳＢ８６６、ＣＰＵ：ＰｅｎｔｉｎｕｍＩＩＩ８６４ＭＨｚ、ＯＳ：ＲｅｄＨａｔＬｉｎｕｘ６．２Ｊ、メモリ：５１２Ｍｂｙｔｅｓ）を用いて行った。トリプシンとＢＰＴＩ単独のＸ線結晶解析の座標、ならびにトリプシン−ＢＰＴＩ複合体のそれは、ＰｒｏｔｅｉｎＤａｔａＢａｎｋ（ＰＤＢ）；ｈｔｔｐ：／／ｗｗｗ．ｒｃｓｂ．ｏｒｇ／ｐｄｂ／より、それぞれ１ＴＬＤ（トリプシン単体）、４ＰＴＩ（ＢＰＴＩ）、２ＰＴＣ（トリプシン−ＢＰＴＩ複合体）を取得して用いた。
トリプシンとＢＰＴＩの立体座標系は、トリプシン−ＢＰＴＩ複合体の結果を考察しやすいように１ＴＬＤと４ＰＴＩの座標系を２ＰＴＣの座標系に最小二乗フットによりスーパーインポーズした。トリプシンとＢＰＴＩの立体座標はヘテロ原子に水素原子を発生させたのち、それぞれ単体での初期座標の最適化を行った。次にトリプシンはＢＰＴＩを含まない系で基準振動解析を行い、波長ごとに対する振動ベクトルを求めた。
その中で、時間的に長周期な振動ベクトルからなる５つのトリプシンの立体構造に対して、ＢＰＴＩの立体構造をドッキングしてａｐｒｉｃｏｔ−ＭＣＳＳプログラムによるＭＣＳＳ計算を行い、トリプシン−ＢＰＴＩ複合体の立体構造を精密化した。ＭＣＳＳ計算の内訳は、最初に１０００ステップのトリプシン−ＢＰＴＩ複合体の分子力学計算による立体構造の最適化を行い、続いて１ｆｓを１ステップとする３００°Ｋ、１０ｐｓの分子動力学計算によりトリプシン−ＢＰＴＩ複合体の立体構造の緩和を行った。分子動力学計算では複合体の立体構造が大きく崩れないように式（２７）に示したＣα原子に対するＫｘｙｚ＝１０．０ｋｃａｌ／ｍｏｌ／Å^２の拘束条件を加えた。そして１０ｐｓ後の立体構造について、トリプシン−ＢＰＴＩ複合体の座標データをＰＤＢフォーマットで得た。
ＭＣＳＳ計算後のトリプシン−ＢＰＴＩ複合体系のトリプシンの立体構造を第１１図に示す。トリプシンの原子座標を眺めて見ると、主鎖、側鎖ともに大きくばらついている部分と、それらが余りばらついていない部分があった。その中でもトリプシン活性部位であるトリプシン側のＨｉｓ５７、Ａｓｐ１０２、Ｇｌｙ１９３−Ａｓｐ１９４−Ｓｅｒ１９５（オキシアニオンホール）部分は主鎖、側鎖ともよく一致していた。このことを利用するとリガンド結合部位に重要な受容体タンパク質側の部位を見つけられる。それは新たなリガンドをデザインする上でたいへん参考になる。
ＭＣＳＳ計算前のトリプシン−ＢＰＴＩ複合体の初期立体構造を第１２図に、ＭＣＳＳ計算後のトリプシン−ＢＰＴＩ複合体の立体構造を第１３図に、複合体のＸ線結晶解析の立体構造とともに示した。これらの図では、トリプシン−ＢＰＴＩ複合体の活性部位に当たる、トリプシン側ではＨｉｓ５７、Ａｓｐ１０２、オキシアニオンホール（Ｇｌｙ１９３−Ａｓｐ１９４−Ｓｅｒ１９５）を、ＢＰＴＩ側ではＬｙｓ１５だけを抜き出して表示した。黒色で表示されている線がトリプシン−ＢＰＴＩ複合体のＸ線結晶解析の立体構造、灰色で表示されている線が本発明により組み立てられた複合体モデルの初期の立体構造（第１２図）と精密化された結果（第１３図）である。
トリプシンの活性部位であるＨｉｓ５７、Ａｓｐ１０２、オキシアニオンホールは、ＭＣＳＳ計算前の初期立体構造（第１２図）とＭＣＳＳ計算後の精密化された立体構造（第１３図）は主鎖、側鎖を含めてよく一致している。ＢＰＴＩのＬｙｓ１５主鎖も、そのカルボニル酸素がオキシアニオンホールのＧｌｙ１９３とＳｅｒ１９５ベプチドＮＨ基と２本の水素結合で結ばれているため、ＭＣＳＳの計算前後でよく一致している。一方ＢＰＴＩのＬｙｓ１５側鎖の方向は、ＭＣＳＳ計算前はトリプシンの活性ポケットに入っていないが、ＭＣＳＳ計算で立体構造を精密化することによりその活性ポケットに入り込み、トリプシン−ＢＰＴＩ複合体のＸ線結晶解析によく一致するようになる。
このことは、目的タンパク質の基準振動モードを含む複数のモデル立体構造を用いること、それらにドッキングして得られる目的タンパク質−リガンド複合体の初期立体構造をＭＣＳＳ計算によりシミュレーションする手法が、目的とするタンパク質−リガンド複合体の立体構造の構築に有用であることを示している。
実施例３トリプシン、トリプシン・インヒビターそれぞれの結合部位の特定
前記ステップＩＩＩ−１０〜ＩＩＩ−３０で詳述した方法に従って、次の手順でトリプシンおよびＢＰＴＩの結合部位をそれぞれ特定し、それら部位を複合体のＸ線結晶解析データと比較検討した。本例では、タンパク質−リガンド複合体Ｘ線結晶解析が既知である牛膵臓由来のβ−Ｔｒｙｐｓｉｎ（トリプシン）とトリプシン・インヒビター（ＢＰＴＩ）の系を用いた。ここではトリプシンが受容体タンパク質（目的タンパク質）、ＢＰＴＩがリガンドであるが、ＢＰＴＩもタンパク質であるので、タンパク質側だけでなく、リガンド側の結合部位の特定も行った。用いたトリプシンおよびトリプシン・インヒビター（ＢＰＴＩ）アミノ酸配列は、それぞれＳＥＱＩＤＮｏ．３およびＳＥＱＩＤＮｏ．４に示した通りである。
トリプシン−ＢＰＴＩ複合体の立体構造座標は、ＰｒｏｔｅｉｎＤａｔａＢａｎｋ（ＰＤＢ）；ｈｔｔｐ：／／ｗｗｗ．ｒｃｓｂ．ｏｒｇ／ｐｄｂ／より２ＰＴＣを得た。２ＰＴＣのトリプシン−ＢＰＴＩ複合体のＸ線結晶解析の立体構造を第１４図に示す。
タンパク質ならびにリガンドの結合部位の検索には、ＤＥＬ社製パーソナルコンピュータ（機種：ＤｉｍｅｎｓｉｏｎＸＰＳＢ８６６、ＣＰＵ：ＰｅｎｔｉｎｕｍＩＩＩ８６４ＭＨｚ、ＯＳ：ＲｅｄＨａｔＬｉｎｕｘ６．２Ｊ、メモリ：５１２Ｍｂｙｔｅｓ）を用いた。
トリプシンとＢＰＴＩの立体構造座標はそれぞれ別に扱い、ヘテロ原子に水素原子を発生させたのち、周囲に水溶媒を発生した。次にトリプシンとＢＰＴＩの中でＭＳＡＳが３０％以上のアミノ酸残基が形成する表面より３．５Å以内の水分子をベンゼン分子と置換した。その際ベンゼン同士が１．５Å以内になるときは水分子のベンゼンへの置換は行わなかった。そしてベンゼンへの置換が終了した時点で水分子は１回消去した。ベンゼン分子を含むトリプシンとＢＰＴＩの立体構造座標はそれら周囲に水分子を満たした周期ボックスを発生させたのち、水分子の周期境界条件のもとａｐｒｉｃｏｔプログラムによる経験的分子エネルギー計算を実行した。これらエネルギー計算の内訳は最初に１，０００ステップの分子力学計算よる構造の最適化、続いて１ｆｓを１ステップとする３００°Ｋ、１０ｐｓの分子動力学計算によるベンゼン分子の挙動探索である。分子動力学計算ではタンパク質の立体構造が大きく崩れないように全アミノ酸残基のＣα原子に式（２７）によるＵｘｙｚ＝１０．０ｋｃａｌ／ｍｏｌ／Å^２の拘束条件を加えた。
これら経験的分子エネルギー計算の終了した時点で、トリプシン、ＢＰＴＩともに周期ボックス内の水分子を消去し、分子動力学計算１０ｐｓ後のトリプシンとベンゼンの原子座標およびＢＰＴＩとベンゼンの原子座標をＰＤＢフォーマットで得た。それらからトリプシンならびにＢＰＴＩを除いたベンゼンの分布について閾値を６Åとしたクラスター解析をそれぞれ行った。トリプシンとＢＰＴＩ周囲にそれぞれ置かれた９４個と４０個のベンゼン分子のうち、一番大きなクラスターはそれぞれ２９個、１１個であった。トリプシンとＢＰＴＩ周囲のベンゼン分子の分布を、トリプシンとＢＰＴＩとともに第１５図と第１６図にそれぞれ示す。
これらの図は、第１４図と同じ方向から見たものである。図中、黒線の六角形が一番大きなベンゼンクラスターである。
第１４図〜第１６図より、トリプシンとＢＰＴＩ周囲の一番大きなベンゼンクラスター同士は方向的によく一致していることが分かる。すなわちタンパク質の疎水性残基の周囲にベンゼン分子を配置し、水溶媒中での分子動力学計算を行い、クラスター解析による大きなベンゼンクラスター分布を探索することにより、タンパク質のリガンドへの結合部位候補を特定できることが分かる。またグラフィックス上でこれらのクラスター同士を重ねるようにタンパク質とリガンドをドッキングさせると、タンパク質−リガンド複合体の初期立体配置をラフに予測できると考えられる。この初期立体配置は手動あるいは分子設計ソフトで調整することにより、タンパク質−リガンド複合体の立体配置の有力な候補の１つになる。
産業上の利用可能性
上記のとおり、本発明の方法は、従来の方法と比べて、より真に近いタンパク質の構造、特にリガンドと結合する近傍を精度良く構築しうる方法である。したがって、本発明の方法は医農薬分子の設計等に極めて有用である。
即ち、本発明の誘導適合を含めた立体構造の構築方法は、目的タンパク質のモデル立体構造による基準振動解析から得られる複数の座標データを用いるものであり、分子振動を考慮した平均のモデル立体構造が精度よく構築できる。とくに目的タンパク質−リガンド複合体の立体構造を予測する場合には、それに重要な誘導適合（ｉｎｄｕｃｅｄｆｉｔ）を含められるので、それを考慮した精密な複合体のモデル立体構造を構築できる。また複数の受容体タンパク質の立体構造を１つのリガンドのそれで構造最適化させるＭｕｌｔｉｐｌｅＣｏｐｙＳｉｍｕｌｔａｎｅｏｕｓＳｅａｒｃｈ（ＭＣＳＳ）法でタンパク質−リガンド複合体の立体構造をシミュレートすることにより、経時的に平均化された複合体の立体構造が得られる。
また、本発明のタンパク質−リガンド複合体の立体構造構築方法は、ＭＣＳＳ計算後に、目的タンパク質−リガンド複合体モデルにおける受容体側の原子座標のばらつきを調べるものであり、活性に重要なサイトは原子座標のばらつきが比較的小さく、その他のサイトはそのばらつきが大きいことを利用して、新たなリガンドをデザインすることができ、医農薬分子設計において、有効に利用することができる。
本発明を詳細にまた特定の実施態様を参照して説明したが、本発明の精神と範囲を逸脱することなく様々な変更や修正を加えることができることは当業者にとって明らかである。
本出願は、２００１年１月１９日の日本特許出願（特願２００１−０１１７８３号）に基づくものであり、その内容はここに参照として取り込まれる。また、本明細書にて引用した文献の内容もここに参照として取り込まれる。
【配列表】

【図面の簡単な説明】
第１図は、本発明の誘導適合を含めたタンパク質立体構造構築法の一例を示すフローチャートである。
第２図は、ステップＩ−４１のＣα原子座標の構築方法を示す図である。アライメントの一致部分は参照タンパク質から取得し、無い部分はＮ，Ｃ両端それぞれ重なった２残基の重ね合わせのｒｍｓｄが最小のものをデータベースから取得する。
第３図は、ローカルスペースホモロジー（ＬＳＨ）を示す図である。図中のＴ残基に関する計算では、網をかけた（灰色の）残基が考慮される。図中下のアライメントにおける四角で囲った部分が考慮される残基ペアであり、＊のマークがあるところの比率がＬＳＨである。この場合ＬＳＨは５６．２％である。
第４図は、ＬＳＨと構造保存部位（ＳＣＲｓ）にある比率との関係を示す図である。ＬＳＨは目的タンパク質と参照タンパク質とのＣα原子の重ね合わせから計算され、ＳＣＲｓにある比率は目的タンパク質の全残基数に対するＳＣＲｓ中の残基数である。
第５図は、本発明のタンパク質−リガンド複合体の立体構造構築法の一例を示すフローチャートである。
第６図は、本発明のリガンド結合部位の特定方法、該方法で特定された結合部位を用いるタンパク質−リガンド複合体の立体構造構築法の一例を示すフローチャートである。
第７図は、本発明の誘導適合を含めたタンパク質の立体構造構築方法の実施例の一例を示すフローチャートである。
第８図は、１Ｆ８８（ロドプシン）を参照タンパク質として得られたＱＲＨＵＢ２（β２アドレナリンレセプター）のアライメントを示す図である。図中、ＱＲＨＵＢ２及び１Ｆ８８の右側の数字は、各々のタンパク質のアミノ酸配列においてアライメントの対象となったアミノ酸数である。また、上段の配列はＱＲＨＵＢ２（β２アドレナリンレセプター）を示し、下段の配列は１Ｆ８８（ロドプシン）を示す。各タンパク質のアミノ酸配列は１文字記号で示す。
第９図は、最低固有値４．４７ｃｍ^−１のＭ^Ｖ（＝２６．４）倍したゆらぎと換算した温度因子を示す図である。実線はＰＤＢＩＤ：１Ｆ８８のＡ鎖とＢ鎖平均の温度因子を換算したＣα原子のゆらぎであり、点線は基準振動解析法から得られた４．４７ｃｍ^−１のＣα原子位置ゆらぎをＭ^Ｖ（＝２６．４）倍したものである。
第１０図は、目的タンパク質と±２×Ｍ^Ｖ（±２×２６．４）倍した誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型参照タンパク質から構築された誘導適合（ｉｎｄｕｃｅｄｆｉｔ）型目的タンパク質の立体構造の一部を示すディスプレイのプリントアウトの写真である。中央の構造が非誘導適合（ｎｏｉｎｄｕｃｅｄｆｉｔ）型目的タンパク質である。
第１１図は、ＭＣＳＳ計算後のトリプシン−ＢＰＴＩ複合体系のトリプシンの立体構造を示すディスプレイのプリントアウトの写真である。
第１２図は、ＭＣＳＳ計算前のトリプシン−ＢＰＴＩ複合体の初期立体構造を示すディスプレイのプリントアウトの写真である。この図では、トリプシン−ＢＰＴＩ複合体の活性部位に当たる、トリプシン側ではＨｉｓ５７、Ａｓｐ１０２、オキシアニオンホール（Ｇｌｙ１９３−Ａｓｐ１９４−Ｓｅｒ１９５）を、ＢＰＴＩ側ではＬｙｓ１５だけを抜き出して表示してある。図中、黒色で表示されている線がトリプシン−ＢＰＴＩ複合体のＸ線結晶解析の立体構造、灰色で表示されている線が組み立てられた複合体モデルの初期の立体構造である。
第１３図は、ＭＣＳＳ計算後のトリプシン−ＢＰＴＩ複合体の立体構造を示すディスプレイのプリントアウトの写真である。この図では、トリプシン−ＢＰＴＩ複合体の活性部位に当たる、トリプシン側ではＨｉｓ５７、Ａｓｐ１０２、オキシアニオンホール（Ｇｌｙ１９３−Ａｓｐ１９４−Ｓｅｒ１９５）を、ＢＰＴＩ側ではＬｙｓ１５だけを抜き出して表示してある。図中、黒色で表示されている線がトリプシン−ＢＰＴＩ複合体のＸ線結晶解析の立体構造であり、灰色で表示されている線が組み立てられた複合体モデルの精密化された立体構造である。
第１４図は、トリプシン−ＢＰＴＩ複合体のＸ線結晶解析の立体構造座標を示すディスプレイのプリントアウトの写真である。
第１５図は、トリプシン周囲のベンゼン分子の分布を示すディスプレイのプリントアウトの写真である。図中、黒線の六角形が一番大きなベンゼンクラスターである。
第１６図は、ＢＰＴＩ周囲のベンゼン分子の分布を示すディスプレイのプリントアウトの写真である。図中、黒線の六角形が一番大きなベンゼンクラスターである。

Claims

コンピュータを用いて、参照タンパク質と目的タンパク質とのアライメントを導き出し、該アライメントおよび上記参照タンパク質の立体構造情報に基づいて目的タンパク質の立体構造を構築する方法において、
上記コンピュータは、ＣＰＵと記憶手段とを少なくとも備え、
上記記憶手段は、上記参照タンパク質の立体構造の原子座標を記述した立体構造情報を少なくとも記憶し、
上記ＣＰＵにおいて実行される、
上記記憶手段に記憶された上記参照タンパク質の立体構造情報とその原子座標を基準振動解析法から得られる固有ベクトル方向に変位させた複数の誘導適合型立体構造情報を上記参照タンパク質の立体構造として目的タンパク質の複数の立体構造セットを作成して上記記憶手段に記憶する立体構造構築ステップ、
を含み、
上記誘導適合型立体構造情報は、上記原子座標につき上記基準振動解析法から得られる固有値および固有ベクトルを用いて所定の温度および上記固有値での C α原子の第１の位置ゆらぎを計算し、各 C α原子について温度因子を位置ゆらぎに換算した第２の位置ゆらぎを計算し、上記第２の位置ゆらぎと上記基準振動解析法で求めた上記第１の位置ゆらぎとの比を計算し全 C α原子の平均の比を求め、下記の数式１または２を用いて計算された原子座標である、
ことを特徴とする誘導適合を含めたタンパク質の立体構造構築方法。
上記ＣＰＵにおいて実行される上記立体構造構築ステップは、
(i)アミノ酸中のCα原子について上記記憶手段に記憶された上記参照タンパク質の立体構造情報から座標を取得し、目的関数を最小化するようにCα原子座標を最適化し、
(ii)最適化されたCαの原子座標に主鎖の他の原子を付加して目的関数を最小化するように主鎖の原子座標を最適化し、
(iii)最適化された主鎖の原子座標に側鎖の他の原子を付加し目的関数を最小化するように最適化して上記記憶手段に記憶する、
各ステップを含むことを特徴とする請求項１に記載の方法。
コンピュータを用いて、タンパク質−リガンド複合体の立体構造を構築する方法において、
上記コンピュータは、ＣＰＵと記憶手段とを少なくとも備え、
上記記憶手段は、参照タンパク質の立体構造の原子座標を記述した参照タンパク質立体構造情報と、リガンドの立体構造の原子座標を記述したリガンド立体構造情報と、を少なくとも記憶し、
上記ＣＰＵにおいて実行される、
(i)上記記憶手段に記憶された請求項１または２に記載の方法により作成された目的タンパク質の複数の立体構造情報と上記リガンド立体構造情報とのドッキング処理を行い、
(ii)上記記憶手段に記憶された上記目的タンパク質の１つの立体構造情報と上記リガンド立体構造情報との構造の経験的分子エネルギー計算を、上記目的タンパク質の立体構造情報の数だけ行い、その際、
(iii)目的タンパク質側は、上記目的タンパク質の複数の立体構造情報のそれぞれのポテンシャルエネルギー勾配に応じて原子座標を動かし、
(iv)リガンド側は、複数個算出されたポテンシャルエネルギー勾配を平均化した方向に上記リガンド立体構造情報の原子座標を動かして、
(v)上記目的タンパク質の複数の立体構造情報に基づく上記リガンド立体構造情報を求め、上記記憶手段に記憶する、
各ステップを含むことを特徴とするタンパク質−リガンド複合体の立体構造構築方法。
上記ＣＰＵにおいて実行される上記経験的分子エネルギー計算において、上記目的タンパク質の初期Cα原子座標の位置をオプションHarmonic関数として加えるか、あるいは上記目的タンパク質の主鎖のねじれ角を拘束するポテンシャル関数を加えることを特徴とする請求項３に記載の方法。