JP2000507940A - 共通の機能特性を有する化学構造をコンピューターによって設計する方法 - Google Patents

共通の機能特性を有する化学構造をコンピューターによって設計する方法

Info

Publication number
JP2000507940A
JP2000507940A JP09533880A JP53388097A JP2000507940A JP 2000507940 A JP2000507940 A JP 2000507940A JP 09533880 A JP09533880 A JP 09533880A JP 53388097 A JP53388097 A JP 53388097A JP 2000507940 A JP2000507940 A JP 2000507940A
Authority
JP
Japan
Prior art keywords
affinity
receptor
genotype
maximum
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP09533880A
Other languages
English (en)
Inventor
シュミット,ジョナサン,エム.
Original Assignee
ユニバーシティー オブ グエルフ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユニバーシティー オブ グエルフ filed Critical ユニバーシティー オブ グエルフ
Publication of JP2000507940A publication Critical patent/JP2000507940A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional [2D] or three-dimensional [3D] molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional [2D] or three-dimensional [3D] molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Computing Systems (AREA)
  • Biochemistry (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Saccharide Compounds (AREA)

Abstract

(57)【要約】 本発明は、立体配置と結合親和力との特定の組合せに基づいて共通した有用な機能特性を共有する化学構造を設計するためのコンピューターによる方法に係る。特に、本発明は、機能上生物学的受容体に類似するコンピューターでシミュレートされた受容体の製造方法を提供する。これらシミュレートされた受容体は、既知の標的分子に対して最適化された選択的親和力を示すように設計される。次いで、シミュレートされた受容体に対する選択的親和力を示す化学構造を作製し進化させる。

Description

【発明の詳細な説明】 共通の機能特性を有する化学構造を コンピューターによって設計する方法 発明の利用分野 本発明は、立体配置と結合親和力との特定の組合せに基づいて共通した有用な 機能特性を共有する化学構造を設計するためのコンピューターによる方法に係る 。特に、本発明は、機能上生物学的受容体に類似するコンピューターでシミュレ ートされた受容体の製造方法を提供する。これらシミュレートされた受容体は既 知の標的分子に対して最適化された選択的親和力を示すように設計される。次い で、シミュレートされた受容体に対する選択的親和力を示す化学構造を作製し進 化・開発させる。 発明の背景 生物学的受容体は、折り畳まれて基質結合のための三次元エンベロープ(包み 込み構造)を作製するアミノ酸またはヌクレオチドの線状ポリマーである。これ らの線状列(linear arrays)の特定の三次元配置およびエンベロープ表面上の荷 電部位の配置は、機能効率に基づく進化上の選択の結果もたらされたものである 。 生物学的受容体の選択性は、受容体と基質との間に生成する吸引力と反発力の 強さの違いに依存する。これらの力の大きさは、受容体および基質の表面におけ る荷電部位の大きさ(magnitude)と近接さに応じて部分的に変化する。 基質はその表面に存在するかまたは誘導される荷電部位の数と大きさおよびそ れらの部位の空間配置において異なるので、結合親和力は基質の構造によって変 化し得る。同じ受容体に対して類似の結合親和力をもつ基質は、その誘導され固 定された荷電部位の少なくともいくつかで共通する空間配置を共有する可能性が 高い。受容体の機能が結合親和力と 関連しているのであれば、類似の結合親和力をもつ基質もまたその効果において 機能的に類似しているであろう。この意味で、受容体は基質間の類似性を認識ま たは定量するということができる。 受容体に対する選択的な結合親和力をもつ新規な化合物または基質を同定また は発見するために分子認識において使用されている伝統的な方法は、活性のある 基質の分子的に共通なサブグラフ(subgraph)を見出だしこれを用いて新しい類似 の化合物を予想することに基づいている。この技術の欠点は、結合に対して類似 の効力を示す基質が構造的に類似しているということを前提にしている点である 。しかし、多くの場合、構造的に類似していない基質が同じ受容体に対して類似 の結合親和力を示す可能性がある。定量的構造‐活性相関(QSAR)に基づく 最近の技術は、同じ構造クラス内で新規な化合物を進化・開発することにのみ適 しており、所望の選択的親和力を示す新しい分子構造を進化・開発する点ではあ まり適していない。たとえば、ディーン(Dean,Philip M.)の「分子認識:リガ ンド‐受容体相互作用における分子類似性の測定と探索(Molecular Recognition :The Measurement and Search For Molecular Similarity in Ligand-Receptor Interaction)」、分子類似性の概念と応用(Concepts and Applications of Mole cular Similarity)、ジョンソン(Mark A.Johnson)およびマギオラ(Geral dM.M aggiora)編、第211〜238頁(1990年)を参照されたい。 最近の努力は、原子と官能基が連結されている疑似受容体(pseudoreceptors) または連結されてない原子または官能基の組からなるミニ受容体(minireceptors )の原子モデルの構築に向けられている[スナイダー(Snyder,J.P.)、(199 3年)、ドラッグデザインにおける三次元QSAR:理論、方法および応用(3D QSAR in DrugDesign:Theory,Methods and Applications)、クビニイ(Kubinyi, H.)編、Escom,Leiden.、第336頁]。関連する方法には、既知の標的リガン ドをたくさんのモデル原子で囲み、リガンドと受容体モデルとの間に発生する分 子間力を計算することが含まれる。このようなモデルでは、計算された結合エネ ルギーと生物学的活性との間に高い相関があるが[ウェルターズ(Walters,D.E. )およびヒンズ(Hinds,R.M.)、(1994年)、J.Medic.Chem.,37:2527]、 この受容体モデルに対して選択的親和力を示す新規な化学構造を製造することが できる程までには開発されていない。 したがって、立体配置と結合親和力との特定の組合せに基づいて有用な機能特 性を有する新しい化学構造の設計の基礎として使用することができる共有する特 性を説明するのに必要充分な微細ではない(non-trivial)類似性をいろいろな化 学構造間で同定するための方法を提供することは極めて有利であろう。 発明の概要 本発明は、異なる化学構造が共有する機能特性を説明するのに必要かつ充分で あるそれらの構造間の微細でない類似性を同定する方法を提供する。本プロセス はまた、類似の機能特性を示す新規な化学構造を作製する方法も提供する。 本発明の根幹をなす基本的な概念は、立体配置と結合親和力との特定の組合せ に基づいて有用な機能特性をもつ化学構造を設計または発見するためにコンピュ ーターによる二段階プロセスを用いることである。このプロセスの最初の工程で は、抗体形成のアルゴリズムによるエミュレーシヨョン(emulation)を用いて、 選択された標的基質に対して最適化された結合親和力をもつ生物学的受容体に類 似するコンピューターで作製したシミュレートされた受容体の集団を作製するこ とである。本プロセスの第二段階では、シミュレートされたまたは仮想上(virtu al)の受容体を用いて、実在する化合物の結合親和力を評価するか、または最適 な結合を示す新規な基質を設計する。 本明細書に記載した方法は、結合選択性を最適化する進化プロセス(evolution ary process)を含む、生物学的受容体の選択された特徴と類似するシミュレート された受容体を提供する。本方法により作製される疑似体またはシミュレートさ れた受容体は、分子間の特定の類似性を認識 するのに使用することができる。抗体およびその他の生物学的受容体と同様に、 本発明により作製されるシミュレートされた受容体は特徴抽出機構(feature ext raction mechanism)である。すなわち、標的基質の共通または類似の構造的特徴 を同定または認識するのに使用することができる。受容体と標的基質との間の結 合親和力は特徴認識のための基準(metric)として使用される。標的基質は、特定 のシミュレートされた受容体との結合親和力に基づいて定量的に分類することが できる。特定の構造的特徴を共有する化合物は同じ仮想上の受容体に対して類似 の結合親和力も共有する。 生物学的受容体と基質との間の結合親和力は、隣接する受容体と基質の表面間 の立体適合の良好度、それら2つの表面の非極性領域の間の水の排除、および隣 接する荷電部位間で発生する静電力の強さによって決定される。場合によっては 、基質と受容体との間で共有結合の形成が結合親和力に寄与することもある。こ のプロセスによって作製されるシミュレートされた受容体は、それらの生物学的 相手と結合メカニズムが類似している。受容体と標的の表面間の平均的近似性、 および両表面の荷電部位間で発生した静電引力の強さを用いて結合親和力の測定 値が計算される。得られる結合親和力の値を用いて基質分子の類似性を評価する 。 結合親和力は全体として決定することができる。すなわち、結合親和力は、基 質表面全体とその基質を完全に取り囲む密接した受容体または受容体エンベロー プとの間の相互作用に依存し得る。この場合、基質間の全体的類似性の解析は有 用な定量的構造‐活性相関を確立するための基礎として適している。しかし、す べてではないがほとんどの生物学的系では、親和力は全体というよりはむしろ局 部的に決定される。基質分子と生物学的受容体との間の相互作用は通常、受容体 の孤立した断片と基質表面との間の接触に限定されている。この状況では、結合 親和力の生成に直接関与するのは基質の断片だけであるので、基質間の全体的類 似性の解析は構造‐活性相関を確立する方法として不適当である。 局部的に類似の構造は類似の構造断片を類似の相対位置および配向で 共有している。局部的に類似の構造は必ずしも全体として類似してはいない。分 子特性のサンプリングは、全体的類似性の評価を含む全サンプリング戦略、局部 的類似性の評価を含む断片サンプリング戦略、ならびに局部的および全体的な類 似性の評価を含む多数断片サンプリング戦略によって達成し得る。 局部的類似性の解析は類似の構造および電荷分布に対して基質の別々の領域を サンプリングすることに基づく。生物学的受容体の場合、局在化されたサンプリ ングは、隣接する基質と受容体の表面の不規則性または凹凸に起因する。密接し て対向した表面間の相互作用は、結合親和力を決定する際に、より離れた領域間 の相互作用より支配的である。隣接する表面の近似性はまた疎水性結合の強さも 決定する。本発明方法によって作製されるシミュレートされた有効な受容体では 、化合物間の機能的に関連する類似性を評価するために、標的基質(分子)の別 々の局部的サンプリングを使用しなければならない。 局部的類似性の解析は、次の2つのファクターのため複雑になっている。すな わち、1)特定の結合親和力に対して必要充分な関連する断片の数、位置および 種類(identity)が一般に、基質の化学構造からの簡単な推測によって確立するこ とができないこと、そして、2)サンプリングした断片の位置と配向が分子全体 の基本構造に依存すること、である。 化学基質間の類似性を分類することができるシミュレートされた受容体の作製 に関する本発明方法の一部は、本質的に、空間中の関連する位置において該基質 の関連する断片のサンプルとなる受容体の探索である。最適化のプロセスはシミ ュレートされた受容体の次の4つの特徴に基づく。1)汎用性、すなわち、受容 体は1つより多くの基質と結合することができる。2)特異性、すなわち、受容 体の結合親和力は基質構造と共に変化する。3)効率性(parsimony)、すなわち 、受容体は局部構造特徴の最小の組に基づいて基質を区別する。4)変異性、す なわち、受容体の構造の変化によって特定の基質に対するその結合親和力が変化 し得る。文字列(character string)によって表される線状の遺伝子型の形 態で受容体表現型がコードされると、シミュレートされた受容体の構造特性の変 異、組換えおよび遺伝のプロセスが容易になる。 これらの基本的評価基準を満たすシミュレートされた受容体は、進化選択育種 法(evolutionary selective breeding strategies)を用いて、局部的に類似する 基質に対する特異的結合親和力を得るように最適化することができる。これを達 成するには、受容体の空間配置および荷電部位分布を、変化または変異を受ける ことができる遺伝可能な形態でコードする。生物学的受容体と同様に、本方法に よって作製されるシミュレートされた受容体は三次元の排除空間を規定する。そ のような三次元空間は、充分な長さと湾曲の一次元の経路によって任意の分解度 で輪郭を描くことができる。アミノ酸の線状ポリマーから形成されるタンパク質 はそのような構造の一例である。同様に、シミュレートされた受容体の三次元構 造は転回指示(turning instructions)のひとつの線形列としてコードすることが できる。この受容体のコードされた一次元形態はその遺伝子型を構成する。結合 親和力を評価するために使用する解読された形態はその表現型を構成する。最適 化のプロセス中に、受容体遺伝子型に変化(変異)を施す。次に、これらの変化 が表現型の結合親和力に対して及ぼす影響を評価する。望ましい結合親和力を有 する表現型を生成する遺伝子型は、変異および選択過程の反復により、表現型の 選択した最適化度が達成されるまで、さらなる変化のために保持される。最適な 結合特性を有するシミュレートされた受容体の集団を作製するには、古典的な遺 伝子アルゴリズムを含む各種の進化戦略(evolutionary strategies)を使用でき る。 次いで、この方法によって作製した受容体を用いて、シミュレートされた受容 体を製造する際に選択基準として用いた分子標的種の特定の有用な性質を共有す る新規な化学構造(化合物)を作製または同定する。受容体との相互作用を選択 基準として使用して、受容体と最適に適合するような新規な化学構造を導く。こ れらの構造は受容体選択性に対する必要充分要件を満たさなければならないので 、元の分子標的の生物学的 活性と類似の活性ももつと思われる。増大した選択性を有するシミュレートされ た受容体の集団はまた、既存の化学構造からこれらの有用な特性を共有し得る高 い親和力をもつ化合物をスクリーニングするのにも使用できる。また同じプロセ スを用いて、選択された毒物学的または免疫学的性質を有する化合物をスクリー ニングすることもできる。 本発明のひとつの態様では、予め選択された機能特性を有する化学構造を設計 するためのコンピューターに基づく方法が提供される。この方法は、 (a)線形文字配列(linear character sequence)にコードされているシミュ レートされた受容体表現型の物理的モデルを製造し、少なくともひとつの定量可 能な機能特性を共有する一組の標的分子を用意し、 (b)各標的分子に対して、 (i)有効な親和力計算を用いて、該受容体と該標的分子との間の親和力を 複数の配向の各々で計算し、 (ii)計算された親和力を合計することによって合計親和力を計算し、 (iii)最大親和力を同定し、 (c)計算された合計親和力および最大親和力を用いて、 (i)該最大親和力と該定量可能な機能特性との間の最大親和力相関係数を 計算し、 (ii)該合計親和力と該定量可能な機能特性との間の合計親和力相関係数を 計算し、 (d)該最大相関係数および該合計相関係数を用いて適合係数(a fitness coe fficient)を計算し、 (e)受容体の構造を変化させ、予め選択された適合係数を有する受容体の集 団が得られるまで工程(b)〜(d)を繰返し、 (f)分子線形文字配列にコードされた化学構造の物理的モデルを用意し、前 記有効な親和力計算値を用いて複数の配向にある各受容体と該化学構造との間の 親和力を計算し、計算された親和力を用いて親和力適 合性スコア(an affinity fitness score)を計算し、 (g)該化学構造を変化させて化学構造の変形体を生成させ、工程(f)を繰 返し、 (h)その親和力スコアが予め選択した親和カスコアに近い化学構造の変形体 を保持し、かつさらに変化させる、 各工程を含んでなる。 本発明の別の態様では、予め選択した機能特性に関して化学構造をスクリーニ ングする方法が提供される。この方法は、 a)空間占有および電荷をコードする受容体線形文字配列を作製することによ ってシミュレートされた受容体遺伝子型を生成させ、 b)該遺伝子型を解読して受容体表現型を生成させ、選択された機能特性を示 す少なくひとつの標的分子を提供し、有効な親和力計算を用いて複数の配向で該 受容体と各標的分子との間の親和力を計算し、各標的分子と受容体との間の合計 親和力および最大親和力を計算し、該標的分子の該機能特性に対する合計親和力 の合計親和力相関係数および該機能特性に対する最大親和力の最大親和力相関係 数を計算し、該合計親和力相関係数および該最大親和力相関係数に依存する適合 係数を計算し、 c)受容体遺伝子型を変異させ、かつ工程b)を繰返し、予め選択された適合 係数をもつ受容体の集団が得られるまで、増大した適合係数を示す受容体を保持 し、かつ変異させ、そして d)該有効な親和力計算を用いて複数の配向でスクリーニングしようとする化 学構造と各受容体との間の親和力を計算し、親和力適合スコアを計算する(但し 、これは、化合物と各受容体との間の合計親和力および最大親和力を計算し、該 合計親和力および該最大親和力の少なくともひとつを該少なくともひとつの標的 と該受容体の集団との間の合計親和力および最大親和力と比較することを含み、 これによりこの比較が、該少なくともひとつの標的分子に対する該化学構造の機 能活性のレベルを示すことになる)、 各工程を含んでなる。 本発明のもうひとつ別の態様では、類似の機能特性をもつ化合物に対して選択 的親和力を示す生物学的受容体に類似するシミュレートされた受容体を設計する 方法が提供される。この方法は、 a)空間占有および電荷をコードする受容体線形文字配列を作製することによ ってシミュレートされた受容体遺伝子型を生成し、 b)該遺伝子型を解読して受容体表現型を生成させ、類似の機能特性を共有す る一組の標的分子を用意し、有効な親和力計算を用いて複数の配向で受容体と各 標的分子との間の親和力を計算し、各標的分子と受容体との間の合計親和力およ び最大親和力を計算し、各標的分子の機能特性に対する合計親和力の合計親和力 相関係数および各標的分子の該機能特性に対する最大親和力の最大親和力相関係 数を計算し、各標的分子に対する該合計親和力相関係数および該最大親和力相関 係数に依存する適合係数を計算し、そして c)該遺伝子型を変異させ、かつ工程b)を繰返し、予め選択された適合係数 をもつ受容体の集団が得られるまで、増大した適合係数を示す受容体を保持し、 かつ変異させる、 各工程を含んでなる。 本発明の別の態様では、予め選択された機能特性を有する化学構造を設計する ためのコンピューターに基づく方法が提供される。この方法は、 (a)少なくともひとつの定量可能な機能特性を共有する一組の標的分子およ び受容体の物理的モデルを用意し、 (b)各標的分子に対して、 (i)有効な親和力計算を用いて、該受容体と該標的分子との間の親和力を 複数の配向の各々で計算し、 (ii)計算された親和力を合計することによって合計親和力を計算し、 (iii)最大親和力を同定し、 (c)計算された合計親和力および最大親和力を用いて、 (i)該最大親和力と該定量可能な機能特性との間の最大親和力相関係数を 計算し、 (ii)該合計親和力と該定量可能な機能特性との間の合計親和力相関係数を 計算し、 (d)該最大相関係数および該合計相関係数を用いて適合係数を計算し、 (e)予め選択された適合係数を有する受容体の集団が得られるまで、該受容 体の構造を変化させ、かつ工程(b)〜(d)を繰返し、 (f)化学構造の物理的モデルを用意し、該有効な親和力計算を用いて複数の 配向にある各受容体と該化学構造との間の親和力を計算し、計算された親和力を 用いて親和力適合スコアを計算し、 (g)化学構造を変化させて該化学構造の変形体を生成させ、工程(f)を繰 返し、 (h)その親和力スコアが予め選択した親和力スコアに近い化学構造の変形体 を保持し、かつさらに変化させる 本発明のさらに別の態様では、原子要素を含む化学構造をコードする方法であ って、該化学構造の各原子に対する空間占有と電荷をコードする線形文字配列を 用意することを含んでなる該方法が提供される。 図面の簡単な説明 以下、単なる例示として添付の図面を参照しつつ本発明の方法を説明する。 図1は、本発明の対応する表現型形成部分を生成するための遺伝子型コードの 作製と翻訳との関係を示すフローチャートである。 図2は、本発明の点突然変異形成部分を用いて一組の基質に選択的に結合させ るための受容体の最適化における工程の概略を示すフローチャートである。 図3は、一組の化学基質に対して最適化された選択的結合親和力をもつ関連す る受容体の集団を生成し、これらの最適化された受容体を用い て共通の機能特性をもつ一組の新規な化学基質を生成するプロセスにおける工程 の概略を示すフローチャートである。 図4aは、リガンド作製の例に関連する実施例で使用したいくつかの化合物を 示す。 図4bは、リガンド作製の実施例で本発明の方法によって作製されたリガンド 1.1〜1.4を示すものであり、各リガンドは少なくともひとつの配向をもっ ており、構造上ベンズアルデヒドに類似している。 図4cは、蚊を寄せ付けない効力を示す化学構造の設計に関連するリガンド作 製の実施例で本発明の方法によって作製されたリガンド2.1〜2.4を示す。 好ましい態様の説明 本方法は2つの部分に分けることができる。すなわち、(A)共有される機能 特性をもつ化合物に対して選択的な親和力を有するシミュレートされた受容体の 集団の進化・開発(evolution)、および(B)共有される機能特性を有する新規 な化学構造の作製である。パート(A)は、1)受容体の遺伝子型および表現型 の作製、2)該受容体に対する既知の化学構造の提示、4)該化学構造に対する 該受容体の親和力の評価、5)該化学構造に対する該受容体の選択性の評価、6 )該化学構造に対して最適化された選択的親和力をもつ一群の関連受容体の確率 的な進化・開発、毒物学的および薬理学的活性に関する化学基質のスクリーニン グ、ならびに最適化された受容体を用いた、該受容体に対して選択的な結合親和 力をもつ新規な化学構造の設計を含むいくつかの工程からなっている。 本発明の最良の実施態様に関する以下の記載では、分子および原子の半径、分 極率、有効双極子値、ならびに遷移状態およびその他のファクターに関する各種 の表を参照する。これらの値は本明細書の末尾の表I〜Vに挙げる。プロセス計 算の非限定例を示すフローチャートは本明細書末尾のモジュール1〜14に添付 する。 パートA:共通の機能特性を有する標的分子に対する選択的親和力を示すシミュ レートされた受容体の集団の開発 (1)遺伝子型コード及び受容体表現型生成 シミュレートされた受容体遺伝子型及び表現型の両方が計算の目的である。シ ミュレートされた受容体の表現型は、直径が長さにおいて原子状水素のファンデ ルワールス半径(≒110pm)に等しい球形のサブユニットの折り畳まれた非分岐 のポリマーからなる。サブユニットは、それらの主軸の各々での球の切片に対応 する6つの点の任意の2つにおいて互いに結合することができる。この実例にお いては、サブユニットの間の結合は伸びることができず、あるいは転回すること ができず、2つの結合されたサブユニットの中心はそれらの側面の長さに等しい 距離(すなわち1水素半径)だけ常に隔てられている。2つのサブユニットがそ れらの共通の隣接するものの対抗する面に結合されていない場合に転回が起こる 。左、右、上、下の4種類の直角の転回が可能である。転回は主軸の1つに平行 に行われなければならない。計算を簡単にするため、転回によりポリマー中の他 のサブユニットと交差する場合は、サブユニットが他のサブユニットと同じ空間 を占めることを許容する。 完全なシミュレートされた受容体は、一以上の別々のポリマーからなる。多重 のポリマーからなる受容体の場合、個々のポリマーは空間の異なる点から始まる ことができる。計算を簡単にするため、この実例においては、単一の受容体を構 成する全てのポリマーは同じ長さを有するように選択する(=サブユニットの数) 。この限定は機能性のための要件ではなく、長さの異なるポリマーのセットは特 定の系をモデル化するために有用であり得る。 各ポリマーの構造は、転回の指示の連続的なセットとしてコードされる。この 指示は、各ポリマーにおける最初のサブユニットの当初の配向に基づいた内部参 照フレームに対する個々の転回を指定する。 この実例においては受容体及び基質の水和を明確に処理せず、その代わりに、 結合部位に存在する水分子はすべて永久的に受容体表面に結合し、その構造の一 体的な部分を構成すると仮定する。これは任意の近似であり、当業者であればよ り正確な処理に置き換えることができることを理解するであろう(例えば、VanOs s, 1995,Molecular Immunology 32:199-211参照)。 図1に示すように、コード作成モジュールは、文字のランダムな列を生成する 。各文字は、転回の指示を表すか、仮想の受容体を構成する三次元形態における 点の荷電特性あるいは反応性を決定する。デカルト(直交)座標枠に基づく受容 体の三次元形態を表す列を生成するためには、最小で5つの異なる文字が必要で ある。その他の枠組み、例えば四面体の構造も、転回の指示の異なるセットを使 用して構築することができる。文字は、三次元空間における仮想受容体構造の現 在のパスに対して定義される転回の指示を表す(すなわち、指示は仮想受容体の 内部参照フレームを引用するものであり、任意の外部参照フレームを引用するも のではない)。 転回の指示は、現在の方向とポリマーの配向に対して与えられる。左、右、上 、及び下への転回だけが許容される。転回が起こらない場合は、ポリマーは終結 するか、その現在の方向に連続することができる。 直交系については、最小の文字セットは、C1=転回なし、C2=右転回、C3=左転 回、C4=上転回、及びC5=下転回である。指示を組合せて対角線方向の転回、例え ばA1,2=C1C2、A2,1=C2C1等を形成し得ることは理解されるであろう。異なる荷電 あるいは反応性の状態を決定する異なる文字の数には制限がなく、実験的な確認 により調節することができる。コードは、長さ(文字の数)及び系列中で特定の 文字が現れる頻度の両方において異なってもよい。遺伝子型作成の例 遺伝子型コード作成と表現型発現の以下の例は、当業者によれば例示のためだ けのものであることが理解されるであろう。この例では以下の規則を使用する。 (1)コードを生成するために使用する文字セットは、転回の指示を示す5文字 と荷電部位を指定する2文字、すなわち、「0」=転回なし、「1」=右転回、「2 」=上転回、「3」=左転回、「4」=下転回、「5」=正に荷電した部位(転回なし )、及び「6」=負に荷電した部位(転回なし)からなる。 (2)サブユニットは帯電したもの、あるいは帯電してないものの2つの種類を 有する。全ての帯電したサブユニットは、正または負の単位電荷を有すると仮定 す る。電荷の均一な大きさは任意の規則である。 (3)受容体は15の別々のポリマーを含む。完全なコードの長さは常に15の倍数 である。各ポリマーの長さは、全コード長を15で割ったものに等しい。受容体は 異なる又は一定の長さの任意の数の別々のポリマーから構築され得ることは理解 されるであろう。 (4)以下のパラメーター、(a)全コード長(及びポリマー長)、(b)各文字がコ ード列中に存在する頻度、及び(c)文字の組合わせの発生は、ユーザーにより設 定される。モジュールIは遺伝子型コード作成のサンプルのフローチャートを示 す。受容体表現型作成の例 各遺伝子型コードは翻訳され、その対応する表現型すなわち仮想受容体の三次 元設計図を生成する。あらかじめ定義された開始点から、翻訳アルゴリズムを使 用して、受容体ポリマーを構成する連続したサブユニットの空間における位置を 記載する一連の座標トリプレットに転回の指示を変換する。各ポリマーの開始座 標は、翻訳に先立って与えなければならない。翻訳においては、連続したサブユ ニットの中心は水素原子の共有結合直径に等しい距離だけ離れていると仮定する 。 翻訳アルゴリズムは、コード列を逐次読み込み、連続した転回及び直線パス部 分を生成する。外部の座標系に対する連続した転回の解読は、転回に先立つ配列 に依存する。受容体を構成する各ポリマーについては、当初の配向は同じである と仮定する。この実例においては、翻訳アルゴリズムは表Iに示すが、これは入 力及び出力状態を示している。転回が起こらない場合は、Δx、Δy、Δzについ ての最も最近の値と新しい状態を使用して新しい座標トリプレットを計算する。 電荷部位は、直線状の(転回のない)部分として扱われる。古い状態の初期値は 、20である。 以下のパラメーターは、ユーザーが設定することができる。 a.受容体を構成する各ポリマーの開始座標。 出力は、 a.3つのベクトル(各軸について1つ:{x1,x2,x3...xn},{y1...yn},{z1...zn })、 b:三次元の2成分のマトリックス、 c.荷電部位座標の別のベクトル として記憶される。コード翻訳のサンプルプロセスをモジュール2に示す。 (2)標的生成 標的は、球形の原子からなる分子として表される。原子は、各原子種に特徴的 な固定された半径を有する剛体球であるとみなされる。標的原子と仮想受容体と の間の斥力が無限大であるとみなされる剛体球半径は、表2に示した露出ファン デルワールス半径によって概算される。表2に示したものの代わりに、ファンデ ルワールス半径の他の推定値を使用することもできる。 共有結合によって結合された2つの原子の、原子の中心の間の距離は、それら の共有結合半径の合計として表される。共有結合半径は、結合次数と原子種によ って変化する。結合半径の適した値の例を表3に示す。一次近似として、結合距 離は固定されたものと仮定する(すなわち結合振動は無視する)。結合の転回を 許容すると、同じ構造の多重の配置により転回状態を代表するサンプルをとるこ とが必要となる。仮想受容体との結合により、エネルギー的に不安定ではないよ うに配置が安定化され得るので、配置的な安定性は考慮しない。種々のエネルギ ー最小化アルゴリズムを標的リガンドの生成に使用することができる。 結合双極子モーメントにより生じる電荷は、原子の核に局在すると考えられる 。負電荷は、より大きい電気陰性度を有する原子が保持する。この実例において 使用された双極子値は表4に示す。表4に示したものの代わりに、双極子値のそ の他の推定値を使用することができる。 (3)標的提示 各標的のシミュレートされた受容体に対する親和力を、受容体の上部表面に対 する標的の複数の配向について試験する。この上部表面は翻訳アルゴリズムによ って定義される。結合親和力の評価の前に、標的と受容体を接触させなければな らない。受容体の少くとも1つのサブユニットと標的の少くとも1つの原子の中 心の間の距離がそれらの合わせたファンデルワールス半径と等しいとき、接触が 起こる。接触点における標的と受容体の相対的な位置を決定するために、標的を 受容体表面に向かってその表面に対して垂直な経路に沿って徐々に移動させ、受 容体と標的の幾何学的中心を通過させる。接触が起こるとき、標的は受容体に対 してその対立位置に達する。対立位置が達成されたときの標的原子の翻訳された 位置を使用して標的の原子と受容体のサブユニットの間の距離を計算する。これ らの距離は、静電的相互作用と近接度を計算するために使用される。 この実例においては、標的は受容体の方へ直線的に移動し、接触の時点でその 最初の配向を保持すると仮定する。代替的なアプローチとしては、標的が受容体 に接近するにつれてその配向を徐々に変化させ、接触の時点において最大の親和 力位置が得られるようにする。この方法は実施したものに機能的に類似している が、計算上はずっと複雑である。この実例においては、多重の配向をより小さい 計算労力で試験している。この実例では、受容体のx及び/またはy軸に沿った 経路の調節可能な置換を可能として、より大きい分子を収容する。この特徴は、 大きさが異なる分子を同じ受容体上で試験するときに、選択性を増強するために 必要である。 対立位置の計算に先立ち、標的の配向は、x、y及びz軸のそれぞれのまわりに6 °増加させるランダムな転回によって無作為化される。より大きい又はより小さ い転回の増加を使用してもよい。標的のこれらのランダムな配向のそれぞれは、 与えられた試験系列においてユニークなものである。最適化プロセスの信頼性は 、試験される標的の配向の数並びに評価される標的化合物の数に依存する。標的 提示のためのサンプルプロセスをモジュール3に示す。 (4)親和力の計算 近似方法 この実例は、比較的小さな計算労力で親和力の主成分を評価する、単純化され た近似に基づくものである。近似は、以下の節において説明する。しかし、より 正確な親和力値を与えるより正確な親和力計算方法を使用してもよいことは、当 業者であれば理解されるであろう。より正確な親和力値を計算するための公知の 計算パッケージを本プロセスに直接使用してもよい。 クラウンエーテルの研究により、より大きい化合物の電子密度を解明するため に小さい分子の電子密度分布を使用することができることが示されている (Bruning,H.And Feil,D.(1991)J.Comput.Chem.12:1)。電荷と双極子モー メントにより後に特徴づけられる、厳格に局在する電荷分布を定義するために Hirshfeldのストックホルダー法を使用することができる(Hirshfeld,F.L.(197 7)Theor.Chim.Acta 44:129)。結果は、分子の全電子密度分布の重複した原子 の部分への分裂であり、そのサイズは自由原子半径に関連する。 クラウンエーテルにおいて、静電的相互作用の主成分が原子の間の電荷の全体 的な移動ではなく局所的な移動により決定されることを示すことが可能である。 電荷分布は、異なる化学結合による狭い範囲の効果によって主として決定される 。特に、非近隣の原子は、原子の双極子モーメントにほとんど寄与しない。それ に加えて、原子間の電荷移動は全分子の静電場によっても影響されるが、クラウ ンエーテルについての計算によれば、電荷分布に対する影響は非常に小さいこと が示される。 計算されたストックホルダー原子の電荷と双極子モーメントを使用して静電相 互作用を解明することができる(Bruning,H.And Feil,D.(1991)J.Comput.Ch em.12:1)。ファンデルワールス半径を越えると、原子の四極子モーメントはわ ずかに貢献するのみである。原子の電荷だけを考慮に入れた静電電位の計算は非 常に貧弱な結果を与えるが、双極子モーメントを使用することにより改善された 値が得られる。 これらの考えに基づいて、本発明の方法は、標的リガンドとシミュレートされ た受容体の間、及びシミュレートされた受容体と2つの測定に基づいて設計され た化学構造の間の親和力の近似化を導入している。 1.シミュレートされた受容体の帯電したサブユニットと標的リガンド(化学構 造)の原子双極子の間に生成される静電気力の大きさ。帯電したサブユニットは 移動不可能な単位電荷を有すると仮定されるので、この力の大きさは原子双極子 の大きさに直接比例し、シミュレートされた受容体とリガンドの原子双極子との 間の距離に反比例する。 2.有意なロンドン分散力の生成のためのリガンドの非極性領域に十分に近いシ ミュレートされた受容体の非極性又は非荷電サブユニットの比率。この実例において親和力計算に使用した仮定 1.この実例によって評価される化学基質標的は、中性(すなわちイオン化しない) 分子であると仮定する。これは任意の限定であり、荷電及び非荷電標的に適用で きる実例は同じ方法を使用して開発することができる。 2.双極子モーメントは原子核に局在すると仮定する。親和力の類似した解析は 、双極子モーメントが共有結合の中心に位置すると仮定して行うことができる。 Allinghamら(1989)によると、これらの仮説は機能的に等価である。 3.仮想受容体の周囲の環境は、標的が溶質として存在する溶媒系であると仮定 する。標的は溶媒と仮想受容体とに有効に分配される。 4.親和力を計算する時点において、標的と受容体は互いの間で静止し、特定の 固定された配向にあると仮定する。 5.標的は、受容体表面上の2種類の部位、固定された荷電部位(負または正に 荷電した)及び非極性部位のみと相互に作用すると仮定する。 これらの仮定に基づくと、相互作用の強度に対する以下の貢献を考慮するのみ でよいことになる。 1.電荷-双極子 -Q2μ2/6(4ΠE)2kTr4 2.電荷-非極性 -Q2α/2(4ΠE)2r4 3.双極子-非極性(デバイエネルギー) -μ2/(4ΠE)2r6 4.非極性-非極性(ロンドンエネルギー) -.75[hνα2/(4ΠE)2r6] この実例においては、近似により相対的な強度のみを考慮するので、全ての定 数は無視される。さらに、固定された荷電部位は単一のものであり正または負の いずれかであると仮定される。これに基づいて、4つの成分は下記の簡略化され た形態に書き直すことができる。 1.電荷-双極子 -μ2/r4または-μ/r2 2.電荷-非極性 -α/r4 3.双極子-非極性(デバイエネルギー) -μ2α/r6または-μα.5/r3 4.非極性-非極性(ロンドンエネルギー) -α2/r6または-α/r3 一般に、上記2及び3は広範囲の相互作用にわずかにのみ貢献する。しかし、 1及び4はいずれも相互作用エネルギーに有意に寄与する。この実例においては 、非極性断片の間の大部分の相互作用は、受容体の隣接するアルキル及び芳香族 水素及び非極性サブユニットの間で起こると推定される。これらの条件下ではα の値はほぼ一定であると仮定される。疎水性強度及び水排除の貢献 溶媒和効果は、結合親和力生成における重要な考慮事項である。例えば、疎水 結合形成は、非極性の疎水基の接近した空間的結合に依存し、疎水性の領域と水 分子の間の接触を最小にする。疎水結合形成は抗体-抗原結合の全強度の半分程 度まで貢献し得る。また、受容体と基質表面の水和も有意な因子である。受容体 または基質表面の極性部位に結合された水は、表面の間の連結橋を形成すること によって結合を阻害し、あるいは親和力を増加させ得る。 疎水性相互作用は、水中での疎水性分子間の強い引力を説明するものである 。受容体-標的相互作用の場合、それは標的の非極性断片及び非極性受容体サブ ユニットの隣接する領域の間の引力をいうものである。この効果は主としてエン トロピー効果によって起こり、表面の再配列を生じ、隣接する非極性領域の間で 水が排除される。しかし、疎水性相互作用の正確な理論的処理は利用できず、疎 水性の力は、抗体と抗原の間の全引力の50%程度に貢献すると見積もられる。標 的と仮想受容体の間の疎水性相互作用を見積もるために、この実例においては標 的との結合により溶媒和から効果的に保護される受容体の比率を評価する。標的 上の非極性原子の固定された距離の範囲内にある全ての非極性(荷電していない )サブユニットは、前記の限定距離に等しいかそれより大きい直径の溶媒分子に よる溶媒和から保護されると考える。組合せによる親和力計算 この実例において使用した組合せによる親和力計算は、相互作用の2つの測定 、すなわち、電荷-双極子相互作用の合計強度及び近接度の測定を組合せたもの である。この実例においては、これらの親和力は等方性であるものと仮定する。 親和 力の異方性の計算を使用すれば、計算はより複雑であるが、より大きい区別能力 が得られ得ることは当業者により理解されるであろう。 電荷-双極子相互作用は、D=Σμi/rij v(μiは標的のi番目の原子の双極子モ ーメントであり、rijは受容体上のi番目の原子とj番目の荷電部位の間の距離 であり、係v数は2、3または4に設定することができる。)により計算される。 全親和力へのDの貢献は、vのより大きい値についての電荷分離に対してより鋭敏 になる。 近接度測定は、p=Σni/N(niは0.75デバイ以下の双極子モーメントを有する標 的のi番目の原子からの最大距離δだけ隔てられた受容体の荷電してないサブユ ニットの数である)として計算される。この実例においては、6は1〜4サブユニ ット直径(これは、水のファンデルワールス半径を近似するものである)の範囲 をとり得る。Nは受容体を構成するサブユニットの全数である。 親和力値Aは、以下の関係A=[P(D+NP/k)]0.5(kは適合定数、この実例において はk=10000)を使用してDとPから計算される。式中Pの値は2つの役割を果たす。 第一に、これは重み付け因子である。「適合度」の測定値として、標的と受容体 の非極性領域が緊密に接触しているそれらの配置に好適な親和力値にバイアスを かけるのに使用する。これらの条件下では、疎水性相互作用と非極性相互作用エ ネルギーは大きくなり、結合の安定性と強度に有意に寄与する。これらの条件下 では、標的が受容体から逃避する可能性のある経路がより少なくなり、その保持 時間が長くなる。第二に、Pは相互作用の強度に対する分散エネルギーの貢献を 評価するために使用される。分散エネルギーは荷電してない非極性領域に対して のみ有意であり、標的と受容体が互いに近接しているとき(すなわち互いにδの 範囲内にある)にのみそれが有意であると仮定する。k及び6の値を調節してP及 びDの相対的な貢献を変更できる。一般に、Pは非極性標的を支配し、Dは大きい 局所的な双極子を有する標的に有意である。水素結合は、標的ヒドロキシル、カ ルボキシルまたはアミン官能基と同時に相互作用する負または正に帯電した対に なった受容体単位により近似される。親和力計算の代替的アプローチ−結合分極率 場合によっては、親和力計算に標的原子の相対的な分極率に対応するパラメー ターを導入することが有利であり得る。この場合、A=[P(D+NP2/k)]0.5におけるP2 を計算するための式はP2=Σni/Nではなく、P2はP2=Σαini/N(niは標的のi番 目の原子からの最大距離δだけ隔てられた受容体の荷電しているか荷電していな いサブユニットの数であり、αiは標的のi番目の原子の相対分極率である)で計 算される。簡略化するため、αHは脂肪族水素について1.0に設定することができ る。分極率を使用する場合は、kの値を調節しなければならない。隣接する結合 の分極率の合計に基づいたサンプル分極率を表Vに示す。 分極率は電子雲の移動と関連するので、分子の分極率はその共有結合の特徴的 な分極率の合計として計算することができる。この加算性は、非極在化された電 子を有しない非芳香族分子にあてはまる。別の方法−官能基特異性 この実例において使用される親和力近似は、局所的電荷、分散エネルギー及び 標的−受容体分離の関係を保存する、機能的に類似した計算によって置き換える ことができる。さらに、帯電した標的についての親和力測定値を構築してもよい 。この実例では非共有結合相互作用だけを評価するが、選択された標的官能基と 特異的な共有結合形成反応をすることのできる仮想受容体サブユニットを含める ことにより方法を拡張してもよい。モジュール5は、本発明において使用される 好ましい効果的な親和力計算のサンプルフローチャートを示す。 (5)選択的親和力の評価 仮想受容体と標的基質のセットとの間の適合度は、標的の既知の活性又は親和 力値を、仮想受容体−標的複合体について得られたものと比較することによって 評価する。最適に選択的な仮想受容体の最大の親和力は、既知の親和力測定値に 強く相関していなければならない。点突然変異の連続した反復を使用して、基質 のセットと仮想受容体との間のこの相関を増強することができ(図2)、あるい は仮想受容体の集団の選択性を最適化するために生成プロセスの連続した反復を 使用してこの相関を増強することができる(図3)。 既知の値は、結合親和力に依存することが知られているか、そのように考えら れる任意の指標とすることができ、(限定するものではないが)ED50、ID50、結 合能親和力、凝集測定値等を含む。試験される値は正(positive)でなければな らない。データの対数関数的な転換が必要であり得る。重み付けされていない階 級データは使用することができない。 最大の結合親和力を与える標的の最適な配向は、試験の前には未知である。受 容体-標的親和力の範囲を代表する測定値を得るために、各標的を、受容体表面 に対する種々のランダムな配向を使用して繰り返し試験しなければならない。各 試験では、モジュール4を使用して親和力を評価する。一般に、得られる最大の 親和力値の信頼性はサンプルのサイズに依存するが、これはサンプルが真の最大 値を含む可能性が増大するからである。標的の配向の同じセットを使用して各受 容体を試験する。 この実例では、2つの方法、1)平均の(または合計の)親和力及び最大の親 和力を組合せた測定値を使用して、より高い選択性を有する受容体を選択するこ と、及び、2)最適化プロセスを連続的に反復することにより試験される配向の 数を徐々に増加させること(最適化は小さい標的配向のセットで開始し、より大 きい適合を示す受容体を作製し、さらに多くの配向を試験する)を使用して、最 適化された受容体の作製のための大きいサンプルのセットの必要性を回避する。 この実例においては、各標的の試験された全ての配向について得られた親和力 値について、合計を計算する。この合計親和力スコアは、受容体と標的との間の 平均親和力の測定値である。同時に、最大親和力値も決定する。 既知の値と合計親和力rSA 2及び最大親和力rMA 2の両者との間の相関を計算する 。活性を示さない標的化合物は仮想受容体に対する親和力を殆ど又は全く示さな いという仮定に基づいて、原点(0,0)を相関に含める。この仮定は常に有効と いうわけではなく、他の切片値が必要となる試験もあり得る。 合計親和力を使用する相関は、平均値適合度の測定値である。この相関が大き いが、最大親和力と既知の親和力との相関が弱い場合には、その結果は、仮想受 容体が選択的でないこと、すなわち標的の多重配向が効果的に受容体と相互に作 用することができることを示唆している。反対に、最大親和力が既知の親和力値 に高度に相関し、合計親和力との相関が弱い場合には、仮想受容体は非常に選択 的であり得る。合計親和力及び最大親和力の両方が既知の親和力と高度に相関す る場合は、サンプルとされた配向は限定的なエラーを有する受容体の応答特性と される可能性がある(タイプI及びタイプIIの両者のエラーが減少しており、偽 陽性あるいは偽陰性結果のいずれかの可能性)。既知の親和力と合計親和力の間 の相関を最小にし、最大親和力と既知の親和力との間の相関を増大させることが より適当である場合もある。そのような選択では、全合計から最大親和力値を差 し引いて、混乱させるバイアス源としてのこれらの値を除去する必要がある。 この実例においては、組合せによる相関値を受容体選択のための基礎として使 用する。この値は、合計親和力と最大親和力の積の平方根として計算される。 F=(rMA 2×rSA 2)0.5 この値は、仮想受容体に適用される進化プロセスによって最適化される。注:rMA 2 及びrSA 2が互いに強く相関する場合は、rSA 2に寄与している値は個々に最大親 和力値と密接に相関するか、あるいは合計に対しては無視してよい程度しか寄与 しないものでなければならない。あるいは、(合計親和力−最大親和力)対既知 の親和力の相関(rSA-MA)を計算することができ、そして測定値、 F=(rSA 2×(1-rSA-MA 2))0.5 が最大化される。この測定値を使用することにより、標的の配向の非常に限定さ れたセットについて高い親和力を有する受容体が選択される。モジュール5は、 サンプル適合度計算のフローチャートを示す。 (6)最適化プロセス 最適化プロセスの目的は、標的受容体のセットについての選択的親和力を有す る仮想受容体を開発することである。解を見つけるための非常に効率的なメカニ ズムが必要であるが、これは300の指示を含む可能な遺伝子型の総数は7300又は 約10253であるからである。以下の4つの段階は最適化プロセスにおける工程を まとめたものであり、以下に各段階をより詳細に説明し、計算例を示す。 第1段階:ランダムな遺伝子型のセットを作製し、活性の最小レベルについて スクリーニングする。遺伝的アルゴリズム(組換え)及び1方向性突然変異法を 使用した別の最適化のための基礎として選択された遺伝子型を使用する。 第2段階:選択された遺伝子型を変異させて、組換えのための異なっているが 相関する遺伝子型の育種集団を作製する。組換えのための集団から最も選択的な 突然変異体を選択する。 第3段階:選択的な突然変異体の組換えによって新しい遺伝子型を作製する。 得られた遺伝子型から最も高い親和力適合値のものを選択する。このサブ集団を 次の組換え体又は突然変異体作製のために使用する。 段階4:最良の組換え生成物をとり、点突然変異に繰り返しかけて選択性を改 良する。段階I:進化−一次コードの作成 Hollandにより開発された遺伝的アルゴリズム(Holland,J.H.(1975)Adaptati on in Natural and Artificial Systems.U.Michigan Press.Ann Arbour)を使 用して、種々の問題に最適の解を検索することができる。通常この方法は、大き い、最初はランダムな解のセットを使用して適用される。本実施例においては、 この方法をかなり変更し、高い選択性を有する仮想受容体を見つけるために必要 とされる試験回数とその反復回数を減らしている。これは、密接に関連した遺伝 子型のセットを当初の集団として使用し、各反復において突然変異の高い割合を 適用することにより達成した。標的化合物の任意のセットについて、最適な親和 特性を有する異なる受容体を開発することが可能である。例えば、受容体は最適 には同じ標的に異なる方向で結合しうる。密接に関連した遺伝子型の最初の集団 を使用することにより、最適化プロセスが単一の解に収束する可能性が増大する 。無関係な遺伝子型の組換えは、増大した適合値(fitness)を有する新しい遺伝 子型を生成し得るが、多様性を生じる可能性がより高い。 最適化プロセスの最初の段階の目的は、標的のセットに対して最小レベルの親 和力を有する遺伝子型を作成することである。この遺伝子型を、その後関連遺伝 子型の集団を作成するために使用する。最小レベルの親和力を有する遺伝子型を 作成するための代表的なプロセスのフローチャートをモジュール6に示す。段階2:進化−一番目のコード(primary code)の突然変異 遺伝子型の突然変異は、コード中の一つ以上の文字(character)を変更するこ とを含む。この実施例の突然変異は、受容体ポリマーを構成するサブユニットの 数を変更せず、遺伝子型の長さに影響を及ぼさないものである。これらの規則(c onvention)が任意のものであり、改変が有用である系もあることは理解されるで あろう。 突然変異は表現型の折り畳みパターンを変化させ得、受容体の形状空間及び結 合部位の位置あるいは露出の変化を生じる。表現型の周囲の領域の構造に影響を 及ぼす突然変異は、標的中心に対する受容体中心の移動(shift)を生じ得る。中立突然変異 全ての突然変異は表現型の構造を変えるが、全ての突然変異が受容体の機能性 を変化させるわけではない。そのような中立突然変異は、親和力に影響を及ぼさ ない受容体の成分を変化させ得る。これらの中立突然変異は、以降の突然変異と 組み合わされて相乗効果を示し得る場合もある。繁殖集団The Breeding Population) 生成プロセスの第二段階の目的は、一次遺伝子型に由来する、異なるが関連す る遺伝子型の集団を作成することである。この集団のメンバーはその後組換え体 を作成するため使用される。この繁殖集団は、一次遺伝子型の多数の突然変異に よって生成される。結果として得られる遺伝子型は、翻訳され、選択性について スクリーニングされる。最も選択的な生成物を組換えのために保存する。モジュ ール7に遺伝子型の多数の突然変異のための代表的なプロセスのフローチャート を示す。段階3:進化−組換え 組換えの目的は、適合が改善された新しい遺伝子型の作成である。組換えによ り、表現型適合に必須の遺伝子型断片の保存が容易になり、同時に指令(instruc tion)の新しい組み合わせが導入される。一般に、選択と組合わせた組換えによ り選択性の急速な最適化が得られる。モジュール8は、遺伝子型の組換えのため の代表的なプロセスのフローチャートを示す。 この実例では、モジュール8のステップ7における試験のための組換えに使用 される集団を保存する。これにより、高い選択性を有する遺伝子型がより低い選 択性を有する遺伝子型により置換されないようにすることができる。さらに、こ の実例においては、突然変異(モジュール7)を試験(ステップ7、モジュール8 )に先立ち組換え体遺伝子型の50%に適用する。このステップにより、組換え体 集団の範囲内での可変性が増大する。この実例において使用する試験集団の大き さは、10〜40の遺伝子型の範囲であする。これは、比較的小さい集団の大きさで ある。より大きい集団を必要とする条件もあり得る。段階4:進化−成熟 漸進的な小突然変異法 最適化プロセスの最終段階は、哺乳動物の免疫系における抗体の成熟を模倣す るものである。一連の単一の点突然変異を遺伝子型に適用し、そして表現型適合 に対する効果を評価する。組換えとは異なり、このプロセスは一般に表現型の選 択性に対してわずかに増加する変化しか与えない。この成熟プロセスは、Rechen berg(1+1)進化法(Rechenberg,I.(1973),Evolutionsstrategie.F.Frommann .Stuttgart)を使用する。各作成において、親遺伝子型の適合をその突然変異生 成物のものと比較し、そしてより大きい選択性をもつ遺伝子型を次の作成のため に保存する。この結果、より小さい選択性を有する突然変異体はその親に置換す ることがなく、このプロセスは厳密に1方向性のものとなる。モジュール9は遺 伝子型の成熟の非限定的なサンプルのフローチャートを示す。 成熟プロセスの各反復においては、コード中の単一の指令のみが変化する。親 とその突然変異生成物が同じ選択性を有する場合は、次の作成において親はその 生成物と置換する。この方法により、以降の突然変異とともに相乗効果を有し得 る中立突然変異の蓄積が得られる。この規則は任意のものである。 組換えあるいは成熟を反復して繰り返しても改善された選択性が得られない場 合は、繁殖集団ゲノムの可変性を増加させるために段階2を反復する必要があり 得る。選択された用途 本発明のプロセスは、1)選択された薬理学的あるいは毒物学的活性を有する 化合物のスクリーニング、2)選択された機能特性を有する新しい化学構造の開 発等の複数の分野で使用することができる。両方の用途とその具体例を以下に示 す。 1A)スクリーニング法 類似した薬理学的性質を共有する化合物の特定の基に対する選択的な親和力に ついて開発された受容体の集団は、この活性が結合親和力に依存するものであれ ば、類似した活性を有する他の化合物を同定するためのプローブとして使用する ことができる。例えば、サリチル酸塩に特異的な親和力を示す受容体の集団を開 発することができる。サリチル酸塩に対するこれらの受容体の親和力がシクロオ キシゲナーゼのサ リチル酸塩に対する親和力と密接に関連しているならば、該受容体は少くとも部 分的に前記シクロオキシゲナーゼ分子の結合部位の機能的に関連した特徴を模倣 しているに違いない。従ってこれらの受容体は、可能性のあるシクロオキシゲナ ーゼに対する結合親和力について他の化合物をスクリーニングするために使用す ることができる。 またこの方法は、潜在的な毒物学的あるいは発癌活性について化合物をスクリ ーニングするために使用することができる。例えば、ステロイドホルモン受容体 の特異的な結合親和力を模倣する受容体を開発することができる。さらにこれら の受容体は、可能性のある結合親和力について、in vitroまたはin vivo試験の 前に殺虫剤、溶媒、食品添加物、及びその他の合成物質の親和力を評価するため に使用することができる。また、シミュレーションされた受容体は、交互の標的 部位、輸送タンパク質、あるいは非標的結合についての親和力を検出するように 構築することもできる。 1B)最大未満(sub-maximal)の活性のスクリーニング 高い親和力をもつ化合物は、有害な副作用を有し、あるいは長期投与に不適当 である場合がある。このような場合、より低い結合親和力をもつ化合物が必要と なり得る。合成の組合せのような方法では、容易にそのような化合物は作成され ず、特定されない。これに対し、シミュレーションされた受容体を使用して、任 意の特定のレベルで結合親和力を示す構造を効果的にスクリーニングすることが できる。 1C)分子の類似性の測定 シミュレーションされた受容体の選択性は、分子の類似性の量的な基準として 使用することができる。シミュレーションされた受容体の例 この例においては、標的親和力の架空の試験値を選択して、活性の任意の選択 されたパターンを模倣するシミュレーションされた受容体を構築する受容体生成 プログラムの能力を示した。 この例では、全ての受容体は15のポリマーからなる。幅、長さ及び深さの値に より、受容体の中心に対する15のポリマーの原点座標を特定する。実施例1 シミュレーションされた受容体を、以下の仕様で作成した: サブユニットの数:240、幅:6、長さ:6、深さ:25 コード:各標的は、受容体に対して20回試験した。 最適化された受容体の親和カスコアは0.9358であり、比較的低かった。 受容体を最適化するために使用した標的基質は、ベンゼン、フェノール、安息 香酸及びo-サリチル酸であった。アスピリン前駆体のo-サリチル酸は、シクロオ キシゲナーゼによるプロスタグランジン合成の阻害剤である。安息香酸とフェノ ールは、同じ部位に対して相対的に非常に低い親和力を有する。受容体に対する 標的親和力値及びスコアは下記表Aに示す。これはシミュレーションされた受容 体がo-サリチル酸に対して最大の親和力を有することを示している。 表A 標的化合物 標的親和力 合計親和力スコア 最大親和力スコア ベンゼン 0.6 20.88 3.38 フェノール 1.2 8.03 4.99 安息香酸 1.6 42.23 12.98 o-サリチル酸 4.4 80.33 34.71 シミュレーションされた受容体を使用して3つの試験基質を評価した。化合物 のうちの2つはo-サリチル酸より活性が低いことが知られている、m-サリチル酸 及びp-サリチル酸である。3番目の化合物、ジフルシナール(Diflusinal)はサリ チル酸のものに等しいかそれより大きい効能を有するフッ素化サリチル酸誘導体 である。評価の結果は表Bに示す。 表B 標的化合物 合計親和力スコア 最大親和力スコア m-サリチル酸 45.9 12.3 p-サリチル酸 63.5 27.5 ジフルシナール 117 71.2 o-サリチル酸 80.33 34.71 シミュレーションされた受容体を使用して得られた結果は、これらの化合物の 薬理学的データに正確に一致しており、m-サリチル酸及びp-サリチル酸はo-サリ チル酸より低い親和力スコアを有し、ジフルシナールはo-サリチル酸より活性が 高い。活性のこれらの予測の確実性を高めるためには、シミュレーションされた 受容体をさらに精度の高いものとし、独立に最適化された別の受容体を使用する ことが必要である。 パートB:選択した機能特性を有する新規な化合物の開発 新規リガンドの進化 類似した機能特性を有する標的化合物のセットに対する選択的な親和力につい て開発されたシミュレーションされた受容体の集団を使用して、モデル化合物の 構造あるいは結合親和力に密接に関連した特性である、類似した特性を有する新 規な化合物を製造することができる。受容体との相互作用を選択基準として使用 して、受容体に最適に適合するように新しい化学構造を開発することができる。 これらの化合物は、受容体の選択性についての必要で十分な要件に適合しなけれ ばならないので、これらの新規な化合物は最初の分子標的のものに類似した活性 も有する可能性がある。プロセスの概要 1.特性化された標的化合物のセットについて最適化された選択性を有するシ ミュレーションされた受容体の集団を作成する。異なる親和特性を有する複数の 集団を作成することが望ましい場合もある。例えば、シミュレーションされた受 容体の3つの集団を作成することができ、第1のものは選択された標的部位を模 倣し、第2のものはリガンドをその一番目の標的に輸送するのに必要な部位を模 倣し、受容体の第3の集団は望ましくない副作用を媒介する標的部位を模倣する ものとすることができる。この場合における新しいリガンド構造の開発には、最 初の2つの受容体集団に対する親和力を同時に最適化することと、第3の集団に 対する親和力を最小にすることを必要とする。 2.シミュレーションされた受容体集団について新規な一次構造の親和力を測 定する。 3.一次構造を修飾し、シミュレーションされた受容体集団を使用して親和力 を評価する。修飾が親和特性を改善する場合は、修飾された構造をさらに修飾す るために保存する。そうでないならば異なる修正を試験する。先に拒絶された修 飾を別の修飾と組み合わせて再導入してもよい。 4.適した親和特性を有する化合物が得られるまでステップ3を繰り返す。 注:適当に識別されるシミュレーションされた受容体を使用して、選択された標 的部位に対する最大未満の親和力を有する化学構造を開発することが可能である 。 1)分子遺伝子型コードの作成 文字列(character string)で表される線状の遺伝子型の形態にリガンド表現型 (分子構造)をコード化することは、進化プロセスの間のリガンドの構造上の特 性の突然変異、組換え、及び継承のプロセスを容易にする。 この実例により開発されたリガンドは、置換された炭素骨格からなる。各コー ドは、3つの文字のベクトルから成る。一番目のコードベクトルは炭素骨格の作 成のための回転の指令を含み、骨格における各炭素原子の位置を決定する。二番 目のコードベクトルは、各炭素原子に結合される官能基を指定する。三番目のコ ードベクトルは、ホスト炭素に対する官能基の位置を特定する。炭素以外の原子 を結合している分子骨格(例えばエーテル、アミド及びヘテロ環)は、コードに おいて別の文字を使用して骨格の炭素原子を置換する原子種を特定することによ り同じ方法で構築することができる。 炭素骨格は、三次元四面座標系の結節点を形成する一連の点から構築される。 初期の骨格構築の間、最も近い点の間の距離は、アルキル炭素原子の間の平均結 合長に等しい。 一番目のコードベクトル:リガンド骨格決定要素 一番目のコードベクトルは、そのときの原子位置に対する回転方向を指定する 文字からなる。各回転方向は、四面マトリックスにおける次の原子の座標を特定 する。各原子から4つの方向(1,2,3,4)を取ることができ、これはsp3炭素の 満たされてい ない原子価に対応する。各炭素原子は4つの可能な状態(A,B,C,D)の一つに属 している。これらの状態は、四面座標系の異なる結節点の数に対応する。 回転方向と骨格中の次の原子の新しい座標との関係を以下の表に示す。下記の 2つの表B1及びB2は、リガンドの構築に必要な2つの回転の規則を具体的に示す 。ボート型規則は、閉鎖された6員環(シクロヘキサン)がボート型構造をとる 四面マトリックスを作成する。椅子型規則は、シクロヘキシル環が椅子型構造を とるマトリックスを作成する。コード生成の間、両方の規則を組み合わせること が可能である。ここで記載する例においてはボート型規則のみを使用する。 表B1:ボート型規則 現在位置=(x,y,z) 回転後の新しい位置 回転後の新しい状態 表B2:椅子型規則 現在位置=(x,y,z) 回転後の新しい位置 回転後の新しい状態 これらの関係を使用して、文字1、2、3及び4の列からなる一番目のコードベク トルを解読し、炭素原子の三次元の配列を形成することができる。得られる炭素 原子の列は、それ自体で折り畳まれるか閉鎖したループを形成し、短い側鎖及び 環構造を形成する。特定の環構造(例えばシクロヘキサン)は、下記に示すよう に特異的文字配列として直接導入することができる。二番目のコードベクトル:置換基 一番目のコードベクトルと同じ長さの二番目のコードベクトルを使用して、一 番目のコードベクトルにより特定された炭素原子に結合される置換基の種類を割 り当てる。各置換基は単一の文字によって特定される。置換基は単独で炭素骨格 に付加される。単一の炭素原子は1より多い置換基を有することができるが、こ れは一番目のコードにより1回より多く特定されたときのみである。 この実例においては、二番目のコードベクトルによって特定された置換基によ って満たされていない原子価は全て、リガンド構築プロセスの間に自動的に水素 原子で埋められる。空の原子価を水素以外の原子で満たすために他の規則を適用 してもよい。三番目のベクトル:置換基結合ベクトル 一番目のコードベクトルと同じ長さの三番目のコードベクトルを使用して、二 番目のコードベクトルによって指定された置換基の結合のために使用される原子 価を割り当てる。三番目のコードは文字1、2、3及び4からなり、それぞれ一番目 のコードについて特定された回転方向を示す。原子価がすでに一番目のコードベ クトルによって指定された炭素原子あるいは別の以前に割り当てられた置換基で 占められていない場合にのみ置換基が割り当てられる。あるいは、連続した置換 基により以前に割り当てられた置換基を置換してもよい。 2)コード作成 炭素骨格を形成するため、セット{「1」、「2」、「3」、「4」}に属してい る文字のランダムな配列を生成することにより一番目のコードを構築する。ヘテ ロ環構造、エーテル、アミド、イミド及びカルボキシル化合物の生成は、二番目 のコードで指定される異なる原子により骨格中の炭素原子を置換することによっ て行うことができる。 二番目のコードは、置換基の種類を指定する文字のランダムな配列から作成す る。文字の頻度はランダムであるか、コード生成に先立ち固定することができる 。 三番目のコードは、セット{「1」、「2」、「3」、「4」}に属している文字 からなる。環構造は、特定の文字配列を一番目のコードに加えることによって意 図的に(ランダムな作成に対して)構築することができる。例えば、「431413」は シクロヘキシル環をコードする。合計24列が、四面マトリックスにおけるシクロ ヘキシル環の全ての可能な方向をコードする。環の一番目のコードについての二 番目及び三番目のコードベクトルは前に記載したように作成する。モジュール10 は、環を有する炭素骨格を作成するコードの作成例のフローチャートを示す。 炭素原子骨格の部分を構成する環への入口及びそれからの出口となる点の相対 位置は、環を作成するのに使用された文字配列の長さによって決定される。具体 的には、配列が例えば431413の6つの文字を含む場合、入口及び出口点は環の同 じメンバーである。配列が部分的に繰り返されて、最初の6つの文字に付加され る場合は、入口点と出口点は環の同じメンバーではない。例えば、配列4314134 及び43141343141は 入口点に隣接した環のメンバーに出口点を有する環を作成する。 この実例においては、少なくとも6つの文字の配列をコードに加えることによ って環が骨格に加えられる。431413によって定義される環について使用される可 能な配列は以下のものである。 431413 4314134 43141343 431413431 4314134314 43141343141 431413431413 431413431413 新しいリガンド遺伝子型を形成するために示した規則を使用して、リガンド生 成プロセスでの保存のため、あるいはそれへの導入のために、直線状の形態のそ の他の化学構造をコードすることができる。例えば、公知の医薬原子団(pharmac ophore)は、線状の形態でコードされ得、類似しているかあるいは改良された機 能的特性を有する新しいリガンドを生成するための出発点として使用することが できる。同様に、共通の標的部位と相互作用する医薬原子団のセットを線状の形 態でコードすることができ、組換えのために使用することができる。 3)コード翻訳とリガンド構築 コードベクトルは、3つの別々のステップからなる翻訳プロセスにおいてリガ ンドの三次元の表現に変換される。最初のステップにおいて、一番目のコードを 使用して炭素原子骨格が構築される。二番目のステップにおいて、二番目及び三 番目のコードベクトルからの指令を使用して置換基が炭素骨格に付加される。ま た、二番目及び三番目のコードベクトルからの指令は、骨格における炭素原子の 異なる原子での置換を指定してもよい。また、二番目の及び三番目のコードから の指令は、一次骨格の部分を形成している炭素またはその他の原子上に存在する 利用可能な原子価の数と方向を変更しうる。例えば、カルボニル酸素の付加は2 つの空の原子価を占める。三番目のステップにおいては、二番目のステップの間 に置換基によって満たされなかった全 ての原子価が(特に指定されない限り)水素原子で満たされる。一次解読:リガンド骨格構築 一次解読は、一番目のコードベクトルからの回転の指令を使用して各炭素原子 の位置を特定する。最初の原子が座標系の原点に位置すると仮定する。最初の原 子がマトリックスにおいて状態Aを占めると仮定する。 解読は逐次進行する。一次解読プロセスの結果は、骨格中のn個の炭素原子の 各々のx、y及びz座標を含む3×n個のマトリックスである。ループ及び反転が許 容されるので、空間中の同じ位置が1より多い炭素で占められてもよい。この場 合、1つの炭素原子のみがその位置を占めると仮定する。この結果、完成した骨 格を形成している炭素原子の数は、一番目のコードベクトルの中の文字の数より 少なくなり得る。 一番目のコードが読み込まれるに従って、各炭素位置に結合される置換基を指 定する二番目のコードからリストが構築される。同時に、三番目のコードを使用 して平行のリストが構築され、各置換基で占められる原子価が指定される。二次解読:置換基付加 置換基は、一次解読の間、二番目のコードから生成されたリストに基づいて各 炭素原子に逐次付加される。三番目のコードからの対応する値を使用してホスト 炭素に対する置換基の原子価位置を指定する。その位置が隣接の炭素原子あるい は以前に指定された置換基すでに占められている場合は置換は実行されない。あ るいは、置換が次の空いている位置で実行されるか、置換により先に指定された 置換基を置き換える解読プロセスを構築してもよい。置換基と炭素原子との間の 距離は結合距離の照合表から計算される。位置データと結合距離を使用して置換 基の座標を計算する。ヒドロキシル、ニトロ及びアミノ基のような多成分置換基 の場合、置換基中の各原子の座標はホスト炭素に対して計算される。 二番目のコードベクトルによって指定された全ての置換基が骨格に付加された 後、骨格上に残っている全ての満たされていない位置を水素原子で満たす。水素 sp3-炭素結合長を使用して各水素原子の座標を計算する。 単一の炭素原子は1より多い非水素置換基を有することができる。これは同じ 位置が一番目のコードベクトルによって一回より多く指定される場合に起こり得 る。この 実例では直接二番目のコードを使用した多数の置換を導入していないが、これは 容易に実施することができる。 置換は、リガンド骨格を形成している炭素原子で満たされていない場所でのみ 可能である。四面マトリックスにおける全ての占められた部位の蓄積リストを維 持する。 二次解読プロセスの間、リガンドを構成する全ての原子の種類、半径及び位置 ついてリストを作製する。このリストは以降の標的作成の基礎となる。 プロセスのこの段階において、コード配列から作成された構造の実現可能性は 評価されない。一定の場合においては、原子座標をエネルギー最小化プログラム に導入してより現実的な構造を生成してもよい。しかしこの実例においては、結 合の間のリガンドの構造にかかわる仮定は設定していない。さらに本実施例は、 同じ分子の特異的な構造の構造上のユニークさを保存するものである。例えば、 本実施例はブタンの3つの回転異性体を区別し、各異性体をユニークな分子とみ なす。 コードベクトルが対応するリガンドの遺伝子型を構成し、突然変異及び組換え を経てリガンド構造の変化を生ずることができる。リガンド構造自体が、仮想受 容体の選択された集団で結合親和力を評価するために使用される表現型である。 4)標的提示 化学構造あるいは標的リガンドを最初にランダムに生成されたコードから構築 する。解読の後、標的リガンド中の各原子の座標、半径、双極子モーメント及び 分極率を値の照合表から得、リガンドと仮想受容体の選択された集団との間の結 合親和力を評価するために使用する。 仮想受容体の各々についての標的の親和力を、受容体表面に対する標的の多く の方向について試験する。リガンドとシミュレーションした受容体との相対方向 に関する仮定は設定しない。結合親和力の評価に先立ち、標的と受容体を接触さ せなければならない。標的提示の方法及び化学構造とシミュレーションされた受 容体との間の親和力の計算は、モジュール4において上で示した既知の標的分子 とシミュレーションされた受容体との間についてのものと本質的に同じものであ る。 5)結合親和力および適合度の評価 適合度の評価のために使用される各シュミレートした受容体に対する標的リガ ンドの結合親和力を、標的分子を用いたシュミレートした受容体の作製について 記載したものと同じ有効親和力計算法を使用して計算する。先に述べたように、 他の判定基準を用いた親和力計算を適合度試験法に導入することもできるが、本 発明の効力および計算効率は、部分的に、仮想的受容体の作製およびシュミレー トした受容体集団を用いた化学構造の作製のために同じ有効親和力計算を使用し たことに基づくものである。 6)リガンドの進化 適合度の試験 シュミレートした受容体の特定の集団と新規なリガンドまたは化学構造との適 合度は、リガンドに対する目標活性値または目標親和力値とシュミレートした受 容体‐リガンド複合体に対して得られたそれらの値とを比較することにより評価 する。最適に選択された仮想受容体の最大親和力は、目標親和力の測定値と強い 相関をもつはずである。 目標値は、任意のレベルの結合親和力に設定することができる。リガンドは、 選択プロセスで使用されるすべての仮想受容体に対して同じ結合親和力をもつ必 要はない。本発明の実施にあたり、既知の基質に対する最適化した仮想受容体の 最大結合親和力を使用して、目標結合親和力を計算する。例えば、目標親和力を 、特定の基質に対する仮想受容体集団の各メンバーの結合親和力の90%に設定し てもよい。このほか、リガンドと仮想受容体との相互作用を最小化する場合には 、目標結合親和力をゼロに設定してもよい。 様々な基質の組に対して最適化されたシュミレートした受容体を一緒にし、選 択された目標親和力値と各受容体とを関連付けることにより、特定の結合親和力 プロフィルについて新規なリガンドを選択することができる。リガンドの適合度 は、リガンド結合親和力の計算値と目標親和力値との一致度の尺度となる。最適 化プロセスはリガンドの適合度を最大化する。 最大結合親和力を与えるリガンドの最適配向は、試験を行うまでは不明である 。 受容体‐リガンド親和力の範囲の代表的な測定値を得るために、受容体表面に対 してランダムに様々な配向をとらせて、各新規リガンドを繰返し試験しなければ ならない。各試験では、第A部で説明したモジュール4を使用して親和力の評価 を行う。一般的には、得られる最大の親和力値の信頼性は、サンプルサイズに依 存する。なぜなら、サイズが増大するとサンプル中に真の最大値が含まれる可能 性が増大するからである。 最適化された新規なリガンドまたは化学構造を作製するために大きなサンプル 組を使用しないで済むように、本発明を実施するにあたり次の2つの技法を利用 する。 1.最適化された親和力プロフィルを有するリガンドを選択するために、平均 (または合計)親和力と最大親和力を合わせた測定値を使用する。 2.最適化プロセスを連続的に繰返し、試験される配向の数を増大させる(標 的配向の小さい組を用いて最適化を開始し、より大きい適合度のリガンドを発生 させながら、より多くの配向を試験する)。 本発明を実施する際、各リガンドの試験されたすべての配向に対して得られた 親和力値の合計を計算する。この合計親和力スコアは、受容体とリガンドの間の 平均親和力の測度である。同時に、最大親和力も求める。 合計親和力と最大親和力の両方を用いて、仮想受容体と新規なリガンドとの適 合度を試験する。合計親和力および最大親和力の計算値とこれらのパラメータの 目標値との差に従って、新規な各リガンドの適合度を評定する。本発明を実施す る場合、新規リガンド‐シュミレートした受容体対のそれぞれに対して適合性ス コアとして次の値を計算する。適合性スコアがゼロのときに適合度が最大となる。先の節で説明したように、最 大親和力の目標値および合計親和力の目標値は、最適化される仮想受容体の進化 ・開発(evolution)の過程で得られる回帰関数から得られる。目標値の求め方は 次の通りである: 最大親和力の目標値=f×仮想受容体の作製に使用された基質のうちで最 も可能性の高い基質の最大親和力 合計親和力の目標値=f×仮想受容体の作製に使用された基質のうちで最 も可能性の高い基質の合計親和力 ただし、F=スケーリング係数 リガンドの適合度を評価するために2つ以上のシュミレートした受容体を使用 する場合、リガンド‐シュミレートした受容体の対のそれぞれの適合性スコアを 合計する。 この場合、適合性スコアの合計がゼロのときに適合度が最大となる。様々なシ ュミレートした受容体のパネルに対して新規なリガンドを試験する場合、最大親 和力だけを使用することが望ましいこともある。この場合、適合度は次式で与え られる: この場合も、適合性スコアの合計がゼロのときに適合度が最大となる。一連の シュミレートした受容体に対して試験されるリガンドの合計適合度を測定するた めに、幾何学的手段を使用するなど、他の方法を利用することもできる。 シュミレートした受容体の各々について得られる最大親和力値と合計親和力値 の両方を使用することにより、仮想受容体の選択性がリガンドの適合度の評価に 確実に関係するようになる。この方法によれば、リガンドの適合度は、リガンド の親和力を反映するだけでなく、選択性の基礎となる仮想受容体の立体的要件の 満足度をも反映する。 6a)最適化方法 目的 シュミレートした受容体の組に対して所定の目標親和力を有する新規なリガン ドの進化を行うこと。25個の指令を含む候補遺伝子型の合計数は25625であるの で、解を得るために高度に効率的な手法が必要である。 方法 (1)第1段階:リガンドをコードするランダムな1組の遺伝子型を作製し、更に 、1組のシュミレートした受容体に対してスクリーニングを行い、適合度の閾レ ベルを超えるリガンドを選択する。 (2)第2段階:選択された遺伝子型を、遺伝子アルゴリズム(組換え)および 一方向突然変異法を用いて更に最適化を行うための出発点(basis)として使用す る。選択された遺伝子型に突然変異を起こさせ、組換えを行うために、異なって はいるが関連性のある遺伝子型の育種集団を発生させる。 (3)組換え用の集団から最も選択性の高い突然変異体を選択する。 (4)第3段階:選択性のある突然変異体の組換えを行うことにより新しい遺伝 子型を発生させる。得られた遺伝子型の中から最も親和力適合度の高いものを選 択する。この亜集団を、次の組換え体を発生させるために(第3段階の繰返し) 、または次の突然変異体を発生させるために(第4段階の繰返し)使用する。 (5)第4段階:最良の組換え産物を選定し、点突然変異を繰返して、選択性を 増大させる。 (6)所望の適合度のリガンドが作製された場合、この最適化プロセスを終了す る。第1段階:進化−初期コードの作製 最適化プロセスの第1段階の目的は、遺伝子型、および最小レベルの適合度を 有する対応するリガンド表現型を作製することである。続いて、この遺伝子型を 使用して、関連する遺伝子型の集団を発生する。 様々な問題に対する最適解を探索するために、Hollandにより開発された遺伝 子アルゴリズムを使用することができる。通常、この技法を適用する場合、大き な初期ランダムな組の解を使用する。本発明を実施する際は、選択性の高い親和 力を有するリガンドを見出すのに必要な試験および繰返しの数を減少させるため に、この技法に著しい改良を加える。この改良は、初期の集団として関連性の大 きい1組の遺伝子型を使用し、かつ各繰返しの際の突然変異の発生率を高くする ことにより達成してきた。標的化合物の任意の組に対して、最適親和特性を有す る独特なリガンドを開発することが可能である。例えば、受容体は、同じ標的に 対して異なる配向で最適な結合を呈することができる。関連性の高い遺伝子型の 初期集団を使用すると、最適化プロセスが単一解に収束する可能性が増大する。 関連性のない遺伝子型の組換えは、適合度の高い新規な遺伝子型を生ずる可能性 があるが、発散する可能性が大きい。第2段階:リガンドの突然変異 進化プロセスの第2段階の目的は、初期遺伝子型から誘導される異なってはい るが関連性のある遺伝子型の集団を作製することである。続いて、この集団のメ ンバーを使用して、組換え体を作製する。この育種集団は、初期遺伝子型の多重 突然変異により作製する。得られた遺伝子型を翻訳し、選択性に関してスクリー ニングを行う。最も選択性の高い産物を組換えのために保持する。 構造をコードする遺伝子型(コードベクター)の特性を変化させることにより 、リガンドを突然変異処理にかける。これらの突然変異により、リガンドの形状 、ならびにリガンド上に存在する官能基の位置およびタイプが変化する。本発明 で行われる突然変異では、リガンドの骨格を構成する炭素の数を変えることがで きる。モジュール11は、複数の点突然変異を起こすための代表的なプロセスのフ ローチャートである。 突然変異により、リガンドの表現型の折畳みパターンを変えることができ、結 果として、形状ならびに官能基の位置および露出状態が変化する。リガンドの表 現型の周辺領域の立体配置に影響を及ぼす突然変異が起こると、受容体中心に対 する位置の変化を生じる可能性がある。中立突然変異 いずれの突然変異が起こっても表現型の構造の変化は起こるが、リガンドの官 能性の変化は、必ずしもすべての突然変異の場合に起こるわけではない。このよ うな中立突然変異が起こると、親和力に影響を及ぼさないリガンドの成分の変化 を生じることがある。場合により、これらの中立突然変異は、後続の突然変異と 組合わさって相乗効果を示す可能性がある。配列突然変異 配列突然変異が起こっても、コードの特性が直接変化することはない。その代 わりに、コード中の文字の配列が再配置される。配列突然変異が起こると、リガ ンドのサイズ、立体構造、ならびに官能基の存在(有無)および位置が変化する 可能性がある。本発明を実施する際、4つのタイプの配列突然変異を使用する。 a)欠失:コードから文字の配列を欠失させる。 ABCDEA⇒ABEA b)反転:コード中の配列を構成する文字の順序を反転させる。 ABCDEA⇒ABDCEA c)重複:コードの一部分を構成する文字の配列を反復させる。 ABCDEA⇒ABCDCDEA d)挿入:文字の配列をコード中に挿入する。 ABCDEA⇒ABCDBCEA 本発明を実施する場合、突然変異を組合わせて利用する。モジール12は、代表的 な配列突然変異のフローチャートである。第3段階:組換え体コードの発生 組換え処理の際、選択された遺伝子型間で、ランダムに選ばれた相補的セクシ ョンの交換を行う。組換えの目的は、適合度の増大した新規な遺伝子型を作製す ることである。組換えを行う際、表現型の適合度に対して必須である遺伝子型断 片は保持するが、同時に、指令の新規な組合せの導入を行う。一般的には、組換 えを選択と連動させて行うと、選択性の最適化が迅速化される。モジュール13は 、組換えに対する代表的な手順を示すフローチャートである。 本発明を実施する場合、試験のための組換えに使用された集団を保持する。こ うすることにより、選択性の高い遺伝子型が適合度の低い遺伝子型と置き換わら ないようにする。本発明を実施する際、組換え体遺伝子型の50%に対して多重の 突然変異を起こしてから試験にかける。このプロセスは、組換え体集団内での多 様性を増大させる。本発明を実施する際に使用される試験集団のサイズは、遺伝 子型10個〜40個である。これは比較的小さいサイズの集団である。条件によって は、より大きな集団が必要となることもある。第4段階:リガンドの成熟 段階的微量突然変異法 最適化プロセスの最終段階では、哺乳類免疫系における抗体の成熟を模倣する 。一連の単一点突然変異を遺伝子型に適用して、表現型の適合度に及ぼす影響を 評価する。組換えとは異なり、このプロセスでは、一般的には、表現型の選択性 が極僅かに増大する。この成熟プロセスは、Rechenberg(1+1)進化戦略を利用す る。発生を行うごとに、親の遺伝子型の適合度と、その突然変異産物の適合度と を比較し、選択性のより高い遺伝子型を次の発生のために保持する。より選択性 の低い突然変異体が親と置き換わることはないため、結果として、このプロセス は極めて一方向的となる。本発明を実施する場合、成熟プロセスの各繰返しにお いてコード中の指令を1つだけを変化させる。 親およびその突然変異産物が同じ選択性をもつ場合、次の発生の中で、親をそ の突然変異産物と入れ替える。この方法を行うと、後続の突然変異と相乗効果を 示す可能性のある中立突然変異が蓄積される。この変換は任意である。モジュー ル14は、代表的な成熟プロセスを示すフローチャートである。 組換えまたは突然変異を何度か繰返した後に、選択性の改良が得られない場合 、育種集団ゲノムの多様性を増大させるために、多重突然変異(第2段階)を繰 り返さなければならないこともある。 リガンド作製の例 概要 ベンズアルデヒドは、蚊Aedes aegyptiを忌避させるが、ベンゼンおよびトル エンの忌避作用はかなり小さい(表1)。シクロヘキサンやヘキサンは、この種 を有意には忌避させない(表1)。新規なリガンドを作製させる次の試験におい て、本発明の方法を使用して、忌避作用がベンズアルデヒドと類似した化合物 を最初(ab initio)に作製させる。リガンド作製の第1段階では、ベンズアル デヒドに対して高い親和性を呈し、ベンゼンに対して低い親和性を呈するシュミ レートした受容体を構築した。第2段階では、そのシュミレートした受容体に対 する結合親和力がベンズアルデヒドの場合と類似したリガンドを進化・開発する 。蚊の反応 蚊は、発生後7〜14日目のもので、実験室で飼育され、餌は与えられていなか った。蛍光灯の照明下で20℃において6日間にわたり実験を行った。東部夏時間 で12:00〜17:00に試験を実施した。試行用の4組の試験集団は、200匹、175匹、 105匹、および95匹の雌の蚊から成っていた。蚊には飲料水を与えた。 対向する壁を形成する2つのスクリーン側面を備えた35×35×35cmの透明なPl exiglas箱中で試験を行った。スクリーンは2つの層:すなわち、粗いプラスチ ックメッシュの内層と細かいナイロンメッシュの外層とから成っていた。一方の スクリーン側面から空気が入って反対の側面から出るように、ヒュームフード中 に箱を配置した。空気の流量は<0.5cm/sであった。 蚊は、頭を上に向けて箱の壁にとまっていた。Whatman #1濾紙の三角片(4×4 ×1mm)を用いて剌激化合物を与えた。先端を試験溶液中に深さ0.5cmまで浸漬し 、その直後に使用した。試験溶液に対する反応を次のように測定した: 1.風上の方の壁の内側スクリーン上にとまっている静止した雌の蚊を試験用と して選択した。 2.処理済みの濾紙の先端をスクリーンの外側に接して配置し、蚊の後胸・節に対 向した位置に置いた。いずれの場合においても、最初に、蚊の位置の下から近づ けた。 3.先端を所定の位置に最大3秒間保持し、蚊の反応をメモした。 次に、新しい個体に対して、この手順を繰り返した。各化合物を用いて1日1 回だけ蚊の試験を行った。先端は、それぞれ5回の試験(合計使用時間<30s) に使用してから交換した。化合物の試験はランダムな順序で行い、各化合物とも 、別の日に2度試験した。処理済みの先端の場合と同じ位置に、未処理の(乾燥 した)濾紙の先端および蒸留水で湿した先端を配置し、2組の対照の試験を行っ た。これらの対照の試験は、忌避化合物の試験の間に規則的に介在させて行った 。対 照に対する反応は、実験期間中、変化しなかった(p>0.25)。 4つの行動反応を記録した: 1.反応なし:蚊は不動のままであった。 2.逃避:蚊はとまっていた場所から飛び去った。 3.同側肢の持上げ:蚊は剌激源と同一側の後胸肢を持ち上げた。 4.対側肢の持上げ:蚊は剌激源と反対側の後胸肢を持ち上げた。 同側肢の持上げの後、しばしば逃避を起こしたが、この場合には両方の動作を 記録した。試験中および化合物調製のすべての段階で、ポリエチレン手袋を着用 した。 シュミレートした受容体およびリガンドの作製 同じ選択基準を用いて、2つのシュミレートした受容体を作製した。各受容体 を独立して使用し、l組のリガンドを作製した。分子アセンブリー1 第1段階:受容体の作製 ベンアルデヒドに対して選択的親和性を有する受容体を進化・開発させた。ト レーニング標的はベンゼンおよびベンズアルデヒドであった。各標的につき15 通りの配向を用いて親和力値を計算した。進化プロセスの結果は次の通りであっ た。 標的 活性レベル 合計親和力 最大親和力 ベンゼン 1.0 6.87 2.21 ベンズアルデヒド 5.9 75.87 13.02 受容体に対する親和カスコアは0.992であった。最適化された25×6×7ベンズ アルデヒド受容体に対するコードは、次の通りであった: 第2段階:リガンドの作製 最適化されたシュミレートした受容体を、新規なリガンドの進化のための鋳型 として使用した。ランダムな突然変異および選択により、4つの異なるリガンド をアセンブルした。ベンズアルデヒドとの類似性を有するリガンドを選択した。 リガンドに対する親和力値は次の通りであった: 進化させたリガンド1.1〜1.4は、図4bに示されている。各リガンドの少なくと も1つの配向は、ベンズアルデヒドと構造的に類似したものであった。分子アセンブリー2 第1段階:受容体の作製 ベンズアルデヒドに対して選択的親和性を有する25×6×7受容体を進化・開発 した。トレーニング標的はベンゼンおよびベンズアルデヒドであった。各標的に つき15通りの配向を用いて親和力値を計算した。進化プロセスの結果は次の通り であった。 標的 活性レベル 合計親和力 最大親和力 ベンゼン 1.0 25.88 8.53 ベンズアルデヒド 5.8 162.23 42.74 受容体に対する親和力スコアは0.996であった。受容体に対するコードは、次 の通りであった: 第2段階:リガンドの作製 最適化されたシュミレートした受容体を、新規なリガンドの進化のための鋳型 として使用した。ランダムな突然変異および選択により、4つの異なるリガンド をアセンブルした。ベンズアルデヒドとの類似性を有するリガンドを選択した。 リガンドの親和力値は次の通りであった: 進化させたリガンド2.1〜2.4は、図4cに示されている。各リガンドの少なくと も1つの配向は、ベンズアルデヒドと構造的に類似したものであった。 化合物2.1および2.4は、置換シクロヘキサノン誘導体である。リガンド2.2は5 -クロロ-2,7-ノナジオンであり、リガンド2.3は2-シアノ-5-ヘキサノンである。 リガンド1.4には、構造的にメチルシクロヘキシルケトンに相当する断片が含ま れている。シクロヘキサノン、メントン、メチルシクロヘキシルケトン、および 2-オクタノンの忌避性を試験した実験(図4aを参照のこと)から、これらのリガ ンドは蚊に対して忌避性を示すことが示唆される(表E2)。 *相対的忌避性=[(逃避反応%+肢上げ反応%)×沸点]/100 予め選択された機能的特徴または性質を呈する新しい化学構造をデザインする 本明細書中に開示された方法について、実施例だけを用いて説明してきた。例え ば、この方法は、分極率、双極子モーメント、共有結合半径などの他の既知の許 容しうる値を用いて容易に実施可能である。更に、モジュール中におけるプロセ スの計算工程を示すフローチャートは、例示だけを目的としたものである。例え ば、親和力の計算は、本明細書中で使用したものよりも少ない近似を使用した入 手可能なコンピュータパッケージを用いて行うこともできる。新しい化学構造を 作製する方法は、最初に、類似の機能的特徴を有する既知の標的化合物に対して 所定の親和力を呈する1つ以上のシュミレートした受容体を作製し、これらの受 容体を用いて、所望の程度までこれらの特徴を呈する新規な化学構造を作製させ ることに基づくものであった。受容体自体を、新規な化学構造を生成させる以外 の用途に、例えば、既知の化合物の薬学的性質または毒物学的性質をスクリーニ ングする手段として、使用してもよい。従って、本発明の範囲を逸脱することな く、本明細書中に開示された方法に多くの変更を加えることができることは、当 業者には分かるであろう。 表I:遷移状態および追加因子 古い状態 追加因子 以下の回転に対する新しい状態 アルゴリズムに対する式:入力(古い状態,回転) ⇒出力(Δx,Δy,Δz,新しい状態) 例:初期位置(12,34,-18);入力:古い状態=10,回転=右: 出力:新しい状態=6,Δx=0,Δy=1,Δz=0:後続位置(12,35,-18)表2:ファンデルワールス半径 出典:N.S.Issacs,1987.Physical Organic Chemistry.Longman Scientific and Technical,New York.828 pp. 表3:共有結合半径(pm) 結合次数 N.S.Issacs(1987)中の値に基づく。表4:荷電部位の割当てに使用した代表的な有効双極子の値 *ほとんどの条件下で好ましい値 各標的原子は、8つの値の組{xi,yi,zi,ri,bri,cri,di,αi}で完全 に記述される。ただし、xi、yi、ziは、分子の幾何中心に対する位置座標であり 、ri=ファンデルワールス半径、bri=結合半径または共有結合半径、cri=衝突 半径(=ri+0.5)、αi=分極率、およびdi=有効双極子モーメントの値である 。表5:特定の標的原子に対して選択された相対有効分極率 *分子の分極率から計算した値 ?適切な分子データから値を決定することができる。 モジュール1:シュミレートした受容体に対するコードの作製 ステップ1 コード作製パラメータ:i)コード長およびii)指令頻度、を入力 する。 ステップ2 空の文字鎖で初期化してコードを保存する。 ステップ3 乱数を発生させる。 ステップ4 乱数および指令頻度に基づいて文字{‘0’,‘1’,..., ‘6’}を選択し、コード鎖に連結する。鎖長がコード長の設定 値に等しくなるまでステップ4を繰り返す。 ステップ5 コードを出力する。 モジュール2:シュミレートした受容体に対するコードの翻訳 ステップ1 受容体を含むポリマーに対する原点座標を入力する。 ステップ2 ポリマーに対するコードを入力する。 ステップ3 コードから最初の文字を読む。 ステップ4 文字が転回指令である場合、翻訳アルゴリズムを使用してサブユ ニットの座標を決定する。それ以外の場合、ステップ7に進む。 ステップ5 サブユニットの座標を保存する。サブユニットに対して荷電値0 を割当てる。 ステップ6 文字がコード中の最後の文字でない場合、ステップ3を繰り返す 。それ以外の場合、次に進む。 ステップ7 文字が荷電指令の場合、翻訳アルゴリズムを使用し、転回なしと 仮定してサブユニットの座標を決定する。 ステップ8 サブユニットの座標を保存する。文字に基づいて、サブユニット に対して荷電値+1または-1を割当てる。 ステップ9 文字がコード中の最後の文字でない場合、ステップ3を繰り返す 。それ以外の場合、次に進む。 ステップ10 受容体を含むポリマーのそれぞれに対してステップ2〜9を繰り 返す。 ステップ11 サブユニットの座標および荷電値を出力する。 モジュール3:標的の提示 ステップ1 標的原子の座標および半径(xti,yti,zti,半径i)を入力 する。 (i=標的中の原子の番号) 受容体の座標(xrj,yrj,zrj,電荷j)を入力する。 (j=受容体中のサブユニットの番号) ステップ2 ランダムな角度値(Δθ,Δφ)および並進値(kx,ky)を発 生させる。 ステップ3 ランダムな量で原子座標の回転および並進を行う。 ステップ3a 標的座標を極形式に変換する。 (xti,yti,zti,半径i)⇒(θi,φi,ρi,半径 i) ステップ3b 角度にランダムな変化を与える。 (θi,φi,ρi,半径i)⇒(θi+Δθ,φi+Δφ ,ρi,半径i) ステップ3c 直角座標に変換する。 (θi+Δθ,φi+Δφ,ρi,半径i)⇒(xi,yi, zi,半径i) ステップ3d ランダムな並進を加える。 (xni,yni,zni,半径i)=(xi+kx,yi+ky,z i,半径i) ステップ4 標的座標の中心を原点(0,0,0)に置く。 ステップ4a xni、yni、およびzniの最大値および最小値を求める。 ステップ4b 受容体の幾何中心を求める: xn中心=(xn最大値−xn最小値)/2、yn中心=(yn最大値−yn 最小値)/2、zn中心=(zn最大値−zn最小値)/2。 ステップ4c 中心移動した座標を計算する: (xncj,yncj,zncj)=(xni−xn中心,yni−yn中心 , znj−zn最大値)。 ステップ5 原子半径および変換された座標(xncj,yncj,zncj,半径 i)を用いて標的の衝突面g(xg,yg)=zgを構築する。 ステップ5a 受容体サブユニットの直径(=1)に等しい間隔のグリッドを作 製する。 グリッドの座標: xg∈{Int(xn最小値−xn中心),Int(xn最小値−xn中 心)+1...0,..Int(xn最大値−xn中心)−1,Int(xn最大値−xn中 心)} yg∈{Int(yn最小値−yn中心),Int(yn最小値−yn中 心)+1...0,..Int(yn最大値−yn中心)−1,Int(yn最大値−yn中 心)} グリッド上のすべての点において、g(xg,yg)の初期値を 0に設定する。 ステップ5b 次の規則に従って、各原子(i)に対して、各グリッド点(xg,y g)のg(xg,yg)(高さ)の値を設定する: For i=1 to 標的中の原子数 If(xnci-xp)2+(ynci+yp)2<半径i2then g(xg,yg)=最小(g(xg,yg),znci-半径i) Else If(xnci-xp)2+(ynci+yp)2<(半径i+.5)2then g(xg,yg)=最小(g(xg,yg),znci-(半径i/ 2)) Else g(xg,yg)=最小(g(xg,yg),0) Nexti ステップ6 受容体の座標の中心を原点(0,0)に置く。 ステップ6a xrj、yrj、およびzrjの最大値および最小値を求める。 ステップ6b 受容体の幾何中心を求める: xr中心=(xr最大値−xr最小値)/2、 yr中心=(yr最大値−yr最小値)/2、 zr中心=(zr最大値-zr最小値)/2。 ステップ6c 中心移動した受容体の座標を計算する: (xcj,ycj,zcj) =(xrj−x中心,yrj−y中心,zrj −z最小値)。 ステップ7 次の規則に従い、中心移動した受容体の座標を用いて受容体の衝 突面s(xs,ys)=zsを構築する: s(xcj,ycj)のすべての初期値を0に設定する。 for j=1 to 受容体中のサブユニットの数 if zcj>s(xcj,ycj) then s(xcj,ycj)=zcj next j ステップ8 受容体の衝突面と標的の衝突面との最小分離を求める。 次のように差マトリックスd(xg,yg)を計算する: xg∈{Int(xn最小値−xn中心),Int(xn最小値−xn中心) +1...0,..Int(xn最大値−xn中心)−1,Int(xn最大値−xn中 心)} および yg∈{Int(yn最小値−y中心),Int(yn最小値−yn中心)+ 1...0,..Int(yn最大値−yn中心)−1,Int(yn最大値−yn中心)} のすべてに対して、 d(xg,yg)=(h(xg,yg)−zn最小値+zn最大値)+ (s(xg,yg)−zr最小値+zr最大値) を計算する。 すべてのxg,ygに対して、d(xg,yg)の最小値=dmin を求める。 dminは最小分離距離である。 ステップ9 衝突立体配置を求めるために、標的の座標および受容体の座標を 変換する。 受容体の座標変換: (xreceptorj,yreceptorj,zreceptorj)= (xcj,ycj,zcj+z r最小値-zr最大値) 標的の座標変換: (xtargeti,ytargeti,ztargeti)= (xnci,ynci,znc i-zn最小値+zn最大値-dmin) ステツプ10 (xtargeti,ytargeti,ztargeti)および(xreceptorj,yrece ptorj,zreceptorj)を用いて親和力を計算する。 試験対象の各標的の立体配置に対して、ステップ2〜9を繰 り返す。 モジュール4:親和力の計算 ステップ1 標的および受容体の衝突座標(xtargeti,ytargeti,ztarget i)および(xreceptorj,yreceptorj,zreceptorj)を入力する 。 ただし、 i=標的中の原子の数、j=受容体中のサブユニットの数で ある。 ステップ2 標的に対する双極子モーメントの値dip(i)を入力する。 受容体に対する荷電の値charge(j)を入力する。 ステップ3 近接度計算のための閾値THRESH0LDを入力する。 ステップ4 双極子親和力値を計算する。 ステップ4a 各荷電サブユニット(charge(j)≠0)に対して、 e(i,j)=dip(i)/((xtargeti−xreceptorj)2+ (ytargeti−yreceptorj)2+(ztargeti−zreceptorj)2)1.5 を計算する。 ステップ4b charge(j)≠0であるiおよびjのすべての組合せに対して、e(i, j)の合計を計算する。 DIPOLE=Σe(i,j) ステップ5 近接度の値を計算する(このステップは、分極率に基づく計算で 置き換えることができる)。 ステップ5a │dip(j)│≦0.75である各標的原子に対して、 1(i,j)=((xtargeti−xreceptorj)2+ (ytargeti−yreceptorj)2+(ztargeti−zreceptorj ) 2)0.5 を計算する。1(i,j)<THRESHOLDのとき、prox(i,j)=1と する。 ステップ5b │dip(j)│≦0.75であるiおよびjのすべての組合せに対して、 prox(i,j)の合計を計算する。 PROXIMITY=Σprox(i,j) ステップ6 標的基質の組合せに対する親和力値=AFFINITYを計算する。 AFFINITY=(PROXIMITY/j)((PROXIMITY/10000)+DIPOLE) モジュール5:適合度の計算 ステップ1 既知の標的の効力または親和力の値(yk)を入力する。ただし、 k=試験対象の標的の数である。 ステップ2 標的および受容体の衝突座標(xtargeti,ytargeti,ztarget i)および(xreceptorj,yreceptorj,zreceptorj)を入力する 。 ただし、 ik=標的k中の原子の数、j=受容体中のサブユニットの 数である。 ステップ3 試験される標的の配向の数(=m)を入力する。 ステップ4 モジュール5を使用して、各標的および各標的の配向に対する親 和力値(AFFINITYk,m)を求める。 ステップ5 各標的に対する最大親和力値(MAk)および合計親和力値(SA k)を決定する。 ステップ6 最大親和力値(MAk)と既知の標的の効力または親和力の値(y k)との相関係数rMA 2、または合計親和力値(SAk)と既知の標 的の効力または親和力の値(yk)との相関係数rSA 2を計算する。 ステップ7 適合係数Fを計算する。 F=(rMA 2×rSA 2)0.5 別法 ステップ6’ 最大親和力値(MAk)と既知の標的の効力または親和力の値(y k)との相関係数rMA 2、または合計親和力値(SAk)−最大親和 力値と既知の標的の効力または親和力の値(yk)との相関係数rSA -MA 2を計算する。 ステップ7’ 適合係数Fを計算する。 F=(rMA 2×(1−rSAMA)2)0.5 モジユール6:最小レベルの親和力を有する遺伝子型の作製 ステップ1 適合度の最小閾値を設定する。 ステップ2 ランダムな遺伝子型を発生させる(モジュール1)。 ステップ3 遺伝子型を翻訳し、表現型を構築する(モジュール2)。 ステップ4 標的に対する表現型の親和性を試験する(モジユール3、4、5、 6)。 ステップ5 表現型の適合度が適合度の閾値を超えた場合、コードの作製を中 断し、コードを第2段階に送る。それ以外の場合はステップ1〜5 を繰り返す。 モジュール7:多重突然変異 ステップ1 初期コードを入力する(第1段階)。 ステップ2 コード1つ当たりの突然変異の数(=q)を設定する(本発明を 実施する場合、遺伝子型中の文字の2.5〜5%に突然変異を起こ す)。 ステップ3 集団のサイズ(=p)を入力する。 ステップ4 遺伝子型中の位置をランダムに選択する。 ステップ5 選択された位置のコード文字をランダムに選ばれた異なる文字と 入れ替える。 ステップ6 ステップ4および5をq回繰り返す。 ステップ7 ステップ4〜6を繰返し、合計p個の新しいコードを発生させる。 ステップ8 モジュール1〜6を適用し、突然変異体集団の適合度を試験する。 最も高い選択性を有する亜集団を選択し、第3段階で使用する。 モジュール8:組換え ステップ1 集団のサイズ(=P)を設定する。 ステップ2 第2段階で発生させた集団からランダムに2つのコードを選択す る。 ステップ3 遺伝子型中の位置をランダムに選択する。 ステップ4 交換する文字の数を決めるために乱数を発生させる。 ステップ5 コード間で、選択された位置から始まる文字を入れ替える。 ステップ6 P個の新しい遺伝子型が生じるまでステップ2〜5を繰り返す。 ステップ7 モジュール2〜6を適用し、突然変異体集団の適合度を試験する。 最も高い選択性を有する亜集団を選択し、次の組換えシリーズま たは第4段階の成熟で使用する。 モジュール9:成熟 ステップ1 第3段階から誘導された親コードを入力する。 ステップ2 繰返し回数を設定する。 ステップ3 親遺伝子型中の位置をランダムに選択する。 ステップ4 その位置のコード文字をランダムに選ばれた異なる文字と入れ替 える。 ステツプ5 モジュール2〜6を用いて親コードの選択性(Fp)および突然変 異産物の選択性(FM)を試験する。 ステップ6 FM≧Fpの場合、親遺伝子型を突然変異産物で置き換える。 ステップ7 必要な繰返し回数だけステップ3〜6を繰り返す。 モジュール10:環を有する炭素骨格を発生するコードの作製 (6員環、入口点=出口点) ステップ1 コードの長さを設定する。 v1、v2、v3、...vn(置換基の頻度)を設定する。 prob_ring(環コード配列の頻度)を設定する。 (0≦prob_ring≦1) ステップ2 prime_code=""に初期化する。 second_code=""に初期化する。 third_code=""に初期化する。 ステップ3 文字鎖を形成する。 コード長に達するまでステップ4を繰り返す。 ステツプ4a If probe_ring>random(0≦random≦1)Then 環(舟形)に対する文字を割当てる。 {'431413','314134','141343','132132','321321' ,'213213','123123','231231','312312','42141 2','214124','141242','324234','242343','423 432'}からランダムに選択されたメンバーをnew character_l に設定する。 置換基に対する文字を割当てる。 頻度v1、v2、v3、...vnを使用して、{c1,c2,c3,.. .,cn}からランダムに選択された6つのメンバーをnew chara cter_2に設定する。(cl..cnは、異なる官能基を規定する文字 である) 置換基の価数に対する文字を割当てる。 {'1','2','3','4'}からランダムに選択された6 つのメンバーをnew character 3に設定する。 Else ステップ4b 初期コードに対する単一(非環)文字を割当てる。 {'1','2','3','4'}からランダムに選択されたメンバ ーをnew character 1に設定する。 置換基に対する文字を割当てる。 頻度v1、v2、v3、...vnを使用して、{cl,...,cn}からラ ンダムに選択されたメンバーをnew character 2に設定する。 置換基の価数に対する文字を割当てる。 {'1','2','3','4'}からランダムに選択されたメンバー をnew_character_3に設定する。 ステップ4c 新しい文字をコード鎖に連結する。 Prime_code=Prime_code & new character_1 Second_code=Second_code & new character_2 Third_code=Third_code & new_ character_3 モジュール11:多重点突然変異 ステップ1 初期コードを入力する。 ステップ2 コード1つ当たりの突然変異の数(=q)を設定する(本発明を 実施する場合、遺伝子型中の文字の2.5〜5%に突然変異を起こ す)。 ステップ3 集団のサイズ(=p)を入力する。 ステップ4 遺伝子型中の位置をランダムに選択する。 ステップ5 各コードベクター中の該選択された位置のコード文字をランダム に選ばれた異なる文字と入れ替える。 ステップ6 ステップ4および5をq回繰り返す。 ステップ7 ステップ4〜6を繰返し、合計p個の新しいコードを発生させる。 ステップ8 突然変異体集団の各メンバーの適合度を試験する。最も高い適合 度を有する亜集団を選択し、組換えまたは追加の多重突然変異で 使用する。 モジユール12:配列突然変異 ステップ1 突然変異の発生に対する閾レベルとして、PDEL、PINV、PINS、お よびPDUPを設定する(0≦PX≦1)。 ステップ2 コード中のランダムな位置(=x)を発生させる(0≦p≦コードの 長 さ)。 ステップ3 ランダムな長さ(=L)の配列を発生する(0≦L≦コードの長さ−x) 。 ステップ4 位置xから始まる合計L個の文字の配列をコードからコピーする 。 ステップ5 If O≦PINV≦乱数≦1 Then 鎖中の文字の順序を反転する。 ステツプ6 If≦PDUP≦乱数≦1 Then 配列をコピーして、コピーを配列に連結する。 ステップ7 If O≦PDEL≦乱数≦1 Then 位置xから始まるL個の文字をコードから削除する。 Else コード中の配列を、ステップ5および6で発生させた 配列で置き換える。 ステップ8 If O≦PINS≦乱数≦1 Then コード中の位置(=y)をランダムに発生させる(0≦y≦ コードの長さ)。 ステップ5および6で発生させた配列を位置yに挿入 する。 モジュール13:組換え ステップ1 集団のサイズ(=P)を設定する。 ステップ2 多重突然変異で発生させた集団からランダムに2つのコードを選 択する。 ステップ3 遺伝子型中の位置をランダムに選択する。 ステップ4 交換する文字の数を決めるために乱数を発生させる。 ステップ5 3つのコードベクターのそれぞれの間で、選択された位置から始 まる文字を入れ替える。 ステップ6 P個の新しい遺伝子型が生じるまでステップ2〜5を繰り返す。 ステツプ7 得られた突然変異体集団中で各リガンドの適合度を試験する。最 も高い適合度を有する亜集団を選択し、次の組換えシリーズまた は成熟で使用する。 モジュール14:成熟 ステップ1 組換えから誘導された親コードを入力する。 ステップ2 繰返し回数を設定する。 ステップ3 親遺伝子型中の位置をランダムに選択する。 ステップ4 各コードベクター中の該選択された位置のコード文字をランダム に選ばれた異なる文字と入れ替える。 ステップ5 モジュール4および5を用いて親コードの適合度(FP)および突 然変異産物の適合度(FM)を試験する。 ステップ6 FM≧FPの場合、親遺伝子型を突然変異産物で置き換える。 ステップ7 必要な繰返し回数だけステップ3〜6を繰り返す。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(KE,LS,MW,SD,S Z,UG),EA(AM,AZ,BY,KG,KZ,MD ,RU,TJ,TM),AL,AM,AT,AU,AZ ,BB,BG,BR,BY,CA,CH,CN,CZ, DE,DK,EE,ES,FI,GB,GE,HU,I S,JP,KE,KG,KP,KR,KZ,LK,LR ,LS,LT,LU,LV,MD,MG,MK,MN, MW,MX,NO,NZ,PL,PT,RO,RU,S D,SE,SG,SI,SK,TJ,TM,TR,TT ,UA,UG,UZ,VN

Claims (1)

  1. 【特許請求の範囲】 1. 予め選択された機能特性を有する化学構造を設計するためのコンピュー ターに基づく方法であって、 (a)線形文字配列にコードされているシミュレートされた受容体表現型の物 理的モデルを作製し、少なくともひとつの定量可能な機能特性を共有する一組の 標的分子を用意し、 (b)各標的分子に対して、 (i)有効な親和力計算を用いて、該受容体と該標的分子との間の親和力を 複数の配向の各々で計算し、 (ii)計算された親和力を合計することによって合計親和力を計算し、 (iii)最大親和力を同定し、 (c)計算された合計親和力および最大親和力を用いて、 (i)該最大親和力と該定量可能な機能特性との間の最大親和力相関係数を 計算し、 (ii)該合計親和力と該定量可能な機能特性との間の合計親和力相関係数を 計算し、 (d)該最大相関係数および該合計相関係数を用いて適合係数を計算し、 (e)該受容体の構造を変化させ、予め選択された適合係数を有する受容体の 集団が得られるまで工程(b)〜(d)を繰返し、 (f)分子線形文字配列にコードされた化学構造の物理的モデルを用意し、前 記有効な親和力計算値を用いて複数の配向にある各受容体と該化学構造との間の 親和力を計算し、計算された親和力を用いて親和力適合性スコアを計算し、 (g)該化学構造を変化させて化学構造の変形体を生成させ、工程(f)を繰 返し、 (h)その親和カスコアが予め選択した親和カスコアに近い化学構造 の変形体を保持し、かつさらに変化させる、 各工程を含んでなる前記方法。 2. 前記のシミュレートされた受容体遺伝子型を生成させる工程が空間占有 および電荷をコードする受容体線形文字配列を作製することを含み、前記の化学 構造の物理的モデルを作製する工程が空間的占有および電荷をコードする前記分 子線形文字配列を作製することを含む、請求項1記載の方法。 3. 前記有効な親和力計算が2つの測定値を含み、第一のものは、前記シミ ュレートされた受容体の非荷電部分で、前記分子構造上の非極性領域に充分近く て有効なロンドンの分散力を生じさせる部分の割合を見積もる近似測定値であり 、第二のものは、前記シミュレートされた受容体の荷電部分と前記分子構造中に 存在する双極子との間で発生する電荷‐双極子静電力相互作用の合計強さである 、請求項2記載の方法。 4. Σ{│計算された最大親和力−標的最大親和力│/標的最大親和力}で 、前記予め選択された適合スコアが実質的にゼロである。 5. 前記親和力適合スコアを計算する工程が前記分子構造と各受容体との間 の合計親和力および最大親和力を計算することを含んでおり、その適合スコアが Σ{(│計算された最大親和力−標的最大親和力│/2×標的最大親和力)+( │計算された合計親和力−標的合計親和力│/2×標的合計親和力)}で計算さ れ、前記予め選択された適合スコアが実質的にゼロである、請求項2記載の方法 。 6. 前記合計親和力相関係数がrSA 2であり、前記最大親和力相関係数がrM A 2 であり、前記適合係数がF=(rMA 2×rSA 20.5であり、前記予め選択され た適合係数が実質的に単一である、請求項2記載の方法。 7. 前記合計親和力相関係数がrSAMA 2であり、前記最大親和力相関係数 がrMA 2であり、前記適合係数がF=(r2 MA×(1−rSA 2))0.5であり、前記 予め選択された適合係数が実質的に単一である、請求項2記載の方法。 8. 前記分子線形文字配列が複数の連続文字トリプレットを含み、該トリプ レットの第一の文字が前記分子構造の分子骨格中の占有原子の位置と種類を特定 する第一の文字セットの中からランダムに選択され、該トリプレットの第二の文 字が該占有原子に結合した置換基の種類を特定する第二の文字セットの中からラ ンダムに選択され、該トリプレットの第三の文字が該トリプレットの第一の文字 によって特定される原子上の該置換基の位置を特定する第三の文字セットの中か らランダムに選択される、請求項2記載の方法。 9. 前記分子線形配列からの各トリプレットを連続的に翻訳した後で前記分 子骨格上の占められてない位置を水素原子で充填する有効分子組立アルゴリズム を用いて前記分子線形文字配列を解読する、請求項8記載の方法。 10. 前記分子構造を変異させる工程が、i)少なくともひとつのトリプレ ットの前記第一、第二および第三の文字の少なくともひとつを関連する文字セッ トの中からランダムに交換することによって前記分子遺伝子型を変異させる工程 、ii)分子遺伝子型からのトリプレットを欠失させる工程、iii)分子遺伝子型 中のトリプレットを重複させる工程、iv)ひとつ以上のトリプレットの順序を反 転させる工程、およびv)分子遺伝子型からのトリプレットを分子遺伝子型中の 異なる位置に挿入する工程の少なくともひとつの工程を含む、請求項9記載の方 法。 11. 前記分子遺伝子型を変異させる工程が、前記保持された変異分子遺伝 子型のランダムに選択された対を組換えることにより前記分子線形配列中の対応 する文字を交換することを含む、請求項10記載の方法。 12. 受容体線形文字配列中の各文字が空間転回指示のひとつおよび転回を 伴なわない荷電部位を特定する、請求項2記載の方法。 13. 前記受容体表現型が複数のサブユニットをもつ少なくともひとつの線 状ポリマーを含み、該サブユニットのひとつが該少なくともひとつの線状ポリマ ー中の第一のサブユニットである、請求項12記載の 方法。 14. 前記第一のサブユニットに続く各サブユニットに適用された転回指示 が前記第一のサブユニットの最初の位置に関して行なわれる有効受容体組立アル ゴリズムを用いて前記受容体線形文字配列を解読する、請求項13記載の方法。 15. 空間転回指示を特定する前記文字が転回なし、右転回、左転回、上転 回、下転回をコードしており、荷電部位を特定する文字が転回なしの正荷電部位 および転回なしの負荷電部位をコードする、請求項14記載の方法。 16. 前記サブユニットが水素のファンデルワールス半径に実質的に等しい ファンデルワールス半径を有する実質的な球状である、請求項14記載の方法。 17. 前記受容体遺伝子型を変異させる工程が、i)受容体遺伝子型からの 文字を欠失させる工程、ii)受容体遺伝子型中の文字を重複させる工程、iii) 受容体遺伝子型中のひとつ以上の文字の順序を反転させる工程、およびiv)受容 体遺伝子型からの文字を該遺伝子型中の異なる位置に挿入する工程の少なくとも ひとつの工程を含む、請求項15記載の方法。 18. 前記受容体遺伝子型を変異させる工程が、前記保持された変異受容体 遺伝子型のランダムに選択された対を組換えることにより前記受容体線形配列中 の対応する文字を交換することを含む、請求項17記載の方法。 19. 予め選択した機能特性に関して化学構造をスクリーニングする方法で あって、 a)空間占有および電荷をコードする受容体線形文字配列を作製することによ ってシミュレートされた受容体遺伝子型を生成させ、 b)該遺伝子型を解読して受容体表現型を生成させ、選択された機能特性を示 す少なくひとつの標的分子を提供し、有効な親和力計算を用いて複数の配向で該 受容体と各標的分子との間の親和力を計算し、各標的 分子と受容体との間の合計親和力および最大親和力を計算し、該標的分子の該機 能特性に対する合計親和力の合計親和力相関係数および該機能特性に対する最大 親和力の最大親和力相関係数を計算し、該合計親和力相関係数および該最大親和 力相関係数に依存する適合係数を計算し、 c)受容体遺伝子型を変異させ、かつ工程b)を繰返し、予め選択された適合 係数をもつ受容体の集団が得られるまで、増大した適合係数を示す受容体を保持 し、かつ変異させ、そして d)該有効な親和力計算を用いて複数の配向でスクリーニングしようとする化 学構造と各受容体との間の親和力を計算し、親和力適合スコアを計算する(但し 、これは、化合物と各受容体との間の合計親和力および最大親和力を計算し、該 合計親和力および該最大親和力の少なくともひとつを該少なくともひとつの標的 と該受容体の集団との間の合計親和力および最大親和力と比較することを含み、 これによりこの比較が、該少なくともひとつの標的分子に対する該化学構造の機 能活性のレベルを示すことになる)、 各工程を含んでなる前記方法。 20. 前記有効な親和力計算が2つの測定値を含み、第一のものは、前記シ ミュレートされた受容体の非荷電部分で、前記分子構造上の非極性領域に充分近 くて有効なロンドンの分散力を生じさせる部分の割合を見積もる近似測定値であ り、第二のものは、前記シミュレートされた受容体の荷電部分と前記分子構造中 に存在する双極子との間で発生する電荷‐双極子静電力相互作用の合計強さであ る、請求項19記載の方法。 21. 前記適合スコアが、Σ{│計算された最大親和力−標的最大親和力│ /標的最大親和力}で計算される、請求項20記載の方法。 22. 前記適合スコアが、Σ{(│計算された最大親和力−標的最大親和力 │/2×標的最大親和力)+(│計算された合計親和力−標的合計親和力│/2 ×標的合計親和力)}で計算される、請求項20記載の方法。 23. 前記合計親和力相関係数がrSA 2であり、前記最大親和力相 関係数がrMA 2であり、前記適合係数がF=(rMA 2×rsA 20.5であり、前記予 め選択された適合係数が実質的に単一である、請求項20記載の方法。 24. 前記合計親和力相関係数がrSA 2であり、前記最大親和力相関係数が rMA 2であり、前記適合係数がF=(rMA 2×(1−rSAMA 2))0.5前記予め選 択された適合係数が実質的に単一である、請求項20記載の方法。 25. 前記受容体線形文字配列中の各文字が空間転回指示のひとつおよび転 回を伴なわない荷電部位を特定する、請求項20記載の方法。 26. 前記受容体表現型が複数のサブユニットをもつ少なくともひとつの線 状ポリマーを含み、該サブユニットのひとつが該少なくともひとつの該線状ポリ マー中の第一のサブユニットである、請求項25記載の方法。 27. 前記第一のサブユニットに続く各サブユニットに適用された転回指示 が前記第一のサブユニットの最初の位置に関して行なわれる有効受容体組立アル ゴリズムを用いて前記受容体線形文字配列を解読する、請求項26記載の方法。 28. 空間転回指示を特定する前記文字が転回なし、右転回、左転回、上転 回、下転回をコードしており、荷電部位を特定する文字が転回なしの正荷電部位 および転回なしの負荷電部位をコードする、請求項27記載の方法。 29. 前記サブユニットが水素のファンデルワールス半径に実質的に等しい ファンデルワールス半径を有する実質的な球状である、請求項28記載の方法。 30. 前記受容体遺伝子型を変異させる工程が、i)受容体遺伝子型からの 文字を欠失させる工程、ii)受容体遺伝子型中の文字を二重にする工程、iii) 受容体遺伝子型中のひとつ以上の文字の順序を反転させる工程、およびiv)受容 体遺伝子型からの文字を該遺伝子型中の異なる位置に挿入する工程の少なくとも ひとつの工程を含む、請求項27 記載の方法。 31. 前記受容体遺伝子型を変異させる工程が、前記保持された変異受容体 遺伝子型のランダムに選択された対を組換えることにより前記受容体線形配列中 の対応する文字を交換することを含む、請求項30記載の方法。 32. 類似の機能特性をもつ化合物に対して選択的親和力を示す生物学的受 容体に類似するシミュレートされた受容体を設計する方法であって、 a)空間占有および電荷をコードする受容体線形文字配列を作製することによ ってシミュレートされた受容体遺伝子型を生成し、 b)該遺伝子型を解読して受容体表現型を生成させ、類似の機能特性を共有す る一組の標的分子を用意し、有効な親和力計算を用いて複数の配向で受容体と各 標的分子との間の親和力を計算し、各標的分子と受容体との間の合計親和力およ び最大親和力を計算し、各標的分子の機能特性に対する合計親和力の合計親和力 相関係数および各標的分子の該機能特性に対する最大親和力の最大親和力相関係 数を計算し、各標的分子に対する該合計親和力相関係数および該最大親和力相関 係数に依存する適合係数を計算し、そして c)該遺伝子型を変異させ、かつ工程b)を繰返し、予め選択された適合係数 をもつ受容体の集団が得られるまで、増大した適合係数を示す受容体を保持し、 かつ変異させる、 各工程を含んでなる前記方法。 33. 前記受容体線形文字配列中の各文字が空間転回指示のひとつおよび転 回を伴なわない荷電部位を特定する、請求項32記載の方法。 34. 前記受容体表現型が複数のサブユニットをもつ複数の線状ポリマーを 含み、各線状ポリマーが対応する線形文字配列によってコードされ、該サブユニ ットのひとつが該少なくともひとつの線状ポリマー中の第一のサブユニットであ る、請求項33記載の方法。 35. 前記第一のサブユニットに続く各サブユニットに適用された 転回指示が前記第一のサブユニットの最初の位置に関して行なわれる有効受容体 組立アルゴリズムを用いて前記受容体線形文字配列を解読する、請求項34記載 の方法。 36. 空間転回指示を特定する前記文字が転回なし、右転回、左転回、上転 回、下転回をコードしており、荷電部位を特定する文字が転回なしの正荷電部位 および転回なしの負荷電部位をコードする、請求項35記載の方法。 37. 前記サブユニットが水素のファンデルワールス半径に実質的に等しい ファンデルワールス半径を有する実質的な球状である、請求項36記載の方法。 38. 前記受容体遺伝子型を変異させる工程が、i)受容体遺伝子型からの 文字を欠失させる工程、ii)受容体遺伝子型中の文字を重複させる工程、iii) 受容体遺伝子型中のひとつ以上の文字の順序を反転させる工程、およびiv)受容 体遺伝子型からの文字を遺伝子型中の異なる位置に挿入する工程の少なくともひ とつの工程を含む、請求項35記載の方法。 40. 前記受容体遺伝子型を変異させる工程が、前記保持された変異受容体 遺伝子型のランダムに選択された対を組換えることにより前記受容体線形配列中 の対応する文字を交換することを含む、請求項39記載の方法。 41. 前記有効な親和力計算が2つの測定値を含み、第一のものは、前記シ ミュレートされた受容体の非荷電部分で、前記分子構造上の非極性領域に充分近 くて有効なロンドンの分散力を生じさせる部分の割合を見積もる近似測定値であ り、第二のものは、前記シミュレートされた受容体の荷電部分と前記分子構造中 に存在する双極子との間で発生する電荷‐双極子静電力相互作用の合計強さであ る、請求項33記載の方法。 42. 前記合計親和力相関係数がrSA 2であり、前記最大親和力相関係数が rMA 2であり、前記適合係数がF=(rSA 2×rMA 20.5であり、前記予め選択さ れた適合係数が実質的に単一である、請求項41記 載の方法。 43. 前記合計親和力相関係数がrSAMA 2であり、前記最大親和力相関係 数がrMA 2であり、前記適合係数がF=(rMA 2×(1−rSAMA 20.5であり、 前記予め選択された適合係数が実質的に単一である、請求項41記載の方法。 44. 予め選択された機能特性を有する化学構造を設計するためのコンピュ ーターに基づく方法であって、 (a)少なくともひとつの定量可能な機能特性を共有する一組の標的分子およ び受容体の物理的モデルを用意し、 (b)各標的分子に対して、 (i)有効な親和力計算を用いて、該受容体と該標的分子との間の親和力を 複数の配向の各々で計算し、 (ii)計算された親和力を合計することによって合計親和力を計算し、 (iii)最大親和力を同定し、 (c)計算された合計親和力および最大親和力を用いて、 (i)該最大親和力と該定量可能な機能特性との間の最大親和力相関係数を 計算し、 (ii)該合計親和力と該定量可能な機能特性との間の合計親和力相関係数を 計算し、 (d)該最大相関係数および該合計相関係数を用いて適合係数を計算し、 (e)予め選択された適合係数を有する受容体の集団が得られるまで、該受容 体の構造を変化させ、かつ工程(b)〜(d)を繰返し、 (f)化学構造の物理的モデルを用意し、該有効な親和力計算を用いて複数の 配向にある各受容体と該化学構造との間の親和力を計算し、計算された親和力を 用いて親和力適合スコアを計算し、 (g)化学構造を変化させて該化学構造の変形体を生成させ、工程(f)を繰 返し、 (h)その親和力スコアが予め選択した親和力スコアに近い化学構造の変形体 を保持し、かつさらに変化させる、 各工程を含んでなる前記方法。 45. 前記の受容体の物理的モデルを用意する工程が空間的占有および電荷 をコードする受容体線形文字配列を作製することを含み、前記の化学構造の物理 的モデルを作製する工程が空間的占有および電荷をコードする線形文字配列を作 製することを含む、請求項44記載の方法。 46. 前記化学構造の前記線形文字配列が複数の連続文字トリプレットを含 み、該トリプレットの第一の文字が前記化学構造の分子骨格中の占有原子の位置 と種類を特定する第一の文字セットの中からランダムに選択され、該トリプレッ トの第二の文字が該占有原子に結合した置換基の種類を特定する第二の文字セッ トの中からランダムに選択され、該トリプレットの第三の文字がトリプレットの 該第一の文字によって特定される原子上の該置換基の位置を特定する第三の文字 セットの中からランダムに選択される、請求項45記載の方法。 47. 前記の分子の線形配列からの各トリプレットを連続的に翻訳した後で 前記分子骨格上の占められてない位置を水素原子で充填する有効分子組立アルゴ リズムを用いて化学構造線形文字配列を解読する、請求項46記載の方法。 48. 原子要素を含む化学構造をコードする方法であって、該化学構造の各 原子に対する空間占有と電荷をコードする線形文字配列を用意することを含んで なる前記方法。 49. 前記化学構造の前記線形文字配列が複数の連続文字トリプレットを含 み、該トリプレットの第一の文字が前記化学構造の分子骨格中の占有原子の位置 と種類を特定する第一の文字セットの中から選択され、該トリプレットの第二の 文字が該占有原子に結合した置換基の種類を特定する第二の文字セットの中から 選択され、該トリプレットの第三の文字が該トリプレットの第一の文字によって 特定される原子上の該置換基の位置を特定する第三の文字セットの中から選択さ れる、請求項48記 載の方法。 50. 前記線形文字配列からの各トリプレットを連続的に翻訳した後前記分 子骨格上の占められてない位置を予め選択された原子で充填する有効分子組立ア ルゴリズムを用いて前記線形文字配列を解読する、請求項46記載の方法。 51. 前記線形文字配列をコンピューターでアクセス可能な記憶手段に保存 する工程を含む、請求項50記載の方法。 52. 前記機能特性が生物学的毒性である、請求項19記載の方法。 53. 前記機能特性が触媒活性である、請求項19記載の方法。
JP09533880A 1996-03-22 1996-03-22 共通の機能特性を有する化学構造をコンピューターによって設計する方法 Pending JP2000507940A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CA1996/000166 WO1997036252A1 (en) 1996-03-22 1996-03-22 Computational method for designing chemical structures having common functional characteristics

Publications (1)

Publication Number Publication Date
JP2000507940A true JP2000507940A (ja) 2000-06-27

Family

ID=4173144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09533880A Pending JP2000507940A (ja) 1996-03-22 1996-03-22 共通の機能特性を有する化学構造をコンピューターによって設計する方法

Country Status (4)

Country Link
EP (1) EP0888591A1 (ja)
JP (1) JP2000507940A (ja)
EA (1) EA001095B1 (ja)
WO (1) WO1997036252A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005215786A (ja) * 2004-01-27 2005-08-11 National Institute Of Information & Communication Technology 化学的遺伝プログラミング装置および化学的遺伝プログラミング方法
JP2005529158A (ja) * 2002-05-28 2005-09-29 ザ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・ペンシルベニア 両親媒性ポリマーのコンピュータ分析および設計のための方法、システムおよびコンピュータプログラム製品
JP2009509929A (ja) * 2005-09-12 2009-03-12 ジボダン エス エー 皮膚刺激を低減させるための局所的組成物
JPWO2022224336A1 (ja) * 2021-04-20 2022-10-27

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998038208A2 (en) * 1997-02-28 1998-09-03 Bearsden Bio, Inc. Method of determining protein-ligand interactions via computer modeling
WO2002041184A1 (en) * 2000-11-14 2002-05-23 Kyorin Pharmaceutical Co., Ltd. Method of searching for novel lead compound
AU2001215557A1 (en) * 2000-11-30 2002-06-11 Toyo Suisan Kaisha, Ltd. Method of designing the molecular structure of inhibitor to enzyme
US20180137256A1 (en) * 2016-11-16 2018-05-17 Paul MERRITHEW System and method of calculating the structure and properties of chemicals
JP7590697B2 (ja) 2019-08-19 2024-11-27 Jsr株式会社 化学構造発生装置、化学構造発生プログラム、及び化学構造発生方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5025388A (en) * 1988-08-26 1991-06-18 Cramer Richard D Iii Comparative molecular field analysis (CoMFA)
US5434796A (en) * 1993-06-30 1995-07-18 Daylight Chemical Information Systems, Inc. Method and apparatus for designing molecules with desired properties by evolving successive populations

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005529158A (ja) * 2002-05-28 2005-09-29 ザ・トラスティーズ・オブ・ザ・ユニバーシティ・オブ・ペンシルベニア 両親媒性ポリマーのコンピュータ分析および設計のための方法、システムおよびコンピュータプログラム製品
JP2005215786A (ja) * 2004-01-27 2005-08-11 National Institute Of Information & Communication Technology 化学的遺伝プログラミング装置および化学的遺伝プログラミング方法
US8108151B2 (en) 2004-01-27 2012-01-31 National Institute Of Information And Communications Technology Method and apparatus for chemical genetic programming
JP2009509929A (ja) * 2005-09-12 2009-03-12 ジボダン エス エー 皮膚刺激を低減させるための局所的組成物
JPWO2022224336A1 (ja) * 2021-04-20 2022-10-27
JP7619443B2 (ja) 2021-04-20 2025-01-22 富士通株式会社 情報処理プログラム、情報処理方法および情報処理装置

Also Published As

Publication number Publication date
EA199800843A1 (ru) 1999-02-25
AU712188B2 (en) 1999-10-28
WO1997036252A1 (en) 1997-10-02
EA001095B1 (ru) 2000-10-30
EP0888591A1 (en) 1999-01-07
AU4935096A (en) 1997-10-17

Similar Documents

Publication Publication Date Title
CN114464247B (zh) 基于抗原和抗体序列的结合亲和力预测方法和装置
EP4050612B1 (en) Method and device for designing compound
US6219622B1 (en) Computational method for designing chemical structures having common functional characteristics
CN112119464B (zh) 用于mhc肽结合预测的gan-cnn
Nicolaou et al. De novo drug design using multiobjective evolutionary graphs
Hinds et al. A lattice model for protein structure prediction at low resolution.
CN115116538A (zh) 一种蛋白质配体的亲和力预测方法、相关装置以及设备
US5699268A (en) Computational method for designing chemical structures having common functional characteristics
CN115512785A (zh) 基于注意力机制的三维蛋白质-配体活性预测方法
JPH08512159A (ja) 連続して分子群を進化させて、所望の特性を有する分子を設計する方法と装置
A. Nicolaou et al. Multi-objective optimization methods in de novo drug design
He et al. A divide‐and‐conquer approach to determine the Pareto frontier for optimization of protein engineering experiments
CN115713965B (zh) 基于GECo模型预测化合物-蛋白质亲和力的计算方法
JP2000507940A (ja) 共通の機能特性を有する化学構造をコンピューターによって設計する方法
JP2016527481A (ja) 改善された治療リガンドの取得
Singh et al. Psycho-clonal based approach to solve a TOC product mix decision problem
Lee et al. Docking-based multi-objective molecular optimization pipeline using structure-constrained genetic algorithm
WO1999012118A1 (en) Compound screening system
TW202541041A (zh) 用於將分子測繪至介面中之系統及方法
Ye et al. Probabilistic cross‐link analysis and experiment planning for high‐throughput elucidation of protein structure
Liu et al. HuAbDiffusion: a discrete language diffusion model used for antibody humanization
Hasegawa et al. 3D-QSAR study of antifungal N-myristoyltransferase inhibitors by comparative molecular surface analysis
CN115132278A (zh) 一种抗体物种的改造方法、装置、设备及存储介质
Cerveira et al. Compo-gpt: Cross-attention conditioning for multi-target molecular design in generative models
AU712188C (en) Computational method for designing chemical structures having common functional characteristics