JPH08123781A - 3次元化合物構造式の周辺空間情報を数値データへ変換する方法、並びに、3次元化合物構造式とその周辺空間との相互作用を数値データへ変換する方法 - Google Patents
3次元化合物構造式の周辺空間情報を数値データへ変換する方法、並びに、3次元化合物構造式とその周辺空間との相互作用を数値データへ変換する方法Info
- Publication number
- JPH08123781A JPH08123781A JP25502394A JP25502394A JPH08123781A JP H08123781 A JPH08123781 A JP H08123781A JP 25502394 A JP25502394 A JP 25502394A JP 25502394 A JP25502394 A JP 25502394A JP H08123781 A JPH08123781 A JP H08123781A
- Authority
- JP
- Japan
- Prior art keywords
- numerical data
- structural formula
- dimensional
- compound structural
- dimensional compound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/80—Data visualisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】
【目的】化合物の3次元構造式の周辺空間の情報を用い
た構造−活性相関を可能にし、かつ、線形重回帰等を用
いた要因解析をも可能にする方法を実現する。 【構成】予め決定(S1)された3次元化合物構造式の
周辺に、この3次元化合物構造式の全体を内包する周辺
領域を設定する第1のプロセス(S2)と、上記周辺領
域内に複数の小領域を設定する第2のプロセス(S3)
と、上記周辺領域内に多数の点を発生させる第3のプロ
セス(S4)と、これら多数の点のうち少なくとも上記
複数の小領域内に含まれる個々の点について、上記3次
元化合物構造式がこれら個々の点に及ぼす作用を数値デ
ータとして算出し、この数値データをそれと対応する個
々の点に割り当てる第4のプロセス(S5)と、上記個
々の点に割り当てられた数値データに基づき、各小領域
を代表する1つ又は複数の数値データを決定する第5の
プロセス(S6)と、を備えている。このようにして各
小領域毎の代表値が得られたら、この代表値はそのまま
線形重回帰等の各種解析手法へ引き渡され、それぞれの
解析が実行可能である(S7)。
た構造−活性相関を可能にし、かつ、線形重回帰等を用
いた要因解析をも可能にする方法を実現する。 【構成】予め決定(S1)された3次元化合物構造式の
周辺に、この3次元化合物構造式の全体を内包する周辺
領域を設定する第1のプロセス(S2)と、上記周辺領
域内に複数の小領域を設定する第2のプロセス(S3)
と、上記周辺領域内に多数の点を発生させる第3のプロ
セス(S4)と、これら多数の点のうち少なくとも上記
複数の小領域内に含まれる個々の点について、上記3次
元化合物構造式がこれら個々の点に及ぼす作用を数値デ
ータとして算出し、この数値データをそれと対応する個
々の点に割り当てる第4のプロセス(S5)と、上記個
々の点に割り当てられた数値データに基づき、各小領域
を代表する1つ又は複数の数値データを決定する第5の
プロセス(S6)と、を備えている。このようにして各
小領域毎の代表値が得られたら、この代表値はそのまま
線形重回帰等の各種解析手法へ引き渡され、それぞれの
解析が実行可能である(S7)。
Description
【0001】
【産業上の利用分野】本発明は、医薬品や農薬等の薬物
を対象とし、これら薬物を構成する化合物の活性や物性
を評価する「構造−活性相関」や「構造−物性相関」等
の研究分野における利用を前提においた、3次元化合物
構造式の周辺空間情報を数値データへ変換する方法、並
びに、3次元化合物構造式とその周辺空間との相互作用
を数値データへ変換する方法に関する。
を対象とし、これら薬物を構成する化合物の活性や物性
を評価する「構造−活性相関」や「構造−物性相関」等
の研究分野における利用を前提においた、3次元化合物
構造式の周辺空間情報を数値データへ変換する方法、並
びに、3次元化合物構造式とその周辺空間との相互作用
を数値データへ変換する方法に関する。
【0002】構造−活性相関や構造−物性相関の研究に
おいては、その研究対象となる化合物の数値データ化
(パラメータ化)が重要なものとなる。この数値データ
化により、化学上の種々問題に対する統計的なアプロー
チが初めて可能となる。特に最近の分子モデリング技術
(化合物の3次元構造を計算したりする学問)の進歩
は、化合物の3次元構造式を簡単に創出することを現実
のものとした。構造−活性相関や構造−物性相関自体
も、1次元や2次元構造式を基本とした解析から、より
高度な3次元構造式を直接扱う解析へと進歩している。
また、現在では、単なる3次元構造式のみならず、この
3次元構造式とこれを取り巻く周囲の3次元的環境中に
存在する原子との相互作用を議論することも重要となり
つつある。このような研究上の進歩を背景として、化合
物の3次元構造情報を数値データ(3次元パラメータ)
へと変換する効率的な手法、並びに、化合物の3次元構
造情報とその周辺環境上における原子との相互作用を数
値データへと変換する効率的な手法が要求されてきてい
る。
おいては、その研究対象となる化合物の数値データ化
(パラメータ化)が重要なものとなる。この数値データ
化により、化学上の種々問題に対する統計的なアプロー
チが初めて可能となる。特に最近の分子モデリング技術
(化合物の3次元構造を計算したりする学問)の進歩
は、化合物の3次元構造式を簡単に創出することを現実
のものとした。構造−活性相関や構造−物性相関自体
も、1次元や2次元構造式を基本とした解析から、より
高度な3次元構造式を直接扱う解析へと進歩している。
また、現在では、単なる3次元構造式のみならず、この
3次元構造式とこれを取り巻く周囲の3次元的環境中に
存在する原子との相互作用を議論することも重要となり
つつある。このような研究上の進歩を背景として、化合
物の3次元構造情報を数値データ(3次元パラメータ)
へと変換する効率的な手法、並びに、化合物の3次元構
造情報とその周辺環境上における原子との相互作用を数
値データへと変換する効率的な手法が要求されてきてい
る。
【0003】
【従来の技術】これまで、化合物の3次元構造式に関す
る情報としては様々なものが提案され、また実用化され
てきた。例えば、化合物の部分的3次元構造を立体的に
規定して数値データへと変換したパラメータとしては、
STERIMOLパラメータがある。また、化合物全体
の形状を規定するために3次元ボックス内に化合物を閉
じ込め、その時のボックスのX、Y及びZ軸の値とその
比を求めた分子モーメントもある。最近提案されてきた
3次元パラメータとしては、3次元化合物そのものを3
次元的な領域単位で分割し、その領域に分割された部分
構造情報をもとに様々な基準で数値データ化する領域パ
ラメータがある。また、化合物の周辺を3次元格子によ
り分割し、その交叉点での電子密度や原子同士の反発力
等を3次元パラメータとして用いるCoMFAパラメー
タ等も提案されてきた。このように、3次元パラメータ
が種々の形で創出されるようになったことから、これら
のパラメータを用いた3次元構造−活性相関が盛んに利
用されるようになりつつある。
る情報としては様々なものが提案され、また実用化され
てきた。例えば、化合物の部分的3次元構造を立体的に
規定して数値データへと変換したパラメータとしては、
STERIMOLパラメータがある。また、化合物全体
の形状を規定するために3次元ボックス内に化合物を閉
じ込め、その時のボックスのX、Y及びZ軸の値とその
比を求めた分子モーメントもある。最近提案されてきた
3次元パラメータとしては、3次元化合物そのものを3
次元的な領域単位で分割し、その領域に分割された部分
構造情報をもとに様々な基準で数値データ化する領域パ
ラメータがある。また、化合物の周辺を3次元格子によ
り分割し、その交叉点での電子密度や原子同士の反発力
等を3次元パラメータとして用いるCoMFAパラメー
タ等も提案されてきた。このように、3次元パラメータ
が種々の形で創出されるようになったことから、これら
のパラメータを用いた3次元構造−活性相関が盛んに利
用されるようになりつつある。
【0004】従来は、3次元化合物構造式を扱って数値
情報へと変換する手法が主であり、その代表的なものが
上記のSTERIMOLパラメータと呼ばれるものであ
る。このSTERIMOLパラメータの一例を図20に
示す。このパラメータにより、化合物の「3次元的形状
情報」が数値データへと変換される。
情報へと変換する手法が主であり、その代表的なものが
上記のSTERIMOLパラメータと呼ばれるものであ
る。このSTERIMOLパラメータの一例を図20に
示す。このパラメータにより、化合物の「3次元的形状
情報」が数値データへと変換される。
【0005】このように3次元化合物そのものの構造情
報を数値データ化する手法は、従来にもいくつか存在し
たが、最近にいたるまで3次元化合物の「周辺空間の環
境情報」を数値データへと変換する有力な手法は存在し
なかった。ところが、1988年になり、3次元化合物
の周辺における電子的な反発力と原子同士の反発力を3
次元格子での交叉点における値として表現することで、
この3次元空間情報を数値データ化することが提案され
た。同時に、解析手法として高次元データを数次元に落
とす多変量解析手法のPLS(Pertial Least Squares)
手法を用いることで、統計的な問題をクリアすることも
提案されている。このように3次元化合物の周辺情報を
用いて実際の構造−活性相関に役立てるようにした手法
がCoMFA(Comparative Molecular Field Analysi
s) として米国で特許されている(U.S.Patent 5,025,38
8) 。図21はCoMFAにより利用される化合物の3
次元情報の取り出しの概念図である。
報を数値データ化する手法は、従来にもいくつか存在し
たが、最近にいたるまで3次元化合物の「周辺空間の環
境情報」を数値データへと変換する有力な手法は存在し
なかった。ところが、1988年になり、3次元化合物
の周辺における電子的な反発力と原子同士の反発力を3
次元格子での交叉点における値として表現することで、
この3次元空間情報を数値データ化することが提案され
た。同時に、解析手法として高次元データを数次元に落
とす多変量解析手法のPLS(Pertial Least Squares)
手法を用いることで、統計的な問題をクリアすることも
提案されている。このように3次元化合物の周辺情報を
用いて実際の構造−活性相関に役立てるようにした手法
がCoMFA(Comparative Molecular Field Analysi
s) として米国で特許されている(U.S.Patent 5,025,38
8) 。図21はCoMFAにより利用される化合物の3
次元情報の取り出しの概念図である。
【0006】この図に示すように、CoMFA法では、
3次元化合物構造式1をその周辺領域を含めて3次元格
子2で取り囲み、その個々の格子点毎に空間上の種々の
パラメータ(ポイントチャージや原子反発力等)を割り
当て、数値データ化するようにしている。従って、格子
点の1つ1つが1次元データとなるために、これにより
得られるデータは非常に高い次元を持つことになる。例
えば、X、Y、Zの各軸がそれぞれ10個の格子で区切
られているとすれば、全体の次元は1000(=1
03 )次元近くにもなってしまう。
3次元化合物構造式1をその周辺領域を含めて3次元格
子2で取り囲み、その個々の格子点毎に空間上の種々の
パラメータ(ポイントチャージや原子反発力等)を割り
当て、数値データ化するようにしている。従って、格子
点の1つ1つが1次元データとなるために、これにより
得られるデータは非常に高い次元を持つことになる。例
えば、X、Y、Zの各軸がそれぞれ10個の格子で区切
られているとすれば、全体の次元は1000(=1
03 )次元近くにもなってしまう。
【0007】一方、3次元構造−活性相関に対するCo
MFA法以外の手法として、本願発明者等によって既に
提案された手法があり、本願よりも先に出願(特願平5
−117272号)されている。この手法は、3次元構
造式をより小さな領域単位に分割し、この領域内に存在
する化合物の3次元部分構造を種々のアルゴリズムと様
々な数学的変換手法により数値データへと変換するもの
である。これによって得られる部分構造領域パラメータ
を用いることで、3次元定量的構造−活性相関を実現す
ることができる。この時、CoMFA法が本質的に持っ
ている解析手法上の欠陥(後に詳述する)を克服した形
で解析を行うことが可能である。
MFA法以外の手法として、本願発明者等によって既に
提案された手法があり、本願よりも先に出願(特願平5
−117272号)されている。この手法は、3次元構
造式をより小さな領域単位に分割し、この領域内に存在
する化合物の3次元部分構造を種々のアルゴリズムと様
々な数学的変換手法により数値データへと変換するもの
である。これによって得られる部分構造領域パラメータ
を用いることで、3次元定量的構造−活性相関を実現す
ることができる。この時、CoMFA法が本質的に持っ
ている解析手法上の欠陥(後に詳述する)を克服した形
で解析を行うことが可能である。
【0008】このように部分構造領域パラメータを用い
た3次元定量的構造−活性相関手法が確立されると、次
にこの部分構造領域パラメータそのものが重要な問題と
なってくる。上記先願の発明における部分構造領域パラ
メータは、全て化合物本体に関する情報を数値データへ
と置き換えたものであり、化合物とその周辺環境との相
互作用に関する情報を部分構造領域パラメータへと変換
する手段は存在していない。部分構造領域パラメータを
用いた3次元定量的構造−活性相関が発展すると同時
に、化合物とその周辺環境の情報を盛り込んだパラメー
タの必要性が高まってきている。
た3次元定量的構造−活性相関手法が確立されると、次
にこの部分構造領域パラメータそのものが重要な問題と
なってくる。上記先願の発明における部分構造領域パラ
メータは、全て化合物本体に関する情報を数値データへ
と置き換えたものであり、化合物とその周辺環境との相
互作用に関する情報を部分構造領域パラメータへと変換
する手段は存在していない。部分構造領域パラメータを
用いた3次元定量的構造−活性相関が発展すると同時
に、化合物とその周辺環境の情報を盛り込んだパラメー
タの必要性が高まってきている。
【0009】
【発明が解決しようとする課題】上述のCoMFA法
は、構造−活性相関分野において3次元構造式の周辺情
報を数値データ化する従来唯一の手法ではあるが、その
数値データ化の手続きで重大な問題を抱えている。この
問題は、単なる3次元空間情報の数値化手続きというよ
りは、その変換された数値データを用いて構造−活性相
関を行う時に利用される統計的手法に起因するものであ
る。
は、構造−活性相関分野において3次元構造式の周辺情
報を数値データ化する従来唯一の手法ではあるが、その
数値データ化の手続きで重大な問題を抱えている。この
問題は、単なる3次元空間情報の数値化手続きというよ
りは、その変換された数値データを用いて構造−活性相
関を行う時に利用される統計的手法に起因するものであ
る。
【0010】すなわち、数値データを用いて線形重回帰
やその他の解析手法を実行する時、統計的な信頼性を保
つ目的で、守るべき制限事項が幾つか存在する。この中
でも最も重要な制限事項は、解析母集団のサンプル数と
解析に用いる数値データの種類の数との関係に関するも
ので、信頼性の高い解析を保証するには以下の式(1)
に示される関係を満たすことが必要である。
やその他の解析手法を実行する時、統計的な信頼性を保
つ目的で、守るべき制限事項が幾つか存在する。この中
でも最も重要な制限事項は、解析母集団のサンプル数と
解析に用いる数値データの種類の数との関係に関するも
ので、信頼性の高い解析を保証するには以下の式(1)
に示される関係を満たすことが必要である。
【0011】 〔サンプル数/解析に利用される数値データの種類の数〕≧4〜5 (1) 通常の構造−活性相関に用いられる化合物(サンプル
数)は、他の分野における解析と異なり、非常に少ない
数(数十〜百)であることが多い。従って、解析に利用
される数値データの数は多くても数個〜数十個というこ
とになる。この結果、3次元構造式の周辺空間の情報
も、この制限事項に従った小さな数の間に限定しながら
数値データへの変換が必要となる。
数)は、他の分野における解析と異なり、非常に少ない
数(数十〜百)であることが多い。従って、解析に利用
される数値データの数は多くても数個〜数十個というこ
とになる。この結果、3次元構造式の周辺空間の情報
も、この制限事項に従った小さな数の間に限定しながら
数値データへの変換が必要となる。
【0012】前記CoMFA法による化合物周辺情報の
数値データへの変換では、化合物を囲む3次元空間の全
体を細かく(一辺が10程度)刻み、小さな点情報とし
て取り出すので、変換される情報は1000(=1
03 )に近い値となる。このために、CoMFA法では
この1000次元データを前記PLS手法により強制的
に数次元に落とすことで、線形重回帰による解析を可能
にしようとしている。
数値データへの変換では、化合物を囲む3次元空間の全
体を細かく(一辺が10程度)刻み、小さな点情報とし
て取り出すので、変換される情報は1000(=1
03 )に近い値となる。このために、CoMFA法では
この1000次元データを前記PLS手法により強制的
に数次元に落とすことで、線形重回帰による解析を可能
にしようとしている。
【0013】しかしながら、このPLSによる強制的な
次元減少は手続き的には成功しても、構造−活性相関を
行うという観点からは成功していない。つまり、PLS
による次元減少過程で情報の変換が起こり、線形重回帰
の解析結果から得られる情報が少なくなり、かつ不明瞭
となってしまうことが、この原因である。そのため、構
造−活性相関で最も重要な要因解析を行えなくなるとい
う致命的な欠陥が生じることになる。
次元減少は手続き的には成功しても、構造−活性相関を
行うという観点からは成功していない。つまり、PLS
による次元減少過程で情報の変換が起こり、線形重回帰
の解析結果から得られる情報が少なくなり、かつ不明瞭
となってしまうことが、この原因である。そのため、構
造−活性相関で最も重要な要因解析を行えなくなるとい
う致命的な欠陥が生じることになる。
【0014】すなわち、PLS手法による次元圧縮デー
タを用いた解析の欠点として、1)線形重回帰手法によ
る要因解析が困難になること、及び、2)パラメータ間
の相対的な強度の比較が不可能となること、があげられ
る。つまり具体的には、通常の線形重回帰により得られ
る最終回帰式が以下の式(2)のようになるのに対し、
PLS手法を用いたCoMFA法により得られる回帰式
は以下の式(3)のようになってしまい、すなわち、こ
れら両式を比較すれば明らかなように、CoMFA法に
より得られる回帰式では各次元の係数の値が抜けてしま
う。なお、正確に言えば、実際に係数の値が抜けること
はないが、回帰式の評価という点で各次元の係数の情報
は使えないため、係数の値の抜けている式(3)と実質
的に同様の表現となる。このようになるのは、高次元デ
ータをPLS手法により強制的に次元減少し、線形重回
帰による解析を行ったためである。
タを用いた解析の欠点として、1)線形重回帰手法によ
る要因解析が困難になること、及び、2)パラメータ間
の相対的な強度の比較が不可能となること、があげられ
る。つまり具体的には、通常の線形重回帰により得られ
る最終回帰式が以下の式(2)のようになるのに対し、
PLS手法を用いたCoMFA法により得られる回帰式
は以下の式(3)のようになってしまい、すなわち、こ
れら両式を比較すれば明らかなように、CoMFA法に
より得られる回帰式では各次元の係数の値が抜けてしま
う。なお、正確に言えば、実際に係数の値が抜けること
はないが、回帰式の評価という点で各次元の係数の情報
は使えないため、係数の値の抜けている式(3)と実質
的に同様の表現となる。このようになるのは、高次元デ
ータをPLS手法により強制的に次元減少し、線形重回
帰による解析を行ったためである。
【0015】 Y=A1×1+A2×2+・・・・+An×n+定数 (2) Y= ×1+ ×2+・・・・+ ×n+定数 (3) 一方、前述の部分構造領域パラメータを用いた3次元定
量的構造−活性相関手法(本願発明者等による先願の発
明)において、現在報告されている部分構造領域パラメ
ータは、あくまでも該当する部分構造のみを基準として
数値データへと変換されたものである。従って、その部
分構造とそれ以外のものとの関係(例えば化合物構造式
周辺空間上に存在する原子との立体的反発力や電子的相
互作用等の情報)を的確に数値データとして表現するこ
とはできなかった。
量的構造−活性相関手法(本願発明者等による先願の発
明)において、現在報告されている部分構造領域パラメ
ータは、あくまでも該当する部分構造のみを基準として
数値データへと変換されたものである。従って、その部
分構造とそれ以外のものとの関係(例えば化合物構造式
周辺空間上に存在する原子との立体的反発力や電子的相
互作用等の情報)を的確に数値データとして表現するこ
とはできなかった。
【0016】しかし、構造−活性相関の発展とともに化
合物構造式とその周辺環境との相互作用情報を的確に知
ることは極めて重要な項目の1つとなりつつある。この
点で、上記の課題(構造式そのものとその周辺空間との
相互関係を数値データへと変換すること)を解決するた
めの手法の開発が望まれている。
合物構造式とその周辺環境との相互作用情報を的確に知
ることは極めて重要な項目の1つとなりつつある。この
点で、上記の課題(構造式そのものとその周辺空間との
相互関係を数値データへと変換すること)を解決するた
めの手法の開発が望まれている。
【0017】本発明の目的は、以上の点に鑑み、3次元
化合物構造式の周辺空間の情報を用いた構造−活性相関
を行うことができ、かつ、線形重回帰等を用いた要因解
析をも十分に可能にする手法を実現することにある。本
発明の更なる目的は、3次元化合物構造式とその周辺環
境にある原子との相互作用情報を数値データとして取り
出すことのできる手法を実現することにある。
化合物構造式の周辺空間の情報を用いた構造−活性相関
を行うことができ、かつ、線形重回帰等を用いた要因解
析をも十分に可能にする手法を実現することにある。本
発明の更なる目的は、3次元化合物構造式とその周辺環
境にある原子との相互作用情報を数値データとして取り
出すことのできる手法を実現することにある。
【0018】
【課題を解決するための手段】本願に係る第1の発明
は、3次元化合物構造式の周辺空間情報を数値データへ
変換する方法であって、請求項1に記載の通り5つのプ
ロセスを含んでいる。すなわち、予め決定された3次元
化合物構造式の周辺に、この3次元化合物構造式の全体
を内包する周辺領域を設定する第1のプロセスと、上記
周辺領域内に複数の小領域を設定する第2のプロセス
と、上記周辺領域内に多数の点を発生させる第3のプロ
セスと、これら多数の点のうち少なくとも上記複数の小
領域内に含まれる個々の点について、上記3次元化合物
構造式がこれら個々の点に及ぼす作用を数値データとし
て算出し、この数値データをそれと対応する個々の点に
割り当てる第4のプロセスと、上記個々の点に割り当て
られた数値データに基づき、各小領域を代表する1つ又
は複数の数値データを決定する第5のプロセスと、を備
えることを特徴とするものである。なお、第2のプロセ
スは、第1のプロセス後から第5のプロセス前までのど
の段階で行ってもよい。
は、3次元化合物構造式の周辺空間情報を数値データへ
変換する方法であって、請求項1に記載の通り5つのプ
ロセスを含んでいる。すなわち、予め決定された3次元
化合物構造式の周辺に、この3次元化合物構造式の全体
を内包する周辺領域を設定する第1のプロセスと、上記
周辺領域内に複数の小領域を設定する第2のプロセス
と、上記周辺領域内に多数の点を発生させる第3のプロ
セスと、これら多数の点のうち少なくとも上記複数の小
領域内に含まれる個々の点について、上記3次元化合物
構造式がこれら個々の点に及ぼす作用を数値データとし
て算出し、この数値データをそれと対応する個々の点に
割り当てる第4のプロセスと、上記個々の点に割り当て
られた数値データに基づき、各小領域を代表する1つ又
は複数の数値データを決定する第5のプロセスと、を備
えることを特徴とするものである。なお、第2のプロセ
スは、第1のプロセス後から第5のプロセス前までのど
の段階で行ってもよい。
【0019】また、本願に係る第2の発明は、3次元化
合物構造式とその周辺空間との相互作用を数値データへ
変換する方法であって、請求項9に記載の通り5つのプ
ロセスを含んでいる。すなわち、予め決定された3次元
化合物構造式の周辺に、この3次元化合物構造式の全体
を内包する周辺領域を設定する第1のプロセスと、上記
周辺領域を複数の小領域に分割する第2のプロセスと、
上記3次元化合物構造式を複数の部分構造に分割する第
3のプロセスと、上記複数の小領域内にそれぞれ1つ又
は複数の仮想原子(「仮想原子」という表現には仮想電
子をも含むものとする)を設定する第4のプロセスと、
上記第3のプロセスで得られた各部分構造を構成する個
々の原子と上記第4のプロセスで設定された1つ又は複
数の小領域内の仮想原子との間の相互作用を数値データ
として算出し、この数値データをそれと対応する部分構
造にこの部分構造を代表する値として割り当てる第5の
プロセスと、を備えることを特徴とするものである。な
お、第3のプロセスは、第1のプロセスの前に行っても
よく、或いは、第2のプロセス後から第5のプロセス前
までのどの段階で行ってもよい。
合物構造式とその周辺空間との相互作用を数値データへ
変換する方法であって、請求項9に記載の通り5つのプ
ロセスを含んでいる。すなわち、予め決定された3次元
化合物構造式の周辺に、この3次元化合物構造式の全体
を内包する周辺領域を設定する第1のプロセスと、上記
周辺領域を複数の小領域に分割する第2のプロセスと、
上記3次元化合物構造式を複数の部分構造に分割する第
3のプロセスと、上記複数の小領域内にそれぞれ1つ又
は複数の仮想原子(「仮想原子」という表現には仮想電
子をも含むものとする)を設定する第4のプロセスと、
上記第3のプロセスで得られた各部分構造を構成する個
々の原子と上記第4のプロセスで設定された1つ又は複
数の小領域内の仮想原子との間の相互作用を数値データ
として算出し、この数値データをそれと対応する部分構
造にこの部分構造を代表する値として割り当てる第5の
プロセスと、を備えることを特徴とするものである。な
お、第3のプロセスは、第1のプロセスの前に行っても
よく、或いは、第2のプロセス後から第5のプロセス前
までのどの段階で行ってもよい。
【0020】
【作用】第1の発明では、3次元化合物構造式の周辺領
域内に複数の小領域を設定し、この小領域に対してそれ
ぞれの代表値を決定するようにしている。すなわち、従
来のCoMFA法のように3次元化合物構造式の周辺空
間の情報を小さな「点」情報として取り出すのではな
く、より大きな「領域」単位での情報として取り出すこ
とを大きなポイントとしている。その結果、前述のよう
なPLS手法を使用せずとも、化合物の周辺空間情報を
少数の数値データ(小さな次元)で表すことが可能とな
り、これらの数値データを用いれば、統計的な信頼性を
保ちつつ線形重回帰やその他の解析手法の適用により、
構造−活性相関での最も大事な要因解析を実現すること
が可能となる。
域内に複数の小領域を設定し、この小領域に対してそれ
ぞれの代表値を決定するようにしている。すなわち、従
来のCoMFA法のように3次元化合物構造式の周辺空
間の情報を小さな「点」情報として取り出すのではな
く、より大きな「領域」単位での情報として取り出すこ
とを大きなポイントとしている。その結果、前述のよう
なPLS手法を使用せずとも、化合物の周辺空間情報を
少数の数値データ(小さな次元)で表すことが可能とな
り、これらの数値データを用いれば、統計的な信頼性を
保ちつつ線形重回帰やその他の解析手法の適用により、
構造−活性相関での最も大事な要因解析を実現すること
が可能となる。
【0021】第2の発明では、3次元化合物構造式の周
辺に仮想原子を置き、この仮想原子と3次元化合物構造
式の各部分構造を構成する個々の原子との間の相互作用
(反発力や電子的相互作用等)を計算するようにしてい
るので、構造式の周辺空間における原子や電子との相互
作用に関する情報の取り出しが可能となる。しかも、こ
の第2の発明においても、上記相互作用に関する情報を
少数の数値データ(小さな次元)で表すことが可能なの
で、第1の発明と同様、統計的な信頼性を保ちつつ線形
重回帰等の適用により、構造−活性相関での最も大事な
要因解析を実現することが可能となる。
辺に仮想原子を置き、この仮想原子と3次元化合物構造
式の各部分構造を構成する個々の原子との間の相互作用
(反発力や電子的相互作用等)を計算するようにしてい
るので、構造式の周辺空間における原子や電子との相互
作用に関する情報の取り出しが可能となる。しかも、こ
の第2の発明においても、上記相互作用に関する情報を
少数の数値データ(小さな次元)で表すことが可能なの
で、第1の発明と同様、統計的な信頼性を保ちつつ線形
重回帰等の適用により、構造−活性相関での最も大事な
要因解析を実現することが可能となる。
【0022】
【実施例】以下、本発明の実施例について、図面を参照
しながら説明する。図1は本発明の第1実施例を示すフ
ローチャートであり、その中のステップS2〜S6のプ
ロセスが本実施例に相当する。
しながら説明する。図1は本発明の第1実施例を示すフ
ローチャートであり、その中のステップS2〜S6のプ
ロセスが本実施例に相当する。
【0023】同図において、本実施例のプロセス(ステ
ップS2〜S6)を実行する前に、予め、複数の化合物
の3次元構造式を例えば3次元座標の形で生成し、続い
て、共通座標を用いて上記複数の化合物の3次元での分
子重ね合わせを実行する(ステップS1)。ここで、3
次元構造式の決定はどのような手法を用いてもかまわ
ず、例えば分子軌道法や分子力学法等を用いた3次元座
標計算による手法や3次元構造式のデータベースから引
用する手法等、従来から知られた各種手法を採用可能で
ある。また、複数の化合物の3次元での分子重ね合わせ
も、やはり従来の手法を採用可能であり、例えば、最小
二乗法やシンプレックス法等を用いた計算機での重ね合
わせや、グラフィックディスプレイを見ながらのマニュ
アル的重ね合わせ等がある。このようにして3次元化合
物構造式が決定したら、本実施例に係るプロセスへと移
行する。
ップS2〜S6)を実行する前に、予め、複数の化合物
の3次元構造式を例えば3次元座標の形で生成し、続い
て、共通座標を用いて上記複数の化合物の3次元での分
子重ね合わせを実行する(ステップS1)。ここで、3
次元構造式の決定はどのような手法を用いてもかまわ
ず、例えば分子軌道法や分子力学法等を用いた3次元座
標計算による手法や3次元構造式のデータベースから引
用する手法等、従来から知られた各種手法を採用可能で
ある。また、複数の化合物の3次元での分子重ね合わせ
も、やはり従来の手法を採用可能であり、例えば、最小
二乗法やシンプレックス法等を用いた計算機での重ね合
わせや、グラフィックディスプレイを見ながらのマニュ
アル的重ね合わせ等がある。このようにして3次元化合
物構造式が決定したら、本実施例に係るプロセスへと移
行する。
【0024】まず、ステップS2では、3次元化合物構
造式自体の領域(内部領域)を設定し、更にその周辺
に、上記内部領域を内包する周辺領域を設定するプロセ
スを実行する。
造式自体の領域(内部領域)を設定し、更にその周辺
に、上記内部領域を内包する周辺領域を設定するプロセ
スを実行する。
【0025】ここで、上記内部領域は、構造式そのもの
の立体的な容積や形状と一致する必要はなく、構造式全
体を内包した形をしていればよい。このような内部領域
の設定は、例えば、原子のファンデルワールス半径デー
タを用いて作成される空間充填図そのものを内部領域と
して設定することができる。例えば、図2に示すような
3次元化合物構造式11に対しては、図3に示すような
内部領域12を設定できる。或いは、化合物が3次元空
間上で占めている空間的な領域を直方体のボックスや球
といった立体的な形で領域化すること等により、上記内
部領域を設定することもできる。直方体により内部領域
12を設定した一例を図4に、球により内部領域12を
設定した一例を図5に示す。直方体による内部領域の設
定は、各X、Y、Z座標の最大値と最小値を取り出すこ
と等により行うことができ、例えばX座標の最大値31
5、最小値169、Y座標の最大値266、最小値5
3、Z座標の最大値247、最小値107等のように設
定することで、化合物は直方体のボックス内に収められ
た形となる。また、球による内部領域の設定は、例えば
化合物全体の重心を球の中心としてその中心から最大離
れた原子との距離を半径とする球を設定すること等によ
り、化合物は球の中に収められた形となる。なお、内部
領域のサイズや形状等は計算機内部で自動的に設定され
るようにしてもよく、或いは、人間が画面を見ながら自
由に設定するようにしてもよい。
の立体的な容積や形状と一致する必要はなく、構造式全
体を内包した形をしていればよい。このような内部領域
の設定は、例えば、原子のファンデルワールス半径デー
タを用いて作成される空間充填図そのものを内部領域と
して設定することができる。例えば、図2に示すような
3次元化合物構造式11に対しては、図3に示すような
内部領域12を設定できる。或いは、化合物が3次元空
間上で占めている空間的な領域を直方体のボックスや球
といった立体的な形で領域化すること等により、上記内
部領域を設定することもできる。直方体により内部領域
12を設定した一例を図4に、球により内部領域12を
設定した一例を図5に示す。直方体による内部領域の設
定は、各X、Y、Z座標の最大値と最小値を取り出すこ
と等により行うことができ、例えばX座標の最大値31
5、最小値169、Y座標の最大値266、最小値5
3、Z座標の最大値247、最小値107等のように設
定することで、化合物は直方体のボックス内に収められ
た形となる。また、球による内部領域の設定は、例えば
化合物全体の重心を球の中心としてその中心から最大離
れた原子との距離を半径とする球を設定すること等によ
り、化合物は球の中に収められた形となる。なお、内部
領域のサイズや形状等は計算機内部で自動的に設定され
るようにしてもよく、或いは、人間が画面を見ながら自
由に設定するようにしてもよい。
【0026】また、上記周辺領域は、上記内部領域と同
様に構造式そのものの立体的な容積や形状と一致する必
要はなく、上記内部領域の外周空間を更に取り囲んだ形
をしていればよい。すなわち、周辺領域は内部領域より
も大きな直方体、立方体、球、楕円球等種々の形が取ら
れる。例えば、図2に示すような3次元化合物構造式1
1に対し図3に示すように設定された内部領域12に対
しては、更に図6に示すように内部領域12とは異なる
形状の周辺領域13を設定することができ、また、図7
に示すように直方体の内部領域12に対して同じく直方
体の周辺領域13を設定することも可能である。なお、
周辺領域のサイズや形状等は、人間が各座標毎に設定す
る区間の幅の大きさを入力(又は画面上で指定)するよ
うにしてもよく、或いは、各座標毎に設定する幅がデフ
ォルトで決定されており、自動的に外側空間が決まるよ
うにしてもよく、また、直方体の重心を中心としてその
直方体を含む球や楕円を形成するようにしてもよい。
様に構造式そのものの立体的な容積や形状と一致する必
要はなく、上記内部領域の外周空間を更に取り囲んだ形
をしていればよい。すなわち、周辺領域は内部領域より
も大きな直方体、立方体、球、楕円球等種々の形が取ら
れる。例えば、図2に示すような3次元化合物構造式1
1に対し図3に示すように設定された内部領域12に対
しては、更に図6に示すように内部領域12とは異なる
形状の周辺領域13を設定することができ、また、図7
に示すように直方体の内部領域12に対して同じく直方
体の周辺領域13を設定することも可能である。なお、
周辺領域のサイズや形状等は、人間が各座標毎に設定す
る区間の幅の大きさを入力(又は画面上で指定)するよ
うにしてもよく、或いは、各座標毎に設定する幅がデフ
ォルトで決定されており、自動的に外側空間が決まるよ
うにしてもよく、また、直方体の重心を中心としてその
直方体を含む球や楕円を形成するようにしてもよい。
【0027】続いてステップS3では、上記周辺領域の
内部に、後に数値データ化する対象となる複数の小領域
を設定するプロセスを実行する。例えば図8に示すよう
に、周辺空間13の内部に複数(同図では4個)の小領
域14、14、・・・を設定する。これら複数の小領域
同士は互いに分離していることが望ましいが、小さな重
なりがあっても解析上で支障はない。また、設定される
小領域の個数は、例えば研究対象となる化合物群や解析
の段階等によって異なるため、必要に応じて適宜設定す
ることになる。以下に、小領域の設定手法のほんの一例
を、図9〜図11を用いて具体的に説明する。
内部に、後に数値データ化する対象となる複数の小領域
を設定するプロセスを実行する。例えば図8に示すよう
に、周辺空間13の内部に複数(同図では4個)の小領
域14、14、・・・を設定する。これら複数の小領域
同士は互いに分離していることが望ましいが、小さな重
なりがあっても解析上で支障はない。また、設定される
小領域の個数は、例えば研究対象となる化合物群や解析
の段階等によって異なるため、必要に応じて適宜設定す
ることになる。以下に、小領域の設定手法のほんの一例
を、図9〜図11を用いて具体的に説明する。
【0028】複数の小領域を設定する第1の例として
は、例えば図9に示すように、ディスプレイ上に表示さ
れた空間上の立方体、直方体、球等を人間が指定するこ
とで実行することができる。すなわち、まず図9(a)
に示すように、周辺領域13を構成する3次元空間を小
さな直方体や立方体のブロック或いは球等(図では直方
体)で細分化する。この際、ブロックや球のサイズは、
人間が指定する他にも、デフォルト設定や計算等により
算出してもよい。続いて図9(b)に示すように、細分
化して得られた多数のブロックや球の中から所望の1個
或いは複数個を指定することにより、これら指定された
ブロックや球の集まりからなる所望のサイズ及び形状の
小領域14を生成する。この際、先に生成された小さな
ブロックや球(図9(a))の中から所望の領域を指定
すると、その指定された一連のブロックや球は全て1つ
の領域として認識されるようにし、これにより、小領域
14が生成されることになる。
は、例えば図9に示すように、ディスプレイ上に表示さ
れた空間上の立方体、直方体、球等を人間が指定するこ
とで実行することができる。すなわち、まず図9(a)
に示すように、周辺領域13を構成する3次元空間を小
さな直方体や立方体のブロック或いは球等(図では直方
体)で細分化する。この際、ブロックや球のサイズは、
人間が指定する他にも、デフォルト設定や計算等により
算出してもよい。続いて図9(b)に示すように、細分
化して得られた多数のブロックや球の中から所望の1個
或いは複数個を指定することにより、これら指定された
ブロックや球の集まりからなる所望のサイズ及び形状の
小領域14を生成する。この際、先に生成された小さな
ブロックや球(図9(a))の中から所望の領域を指定
すると、その指定された一連のブロックや球は全て1つ
の領域として認識されるようにし、これにより、小領域
14が生成されることになる。
【0029】複数の小領域を設定する第2の例として
は、例えば図10に示すように、人間が周辺領域13中
に点(座標)15を指定すると、その周りに立方体や直
方体のブロックや球等が形成されるようにし、そのブロ
ックや球の占有する空間を小領域14とすることができ
る。すなわち、まず図10(a)に示すように、人間が
周辺領域13中に点15を設定する。すると、図10
(b)に示すように、指定された点15を中心としてブ
ロックや球が生成され(図ではブロック)、最終的には
図10(c)に示すように、指定された複数の点15に
生成された各ブロックや球を融合することで小領域14
が生成されることになる。
は、例えば図10に示すように、人間が周辺領域13中
に点(座標)15を指定すると、その周りに立方体や直
方体のブロックや球等が形成されるようにし、そのブロ
ックや球の占有する空間を小領域14とすることができ
る。すなわち、まず図10(a)に示すように、人間が
周辺領域13中に点15を設定する。すると、図10
(b)に示すように、指定された点15を中心としてブ
ロックや球が生成され(図ではブロック)、最終的には
図10(c)に示すように、指定された複数の点15に
生成された各ブロックや球を融合することで小領域14
が生成されることになる。
【0030】複数の小領域を設定する第3の例として
は、例えば図11に示すように、予め立体的なブロック
や球等を初めとした立体の部品16を用意しておき、そ
れを指定したい空間に埋めていくことで小領域14とす
るようにしてもよい。すなわち、まず図11(a)に示
すように、一定の形状或いは様々な形状をした3次元の
ブロックや球等を部品16として予め揃えておき、人間
が複数の部品16の中から所望のものを指定して、これ
を図11(b)に示すように周辺領域13中の適当な位
置に配置すると、その部分が小領域の一部となる。この
ようにして複数の部品16を順次配置していくことで、
それら複数の部品が連続してできた領域の全体が1つの
領域として認知され、最終的には図11(c)に示すよ
うに当初目的とした小領域14が生成される。
は、例えば図11に示すように、予め立体的なブロック
や球等を初めとした立体の部品16を用意しておき、そ
れを指定したい空間に埋めていくことで小領域14とす
るようにしてもよい。すなわち、まず図11(a)に示
すように、一定の形状或いは様々な形状をした3次元の
ブロックや球等を部品16として予め揃えておき、人間
が複数の部品16の中から所望のものを指定して、これ
を図11(b)に示すように周辺領域13中の適当な位
置に配置すると、その部分が小領域の一部となる。この
ようにして複数の部品16を順次配置していくことで、
それら複数の部品が連続してできた領域の全体が1つの
領域として認知され、最終的には図11(c)に示すよ
うに当初目的とした小領域14が生成される。
【0031】なお、以上の例において、複数のブロック
や球等が設定された後に、これらを融合することが行わ
れるが、この時、指定された個々のブロックや球等に連
続性が無く複数の領域に分割されてしまう場合は、その
まま複数の小領域として扱えばよい。
や球等が設定された後に、これらを融合することが行わ
れるが、この時、指定された個々のブロックや球等に連
続性が無く複数の領域に分割されてしまう場合は、その
まま複数の小領域として扱えばよい。
【0032】以上のようにして周辺領域内に小領域が設
定されたら、次に図1のステップS4のプロセスを実行
する。このプロセスは、上記ステップS2で得られた周
辺領域内の全体(既に小領域が設定済みの場合は、小領
域内のみでよい)に多数の点を発生させるプロセスであ
る。このような点の発生方法の一例を、図12及び図1
3に示す。図12に示す方法はいずれも、周辺領域13
の全体に点を発生させる一例であり、図12(a)は周
辺領域13の全体を囲む3次元格子を作成し、個々の格
子点を点17として用いるもの(格子のサイズは人間が
指定してもよく、デフォルト指定であってもよい)であ
り、図12(b)は乱数を用いて周辺領域13中に点1
7を発生させるもの(発生させる点の数等は人間が指定
しても、デフォルト指定でもよい)であり、図12
(c)は人間が周辺領域13中に点17を指定するもの
である。また、図13に示す方法はいずれも、小領域1
4中にのみ点を発生させる一例であり、図13(a)、
(b)、(c)は上記図12(a)、(b)、(c)と
同様にそれぞれ3次元格子を用いるもの、乱数により発
生させるもの、人間の指定によるものである。なお、3
次元格子や乱数を用いるものでは、空間上での点17の
分布に均一性が要求されるが、人間が指定する場合は、
人間(研究者)の先見的な知識や或る目的をもって点を
指定することになるので、むしろ均一性をもたせるとい
うよりも、意識的に偏りをもたせた点を発生させること
になる。また、1つの小領域内に発生させる点の数は、
必要に応じて適宜設定されるものであるが、解析の趣旨
やこれ以降の処理手続きや計算速度等の問題から考える
ならば、1つの小領域あたり例えば100個〜1000
個もあれば十分と言える。
定されたら、次に図1のステップS4のプロセスを実行
する。このプロセスは、上記ステップS2で得られた周
辺領域内の全体(既に小領域が設定済みの場合は、小領
域内のみでよい)に多数の点を発生させるプロセスであ
る。このような点の発生方法の一例を、図12及び図1
3に示す。図12に示す方法はいずれも、周辺領域13
の全体に点を発生させる一例であり、図12(a)は周
辺領域13の全体を囲む3次元格子を作成し、個々の格
子点を点17として用いるもの(格子のサイズは人間が
指定してもよく、デフォルト指定であってもよい)であ
り、図12(b)は乱数を用いて周辺領域13中に点1
7を発生させるもの(発生させる点の数等は人間が指定
しても、デフォルト指定でもよい)であり、図12
(c)は人間が周辺領域13中に点17を指定するもの
である。また、図13に示す方法はいずれも、小領域1
4中にのみ点を発生させる一例であり、図13(a)、
(b)、(c)は上記図12(a)、(b)、(c)と
同様にそれぞれ3次元格子を用いるもの、乱数により発
生させるもの、人間の指定によるものである。なお、3
次元格子や乱数を用いるものでは、空間上での点17の
分布に均一性が要求されるが、人間が指定する場合は、
人間(研究者)の先見的な知識や或る目的をもって点を
指定することになるので、むしろ均一性をもたせるとい
うよりも、意識的に偏りをもたせた点を発生させること
になる。また、1つの小領域内に発生させる点の数は、
必要に応じて適宜設定されるものであるが、解析の趣旨
やこれ以降の処理手続きや計算速度等の問題から考える
ならば、1つの小領域あたり例えば100個〜1000
個もあれば十分と言える。
【0033】ステップS4で点の発生を終了したら、今
度はステップS5へ進み、個々の点について様々な基準
で値を設定するプロセス、すなわち、3次元化合物構造
式が個々の点に及ぼす作用を数値データとして算出し、
この数値データをそれと対応する個々の点に割り当てる
プロセスを実行する。個々の点に数値データを割り当て
た一例を図14に示す。ここで算出される数値データと
しては、例えば、分子軌道法によるポイントチャージ、
分子間反発力(点に炭素原子等の仮想原子を置いた時に
化合物から受ける引力や反発力)、疎水性、ボリューム
(体積)、静電相互作用(点に単位チャージ(±)を置
いた時に化合物から受ける引力や反発力)等が考えられ
る。
度はステップS5へ進み、個々の点について様々な基準
で値を設定するプロセス、すなわち、3次元化合物構造
式が個々の点に及ぼす作用を数値データとして算出し、
この数値データをそれと対応する個々の点に割り当てる
プロセスを実行する。個々の点に数値データを割り当て
た一例を図14に示す。ここで算出される数値データと
しては、例えば、分子軌道法によるポイントチャージ、
分子間反発力(点に炭素原子等の仮想原子を置いた時に
化合物から受ける引力や反発力)、疎水性、ボリューム
(体積)、静電相互作用(点に単位チャージ(±)を置
いた時に化合物から受ける引力や反発力)等が考えられ
る。
【0034】そして最後に、ステップS6のプロセスを
実行する。このプロセスは、個々の点に割り当てられた
数値データに基づき、各小領域を代表する1つ又は複数
の数値データ(代表値)を決定するプロセスである。各
小領域14には複数の点17が存在するので、これらの
点に割り当てられた数値データを用いて、各小領域単位
に何らかの代表値を設定する。例えば図15では、2つ
の小領域14A、14Bのそれぞれに対して、その領域
を代表する数値データ(代表値)を決定している。この
ような代表値としては、例えば、各小領域14内の全て
の点に割り当てられた数値データの総和、平均値、最大
値又は最小値、或いは上記総和を小領域の体積又は表面
積で割った値、各小領域14の重心点での値、各小領域
のモーメント値(小領域の重心を起点とした時のX、
Y、Z軸長をモーメントとするもの)等を採用可能であ
る。このようにして、各小領域毎に、1つ又は複数の代
表値(数値データの種類に応じて、その数も変わる)
と、この代表値の種類や算出法(例えば電子密度の平均
値、反発力の最大値等)を割り当てる。なお、各点に割
り当てられた異なる種類の数値データについて新たに小
領域単位の代表値を求める時は、ステップS5へ戻り、
改めて各点の数値データを求め直すようにする。
実行する。このプロセスは、個々の点に割り当てられた
数値データに基づき、各小領域を代表する1つ又は複数
の数値データ(代表値)を決定するプロセスである。各
小領域14には複数の点17が存在するので、これらの
点に割り当てられた数値データを用いて、各小領域単位
に何らかの代表値を設定する。例えば図15では、2つ
の小領域14A、14Bのそれぞれに対して、その領域
を代表する数値データ(代表値)を決定している。この
ような代表値としては、例えば、各小領域14内の全て
の点に割り当てられた数値データの総和、平均値、最大
値又は最小値、或いは上記総和を小領域の体積又は表面
積で割った値、各小領域14の重心点での値、各小領域
のモーメント値(小領域の重心を起点とした時のX、
Y、Z軸長をモーメントとするもの)等を採用可能であ
る。このようにして、各小領域毎に、1つ又は複数の代
表値(数値データの種類に応じて、その数も変わる)
と、この代表値の種類や算出法(例えば電子密度の平均
値、反発力の最大値等)を割り当てる。なお、各点に割
り当てられた異なる種類の数値データについて新たに小
領域単位の代表値を求める時は、ステップS5へ戻り、
改めて各点の数値データを求め直すようにする。
【0035】なお、周辺領域内に小領域を設定するステ
ップS3のプロセスは、図1ではステップS2の次に行
うように示したが、ステップS4の次に行ってもよく、
或いはステップS5の次に行ってもよい。
ップS3のプロセスは、図1ではステップS2の次に行
うように示したが、ステップS4の次に行ってもよく、
或いはステップS5の次に行ってもよい。
【0036】このようにして本実施例に係る上記ステッ
プS2〜S6により各小領域毎の代表値が得られたら、
この代表値はそのまま線形重回帰等の各種解析手法へ引
き渡され、それぞれの解析が実行されることになる(ス
テップS7)。このような解析自体に関しては、本発明
の範疇から外れるため、ここでは説明を省略する。
プS2〜S6により各小領域毎の代表値が得られたら、
この代表値はそのまま線形重回帰等の各種解析手法へ引
き渡され、それぞれの解析が実行されることになる(ス
テップS7)。このような解析自体に関しては、本発明
の範疇から外れるため、ここでは説明を省略する。
【0037】以上に述べた第1実施例の方法によれば、
3次元化合物構造式の周辺に関する情報を小領域単位で
効率良く数値データへと変換可能なので、以下のような
効果が得られる。すなわち、化合物周辺の環境情報を小
領域単位で取り出すものなので、その情報取り出しは低
い(少ない)次元数で実現でき、従来のCoMFA法に
おいて必要とされたPLS手法等のような次元縮小のた
めの特別な手続きを何ら必要としない。次元数について
言えば、CoMFA法の場合は図21に示したように3
次元格子の全ての格子点についての情報を取り出すもの
であるのに対し、本実施例の場合は図16に示すように
少数の小領域14毎の情報を取り出すものなので、例え
ばCoMFAが約1000次元程度(最低でも250次
元は必要)と高次元であるのに対し、本実施例の場合は
小領域14の数と同じ次元数の数次元〜数十次元(図1
6では4次元)と非常に低くできる。よって、本実施例
ではもともと少ない次元データで表現できるため、限定
された情報を多数の次元データで表現した時に起こる統
計上の問題(“過剰評価”の問題)を避けることができ
るばかりでなく、本実施例で得られた少ない次元の数値
データをそのまま線形重回帰やその他の解析手法で用い
ることが可能になるので、構造−活性相関や構造−物性
相関で最も重要な要因解析を精度高く行うことができ
る。これは、具体的には、従来の3次元空間情報を用い
た構造−活性相関手法であるCoMFAでは前述のよう
に回帰式の係数(前述の式(2)におけるA1、A2
等)は何の情報的価値を持たなかったのに対し、本実施
例では回帰式の個々の係数が数値情報として意味を持つ
ことが可能となるからである。
3次元化合物構造式の周辺に関する情報を小領域単位で
効率良く数値データへと変換可能なので、以下のような
効果が得られる。すなわち、化合物周辺の環境情報を小
領域単位で取り出すものなので、その情報取り出しは低
い(少ない)次元数で実現でき、従来のCoMFA法に
おいて必要とされたPLS手法等のような次元縮小のた
めの特別な手続きを何ら必要としない。次元数について
言えば、CoMFA法の場合は図21に示したように3
次元格子の全ての格子点についての情報を取り出すもの
であるのに対し、本実施例の場合は図16に示すように
少数の小領域14毎の情報を取り出すものなので、例え
ばCoMFAが約1000次元程度(最低でも250次
元は必要)と高次元であるのに対し、本実施例の場合は
小領域14の数と同じ次元数の数次元〜数十次元(図1
6では4次元)と非常に低くできる。よって、本実施例
ではもともと少ない次元データで表現できるため、限定
された情報を多数の次元データで表現した時に起こる統
計上の問題(“過剰評価”の問題)を避けることができ
るばかりでなく、本実施例で得られた少ない次元の数値
データをそのまま線形重回帰やその他の解析手法で用い
ることが可能になるので、構造−活性相関や構造−物性
相関で最も重要な要因解析を精度高く行うことができ
る。これは、具体的には、従来の3次元空間情報を用い
た構造−活性相関手法であるCoMFAでは前述のよう
に回帰式の係数(前述の式(2)におけるA1、A2
等)は何の情報的価値を持たなかったのに対し、本実施
例では回帰式の個々の係数が数値情報として意味を持つ
ことが可能となるからである。
【0038】また、各小領域の具体的な数値データへの
変換方式として、様々な手法(例えば最大値や最小値、
平均値、重心値等)を採用できるので、解析目的に応じ
て、種々の形態での数値データを利用することが可能と
なる。そして、個々の小領域単位で重要な情報が最大値
(最小値)なのか、平均値なのか、重心値なのか、とい
うように、より細かな単位で評価することが可能とな
る。
変換方式として、様々な手法(例えば最大値や最小値、
平均値、重心値等)を採用できるので、解析目的に応じ
て、種々の形態での数値データを利用することが可能と
なる。そして、個々の小領域単位で重要な情報が最大値
(最小値)なのか、平均値なのか、重心値なのか、とい
うように、より細かな単位で評価することが可能とな
る。
【0039】更には、各小領域の代表値を求める時、1
つの小領域から1つの数値データへ変換する手法と、1
つの小領域から複数の数値データへ変換する手法の2種
類の手法をとることができる。1領域1データの様式
は、化合物全体に注目した時にその小領域が果たす要因
の解析に重要であり、1領域複数データの様式は、各小
領域を更に細かく検討しながら解析を行う時に利用でき
る。
つの小領域から1つの数値データへ変換する手法と、1
つの小領域から複数の数値データへ変換する手法の2種
類の手法をとることができる。1領域1データの様式
は、化合物全体に注目した時にその小領域が果たす要因
の解析に重要であり、1領域複数データの様式は、各小
領域を更に細かく検討しながら解析を行う時に利用でき
る。
【0040】次に、図17は本発明の第2実施例を示す
フローチャートであり、その中のステップS12〜S1
6のプロセスが本実施例に相当する。同図において、本
実施例のプロセス(ステップS12〜S16)を実行す
る前に、予め、複数の化合物の3次元構造式を生成し、
続いて、上記複数の化合物の3次元での分子重ね合わせ
を実行する(ステップS11)。このプロセスは、図1
に示したステップS1のプロセスと同様であり、ここで
はその説明を省略する。このようにして3次元化合物構
造式が決定したら、本実施例に係るプロセスへと移行す
る。
フローチャートであり、その中のステップS12〜S1
6のプロセスが本実施例に相当する。同図において、本
実施例のプロセス(ステップS12〜S16)を実行す
る前に、予め、複数の化合物の3次元構造式を生成し、
続いて、上記複数の化合物の3次元での分子重ね合わせ
を実行する(ステップS11)。このプロセスは、図1
に示したステップS1のプロセスと同様であり、ここで
はその説明を省略する。このようにして3次元化合物構
造式が決定したら、本実施例に係るプロセスへと移行す
る。
【0041】まず、ステップS12では、3次元化合物
構造式自体の領域(内部領域)を設定し、更にその周辺
に、上記内部領域を内包する周辺領域を設定するプロセ
スを実行する。このプロセスは、図1に示したステップ
S2と同様なプロセスである。ここで、上記内部領域
は、構造式そのものの立体的な容積や形状と一致する必
要はなく、構造式全体を内包した形をしていればよい。
例えば図18に示すように、3次元化合物構造式21を
取り囲む内部領域22を設定できる。また、上記周辺領
域も、上記内部領域と同様に構造式そのものの立体的な
容積や形状と一致する必要はなく、上記内部領域の外周
空間を更に取り囲んだ形をしていればよい。例えば図1
8に示すように、3次元化合物構造式21に対し設定さ
れた内部領域22に対しては、内部領域12とは異なる
形状(同じ形状であってもよい)の周辺領域23を設定
することができる。
構造式自体の領域(内部領域)を設定し、更にその周辺
に、上記内部領域を内包する周辺領域を設定するプロセ
スを実行する。このプロセスは、図1に示したステップ
S2と同様なプロセスである。ここで、上記内部領域
は、構造式そのものの立体的な容積や形状と一致する必
要はなく、構造式全体を内包した形をしていればよい。
例えば図18に示すように、3次元化合物構造式21を
取り囲む内部領域22を設定できる。また、上記周辺領
域も、上記内部領域と同様に構造式そのものの立体的な
容積や形状と一致する必要はなく、上記内部領域の外周
空間を更に取り囲んだ形をしていればよい。例えば図1
8に示すように、3次元化合物構造式21に対し設定さ
れた内部領域22に対しては、内部領域12とは異なる
形状(同じ形状であってもよい)の周辺領域23を設定
することができる。
【0042】続いてステップS13では、上記ステップ
S12で得られた周辺領域を複数の小領域に分割するプ
ロセスを実行する。すなわち、後述のステップS15で
3次元化合物の周辺に仮想原子を置くための前段階とし
て、大きな周辺領域をこれよりも小さな小領域に分割す
る。この小領域は、化合物構造式と周辺領域との間に存
在するものであれば、どのような手法で設定してもよ
い。例えば図18に示すように、周辺領域23(図では
立方体の形状)内に3次元格子を設定することで、各格
子毎に切断して得られる個々の小ブロックを小領域24
とすることができる。次にステップS14に移行し、3
次元化合物構造式を複数の部分構造に分割するプロセス
を実行する。すなわち、重ね合わされた化合物群を複数
箇所で切断することにより、立体的により小さな部分構
造に分割する。正確には、ステップS12で得られた内
部領域をより小さな領域に分割し、その分割して得られ
た個々の領域内に存在する構造式を部分構造と呼ぶ。こ
のように1つの3次元化合物構造式を複数の部分構造に
分割する具体的な手法については、前述の本願発明者等
による先願の明細書を参考にしてもらいたい。ここで、
各部分構造のサイズは、化合物を構成している原子のサ
イズ以上の大きさを持つことが必要であり、各部分構造
内に最低限1個以上の原子が含まれていれば、どの位置
で切断されていてもよい。また、部分構造のサイズ、位
置、個数等は、操作者が指定しながら決定してもよく、
或いは、計算機が自動的に行うようにしてもよい。前者
に関しては、複数の面を用いて化合物群を個々の部分構
造に分割していく手法等を採用可能であり、また、後者
に関しては、化合物群を包含する立方体をより小さな枡
目で区切っていく手法等を採用可能である。
S12で得られた周辺領域を複数の小領域に分割するプ
ロセスを実行する。すなわち、後述のステップS15で
3次元化合物の周辺に仮想原子を置くための前段階とし
て、大きな周辺領域をこれよりも小さな小領域に分割す
る。この小領域は、化合物構造式と周辺領域との間に存
在するものであれば、どのような手法で設定してもよ
い。例えば図18に示すように、周辺領域23(図では
立方体の形状)内に3次元格子を設定することで、各格
子毎に切断して得られる個々の小ブロックを小領域24
とすることができる。次にステップS14に移行し、3
次元化合物構造式を複数の部分構造に分割するプロセス
を実行する。すなわち、重ね合わされた化合物群を複数
箇所で切断することにより、立体的により小さな部分構
造に分割する。正確には、ステップS12で得られた内
部領域をより小さな領域に分割し、その分割して得られ
た個々の領域内に存在する構造式を部分構造と呼ぶ。こ
のように1つの3次元化合物構造式を複数の部分構造に
分割する具体的な手法については、前述の本願発明者等
による先願の明細書を参考にしてもらいたい。ここで、
各部分構造のサイズは、化合物を構成している原子のサ
イズ以上の大きさを持つことが必要であり、各部分構造
内に最低限1個以上の原子が含まれていれば、どの位置
で切断されていてもよい。また、部分構造のサイズ、位
置、個数等は、操作者が指定しながら決定してもよく、
或いは、計算機が自動的に行うようにしてもよい。前者
に関しては、複数の面を用いて化合物群を個々の部分構
造に分割していく手法等を採用可能であり、また、後者
に関しては、化合物群を包含する立方体をより小さな枡
目で区切っていく手法等を採用可能である。
【0043】続いてステップS15へ進み、上記ステッ
プS13で得られた個々の小領域内に仮想原子を設定す
るプロセスを実行する。このような仮想原子を設定する
手法としては、例えば図18に示すように複数の小領域
24のそれぞれの中点に1つの仮想原子25を存在させ
る手法(図18における3次元格子の線を取り除いたも
のを図19に示す)、個々の小領域24内に複数の仮想
原子を一定間隔置きに設定する手法、個々の小領域24
内に複数の仮想原子を乱数を発生させることにより均一
に点在させる手法、人間が仮想原子を適当に設置する手
法等、各種の手法を採用可能である。なお、仮想原子の
種類は、後に解析に利用する数値データの種類により異
なってくるが、通常は炭素原子を想定することができ、
場合により別の原子を用いてもよい。例えば、原子間の
反発力を数値データとする時には炭素原子を用い、水素
結合力等を数値データとする時には酸素原子や窒素原子
を用い、電子的引力や反発力を数値データとする時には
プラスやマイナスのチャージを用いることができる。す
なわち、仮想原子の種類は、利用しようとする数値デー
タの種類により変化させることが必要であり、従って、
仮想原子の種類は数値データ単位で変化することができ
るようになっていることが必要である。
プS13で得られた個々の小領域内に仮想原子を設定す
るプロセスを実行する。このような仮想原子を設定する
手法としては、例えば図18に示すように複数の小領域
24のそれぞれの中点に1つの仮想原子25を存在させ
る手法(図18における3次元格子の線を取り除いたも
のを図19に示す)、個々の小領域24内に複数の仮想
原子を一定間隔置きに設定する手法、個々の小領域24
内に複数の仮想原子を乱数を発生させることにより均一
に点在させる手法、人間が仮想原子を適当に設置する手
法等、各種の手法を採用可能である。なお、仮想原子の
種類は、後に解析に利用する数値データの種類により異
なってくるが、通常は炭素原子を想定することができ、
場合により別の原子を用いてもよい。例えば、原子間の
反発力を数値データとする時には炭素原子を用い、水素
結合力等を数値データとする時には酸素原子や窒素原子
を用い、電子的引力や反発力を数値データとする時には
プラスやマイナスのチャージを用いることができる。す
なわち、仮想原子の種類は、利用しようとする数値デー
タの種類により変化させることが必要であり、従って、
仮想原子の種類は数値データ単位で変化することができ
るようになっていることが必要である。
【0044】このようにして個々の小領域に仮想原子を
設定したら、最後に、ステップS16のプロセスを実行
する。このプロセスは、上記ステップS14で得られた
各部分構造を構成する個々の原子と上記ステップS15
で設定された仮想原子との間の相互作用を数値データと
して算出し、この数値データをそれと対応する部分構造
にその代表値として割り当てるプロセスである。上記相
互作用の種類には、例えば原子間反発力や電子的相互作
用等があり、その種類単位に計算を繰り返すことにな
る。また、上記数値データを算出するにあたっては、各
部分構造と各小領域内に存在する仮想原子との組み合わ
せ方法には種々のものが考えられ、例えば1つの部分構
造と1つの小領域との組み合わせでもよく、或いは、1
つの部分構造と複数の小領域との組み合わせであっても
よい。この組み合わせが済んだならば、各部分構造毎に
相互作用を求めて代表値を算出することになるが、上記
の各組み合わせ毎に、その算出方法の一例を以下に述べ
る。
設定したら、最後に、ステップS16のプロセスを実行
する。このプロセスは、上記ステップS14で得られた
各部分構造を構成する個々の原子と上記ステップS15
で設定された仮想原子との間の相互作用を数値データと
して算出し、この数値データをそれと対応する部分構造
にその代表値として割り当てるプロセスである。上記相
互作用の種類には、例えば原子間反発力や電子的相互作
用等があり、その種類単位に計算を繰り返すことにな
る。また、上記数値データを算出するにあたっては、各
部分構造と各小領域内に存在する仮想原子との組み合わ
せ方法には種々のものが考えられ、例えば1つの部分構
造と1つの小領域との組み合わせでもよく、或いは、1
つの部分構造と複数の小領域との組み合わせであっても
よい。この組み合わせが済んだならば、各部分構造毎に
相互作用を求めて代表値を算出することになるが、上記
の各組み合わせ毎に、その算出方法の一例を以下に述べ
る。
【0045】1つの部分構造と1つの小領域との組み合
わせの場合、1つの例としては、1つの部分構造を構成
する個々の原子と1つの小領域内の仮想原子(1個)と
の相互作用を算出し、全ての原子についての総和をと
り、その値を部分構造の代表値とする方法がある。他の
例としては、1つの部分構造を構成する個々の原子と1
つの小領域内の仮想原子(複数個)との相互作用を算出
し、全ての原子についての総和をとり、その値を部分構
造の代表値とする方法がある。更に他の例としては、人
間が指定した原子と仮想原子との間の相互作用だけを算
出する方法等であってもよい。
わせの場合、1つの例としては、1つの部分構造を構成
する個々の原子と1つの小領域内の仮想原子(1個)と
の相互作用を算出し、全ての原子についての総和をと
り、その値を部分構造の代表値とする方法がある。他の
例としては、1つの部分構造を構成する個々の原子と1
つの小領域内の仮想原子(複数個)との相互作用を算出
し、全ての原子についての総和をとり、その値を部分構
造の代表値とする方法がある。更に他の例としては、人
間が指定した原子と仮想原子との間の相互作用だけを算
出する方法等であってもよい。
【0046】1つの部分構造と複数の小領域との組み合
わせの場合も、基本的には上記組み合わせの場合と変わ
りはない。すなわち、指定された1つの部分構造とその
相互作用を求める複数の小領域が定まれば、その計算は
1つの部分構造と複数の小領域の中の個々の小領域との
間で上記組み合わせの場合と同様な計算を行っていき、
最終的に、それぞれ得られた数値の総和をとって部分構
造の代表値としたり、或いは、得られた数値の最大値
(最小値)や平均値等を代表値とする。ただしこの場
合、部分構造と小領域の選択方法に幾つかのバリエーシ
ョンがあり、例えば、全ての小領域を対象とする方法、
人間が小領域を指定する方法、計算機が距離を基準にし
て自動的に決定(或る一定距離内にある原子と仮想原子
のみ計算)する方法等がある。
わせの場合も、基本的には上記組み合わせの場合と変わ
りはない。すなわち、指定された1つの部分構造とその
相互作用を求める複数の小領域が定まれば、その計算は
1つの部分構造と複数の小領域の中の個々の小領域との
間で上記組み合わせの場合と同様な計算を行っていき、
最終的に、それぞれ得られた数値の総和をとって部分構
造の代表値としたり、或いは、得られた数値の最大値
(最小値)や平均値等を代表値とする。ただしこの場
合、部分構造と小領域の選択方法に幾つかのバリエーシ
ョンがあり、例えば、全ての小領域を対象とする方法、
人間が小領域を指定する方法、計算機が距離を基準にし
て自動的に決定(或る一定距離内にある原子と仮想原子
のみ計算)する方法等がある。
【0047】なお、化合物構造式を部分構造単位に分割
するステップS14のプロセスは、図17ではステップ
S13の次に行うように示したが、ステップS11とス
テップS16との間であればどこで実行してもかまわな
い。
するステップS14のプロセスは、図17ではステップ
S13の次に行うように示したが、ステップS11とス
テップS16との間であればどこで実行してもかまわな
い。
【0048】このようにして本実施例に係る上記ステッ
プS12〜S16により各部分構造毎の代表値が得られ
たら、この代表値はそのまま線形重回帰等の各種解析手
法へ引き渡され、それぞれの解析が実行されることにな
る(ステップS17)。このような解析自体に関して
は、やはり本発明の範疇から外れるため、ここでは説明
を省略する。
プS12〜S16により各部分構造毎の代表値が得られ
たら、この代表値はそのまま線形重回帰等の各種解析手
法へ引き渡され、それぞれの解析が実行されることにな
る(ステップS17)。このような解析自体に関して
は、やはり本発明の範疇から外れるため、ここでは説明
を省略する。
【0049】以上に述べた第2実施例の方法によれば、
3次元化合物構造式を構成する部分構造単位で、その周
辺環境との相互作用を効率良く定量化できるようになる
と共に、前記第1実施例と同様、その相互作用情報の取
り出しを少ない次元数で実現でき、その少ない次元の数
値データをそのまま線形重回帰やその他の解析手法で用
いることが可能になるので、構造−活性相関や構造−物
性相関で最も重要な要因解析を精度高く行うことができ
るようになる。その結果、従来は不可能であった化合物
の部分構造領域に潜む、この部分構造とその周辺の原子
や電子との相互関係を明確にすることができる。
3次元化合物構造式を構成する部分構造単位で、その周
辺環境との相互作用を効率良く定量化できるようになる
と共に、前記第1実施例と同様、その相互作用情報の取
り出しを少ない次元数で実現でき、その少ない次元の数
値データをそのまま線形重回帰やその他の解析手法で用
いることが可能になるので、構造−活性相関や構造−物
性相関で最も重要な要因解析を精度高く行うことができ
るようになる。その結果、従来は不可能であった化合物
の部分構造領域に潜む、この部分構造とその周辺の原子
や電子との相互関係を明確にすることができる。
【0050】なお、以上の実施例で述べたことはほんの
一例であり、本発明がこれら実施例の構成に限定される
ものでないことは勿論である。
一例であり、本発明がこれら実施例の構成に限定される
ものでないことは勿論である。
【0051】
【発明の効果】本願の第1の発明(請求項1の発明)に
よれば、3次元化合物構造式の周辺に関する情報を小領
域単位で効率良く数値データへと変換可能なので、その
情報取り出しを従来のCoMFA法等と比べて著しく低
次元数で実現でき、その結果、限定された情報を多数の
次元データで表現した時に起こる統計上の問題(“過剰
評価”の問題)を避けることができる。それと共に、本
発明で得られる低次元の数値データを次元縮小のための
特別な手続きを経ずにそのまま線形重回帰やその他の解
析手法で用いることが可能になるので、構造−活性相関
や構造−物性相関で最も重要な要因解析を精度高く行う
ことができる。このように、本発明によれば、従来は困
難とされた、化合物の3次元構造情報を用いた3次元構
造−活性相関を容易に実現することが可能となり、ま
た、CoMFA法と比べてもその要因解析力等から比較
するならば、構造−活性相関を目的とした解析では非常
に重要な情報を研究者にもたらすことが可能となる。
よれば、3次元化合物構造式の周辺に関する情報を小領
域単位で効率良く数値データへと変換可能なので、その
情報取り出しを従来のCoMFA法等と比べて著しく低
次元数で実現でき、その結果、限定された情報を多数の
次元データで表現した時に起こる統計上の問題(“過剰
評価”の問題)を避けることができる。それと共に、本
発明で得られる低次元の数値データを次元縮小のための
特別な手続きを経ずにそのまま線形重回帰やその他の解
析手法で用いることが可能になるので、構造−活性相関
や構造−物性相関で最も重要な要因解析を精度高く行う
ことができる。このように、本発明によれば、従来は困
難とされた、化合物の3次元構造情報を用いた3次元構
造−活性相関を容易に実現することが可能となり、ま
た、CoMFA法と比べてもその要因解析力等から比較
するならば、構造−活性相関を目的とした解析では非常
に重要な情報を研究者にもたらすことが可能となる。
【0052】本願の第2の発明(請求項9の発明)によ
れば、3次元化合物構造式を構成する部分構造単位で、
その周辺環境との相互作用を効率良く数値データへ変換
できるようになると共に、上記第1の発明と同様、その
相互作用情報の取り出しを著しく低次元数で実現でき、
その低次元の数値データをそのまま線形重回帰やその他
の解析手法で用いることができるので、構造−活性相関
や構造−物性相関で最も重要な要因解析を精度高く行う
ことができるようになる。その結果、従来は不可能であ
った化合物の部分構造領域に潜む、この部分構造とその
周辺の原子や電子との相互関係を明確に数値データ化す
ることができる。これらのことは、化合物とその周辺に
おける原子との空間的(立体的)相互作用を客観的に解
析が可能となることを意味しており、特に、薬物の設計
(ドラッグデザイン)研究における、化合物(薬物)と
レセプターサイト(人体側の薬物の作用点)との相互作
用を前提とした3次元定量的構造−活性相関等の研究分
野において、大きな進歩が期待される。
れば、3次元化合物構造式を構成する部分構造単位で、
その周辺環境との相互作用を効率良く数値データへ変換
できるようになると共に、上記第1の発明と同様、その
相互作用情報の取り出しを著しく低次元数で実現でき、
その低次元の数値データをそのまま線形重回帰やその他
の解析手法で用いることができるので、構造−活性相関
や構造−物性相関で最も重要な要因解析を精度高く行う
ことができるようになる。その結果、従来は不可能であ
った化合物の部分構造領域に潜む、この部分構造とその
周辺の原子や電子との相互関係を明確に数値データ化す
ることができる。これらのことは、化合物とその周辺に
おける原子との空間的(立体的)相互作用を客観的に解
析が可能となることを意味しており、特に、薬物の設計
(ドラッグデザイン)研究における、化合物(薬物)と
レセプターサイト(人体側の薬物の作用点)との相互作
用を前提とした3次元定量的構造−活性相関等の研究分
野において、大きな進歩が期待される。
【図1】本発明の第1実施例を示すフローチャートであ
る。
る。
【図2】3次元化合物構造式の一例を示す図である。
【図3】3次元化合物構造式を内包する内部領域の一例
を示す図である。
を示す図である。
【図4】3次元化合物構造式を内包する内部領域の他の
例を示す図である。
例を示す図である。
【図5】3次元化合物構造式を内包する内部領域の更に
他の例を示す図である。
他の例を示す図である。
【図6】内部領域を内包する周辺領域の一例を示す図で
ある。
ある。
【図7】内部領域を内包する周辺領域の他の例を示す図
である。
である。
【図8】周辺領域内に設定された小領域の一例を示す図
である。
である。
【図9】小領域の設定手法の一例を示す図であり、
(a)は周辺領域を細分化した例を示し、(b)は細分
化して得られた多数のブロックの中から所望のものを指
定して小領域を設定する例を示す。
(a)は周辺領域を細分化した例を示し、(b)は細分
化して得られた多数のブロックの中から所望のものを指
定して小領域を設定する例を示す。
【図10】小領域の設定手法の他の例を示す図であり、
(a)は周辺空間内に点を発生させる例を示し、(b)
は上記の点の位置にブロックを生成させる例を示し、
(c)は複数のブロックを融合させて小領域を設定する
例を示す。
(a)は周辺空間内に点を発生させる例を示し、(b)
は上記の点の位置にブロックを生成させる例を示し、
(c)は複数のブロックを融合させて小領域を設定する
例を示す。
【図11】小領域の設定手法の更に他の例を示す図であ
り、(a)は予め用意された立体の部品の中から所望の
ものを指定する例を示し、(b)は指定された部品を周
辺空間内に配置する例を示し、(c)は複数の部品を融
合させて小領域を設定する例を示す。
り、(a)は予め用意された立体の部品の中から所望の
ものを指定する例を示し、(b)は指定された部品を周
辺空間内に配置する例を示し、(c)は複数の部品を融
合させて小領域を設定する例を示す。
【図12】周辺領域の全体に点を発生させる方法の一例を
示す図であり、(a)は3次元格子を用いて点を発生さ
せる例を示し、(b)は乱数を用いて点を発生させる例
を示し、(c)は人間が点を指定する例を示す。
示す図であり、(a)は3次元格子を用いて点を発生さ
せる例を示し、(b)は乱数を用いて点を発生させる例
を示し、(c)は人間が点を指定する例を示す。
【図13】小領域内にのみ点を発生させる方法の一例を示
す図であり、(a)は3次元格子を用いて点を発生させ
る例を示し、(b)は乱数を用いて点を発生させる例を
示し、(c)は人間が点を指定する例を示す。
す図であり、(a)は3次元格子を用いて点を発生させ
る例を示し、(b)は乱数を用いて点を発生させる例を
示し、(c)は人間が点を指定する例を示す。
【図14】個々の点に数値データを割り当てた一例を示す
図である。
図である。
【図15】各小領域にそれぞれの代表値を設定した一例を
示す図である。
示す図である。
【図16】本発明の第1実施例の方法により3次元化合物
構造式の周辺領域に設定された3次元格子及び小領域の
一例を示す図である。
構造式の周辺領域に設定された3次元格子及び小領域の
一例を示す図である。
【図17】本発明の第2実施例を示すフローチャートであ
る。
る。
【図18】3次元化合物構造式の周辺領域に設定された3
次元格子及び仮想原子の一例を示す図である。
次元格子及び仮想原子の一例を示す図である。
【図19】図18から3次元格子を取り除いた図である。
【図20】従来のSTERIMOLパラメータの一例を示
す図である。
す図である。
【図21】従来のCoMFA法により3次元化合物構造式
の周辺領域に設定された3次元格子の一例を示す図であ
る。
の周辺領域に設定された3次元格子の一例を示す図であ
る。
11 3次元化合物構造式 12 内部領域 13 周辺領域 14 小領域 16 部品 17 点 21 3次元化合物構造式 22 内部領域 23 周辺領域 24 小領域 25 仮想原子
Claims (16)
- 【請求項1】 予め決定された3次元化合物構造式(1
1)の周辺に、該3次元化合物構造式の全体を内包する
周辺領域(13)を設定する第1のプロセス(S2)
と、 前記周辺領域内に複数の小領域(14)を設定する第2
のプロセス(S3)と、 前記周辺領域内に多数の点(17)を発生させる第3の
プロセス(S4)と、 該多数の点のうち少なくとも前記複数の小領域内に含ま
れる個々の点について、前記3次元化合物構造式が該個
々の点に及ぼす作用を数値データとして算出し、該数値
データをそれと対応する個々の点に割り当てる第4のプ
ロセス(S5)と、 前記個々の点に割り当てられた数値データに基づき、各
小領域を代表する1つ又は複数の数値データを決定する
第5のプロセス(S6)と、 を備えることを特徴とする3次元化合物構造式の周辺空
間情報を数値データへ変換する方法。 - 【請求項2】 前記第3のプロセスは、前記周辺領域を
3次元格子を用いて分割し、該3次元格子内に均一に存
在する各格子点を1つの点とみなすプロセスであること
を特徴とする請求項1記載の3次元化合物構造式の周辺
空間情報を数値データへ変換する方法。 - 【請求項3】 前記第3のプロセスは、乱数を用いて前
記周辺領域内に多数の点を均一に発生させるプロセスで
あることを特徴とする請求項1記載の3次元化合物構造
式の周辺空間情報を数値データへ変換する方法。 - 【請求項4】 前記第4のプロセスで数値データとして
算出される前記作用は、少なくとも、分子軌道法による
ポイントチャージ、原子間反発力、疎水性、ボリューム
及び静電相互作用の中から選択された1つ若しくは複数
であることを特徴とする請求項1乃至3のいずれかに記
載の3次元化合物構造式の周辺空間情報を数値データへ
変換する方法。 - 【請求項5】 前記第5のプロセスで決定される前記小
領域を代表する数値データは、各小領域内の全ての点に
割り当てられた数値データの総和である請求項1乃至4
のいずれかに記載の3次元化合物構造式の周辺空間情報
を数値データへ変換する方法。 - 【請求項6】 前記第5のプロセスで決定される前記小
領域を代表する数値データは、各小領域内の全ての点に
割り当てられた数値データの平均値である請求項1乃至
4のいずれかに記載の3次元化合物構造式の周辺空間情
報を数値データへ変換する方法。 - 【請求項7】 前記第5のプロセスで決定される前記小
領域を代表する数値データは、各小領域内の全ての点に
割り当てられた数値データの最大値又は最小値である請
求項1乃至4のいずれかに記載の3次元化合物構造式の
周辺空間情報を数値データへ変換する方法。 - 【請求項8】 前記第5のプロセスで決定される前記小
領域を代表する数値データは、各小領域内の全ての点に
割り当てられた数値データの総和を該小領域の体積又は
表面積で割った値である請求項1乃至4のいずれかに記
載の3次元化合物構造式の周辺空間情報を数値データへ
変換する方法。 - 【請求項9】 予め決定された3次元化合物構造式(2
1)の周辺に、該3次元化合物構造式の全体を内包する
周辺領域(23)を設定する第1のプロセス(S12)
と、 前記周辺領域を複数の小領域(24)に分割する第2の
プロセス(S13)と、 前記3次元化合物構造式を複数の部分構造に分割する第
3のプロセス(S14)と、 前記複数の小領域内にそれぞれ1つ又は複数の仮想原子
(25)を設定する第4のプロセス(S15)と、 前記第3のプロセスで得られた各部分構造を構成する個
々の原子と前記第4のプロセスで設定された1つ又は複
数の小領域内の仮想原子との間の相互作用を数値データ
として算出し、該数値データをそれと対応する部分構造
に該部分構造を代表する値として割り当てる第5のプロ
セス(S16)と、 を備えることを特徴とする3次元化合物構造式とその周
辺空間との相互作用を数値データへ変換する方法。 - 【請求項10】 前記第4のプロセスは、前記第2のプロ
セスで得られた前記小領域の中点に1つの仮想原子を設
定するプロセスである請求項9記載の3次元化合物構造
式とその周辺空間との相互作用を数値データへ変換する
方法。 - 【請求項11】 前記第4のプロセスは、前記第2のプロ
セスで得られた前記小領域中に複数の仮想原子を一定間
隔置きに設定するプロセスである請求項9記載の3次元
化合物構造式とその周辺空間との相互作用を数値データ
へ変換する方法。 - 【請求項12】 前記第4のプロセスは、前記第1のプロ
セスで得られた前記周辺領域中に乱数を用いて複数の仮
想原子を均一に点在させて、前記小領域中に少なくとも
1つの仮想原子を配置するプロセスである請求項9記載
の3次元化合物構造式とその周辺空間との相互作用を数
値データへ変換する方法。 - 【請求項13】 前記第5のプロセスで数値データとして
算出される前記相互作用は、少なくとも原子間反発力及
び電子的相互作用のどちらか1つ若しくは両方であるこ
とを特徴とする請求項9乃至12のいずれかに記載の3
次元化合物構造式とその周辺空間との相互作用を数値デ
ータへ変換する方法。 - 【請求項14】 前記第5のプロセスで各部分構造に代表
値として割り当てられる数値データは、前記部分構造を
構成する個々の原子と前記小領域内の1個若しくは複数
個の仮想原子との相互作用を算出し、それらの総和を取
って得られる値であることを特徴とする請求項9乃至1
3のいずれかに記載の3次元化合物構造式とその周辺空
間との相互作用を数値データへ変換する方法。 - 【請求項15】 前記第5のプロセスで各部分構造に代表
値として割り当てられる数値データは、前記部分構造を
構成する個々の原子と前記小領域内の1個若しくは複数
個の仮想原子との相互作用を算出し、その中の最大値又
は最小値であることを特徴とする請求項9乃至13のい
ずれかに記載の3次元化合物構造式とその周辺空間との
相互作用を数値データへ変換する方法。 - 【請求項16】 前記第5のプロセスで各部分構造に代表
値として割り当てられる数値データは、前記部分構造を
構成する個々の原子と前記小領域内の1個若しくは複数
個の仮想原子との相互作用を算出し、それらの平均値で
あることを特徴とする請求項9乃至13のいずれかに記
載の3次元化合物構造式とその周辺空間との相互作用を
数値データへ変換する方法。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP25502394A JPH08123781A (ja) | 1994-10-20 | 1994-10-20 | 3次元化合物構造式の周辺空間情報を数値データへ変換する方法、並びに、3次元化合物構造式とその周辺空間との相互作用を数値データへ変換する方法 |
| US08/546,138 US5796632A (en) | 1994-10-20 | 1995-10-20 | Method for converting information of peripheral space of a three-dimensional compound structure into numerical data and method for converting interactions between a three-dimensional compound structure and peripheral space into numerical data |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP25502394A JPH08123781A (ja) | 1994-10-20 | 1994-10-20 | 3次元化合物構造式の周辺空間情報を数値データへ変換する方法、並びに、3次元化合物構造式とその周辺空間との相互作用を数値データへ変換する方法 |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002249877A Division JP2003196329A (ja) | 2002-08-29 | 2002-08-29 | 3次元化合物構造式の周辺空間情報の数値データへの変換装置、並びに、3次元化合物構造式と該3次元化合物構造式の周辺空間との相互作用の数値データへの変換装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH08123781A true JPH08123781A (ja) | 1996-05-17 |
Family
ID=17273120
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP25502394A Pending JPH08123781A (ja) | 1994-10-20 | 1994-10-20 | 3次元化合物構造式の周辺空間情報を数値データへ変換する方法、並びに、3次元化合物構造式とその周辺空間との相互作用を数値データへ変換する方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US5796632A (ja) |
| JP (1) | JPH08123781A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000143554A (ja) * | 1998-09-11 | 2000-05-23 | Inst Of Physical & Chemical Res | 分子の反応特性予測方法 |
| JP2003196329A (ja) * | 2002-08-29 | 2003-07-11 | Fujitsu Ltd | 3次元化合物構造式の周辺空間情報の数値データへの変換装置、並びに、3次元化合物構造式と該3次元化合物構造式の周辺空間との相互作用の数値データへの変換装置 |
| WO2010016109A1 (ja) * | 2008-08-05 | 2010-02-11 | 富士通株式会社 | サンプルの帰属クラス予測方法、帰属クラス予測プログラムおよび帰属クラス予測装置 |
| WO2010016110A1 (ja) * | 2008-08-05 | 2010-02-11 | 富士通株式会社 | 重回帰分析による予測モデルの作成方法、作成システムおよび作成プログラム |
| WO2010029627A1 (ja) * | 2008-09-11 | 2010-03-18 | 富士通株式会社 | 重回帰分析による予測モデルの作成方法、作成プログラム、作成装置 |
| JP5083320B2 (ja) * | 2007-08-22 | 2012-11-28 | 富士通株式会社 | 化合物の物性予測装置、物性予測方法およびその方法を実施するためのプログラム |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| ATE219847T1 (de) * | 1997-09-05 | 2002-07-15 | Accelrys Inc | Interaktionsmodellierung mit atomaren parametern und anisotropischer dipol-polarisierbarkeit |
| US20030148386A1 (en) * | 2001-11-09 | 2003-08-07 | North Dakota State University | Method for drug design using comparative molecular field analysis (CoMFA) extended for multi-mode/multi-species ligand binding and disposition |
| US7557954B2 (en) * | 2005-09-29 | 2009-07-07 | Lexmark International, Inc. | Fast color interpolation |
| JP5052985B2 (ja) * | 2007-07-31 | 2012-10-17 | 住友重機械工業株式会社 | 分子シミュレーション方法、分子シミュレーション装置、分子シミュレーションプログラム、及び該プログラムを記録した記録媒体 |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5025388A (en) * | 1988-08-26 | 1991-06-18 | Cramer Richard D Iii | Comparative molecular field analysis (CoMFA) |
| US5265030A (en) * | 1990-04-24 | 1993-11-23 | Scripps Clinic And Research Foundation | System and method for determining three-dimensional structures of proteins |
| US5438526A (en) * | 1991-07-12 | 1995-08-01 | Hitachi, Ltd. | Program generation method for particles simulation |
| JP2638359B2 (ja) * | 1991-11-26 | 1997-08-06 | 富士通株式会社 | 分子動力学法の拘束条件作成装置 |
| US5353236A (en) * | 1992-04-23 | 1994-10-04 | The Board Of Trustees Of The Leland Stanford University | High-resolution crystallographic modelling of a macromolecule |
| AU7311994A (en) * | 1993-05-21 | 1994-12-20 | Arris Pharmaceutical Corporation | A machine-learning approach to modeling biological activity for molecular design and to modeling other characteristics |
-
1994
- 1994-10-20 JP JP25502394A patent/JPH08123781A/ja active Pending
-
1995
- 1995-10-20 US US08/546,138 patent/US5796632A/en not_active Expired - Fee Related
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000143554A (ja) * | 1998-09-11 | 2000-05-23 | Inst Of Physical & Chemical Res | 分子の反応特性予測方法 |
| JP2003196329A (ja) * | 2002-08-29 | 2003-07-11 | Fujitsu Ltd | 3次元化合物構造式の周辺空間情報の数値データへの変換装置、並びに、3次元化合物構造式と該3次元化合物構造式の周辺空間との相互作用の数値データへの変換装置 |
| JP5083320B2 (ja) * | 2007-08-22 | 2012-11-28 | 富士通株式会社 | 化合物の物性予測装置、物性予測方法およびその方法を実施するためのプログラム |
| WO2010016109A1 (ja) * | 2008-08-05 | 2010-02-11 | 富士通株式会社 | サンプルの帰属クラス予測方法、帰属クラス予測プログラムおよび帰属クラス予測装置 |
| WO2010016110A1 (ja) * | 2008-08-05 | 2010-02-11 | 富士通株式会社 | 重回帰分析による予測モデルの作成方法、作成システムおよび作成プログラム |
| JP5141767B2 (ja) * | 2008-08-05 | 2013-02-13 | 富士通株式会社 | サンプルの帰属クラス予測方法、帰属クラス予測プログラムおよび帰属クラス予測装置 |
| JP5293739B2 (ja) * | 2008-08-05 | 2013-09-18 | 富士通株式会社 | 重回帰分析による予測モデルの作成方法、作成システムおよび作成プログラム |
| US8682813B2 (en) | 2008-08-05 | 2014-03-25 | Fujitsu Limited | Sample class prediction method, prediction program, and prediction apparatus |
| WO2010029627A1 (ja) * | 2008-09-11 | 2010-03-18 | 富士通株式会社 | 重回帰分析による予測モデルの作成方法、作成プログラム、作成装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| US5796632A (en) | 1998-08-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Bandini et al. | Cellular automata: From a theoretical parallel computational model to its application to complex systems | |
| Viau et al. | The FlowVizMenu and parallel scatterplot matrix: Hybrid multidimensional visualizations for network exploration | |
| US20030052877A1 (en) | Text overlay for multi-dimensional construction project models | |
| EP1175661B1 (en) | Computer method and apparatus for creating visible graphics by using a graph algebra | |
| Baniassadi et al. | Three-phase solid oxide fuel cell anode microstructure realization using two-point correlation functions | |
| Eddy et al. | Visualization of multidimensional design and optimization data using cloud visualization | |
| JPH08123781A (ja) | 3次元化合物構造式の周辺空間情報を数値データへ変換する方法、並びに、3次元化合物構造式とその周辺空間との相互作用を数値データへ変換する方法 | |
| Owen et al. | Hexahedral mesh generation for computational materials modeling | |
| Wouterse et al. | Geometrical cluster ensemble analysis of random sphere packings | |
| Morris et al. | Automatic preparation, calibration, and simulation of deformable objects | |
| JP2003196329A (ja) | 3次元化合物構造式の周辺空間情報の数値データへの変換装置、並びに、3次元化合物構造式と該3次元化合物構造式の周辺空間との相互作用の数値データへの変換装置 | |
| Sitharam et al. | Geometric constraints within feature hierarchies | |
| Twarock | New group structures for Carbon onions and Carbon nanotubes via affine extensions of non-crystallographic Coxeter groups | |
| Sivaloganathan | Sketching input for computer aided engineering | |
| Kristiansen et al. | Visception: An interactive visual framework for nested visualization design | |
| JP3165780B2 (ja) | 3次元モデル情報検索システム | |
| Onoue et al. | Optimal tree reordering for group-in-a-box graph layouts | |
| US20040054509A1 (en) | System and method for preparing a solid model for meshing | |
| Averbukh et al. | Virtual reality as an instrument of computer visualization | |
| Alnafisah | Enhancing algorithmic techniques for streamlined complex graph structures in big data visualization | |
| Markhede et al. | Spatial positioning tool | |
| Bovey et al. | Movement as an aid to understanding graphs | |
| Zhu et al. | Visualized CAD models of objects made of a multiphase perfect material | |
| Coomans et al. | The visualisation of building data in VR-DIS | |
| Becciani et al. | AstroMD, a tool for Stereographic Visualization and data analysis for astrophysical data |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20020730 |