JPS6272027A - 化学物質構造の記録・検索方法 - Google Patents

化学物質構造の記録・検索方法

Info

Publication number
JPS6272027A
JPS6272027A JP60213184A JP21318485A JPS6272027A JP S6272027 A JPS6272027 A JP S6272027A JP 60213184 A JP60213184 A JP 60213184A JP 21318485 A JP21318485 A JP 21318485A JP S6272027 A JPS6272027 A JP S6272027A
Authority
JP
Japan
Prior art keywords
bond
chemical
reaction
chemical substance
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60213184A
Other languages
English (en)
Other versions
JPH0564390B2 (ja
Inventor
Shinsaku Fujita
藤田 真作
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP60213184A priority Critical patent/JPS6272027A/ja
Publication of JPS6272027A publication Critical patent/JPS6272027A/ja
Publication of JPH0564390B2 publication Critical patent/JPH0564390B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の分野] 本発明は、化学物質構造の検索処理方法に関するもので
あり、さらに詳しくは、記録保存された化学反応情報に
基づいて化合物構造を検索処理する方法に関するもので
ある。
[発明の技術的背景コ 近年において、コンピュータの発達に伴ない、化学物質
、特に有機化合物の構造情報の記録方法について各種の
方法が提案され、利用されつつある。今日までに研究さ
れ、解明された有機化合物および有機化学反応は膨大な
量にのぼるが、これらの既知の情報を有効に利用して公
知の化学物質または化学反応を短詩間のうちに検索した
り、さらには所望の特性を有する新規物質の合成方法を
見い出すことが望まれている。そのためには、化学物質
および化学反応の表現形態として、技術者にとってその
構造的特徴を把握することが容易な従来の化学構造式の
代りに、コンピュータが処理できる(すなわち、コンピ
ュータが論理判断しうる)表現形態を開発し、利用する
ことが要求されている。
化学物質の記録方法としては、W L N (Wisw
esser Linear Notation )など
の線型表記法および結合表による方法が代表的なもので
あり、その詳細はたとえば、W、T、Wipke、 S
、R,He1ler、 R,j、Feldmann、 
E、Hyde(Eds) :Computer Rep
resentati。
n and Manipulation of Che
mical Information″(john W
iley and 5ons、 New York、 
+974) [ウィブケ、ヘラ−、フェルトマン、ハイ
ド(編):[化学情報のコンピュータ表現および取扱い
」(ジョン・ウィリーアンドサンズ社)]に記載されて
いる。結合表(connection table)は
、たとえば化学物質の構造式における各原子の種類、そ
れに結合する相手の原子および結合の種類などを一覧表
にまとめたものであり、上記のm型表記法に比べて化学
物質を原子単位で検索することができるとの利点がある
また、化学物質の構造変化(化学反応)に関する情報を
記録する方法についても提案されているが、今までのと
ころ満足できる表現方法は知られていない、たとえば、
化学反応に関する情報を記録する方法として反応コード
による方法があり、具体的にはJ、Vallg、 0.
5cheiner: ”Chemical Infor
mation  Systems”、E、Ash、E、
Hyde(Eds)、(Elfis )larwood
  Lim1ted、  1975)  p、241−
258   [バ −ル、シャイナ一二 「化学情報シ
ステム」、アッシュ、ハイド編(エリス拳ホアウッド社
)]に記載された方法、M、A、Lobeck、 An
gew、 Cbern、 Intern。
Ed、 Engl、、 9.578(1970) [ロ
ベック、アンゲへンテ・ヒエミー〇インターナショナル
・エディジョン・イン・イングリッシュ]に記載された
方法、およびH,J、Z、iegler、 J、 Ch
ew、 Inf、 Coaput。
Sci、、  19.141(1979)  [ジ−グ
ラ−、ジャーナル・オブeケミカル・インフォメーショ
ン・アント−コンビューテーショナル・サイエンス]に
記載された方法などがある。この方法では化学反応表現
の観点が固定されているために、新しい化学反応が見い
出された場合に記録できないとの欠点がある。また、化
学物質の構造情報とその変化の情報とが別個の形態で記
録されているので有効な情報検索を行なうことができな
いとの欠点がある。
別に、化学物質の合成経路を設計する立場から案出され
た記録方法も知られている。たとえば、E、J、Cor
ey、 R,D、Cramer、 W、J、Howe、
 J、 Am、 Chem、 Sac、、 94.44
0(1972)  [D−リ、クラマー、ホウエ、ジャ
ーナル・オブ・アメリカンφケミカル・ソサエテ4 ]
 、1.Ugi、 J、Bauer、 J、Braud
t。
J、Fr1edrich、 J、Gasteiger、
 L、Jochua+、 W、5chubert、 A
ngew、 Chew、 Intern、 Ed、 E
ngl、、 18.111(1979)  [ウギ、パ
ウアー、ブラウト、フリードリッヒ、ガスタイガー、ジ
ョッチャム、シューベルト、アンゲバンテ・ヒエミー・
インターナショナル・エディジョン番イン・イングリッ
シュ]に記載された方法がある。しかしながら、この方
法は個々の化学反応を記録するのには適していない。
これまで、以上のような各種の表現形態を用いて記録保
存された化学物質情報(化学物質ファイル)に基づいて
、所望の化合物を検索することが行なわれている。すな
わち、予め多数の化学物質に関する構造情報をコンピュ
ータに登録しておき、特定の部分構造を有する化合物を
短時間のうちに効率的に検出することが試られている。
たとえば、数十万乃至数百万個の化合物ファイルから、
まず約数子細の特徴的な部分構造によってスクリーニン
グを行ない、次いで原子−結合追跡法(atom by
 atom)によって最終的に当該部分構造を有する化
合物を検出する。
この化合物の構造検索システムにおいて、検索条件であ
る特定の部分構造のコンピュータへの人力および検出さ
れた目的化合物の出力は、化学名が通常使い慣れている
構造式または三次元の構造図の形態で行なうことができ
るのが望ましく、そして入力条件に基づくコンピュータ
内での検索は結合表を利用したatom by ato
m検索によって行なうのが望ましい、さらに、膨大な情
報の登録および蓄積は、多種多様な化合物構造を簡易に
登録でき、かつ大きな記憶容量を占めることなく蓄桔で
きる表現形態を利用して行ない、このコンピュータ処理
可能な表現形態と入出力に係る構造図との間で容易に相
互変換できることが要求されている。
[発明の要旨] 本発明は、化学反応情報を利用して特定の化学物質を検
索するための新規な処理方法を提供することをその目的
とするものである。
また本発明は、化学反応情報に基づいて化学物質の構造
に関する情報をコンピュータ処理が可能な表現形態によ
って検索し、構造式もしくは三次元の構造図の形態で表
示記録するための処理方法を提供することもその目的と
するものである。
すなわち、本発明は、少なくとも一つの出発物質から少
なくとも一つの生成物質を生ずる多数の化学反応に関す
る情報に基づいて化学物質の構造を検索処理する方法で
あって、 該化学反応に関する情報が、トポロジカルに重ね合わさ
れた該出発物質の構造と生成物質の構造との間で(1)
出発物質および生成物質に共通して存在するノード間の
結合、(2)出発物質のみに存在するノード間の結合お
よび(3)生成物質のみに存在するノード間の結合をそ
れぞれ区別して表わしてなる虚遷移構造、および/また
はこれらのメート間の結合とノードとに関する情報を含
む結合表として与えられ、 そして、少なくとも一つのノードおよび/または少なく
とも一つのノード間の結合に関する条件を含む検索条件
に対して、この検索条件を満足する化学物質に関する情
報を該化学反応の虚遷移構造および/または結合表に基
づいて抽出することを特徴とする化学物質構造の検索処
理方法を提供するものである。
本発明の方法によれば、虚遷移構造および/または結合
表として記録保存(登録)された膨大な量の化学反応情
報を利用して、入力条件に基づいて好適な処理を行なう
ことにより、目的の化学物質に関する情報を自動的に引
き出すことができる。
本発明において虚遷移構造(imaginary tr
ansition 5tructures 、以下にお
いてITSと略称する)とは、化学反応に関与する物質
の構造変化を、(1)出発物質のみに存在する結合、(
2)生成物質のみに存在する結合および(3)両者に共
通に存在する結合からなる三種類に区別して表わした一
次元もしくは三次元の構造図(図形)をいう。この構造
図は、化合物についての従来の構造式および三次元的構
造図に準じて技術者が視覚的になじみやすく、また容易
に理解できる形態で化学反応を表わすことができるもの
である。
また、結合表(connection table)は
、化学反応におけるノードの種類、該ノードに結合する
相手ノードおよび上記三種類に区別して表わしたこれら
ノー1間の結合などの組合せからなる簡単かつ明瞭な一
覧表であり、そしてこの結合表は化学反応情報をたいし
て大きな容量を必要とせずに記録媒体に蓄積保存するこ
とができるものである。
特に、登録形態として結合表を用いることによりコンピ
ュータによる情報の処理が容易となり、化学反応の登録
を簡便に行なうことができるためこれらの情報の蓄積、
管理が容易となる。
L2虚遷移構造および結合表において、化学反応は基本
的に原子、原子団などからなるノード(節、node)
と7−ドとの間の結合についての簡易な表現で表わされ
、かつ反応系におけるノード間の結合は上記三種類に区
別して表わされている。従って、コンピュータに登録さ
れた虚遷移構造および結合表は、化学反応のみならず反
応に関与する化学物質(反応の出発物質および生成物質
)についての情報をも包含している。そのために、この
虚遷移構造および/または結合表を利用して、物質構造
などの検索条件に基づいてスクリーニングまたは比較照
合からなる処理を行なうことにより、目的の化学物質に
関する情報のみを引き出すことができる。
また、本発明の方法によれば、化学物質における特定の
部分構造を検索条件としてこの部分構造を共通に有する
化学物質を抽出することができる。化学の分野においで
ある部分構造を共通に有する物質は共通の物性、反応特
性を示すことが経験的知られまた理論的に確かめられて
おり、ある目的に適合する化合物を追求したり、類似の
化合物を検出したりするために、特定の部分構造を共通
に有する一層の化合物を検索することが要求されている
。本発明においては、上記虚遷移構造および/または結
合表を利用して化合物の部分構造に基づく検索(部分構
造検索)を簡易に効率良く行なうことができる。
特に、従来より技術者が使い慣れている構造式の形態で
グラフィックス等を介して入力された部分構造に関する
検索条件に基づいて、結合表を利用して原子中位で目的
の化合物を検索することができる。また、検索された目
的化合物を虚遷移構造を介して二次元もしくは三次元の
図形として表示記録することができる。
さらに、虚遷移構造および/または結合表で表わされた
化学反応情報に種々の処理を施すことにより、反応に固
有な結合変化を表わす反応緒、開環および閉環反応等に
特有な環構造などを抽出して別種の反応情報としてコン
ピュータに登録することができるから、これらの付加的
な情報ファイルを利用して検索をより一層効率的に進め
ることができる。また、個ノ?の灰地のみならず複数の
連続する反応(多段階反応)をも一つの虚遷移構造およ
び/または結合表にまとめて表わすことができるから、
目的の化合物を任意の中間反応あるいは一連の合成反応
の過程で捕えることが可能である。換言すれば、目的化
合物に関する情報として、その構造のみならず反応特性
をも広く有意義に引き出すことができる。
目的の化学物質に関する情報は、コンピュータ処理可能
な結合表の形態でもあるいは技術者が視覚的に容易に理
解できる構造式または三次元の構造図の形態でも得るこ
とができ、得られた情報は白紙に記録したりブラウン管
などの画面に表示したり、更には適当な記録媒体に記録
保存することができる。
そして、登録された反応情報に基づいて化学物質に関す
る情報検索を短時間のうちに効率良く行なうことができ
るため、技術者の個々の研究において情報の収集、調査
等に要する時間を短縮化し、かつ得られる情報の密度を
高めて、研究を効率的に進めることができる。
これらの利点に加えて、本発明の方法においては、化学
物質の構造−活性相関の究明、未知化合物の構造自動決
定、および複雑な化合物をある条件下で反応させた場合
の反応機構および反応生成物の予測(iechanis
tic evaluation of organic
react 1on)なども併せて行なうことが可能で
ある。さらに、得られた情報は、薬品製造等にたずされ
る技術者にとって要望が大である化学物質の構造解析、
分子設計(molecular modeling)、
有機合成経路設計(heuristic analys
is qf organic 5ynthesis )
などに有利に応用することが可能である。
C発明の構成] 本発明の化学物質構造の検索処理方法(化学物質の構造
検索システム)においては、ノード間の結合を出発物質
のみに存在する結合、生成物質のみに存在する結合およ
び両者に共通に存在する結合からなる三種類に区別して
表わした虚遷移構造および/または結合表として記録保
存されている多数の化学反応情報をデータベースとして
、物質の構造に係る検索条件を満足するような化学物質
を抽出する操作が行なわれ、これにより目的の化学物質
に関する情報が得られる。
本発明の検索処理方法において、データベースとして用
いられる化学反応に関する情報ファイルは、虚遷移構造
および/または結合表としてコンピュータに記録保存(
登録)されている。
具体的に酢酸エチルを塩酸によって加水分解する反応を
例に挙げて説明する。
この化学反応は、 CH3COOCH2CH3+ H20+ HC1→CH
3COOH+ CH3CH20H+ H0文(反応式l
) で表わされる。反応の虚遷移構造(ITS)はたとえば
以下のように表わすことができる。
ここで、 1)記号−は、出発物質および生成物質に共通して存在
する結合を表わし、 11)記号中は、出発物質にのみ存在する結合を表わし
、そして 1ii)記号・・・は、生成物質にのみ存在する結合を
表わしている。
すなわち、虚遷移構造(ITS)とは、出発物質の41
造と生成物質の構造とをトポロジカルに重ね合わせて、
各ノード間の結合を上記i)〜1ii)の三種類で区別
した二次元もしくは三次元の構造をいう、なお、1トポ
ロジカルに重ね合わせる」とは具体的に、出発物質の構
造に現れるノードと生成物質の構造に現れるノードとを
一致させてこれらの構造を一つに組み合わせることをい
う。
本発明に係る虚遷移構造(I TS)において。
化学反応に関与する物質のノードは、原糸(出発物質群
)および生成系(生成物質群)に含まれる原子を単位と
して表わされていてもよいし、あるいはメチル基[上記
ノード(1) 、 (5) ] 、 メチレン基[上記
ノード(4)]のような官能基などの原子団単位で表わ
されてもよい。また、化学反応を表現するに際して、原
糸および生成系に現れるノードが一部省略して表わされ
ていてもよい。
また、三種類の結合の区別は上記1)〜111)のよう
な記号による表示に限定されるものではなく、たとえば
数字(l、2,3)等の簡単な文字による表示、あるい
は色彩(黒色、赤色、緑色)による色分は表示など利用
者が五感により判断でき。
かつコンピュータ処理が可能である限り、いかなる手段
が用いられていてもよい。
以下本発明において、 i)出発物質および生成物質に共通の結合(記号〜)を
1無色の結合」と呼び、 ii)出発物質にのみ存在する結合(記号中)をr重結
合」と呼び、 1ii)生成物質にのみ存在する結合(記号・・・)を
「入結合1と呼び、 そして、重結合と入結合とを総称してr有色の結合Jと
呼ぶことにする。
具体的に、本発明における虚遷移構造に現れる結合の種
類を第1表にまとめて示す。なお、第1表において横の
数値は結合の出入の指標を意味する。
第1表において、たとえば記号「・・・Jで表わされた
結合は中入結合(single 1n−bond) テ
あって、一対の数字(0+1)で表わすことができる。
ここで、0は反応前の原系において結合が存在しないこ
とを代味し、+1は反応後の生成系において単結合が生
じていることを意味する。同様にして、f + Jで表
わされた結合は小出結合(single out−bo
nd )であって(11)で表わし、反応前の原系にお
いて単結合が存在するが反応後の生成系において単結合
が消滅していることを意味する。また、(2〜l)で表
わされる結合は吊出の二重結合(double bon
d 5iB17 cleaved)であり、「=」で表
記される。
このように結合の種類はまた、一対の数字:(a、b)
[ただし、aは出発物質における結合多重度を表わす整
数であり、bは化学反応における結合多重度の変化を表
わす整数である]で表わすことができ、この場合には結
合多重度か二以上であっても簡潔に表記することができ
る。なお、(a、b)の表記のうちコンマ(、)は省略
してもよい、また、この表記によれば、記憶容量をそれ
ほど必要としなく、かつ直接にコンピュータ処理が可能
である点で化学反応の記録保存に特に好ましい。
化学反応はまた、各メート、該メートに結合する結合相
手のノードおよび該ノード間の結合に関する情報を含む
結合表(connection table)として表
わすことができる。
ト記エステルの加水分解反応についての結合表を第2表
に示す、なお、結合表は各ノードの二次元座標(xy座
標)に関する情報をも包含している。
第2表に示すように、結合表は加水分解反応に関与する
原糸(酢酸エチル、水、塩酸)および生成系(酢酸、エ
タノール、塩酸)について、全てのノード、その二次元
座標(ノード(1)を原点にとっである)、各ノードに
結合する全てのノードおよびこれらノード間の結合の種
類がノード番号順に記載された一覧表である。
なお、反応の虚遷移構造に基づいて結合表を作成するこ
とが可能であり、逆に結合表が各ノードの位置情報を含
んでいる場合には結合表から虚遷移構造を作成すること
ができる。換言すれば、虚遷移構造と結合表とは、化学
反応情報の登録および表示形態として表裏一体の関係を
なすものと言える。
結合表には、上記のように各ノードの位置座標等に関す
る入力情報が併記されていてもよい、また、虚遷移構造
および/または結合表には付加情報として所望により、
各ノードの電荷および立体化学等に関する情報;反応に
関与する化学物質の各種の物性値、スペクトル情報;お
よび反応のエンタルピー、温度、時間、使用する触媒、
雰囲気、反応相、反応の収率、副生成物の有無等に関す
る情報が記載されていてもよい、さらに、虚遷移構造お
よび/または結合表には化学反応情報の蓄積、管理およ
び検索を容易にするために、行別に反応名、反応番号な
どが付されていてもよい。
虚遷移構造および/または結合表のコンピュータへの登
録は、コンピュータ内の主犯t!!J装置に記録保存す
ることにより行なってもよいし、あるいは適当な記録媒
体(磁気ディスク 光ディスク、磁気テープなど)を介
して記録保存してもよい。
また、登録された虚遷移構造および/または結合表は、
適当な記録装置によりプレインペーパーなど各種の記録
材料上に記録したり、あるいはコンピュータや電子機器
に接続したカラーブラウン管などに表示(グラフィック
ディスプレイ)することができる。
化学反応の表現形態および反応情報の登録、蓄積方法の
詳細については、本出願人による特願昭60−1773
45号および特願昭60−180875号の各明細書に
記載されている。
このようにして虚遷移構造および/または結合表の形態
でコンピュータに登録された多数の化学反応についての
情報ファイルを利用して、特定の化学物質に関する情報
は以下に述べるような方法により抽出される。
まず、入力された検索条件に基づいてスクリーニングを
行なう。
検索条件は、少なくとも一つのノードおよび/または少
なくとも一つのノード間の結合に関する構造条件を含む
。その例として、炭素数が12個の脂肪族炭化水素(C
l3)、−C=N−結合を含む化合物などを挙げること
ができる。すなわち、目的の化学物質構造の一部(特徴
的な部分)でも全部でもよい。
入力は、従来の化学構造式、上記の結合表あるいはこれ
らの組合せの形態で行なわれる。入力が構造式の形態で
行なわれた場合でも、この構造条件に基づいてコンピュ
ータ処理によりコンピュータ処理可能な結合表の形態に
自動的に変換することができ、好ましい方法である。
このときスクリーニングの効率を丑げるために、ノード
を原子団のみで構成してもよいし、更にはメートおよび
結合種の表現として簡略化した文字、記号(HA=ハロ
ゲン、MT=金属)を用いたり、芳香族、ヘテロ環など
の条件を加えてもよい。また、原子の種類あるいは置換
基の位置に複数の可能性がある場合にはいわゆるマーカ
ッシュ表現(例えば、X=Cu、OH)を用いることも
できるし、釦と環とを区別して検索するか否かなどの条
件を付は加えることもできる。さらに化学構造とともに
各種の物性、反応特性、電荷、立体特性(各ノードの三
次元的相対位置)などの条件を付は加えることも可能で
ある。
入力は、通常のテレタイプライター、化学構造式が描け
るように工夫された化学用タイプライタ−などの文字端
末;およびキーボード、ジョイスティック、ライトペン
などを用いる画像端末(グラフィック端末)を利用して
行なうことができる。後者の画像端末はグラフィックデ
ィスプレイヒに直接に二次元図形を描くことができる点
で利用しやすいものである。いずれの端末を利用する場
合でも質問形式で入力することができ、また、多種類の
検索条件を設定する場合には通常のプール演’11 (
AND、 OR,N0T)を用いることができる。
これらの検索条件に対して、虚遷移構造および/または
結合表として登録されている化学反応情報のうち、反応
に関与する化学物質(すなわち、出発物質および生成物
質)が検索される直接の対象となる。
E記エステルの加水分解反応を例にとれば、反応の出発
物質は、虚遷移構造(ITSI)から入結合(記号・・
・)を無視して無結合とみなすことにより、また生成物
質はITSIから出結合(記号+)を無視して無結合と
みなすことにより、それぞれ以下のような構造式として
導き出される。
以下余白 敬五      (6) (7))I      0文 1虚五     (6) (7))l−0文 (8)(+1) ITSが三次元の虚遷移構造である場合には、出発物質
および生成物質の構造は三次元の構造図として導き出さ
れる。
また、反応の結合表から、出発物質および生成物質に関
する結合表は以下に述べるような方法により導き出され
る。
たとえば、ノード間の結合が第2表に示したよ〉に一対
の数字(a、b)[ただし、aは出発物質における結合
多重度を表わす整数であり、bは化学反応における結合
多重度の変化を表わす整数である]で表わされている場
合には、出発物質は各ノード間の結合多重度をaとみな
すことにより、また生成物質は各ノード間の結合多重度
をa+bとみなすことにより、それぞれ導き出される。
具体的には、スクリーニングを行なうに際してデータベ
ースとなる虚遷移構造および/または結す表についてこ
のような条件をつけたのち、上記の検索条件を満たす化
学物質を探し出す操作を行なう。
あるいは予め、ITSおよび/または結合表から原糸お
よび生成系を抽出する操作[それぞれ、f原糸への投影
J  (projection to the sta
rtingstage、 P Sと略称する)、T生成
系への投影】(projection to the 
product stage 、  P Pと略称する
)]を行ない、得られた出発物質および生成物質につい
ての情報は別に化学物質ファイルとしてそれぞれコンピ
ュータに登録しておいてもよい。
化学物質情報の登録に際して、原糸および生成系の構造
図とともにITSを一緒に記録してもよいし、また情報
の蓄積および検索を容易にするために、構造図および/
または結合表ごとに物質番号あるいは物質名を付しても
よい。
PSおよびPP操作の詳細については、本出願人による
昭和60年8月22日出願の特願昭60−   号明細
書に記載されている。
このようにして、反応の出発物質および生成物質を対象
として、検索条件を満足する化学物質のみが検出される
。コンピュータ処理機能の点から、検索は結合表に基づ
いて行なわれるのが好ましい。特に、グラフィックディ
スプレイ上で構造式の形で入力された検索条件を満足す
べく対話形式で、結合表に基づいてatom b7 a
toa+で検索できるのが好ましい。
検出された化学物質が多数である場合には、さらに同様
の操作を綴り返すことにより、より一層目的に適った物
質をスクリーニングすることができる。
あるいは、−次スクリーニングとして、典型的な部分構
造をコード化しておき、この構造コード(フラグメント
コード)を利用して原子団−結合追跡法(group 
by group)に類する検索を行なってもよい。
あるいはまた、スクリーニングを容易にするために、予
め上記反応のITSおよび/または結合表について環構
造を抽出する操作を行ない、得られた環構造についての
情報を別に環構造ファイルとしてコンピュータに登録し
ておき、このファイルを用いて一次スクリーニングを行
なってもよい。
ここで、環構造とはITSに現れる環状構造をいい、反
応に特有の表現を示すものである。
化学反応に関与する環構造は以下の五種類に大別するこ
とができる。
(I)開環の環(ringof ring openi
ng)開環の環は、ただ一つの出結合を含み、残りの結
合は全て無色の結合である環構造をいい、開環反応に対
応している。従って、開環の環を示す反応における出発
物質は環構造を有する。
(II )環開裂の環(ring of ring c
leavage )環開裂の環は、二つ以上の出結合を
含み、残りの結合が全て無色の結合である環構造をいう
。従って、環開裂の環を示す反応における出発物質は環
構造を有する。
(m)閉環の環(ring of ringclosu
re)閉環の喝は、一つの入結合を含み、残りの結合が
全て無色の結合である環構造をいい、閉環反応に対応し
ている。従って、閉環の環を示す反応における生成物質
は環構造を有する。
(IV)環生成の環(ring of ring fo
rIlation)環生成の環は、二つ以上の入結合を
含み、残りの結合が全て無色の結合である環構造をいう
、従って、環生成の環を示す反応における生成物質は環
構造を有する。
(V)転位の環(ring of rearrange
ment )転位の環は、環構造が一つの出結合と一つ
入結合とを含み、残りの結合が全て無色の結合である環
構造をいう。
具体的に、開環の環を例に挙げて説明する。
たとえば、下記反応式2で表わされるエステルの加水分
解反応において、 →HO2C(CH2) 、C0OH +C2H,OH(反応式2) ITSは次のように表わされる。
(14) H(7)   (!]) (20)+ まず、ITS2から、無色および有色の全ての結合のう
ち結合が環状に連結して一つの環を構成している部分を
認識し、検出する。
得られた環構造(環1)は、一つの出結合と五つの無色
の結合とからなる六員環であり、開環の環である。
この開環の垣はまた、 なる文字列で表わすことができる。
また、環構造は反応の結合表からも直接に抽出すること
ができる。
上記五種類の環構造はたとえば、上記の(a。
b)表記を利用して次のようにに類別することができる
無色および有色の結合はそれぞれ以下の条件:i)無色
の結合:a≠0、 a+b≠0 11)出結合:  a≠0、b=o。
a+b二〇 111)大結合: a=0、b≠0、 a+b  ≠ 0 を満たすから、禮構造は下記第3表に示すように類別さ
れる。なお、第3表において、環はn員El(nは正整
数である)であり、mは2≦m<nの範囲の正整数であ
る。
第3表 環構3      a≠Oa+t+−Oa=0a+b+
: O n−110 II             n  −m     
  m       On−101 1V             n  −m     
  Omn−211 Vl               n       
  0       0なお、環構造Vlは、出発物質
および生成物質のいずれにも環構造が変化することなく
存在する場合である。
この環抽出操作の詳細については、本出願人による昭和
60年9月9日出願の特願昭60−号明細書に記載され
ている。
芳香族環、ヘテロ環などの環構造を有する物質を検索す
る場合には、この環構造ファイルを利用することにより
検索の効率を高めて検索時間を短縮化することができる
このようにして、化学物質の部分構造検索、完全一致検
索あるいは異性体検索を実施することができる。そして
、上記化学反応情報ファイルが反応の出発物質および生
成物質の物性、反応条件など種々のデータを付加情報と
して含んでいる場合には、目的の化学物質の構造のみな
らずこれらの付加情報をも入手することができる。
また、本発明においては、構造検索だけではなく、文献
検索と組み合わせて構造検索を行なうことも可能である
さらに、所望により、目的の化学物質に関する情報とし
て反応特性に関する知見を得ようとする場合には、予め
F記反応のITSおよび/または結合表について反応緒
を抽出する操作を行ない、得られた反応緒についての情
報を別に反応諸ファイルとしてコンピュータに登録して
おき、上記反応ファイルと反応基または反応番号等で関
連づけておくことにより、目的化合物の抽出とともに該
化合物の反応中心、反応特性などについての情報を得る
ことができる。
ここで、反応緒(reaction string )
とは複数の出結合と大結合とが交互に連結してなる部分
圧、応構造をいい、反応に固有な結合の変化を表わすも
のである。
たとえば、上記エステルの加水分解反応(反応式l)を
例にとれば、ITSIから出結合(記号→)および大結
合(記号・・・)のみを抽出することにより得られる。
以下余白 反応諸はまた、 (2) −(3) +(10)−(+1)+(8) −
(7) +(2)なる文字列で表わすことができる。こ
こで、記号−は出結合を表わし、記号十は大結合を表わ
す。
また、反応緒は反応の結合表からも抽出することができ
る。
なお、上記ITSIにおいて反応緒は一本であるが、反
応によっては反応緒が二本以上であることもある。一般
に有機反応は、反応緒の数によって分類することができ
る。一本の反応緒を含むITSで表わされる有機反応を
一本緒反応(one−string reaction
 )と称する。同様に、二本の反応緒および三本の反応
緒を含むITSをそれぞれ、二本諸反応(two−st
ring reaction )および三本緒反5 (
three−strin3 reaction )と称
する。このことから反応線単位で反応を分割することが
可能であり、逆に複数本の反応緒を有する反応は二段階
以上の連続反応であると看做することができる。
反応緒の抽出操作の詳細については、本出願人による昭
和60年9月5日出願の特願昭60−号明細書に記載さ
れている。
また、個々の反応のITSおよび/または結合表に基づ
いて、複数の連続する反応のITSおよび/または結合
表を作成する操作を行ない、得られた多段階反応のIT
Sおよび/または結合表を別に多段階反応ファイルとし
てコンピュータに登録しておいて利用することもできる
。これにより、目的化合物の情報を複雑な合成反応など
一連の反応に位置づけて得ることができる。
多段階反応のITSおよび結合表は、たとえば上記(a
、b)表記で表わされた各段階の単位反応についての結
合表に基づいて、下記の演算処理を行なうことにより得
られる。
すなわち、各段階の反応における各ノード間の結合が、
一対の数字(aX’、 bX’)  [ただし、iはl
≦i≦nの範囲の正整数であり、nは全反応の組設階数
を表わす2以上の正整数であり、a。1はi段階の反応
の出発物質における結合多重度を表わす整数であり、b
81はi段階の反応における結合多重度の変化を表わす
整数であり、モしてXはノード間の結合を表わす]で表
わされているとき、 a、jk二Bxj bxjk  = 1)x1+b×」’++・+ bxk
−1+ bxk[ただし、jおよびkはそれぞれ1≦j
<k≦nなる条件を満足する正整数であり、3%にはj
段階からに段階までの反応の出発物質における結合多重
度を表わす整数であり、bXJkはj段階からに段階ま
での反応における結合多重度の変化を表わす整数であり
、モしてXはノード間の結合を表わす] なる結合の演算を行なうことにより、j段階からに段階
までの反応に関する情報は(ax”。
bxlk)として得られる。
さらに、連続する多段階反応を合成ルート属(reac
tion−route claSses)として登録す
ることもできる。
たとえば、i段階よりなる逐次反応において、s−p、
→P2→P3→P4→P、:IRBCDE (ここで、Rは五段階反応の合成空間を意味し、Sは五
段階反応の出発物質を意味し、P、〜P、は各段階の反
応の生成物質を意味する)各段階のITSおよび/また
は結合表をそれぞれ屯にA、B、C1・・・で表わすと
、この逐次反応の合成ルート属は、第4表のようにファ
イルにしてまとめることができる。
以下余白 第4表に示した合成ルートミツアイルにおいであるIT
Sに着目すると、このITSより右側であってかつ下側
に位lするITSは全てこのITSの部分反応を表わし
ている。たとえば、DCBについてはCB、B、DC,
CおよびDがその部分反応を表わすITSであるといえ
る。
この合成ルート属ファイルを利用して化学物質の検索を
行なった場合には、ITS (DCB)が見い出された
(ヒツトした)とき、該ファイルを解いてこのDCBに
関係する全ての反応を出力させることができる。
多段階反応の情報のITSおよび/または結合表作成操
作の詳細については、本出願人による昭和60年9月1
3日出願の特願昭60−   号明細書に記載されてい
る。
以上の構造検索により得られた目的の化学物質に関する
情報(物質構造、物性、反応特性等)は、CRTなどの
グラフィックディスプレイ上に二次元もしくは三次元の
構造図として表示することができる。この際に、二次元
の構造図として得られた構造情報を基にして、エネルギ
ー計算(分子力場計算など)により最適化された分子の
三次元座標を得るような操作を施すことにより、三次元
の構造図(三次元構造、空間充填図など)を得ることも
可能である。また、任意の角度から見た三次元の構造図
をディスプレイ上に拡大または縮小して表示することが
できる。
また、得られた情報はプレインペーパーなどの適当な記
録材料上に記録(ハードコピー化)することもできる。
さらに、磁気ディスクなどの適当な記録媒体に記録保存
してもよい。

Claims (1)

  1. 【特許請求の範囲】 1、少なくとも一つの出発物質から少なくとも一つの生
    成物質を生ずる多数の化学反応に関する情報に基づいて
    化学物質の構造を検索処理する方法であって、 該化学反応に関する情報が、トポロジカルに重ね合わさ
    れた該出発物質の構造と生成物質の構造との間で(1)
    出発物質および生成物質に共通して存在するノード間の
    結合、(2)出発物質のみに存在するノード間の結合お
    よび(3)生成物質のみに存在するノード間の結合をそ
    れぞれ区別して表わしてなる虚遷移構造、および/また
    はこれらのノード間の結合とノードとに関する情報を含
    む結合表として与えられ、 そして、少なくとも一つのノードおよび/または少なく
    とも一つのノード間の結合に関する条件を含む検索条件
    に対して、この検索条件を満足する化学物質に関する情
    報を該化学反応の虚遷移構造および/または結合表に基
    づいて抽出することを特徴とする化学物質構造の検索処
    理方法。 2、上記化学物質に関する情報が化学反応の出発物質も
    しくは生成物質として抽出されることを特徴とする特許
    請求の範囲第1項記載の化学物質構造の検索処理方法。 3、上記結合表において、ノード間の結合が一対の数字
    (a、b)[ただし、aは出発物質における結合多重度
    を表わす整数であり、bは化学反応における結合多重度
    の変化を表わす整数である]によって区別して表わされ
    、そしてノードの種類とノード間の結合をaまたはa+
    bで表わした結合多重度とに基づいて、化学物質に関す
    る情報を抽出することを特徴とする特許請求の範囲第1
    項記載の化学物質構造の検索処理方法。 4、上記検索条件が、化学物質の部分構造に関するもの
    であることを特徴とする特許請求の範囲第1項記載の化
    学物質構造の検索処理方法。 5、上記検索条件が、構造式もしくは三次元の構造図と
    して与えられることを特徴とする特許請求の範囲第1項
    記載の化学物質構造の検索処理方法。 6、上記検索条件が、ノードの種類およびノード間の結
    合多重度、またはこれらとノードの二次元もしくは三次
    元の座標との組合せとして与えられることを特徴とする
    特許請求の範囲第1項記載の化学物質構造の検索処理方
    法。 7、上記化学物質に関する情報が、構造式もしくは三次
    元の構造図として得られることをを特徴とする特許請求
    の範囲第1項記載の化学物質構造の検索処理方法。 8、上記化学物質に関する情報を記録材料もしくは表示
    装置の画面上に表示記録することを特徴とする特許請求
    の範囲第1項記載の化学物質構造の検索処理方法。
JP60213184A 1985-09-25 1985-09-25 化学物質構造の記録・検索方法 Granted JPS6272027A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60213184A JPS6272027A (ja) 1985-09-25 1985-09-25 化学物質構造の記録・検索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60213184A JPS6272027A (ja) 1985-09-25 1985-09-25 化学物質構造の記録・検索方法

Publications (2)

Publication Number Publication Date
JPS6272027A true JPS6272027A (ja) 1987-04-02
JPH0564390B2 JPH0564390B2 (ja) 1993-09-14

Family

ID=16634931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60213184A Granted JPS6272027A (ja) 1985-09-25 1985-09-25 化学物質構造の記録・検索方法

Country Status (1)

Country Link
JP (1) JPS6272027A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0354670A (ja) * 1989-07-21 1991-03-08 Mitsubishi Electric Corp 画像検索装置
JP2024146232A (ja) * 2023-03-31 2024-10-15 住友化学株式会社 情報提供装置、情報提供方法及びコンピュータープログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0354670A (ja) * 1989-07-21 1991-03-08 Mitsubishi Electric Corp 画像検索装置
JP2024146232A (ja) * 2023-03-31 2024-10-15 住友化学株式会社 情報提供装置、情報提供方法及びコンピュータープログラム

Also Published As

Publication number Publication date
JPH0564390B2 (ja) 1993-09-14

Similar Documents

Publication Publication Date Title
EP0213483B1 (en) Method for processing information on chemical reactions
JPS6257017A (ja) 化学反応情報の処理方法
US5047929A (en) Method for processing information on chemical reactions
US5023802A (en) Method for processing information on chemical reactions
JPS6272027A (ja) 化学物質構造の記録・検索方法
JPS6285331A (ja) 化学物質の合成経路の設計処理方法
Roberts A systematic approach to the classification and nomenclature of reaction mechanisms
JPS6279520A (ja) 化学反応の検索処理方法
JPS63226725A (ja) 化学反応情報の記録・検索方法
JPS6237738A (ja) 化学反応情報の記録・検索方法
JPS63197224A (ja) 化学反応情報の処理方法
Willett The evaluation of an automatically indexed, machine-readable chemical reactions file
Bersohn et al. Steps toward the Automatic Compilation of Synthetic Organic Reactions
JPS63197223A (ja) 化学反応情報の記録・検索方法
JPS6244828A (ja) 化学反応情報の記録・検索方法
JPS63197226A (ja) 化学反応情報の記録・検索方法
JPH0564387B2 (ja)
JPH10326285A (ja) ドキュメント管理システム
JPS63247827A (ja) 化学反応情報の処理方法
Barcza et al. Integrated chemical-biological-spectroscopy-inventory-reactions preclinical database
JPS63197225A (ja) 化学反応情報の処理方法
JP3990764B2 (ja) 反応検索方法、反応検索装置および反応検索用記憶媒体
Jombart et al. Analysing Genome-Wide SNP Data using Adegenet. 2012
JPH0740273B2 (ja) 化学反応情報の記録・検索方法
Barnard et al. Retrieval of Organic Structures from Small-to-Medium Sized Collections.

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees