WO2003077159A1 - Method of forming molecule function network - Google Patents

Method of forming molecule function network Download PDF

Info

Publication number
WO2003077159A1
WO2003077159A1 PCT/JP2003/002847 JP0302847W WO03077159A1 WO 2003077159 A1 WO2003077159 A1 WO 2003077159A1 JP 0302847 W JP0302847 W JP 0302847W WO 03077159 A1 WO03077159 A1 WO 03077159A1
Authority
WO
WIPO (PCT)
Prior art keywords
biomolecule
information
database
molecular
molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2003/002847
Other languages
English (en)
French (fr)
Inventor
Nobuo Tomioka
Akiko Itai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Medicinal Molecular Design Inc IMMD
Original Assignee
Institute of Medicinal Molecular Design Inc IMMD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Medicinal Molecular Design Inc IMMD filed Critical Institute of Medicinal Molecular Design Inc IMMD
Priority to EP03708546A priority Critical patent/EP1492019A4/en
Priority to CA002478963A priority patent/CA2478963A1/en
Priority to US10/506,610 priority patent/US20060004706A1/en
Priority to JP2003575304A priority patent/JPWO2003077159A1/ja
Priority to CN038107031A priority patent/CN1653454B/zh
Priority to AU2003213457A priority patent/AU2003213457A1/en
Publication of WO2003077159A1 publication Critical patent/WO2003077159A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes

Definitions

  • the present invention relates to a method for creating and using a biomolecule database including information on biological events.
  • a characteristic of biological systems is that not only are they composed of a variety of biomolecules, but all phenomena in living organisms, including the manifestation of functions, occur through specific binding between biological molecules. This specific binding does not form a covalent bond, but forms a complex stabilized only by intermolecular forces. Therefore, a biomolecule is a force that will exist in an equilibrium state between a state in which it is present alone and a complex state. Are significantly biased toward the composite side.
  • the substrate is released as a reaction product after undergoing a predetermined chemical transformation in a state of forming a complex with the enzyme.
  • signal transduction the binding of a mediator molecule to a target biomolecule The extracellular signal is transmitted into the cell through the change in the structure of the target biomolecule accompanying this.
  • genomic sequences have been elucidated for various biological species including humans, and gene and gene product protein sequences, protein expression in each organ, protein-protein interaction, etc. Also, genome-wide systematic research is progressing. Most of these research results are published as databases, It is being used throughout the world. The function of genes and proteins, the estimation of genes that are the cause or background of diseases, and the relationship with genetic polymorphisms have been gradually elucidated, and expectations for medical information and new drug development based on genetic information have increased.
  • nucleic acids are responsible for genetic information, but most of the vital functions such as energy metabolism, material conversion, and signal transmission are carried by molecules other than nucleic acids.
  • Proteins differ from other categories of molecules in that proteins are produced directly on the basis of genetic blueprints, and there are many types of proteins. Enzymes, target biomolecules of low molecular bioactive compounds, and target biomolecules of protein bioactive compounds (often modified with sugars) are all proteins. Regardless of the underlying cause of the disease, many diseases and conditions are thought to be the result of abnormalities in the amount and balance, and in some cases, the quality (function) of proteins and small molecules. Most existing drugs are compounds that target proteins and control their functions. Unlike proteins, the three-dimensional structure of nucleic acids is unlikely to exhibit specificity as a target for low-molecular-weight drugs. is there.
  • KEGG Kanagu et al., Kyoto University
  • Biochemical Pathways Boehringer Mannheim
  • WIT Russian Academy of Sciences
  • Biofrontier feha
  • Protein Pathway AxCell
  • bioSCOUT LION
  • EcoCyc DoubleTwist
  • UM-BBD Minnesota Univ.
  • KEGG's PATHWAY database contains metabolic pathways and signal transduction pathways.
  • the former deals with the pathways of general low-molecular-weight compounds involved in substance metabolism and energy metabolism, and the latter deals with signal transduction proteins. Both provide a predefined molecular network in a static Gif file.
  • information on enzymes and ligands is taken from LIGAND (Kanahisa et al., Kyoto University) and ENZYME (IUPAC-IUBMB), which are other textual molecular databases. It does not include enzymes or target biomolecules involved in the production of bioactive peptides.
  • EcoCyc is a database of the metabolism of Escherichia coli, based on data on individual enzyme reactions and data on known pathways (expressed as a set of enzyme reactions belonging to the pathway). Display. EcoCyc provides a search function based on character strings and abbreviations for molecule names and pathway names, but cannot search for new pathways by specifying an arbitrary molecule.
  • CSNDB National Institute of Health Sciences, Japan
  • SPAD Korean et al., Kyushu University
  • Gene Net Institute of Cytology & Genetics Novosibirsk, Russia
  • GeNet GeNet
  • UCLA DIP
  • PathCalling CuraGen
  • ProNet Myriad
  • Protein expression databases include BodyMap (University of Tokyo, Osaka University), SWISS-2DPAGE (Swiss Institute of Bioinformatics), Human and mouse 2D PAGE database (Danish Center for Human Genome Research), HEART- 2DPAGE (GermanHeart), PDD Protein Disease Databases (NIMH-NCI), Washington University Inner Ear Protein Database (Washington Univ.), P thigh-2DPAGE (Purkyne Military Medical) Academy), Mito-Pick (CEA , France), Molecular Anatomy Laboratory. (Indiana Lniversity), Human and olon Carcinoma Protein Database (Ludwig Institute for Cancer Research) force s Oh. E-Cell (Tomita et al., Keio University), e E. coli (B. Palsson), Cell (D. Lauffenburger, MIT), Virtual Cell (L. Leow, Conneticut Univ.) , Virtual Patient (Entelos, Inc.).
  • COPE Universality of Munich
  • COPE Universality of Munich
  • ARIS Natural Denshi Kagaku Co., Ltd.
  • NASH OMIM
  • the problems with existing databases that focus on the connections between molecules are as follows.
  • the molecular network type database is created for a system in which the connection between molecules included is known, and since it is possible to arrange in consideration of the relationships between molecules in advance, a static G ⁇ And so on.
  • this method makes it difficult to add new molecules and connections between molecules. Including molecules that will be revealed in the future, including more than 100,000 (KEGG handles about 10,000 molecules, including drug molecules).
  • KEGG handles about 10,000 molecules, including drug molecules.
  • the complexity of the molecular network is expected to increase at an accelerating rate.
  • KEGG stores the link between molecules as a pair of two molecules, and can use this information to search for a path connecting any two molecules in the metapolic pathway. It has become.
  • a path search problem has a problem that the computation time increases exponentially as the path connecting two molecules becomes longer.
  • An object of the present invention is to provide a mechanism and a method for understanding various biological responses and phenomena in terms of the function of a biomolecule and the relationship between the molecules, and more specifically, to provide information on biomolecules in a biomolecule.
  • the purpose is to provide a database that can be linked to the response and a search method for the database. Furthermore, from such a vast amount of information, it is possible to quickly and efficiently extract only signal transduction pathways and biosynthetic pathways related to any biological response or biomolecule, and to estimate promising drug targets and risk of side effects. It is one of the objects of the present invention to provide a method.
  • the present inventors have worked diligently to solve the above-mentioned problems, and as a result, by collecting information of pairs of directly binding biomolecules as a part, the connection between biomolecules is covered, and biomolecules are included in biomolecules.
  • information on biological events consisting of physiological actions, biological responses, clinical symptoms, etc. is stored in addition to information on pairs with target biomolecules, and one or more specified biomolecules or
  • By automatically searching for connections including biological events one after another and creating a molecular function network They found that the problem could be solved, and filed a patent application for those inventions (PC D ZJP 01/07830).
  • a method of generating a molecular function network using a biomolecule linkage database in which information on directly binding biomolecule pairs is accumulated is described in the specification of PCT / JP01 / 07830.
  • the above-mentioned method using a biomolecule information database; and the above-mentioned method for generating a molecular functional network including a drug molecule related to information on a bio-event are provided.
  • a method for estimating a bio-event involving any bio-molecule or drug molecule directly or indirectly using a bio-molecule-linkage database in which information on bio-events relating to directly-bonded bio-molecule pairs is stored.
  • the biomolecule is a protein encoded by a gene in an external database or literature
  • a database is created by associating the molecular abbreviation of the biomolecule with the name or ID or abbreviation of the gene.
  • the molecular function network is hierarchized based on the belonging subnets and the inclusion relation between the subnets, with the biomolecule pair data grouped based on the sequence on the network as a subnet.
  • the above method wherein the information on the biomolecule pair is stored in a hierarchical manner based on the assigned path name, assigned subnet name, etc. of the molecule pair;
  • the above-mentioned method characterized in that it is stored hierarchically based on the pattern of expression from the cell, the pattern of appearance on the cell surface, etc .;
  • the above-mentioned method is provided, characterized in that it is stored hierarchically based on the relation of (1).
  • the relationships and dependencies between the items are stored for the upper hierarchy for the biomolecule pair, the upper hierarchy for the biomolecule itself, and the upper hierarchy for the bioevent.
  • the method described above characterized by storing information related to the use of biomolecules, and the use of hierarchical information stored in a biomolecule information database or a biomolecule linkage database.
  • the above method characterized by controlling the detail in the representation of a molecular function network by using hierarchical information stored in a biomolecule information database or a biomolecule linkage database.
  • the above method is also provided by the above invention.
  • a biomolecule pair can be obtained by combining one or more of the following relational codes, relational function codes, reliability codes, working organs, orientation of biomolecule pairs, and other data items.
  • the molecular function network generated by the connect search using the biomolecule linkage database is converted into one or more of the relational code, relational function code, reliability code, working organ, direction of biomolecule pair and other data items.
  • a method for generating a molecular function network wherein the range of the generated molecular function network is limited by the number of paths.
  • a method of generating a molecular functional network connecting three or more molecules by repeating a connect search between two molecules and merging the results of the search.
  • a method for generating a molecular function network comprising performing a connect search by applying a filter to a biomolecule based on information on a generating organ and / or an existing organ of the biomolecule.
  • a method for generating a molecular function network comprising performing a connect search by filtering a biomolecule based on information on the expression level of a biomolecule and / or the transcription level of a gene.
  • a method for generating a molecular function network characterized by using information on two or more species.
  • FIG. 1 is a diagram showing the basic concept of the method of the present invention.
  • FIG. 2 is a diagram showing an example of a result of a connect search including routes having different path lengths.
  • FIG. 3 is a diagram showing an example of a result of a connect search specifying one end point.
  • FIG. 4 is a diagram showing an example of a result of a connect search specifying three or more end points.
  • FIG. 5 shows the concept when a drug molecular linkage database is used in the method of the present invention.
  • FIG. 6 is a diagram showing a concept when a genetic information database is used in the method of the present invention.
  • FIG. 7 is a diagram showing a method of registering the complex information of Example 1 in a biomolecule information database and a method of using the same.
  • FIG. 8 is a diagram showing a method of associating the complex state and the single state of the biomolecule of Example 1 with each other.
  • FIG. 9 is a diagram illustrating a method of expressing a modification state by layering biomolecule data in Example 2.
  • FIG. 10 is a diagram showing a method of treating different modification states of the biomolecule of Example 3 collectively.
  • FIG. 11 is a diagram illustrating the concept of the relevance of data items in the pathological condition database using diabetes as an example.
  • FIG. 12 is a diagram showing the relationship between the subnets in the molecular function network obtained by the search method of Example 5 and the key molecules in the pathological condition database.
  • FIG. 13 is a diagram showing a method for examining the mechanism of a disease using the molecular function network from the disease name and the pathological event in Example 6.
  • FIG. 14 is a diagram showing a method of searching for a subnet from a disease name via a key molecule in Example 7.
  • FIG. 15 is a diagram showing a method for examining the function and role of the biomolecule of Example 8 in a living body.
  • FIG. 16 is a diagram showing a search result using the disease state chain database of Example 9.
  • FIG. 17 is a diagram showing a method for examining the action mechanism of a drug molecule based on target biomolecule information in the drug molecule information database of Example 10.
  • FIG. 18 is a diagram showing a method of examining the details of the action mechanism of a drug molecule via the biomolecule, bioevent, subnet, etc. of Example 11. ' BEST MODE FOR CARRYING OUT THE INVENTION
  • PCTZ J P01 / 07830 it is useful to refer to the disclosure of PCTZ J P01 / 07830 for an understanding of the present invention.
  • the entire disclosure of the above-mentioned PCT / JP01 / 07830 is incorporated herein by reference.
  • living body is a concept that includes all or a part of a living organism such as an organelle, a cell, a tissue, an organ, a living individual, or an aggregate, and includes a living organism that is parasitic on a living organism.
  • Bio event is a concept that includes all phenomena, responses, reactions, and symptoms that occur endogenously or exogenously in a living body. Specific examples include transcription, cell migration, cell adhesion, cell division, neural circuit excitation, vasoconstriction, increased blood pressure, hypoglycemia, fever, convulsions, infection by foreign organisms and parasites such as viruses, and the like. it can. In addition, a physical stimulus from the outside of the living body such as light or heat and the response of the living body to it can be included in the concept of the biological event.
  • the “pathological event” is a concept included in the “biological event”, and refers to a state in which the “biological event” quantitatively or qualitatively exceeds a certain threshold and can be determined to be a disease or pathological condition.
  • the “pathological event” as a result of the abnormal increase in the “biological event” of elevated blood pressure is hypertension or hypertension, and the blood glucose cannot be controlled within the normal range.
  • the “pathological event” is hyperglycemia or diabetes. Can be mentioned.
  • not only events related to a single biological event as in the above example but also pathological events related to multiple types of biological events. Biological reactions, symptoms, signs and symptoms, abnormal laboratory test results, and complications of the disease are also included in the concept of pathological events.
  • Biomolecules refer to nucleic acids, proteins, lipids, carbohydrates, general low molecular weight compounds, and other structures of organic molecules and their aggregates, including metal ions, water, and protons. May be.
  • Key molecule refers to a group of molecules, such as mediators, hormones, neurotransmitters, and otacoids, among biological molecules. Often, a specific target organism in the body It is known that there is a body molecule, and the direct binding to the molecule triggers the above-mentioned “biological event”. These molecules are produced in vivo and exert their effects. In general, when given from outside a biological system, they also express biological events corresponding to their amounts. Specific examples include adrenaline, angiotensin II, insulin, estrogen and others.
  • the target biomolecule even if the target biomolecule has not been recognized or its direct binding to the target biomolecule has not been confirmed, the quantitative or qualitative change of the biomolecule will increase the biological event. If it is known to cause an increase or decrease or a decrease or to cause a change in a molecular function network or subnet, the molecule may be treated as a “key molecule”.
  • Target biomolecule refers to a biomolecule such as a mediator, a hormone, a neurotransmitter, or an otacoid (many of which are key molecules), or a specific biomolecule serving as a reservoir for a drug molecule. In many cases, these biomolecules or drug molecules bind directly to the target biomolecule and express a particular bioevent. Even when direct binding is not confirmed, even when a biomolecule or a drug molecule is given a living body and a quantitative or qualitative change is observed, the biomolecule can be regarded as a target biomolecule. Good.
  • “Information on up or down of a biological event” refers to information such as an increase, increase, decrease, or decrease of a biological event in response to a quantitative or qualitative change in a key molecule or a target biological molecule. This includes the case where the biological event occurs only when the amount of the key molecule exceeds a certain threshold.
  • Molecular abbreviations are used to identify or specify molecules instead of molecular names, and each molecule must be uniquely assigned. Abbreviated abbreviations of molecule names or alphanumeric strings unrelated to molecule names may be used, but short character strings are desirable. If a molecule has a molecular abbreviation that is already used worldwide, it is desirable to use it. It is also possible to assign multiple molecule abbreviations assigned to one molecule in different ways, to layer them by structure group or function, or to use them as needed. . "Direct bonding" means that a stable complex is formed or can be formed by an intermolecular force that is not based on a covalent bond. In rare cases, a covalent bond may be formed, but the concept includes this case.
  • a transcription factor and a protein whose expression is induced or suppressed by the transcription factor may also be regarded as direct binding when a combination of both is determined.
  • the concept of “direct binding” is often called “interaction”, but interaction has a broader meaning.
  • Biomolecule pair refers to a pair of biomolecules that can or cannot be directly bound in a living body. Specific examples include estradiol and estrogen receptors, angiotensin converting enzyme and angiotensin I. In the case of an enzyme-product molecule pair in an enzymatic reaction, the complex is not very stable but should be included in the biomolecule pair. The relationship between a transcription factor and a protein whose expression is induced or suppressed by the transcription factor can also be included in the biomolecule pair. Further, a case where the mutual role of both is not clear, for example, two protein molecules which are determined to have an interaction in a two-hybrid experimental method may be included. Regarding physical and chemical stimuli such as light, sound, temperature change, magnetism, gravity, pressure, and vibration from outside the body, these stimuli are treated as virtual biomolecules, and biomolecules with the corresponding target biomolecules are treated. A pair may be defined.
  • Association '' indicates that there is a direct or indirect association between any two of the following data items: biomolecules, subnets, bio-events, pathological events, drug molecules, genes, and diseases Or record.
  • Association information means information recorded by “association”.
  • “Structural code” is a classification code indicating the structural characteristics of a biomolecule such as DNA, RNA, protein, peptide, general small molecule, and the like.
  • structural characteristics such as seven-transmembrane type, one-transmembrane type, and beta-barrel structure May be hierarchized and represented by T.
  • a “function code” is a classification code representing the function of a biomolecule at the molecular level.
  • a biomolecule that is a “structural code” a force S “protein”, a membrane receptor 'nuclear receptor ⁇ Transporter ⁇ Mediator ⁇ Hydrolase ⁇ Phosphorylase ⁇ Dephosphorylation enzyme etc.
  • substrate ⁇ product ⁇ precursor ⁇ active peptide ⁇ Indicates the classification of metabolites.
  • lower functional classifications such as serine threonine kinase, lip synthase, and MAP kinase may be hierarchically represented.
  • the “relation code” is a classification code indicating a relationship between two molecules forming a biomolecule pair. For example, it can be categorized into 10 for agonists and receptors, 21 for enzymes and substrates, and 22 for substrates and products. If the mutual role of the two molecules is not clear, for example, two protein molecules that have been determined to interact in the two-hybrid experiment, it is desirable to use a code that distinguishes that. Regarding the relationship between a transcription factor and a protein whose expression is induced or suppressed by the transcription factor, it is desirable to use a code that distinguishes the relationship.
  • ⁇ Related function code '' is a classification code that indicates the phenomena and changes associated with the direct binding of two molecules that form a biomolecule pair, such as hydrolysis, phosphorylation, dephosphorylation, activation, and inactivation. Is used.
  • the “reliability code” is a code for indicating the level of reliability of direct binding for each biomolecule pair and the experimental method used as the basis for direct binding.
  • Connect search refers to specifying one or more arbitrary biomolecules or bioevents and automatically searching for a connection of functionally or biosynthetically related molecules including them.
  • the connect search can be executed while filtering the biomolecule pair by combining one or two or more of the related code, the related function code, the reliability code, the direction of the working organ or the biomolecule pair, and other information. Also, To find the desired molecular function network by scoring the connection of the molecules found by using the related code or related function code or reliability code or the direction or other information of the working organ or biomolecule pair alone or in combination. Can also.
  • the connect search can be performed in the same manner as when a biomolecule or bioevent is specified by specifying an arbitrary item such as a subnet, a pathological event, a drug molecule, a gene, or information related to a disease.
  • Molecular function network refers to the results of a connect search using a biomolecule linkage database, specifying one or more items selected from any biomolecule or bioevent or subnet or pathological event or drug molecule or gene. Refers to the connection of functionally or biosynthetically related molecules.
  • pharmaceutical molecule refers to a molecule of a compound that is manufactured as a medicament and used for therapy, but also includes a compound that has a known biological activity, such as a compound used for medicine and pharmaceutical research or a compound described in a patent specification or literature. Shall be included.
  • “Related to information of a biological event” refers to showing or finding that the expression of a biological event is related to a biomolecule or drug molecule or genetic information or a molecular functional network.
  • Molecular annotation refers to information added to molecular data such as biomolecules and drug molecules in a database.
  • Patterning means that when recording information on biomolecules, biomolecule pairs, bioevents, etc. in a database, the information is not recorded as it is, but is classified into predetermined categories. This means that the information is represented by a symbol representing the category.
  • structure code means that “structure code”, “function code”, “relation code”, and “relation function code” are examples of “patterning”.
  • Production organ refers to an organ, tissue, a site in an organ or tissue, a specific cell in an organ or tissue, a site in a cell, etc., in which a biomolecule is produced.
  • Existing organ refers to an organ, tissue, organ or site in an organ, a specific cell in an organ or tissue, an intracellular site, etc., which are stored after biomolecules are generated.
  • “Working organ” refers to an organ, a tissue, a site in an organ or tissue, a specific cell in an organ or tissue, a site in a cell, etc., in which a biomolecule or a key molecule expresses a biological event.
  • a method shown in FIG. 1 is provided.
  • a biomolecule linkage database that stores information on two pairs of directly bound biomolecules. Information about the biomolecule itself, such as how to abbreviate the molecule of the biomolecule, may be included here, but it is preferable to use another database, the “biomolecule information database”.
  • a connect search is performed by specifying one or more arbitrary molecules from the "biomolecule linkage database” described above, and the "molecular function network” that is a representation of the functional or biosynthetic connection of one or more biomolecules. You get.
  • the molecules in the molecular function network can be directly or Indirect biological events can be estimated. Furthermore, by adding information on the relationship between the quantitative or qualitative fluctuation of key molecules and the up-or-down of biological events, the quantitative or qualitative fluctuation of any molecule on It is possible to estimate the power that acts on the progress and rise of the event, and whether it works on the suppression and decline.
  • biomolecule information database The main role of the “biomolecule information database” is to define the molecular abbreviation or ID for the formal name of each biomolecule, and it is also good to collectively store necessary information about the biomolecule itself. For example, it is desirable to store information on molecular names, molecular abbreviations, structure codes, function codes, species, producing organs, existing organs, and the like. In addition, even for biomolecules that have not been isolated or confirmed experimentally, for example, molecules whose presence is presumed from experiments with other species are defined by temporarily giving molecular abbreviations and other information. You may.
  • Biomolecule Information Database contains information on the amino acid sequence and structure of each biomolecule. However, it is preferable that the information be separately stored in a sequence database or a structure database, and extracted as needed based on the molecular abbreviation. For biomolecules of low molecular weight, not only the official molecular names but also the data necessary for the notation of the chemical structure are added so that the chemical structure can be added to the display of the molecular function network as necessary. It is desirable to store it in the biomolecule information database or a separate database.
  • a molecular abbreviation may be added and registered in the “Biomolecular Information Database”.
  • the constituent molecules are known, it is preferable to register each of them with a molecular abbreviation, and provide a field for describing the molecular abbreviation of the constituent molecule in the record of the virtual biomolecule. Even if it is not clear what kind of biomolecules are composed, it is possible to define a virtual biomolecule having a specific function as a group and use it to define a biomolecule pair.
  • a biomolecule has two or more domain structures, and it is determined that it is advantageous to treat each domain independently because they have different functions, etc., treat each domain as an independent molecule.
  • a domain abbreviation may be added to each domain together with the original biomolecule and registered in the biomolecule information database.
  • a field that describes the molecular abbreviation of the divided domain in the original biomolecule record it is possible to describe that one biomolecule has two or more different functions.
  • a specific sequence on a genomic sequence that is not a gene has a certain function or is recognized by a specific biomolecule, that portion of the sequence is treated as an independent biomolecule and a molecular abbreviation is added.
  • Biomolecule Linkage Database Information on biomolecule pairs is stored in the “Biomolecule Linkage Database”. For each biomolecule pair, the molecular abbreviation, relation code, relation function code, reliability code, bioevent, working organ, conjugate molecule, and other additional information of the paired biomolecules are recorded. Regarding the molecular pair of key molecule and its target biomolecule, It is desirable to input as much as possible information on the up-down of biological events corresponding to the quantitative or qualitative fluctuation of molecules, and information on pathological events. In the case of a biomolecule pair other than the key molecule, if there is a bioevent or a pathological event directly related to the expression of the biomolecule pair, it is desirable to input the bioevent / pathological event.
  • Information on the up-or-down of bio-events corresponding to quantitative or qualitative changes in key molecules includes, for example, simplification such as whether the bio-events increase or decrease with respect to an increase in key molecules compared to the normal range. It may be indicated by the information obtained. If an enzyme catalyzes the reaction of two or more substrates to produce different reaction products, add an expression to specify the relationship between the enzyme, the substrate, and the reaction product.
  • biomolecule information database and the “biomolecule linkage database” have different contents and configurations. Therefore, they are treated as conceptually independent databases in this specification. However, both are combined for the purpose of the present invention. Needless to say, two types of data may be included in each database. Further, there may be two or more “biomolecule information databases” and “biomolecule linkage databases”, and in this case, each database can be appropriately selected or used in combination. For example, data on different species, distinguished by specific fields, may be stored in the same “biomolecule information database” and “biomolecule linkage database”, or separate databases for human and mouse may be created. And save it. ,
  • the “relation code” may be entered as words, such as that the two molecules constituting the biomolecule pair are an agonist and a receptor, or an enzyme and a substrate, but the relationship between the agonist and the receptor Therefore, it is desirable to input the data by categorizing them into 10 for the relationship between the enzyme and the substrate, 21 for the relationship between the enzyme and the substrate, and 22 for the relationship between the enzyme and the product. Also, it is convenient to save the functions such as hydrolysis, phosphorylation, dephosphorylation, activation, and inactivation as "related function codes”. It is desirable.
  • the information on the relationship code and the related function code is used when conducting a connect search, for example, by considering only the enzyme reaction, ignoring the inactivation relationship, and ignoring the gene expression induction / suppression relationship.
  • the information on biomolecule pairs that directly bind also varies from those that are experimentally proved to those that are assumed to be biomolecule pairs for the time being. Also, depending on the experimental method, a false positive may be mistaken for a biomolecule pair. Therefore, it is desirable to add a “reliability code” indicating the level of reliability and the experimental method to the information of each biomolecule pair.
  • the reliability code is used not only for viewing as information, but also for the purpose of filtering when searching for a connect, for example, only for biomolecule pairs having a code indicating a certain level of reliability. Available. It can also be used for purposes such as performing a scoring based on the reliability code in the molecular function network, reflecting the results in the display of results, and narrowing the display range.
  • the biomolecule is generated in one organ and goes out of the cell. It is possible to easily express the phenomenon that a molecule that has acted on a target biomolecule on the membrane of another cell from outside the cell. It is desirable to input the information on the organs producing and existing biomolecules into the “Biomolecule Information Database” and the information on the working organs into the “Biomolecule Linkage Database”.
  • the production organ 'existing organ' The description of the organ for use need not be limited to the organ, but may include information such as a tissue, a site in the organ or tissue, a specific cell in the organ or tissue, or a site in the cell.
  • the information on the generated organs, existing organs, and working organs can be used as a filter when performing a connect search, for example, by searching only biomolecule pairs generated in the same organ.
  • connect search that generates “molecular function network” from “biomolecule linkage database” is shown below.
  • any method that can realize this concept may be used.
  • the algorithm of “depth-first search” described in Chapter 29 of “Algorithm. (Modern Science, 1996)” by Sedgewick can be used.
  • biomolecule linkage database is expressed as the following set of biomolecule pairs. .
  • a biomolecule pair (c, j) (j, p) (p, y) (y, k) (k, e) are searched one after another, and as a molecular function network, the connection of molecules c, j, p, y, k, and e is "c — j — p — y— k — e You get.
  • the molecular function network obtained by the connect search does not always follow a linear path as described above. For example, if a biomolecule pair (q, y) is added to the above biomolecule linkage database, and a connect search is performed with c and e as endpoints, The molecular function network shown in Fig. 2 is obtained.
  • the number of biomolecule pairs intervening between c and e is 5 for the shortest path (passing p-y) and 6 for the longest path (passing p-q-y).
  • path number Such a number of biomolecule pairs interposed between two molecules in a molecular function network is hereinafter referred to as a “path number”.
  • biomolecule pairs to be included in the molecular function network can be limited by the number of paths.
  • the biomolecule pair may be restricted to those constituting a path with the minimum number of paths (c-j-py-k-e in the example of FIG. 2), or the number of paths may be limited to a certain range (for example, 5-6).
  • the range of the molecular function network generated by the connect search can be adjusted as needed.
  • biomolecule e is a key molecule and has information on bioevent E
  • biomolecules c, j, p, y, and k are directly or indirectly related to the expression of bioevent E.
  • the expression of E increases, (c, j) (j, p) (p, y) (y, k)
  • the connect search can also be performed by specifying one biomolecule as a starting point.
  • the upper limit of the number of paths between the starting biomolecule and one or more biomolecules as the ending point may be specified as the search termination condition.
  • the molecular function network shown in FIG. can get.
  • Connect search can also be performed by specifying three or more biomolecules. For example, if three biomolecules a, b, and c are specified, a connect search is performed for each of the three pairs a and b, a and c, and b and c, a— d— e— f — b,
  • biomolecules a, b, and c have the information of bioevent E
  • biomolecules a, b, and c appearing in the molecular function network obtained by union as shown in Fig. 4 , D, e,. F, g can be presumed to be directly or indirectly related to the occurrence of biological event E.
  • biomolecule e that appears in the molecular function network required as a common part by the AND operation is likely to play an important role in the expression of the biological event E.
  • the connect search can be performed using the association information between data items such as information related to subnets, pathological events, drug molecules, genes, and diseases, in the same manner as in the case of using the above-described information on biomolecule pairs.
  • the above procedure may be performed by treating the two data items associated in the association information in the same manner as the two biomolecules in the biomolecule pair.
  • N biomolecules on the molecular function network from a certain biomolecule to a key molecule on the expression amount of a bioevent can be predicted by, for example, the following equation.
  • Si is a qualitative evaluation value of the state of the i-th biomolecule
  • Ri is a value representing the amount of the i-th biomolecule
  • Vi is an evaluation value of the environment where the i-th biomolecule exists
  • f Is a multivalent function with 3 XN input values.
  • the biological events related to one molecular function network are not limited to one type, It is expected that there are several molecular functional networks related to one kind of biological event, but it is possible to narrow down the relevant molecular functional networks from the side of biological events. For example, if one or more biomolecules are specified to generate a “molecular function network”, and if a “molecular function network” containing a remarkably large number of biomolecules is generated, information on bio-events is generated. In addition, it is possible to narrow down the scope of the “molecular function network”. Of course, it is also possible to generate a “molecular functional network”, provided that it contains some mediator molecule or a relationship between the molecule and the target biomolecule.
  • a limited range of ⁇ A molecular function network can be created.
  • the above-mentioned search is performed on the biomolecules or biomolecule pairs contained in the network to extract partitions, filters, and subsets.
  • a molecular function network or a desired range of molecular function networks can be generated.
  • the “molecule function network” can be used. Can be hierarchized. Even if there are some unexplained molecules and connections between molecules, it is also possible to collectively define them and define pairs with other molecules as one virtual biomolecule, and create a temporary molecular function network It is. When an excessively complex network is generated due to the large number of molecules contained, two or more biomolecules connected on the network are defined as one virtual biomolecule, and the network is defined as It can also be expressed simply.
  • a partial network composed of two or more pairs of biomolecules connected on the network in this manner is called a “subnet”.
  • any sub-network may be specified as the subnet, but it is preferable to use a cascade, pathway, circuit, etc. that are well known to researchers, such as the TCA circuit and the pentose phosphate circuit in the metabolic system. It is. Further, a certain subnet may be included in another subnet. For example, the metabolic system itself can be regarded as a higher-level subnet including a plurality of subnets.
  • each subnet it is convenient to store information on the biomolecule pairs that make up the subnet and the hierarchy of the subnet in a “biomolecule linkage database”.
  • an upper data hierarchy for representing a subnet is provided in the “biomolecule linkage database”, and information about the subnet is placed there. The information may be saved.
  • Hierarchy of biomolecule pairs by subnet is not limited to two layers, and a set of multiple subnets may be stored as a higher-level subnet.
  • Molecular function To facilitate cross-reference between individual molecule pair data and upper layer subnet data when creating a network, information indicating the relationship between individual molecule pair data and subnet data is stored in each. It is desirable to keep. It goes without saying that one biomolecule pair may be associated with multiple subnets.
  • the data of subnets in the hierarchical “Biomolecule Linkage Database” include not only information on lower-level biomolecule pairs but also information on the relationships between subnets.
  • the glycolysis system and the TCA circuit are subnets that operate continuously, and the relationship between these subnets can be stored as a pair relationship in a higher hierarchy.
  • biomolecules themselves can be hierarchized, and the feature of the present invention is that the information can be stored and used in a “biological information database”.
  • biomolecule information database For high-speed network search and convenient and diverse display, it is desirable to layer both biomolecule information and biomolecule information.
  • the following examples can be given as targets for stratification of biomolecules.
  • Some biomolecules exhibit a function in which a plurality of different molecules are specifically assembled, and in many cases, the expression state and type of the function are controlled by the difference in the aggregation state of the molecules.
  • the association with biological events and the function of cells are sometimes defined by a combination of a plurality of molecules expressed on the cell surface.
  • the state of aggregation of biomolecules is classified into layers.
  • a column for registering each molecule participating in the set may be provided in a lower hierarchy of molecules in the biomolecule information database.
  • Some biomolecules change their functions when modified by enzymatic reactions or the like. Examples of such modifications include phosphorylation, methylation, acetylation, ubiquitination and their reverse reactions.
  • Biomolecules having different modification states may be distinguished by giving different molecular abbreviations, but it is more convenient to provide a data hierarchy indicating modification information in the biomolecule information database.
  • a column indicating “modification state” is provided in the biomolecule information database, and a description such as “phosphorylation” is provided in the column, so that biomolecules in different modification states can be represented by the same molecular abbreviation. While handling, it is possible to distinguish the qualification state. When hierarchization by such a modification state is performed, the molecule may be distinguished and treated by a combination of the molecular abbreviation and the data in the “modification state” column.
  • the hierarchies described above can be extended beyond the state of modification of biomolecules.
  • the change in state is, for example, active or inactive. It is better to store it in the lower hierarchy of molecular data, distinguishing it as a type.
  • biomolecules may or may not bind to other biomolecules depending on the state of modification, active or inactive, etc.
  • the biomolecules may be distinguished and handled based on the hierarchized molecular data, and the biomolecule pairs may be recorded in the biomolecule linkage database for each of the states.
  • a biomolecule pair is first recorded in a biomolecule linkage database based only on a molecule abbreviation, and the two molecules bind and react as additional information to the biomolecule pair.
  • the state of each molecule serving as a condition may be recorded.
  • Bio-events Some pathological events are associated with specific biomolecule pairs. There are many things that cannot be done. For example, a relationship between a biological event / pathological event and the formation of a certain subnet is known, but a biomolecule pair directly connected to the event may not be known. In such a case, by utilizing the above-described layering of the biomolecule pair data, the biological event / pathological event is associated with the data of the subnet, which is the upper hierarchy of the biomolecule pair, so that the event and the biomolecule are associated Network relationships can be described.
  • the aggregation state of a specific molecule or the expression state of a specific molecule on the cell surface is related to the occurrence of a biological event or a pathological event
  • the above-described layering of the molecular aggregation state or the molecular expression state is performed.
  • biomolecule-paired subnet some biological and pathological events cannot be associated with any particular biomolecule-paired subnet.
  • pathological event of inflammation which is caused by a combination of various biological events such as release of inflammatory cytokines, infiltration of leukocytes into tissues, and enhancement of capillary permeability. Can be.
  • biological events and pathological events are hierarchized, events that are associated with biomolecule pairs and subnets are described in lower layers, and events associated with lower-level events are described in upper layers. It is good to describe the event that occurs. It goes without saying that this hierarchical structure may use a hierarchical structure of two or more layers.
  • Biological events Another example of the layering of pathological events is the grouping of biological events, pathological events, up and down of key molecules, biological reactions, symptoms, symptoms, clinical laboratory information, diseases and complications, etc. And / or may be divided into layers. For example, in the case of a certain disease, if there is an association between the above-mentioned group or hierarchy of biological events and pathological events, it is preferable to make an association between the events. According to this method, the relationship between a disease and a molecular function network can be easily described via information on the up or down of key molecules.
  • the biomolecule pairs and subnets to be associated may change depending on, for example, the normal state and the disease state or the difference in the disease state.
  • by associating each biomolecule pair or subnet from the event it is possible to search for two or more molecular functional networks involving the same bioevent / pathological event Becomes
  • molecule A biomolecule
  • molecule B protein
  • the method using non-hierarchical data is enormous. It is necessary to perform a connect search for a number of molecule pairs, and if the path between molecule A and molecule B is long, the search is practically impossible.
  • the connection between the subnet “glycolysis” and the subnet “a certain kinase cascade” is searched for in the upper hierarchy called the subnet, and the route in the upper hierarchy is found. If found, a connect search can be performed at the lower level of each subnet on the route as needed.
  • the direction of the relationship between subnets or a data item specific to the database of the present invention can be performed in the same manner as a connect search using non-hierarchical data. Can be narrowed as it is or according to a certain standard to narrow down the data to be searched.
  • a molecular function network related to any molecule can be generated, and biological events and pathological events directly or indirectly can be easily estimated.
  • the present invention screens a molecular function network having a high possibility of being related to a disease based on knowledge such as a biological event or a pathological event which is characteristically manifested in a disease and a change in the amount of a biomolecule. It can be used to estimate the dynamic mechanism.
  • a drug molecule expresses pharmacological activity by binding to a protein or other biopolymer in the body and controlling its function.
  • the effects of these molecules have been studied in more detail than the effects of biomolecules, and have helped elucidate the molecular mechanisms of the target disease. Therefore, it is necessary to add the relationship between pairs of drug molecules used for medical treatment and drug molecules used for pharmacological research and their target biomolecules that have been approved for production to the above biomolecules and the information between biomolecules. It was noted that the method of the present invention can enhance the usefulness of the method of the present invention.
  • Target biomolecules are mostly proteins or proteins modified with sugars, etc. It is.
  • the following is an example of a method in the case where a relationship between a pair of a drug molecule and a target biomolecule is added in the present invention.
  • a molecular abbreviation for the official name of a drug molecule, and create a “drug molecule information database” that records all information about the molecule itself. It stores the name of the drug molecule, molecular abbreviation, applicable disease, dose, target biomolecule, and other information.
  • information such as the chemical structure, amino acid sequence (in the case of peptides or proteins), and three-dimensional structure of the drug molecule may be included in the “drug molecule information database”. It is desirable to save in a database.
  • the structure may be distinguished by a structural code or the like, or a method of attaching a molecular abbreviation that can be distinguished by the first letter may be employed.
  • information such as noticeable side effects, interactions with other drugs, and metabolic enzymes, etc. is entered from the package insert of the drug or other documents, it can be linked to genetic polymorphisms based on the molecular function network. It is useful for the purpose of making proper selection of medicines.
  • a “drug molecular linkage database” which is a database containing information on pairs of drug molecules and target proteins and their relationships, will be created.
  • the method of the present invention can be extended as shown in FIG. 5 by creating a “pharmaceutical molecule information database” and a “pharmaceutical molecule linkage database” and taking in information of a drug molecule and a drug molecule pair.
  • the generation of a network and the estimation of a biological event can be performed in the same manner as in the case where only the above-described biomolecule linkage database and biomolecule information database are used.
  • Information on drug molecules can be obtained at the same time. It can also be used to extract a molecular function network involving a specified drug molecule from a molecular function network created using only the biomolecule linkage database and biomolecule information database.
  • elucidation of genetic information is rapidly progressing from various angles, including analysis of human genome sequences.
  • CDNA has been isolated in the genome-wide, and elucidation of the orf (open reading frame) and gene sequence has progressed, and the positioning of each gene on the genome has progressed. Therefore, as another embodiment of the present invention, a “biomolecule-one gene database” was created in which a molecular abbreviation of a protein among the biomolecules was associated with the name, abbreviation, ID, and other information of the gene encoding the protein. By doing so, the method of the present invention can be extended as follows.
  • genes and proteins that serve as disease markers it is possible to assign meanings to genes and proteins that serve as disease markers, and to provide information on the relationship between diseases and genetic polymorphisms, etc. Can be understood. It is desirable and necessary to include information such as the species, location on the genome, gene sequence, and function, as well as amino acid mutations and abbreviations of gene polymorphisms and their relationship to function. Depending on the situation, there may be more than one database.
  • the use of the concept of hierarchies makes it possible to create a more efficient and wide-ranging molecular function network.
  • a higher-level hierarchy representing the transcription of genes and the expression of proteins is set in the “Biomolecular Information Database” and The gene group ⁇
  • the data of the protein group may be stored.
  • the “biological molecular linkage database” includes the gene group and the upper layer data of the protein group and the event.
  • Numerical parameters of gene transcription and protein expression can be used in the method of the present invention by a method other than storing them in the above-mentioned “biomolecule information database” or by taking them from an external file database.
  • it is effective to prepare the ID of a gene or protein in the external data, a correspondence table of the ID of the genes in the ID or "biomolecule one gene database” biomolecules in "biomolecule information database” This allows external data to be easily incorporated into the method of the present invention.
  • knockout animals in which specific genes have been crushed or transgenic animals in which genes have been changed to weaker functions or genes have been overexpressed have become increasingly common. These are often lethal and will not be born or have no effect on physiological functions or behavior, but some It is said that it is very difficult to analyze the results of these animal experiments even if abnormalities are observed. In such an experiment, it is convenient to use the method of the present invention to predict the effect of the genetic manipulation and then analyze the function.
  • the method of the present invention When the method of the present invention is used for the study of two or more species as described above, it is preferable to prepare in advance the correspondence of genes or the correspondence of proteins between the species.
  • data for each species may be registered and used in the database of the method of the present invention.
  • information for distinguishing biological species should be recorded in the “biomolecule information database” or “biomolecule linkage database”.
  • biomolecule information database or “biomolecule linkage database”.
  • the biomolecule linkage database used in the method of the present invention does not necessarily need to be collectively managed and stored in the same place, but is managed and stored in different places by unifying molecular abbreviations. It is also possible to appropriately select the biomolecule linkage database and connect and use it by means such as communication. Not only the biomolecule database, but also the biomolecule information database, drug molecule information database, drug molecule information database, genetic information database, pathological condition database used in the method of the present invention can be treated in the same manner. Needless to say.
  • a biomolecule directly involved in the expression of a bioevent and a database containing information on the bioevent (bioevent-biomolecule data)
  • a database is also provided that can be used together with a molecular network database that does not necessarily include information on biological events.
  • a partial molecular network relating to an arbitrary molecule is extracted from a database of a molecular network that does not necessarily include information on a biological event, and based on the molecules constituting the network, Also provided is a method for searching the bio-event-bio-molecule database.
  • biomolecule information database '' “biomolecule linkage database” ⁇ "drug molecule information database” ⁇ “drug molecule linkage database” ⁇ "” biomolecule-gene database " Provides a method for performing a search based on keywords, numerical parameters, 'molecular structure', amino acid sequence, base sequence, etc. for each data item such as ⁇ Chain database '' and generating a molecular function network based on the search results Is done. Examples of molecular function network generation based on search are given below, but it goes without saying that the scope of this effort is not limited to these examples.
  • the database stores various information such as molecular names, molecular abbreviations, biological species, product organs, and existing organs as text.
  • various information such as molecular names, molecular abbreviations, biological species, product organs, and existing organs as text.
  • Corresponding data can be narrowed down. Based on this narrowed down information, it is possible to determine the start and end points of the connect search, and to narrow the range of the molecule pairs targeted by the connect search, enabling the creation of a molecular function network according to the purpose of use. Becomes
  • the chemical structure and tertiary structure of a drug molecule are stored in the “pharmaceutical molecule information database”, a search based on the matching of the entire structure, the matching of the partial structures, the structural similarity, etc., is performed.
  • the drug molecules can be narrowed down. Based on the narrowed-down drug molecule, it is possible to generate a molecular function network related to the drug molecule or to search for a biological event or a pathological event related to the drug molecule. It becomes possible.
  • Biomolecule Information Database '' ⁇ Biomolecule-Gene Database, '' or related databases; if gene base sequences are stored, sequence homology or partial
  • biomolecules can be narrowed down, and a molecular function network can be generated based on the biomolecules.
  • This method is effective for estimating a molecular function network in which a protein translated from the gene is likely to be related to a gene whose function is unknown or its partial sequence information, and further estimating the function of the protein. .
  • a “pathological condition database” in which pathological events, biomolecules, and other information related to a certain disease (hereinafter, referred to as “disease of interest”) are grouped and Z or hierarchically stored is used.
  • a search method is also provided.
  • an example of how to create and use the disease state chain database will be described, but it goes without saying that the scope of the present invention is not limited to the following specific grouping / hierarchical method.
  • the pathology database contains pathological events, biomolecules, Other information is grouped and / or layered and stored as in the following example. Further, in the case of a certain disease of interest, if an association is found between two or more data items belonging to any one of the groups, information on the association between the data items is stored.
  • the “key molecule” group in the pathology database stores information on biomolecules that vary quantitatively and / or qualitatively with disease. By using the information of the key molecule, it becomes possible to search the molecular function network from the pathological event or to search for the association between the molecule in the molecular function network and the pathological event.
  • the quantitative or qualitative variation of the key molecule can be expressed as in the example shown below.
  • a case where the molecular A fluctuates in an increasing direction in a certain disease is expressed as A (+). Examples of this include enhancement of enzyme activity and receptor activity.
  • a (-) the case where the molecule A fluctuates in a quantitative decreasing direction is expressed as A (-). In this case, it may include the case where the quantity is almost zero, and may include the loss of function of the molecule accompanying it.
  • this expression can show the phenomenon that the gene is not expressed due to the methylation abnormality of the CpG island in the promoter region of DNA, so that proteins that should be transcribed and translated and functioning are inactivated.
  • the “biological response” group in the pathogenesis database includes abnormalities or excesses (or under) that are considered to result directly or indirectly from disease. Information on biological reactions and phenomena in the body in various situations.
  • the data items described in the bioreaction group may be associated with bio-events, bio-molecule pairs, subnets, etc. on the molecular function network.
  • the biological reaction mainly refers to a phenomenon at a molecular level (including a protein, an enzyme activity, and a gene), a cell level, and an organ level, and may be described in a hierarchical manner.
  • biological reactions can be stratified according to the information and conditions of the place where it occurs.
  • the “symptoms / symptoms” group in the pathology database stores pathological events that characterize the disease of interest or that provide a basis for diagnosing the disease of interest. Pathological events corresponding to side effects of the drug molecule are also preferably described in this group. In addition, among the pathological events existing in this group, those that correspond to or relate to the mechanism of action or indication of a certain drug molecule are described as data of the drug molecule in the “drug molecule information database”. Good. This makes it possible to search molecular function networks for drug molecules for which the biomolecule that is the target of the action is unknown.
  • the group of “laboratory test values” in the pathological condition database stores the forces actually used in clinical practice and the test items that may be used.
  • information indicating that the molecule is a measurement target in a clinical test may be added as a molecular annotation of the biomolecule.
  • the relevant molecular function network can be searched, and when the biomolecules existing in the molecular function network are measured by the clinical test, the information is used based on this information. It can also be used for purposes such as highlighting the biomolecule.
  • the “Disease” complications group in the pathophysiology database describes information such as the origin and stage of the disease of interest, the names and classifications based on the affected area, and complications related to the disease of interest.
  • the data items of "disease 'complications" may be hierarchically stored based on, for example, the disease of interest, the stage, the affected site, and the like.
  • a connect search is performed from the drug molecule via the target biomolecule, thereby establishing a molecular functional network involving the drug molecule.
  • the use of the disease state chain database makes it possible to search for a molecular function network relating to the drug molecule as described below even if the target biomolecule is an unknown drug molecule.
  • a matching item is searched in a pathological condition database based on information such as indications, indications, and mechanism of action of the drug molecule.
  • a connect search is performed between the data items in the pathological condition database to obtain information on key molecules that can be connected to a molecular function network.
  • a connect search is conducted from the key molecule using a biomolecule linkage database, a molecular function network involving the drug molecule can be searched.
  • a pathological condition database is searched based on the side effect information of a certain drug molecule, and if a matching item exists in the group of symptoms, symptoms, diseases, and complications, a connect search is performed from that item in the same manner as above. By doing so, a molecular function network related to the side effect of the drug molecule can be searched.
  • the database and computer system provided by the present invention can also be used as an input / output device that allows a user to easily add, edit, and delete data.
  • the data edited by the user can be saved, and can be merged with the provided database as needed.
  • the merged data can be used for searching, browsing, etc.
  • users add, edit, or delete data based on biomolecules, biomolecule pairs, bio-events, pathological events, drug molecular information, genes, or other information that has been verified or predicted through experiments, etc.
  • a new molecular function network can be generated by a connect search, and new event information associated with the molecular function network can be obtained. This allows the estimation of new molecular mechanics in disease.
  • Data edited by the user may be recorded in a form that is added to or replaced by the data items of the database provided in advance, or may be independently managed as a file or database for editing, and may be stored in advance as necessary. It may be used together with the data in the provided database.
  • the whole or part of the biomolecules, biomolecule pairs, biological events, pathological events, drug molecule information, and other information stored in an external database other than the database of the present invention can also be imported into the database of the present invention. is there.
  • the information being viewed on the terminal includes a data item in the database of the present invention, a misaligned data item, or an item corresponding to any item on the generated molecular function network, .
  • a method of highlighting and displaying the item is provided. According to this method, the user can know that the item is already registered in the database without having to search the database. At this time, it is possible to display not only the item in highlight but also the data item of the related database and a part or all of the data of the molecular function network on the terminal. Further, a connect search can be performed based on the item, and a molecular function network related to the item can be generated and displayed.
  • a computer system comprising a program and a database for carrying out the method of the present invention; a computer-readable medium recording a program and a database for carrying out the method of the present invention
  • a computer-readable medium recording a database for use in the method of the present invention and a computer-readable medium recording information on a molecular function network generated by the method of the present invention.
  • the transcription factor NF ⁇ B functions as a heterodimer of RelA and p50.
  • a molecule can be treated as one molecule as follows.
  • "composite” Provide a column for “body information” and enter that the molecules that constitute NF ⁇ B are RelA and p50.
  • a complex formed in a ligand-dependent manner for example, a TNF receptor complex (TNFR1 [4] in Fig. 7) can be expressed as a single molecule to express the molecular functional network simply. It becomes possible.
  • a biomolecule TRAF2 is possible or handled or treated as a constituent molecules of a complex TNFR1 [4], as a single biomolecule induce expression downstream of NF K B There is.
  • TRAF2 associating TRAF2 as an independent biomolecule with TRAF2 as a constituent molecule of the complex TNFR1 [4]
  • TRAF2 associates TRAF2 as an independent biomolecule with TRAF2 as a constituent molecule of the complex TNFR1 [4]
  • This association can be made automatically by comparing the molecular abbreviation in the molecular information database with the molecular abbreviation in the complex information column.
  • NF ⁇ // I ⁇ is first phosphorylated by the IKK complex, then ubiquitinated by the SCF complex (recognizing and binding to the phosphorylation site), and finally the IicBa is degraded by the 26S proteasome Is done.
  • unmodified NF ⁇ / ⁇ phosphorylated NF ⁇ / I ⁇ , and further ubiquitinated NFB / IfcBa are converted to biomolecule information database It can be distinguished and handled by the data of the “qualification state” hierarchy.
  • each biomolecule such as ⁇ complex and NF ⁇ ⁇ / I ⁇ B c can be obtained without assigning a different molecular abbreviation to each modification state of NF / cBZl ⁇ B ⁇ .
  • Example 3-Information on the modification state of a biomolecule is only partially known and often cannot be clearly distinguished in the formation of biomolecule pairs or association with bioevents. For example, in the system shown in FIG. 10, the correspondence between the biomolecules p53 in which different sites are phosphorylated and the biomolecules forming the biomolecule pair is not clear. In such a case, the biomolecules in a plurality of modified states may be collectively handled.
  • Table 1 shows the contents of the pathological condition database described by the method of the present invention as a disease of interest with diabetes.
  • Figure 11 conceptually shows the relevance of each data item.
  • Each pair of data items connected by a line in the figure is recorded in the pathological condition database as association information.
  • Diabetes currently uses a classification method based on the etiology. It is being used to better diagnose and treat diabetes in light of recent advances in the study of the etiology of diabetes. Here, an example of analyzing the mechanism of diabetes classified by its origin is shown.
  • MODYl mimaturity onset diabetes of the youthl
  • search for M0DY1 items from the disease and complication group in the pathology database and use the Perform a connection search using, and extract related items.
  • HF-4 (m) corresponding to the causative gene of M0DY1 is found in the key molecule group, and the "HNF-4 ⁇ gene mutation" power is found in the biological response group.
  • a subnet to which the transcription factor HNF-4a is associated is searched to obtain a subnet “a transcription factor network involved in knee development and metabolism”.
  • Example 7 As described above, by using the method of the present invention, it is possible to obtain information on molecules involved in the etiology, mechanisms, or differences from other diseases, even from more finely classified disease names.
  • Example 7 As described above, by using the method of the present invention, it is possible to obtain information on molecules involved in the etiology, mechanisms, or differences from other diseases, even from more finely classified disease names.
  • diabetes is a disease caused by metabolic disorders
  • M0DY2 is a disease in which the causal relationship between the metabolic system and diabetes in the living body is directly clarified.
  • a search example is shown for the purpose of carbohydrate metabolism and diabetes, and its causes.
  • the disease state database is searched using M0DY2 as a query, and data items GlcK (m) and GlcK (-) of the key molecule related to M0DY2 are obtained.
  • GlcK (m) and GlcK (-) as queries a search is performed using the biomolecule-linkage database to extract the subnet “glycolysis system” that has data corresponding to these question items (first section). 4 figure).
  • Insulin is somehow involved in diabetes.
  • the action mechanism of a certain drug molecule is an example of how to know the system.
  • Table 2 shows the data in the drug molecular information database of acarpoose used as a diabetes drug, with the mechanism of action being sugar absorption delay.
  • Serious liver damage such as fulminant hepatitis may occur.
  • Liver dysfunction, jaundice, severe hepatic dysfunction accompanied by elevation of AST (GOT) ALT (GPT) and jaundice may occur.
  • the target biomolecule is ⁇ -darcosidase by searching the drug molecular information database. Furthermore, a search of the biomolecule linkage database using ⁇ _darcosidase as a query shows that this molecule exists in the subnet called “polysaccharide / oligosaccharide metabolism”. Further, when the molecular network in the subnet is displayed, ⁇ -dalcosidase Catalyzes the decomposition reactions of sucrose to glucose and maltose to glucose, etc., and shows that acarbose inhibits these reactions (Fig. 17).
  • Example 1 1
  • a typical feature of type 2 diabetes is insulin resistance.
  • An example of a method for investigating the details of the action mechanism of a drug molecule that is thought to improve insulin resistance on a molecular function network is shown (Fig. 18).
  • Insulin resistance When a search is performed in the pathological condition database using “insulin resistance” as a question, “insulin resistance” is first found in a group of diseases whose disease is “diabetes” as the target disease. Next, when a database of drug molecule information was searched using the term “insulin resistance” as a query under partial string matching conditions, “pioglitazone J” and “troglitazone”, which are thiazolidine-based drug molecules having a pharmacological action to improve insulin resistance, were searched. Dzong "(currently discontinued in Japan).
  • the mechanism of action of these insulin sensitizers is “increased sugar uptake” and the mechanism of action is “activation of the nuclear receptor transcription factor PPARy (peoxisome proliferator activated receptor 7)” It can be seen that it is.
  • PPARy peoxisome proliferator activated receptor 7
  • the biomolecule linkage database of the present invention which is a collection of information of biomolecule pairs including bioevents, generates a molecular function network, which is a necessary range of functional and biosynthetic connections between the molecules by search, and Is useful for estimating biological events directly or indirectly related to expression, By linking to reports, it is possible to obtain the knowledge necessary for new drug development and medical treatment based on individual differences.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Genetics & Genomics (AREA)
  • Theoretical Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physiology (AREA)
  • Biochemistry (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

明 細 書 分子機能ネットワークの生成方法 技術分野 .
本発明は、 生体イベントの情報を含む生体分子データベースの作成方法と利用 方法に関する。 背景技術
生体中には、 D NA、 R NA、 蛋白質、 多糖類などの生体高分子の他に、 アミ ノ酸、 核酸、 脂質、 糖質、 一般低分子化合物など多様な分子が存在して、 それぞ れの機能を担っている。 生体系の特徴は、 単に多様な生体分子から構成されてい るというだけでなく、 機能の発現をはじめとする生体内のすべての現象が生体分 子間の特異的な結合を通じて起きることにある。 この特異的な結合では、 共有結 合は形成されずに、 分子間力のみによって安定化された複合体が形成される。 従 つて、 生体分子はそれが単独で存在する状態と複合体状態の間で、 平衡状態で存 在することになる力 特定の生体分子間では複合体状態の安定化が大きいために、 この平衡が複合体側に著しく偏っている。 その結果、 多数の他分子の存在下で、 かなり希薄な濃度でも実質的に特定の相手を識別して結合することができる。 酵 素反応においては、 基質は酵素との複合体を形成した状態で所定の化学変換を受 けた後に反応生成物として放出されるし、 シグナル伝達においては、 メディエー ター分子の標的生体分子への結合に伴う標的生体分子の構造変化を通じて細胞外 のシグナルが細胞内に伝達される。
近年、 ゲノム研究の進展は目覚ましく、 ヒトをはじめとする多様な生物種につ いてゲノム配列が解明され、 遺伝子や遺伝子産物である蛋白質の配列、 臓器毎の 蛋白質の発現、 蛋白一蛋白相互作用等についてもゲノムワイドな体系的な研究が 進みつつある。 それらの研究成果の大部分はデータベースとして公開されて、 世 界中の利用に供されている。 遺伝子や蛋白質の機能、 疾患の原因又は背景となる 遺伝子の推定、 遺伝子多型との関わりについても少しずつ解明が進み、 遺伝情報 に基づく医療や新薬開発への期待が高まってきた。
一方、 遺伝情報の担い手は核酸であるが、 エネルギー代謝、 物質変換、 シグナ ル伝達など生命機能の殆どは、 核酸以外の分子が担っている。 蛋白質は遺伝子と いう設計図に基づいて直接生産される点で他のカテゴリーの分子と異なり、 その 種類も多い。 酵素も、 低分子性の生体内生理活性化合物の標的生体分子も、 蛋白 性の生体内生理活性化合物の標的生体分子も(糖で修飾されていることも多いが)、 すべて蛋白質である。 疾患の根本原因はともかくとして、 多くの疾患や症状が蛋 白質や低分子化合物の量やバランス、 場合によっては質 (機能) の異常の結果で あると考えられている。 既存医薬の殆どが、 蛋白質を標的としてその機能を制御 する化合物である。 蛋白質と違い、 核酸の立体構造が低分子医薬の標的として特 異性を発揮しにくいという理由もあるが、 抗生物質や抗菌剤、 或いは農薬の殺虫 剤や抗カビ剤に至るまで、 標的は蛋白質である。
従って、 遺伝情報に基づいた医療や新薬開発を行うには、 生体内のそれぞれの 蛋白質と低分子化合物の機能とそれらの分子間の特異的関係を明らかにする必要 がある。さらに、異なる酵素が次々に関与して必要な分子が生合成されることや、 異なる分子が次々に結合することでシグナルが伝達されることなどから、 これら の分子は機能上や生合成上で互いに直接又は間接のつながりをもっており、 その つながり (分子機能ネットワーク) の情報が重要である。 さらに、 これまでの研 究で、 メディエーターやホルモンなど多彩な臨床症状や生理現象や生体反応の発 現に直接関わっている分子が多数明らかにされており、 適切な治療には分子機能 ネットワークとの関係付けが不可欠である。 また、 創薬戦略において、 副作用リ スクを考慮しつつ適切な新薬開発の標的分子を設定するためには、 標的分子を含 む分子機能ネットワークの考慮が必要である。
蛋白質に関連したデータベースとしては、 SwissProt (the Swiss Institute of Bioinformatics (SIB) , Europaen Bioinformatics Institute (EBI) )、 PIR (National Biomedical Research foundation (NBRF) )があり、 いずれも配列情報 の他、 生物種、 機能、 機能メカニズム、 発見者、 文献その他のァノテーシヨンの 情報をもっている。
分子のつながりに注目した分子ネットワーク型データベースのうち、 代謝経路 に関するものと しては、 KEGG (金久ら、 京都大学)、 Biochemical Pathways (Boehringer Mannheim) , WIT (Russian Academy of Sciences) , Biofrontier (fe 羽化学)、 Protein Pathway (AxCell) , bioSCOUT ( LION) , EcoCyc (DoubleTwist) , UM-BBD (Minnesota Univ. ) がある。
KEGGの PATHWAYデータベースにはメタボリックパスウェイとシグナルトランス ダクションパスウェイがあり、 前者は物質代謝、 エネルギー代謝に関わる一般低 分子化合物の代簡す経路を、 後者はシグナル伝達系の蛋白質を扱っている。 いずれ も予め定義された分子ネ.ットワークを静的な Gif フアイルで提供している。 前者 では、酵素とリガンドの情報を別のテキスト形式の分子データベース LIGAND (金 久ら、 京都大学) 及ぴ ENZYME (IUPAC - IUBMB) から取り込むようになつている。 生理活性べプチドの生成に関わる酵素や標的生体分子は含まれない。
EcoCycは大腸菌の物質代謝をデータベース化したもので、個々の酵素反応に関 するデータと、 既知のパスウェイに関するデータ (該パスウェイに属する酵素反 応の集合として表される) に基づいて、 パスゥヱイの図式的な表示を行なってい る。 EcoCycの検索機能としては、分子名やパスウェイ名に対する文字列や略号に よる検索法が提供されているが、 任意の分子を指定して新たなパスウェイを検索 することはできない。
シグナル伝達に関するものとしては、 CSNDB (国立医薬品食品衛生研究所、 日 本)、 SPAD (久原ら、 九州大学)、 Gene Net (Institute of Cytology & Genetics Novosibirsk, Russia) , GeNet ( Maria G. Samsonova) 力 sある。 蛋白一蛋白相互 作用のデータベースとしては、 DIP (UCLA) , PathCalling (CuraGen) , ProNet (Myriad) がある。 遺伝子 '.蛋白発現のデータベースとしては、 BodyMap (東京大 学、 大阪大学)、 SWISS-2DPAGE (Swiss Institute of Bioinformatics) , Human and mouse 2D PAGE database (Danish Centre for Human Genome Research) , HEART- 2DPAGE (GermanHeart) 、 PDD Protein Disease Databases (NIMH— NCI), Washington University Inner Ear Protein Database (Washington Univ. ) , P腿- 2DPAGE (Purkyne Military Medical Academy) , Mito-Pick (CEA, France) , Molecular Anatomy Laboratory. (Indiana Lniversity) , Human し olon Carcinoma Protein Database (Ludwig Institute for Cancer Research) 力 sあ 。 生体反応 シミュレーション型の分子ネットワークとしては E - Cell (冨田ら、慶応大学), e E. coli (B. Palsson) , Cell (D. Lauffenburger, MIT) , Virtual Cell (L. Leow, Conneticut Univ. ) , Virtual Patient (Entelos, Inc. ) があ 。
生体分子と機能の関係については、広範な蛋白の情報を集めた SwissProtの他、 COPE (University of Munich) がサイトカインの機能情報をテキスト形式で公開 している。 ARIS ( (株) 日本電子計算) は、 医学 ·薬学分野を中心に約 4 0 0の 国内雑誌、 2 0の海外雑誌から医薬品の副作用、 相互作用、 農薬 ·化学物質によ る中毒に関わる文献情報を収録しているが、 生体分子の生理的作用や細胞レベル 以上での応答についてのデータベースはこれまでにない。 遺伝子と疾患について は、 遺伝病と蛋白質のアミノ酸変異の情報を集めた OMIM (NIH) がある。 いずれ もテキスト形式のデータが記述されていて、 キーワードで検索できる。
分子間のつながりに注目した既存データベースの問題点は以下の点にある。 分 子ネットワーク型データベースは含まれる分子と分子間のつながりが分かってい る系に対して作られており、 予め分子間の関係を考慮して配置することが可能な ために、 静的な G^ 等での表現で済んできた。 しかし、 この方式では、 新しい分 子や分子間のつながりの追加が困難である。 今後存在が明らかにされるであろう 分子も含めると 1 0万以上あり (KEGGで扱っている分子数は医薬分子を含めて約 1万)、 さらにそれらの分子間の関わりが今後の研究により解明されると、分子ネ ットワークの複雑さは加速度的に増すことが予想される。 新しい分子の追加に対 応でき、 膨大な分子と分子間の関係の情報を保持しながら、 必要な情報を含む部 分的分子ネットワークを生成できる新しい方法が必要である。 2001年 9月 7日現在、 KEGGでは分子間のつながりを 2分子の対の情報として保 存し、 この情報を用いてメタポリックパスウェイ中の任意の 2分子間をつなぐ経 路を探索することが可能になっている。 しかし、 このような経路探索問題には、 2分子間をつなぐ経路が長くなるにつれて計算時間が級数的に増加するという問 題がある。
一方、 テキスト形式のデータベースでは分子データの追加に限界はない。 しか し、 個々の分子のデータから機能上又は生合成上関連ある分子を次々に探索を繰 り返して、 多数の分子のつながりを示す分子ネットワークを生成するには困難が 伴う。 検索時に必要な分子についてのつながりが動的にかつ自動的に得られるよ うなデータの保持方法と検索方法を開発する必要がある。 また、 疾患や病態を分 子レベルで理解するためには、 生体分子やそのネットワークと生体の応答や生理 作用との関係を記述する新しい工夫が必要である。 発明の開示
本発明の課題は、 多様な生体応答や現象を生体分子の機能とその分子間の関わ りにおいて理解するための仕組みと方法を提供することにあり、 より具体的には 生体分子の情報を生体応答と結びつけることのできるデータベースとその検索法 を提供することにある。 さらには、 それらの膨大な情報から、 任意の生体応答又 は生体分子に関連するシグナル伝達経路や生合成経路のみを迅速に効率よく取り 出し、 有望な創薬ターゲットゃ副作用リスクを推定するための方法を提供するこ とも本発明の課題の 1つである。
本発明者らは、 上記の課題を解決すべく鋭意努力した結果、 直接結合する生体 分子の対をパーツとした情報を集積することで生体分子間のつながりを網羅し、 生体分子の中で生体応答の発現に直接関わるキイ分子については標的生体分子と の対の情報に生理作用、 生体応答、 臨床症状等からなる生体イベントの情報を加 えて保存し、 指定した 1以上の任意の生体分子又は生体イベントを含むつながり を自動的に次々と探索して分子機能ネットワークを作成することによって上記の 課題を解決できることを見出し、 それらの発明について特許出願した ( P C丁 Z J P 0 1 / 0 7 8 3 0号明細書)'。
すなわち、 直接結合する生体分子対に関する情報を蓄積した生体分子連鎖デー タベースを用いて分子機能ネットワークを生成する方法が P C T/ J P 0 1 / 0 7 8 3 0号明細書に記載されている。 この発明の好ましい態様によれば、 生体ィ ベントの情報をもつ生体分子連鎖データベースを用いて生体イベントの情報と関 係付けた分子機能ネットワークを生成する上記の方法;生体分子自身に関する情 報を含む生体分子情報データベースを用いる上記の方法;及び生体イベントの情 報と関係付けた医薬分子を含む分子機能ネットワークを生成する上記の方法が提 供されている。 また、 直接結合する生体分子対に関する生体イベントの情報を蓄 積した生体分子連鎖データベースを用いて任意の生体分子又は医薬分子が直接又 は間接に関わる生体ィベントを推定する方法が提供された。さらに、生体分子が、 外部のデータベース又は文献中の遺伝子でコードされる蛋白質である場合に、 該 生体分子の分子略号と該遺伝子の名称又は ID又は略称を対応付けるデータべ一 スを作成することにより、 遺伝子の多型や発現の情報を分子機能ネットワークを 用いて解析する方法が提供されている。
上記発明のさらに好ましい態様により、 ネットワーク上での連なりに基づいて グループ化した生体分子対データをサブネットとして、 帰属するサブネット及び サブネット間の包含関係に基づいて、 分子機能ネットワークを階層化することを 特徴とする上記の方法;生体分子対に関する情報を該分子対の帰属経路名 ·帰属 サブネット名等に基づいて階層化して保存することを特徴とする上記の方法;生 体分子自身に関する情報を遺伝子群からの発現パタ一ンゃ細胞表面への出現パタ ーン等に基づいて階層化して保存することを特徴とする上記の方法;生体ィベン トに関する情報を該イベントの上位概念による分類や病態ィベントとの関連に基 づいて階層化して保存することを特徴とする上記の方法が提供されている。 さら に、 生体分子対に関する上位階層、 生体分子自身に関する上位階層、 生体ィベン トに関する上位階層のそれぞれの保存項目に対して、 項目間の関連性や依存関係 等に関する情報を保存することを特徴とする上記の方法;生体分子情報データベ ース又は生体分子連鎖データベースに保存された階層化の情報を利用することに 'より、 分子機能ネットワークの生成を容易にすることを特徴とする上記の方法; 生体分子情報データベース又は生体分子連鎖データベースに保存された階層化の 情報を利用することにより分子機能ネットワークの表現での詳細さを制御するこ とを特徴とする上記の方法も上記発明により提供されている。
本発明者らはさらに鋭意研究を行った結果、 以下に示す方法及びデータベース を提供することに成功した。
1 . 生体分子連鎖データべ スを用いて、 関係コード、 関係機能コード、 信頼性 コード、 作用臓器、 生体分子対の方向性その他のデータ項目の 1又は 2以上の組 み合わせにより生体分子対にフィルターをかけてコネクト検索を行い生成した分 子機能ネットワーク又は分子機能ネットワークを生成する方法。
2 . 生体分子連鎖データベースを用いてコネクト検索により生成した分子機能ネ ットワークを、 関係コード、 関係機能コード、 信頼性コード、 作用臓器、 生体分 子対の方向性その他のデータ項目の 1又は 2以上の組み合わせによりスコア付け することにより、 該分子機能ネットワークを絞り込む方法。
3 . 端末で閲覧中の情報のなかに、 生体分子情報データベース、 生体分子連鎖デ ータベース、 医薬分子情報データベース、 医薬分子連鎖データベース及び病態連 鎖データベースのいずれかに含まれるデータ項目に該当する項目が存在した場合 に、 該項目を強調して表示する方法。
4 . 端末で閲覧中の情報のなかに、 コネクト検索により生成した分子機能ネット ワーク中のいずれかのデータ項目に該当する項目が存在した場合に、 該項目を強 調して表示する方法。
5 . 端末で閲覧中の情報のなかに、 生体分子情報データベース、 生体分子連鎖デ ータベース、 医薬分子情報データベース、 医薬分子連鎖データペース及び病態連 鎖データベースのいずれかに含まれるデータ項目に該当する項目が存在した場合 に、 該項目を含むデータベースの情報を表示する方法。 6 . 端末で閲覧中の情報のなかに、 コネクト検索により生成した分子機能ネット ワーク中のいずれかのデータ項目に該当する項目が存在した場合に、 該分子機能 ネットワーク上で該項目を強調表示する方法。
7 . 生成される分子機能ネットワークの範囲をパス数により制限することを特徴 とする、 分子機能ネットワークの生成方法。
8 . 2分子の間のコネクト検索を繰り返し、該検索の結果を併合することにより、 3以上の分子を結ぶ分子機能ネットワークを生成する方法。
9 . 生体分子の生成臓器及び/又は存在臓器の情報に基づいて、 生体分子にフィ ルターをかけてコネクト検索を行なうことを特徴とする、 分子機能ネットワーク の生成方法。
1 0 . 生体分子の発現量及び/又は遺伝子の転写量の情報に基づいて、 生体分子 にフィルターをかけてコネクト検索を行なうことを特徴とする、 分子機能ネット ワークの生成方法。
1 1 . 2以上の生物種の情報を併せて用いることを特徴とする、 分子機能ネット ワークの生成方法。
1 2 . 上記 1 1の方法を用いた、 ノックアウト動物又はトランスジヱニック動物 の実験データの解析方法。
1 3 . 上記 1 1の方法を用いた、 ノックアウト動物におけるノックアウト遺伝子 の影響、 又はトランスジエニック動物における導入遺伝子の影響の予測方法。 図面の簡単な説明
第 1図は、 本発明の方法の基本的な概念を表わす図である。
第 2図は、 異なるパス長を持つ経路を含むコネクト検索の結果の例を示した図 である。
第 3図は、 1つの端点を指定したコネクト検索の結果の例を示した図である。 第 4図は、 3以上の端点を指定したコネクト検索の結果の例を示した図である。 第 5図は、 本発明の方法で医薬分子連鎖データベースを用いる場合の概念を表 わす図である。
第 6図は、 本発明の方法で遺伝情報データベースを用いる場合の概念を表わす 図である。
第 7図は、 例 1の複合体情報の生体分子情報データベースへの登録方法と利用 方法を表わす図である。
第 8図は、 例 1の生体分子の複合体状態と単独状態の間を関連付けする方法を 表わす図である。
第 9図は、 例 2の生体分子データの階層化により修飾状態を表現する方法を表 わす図である。
第 1 0図は、 例 3の生体分子の異なる修飾状態を一つにまとめて扱う方法を表 わす図である。
第 1 1図は、 糖尿病を例にとった病態連鎖データベースのデータ項目の関連性 の概念を表す図である。
第 1 2図は、 例 5の検索方法により得られた分子機能ネットワーク中のサブネ ットと病態連鎖データベース中のキイ分子との関連性を示す図である。
第 1 3図は、 例 6の疾患名や病態イベントから分子機能ネットワークを利用し て疾患のメカニズムを調べる方法を示した図である。
第 1 4図は、 例 7における、 疾患名からキイ分子を介してサブネットを検索す る方法を表す図である。
第 1 5図は、 例 8の生体分子の生体における機能と役割を調べる方法を表す図 である。
第 1 6図は、 例 9の病態連鎖データベースを用いた検索結果を表す図である。 第 1 7図は、 例 1 0の医薬分子情報データベース中の標的生体分子情報に基づ いて医薬分子の作用メカニズムを調べる方法を示す図である。
第 1 8図は、 例 1 1の生体分子、 生体イベント、 サブネット等を介して医薬分 子の作用メカ-ズムの詳細を調べる方法を表す図である。 ' 発明を実施するための最良の形態
本発明の理解のために P C TZ J P 0 1 / 0 7 8 3 0号明細書の開示を参照す ることは有用である。 上記 P C T/ J P 0 1 / 0 7 8 3 0号明細書の開示の全て を参照として本明細書の開示に含める。
本明細書における用語の意味又は定義は以下の通りである。
「生体」 とは、 例えばオルガネラ、 細胞、 組織、 臓器、 生物個体、 又は集合体 などの生命体の全体又は一部を含む概念であり、 生物に寄生する生命体も含む概 念とする。
「生体イベント」 とは、 生体において内因的に又は外因的に現れるすべての現 象、応答、反応、症状を含む概念とする。具体的な例として、転写、細胞の遊走、 細胞の接着、 細胞分裂、 神経回路興奮、 血管収縮、 血圧上昇、 血糖低下、 発熱、 痙攣、異種生物及びウィルスなど寄生体による感染その他を挙げることができる。 また、 光や熱などの生体外部からの物理的な刺激とそれに対する生体の応答も生 体イベントの概念に含めることができる。
「病態イベント」 とは 「生体イベント」 に含められる概念であって、 「生体ィべ ント」が量的又は質的にある閾値を超え、疾患又は病態と判断できる状態をいう。 例として、血圧上昇の 「生体イベント」 が異常に t進した結果の 「病態イベント」 としては高血圧又は高血圧症、 血糖が正常範囲に制御できなくなった 「病態ィべ ント」 としては高血糖又は糖尿病を挙げることができる。 また、 上記の例のよう に単一の生体ィベントに関連するものだけではなく、 複数の種類の生体ィベント が関連している病態イベントもある。 また、 疾患において見られる生体反応、 症 状、 症候、 臨床検査結果の異常、 合併症なども病態イベントの概念に含まれる。
「生体分子」 とは、 生体中に存在する核酸、 蛋白質、 脂質、 糖質、 一般低分子化 合物その他のあらゆる構造の有機分子及びその集合体を指し、 金属イオン、 水、 プロトンを含んでいてもよい。
「キイ分子」 とは、 生体分子のうち、 主としてメディエーター、 ホルモン、 神 経伝達物質、 ォータコイド等の分子群を指す。 多くの場合、 体内に特定の標的生 体分子が存在して、 その分子への直接結合が上記の 「生体イベント」 の引き金と なることが知られている。 これらの分子は生体内で生成されて作用を発現してい るが、 一般には生体系の外部から与えた場合にもその量に対応した生体ィベント を発現する。 具体的例として、 アドレナリン、 アンジォテンシン II、 インシユリ ン、 エストロゲンその他を挙げることができる。
また標的生体分子が 認されていなかったり、 標的生体分子への直接結合が確 認されていなかったりする生体分子であっても、 該生体分子の量的又は質的な変 動が生体イベントの亢進 ·上昇又は低下 ·減少をもたらしたり、 分子機能ネット ワークやサブネットに変動を与えたりすることが分かっている場合には、 該分子 を 「キイ分子」 として扱ってもよい。
「標的生体分子」 とは、 メディエーター、 ホルモン、 神経伝達物質、 ォータコ イ ド等の生体分子 (これらの多くはキイ分子である) 又は医薬分子の受け皿とな る特定の生体分子をいう。 多くの場合、 これらの生体分子又は医薬分子は標的生 体分子に直接結合して特定の生体イベントを発現する。 また、 直接結合が確認さ れていない場合であっても、 ある生体分子又は医薬分子を生体に与えた際に量的 又は質的な変化が観測された生体分子を標的生体分子と見なしてもよい。
「生体イベントのアップオアダウンの情報」 とは、 キイ分子又は標的生体分子 の量的又は質的な変動に対応して生体ィベントが亢進 ·上昇又は低下 ·減少する 等の情報をいう。 キイ分子の量が一定の閾値を超えた場合にはじめてその生体ィ ベントが起きる場合も含む。
「分子略号」 とは、 分子名称の代わりに分子を識別又は指定する目的に付する もので、 各分子にユニークに対応している必要がある。 分子名を短縮した略号で も、 分子名と無関係な英数字列でもよいが、 短い文字列であることが望ましい。 既に世界的に使用されている分子略号がある分子の場合には、 それを用いるのが 望ましい。 1個の分子に対して異なる方式で付けられた複数の分子略号を与え、 構造グループや機能などにより階層化したり、 必要に応じて使い分けたりするこ とも可能である。 . 「直接結合」 とは、 共有結合によらない分子間力によって安定な複合体を形成 する、又は形成可能であることをいう。稀に共有結合が形成されることもあるが、 この場合を含めた概念である。 酵素反応における酵素と生成物の関係のように安 定な複合体を形成しない場合であっても、 2以上の分子が生体内で特異的な関係 を持つことが分かっているか予想される場合には、 該分子間の関係を直接結合と みなしてもよい。 転写因子と、 該転写因子により発現が誘導又は抑制される蛋白 質についても、両者の組合せが決まっている場合には直接結合とみなしてもよい。 「直接結合」 の概念は 「相互作用」 と呼ばれることも多いが、 相互作用の方が広 い意味を含んでいる。
「生体分子対」 とは、 生体中で直接結合できるか直接結合することが推定され る生体分子の対をいう。 具体的な例として、 エストラジオールとエストロゲン受 容体、 アンジォテンシン変換酵素とアンジォテンシン Iなどを挙げることができ る。 酵素反応における酵素と生成物の分子対の場合には、 その複合体はあまり安 定とは言えないが、 生体分子対に含めるものとする。 転写因子と、 該転写因子に より発現が誘導又は抑制される蛋白質との間の関係も、 生体分子対に含めること ができる。また、例えば two - hybrid実験法で相互作用があるとされた 2個の蛋白 分子のように両者の相互の役割が明確でない場合を含めてもよい。 光、 音、 温度 変化、 磁気、 重力、 圧力、 振動などの生体外部からの物理的化学的刺激について も、 これらの刺激を仮想的な生体分子として扱い、 対応する標的生体分子との生 体分子対を定義してもよい。
「関連付け」 とは、 生体分子、 サブネット、 生体イベント、 病態イベント、 医 薬分子、 遺伝子、 疾患に関するデータ項目の、 いずれか 2つのデータ項目の間に 直接的又は間接的に関連性があると示すこと又は記録することをいう。 「関連付 け情報」 とは 「関連付け」 することにより記録された情報のことをいう。
「構造コード」 とは、 生体分子が D NAか、 RNAか、 蛋白質か、 ペプチドか、 一般低分子か等の構造上の特徴を表す分類コードである。 蛋白質についてはさら に、 例えば、 7回膜貫通型、 1回膜貫通型、 ベータバレル構造等の構造上の特徴 を階層化し T表わしてもよい。
「機能コード」 とは、 生体分子の分子レベルでの機能を表わす分類コードであ り、 例えば、 「構造コード」 力 S 「蛋白質」 である生体分子の場合は、 膜受容体 '核 内受容体 · トランスポーター · メディエーター ·加水分解酵素 · リン酸化酵素 · 脱リン酸化酵素等の分類を表わし、 「構造コード」が低分子である生体分子の場合 は、基質 ·生成物 ·前駆体 ·活性べプチド ·代謝産物等の分類を表わす。 さらに、 蛋白質については、 例えばリン酸ィヒ酵素についてセリンスレオニンキナーゼ、 チ 口シンキナーゼ、 MA Pキナーゼ等の、 下位の機能上の分類を階層化して表わし てもよレヽ。 ,
「関係コード」 とは、 生体分子対をなす 2分子間の関係を表わす分類コードで ある。 例えば、 ァゴニストと受容体であれば 1 0, 酵素と基質であれば 2 1, 基 質と生成物であれば 2 2というように類型化することができる。 例えば two-hybrid実験法で相互作用があるとされた 2個の蛋白分子のように 2分子の 相互の役割が明確でない場合は、 その旨を区別したコードを用いることが望まし い。 転写因子と、 該転写因子により発現が誘導又は抑制される蛋白質との間の関 係についても、 その旨を区別したコードを用いることが望ましい。
「関係機能コード」 とは、 生体分子対をなす 2分子の直接結合に伴う現象や変 化を表わす分類コードであり、例えば加水分解、 リン酸化、脱リン酸化、活性化、 不活化等の分類を用いる。
「信頼性コード」 とは、 生体分子対毎に直接結合の信頼性のレベルや直接結合 の根拠となつた実験法などを示すためのコードである。
「コネクト検索」とは、 1以上の任意の生体分子又は生体イベントを指定して、 それらを含む機能上又は生合成上関連した分子のつながりを自動的に探すことを いう。
コネクト検索において、 関係コード又は関係機能コード又は信頼性コード又は 作用臓器又は生体分子対の方向性その他の情報を 1または 2以上組み合わせるこ とによって生体分子対にフィルターをかけながら実行することもできる。 また、 関係コード又は関係機能コード又は信頼性コード又は作用臓器又は生体分子対の 方向性その他の情報を単独または複数組み合わせることによって探し出した分子 のつながりにスコア付けを行って、 望みの分子機能ネットワークを探し出すこと もできる。
コネクト検索は、 サブネット、 病態イベント、 医薬分子、 遺伝子、 疾患に関係 する情報などの任意の項目を指定して、 生体分子又は生体イベントを指定した場 合と同様に行うことができる。
「分子機能ネットワーク」 とは、 生体分子連鎖データベースを用い、 任意の生 体分子又は生体ィベント又はサブネット又は病態ィベント又は医薬分子又は遺伝 子から選ばれる 1以上の項目を指定してコネクト検索した結果得られる、 機能上 又は生合成上関連した分子のつながりをいう。
「医薬分子」 とは、 医薬として 造され治療に用いられる化合物の分子を指す が、 医学 ·薬学研究用に用いられる化合物や特許明細書や文献に記載の化合物な ど生理活性が既知の化合物も含むものとする。
「生体イベントの情報と関係付ける」 とは、 ある生体イベントの発現に、 ある 生体分子又は医薬分子又は遺伝子情報又は分子機能ネットワークが関わっている ことを示すか又は見つけることをいう。
「分子ァノテーシヨン」 とは、 データベース中の生体分子、 医薬分子等の分子 のデータに対して付加される情報のことである。
「パターン化」 とは、 生体分子、 生体分子対、 生体イベント等に関する情報を データベースに記録する際に、 与えられた情報をそのまま記録するのではなく、 予め決められたカテゴリーに該情報を分類し、 該当するカテゴリーを表わす記号 により該情報を表現することをいう。 上記の 「構造コード」、 「機能コード」、 「関 係コード」、 「関係機能コード」について挙げられた例が、 「パターン化」の例であ る。
「生成臓器」 とは、生体分子が生成される臓器、組織、臓器又は組織内の部位、 臓器又は組織内の特定の細胞、 細胞内の部位などをいう。 「存在臓器」 とは、 生体分子が生成された後に蓄えられる臓器、 組織、 臓器又 は組織内の部位、 臓器又は組織內の特定の細胞、 細胞内の部位などをいう。
「作用臓器」 とは、 生体分子又はキイ分子が生体イベントを発現する臓器、 組 織、 臓器又は組織内の部位、 臓器又は組織内の特定の細胞、 細胞内の部位などを いう。
本発明の実施の一つの態様として第 1図に示す方法が提供される。 まず、 直接 結合する 2個の生体分子の対に関する情報を蓄積した 「生体分子連鎖データべ一 ス」 を作成する。 生体分子の分子略号の付け方など、 生体分子自身に関する情報 をここに含めてもよいが、 別データベースである 「生体分子情報データベース」 で行うのが望ましい。 次に、 上記の 「生体分子連鎖データベース」 から、 1以上 の任意の分子を指定してコネクト検索を行ない、 1以上の生体分子の機能上又は 生合成上のつながりの表現である 「分子機能ネットワーク」 を得る。
生体分子対のうち、 少なくともキイ分子とその標的生体分子からなる生体分子 対に対して生体イベントの情報を関連付けておくことにより、 「分子機能ネット ワーク」 とともに、 分子機能ネットワーク中の分子が直接又は間接に関わる生体 イベントを推定することができる。 さらに、 キイ分子の量的又は質的な変動と生 体イベントのアップオアダウンの関係の情報を付加しておくことにより、 分子機 能ネットワーク上の任意の分子の量的又は質的変動が生体イベントの宂進 ·上昇 に働く力、 抑制 ·低下に働くか等を推定できる。
「生体分子情報データベース」 の主たる役割は、 各生体分子の正式名称に対し て分子略号又は I Dを定義することであり、 その他にも生体分子自身についての 必要な情報をまとめて保存するとよい。 例えば、 分子名称、 分子略号、 構造コー ド、 機能コード、 生物種、 生成臓器、 存在臓器等に関する情報を保存するのが望 ましい。 また、 実験的に単離や存在の確認がされていない生体分子であっても、 例えば他の生物種での実験から存在が推定される分子に仮に分子略号その他の情 報を与えて定義してもよい。
「生体分子情報データベース」 には、 各生体分子のアミノ酸配列や構造に関す る情報を含めてもよいが、 該情報を配列データベースや構造データベースに別途 保存し、 分子略号に基づいて必要に応じて取り出すのが望ましい。 ·生体分子のう ち低分子量のものについては、 必要に応じて分子機能ネットワークの表示に化学 構造を加えることができるように、 正式な分子名称だけでなく、 化学構造の表記 に必要なデータを生体分子情報データベース又は別途のデータベースに保存して おくことが望ましい。
2以上の生体分子が多量体又は集合体として活性を示す、或いは機能するなど、 複数の生体分子をまとめて扱う方が便利な場合には、 それらを 1個の仮想的生体 分子として定義し、 分子略号を付して 「生体分子情報データベース」 に登録して もよい。 その場合、 その構成分子が既知の場合には、 それぞれに分子略号を付し て登録しておき、 仮想的生体分子のレコードに構成分子の分子略号を記述するフ ィールドを設けるとよい。 どのような生体分子で構成されているか不明な場合で も、 集団として特定の機能をもつ仮想的生体分子を定義して、 生体分子対の定義 に用いることが可能である。
また、 生体分子が 2以上のドメイン構造からなり、 かつそれらが互いに異なる 機能を持つなどの理由で各ドメインを独立に扱う方が有利と判断された場合には、 各ドメインを独立の分子として扱ってもよい。 例えば、 元の生体分子と共に、 各 ドメィンに分子略号を付して生体分子情報データベースに登録するとよい。 元の 生体分子のレコードに、 分割したドメィンの分子略号を記述するフィール を設 けることで、 1個の生体分子が 2以上の異なる機能をもつことが記述できる。 遺 伝子ではないゲノム配列上の特定の配列が、 ある機能を持つ場合や特定の生体分 子によって認識される場合には、 その配列の部分を独立の生体分子として扱い、 分子略号を付して生体分子対の定義に用いることができる。
生体分子対についての情報は 「生体分子連鎖データベース」 に保存する。 生体 分子対毎に、対をなす 2つの生体分子の分子略号、関係コード、関係機能コード、 信頼性コード、 生体イベント、 作用臓器、 共役分子、 その他の付加情報等を収録 しておく。 キイ分子とその標的生体分子の分子対については、 生体イベント、 両 分子の量的又は質的な変動に対応した生体ィベントのアツプオアダウンの情報、 病態ィベント等の情報をできる限り入力しておくことが望ましい。 キイ分子以外 の生体分子対についても、 該生体分子対が発現に直接関わる生体ィベント又は病 態イベントがある場合には、 その生体ィベントゃ病態イベントを入力しておくの が望ましい。 キイ分子の量的又は質的変動に対応した生体イベントのアップオア ダウンの情報としては、 例えば、 キイ分子の増加に対して生体イベントが正常な 範囲に比べて亢進するか低下するか等の単純化した情報で示してもよい。 1個の 酵素が 2種以上の基質の反応を触媒してそれぞれ異なる反応生成物を生成する場 合には、 酵素と基質と反応生成物の関係を特定するための表現を付け加える。
「生体分子情報データベース」 と 「生体分子連鎖データベース」 は、 その内容 や構成が異なるため、 本明細書では概念上独立のデータベースとして扱っている が、 本発明の趣旨からも、 双方を合わせた 1個のデータベースに 2種類のデータ を含めても良いのは言うまでもない。 また、 「生体分子情報データベース」 と 「生 体分子連鎖データベース」 はそれぞれ 2以上存在していてもよく、 この場合、 各 データベースを適宜選択又は組み合わせて用いることができる。 例えば、 特定の フィールドで区別した、 異なる生物種についてのデータを同じ 「生体分子情報デ ータベース」 と 「生体分子連鎖データベース」 に保存してもいいし、 ヒ トとマウ スについて別々のデータベースを作成して保存してもかまわない。 ,
「関係コード」 としては、 該生体分子対を構成する 2分子がァゴニス トと受容 体である、 酵素と基質である、 というように単語で入力してもよいが、 ァゴニス トと受容体の関係なら 1 0, 酵素と基質の関係なら 2 1、 酵素と生成物の関係な ら 2 2, といった具合に類型化して入力するのが望ましい。また、 「関係機能コー ド」 として、 加水分解、 リン酸化、 脱リン酸化、 活性化、 不活化等の機能の別を 保存しておくと便利であるが、 これも類型化して入力しておくのが望ましい。 関 係コードと関係機能コードの情報は、 コネクト検索を行なう際に、 例えば酵素反 応のみを考慮する、 不活化の関係を無視する、 遺伝子発現の誘導 ·抑制の関係を 無視する、 などのフィルターとして利用することができる。 酵素と基質のように互いの関係が明確になっている場合だけでなく、 例えば two-hybrid実験法で蛋白一蛋白相互作用があるとされた 2個の蛋白分子のよう に、 両者の相互の役割が明確でない場合がある。 このような生体分子対を含めて コネクト検索を行うためには、 生体分子対をなす 2分子の関係に方向性があるか ないかを区別して扱うと便利である。 各生体分子対に対して、 どちらのケースに 属するかを区別できるような関係コードを用いるのが望ましい。 前者の場合は、 作用方向確定として分子対の表現における 2分子の入力順序のみが検索時に考慮 されるのに対して、 後者の場合は、 検索時に作用方向不明として逆方向の関係も 考慮される。 このように生体分子対に方向性を持たせることによって、 コネクト 検索を行う際に、 例えば分子機能ネットワークの上流側のみ又は下流側のみとい つた検索の向きを指定することも可能になる。
直接結合する生体分子対の情報も、 実験的に確実に証明されているものから、 とりあえず生体分子対であると仮定されているものまで様々ある。 また、 実験法 によっては false positiveのために間違つて生体分子対であるとされる場合も含 まれる。 そこで、 各生体分子対の情報に信頼性のレベルや実験法を示す 「信頼性 コード」 を付加しておくのが望ましい。 信頼性コードは、 単なる情報として閲覧 するだけでなく、 コネクト検索の際に、 例えばある一定以上の信頼性を表わすコ 一ドを持つ生体分子対のみを対象とする等のフィルターをかける目的にも利用で きる。 また、 分子機能ネットワークに信頼性コードに基づいたスコア付けを行つ て、 結果の表示に反映させたり、 表示する範囲の絞込みを行うなどの目的にも利 用できる。
生体分子が生成される臓器とは別に、 それが蓄積され存在する臓器及び作用す る臓器の情報を保持しておくと、 分子機能ネットワークの生成時に、 例えばある 臓器で生成されて細胞外に出た分子が他の細胞の膜上にある標的生体分子に細胞 外から作用する、 といった現象を容易に表現できる。 生体分子の生成臓器と存在 臓器の情報は 「生体分子情報データベース」 に、 作用臓器の情報は 「生体分子連 鎖データベース」 に入力しておくのが望ましい。 ここで生成臓器'存在臓器'作 用臓器の記述は臓器に限定される必要はなく、 組織、 臓器又は組織内の部位、 臓 器又は組織内の特定の細胞、 細胞内の部位などの情報を含んでいてもよい。 生成 臓器 ·存在臓器 ·作用臓器の情報は、 コネクト検索を行う際に例えば同じ臓器内 で生成する生体分子対のみを検索の対象とする等のフィルターとして利用するこ とができる。
直接結合することを実証した実験や推定の方法、 生体イベントの種類、 キイ分 子の量的変動に対応した生体イベントのアップオアダウン、 細胞内部位や組織、 臓器、 臓器内部位の表現は単純化してあれば何でもよいが、 類型化して短い英数 字記号等に変換しておくのが望ましい。 同義語辞書で定義しておけば、 同時に同 義語の処理もでき、 入力時のミスが最小化できるからである。
以下に 「生体分子連鎖データベース」 から 「分子機能ネットワーク」 を生成する 「コネクト検索」 の概念を示す。 本発明の 「コネクト検索」 には、 この概念を実 現できるものであれば、 いかなる方法を用いてもよい。 例えば、 Sedgewickによ る 「アルゴリズム。 (近代科学社、 1996)」 第 29章に記述されている 「深さ優先 探索」 のアルゴリズムなどが利用できる。
分子略号 a〜z で表される生体分子からなる各生体分子対を(n,m) のように表 現するとすると、 生体分子連鎖データベースは次のような生体分子対の集合とし て表される。
(a, c) (a, g) (b, f) (b, k) (c, j) (c, r) (d, v) (d, y) (e, k) (e, s) (g, u) (j, p) (k, t) (k, y) (p, q) (p, y) (x, z)
コネクト検索で、 例えば cと eを含む分子機能ネットワークを生成するよう指 定したとすると、 対のうちの一方の分子を共通にもつ生体分子対 (c, j) (j, p) (p, y) (y, k) (k, e) を次々に探し、 分子機能ネットワークとして、 分子 c, j, p, y, k, e のつながりである 「c — j — p — y— k — e」 を得る。
コネクト検索で得られる分子機能ネットワークは、 上記のように直線状の経路 になるとは限らない。 例えば、 上記の生体分子連鎖データベースにさらに生体分 子対 (q, y) が加えられた場合に cと eを端点としてコネクト検索を行なうと、 第 2図に示す分子機能ネットワークが得られる。 ここで、 c と e の間に介在する 生体分子対の数は最短経路 (p - yを通るもの) で 5、 最長経路 (p - q - yを通 るもの) で 6である。 分子機能ネットワーク中で 2分子の間に介在する生体分子 対のこのような数を、 以下 「パス数」 とよぶ。
コネクト検索の際に、 分子機能ネットワークに含める生体分子対をパス数によ つて制限することもできる。 例えば、 生体分子対を最小パス数の経路 (第 2図の 例では c - j - p - y - k - e) を構成するものに制限してもよいし、 パス数を 一定の範囲 (例えば 5〜6 ) になるように制限してもよい。 このようなパス数の 制限を行なうことにより、 コネクト検索により生成される分子機能ネットワーク の範囲を必要に応じて調整できるようになる。
得られた 「分子機能ネッ トワーク」 に基づいて、 生体イベントの推定を以下の ようにして行う事ができる。 生体分子 eがキイ分子であって生体ィベント Eの情 報をもつ場合、 生体分子 c, j, p, y, kは生体イベント Eの発現に直接又は間接 に関係すると推定できる。 さらに、 例えば分子 eが減少すると Eの発現が亢進す るといった生体イベントのアップオアダウンの情報がある場合には、 (c, j) (j, p) (p, y) (y, k) (k, e)のそれぞれの関係を考慮して、 c, j, p, y, kのうちの 任意の分子の量的又は質的変動に対する生体ィベント Eの発現への影響を推定す ることがでぎる。
コネクト検索は、 1つの生体分子を起点として指定して行なうこともできる。 この場合、 検索の終了条件として、 起点の生体分子と終点となる 1以上の生体分 子との間のパス数の上限を指定するとよい。 例えば、 上記の生体分子連鎖データ ベースを用いて、 起点の生体分子として aを、 パス数の上限として 3をそれぞれ 指定してコネクト検索を行なった場合には、 第 3図に示す分子機能ネットワーク が得られる。
コネクト検索は、 生体分子を 3以上の複数個指定して行うこともできる。 例え ば a, b , cの 3つの生体分子が指定された場合に、 aと b, aと c, bと cの 3組についてそれぞれコネクト検索を行い、 a— d— e— f — b ,
a― d― e― g― c ,
b— f — e— g— c
の 3組の分子機能ネットワークを得たとする。 これらの共通な部分(A N D演算) や和集合 (O R演算) を求めたり、 2組以上に共通する部分を求めたりすること によって、 a, b , cの 3つの生体分子を含む分子機能ネットワークを得ること ができる。
a , b , cの 3つの生体分子が全て生体イベント Eの情報を持つ場合、 第 4図 に示すように O R演算により和集合によって求められる分子機能ネットワークに 出現する生体分子群 a, b, c, d , e, . f, gは、 生体イベント Eの発現に直 接又は間接に関係すると推定できる。 さらに、 A N D演算により共通な部分とし て求められる分子機能ネットワークに出現する生体分子 eは、 生体イベント Eの 発現に対して重要な役割を果たしている可能性が高いものと推定できる。
コネクト検索は、 サブネット、 病態イベント、 医薬分子、 遺伝子、 疾患に関係 する情報などのデータ項目間の関連付け情報を用いて、 上記に示した生体分子対 の情報を用いる場合と同様に行うことができる。 この場合、 関連付け情報中で関 連付けされた 2つのデータ項目を、 生体分子対中の 2つの生体分子と同様に扱つ て上記の手順を行えばよい。 これにより、 生体分子と生体イベントのみならず、 サブネット、 病態イベント、 医薬分子、 遺伝子、 疾患に関係する情報などを指定 して分子機能ネットワークを生成することが可能になる。
さらに、 ある生体分子からキイ分子までの分子機能ネットワーク上にある N個 の生体分子が、 生体イベントの発現量 に与える影響を、 例えば次のような式で 予測することもできる。 ここで、 Siは i番目の生体分子の状態の質的な評価値、 Riは i番目の生体分子の量を表わす値、 Viは i番目の生体分子が存在する環境の 評価値を表わし、 f は 3 X N個の入力値をもつ多価関数である。
QE = f ( S1? R Yv . . . SN, RN, VN )
1個の分子機能ネットワークが関係する生体イベントは 1種類に限らないし、 また、 1種類の生体ィベントに関わる分子機能ネットワークが数個あることが予 想されるが、 生体イベントの側から関連のある分子機能ネットワークを絞り込む ことは可能である。 例えば、 1以上の生体分子を指定して 「分子機能ネットヮー ク」 を生成した場合に、 著しく多数の生体分子が含まれる 「分子機能ネットヮー ク」 が生成された場合には、 生体イベントの情報を加えて 「分子機能ネットヮー ク」 の範囲を絞り込むことが可能である。 当然のことながら、 何らかのメデイエ 一ター分子、又は該分子と標的生体分子の関係を含むことを条件として、 「分子機 能ネットワーク」 を生成させることも可能である。 ― また、 「生体分子連鎖データベース」 のデータを適宜分割し、又はフィルターを かけ、 又は部分集合を抽出し、 又は階層化することによって、 必要な範囲の分子 機能ネットワークを生成することができる。 分割やフィルターや部分集合の抽出 は、 本発明のデータベース特有のデータ項目に対する検索、 キーワードを用いた 一般的な文字列検索、 アミノ酸配列又は核酸配列に対する相同性検索、 化学構造 式に対する部分構造検索、 生体分子対の方向性を指定した検索、 本発明のデータ ベース特有のデータ項目を一定の基準に沿ってスコア付けに利用した検索等の検 索方法により行なうことができる。 これらの検索を予め 「生体分子連鎖データべ ース」 又は 「生体分子情報データベース」 に対して行なうことにより、 限定をか けた分子機能ネットワークや特徴づけした分子機能ネットワークを生成すること ができる。
例えば、 生成臓器や作用臓器の情報を用いて、 肝臓で生成する生体分子とか皮 膚で起こる生体ィベントといつた観点から絞り込んだ部分データベースを作成し てコネクト検索することで、 限定した範囲の 「分子機能ネットワーク」 を生成す ることができる。 また、 コネクト検索で生成させた分子機能ネットワークに対し て、 そこに含まれる生体分子又は生体分子対について上記の検索を行なって分割 やフィルターや部分集合の抽出をすることによって、 所望の特徴をもつ分子機能 ネットワークや所望の範囲の分子機能ネットワークを生成することができる。 さ らに、 コネクト検索を行う際に例えば生体分子対の方向性を指定してネットヮー クの向きを絞った検索を行ったり、 コネクト検索した結果の分子機能ネットヮー クを信頼性コードに基づくスコア付けを行って絞り込むこともできる。 こうした 限定や特徴づけは検索を容易にするだけでなく、 特定の生体分子群や生体分子対 を分子機能ネットワーク上で強調して表示して、 分子機能ネットワークの理解を 助ける目的にも有効である。
「生体分子連鎖データべ ス」 の分割やフィルターや部分集合の抽出を、 ネッ トワーク上の連なりに基づいて適切に行ない、 その包含関係を示す情報を保存し て利用することにより、 「分子機能ネットワーク」の階層化が可能になる。未解明 の分子や分子間のつながりが一部にあっても、 それらをまとめて 1個の仮想的な 生体分子として他分子との対を定義し、 仮の分子機能ネットワークを生成するこ とも可能である。 含まれる分子数が多いために過度に複雑なネットワークが生成 される場合には、 ネットワーク上で連結している 2以上の生体分子群を仮想的な 1個の生体分子と定義して、 ネットワークをシンプルに表現することも可能であ る。
このような階層化を利用することにより、 コネクト検索の高速化を可能にし、 ネットワーク表示の詳細さを調節可能にして、過度な複雑さを適切に回避できる。 本明細書中では、 このようにネットワーク上で連結している 2以上の生体分子対 からなる部分的なネットワークを 「サブネット」 とよぶ。
サブネットとしてはいかなる部分ネットワークを指定してもよいが、 好ましく は代謝系における T C A回路やペントースリン酸回路の例のように研究者によく 知られたカスケード、 パスウェイ、 回路等をサブネットとするのが便利である。 また、 あるサブネットが別のサブネットに含まれていてもよく、 例えば代謝系自 体を複数のサブネットを含む上位のサブネットと見なすこともできる。
各サブネットを 1個の仮想生体分子として扱う方法もあるが、 サブネットを構 成する生体分子対とサブネットの階層に関する情報を 「生体分子連鎖データべ一 ス」 に保存するのが便利である。 また、 「生体分子連鎖データベース」 にサブネッ トを表わすための上位のデータ階層を設けて、 そこに該サブネットについての情 報を保存してもよい。 生体分子対のサブネットによる階層化は 2層に限らず、 複 数のサブネットの集合をより上位のサブネットとして保存してもよい。 分子機能 ネットワーク生成時に個々の分子対のデータと上位階層のサブネットデータの間 での相互参照を容易にするために、 個々の分子対データ ·サブネットデータそれ ぞれに互いの関連を示す情報を格納しておくのが望ましい。 1個の生体分子対が 複数のサブネットに関連付けされてもよいことは言うまでもない。
階層化した 「生体分子連鎖データベース」 のサブネットのデータには、 下位階 層の生体分子対との関連のみならず、 サブネット間の関連の情報を含めるのが望 ましい。 例えば、 代謝系において解糖系と TCA回路は連続して動作するサブネッ トであり、 これらのサブネット間の関係を上位階層における対の関係として保存 することができる。 この場合、 サブネットの対の情報に加えて、 サブネット間の 接点となる生体分子の情報を加えておくことが望ましい。
さらに、ネットワークの階層化に加えて、生体分子自身も階層化でき、 「生体分 子情報データベース」にその情報を保存して利用できるのが本発明の特徴である。 ネットワークの高速な検索と便利で多様な表示のためには、 生体分子情報と生体 分子対情報の双方を階層化しておくのが望ましい。 生体分子の階層化の対象とし ては、 以下のような例を挙げることができる。 生体分子のなかには、 複数の異な る分子が特異的に集合してある機能を示すものがあり、 分子の集合状態の違いに より機能の発現状態や種類が制御されている場合も多い。 また、 免疫細胞などで 見られるように、 細胞表面に発現している複数の分子の組み合わせにより、 生体 ィベントとの関連や細胞の機能が規定されている場合もある。このような場合に、 上記のように分子の集合状態を 1個の仮想的生体分子として扱う方法もあるが、 別の方法として、 「生体分子情報データベース」に分子の集合状態を表わすための 上位のデータ階層を設けて、そこに該集合状態についての情報を格納してもよレ、。 分子機能ネットワーク生成時に生体分子データと上位階層のデータの間での相互 参照を容易にするために、 生体分子データと上位階層データのそれぞれに、 互い の関連を表わす情報を格納しておくのが望ましい。 1個の生体 子が複数の上位 階層データに関連付けされてもよいことは言うまでもない。
生体分子の集合状態を階層化により极ぅ別の方法として、 生体分子情報データ ベースの分子の下位の階層に、 集合に加わっている各分子を登録する欄を設けて もよい。 この場合、 集合状態にある生体分子を一つの仮想的生体分子として登録 し、上記で設定した下位の階層の欄に各分子の分子略号を登録するのが好ましい。 生体分子のなかには、 酵素反応などによる修飾を受けることにより、 その機能 が変化するものがある。 このような修飾の例としては、 リン酸化、 メチル化、 ァ セチル化、 ュビキチン化やそれらの逆反応などがある。 修飾状態が異なる生体分 子は、 別々の分子略号を与えることにより区別してもよいが、 生体分子情報デー タベースに修飾の情報を示すデータ階層を設けるとより便利である。 例えば、 生 体分子情報データベースに 「修飾状態」 を表わす欄を設けて、 そこに 「リン酸化」 などの記述をすることにより、 異なる修飾状態にある生体分子であっても、 同一 の分子略号で扱いつつ、 修飾状態を区別することが可能になる。 このような修飾 状態による階層化を行なった場合には、 該分子を分子略号と 「修飾状態」 欄のデ ータの組合せにより区別して扱えばよい。
上記の階層化は、 生体分子の修飾状態以外にも拡張可能である。 例えば、 生体 分子の構造変化や複数の修飾の組合せ等によって、 該分子の他の生体分子への結 合性や反応性が変化するような場合には、 その状態変化を例えば活性型 ·不活性 型として区別して分子データの下位の階層に保存するとよい。
生体分子によっては、 修飾状態や活性型 ·不活性型などの状態変化に依存して 他の生体分子と結合したりしなかったりするものがある。 このような場合には、 上記の階層化した分子データに基づいて生体分子を区別して扱い、 上記の状態毎 に生体分子対を生体分子連鎖データベースに記録してもよい。 また、 別の方法と して、 生体分子対をとりあえず分子略号のみに基づいて生体分子連鎖データべ一 スに記録しておき、 該生体分子対への付加情報として該 2分子が結合 ·反応する 条件となる各分子の状態を記録してもよい。
生体イベント ·病態イベントのなかには、 特定の生体分子対に関連付けするこ とのできないものも多い。 例えば、 生体イベント ·病態イベントとあるサブネッ トの形成との間の関係は分かっているが、 該イベントに直結する生体分子対が未 知の場合がある。 このような場合には、 上記の生体分子対データの階層化を利用 して、 生体ィベント ·病態イベントを生体分子対の上位階層であるサブネットの データに対して関連付けることで、 該ィベントと生体分子ネットワークの関係を 記述することが可能となる。
また、 特定の分子の集合状態や細胞表面への特定の分子の発現状態がある生体 イベント ·病態イベントの発現に関連している場合には、 上記の分子集合状態や 分子発現状態の階層化を利用して、 生体イベント ·病態イベントを分子集合状態 や分子発現状態の階層のデータに関連付けておくことで、 該イベントと生体分子 ネットワークの関係を記述することが可能となる。
さらに、 生体イベント ·病態イベントのなかには、 特定の生体分子対ゃサブネ ットのいずれにも関連付けすることができないものもある。 このような例の一つ として、 炎症性サイトカインの遊離 · 白血球の組織への浸潤 ·毛細血管の透過性 の向上などの様々な生体イベントが組み合わさって起こる 「炎症」 という病態ィ ベントを挙げることができる。 このようなイベントを扱うためには、 生体ィベン ト ·病態イベントを階層化し、 下位の階層には生体分子対やサブネットに関連付 けられるイベントを記述し、 上位階層には下位階層のイベントに関連して起こる イベントを記述するとよい。 この階層化では、 2層以上の階層構造を用いてもよ いことは言うまでもない。各階層間でのイベントの相互参照を容易にするために、 各階層のイベントのデータに上下の階層のデータへの関連を示す情報を格納して おくのが望ましい。 このような生体イベント ·病態イベントのデータの階層化に より、 特定の生体分子対やサブネットに直接関連付けられないイベントについて も、 分子機能ネットワークとの関係を記述することが可能 なる。
生体イベント '病態イベントの階層化の別の態様として、 生体イベント '病態 イベントをキイ分子のアップオアダウン、 生体反応、 症状 '症候、 臨床検査値の 情報、疾患 ·合併症などからなる複数のグループかつ/又は階層に分けてもよい。 例えば、ある疾患において、上記のグループ又は階層に分けられた生体ィベント ·. 病態イベントの間に関連が見られる場合に、 該イベントの間に関連付けをしてお くとよい。 この方法によると、 キイ分子のアップオアダウンの情報を経由して、 疾患と分子機能ネットワークとの関係を容易に記述することができる。
以上例示したように 「生体分子情報データベース」 及ぴ 「生体分子連鎖データ ベース」 のデータを階層化して保存することにより、 多様な用途に対応した分子 機能ネットワークの生成を効率的に行なえるようになる。
同一の生体イベント ·病態イベントであっても、 例えば正常時と疾患時や、 疾 患の状態の違いなどによって、 関連付けられるべき生体分子対やサブネットが変 化する場合もある。 このような場合には、 該イベントからそれぞれの生体分子対 やサブネットに対して関連付けをしておくことで、 同一の生体イベント ·病態ィ ベントが関わる 2以上の分子機能ネットワークを探索することが可能となる。 解糖系に存在するある生体分子 (分子 A) とあるキナーゼカスケードに存在す るある蛋白 (分子 B ) との関連を調べようとする場合に、 階層化していないデー タを用いる方法では膨大な数の分子対を対象にコネクト検索を行なう必要があり、 分子 Aと分子 Bの間の経路が長い場合には事実上検索が不可能となる。 一方、 階 層化されたデータを用いると、 「解糖系」 というサブネットと 「あるキナーゼカス ケード」 というサブネットとの間の関連をサブネットという上位階層においてコ ネクト検索し、 上位階層での経路が見つかった場合には、 必要に応じて経路上に ある各サブネットの下位階層でコネクト検索を行なうことができる。 このように 経路探索問題を異なる階層の問題に分割することにより、 階層化を用いない場合 には不可能であったような分子機能ネットワークの生成も可能となる。 この階層 化データを利用したコネクト検索を行う際にも、 階層化を行わないデータを使つ たコネクト検索と同様に、 サブネット間の関係の方向性又は本発明のデータべ一 ス特有のデータ項目をそのまま又は一定の基準に沿ってスコァ化して検索対象デ ータを絞り込むこともできる。
また、 上記の階層化データを利用し tこコネクト検索において、 特定のサブネッ トが頻繁に参照されるような場合には、 該サブネット内について予めコネクト検 索を行なっておき、 該サブネット内の分子機能ネットワークの情報を保存してお くとよい。 この処理により、 全体の分子機能ネットワークの生成をより効率的に 行なえるようになる。
さらにまた、例えば、 「炎症」 という病態イベントに関わる分子機能ネットヮー クを生成する場合に、 「炎症」という上位階層のイベントに関連する下位階層のィ ベントを探し、 該下位階層イベントが関連する生体分子対又はサブネットから出 発してコネクト検索することにより、 より広範囲な分子機能ネットワークの生成 が可能となる。
' 上記のように、 本発明によると生体分子間の直接結合の関係の情報から、 任意 の分子に関連した分子機能ネットワークが生成でき、 直接又は間接に関わる生体 イベント及び病態イベントが容易に推定できる。 また、 本発明は逆に、 疾患で特 徴的に現れる生体イベントや病態イベント、生体分子の量の変化などの知見から、 疾患に関連する可能性の高い分子機能ネットワークを選別し、 疾患の分子的メカ 二ズムを推定する目的に利用できる。 さらに、 本発明によると、 特定の疾患や症 状の治療にネットワークのどの過程を阻害するのが有効か、 ネットワーク中のど の分子が創薬ターゲット (医薬開発で標的とする蛋白質その他の生体分子) とし て有望か、 その創薬ターゲットから予想される副作用は何か、 それを回避するに はどのようなァッセィ系で医薬開発候捕を選別するかと言つた創薬戦略の構築が 可能になる。
医薬分子は一般に、 体内で蛋白質をはじめとする生体高分子に結合してその機 能を制御することにより薬理活性を発現する。 それらの分子の作用は生体分子の 作用よりも詳しく研究され、 対象疾患の分子メカニズムの解明に役立ってきた。 そこで、 製造承認を受けて医療に用いられている医薬分子や薬理学研究等に用い られる薬物分子とその標的生体分子の対の関係を、 上記の生体分子及ぴ生体分子 間の情報に加えることにより、 本発明の方法の有用性を高めることができること に注目した。 標的生体分子は殆どの場合、 蛋白質又は糖などで修飾された蛋白質 である。 標的生体分子を含む分子機能ネットワークから、 副作用となりそうな生 体ィベントを推定することができるし、 併用する薬剤の関わる分子機能ネットヮ ークとの交差から、 薬剤間相互作用を推定することも可能になる。 その結果、 副 作用リスクや薬剤間相互作用のリスクを考慮した薬剤の選択や用量の設定が可能 になる。
以下に本発明で医薬分子と標的生体分子の対の関係を加えた場合の方法の例を 示す。 医薬分子の正式名称に対して、 分子略号を定義し、 該分子そのものについ てのすべての情報を収録する 「医薬分子情報データベース」 を作成する。 ここに は医薬分子の名称、 分子略号、 適用疾患、 用量、 標的生体分子その他の情報を保 存する。 生体分子情報データベースの場合と同様に、 医薬分子の化学構造、 アミ ノ酸配列(ペプチド又は蛋白質の場合)、立体構造等の情報を「医薬分子情報デー タベース」 に含めてもよいが、 別途のデータベースに保存することが望ましい。 医薬分子と生体分子、 蛋白質と低分子などを区別する目的には、 構造コード等で 区別してもよいし、 最初の 1文字で区別できるような分子略号の付け方を採用し てもよい。 さらに、 医薬品の添付文書やその他の文献から、 顕著な副作用、 他の 薬剤との相互作用、 代謝酵素等の情報も入力しておくと、 分子機能ネットワーク に基づいて、 遺伝子多型との関連で薬剤の適正な選択等を行う目的に役立つ。 さらに、 医薬分子と標的蛋白質の対とその関係に関する情報を含むデータべ一 スである 「医薬分子連鎖データベース」 を作成する。 医薬分子の分子略号、 標的 生体分子の分子略号、関係コード、薬理作用、適用疾患その他の情報を保存する。 標的生体分子の分子略号については、 生体分子情報データベース中で定義したも のを用いる必要がある。 関係コードなど生体分子連鎖データベースと共通するデ ータ項目については、 生体分子連鎖データベースに準じた表記方法を用いるとよ い。
「医薬分子情報データベース」 と 「医薬分子連鎖データベース」 を作成して医 薬分子及び医薬分子対の情報を取り込むことにより、 第 5図に示すように本発明 の方法を拡張することができる。 ここでのコネクト検索による分子機能ネットヮ ークの生成や生体イベントの推定などは、 上記の生体分子連鎖データベースと生 体分子情報データベースだけを用いた場合と同様の方法で行うことができ、 該ネ ットワーク上の分子を標的とする既存医薬分子の情報が同時に得られる。 また、 生体分子連鎖データベースと生体分子情報データベースだけを用いて作成した分 子機能ネットワークから、 指定した医薬分子の関わる分子機能ネットワークを抽 出する目的にも利用できる。
一方、 ヒ トゲノム配列の解析をはじめとして、 多様な角度から遺伝情報の解明 が急速に進みつつある。 ゲノムワイ ドに c D N Aが単離され、 o r .f (open reading frame)や遺伝子配列の解明が進み、各遺伝子のゲノム上への位置づけが 進んでいる。 そこで、 本発明の別の態様として、 生体分子のうちの蛋白質の分子 略号と、 該蛋白質をコードする遺伝子の名称、 略称、 IDその他の情報を関係付け た 「生体分子一遺伝子データベース」 を作成しておくことにより、 以下のように 本発明の方法を拡張することができる。 すなわち、 遺伝子と生体分子を対応づけ ることにより、 疾患のマーカーとなる遺伝子や蛋白の意味付けや、 疾患と遺伝子 多型の関わり等の知見を分子機能ネットワーク上の分子及び生体ィベントとの関 連において理解することが可能になる。 「生体分子一遺伝子データベース」 には、 生物種、 ゲノム上の位置、 遺伝子配列、 機能のほか、 遺伝子多型のアミノ酸変異 と略称、 機能との関連等の情報を含めておくのが望ましく、 必要に応じて 2以上 のデータベースとするのもよレ、。
ゲノム配列上に位置づけられた遺伝子名や遺伝子の並びから、 特定のキイ分子 が核内受容体などの遺伝子転写機構に作用することによつて転写される蛋白が明 確になり、 生体分子間の相互の制御の関係を分子機能ネットワークに反映するこ とが可能になる。 また、 臓器によって発現する遺伝子や蛋白が異なることが知ら れているが、 本発明の方法によれば、 そうした発現情報を 「生体分子情報データ ベース」 に取り込むことにより、 臓器毎に異なる 「分子機能ネットワーク」 を生 成することができ、 例えば、 異なる臓器では核内受容体を標的とする医薬分子の 作用が違ったり逆転したりする現象の説明が可能になる。 また、 医薬分子を投与 した場合に蛋白発現が変化する事実がわかっているが、 本発明の方法により個々 の発現蛋白量の増減を標的生体分子に関わる分子機能ネットワーク上で解釈する と、 遺伝子多型を考慮した薬剤選択に有用である。
上記の遺伝子転写や蛋白発現の情報の保存においても、 階層化の概念を利用す ることにより、 より効率的かつ広範囲な分子機能ネットワークの生成が行なえる ようになる。 例えば、 特定の核内受容体により転写 ·発現される複数の遺伝子 · 蛋白に対して、 「生体分子情報データベース」に遺伝子群の転写 ·蛋白群の発現を 表す上位の階層を設けて、 そこに該遺伝子群 ·該蛋白群のデータを保存しておく とよい。 該遺伝子群の転写ゃ該蛋白群の発現に関連する生体イベント ·病態ィべ ントが存在する場合には、 「生体分子連鎖データベース」に該遺伝子群'該蛋白群 の上位階層データと該イベントとの関連を記載することにより、 個々の遺伝子 · 分子と該ィベントとの間の関違付けでは表せないような分子機能ネットワークの 生成が可能となる。
上記の遺伝子転写や蛋白発現の情報の階層化した保存法において、 該遺伝子群 の個々の遺伝子又は該蛋白群の個々の蛋白の転写又は発現の量的な情報が分かつ ている場合には、 それらの情報も数値パラメタとして 「生体分子情報データべ一 ス」 に保存しておくとよレ、。 これらの数値パラメタを利用することにより、 個々 の遺伝子の転写量又は個々の蛋白の発現量の違いに応じて、 関連する生体ィベン ト ·病態ィベントが変化する場合を記述することが可能となる。
遺伝子転写や蛋白発現の数値パラメタは、上記の「生体分子情報データベース」 に保存する方法以外にも、 外部のフアイルゃデ一タベースから取り込む方法によ つても本発明の方法で利用できる。 この場合、 外部データ中の遺伝子又は蛋白質 の IDと、 「生体分子情報データベース」中の生体分子の ID又は「生体分子一遺伝 子データベース」中の遺伝子の IDとの対応表を用意しておくことにより、外部デ 一タを本発明の方法に容易に取り込むことが可能になる。
また、 ゲノムや遺伝子についての個体の多様性が明らかにされつつあるが、 そ うした情報を本発明の方法とリンクすることにより、 個体差への理解が進み、 個 体差に基づく治療が可能になる。 特定の生体分子 (蛋白質) の機能が損なわれる ような遺伝子多型について、 分子機能ネットワーク上で解釈することにより生体 ィベントへの影響が推定できる。 1個の遺伝子の欠損や異常が引き起こす遺伝病 の症状及び生体イベントの異常の情報を、 本発明の方法にリンクさせることも、 その理解に有用である。
いくつかの代表的疾患で、 各疾患の患者に頻度高く見出される数個の遺伝子、 疾患背景遺伝子の存在が報告されている。 特定の疾患にかかりやすい遣伝的体質 が実際にあると仮定した場合、 例えば、 血圧の調節に関わる分子機能ネットヮー クは 2以上あり、 そのうちのどのネットワークのどの分子の異常かによつて、 高 血圧の背景となる遺伝子は相当数あっても不思議ではない。 こうした polygenic な遺伝子の問題を解釈するには、 本発明の方法が不可欠である。
また、 近年、 マウス、 ラット等の動物のゲノムや遺伝子の解析も急速に進めら れており、 ヒ トのゲノムや遺伝子との対応も付けられるようになつてきた。 これ らの動物とヒトとで生理機能の調節に関わる蛋白がかなり似ていることが期待さ れるが、 かなりの違いもあることが医薬開発の障害となってきた。 これらの動物 とヒ トの間で蛋白や蛋白機能が大きく異なる場合があることがわかってきており、 本発明の方法とのリンクによって、 ヒトの分子機能ネットワークとの違いを明ら かにすることは医薬開発に有用である。 さらに、 一般にヒト用に開発された医薬 を転用することが多い動物薬について、 適切な使用を目指す上でも有用である。 医薬開発においてはヒトの疾患と病態が類似した病態動物がある場合、 その動 物での薬理活性を指標に開発を進めることが多い。 そうした病態動物の遺伝子も 進められており、本発明の方法によりヒトの遺伝情報と対応づけることによって、 ヒトの該疾患のメカニズムの解明に役立つ。
さらに、 遺伝子機能の解明の目的で、 特定の遺伝子を潰したノックアウト動物 や機能の弱い遺伝子に変えたり遺伝子を過剰発現させたりしたトランスジヱニッ ク動物を作成することが多くなった。 これらは致死的で生まれて来ない場合や生 理機能や行動に何の影響も見られない場合も多いが、 生まれてきた動物に何らか の異常が観察される場合でも、 これらの動物実験の結果の解析は非常に難しいと いわれている。 このような実験において、 本発明の方法を用いて、 該遺伝子操作 の影響を予測してから、 '機能解析すると便利である。
上記のような 2以上の生物種の研究に本発明の方法を用いる場合には、 生物種 間での遺伝子の対応関係又は蛋白の対応関係を予め用意しておくとよい。 また、 別の方法として、 本発明の方法のデータベースに生物種ごとのデータを登録して 用いてもよい。 この場合、 生物種を区別するための情報を 「生体分子情報データ ベース」 や 「生体分子連鎖データベース」 などに記録しておくとよい。 例えば、 生体分子に関する 「生成臓器」 「存在臓器」 「作用臓器」 の項目に上位概念として 生物種の区別を付け加えることにより、 生物種の区別を記録して本発明の方法に 用いることが可能となる。
遺伝子関違の情報は、 解析の進展とともに、 配列 I Dの面からの統合の試みも 進みつつあり、さらにゲノム配列上に遺伝子を位置づける試みも進められている。 上記 「生体分子連鎖データベース」 との連携を考慮した独自の遺伝情報データべ ースを構築して上記の目的に利用することも考えられるが、 これらの情報が膨大 でかつ公開される方向にあることを考えると、 将来はそうした公開の情報を本発 明の方法に臨機に取り込むことによって、 上記の方法が実施できる可能性が高い (第 6図)。
本発明の方法で用いる生体分子連鎖データベースは、 必ずしも同一の場所にま とめて管理 ·保存されている必要はなく、 分子略号を統一することにより、 異な る場所に管理 ·保存されている 1以上の生体分子連鎖データベースを適宜選択し て通信等の手段により接続して用いることもで'きる。 生体分子連鎖データベース のみならず、 本発明の方法で用いる生体分子情報データベース、 医薬分子連鎖デ ータベース、 医薬分子情報データベース、 遺伝情報データベース、 病態連鎖デー タベースなどについても、 同様の扱いが可能なことは言うまでもない。
本発明の実施のさらに別の態様として、 生体イベントの発現に直接関わる生体 分子と該生体イベントの情報を含むデータベース (生体イベント一生体分子デー タベース) を作成し、 生体イベントの情報を必ずしも含まない分子ネットワーク のデータベースと併用する方法も提供される。 さらに別の実施の様態として、 生 体イベントの情報を必ずしも含まない分子ネットワークの ータベースから、 任 意の分子に関わる部分的な分子ネットワークを抽出し、 該ネットワークを構成す る分子に基づいて、 上記の生体イベント一生体分子データベースを検索する方法 も提供される。
本発明の実施のさらに別の態様として、 「生体分子情報データベース」 '「生体連 鎖データベース」 ·「医薬分子情報データベース」 ·「医薬分子連鎖データベース」 · ' 「生体分子—遺伝子データベース」 ·「病態連鎖データベース」 などの各データ項 目に対して、 キーワード ·数値パラメタ '分子構造 'アミノ酸配列 ·塩基配列な どに基づく検索を行ない、 該検索結果に基づいて分子機能ネットワークを生成す る方法が提供される。 以下に、 検索に基づく分子機能ネットワーク生成の例を挙 げるが、 本努明の範囲がこれらの例に限定されるものでないことは言うまでもな い。
务データベースには、 分子名称 ·分子略号 ·生物種 ·生成臓器 ·存在臓器等の 種々の情報がテキストとして保存されている。 これらのテキストに対して文字列 の全一致 ·部分一致などに基づく検索を行なうことで、 生体分子 ·生体分子対 · 生体ィベント ·病態ィベント ·医薬分子 ·医薬分子一生体分子対 ·遺伝子一蛋白 の対応データなどを絞り込むことができる。 これらの絞り込まれた情報に基づい て、 コネクト検索の起点 ·終点を定めたり、 コネクト検索で対象とする分子対の 範囲を狭めたりすることができ、 利用目的に応じた分子機能ネットワークの生成 が可能となる。
「医薬分子情報データベース」 に医薬分子の化学構造 ·立体構造が保存されて いる場合には、 これらに対して全体構造の一致 ·部分構造の一致 ·構造類似性な どに基づく検索を行なうことで、 医薬分子を絞り込むことができる。 絞り込まれ た医薬分子に基づいて、 該医薬分子に関連する分子機能ネットワークを生成した り、 該医薬分子に関連する生体イベント ·病態イベントを検索したりすることが 可能となる。
「生体分子情報データベース」 に遺伝子転写 ·蛋白発現等の数値パラメタが保 存されている場合には、 これらの数値パラメタに基づく検索を行なうことで、 遺 伝子の転写量 ·蛋白発現量等に応じた分子機能ネットワークの生成が可能となる。 数値パラメタに基づく検索は、 数値パラメタを外部のファイルやデータベース等 から取り込んだ場合にも、 同様に行なうことができる。
「生体分子情報データベース」 又は関連データベースに蛋白のアミノ酸配列が 保存されている場合には、 これらのアミノ酸配列に対して配列相同性や部分配列 パターンの一致などに基づく検索を行なうことで、 生体分子を絞り込むことがで き、 該生体分子に基づいて分子機能ネットワークを生成することができる。 この 方法は、 機能未知の蛋白質やその部分配列情報について、 該蛋白質が関係する可 能性が高い分子機能ネットワークを推定し、 さらに該蛋白質の機能を推定する目 的に有効である。
「生体分子情報データベース」、 「生体分子一遺伝子データベース」 又は関連デ ータベースに蛋白に対応する.遺伝子の塩基配列が保存されている場合には、 これ らの塩基配列に対して配列相同性や部分配列パターンの一致などに基づく検索を 行なうことで、 生体分子を絞り込むことができ、 該生体分子に基づいて分子機能 ネットワークを生成することができる。 この方法は、 機能未知の遺伝子やその部 分配列情報について、 該遺伝子から翻訳される蛋白が関係する可能性が高い分子 機能ネットワークを推定し、 さらに該蛋白の機能を推定する目的に有効である。 本発明のさらに別の態様として、 ある疾患 (以下、 「注目疾患」 という) に関連 する病態イベント、 生体分子、 その他の情報をグループ化かつ Z又は階層化して 保存した 「病態連鎖データベース」 を利用する分子機能ネットワークの生成 *検 索方法も提供される。 以下、 病態連鎖データベースの作成及び利用方法の例を示 すが、 本発明の範囲が以下の特定のグループィヒ ·階層化の方法に限定されないの は言うまでもない。
病態連鎖データベースには、 注目疾患に関係する病態イベント、 生体分子、 そ の他の情報を以下の例のようにグループ化かつ 又は階層化して保存する。 さら に、 ある注目疾患において、 いずれかのグループに属する 2以上のデータ項目の 間に関連が認められる場合には、 該データ項目間の関連付けの情報を保存する。
1 . キイ分子
2 . 生体反応
3 . 症状 ·症侯
4 . 臨床検査値
5 . 疾患 ·合併症
病態連鎖データベースの 「キイ分子」 のグループには、 疾患に関連して量的か つ/又は質的に変動が見られる生体分子の情報を保存する。 このキイ分子の情報 を利用することにより、 病態ィベントから分子機能ネットワークを検索したり、 分子機能ネットワーク中の分子と病態イベントの間の関連を検索したりすること が可能となる。
キイ分子の量的又は質的な変動は、 以下に示す例のように表現することができ る。ある疾患において分子 Aが量的に増加の方向に変動する場合を A (+)と表現す る。 この例としては、 酵素活性や受容体活性の亢進などが挙げられる。 その反対 に、分子 Aが量的に減少の方向に変動する場合を A (-)と表現する。 この場合には 量的にはほとんど 0 に近い場合も含んでもよく、 それに伴う分子の loss of functionをも含んでもよい。 例えば、 DNAのプロモーター領域の CpGアイランド のメチル化異常により遺伝子が発現せず、 そのために本来転写 ·翻訳され, 機能 すべき蛋白質が不活化しているという現象もこの表現によって示すことができる。 また、 この表現方法を用いると、 特定の遺伝子をノックアウトし、 その遺伝子が コードする蛋白質が欠損した際の分子機能ネットワークの変化を推定することが 容易となる。 ある疾患において、 ある分子が質的に変化する場合を A (m)と表現す る。 これはその蛋白質をコードする遺伝子の変異などによることが多い。
病態連鎖データベース中の 「生体反応」 のグループには、 直接的または間接的 に疾患に帰着すると考えられる、生体にとっての異常または過剰(あるいは過少) な状況にある生体反応、 生体内現象の情報を保存する。 生体反応のグループに記 述されるデータ項目は、 分子機能ネットワーク上の生体イベント、 生体分子対、 サブネット等と関連付けしてもよい。 ここで生体反応とは、 主に分子レベル (蛋 白質、 酵素活性、 遺伝子を含む)、 細胞レベル、 臓器レベルにおける現象を指し、 さらに情報を階層化して記述してもよい。 また、 それが起こる場の情報や条件等 により、 生体反応を階層化することもできる。
病態連鎖データベース中の 「症状 ·症候」 のグループには、 注目疾患を特徴づ ける、 あるいは注目疾患の診断の根拠となる病態イベントを保存する。 医薬分子 による副作用に対応する病態イベントも、このグループに記述するのが好ましい。 また、 このグループに存在する病態イベントのうちで、 ある医薬分子の作用機序 や適応症に対応又は関連するものについては、 「医薬分子情報データベース」中で 該医薬分子のデータとして記述しておくとよい。 これにより、 作用の標的となる 生体分子が分かっていない医薬分子についても、 分子機能ネットワークを検索す ることが可能になる。
病態連鎖データベース中の 「臨床検査値」 のグループには、 実際に臨床で用い られている力、 用いられる可能性のある検查項目を保存する。 臨床検査で測定さ れる対象となる生体分子が生体分子情報データベース中に存在するときは、 その 生体分子の分子ァノテーシヨンとして該分子が臨床検査の測定対象であるという 情報を付加してもよい。 臨床検査値のグループ中の生体分子について、 関与する 分子機能ネットワークを検索することができ、 分子機能ネットワーク中に存在す る生体分子が臨床検査の測定対象となっている場合に、 この情報に基づいて該生 体分子を強調表示するなどの目的にも利用できる。
病態連鎖データベース中の「疾患'合併症」のグループには、注目疾患の成因、 ステージ、 罹患部位などに基づく名称や分類名、 及び注目疾患に関わる合併症な どの情報を記述する。 「疾患 '合併症」 のデータ項目は、例えば注目疾患、 ステー ジ、 罹患部位などに基づいて階層化して保存してもよい。
病態連鎖データベース中の用語は、 例えば MedDRA/J (Medical Dictionary for Regulatory Activities Terminology; 日本公定書協会) などの標準辞書に従って 記述するのが好ましい。 また、 辞書に含まれている用語のほかに、 類義語ゃシノ ニム等も付加しておくとよい。
病態連鎖データベースと、 本発明の他のデータベースを併せて用レ、ることによ り、 以下のような分子機能ネットワークの検索が可能となる。
上述のとおり、 ある医薬分子に対して標的生体分子が記述されている場合には、 該医薬分子から該標的生体分子を経由してコネクト検索を行なうことにより、 該 医薬分子が関わる分子機能ネットワークを検索することができる。 病態連鎖デー タベースを用いると、 標的生体分子が不明な医薬分子であっても、 以下のように して該医薬分子が関わる分子機能ネットワークを検索することが可能となる。 標的生体分子が不明な医薬分子について、 該医薬分子の適応疾患、 適応症、 作 用機序等の情報に基づいて、病態連鎖データベース中で一致する項目を検索する。 次に、 病態連鎖データベース中の関連付けの情報を用いて病態連鎖データベース のデータ項目間のコネクト検索を行ない、 分子機能ネットワークにつながり得る キイ分子の情報を取得する。 該キイ分子から、 生体分子連鎖データベースを用い たコネクト検索を行なうことで、 該医薬分子が関わる分子機能ネットワークを検 索することができる。 また、 ある医薬分子の副作用情報に基づいて病態連鎖デー タベースを検索し、 症状 ·症候や疾患 ·合併症のグループ中に一致する項目が存 在すれば、 その項目から上記と同様にコネクト検索を行なうことにより、 該医薬 分子の副作用に関連する分子機能ネットワークを検索することができる。
本発明によって提供されるデータベース及ぴコンピュータシステムは、 利用者 が容易にデータの追加、 編集、 削除等を行うことができる入出力装置としても応 用できる。 利用者が編集したデータは、 保存可能であり、 必要に応じて予め提供 されたデータベースとマージすることができる。 さらに、 マージしたデータは検 索、 閲覧等に利用することもできる。 例えば、 利用者は実験等によって実証また は予測された生体分子、 生体分子対、 生体イベント、 病態イベント、 医薬分子情 報、 遺伝子、 その他の情報に基づいてデータの追加、 編集、 削除を行うことによ り、 コネクト検索により新規な分子機能ネットワークを生成したり、 分子機能ネ ットワークに伴う新規なイベント情報を取得したりできる。 これにより、 疾患に おける新たな分子的メ力ニズムの推定が可能になる。 利用者によつて編集される データは予め提供されたデータベースのデータ項目に追加 ·置換する形で記録し てもよいし、 編集用のファイル又はデータベースとして独立して管理し、 必要に 応じて予め提供されたデータベース内のデータと併せて利用してもよい。
本発明のデータベース以外の外部データベースに収められた生体分子、 生体分 子対、 生体イベント、 病態イベント、 医薬分子情報、 その他の情報の全体または —部を、 本発明のデータベースに取り込むことも可能である。
本発明のさらに別の態様として、 端末で閲覧中の情報に本発明のデータベース 中のレ、ずれかのデータ項目や生成した分子機能ネットワーク上のいずれかの項目 に該当する項目が存在した場合に、該項目を強調して表示する方法が提供される。 この方法により、 該項目が既にデータベース中に登録されていることを、 わざわ ざデータベースに対して検索することなく利用者が知ることが可能になる。また、 この際に該項目を強調表示するだけでなく関連するデータベースのデータ項目や 分子機能ネットワークの一部又は全部のデータを端末に表示することも可能であ る。 さらには、 該項目に基づいてコネクト検索を行い、 該項目が関わる分子機能 ネットワークを生成して表示することもできる。
本発明の実施のさらに別の態様として、 本発明の方法を実施するためのプログ ラムとデータベースからなるコンピュータシステム;本発明の方法を実施するた めのプログラムとデータベースを記録したコンピュータ読み取り可能な媒体;本 発明の方法で用いるためのデータベースを記録したコンピュータ読み取り可能な 媒体;本発明の方法により生成された分子機能ネットワークに関する情報を記録 したコンピュータ読み取り可能な媒体なども提供される。
本発明の方法の特徴をまとめると、 以下の通りである。
•生体イベントの情報を含み、 直接結合する生体分子対の情報を蓄積することに より、 生体内の分子間の関わりのデータベースを作成する。 •パーツの集合である上記データベースからコネクト検索で、 任意の生体分子又 は生体イベントに関わる分子機能ネットワークを作成する。
•分子機能ネットワークに基づいて、 任意の分子が直接間接に関わる生体ィベン トを推定する。
•生体イベントの情報つき分子機能ネットワークから、 疾患メカニズム、 可能な 創薬ターゲット、 副作用リスク等を推定する。
•生体分子の量的又は質的な変動から生体イベントのアップオアダウンを推定す る。
•生体分子の生成臓器、 存在臓器及び作用臓器の情報をもつ分子機能ネットヮー ク
•医薬分子情報と分子機能ネットワークを用いた副作用、 薬剤間相互作用の推定 •医薬分子の投与による蛋白発現の変化を分子機能ネットワーク上で解釈 •遺伝情報とのリンクによって分子機能ネットワークへの遺伝子多型の影響、 疾 患背景遺伝子等の解析を行う。 - 実施例
以下、 本発明を実施例によりさらに具体的に説明するが、 本発明の範囲はこれ により限定されるものではない。 P C TZ J P 0 1ノ 0 7 8 3 0号明細書に記載 された実施例を参照することにより、下記の実施例の理解がさらに容易になろう。 例 1
2以上の生体分キが複合体 (集合体) として機能している場合の、 生体分子情 報データベースと生体分子連鎖データベースへの該複合体の登録方法と利用方法 について、 転写因子 N F κ Bの系と T N Fレセプター複合体を例にして示す (第 7図)。
転写因子である N F κ Bは、 RelAと p50のへテロ 2量体として機能する。 この ような分子については、 以下のようにして 1つの分子として扱うことが可能であ る。 生体分子情報データベース中に、 分子ァノテーシヨンの 1項目として 「複合 体情報」の欄を設け、 NF κ Bを構成する分子が RelAと p50であることを入力す る。 リガンド依存的に形成される複合体、 例えば TNFレセプター複合体 (第 7 図中の TNFR1[4]) についても、 同様に 1つの分子として扱うことにより、 分子機 能ネットワークを簡潔に表現することが可能となる。
生体分子によっては、 あるときには複合体の構成分子として扱われたり、 別の ときには単独で 1つの生体分子として扱われたりと、 両方の場合を考慮する必要 がある。 第 8図に示すように、 生体分子 TRAF2は、 複合体 TNFR1 [4]の構成分子と して扱われたり、 NF K Bの下流で発現を誘導される単独の生体分子として扱わ れたりすることがある。 この場合、 独立な生体分子としての TRAF2 と、 複合体 TNFR1 [4]の構成分子としての TRAF2の間を関連付けすることにより、 分子ネット ワークをより緻密に表現することが可能となる。 この関連付けは、 分子情報デー タベース中の分子略号と複合体情報欄にある分子略号とを照合することにより、 自動的に行なうことができる。 例 2
生体分子の修飾状態を生体分子データの階層化により区別する例を、 NF κ Β /I Κ Β α複合体の系について示す (第 9図)。
NF κ Β// I κ Β αは、 まず IKK complexによってリン酸化され、 次に (リン 酸化部位を認識して結合する) SCF complex によってュビキチン化され、 最後に 26S proteasomeによって I ic B aが分解される。 この例では、 未修飾状態の NF κ Β/ Ι κ Β リン酸ィ匕された NF κ Β/ I κ Β α、 さらにュビキチン化され た NF B/ l fc B aを、 生体分子情報データベースの 「修飾状態」 の階層のデ ータにより区別して扱'うことができる。 このように階層化データを用いることに より、 NF /c BZl κ B αの各修飾状態に対して異なる分子略号を割り振ること なく ΪΚΚ complex等の各生体分子と NF κ Β/ I κ B c との関係を簡潔に表現す ることが可能となる。 例 3 - 生体分子の修飾状態に関する情報が部分的にしか分かっておらず、 生体分子対 の形成や生体ィベントへの関連付けにおいて明確に区別できない場合も多い。 例 えば、 第 1 0図に示す系では、 異なる部位がリン酸化された生体分子 p 5 3と、 生体分子対を形成する相手の生体分子との対応関係が明確ではない。 このような 場合には、 これらの複数の修飾状態にある生体分子を一つにまとめて扱ってもよ レ、。 例 4
糖尿病を注目疾患として、 病態連鎖データベースに含まれる各データ項目と、 それらの間の関連付けのデータの例を示す。
糖尿病は、 1997年 A D A (American Diabetics Association) により、 1型, 2型、 その他の特殊型、 妊娠糖尿病と分類されているが、 一般には遺伝因子と環 境因子が複雑に絡み合った、 多因子疾患として捉えられている。
病態連鎖データベース中に含まれるデータ項目の例として、 表 1に糖尿病を注 目疾患として本件発明の方法により記述した病態連鎖データベースの内容を示す。 第 1 1図には、 各データ項目の関連性を概念的に示した。 図中で線で結ばれたデ ータ項目の対を、それぞれ関連付け情報として病態連鎖データベースに記録する。
Figure imgf000045_0001
糖尿病のように多数の因子が関与している疾患では、 メカニズムを明確な形で 図式化し理解することは非常に困難であるが、 本発明の方法を用いると、 病態連 鎖データベースの各グループに分類された個々のデータ項目がどのように関連し ている力、また複数のデータ項目間の関連付けがどのように絡み合つているかを、 容易に理解することができる。 複雑な疾患の全体像、 具体像を捉えようとすると き、 疾患をその疾患に関与する病態イベント、 生体分子、 生体反応などの間の関 連性という観点から理解することが可能となる。 例 5
病態連鎖データベース中の糖尿病に関与しているキイ分子から分子機能ネット ワーク中のサブネットを検索する例を示す。
現在、糖尿病発症のメカニズムの詳細は明らかになっていない。そこで、まず、 糖尿病において量的かつ/または質的に変動する分子を病態連鎖データベース内 で検索し、 TNFひ(十)、 FFA (+)、 insulin (-)、 HNF— 4a (m)、 glucose (十)、 leptin (+)、 HbAlC (+)という記述があるキイ分子群を得る。 次に、 生体分子情報データベース と生体分子連鎖データベースを用いて、 該キイ分子のそれぞれが所属するサブネ ットを検索する。
上記の手順により、 TNF a (+)では 「TNF レセプターを介したシグナル伝達」 と
「NF- kBによる発現誘導」、 FFA (+)では「リポタンパク代謝」、 insulin (-)では「ィ ンスリ ンシグナル伝達」 と 「グルコースによるィンスリン分泌」、 HNF- 4a (m)は「腌 の発生と代謝に関与する転写因子ネットワーク」、 glucose (+)では「グルコースに よるインスリ ン分泌」、 「グリコーゲン代謝」 と 「解糖系」 というように、 それぞ れのキイ分子に対して糖尿病に関与する可能性があるサブネット群が抽出される
(第 1 2図)。
この方法により、 糖尿病という疾患に関与する、 あるいはこの疾患において変 動する分子が、 生命現象におけるどのようなパスウェイに関わっているかを調べ ることができる。
例 6
糖尿病では現在、 成因の違いによる分類法が用いられている。 これは糖尿病の 最近の成因の研究の進歩を踏まえ、 より適切な診断と治療を行うことを目的とし て用いられている。 ここでは、 成因により分類された糖尿病のメカニズムを解析 する例を示す。
「その他の特殊型」 として分類される糖尿病の中で、 MODYl (maturity onset diabetes of the youthl)が知られている。 この MODYlが他の分類の糖尿病と比較 してどのような違いがあるかを調べるために、 病態連鎖データベース中の疾患 · 合併症のグループから M0DY1の項目を検索し、 該項目から病態連鎖データベース を用いてコネク ト検索を行い、 関連する項目を抽出する。
上記の検索の結果、キイ分子のグループに M0DY1の原因遺伝子に対応する H F - 4 (m)が、生体反応のグループに「HNF- 4 α遺伝子変異」力 それぞれ見出される。 さらに、 生体分子連鎖データベースを用いて、 転写因子である HNF-4 aが関連付 けされているサブネットを検索し、 サブネット 「膝の発生と代謝に関与する転写 因子ネットワーク」 を得る。 該サブネットに属する分子機能ネットワークを生成 することにより、 実際に HNF-4 ct周辺の具体的な生体分子対も知ることができる (第 1 3図)。
このように、本発明の方法を用いると、より細かく分類された疾患名からでも、 その成因に関わる分子および、 メカニズム、 あるいは他の疾患との差異に関する 情報を得る事ができる。 例 7
糖尿病が代謝異常による疾患であることは言うまでもないが、 生体における代 謝系と糖尿病の因果関係が直接明らかになつている疾患に M0DY2が挙げられる。 ここでは、 糖質代謝と糖尿病、 さらにその成因を目的とした検索例を示す。
まず、 M0DY2を質問として病態連鎖データベースを検索して、 M0DY2に関連する キイ分子のデータ項目 GlcK (m)と GlcK (-)を得る。 次に、 GlcK (m)と GlcK (-)を質 問として、 生体分子連鎖データベースを用いて検索を行い、 これらの質問項目に 対応するデータを持つサブネット 「解糖系」 を抽出する (第 1 4図)。 例 8
糖尿病における最も重要な分子のひとつインスリンの生体における役割を調べ るために、 インスリンを質問として本件発明のデータベースを用いた検索を試み た例を示す。
糖尿病では何らかの形でインスリンが関与している。 まず、 インスリンを質問 として病態違鎖データベースを検索し、 キイ分子のグループから insulin (+), insulin (-)及ぴ insulin (m)を、生体反応のグループから「ィンスリン作用低下」、
「インスリン分泌能低下」、 「インスリン受容体数減少」 などを、 症状'症候のグ ループから 「インスリン抵抗性」 を、 臨床検査値のグループから 「インスリン抗 体(IM) (+)、 インスリン注射歴 (-)」 を、 疾患'合併症のグループから 「インスリ ン受容体異常症 A型」 などの項目を、 それぞれ抽出する。
さらに、 インスリンを質問として生体分子連鎖データベースを用いた検索を行 い、 サブネット名として 「インスリンシグナル伝達」、 「膝 細胞におけるインス リン分泌」 などを抽出する。 そのうち、 特に 「インスリンシグナル伝達」 では、 インスリン一インスリンレセプターの生体分子対の下流に 「細胞増殖」、 「蛋白質 合成」、 「グリコーゲン合成」、 「脂質分解」、 「解糖系」、 「糖輸送」、 「アポトーシ ス」 などの生体イベントが存在していることがわかる(第 1 5図)。 したがって、 このシグナル伝達が何らかの原因によって障害された場合、 その影響も多岐にわ たることがわかり、 インスリンの生体における重要性と機能の多様性を知ること ができる。 例 9
生活習慣病は幾つかの疾患が同時にまたは、 付随的に発生し、 共通の原因を持 つことが多い。 糖尿病それ自体も種々の合併症を引き起こすが、 いわゆる 「死の 四重奏」 や 「シンドローム X」 と呼ばれる症候群では、 糖尿病だけを一つの疾患 として切り離して考えることは困難である。
そこで、 これらの症候群に共通する病態 「インスリン抵抗性」 を質問として病 態連鎖データベースをコネクト検索してみた。 コネクト検索の結果を有向グラフ として表示することにより、 「インスリン抵抗性」が関与する疾患とその関連性を 理解しやすい形で図示することができた(第 1 6図)。 例 1 0
医薬分子情報データベースのデータに基づ 、て、 ある医薬分子の作用メカニズ ムを知る方法の例を示す。
医薬分子情報データベース中に含まれる情報の例として、 糖吸収遅延を作用機 序とし、 糖尿病薬として用いられているァカルポースの医薬分子情報データべ一 ス中のデータを表 2に示す。 表 2 医薬分子情報データベース
医薬分子名 ァカルポース一 ーグルコシダーゼ阻害剤
(製品名)
ターゲット分子 α—グレコシター -C
副作用情報 (1)重要な副作用
劇症肝炎等の重篤な肝障害があらわれることがある。
肝機能障害,黄疸、 AST(GOT) ALT(GPT)の上昇を伴う重篤な 肝機能障害、黄疸が現れることがある。
(2)その他の副作用
(特に女性)、 iM、 LDH上昇、賺、ふらつき、頭重感
腹部膨満感、下痢、腹痛、胃痛、胃重感、腹部違和感 (消化器)
GOT上昇、 GPT上昇 (肝臓)
貧血、白血球減少、血小板減少 (血液)
¾ ^、蓦麻疹、瘙痒感 (過敏症)
BUN上昇 (腎臓)
対応疾患 2型糖尿病
コメン卜 糖尿病の食後過血糖の改善 (ただし、食事療法、運動療法によって も十分な血糖コントロールが得られない場合、または食事療法、 運動療法に加えて経口血糖降下薬もしくはインスリン製剤を使用 している患者で十分な血糖コントロールが得られない場合に限る)
ァカルボースまたはその商品名を質問としてその作用メカニズムを知ろうとす る場合、 医薬分子情報データベースを検索することにより、 標的生体分子 (ター ゲット分子) が α—ダルコシダーゼであるという情報を得ることができる。 さら に、 生体分子連鎖データベースを α _ダルコシダーゼを質問として検索し、 この 分子が 「多糖 ·オリゴ糖代謝」 というサブネットの中に存在することがわかる。 さらに該サブネット中の分子ネットワークを表示させると、 α—ダルコシダーゼ がスクロースからグルコース、 マルトースからグルコースなどへの分解反応を触 媒しており、 ァカルボースはこれらの反応を阻害していることがわかる (第 1 7 図)。 例 1 1
2型糖尿病の典型的な特徵はィンスリン抵抗性である。 インスリン抵抗性を改 善するとされる医薬分子の作用メカニズムの詳細を分子機能ネットワーク上で調 ベる方法の例を示す (第 1 8図)。
「インスリン抵抗性」 を質問として病態連鎖データベース内で検索を行うと、 まず、注目疾患を「糖尿病」 とする症状'疾患のグループに、 「インスリン抵抗性」 が見出される。 次に、 同じく 「インスリン抵抗性」 を質問として医薬分子情報デ ータベースを文字列部分一致の条件で検索すると、 インスリン抵抗性改善を薬理 作用にもつ医薬分子であるチアゾリジン系の 「ピオグリタゾン J と 「トログリタ ゾン」 (現在日本では販売中止)が抽出される。医薬分子情報データベースのデー タから、 これらのインスリン抵抗性改善薬の作用機序は「糖取り込み増加」、作用 メカニズムは 「核内受容型転写因子 PPAR y (peoxisome proliferator activated receptor 7 ) の活性化」 であることがわかる。
ここで、 作用機序 「糖取り込み増加」 について、 「糖取り込み」 を質問として、 さらに分子機能ネットワークの検索を行うと、 サブネット 「インスリンシグナル 伝達」 における分子 GLUT4の下流の生体イベントに 「糖取り込み」 があることが わ力る。 産業上の利用可能性
生体ィベントを含む生体分子対の情報の集合である本発明の生体分子連鎖デー タベースは、 検索によって必要な範囲の機能上生合成上の該分子間のつながりで ある分子機能ネットワークを生成し、 任意の生体分子が発現に直接又は間接に関 わる生体イベントを推定するのに有用であり、 さらに医薬分子の情報又は遺伝情 報とリンクすることにより、 新薬開発や個体差に基づく医療に必要な知識を得る ことができる。

Claims

請求 の 範 囲
1 . 修飾状態、 活性 Z不活性状態、 集合状態、 及び構造変化からなる群から選ば れる項目を含む 1又は 2以上の項目により生体分子の情報を階層化して保存した データベースを用いてコネクト検索を行う工程を含む、 分子機能ネットワークの 生成方法。
2 . 生体分子対の情報に該生体分子対が形成される条件を含む生体分子連鎖デー タベースを用いてコネクト検索を行う工程を含む、 分子機能ネットワークの生成 方法。
3 . 疾患に関係する情報をグループ化及びノ又は階層化されたデータ項目として 保存し、 該データ項目間の関連付け情報を保存した病態連鎖データベースを用い てコネクト検索を行う工程を含む、 分子機能ネットワークの生成方法。
4 . 生体分子連鎖データベースを用いて、 関係コード、 関係機能コード、 信頼性 コード、 作用臓器、 及び生体分子対の方向性からなる群から選ばれるデータ項目 を含む 1又は 2以上のデータ項目に条件を設定することにより、 生体分子対にフ ィルターをかけてコネクト検索を行う工程を含む、 分子機能ネットワークの生成 方法。
5 . 生体分子連鎖データベースを用いてコネクト検索により生成した分子機能ネ ットワークを、 関係コード、 関係機能コード、 信頼性コード、 作用臓器、 及び生 体分子対の方向性からなる群から選ばれるデータ項目を含む 1又は 2以上のデー タ項目に基づいてスコァ付けする工程をさらに含む請求の範囲第 1項ないし第 4 項のいずれか 1項に記載の方法。
6 . 請求の範囲第 1項ないし第 5項のいずれか 1項に記載の方法を用いて疾患背 景遺伝子を解析する方法。
7 . 請求の範囲第 1項ないし第 5項のいずれか 1項に記載の方法を用いて 2以上 の疾患間の関連性を解析する方法。
8 . 請求の範囲第 1項ないし第 5項のいずれか 1項に記載の方法を用いて医薬分 子情報データベース及び/又は医薬分子一生体分子連鎖データベースを作成して 医薬分子の作用メカニズム及び/又は副作用を予測する方法。
PCT/JP2003/002847 2002-03-11 2003-03-11 Method of forming molecule function network Ceased WO2003077159A1 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
EP03708546A EP1492019A4 (en) 2002-03-11 2003-03-11 METHOD FOR FORMING A MOLECULAR FUNCTION NETWORK
CA002478963A CA2478963A1 (en) 2002-03-11 2003-03-11 Method of generating molecule-function network
US10/506,610 US20060004706A1 (en) 2002-03-11 2003-03-11 Method of forming molecule function network
JP2003575304A JPWO2003077159A1 (ja) 2002-03-11 2003-03-11 分子機能ネットワークの生成方法
CN038107031A CN1653454B (zh) 2002-03-11 2003-03-11 分子功能网络的生成方法
AU2003213457A AU2003213457A1 (en) 2002-03-11 2003-03-11 Method of forming molecule function network

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002064994 2002-03-11
JP2002/64994 2002-03-11

Publications (1)

Publication Number Publication Date
WO2003077159A1 true WO2003077159A1 (en) 2003-09-18

Family

ID=27800225

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/002847 Ceased WO2003077159A1 (en) 2002-03-11 2003-03-11 Method of forming molecule function network

Country Status (8)

Country Link
US (1) US20060004706A1 (ja)
EP (1) EP1492019A4 (ja)
JP (3) JPWO2003077159A1 (ja)
CN (2) CN1653454B (ja)
AU (1) AU2003213457A1 (ja)
CA (1) CA2478963A1 (ja)
TW (1) TW200306096A (ja)
WO (1) WO2003077159A1 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008102658A1 (ja) 2007-02-23 2008-08-28 Fujitsu Limited 分子ネットワーク分析支援プログラム、該プログラムを記録した記録媒体、分子ネットワーク分析支援装置、および分子ネットワーク分析支援方法
WO2009044459A1 (ja) * 2007-10-02 2009-04-09 Fujitsu Limited 分析支援プログラム、分析支援装置、および分析支援方法
JP2010224913A (ja) * 2009-03-24 2010-10-07 Mitsubishi Space Software Kk 遺伝子解析装置、遺伝子解析プログラムおよび遺伝子解析装置の遺伝子解析方法
WO2014054526A1 (ja) * 2012-10-01 2014-04-10 独立行政法人科学技術振興機構 承認予測装置、承認予測方法、および、プログラム
JP2016099674A (ja) * 2014-11-18 2016-05-30 国立研究開発法人産業技術総合研究所 薬剤探索装置、薬剤探索方法およびプログラム
KR20250004243A (ko) 2023-06-29 2025-01-07 가부시키가이샤 프론테오 패스웨이 분석 장치, 패스웨이 분석 방법 및 패스웨이 분석 프로그램
KR20250001857A (ko) 2023-06-27 2025-01-07 가부시키가이샤 프론테오 패스웨이 해석 장치, 패스웨이 해석 방법 및 패스웨이 해석 프로그램

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030045067A (ko) * 2000-09-12 2003-06-09 가부시키가이샤 이야쿠 분지 셋케이 겐쿠쇼 분자 기능 네트워크의 생성방법
JPWO2004088564A1 (ja) * 2003-03-31 2006-07-06 株式会社医薬分子設計研究所 分子機能ネットワークの表示方法
EP1810202A4 (en) * 2004-09-29 2008-08-13 Inst Med Molecular Design Inc METHOD FOR DISPLAYING MOLECULE FUNCTION NETWORK
CN103049678B (zh) * 2012-11-23 2015-09-09 中国科学院自动化研究所 基于蛋白质交互作用网络的异病同治分子机理分析方法
JP2016151827A (ja) * 2015-02-16 2016-08-22 キヤノン株式会社 情報処理装置、情報処理方法、情報処理システム、およびプログラム
CN111243658B (zh) * 2020-01-07 2022-07-22 西南大学 一种基于深度学习的生物分子网络构建与优化方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5911138A (en) * 1993-06-04 1999-06-08 International Business Machines Corporation Database search facility having improved user interface
US5787279A (en) * 1995-12-22 1998-07-28 International Business Machines Corporation System and method for conformationally-flexible molecular recognition
US5764644A (en) * 1996-01-02 1998-06-09 Lucent Technologies Inc. Method and apparatus for transport of communication signals over a public network
US5991765A (en) * 1997-05-06 1999-11-23 Birdstep Technology As System and method for storing and manipulating data in an information handling system
EP1008572A1 (en) * 1997-07-03 2000-06-14 ITAI, Akiko Method for inferring protein functions with the use of ligand data base
US6470277B1 (en) * 1999-07-30 2002-10-22 Agy Therapeutics, Inc. Techniques for facilitating identification of candidate genes
KR20030045067A (ko) * 2000-09-12 2003-06-09 가부시키가이샤 이야쿠 분지 셋케이 겐쿠쇼 분자 기능 네트워크의 생성방법
EP1810202A4 (en) * 2004-09-29 2008-08-13 Inst Med Molecular Design Inc METHOD FOR DISPLAYING MOLECULE FUNCTION NETWORK

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HUKAGAWA ET AL.: "Idenshi seigyo network kochiku shien no tame no workbench system no kaihatsu", THE TISSUE CULTURE ENGINEERING, vol. 27, no. 2, 25 February 2001 (2001-02-25), pages 67-71 - 84, XP002968474 *
HUKAGAWA: "Idenshi network kaiseki no tame no platform", DAI 18 KAI BIOTECHNOLOGY SYMPOSIUM YOKOSHU, 28 September 2000 (2000-09-28), pages 18 - 21, XP002968475 *
See also references of EP1492019A4 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008102658A1 (ja) 2007-02-23 2008-08-28 Fujitsu Limited 分子ネットワーク分析支援プログラム、該プログラムを記録した記録媒体、分子ネットワーク分析支援装置、および分子ネットワーク分析支援方法
US8818732B2 (en) 2007-02-23 2014-08-26 Fujitsu Limited Molecular network analysis support method and apparatus
WO2009044459A1 (ja) * 2007-10-02 2009-04-09 Fujitsu Limited 分析支援プログラム、分析支援装置、および分析支援方法
US8244480B2 (en) 2007-10-02 2012-08-14 Fujitsu Limited Computer product, analysis support apparatus, and analysis support method
JP5099142B2 (ja) * 2007-10-02 2012-12-12 富士通株式会社 分析支援プログラム、分析支援装置、および分析支援方法
JP2010224913A (ja) * 2009-03-24 2010-10-07 Mitsubishi Space Software Kk 遺伝子解析装置、遺伝子解析プログラムおよび遺伝子解析装置の遺伝子解析方法
WO2014054526A1 (ja) * 2012-10-01 2014-04-10 独立行政法人科学技術振興機構 承認予測装置、承認予測方法、および、プログラム
JP2016099674A (ja) * 2014-11-18 2016-05-30 国立研究開発法人産業技術総合研究所 薬剤探索装置、薬剤探索方法およびプログラム
KR20250001857A (ko) 2023-06-27 2025-01-07 가부시키가이샤 프론테오 패스웨이 해석 장치, 패스웨이 해석 방법 및 패스웨이 해석 프로그램
JP7656284B1 (ja) 2023-06-27 2025-04-03 株式会社Fronteo パスウェイ解析装置、パスウェイ解析方法およびパスウェイ解析プログラム
KR20250004243A (ko) 2023-06-29 2025-01-07 가부시키가이샤 프론테오 패스웨이 분석 장치, 패스웨이 분석 방법 및 패스웨이 분석 프로그램

Also Published As

Publication number Publication date
EP1492019A4 (en) 2005-11-16
CN1653454B (zh) 2010-05-05
US20060004706A1 (en) 2006-01-05
AU2003213457A1 (en) 2003-09-22
JP2010092492A (ja) 2010-04-22
CN101661501A (zh) 2010-03-03
JPWO2003077159A1 (ja) 2005-07-07
TW200306096A (en) 2003-11-01
CN1653454A (zh) 2005-08-10
CA2478963A1 (en) 2003-09-18
JP2012027939A (ja) 2012-02-09
EP1492019A1 (en) 2004-12-29

Similar Documents

Publication Publication Date Title
JP2012027939A (ja) 分子機能ネットワークの生成方法
JPWO2002023395A1 (ja) 分子機能ネットワークの生成方法
US20030113756A1 (en) Methods of providing customized gene annotation reports
Ren et al. Comprehensive survey of target prediction web servers for Traditional Chinese Medicine
Kamisoglu et al. Understanding physiology in the continuum: integration of information from multiple-omics levels
Bajikar et al. Multiscale models of cell signaling
Zuo et al. Unveiling the pathogenesis of psychiatric disorders using network models
Wang et al. NP-TCMtarget: A network pharmacology platform for exploring mechanisms of action of traditional Chinese medicine
Ahmed et al. Integrated ML-based strategy identifies drug repurposing for idiopathic pulmonary fibrosis
JP4305878B2 (ja) 医薬分子の副作用の推定方法及び創薬ターゲットの推定方法
JP2022099245A (ja) 創薬標的タンパク質の予測方法、創薬標的タンパク質の予測システム
Guzzi et al. Non parametric differential network analysis: a tool for unveiling specific molecular signatures
Kenn et al. Molecular dynamics identifies semi-rigid domains in the PD-1 checkpoint receptor bound to its natural ligand PD-L1
Singh et al. Combined Multiomics and In Silico Approach Uncovers PRKAR1A as a Putative Therapeutic Target in Multi-Organ Dysfunction Syndrome
Wang et al. thematicGO: A Keyword-Based Framework for Interpreting Gene Ontology Enrichment via Biological Themes
Yu et al. Molecular circuit discovery for mechanobiology of cardiovascular disease
Zhong et al. Innovative Application of Medicinal Insects: Employing UHPLC-MS, Bioinformatics, In Silico Studies and In Vitro Experiments to Elucidate the Multi-Target Hemostatic Mechanism of Glenea cantor (Coleoptera: Cerambycidae) Charcoal-Based Medicine
Bellenson Expression data and the bioinformatics challenges
Satish et al. Trailblazing Contemporary Frameworks for Drug Repurposing: A Saga on Drugs’ Expedition to Disinter the Veiled Destiny
De Filippis et al. Missense Variants in Nutrition-Related Genes: A Computational Study
Hossain et al. Network-Based Identification of Shared Targets and Repurposable Drugs in Type-2 Diabetes Mellitus-Associated Dementia: A Systematic Network Pharmacology and Molecular Docking Study
Li et al. Multi-omics modality completion and knowledge distillation for drug response prediction in cervical cancer
Li et al. Modeling the causal mechanism between genotypes and phenotypes using large-scale biobank data and context-specific regulatory networks
Ji Application of reverse docking in traditional Chinese medicine research
Morris et al. Toxicogenomics and RNA-seq

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NI NO NZ OM PH PL PT RO RU SC SD SE SG SK SL TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2003575304

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2478963

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2003708546

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 20038107031

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 2003708546

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2006004706

Country of ref document: US

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 10506610

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 10506610

Country of ref document: US