WO2022191459A1 - 약물 설계 방법 및 이를 이용한 디바이스 - Google Patents
약물 설계 방법 및 이를 이용한 디바이스 Download PDFInfo
- Publication number
- WO2022191459A1 WO2022191459A1 PCT/KR2022/002340 KR2022002340W WO2022191459A1 WO 2022191459 A1 WO2022191459 A1 WO 2022191459A1 KR 2022002340 W KR2022002340 W KR 2022002340W WO 2022191459 A1 WO2022191459 A1 WO 2022191459A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- compound
- biological target
- candidate
- binding affinity
- drug
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/10—Analysis or design of chemical reactions, syntheses or processes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/092—Reinforcement learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional [2D] or three-dimensional [3D] molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Definitions
- the present invention relates to a drug design method and a device using the same, and more particularly, to a drug design method based on structural characteristics of a drug and a device for drug design using the same.
- the inventors of the present invention tried to evaluate the suitability of a candidate drug in consideration of the structural characteristics of the drug, particularly the binding affinity with the target, as a way to solve the problems of the conventional drug design system.
- the inventors of the present invention by using a reinforcement learning model, in a docking simulation environment, a target-candidate material to select a material that receives the maximum compensation according to the binding energy of the material. did.
- the inventors of the present invention came to design a new drug design system configured to evaluate structural suitability for drugs.
- the inventors of the present invention designed a reward function based on the binding energy of a target-candidate substance, and from this design an agent network that generates a molecule expected to interact with a biological target.
- a reward function based on the binding energy of a target-candidate substance
- the inventors of the present invention do not simply increase the number of molecules constituting the compound to increase affinity with respect to the reinforcement-learned compound generation model, but rather the unit atoms constituting the compound (e.g., C, H, O, etc.). ) was increased, it was attempted to learn to maximize the increasing binding affinity.
- the unit atoms constituting the compound e.g., C, H, O, etc.
- Such a reinforcement learning compound generation model which can appear in a generative model trained to increase the total binding energy by simply increasing the number of molecules constituting the compound, and a simple bonding model of the reinforcement learning model, mode collapse (Mode collapse) ) can be resolved.
- the inventors of the present invention tried to design a reinforcement learning generative model to generate a compound having a binding affinity in common to two or more biological targets (eg, a plurality of target proteins) according to the modification of the reward function. .
- the inventors of the present invention were able to recognize that it is possible to selectively obtain compounds having high binding affinity to a single target and low binding affinity to other targets by modifying the reward function. Accordingly, the inventors of the present invention could expect a therapeutic effect of a plurality of diseases or a selective therapeutic effect for a single drug by providing a candidate drug having inhibitory ability against a plurality of targets or having a target-selective inhibitory ability.
- the inventors of the present invention have found that the new drug design system based on such a reinforcement learning model is not previously trained by artificial intelligence, that is, for a new biological target (or its ligand) without data, existing drugs It could be expected that it could provide a candidate material similar to that of
- the inventors of the present invention could expect that a novel drug design system could contribute to research for improving a global pandemic situation such as coronavirus infection 19 (COVID-19).
- COVID-19 coronavirus infection 19
- an object of the present invention is to provide a drug design method and device configured to generate a candidate drug using a reward according to binding affinity based on a reinforcement learning model.
- the method is a drug design method implemented by a processor and a communication unit, comprising the steps of: receiving, through the communication unit, a structure for a biological target; performing reinforcement learning using binding affinity with a biological target on a compound generation model that has been previously trained to output the molecular structure of a similar compound by inputting the molecular structure as an input; generating a candidate compound for the biological target using the learned compound generation model, and providing the candidate compound.
- the generating of the candidate compound includes: generating a plurality of candidate compounds using a reinforcement-learned compound generation model; determining binding affinity for a biological target and each of the plurality of candidate compounds; and determining, from among a plurality of candidate compounds, a candidate compound for a biological target based on the binding affinity for each.
- the step of determining the binding affinity for each includes, in a docking simulation environment, using a compensation function configured to evaluate binding energy with a biological target, each It may include the step of determining a reward score for the. Also, the determining of the candidate compound may include determining the candidate compound for the biological target from among the plurality of candidate compounds based on the reward score.
- the determining of the candidate compound may include determining, among a plurality of candidate compounds, a compound having a maximum reward score as a candidate compound for a biological target.
- the compensation function may be configured to evaluate the binding affinity based on a distribution of previously received binding energies of a standard biological target and a standard compound.
- the reward function may be configured to determine the binding affinity score as a value between 0 and 1.
- the reward function may be configured such that the lower the binding affinity with the biological target, the higher the reward score.
- the determining of the candidate compound may further include determining a candidate compound having a low binding affinity to the biological target from among the plurality of candidate compounds based on the reward score.
- the method before performing reinforcement learning, receiving the molecular structure of the learning compound, converting the molecular structure of the learning compound into a SMILES (Simplified molecular-input line-entry system) code for learning.
- the method may further include: receiving the SMILES code for training as an input, and training the compound generation model to output a SMILES code similar to the compound for training.
- the generating of the candidate compound includes: generating a plurality of SMILES codes using a reinforcement-learned compound generation model; based on the plurality of SMILES codes, determining a plurality of candidate compounds determining a binding affinity for each of the biological target and the plurality of candidate compounds, and determining, from among the plurality of candidate compounds, a candidate compound for the biological target based on the binding affinity for each can
- the enhanced compound generation model may include an agent network.
- performing reinforcement learning may include updating the agent network with a reward function configured to evaluate binding affinity based on binding energy with the biological target.
- the biological target is an activity of a specific region of a virus, a virus protein, for example, Coronavirus and SARS-Coronavirus (Severe acute respiratory syndrome coronavirus) It may be at least one of a main protease (Mpro) and a polymerase associated with it.
- a virus protein for example, Coronavirus and SARS-Coronavirus (Severe acute respiratory syndrome coronavirus) It may be at least one of a main protease (Mpro) and a polymerase associated with it.
- Mpro main protease
- the device includes a communication unit configured to receive a rescue for a biological target, and a processor configured to communicate with the communication unit.
- the processor receives the molecular structure of the compound as an input and outputs the molecular structure of the similar compound as an input to obtain the reinforcement-learned compound generation model, and the processor performs a binding affinity with the biological target for the previously learned compound generation model. affinity) to perform reinforcement learning, generate a candidate compound for a biological target using the reinforcement-learned compound generation model, and provide a candidate compound.
- the processor generates a plurality of candidate compounds using the reinforcement trained compound generation model, determines a binding affinity for each of a biological target and a plurality of candidate compounds, and has a binding affinity for each Based on the figure, it may be further configured to determine a candidate compound for the biological target from among a plurality of candidate compounds.
- the processor determines, in a docking simulation environment, a reward score for each, using a reward function configured to evaluate a binding energy with a biological target, and a reward and determining a candidate compound for the biological target from among the plurality of candidate compounds based on the score.
- the processor may be further configured to determine a compound having a maximum reward score among the plurality of candidate compounds as a candidate compound for the biological target.
- the compensation function may be configured to evaluate the binding affinity based on a distribution of previously received binding energies of a standard biological target and a standard compound.
- the reward function may be configured to determine the binding affinity score as a value between 0 and 1.
- the reward function may be configured such that the lower the binding affinity with the biological target, the higher the reward score.
- the processor may be further configured to determine a candidate compound having a low binding affinity to the biological target from among the plurality of candidate compounds based on the reward score.
- the communication unit is further configured to receive the molecular structure of the compound for learning, and the processor converts the molecular structure of the compound for learning into a SMILES (Simplified molecular-input line-entry system) code for learning, It may be further configured to train the compound generation model to output a SMILES code similar to the training compound by taking the training SMILES code as an input.
- SMILES Simple molecular-input line-entry system
- the processor generates a plurality of SMILES codes by using the reinforcement-learned compound generation model, determines a plurality of candidate compounds based on the plurality of SMILES codes, and determines a biological target and a plurality of and determining a binding affinity for each of the candidate compounds, and determining, from among the plurality of candidate compounds, a candidate compound for a biological target based on the binding affinity for each.
- the enhanced compound generation model may include an agent network.
- the processor may be further configured to update the agent network with a compensation function configured to evaluate the binding affinity based on the binding energy with the biological target.
- the biological target is a specific region of a virus, a viral protein, such as a coronavirus (Coronavirus) and SARS- Proliferation of a coronavirus (Severe acute respiratory syndrome coronavirus) It may be one of the main protease (Mpro) and polymerase associated with
- the present invention uses a neural network-based generative model to randomly generate molecules of a candidate substance, and overcomes the limitations of a conventional drug design system based on generating a candidate substance therefrom. There is an effect that can be done.
- the present invention can supplement the conventional drug design system, which requires considerable time and cost in the discovery of candidate substances for a target whose structure is not well known, that is, the initial stage of discovery of drug candidates.
- the present invention using a reinforcement learning model, in a docking simulation environment, a target-candidate substance that is configured to select a substance that receives a maximum reward according to the binding energy of the substance,
- a drug design system can be provided.
- the present invention can provide a new substance similar to an existing drug for a new biological target that the new drug design system based on the reinforcement learning model has not previously trained in artificial intelligence, that is, there is no data.
- the present invention can provide a reliable design result with less time and cost than the conventional drug design system.
- the present invention can provide a number of new and effective compounds having high binding affinity to a biological target, thereby contributing to an increase in the efficiency of de novo drug design.
- the present invention has an effect that can contribute to research for improving the global pandemic situation.
- the effect according to the present invention is not limited by the contents exemplified above, and more various effects are included in the present invention.
- 1A is a schematic diagram for explaining a drug design system according to an embodiment of the present invention.
- 1B is a schematic diagram of the configuration of a device for drug design according to an embodiment of the present invention.
- 1C is a schematic diagram illustrating a user mobile device receiving information from a device for drug design according to an embodiment of the present invention.
- FIG. 2A is a schematic flowchart for explaining a drug design method according to an embodiment of the present invention.
- 2B exemplarily illustrates a procedure of reinforcement learning according to an embodiment of the present invention.
- 2C shows activity data of the ChEMBL database for designing a reward function applied to a reinforcement learning compound generation model used in various embodiments of the present invention.
- 2D exemplarily illustrates a procedure in which a candidate compound is determined by a drug design procedure according to an embodiment of the present invention.
- FIG. 3 exemplarily shows a pre-learning procedure of a compound generation model used in various embodiments of the present invention.
- 5A to 5D show evaluation results of the reinforcement learning compound generation model used in various embodiments of the present invention.
- 6A and 6B are diagrams comparing characteristics of candidate compounds generated by each of the reinforcement-learned compound generation model and the pre-trained compound generation model used in various embodiments of the present invention.
- biological target may refer to a target that causes a disease or any symptom, and whose activity or production (or synthesis) is to be inhibited.
- the biological target may be a virus itself or a viral protein, but is not limited thereto.
- the biological target is a main protease (Mpro), or RNA-dependent RNA polymerase (RNA-dependent), which is associated with the proliferation of a coronavirus or SARS-coronavirus (Severe acute respiratory syndrome coronavirus).
- RNA polymerase RdRp
- the biological target may be a substance whose structure (in particular, protein structure) is known.
- the term “candidate compound” may refer to a compound that binds to a biological target and blocks the pathogenesis by inhibiting the activity or production of the biological target.
- the candidate compound may refer to a candidate substance that binds to a key site (especially, a protease, a polymerase) associated with the proliferation or activity of a virus, inhibits its activity, or blocks the penetration pathway of the virus.
- a key site especially, a protease, a polymerase
- a candidate compound may be used interchangeably with a candidate drug and a candidate substance.
- a candidate compound may be interpreted as having the same meaning as a ligand.
- binding affinity may refer to the degree of binding of a compound and a biological target.
- the binding affinity may correspond to the binding energy, but is not limited thereto.
- a compound having high binding affinity to a biological target may refer to a compound that binds to a biological target with high binding energy in a docking simulation environment. Furthermore, this can inhibit the activity of a biological target, which may mean that it is highly likely to be a candidate drug, which can also inhibit the activity of a target virus.
- compound generation model may refer to a model previously trained to output the molecular structure of a similar compound by inputting the molecular structure of the compound as an input.
- the compound generation model may be interpreted in the same way as the previously learned compound generation model.
- the molecular structure of the compound input to the compound generation model may be in the form of a Simplified molecular-input line-entry system (SMILES) code, but is not limited thereto.
- SILES Simplified molecular-input line-entry system
- the compound generation model may be configured to output similar SMILES codes by inputting SMILES codes for biologically active molecules obtained from the ChEMBL database, which provides information on biologically active molecules with a plurality of drug-like properties. can be learned
- the compound generation model may be a generative model based on a machine learning algorithm that generates a molecular structure (or SMILES code) of a new compound by learning the distribution and characteristics of an existing compound.
- the compound generation model is at least one of a Long Short Term Memory networks (LSTM) model, a Recurrent Neural Network (RNN) model, a Convolution Neural Network (CNN) model, a Gated Recurrent Unit (GRU) model, and a Transformer model.
- LSTM Long Short Term Memory networks
- RNN Recurrent Neural Network
- CNN Convolution Neural Network
- GRU Gated Recurrent Unit
- the compound generation model may be an LSTM model, but is not limited thereto.
- the term “reinforcement trained compound generation model” may refer to a model having a trained agent such that a reward is maximized according to binding affinity to a biological target.
- the reinforcement-learned compound generation model is trained to generate a highly appropriate compound expected to interact with a biological target based on a reward function based on binding energy with the biological target-candidate compound.
- the reinforcement-learned compound generation model is a compound with high binding affinity according to the structure of the biological target by the reward function, unlike the compound generation model trained to randomly generate a compound (or a previously learned compound generation model). It may be a model that has been reinforcement trained to generate
- the reinforcement learning compound generation model does not simply increase the affinity by increasing the number of molecules constituting the compound, but when the unit atoms (eg, C, H, O, etc.) constituting the compound increase, It may be a model trained to maximize increasing binding affinity.
- the reinforcement-learned compound generation model may be a model trained so that the level of increase in binding affinity as the unit atom increases is maximized.
- Such a reinforcement learning compound generation model which can appear in a generative model trained to increase the total binding energy by simply increasing the number of molecules constituting the compound, and a simple bonding model of the reinforcement learning model, mode collapse (Mode collapse) ) can be resolved.
- the reinforcement-learned compound generation model may be trained in a direction to increase binding force in common with respect to two or more biological targets (eg, a plurality of target proteins). That is, the reinforcement-learned compound generation model may provide a candidate drug having inhibitory ability against a plurality of targets, and thus may provide a therapeutic effect for a plurality of diseases.
- the reinforcement-learned compound generation model may be selectively trained by increasing the binding ability to another biological target while lowering the binding ability to one biological target.
- the “compensation function” may refer to a function designed to evaluate the binding energy of a biological target and a compound.
- the compensation function may refer to a function of binding affinity between a biological target and a compound in a docking simulation environment.
- the binding affinity ( B ( A )) of the biological target and the compound may be calculated by the following [Equation 1].
- the binding affinity may have a value between 0 and 1.
- Equation 1 may be an equation designed to calculate the degree of binding chipping based on the distribution of activity data of biological targets and ligands (compounds) obtained from a database of known bioactive molecules.
- the binding affinity may be determined by more various methods.
- standard biological target may be known biologically active molecules having drug-like properties obtainable from a database such as ChEMBL, and “binding energy of a standard compound” is obtained from a database such as ChEMBL. It may mean the activation energy of a possible biologically active molecule.
- the compensation of the compound generation model may be determined based on the following [Equation 2].
- the quantitative estimate of drug-likeness is a quantitative estimate of drug similarity, and may be a parameter capable of changing a weight.
- a compound generation model that has a learned agent and is reinforcement-trained to receive a maximum reward according to binding affinity can generate a candidate compound suitable for a biological target than the previous compound generation model.
- various weights may be applied to the QED value of the reward function, so that the compound generation model excludes compounds with low affinity, or selectively targets one biological target. It is also possible to generate compounds having a low binding affinity to and a high binding affinity to other biological targets. Furthermore, the compound generation model may generate a compound having high binding affinity to a plurality of biological targets.
- FIGS. 1A to 1C a device for drug design according to various embodiments of the present invention will be described in detail with reference to FIGS. 1A to 1C .
- the drug design system 1000 may be a system configured to provide information on a candidate drug having an inhibitory ability against a biological target.
- the drug design system 1000 is configured to determine a candidate compound based on the binding affinity of the biological target and the compound, the user's mobile device 200 and the biological target or compound for drug design. It may be configured as an information providing server 300 that provides a variety of information.
- the device for drug design 100 includes a general-purpose computer, laptop, and/or data server that performs various calculations to evaluate a drug based on data on a biological target or compound provided from the information providing server 300 .
- the user mobile device 200 may be a device for accessing a web server providing a web page for a candidate drug or a mobile web server providing a mobile web site, but limited thereto doesn't happen
- the device for drug design 100 receives data on the structure of the biological target provided from the information providing server 300 , and uses the artificial intelligence algorithm-based compound generation model to bind affinity between the received biological target and the compound. By determining the degree, it can be configured to provide a compound with high binding affinity as a candidate compound.
- the device for drug design 100 may provide data obtained by analyzing a candidate drug for a biological target to the user mobile device 200 .
- the data provided from the device 100 for drug design may be provided as a web page through a web browser installed in the user mobile device 200, or may be provided in the form of an application or program. In various embodiments, such data may be provided in a form included in the platform in a client-server environment.
- the user mobile device 200 is an electronic device that requests a drug design for a biological target and provides a user interface for displaying analysis result data, such as a smartphone, a tablet PC (Personal Computer), a notebook computer, and/or a PC and the like.
- a smartphone a tablet PC (Personal Computer), a notebook computer, and/or a PC and the like.
- the user mobile device 200 may receive the candidate drug analysis result for the biological target from the drug design device 100 , and display the received result through the display unit.
- the analysis result may include the structure of the candidate compound having high binding affinity with the biological target, its SMILES code, binding affinity (or reward score), and the like.
- the candidate compound may be plural.
- the device for drug design 100 includes a storage unit 110 , a communication unit 120 , and a processor 130 .
- the storage 110 may store various data for evaluating a candidate drug for a biological target.
- the storage unit 110 is a flash memory type, hard disk type, multimedia card micro type, card type memory (eg, SD or XD memory, etc.), RAM, SRAM, ROM, EEPROM, PROM, magnetic memory.
- a magnetic disk, and an optical disk may include at least one type of storage medium.
- the communication unit 120 connects the device for drug design 100 to be able to communicate with an external device.
- the communication unit 120 may be connected to the user mobile device 200 and further the information providing server 300 using wired/wireless communication to transmit/receive various data.
- the communication unit 120 may receive data about a structure for a biological target, furthermore, a disclosed compound such as ChEMBL from the information providing server 300 .
- the communication unit 120 may transmit the analysis result to the user mobile device 200 .
- the processor 130 is operatively connected to the storage unit 110 and the communication unit 120 , and may perform various instructions for analyzing a candidate drug for a biological target.
- the processor 130 may receive a structure for the biological target from the information providing server 300 through the communication unit 120 and provide a compound having high binding energy with the biological target as a candidate compound in a docking simulation environment. have.
- the processor 130 is a biological target-based on a reward function based on binding energy with the candidate compound, based on a reinforcement-learned compound generation model to generate a highly appropriate compound expected to interact with the biological target. can do.
- the user may be provided with a novel compound that inhibits activity against a biological target whose structure is only known, or inhibits replication thereof, through the user mobile device 200 .
- the user can reduce the time and cost required in the initial stage of discovering drug candidate substances.
- the present invention can provide a number of novel (novelty) and effective (validity) compounds having high binding affinity to a biological target, thereby contributing to an increase in the efficiency of de novo drug design.
- the user mobile device 200 includes a communication unit 210 , a display unit 220 , a storage unit 230 , and a processor 240 .
- the communication unit 210 connects the user mobile device 200 to enable communication with an external device.
- the communication unit 210 may be connected to the device 100 for drug design using wired/wireless communication to transmit/receive various data.
- the communication unit 210 may receive the analysis result associated with the biological target from the device for drug design 100 .
- the display unit 220 may display various interface screens for displaying analysis results related to the biological target.
- the display unit 220 may include a touch screen, for example, a touch, gesture, proximity, drag, swipe using an electronic pen or a part of the user's body. A swipe or hovering input may be received.
- the storage 230 may store various data used to provide a user interface for displaying result data.
- the storage unit 230 may include a flash memory type, a hard disk type, a multimedia card micro type, and a card type memory (eg, SD or XD). memory, etc.), RAM (Random Access Memory, RAM), SRAM (Static Random Access Memory), ROM (Read-Only Memory, ROM), EEPROM (Electrically Erasable Programmable Read-Only Memory), PROM (Programmable Read-Only Memory) , a magnetic memory, a magnetic disk, and an optical disk may include at least one type of storage medium.
- the processor 240 is operatively connected to the communication unit 210 , the display unit 220 , and the storage unit 230 , and may perform various commands for providing a user interface for displaying result data.
- a molecular structure for a biological target is received ( S210 ). Then, reinforcement learning is performed on the compound generation model (S220), and a candidate compound for a biological target is generated by the reinforcement learning model (S230). Finally, a result is provided (S240).
- step S210 in which a molecular structure for a biological target is received, a protein structure for a biological target such as a viral protein (eg, Mpro) is received.
- a viral protein eg, Mpro
- step S220 using the binding affinity with a biological target for a compound generation model that has been previously trained to output the molecular structure of a similar compound by inputting the molecular structure of the compound as an input Reinforcement learning is performed.
- a prior likelihood is determined from an initial network of the pre-trained compound generation model 410, and an agent After the sequence is generated from an agent network 420, an Agent Likelihood is determined. At the same time, the SMILES code is generated, and the binding affinity with the received biological target is determined. Then, by a reward function 430 designed to evaluate the binding energy of the biological target and the compound, the agent is trained to generate the compound with the maximum reward, and the learned content is updated to generate the reinforcement-learned compound A model can be created.
- the compensation function may be a formula designed to calculate the degree of binding chipping based on the distribution of activity data of a biological target and a ligand (compound) obtained from a database of known bioactive molecules.
- the scaled binding energy (or pre-reward score) from the active data of the ChEMBL database rarely has a high value of 0.5 or more, and is generally It appears to be distributed with low values.
- the binding energy before normalization has a minimum value of -15.21 kcal/mol and appears to be relatively evenly distributed.
- the compensation function is a value between 0 and 1, assuming that the binding energy range is 0 to -15.21 kcal/mol, based on the binding energy distribution obtained from actual biological target-compound activity experimental data such as the ChEMBL database. It can be configured to scale to .
- the compensation function may be calculated by the following Equation (1).
- a compound generation model in which reinforcement learning is performed that is, a learned agent, may be constructed.
- the step S220 in which reinforcement learning is performed is not limited to the above-described procedure and is not generated.
- reinforcement learning may be performed on a compound generation model that receives a SMILES code representing the molecular structure of a compound as an input and outputs a similar SMILE code as an output.
- the compound generation model may be trained to receive a high reward score when generating a new SMILES code having a high binding affinity with a previously received biological target.
- step of generating the candidate compound (S230) for a plurality of candidate compounds randomly generated by the compound generation model, binding affinity with a biological target is determined, and based on the binding affinity, a plurality of Among the candidate compounds, a candidate compound for a biological target is determined.
- a plurality of candidate compounds are randomly generated in the compound generation model ( S2100 ). Then, in a docking simulation environment, a reward score for each may be determined by a reward function configured to evaluate binding energy with a biological target ( S2200 ). Next, a candidate compound for the biological target may be determined from among the plurality of candidate compounds based on the reward score ( S2300 ).
- the compound having the maximum reward score among the plurality of compounds, the compounds having the highest reward score, or the compounds having a reward score higher than or equal to a predetermined level are biologically Can be determined as a candidate compound (or candidate drug) for a target.
- a candidate compound having high binding affinity with respect to the plurality of biological targets may be determined according to a preset reward function. That is, in the step of determining the candidate compound ( S2300 ), a candidate compound having inhibitory ability against a plurality of targets and thus providing a therapeutic effect on a plurality of diseases may be provided.
- a candidate compound having a low binding ability to one biological target and high binding ability to another biological target may be selectively determined according to a preset compensation function.
- the candidate compound for the biological target may be finally determined based on the binding affinity in a method similar to the reinforcement learning procedure, but is not limited thereto.
- the plurality of randomly generated candidate compounds themselves are compounds having high binding affinity with the biological target.
- a plurality of randomly generated candidate compounds in the step (S2300) of determining a candidate compound may be determined as a final candidate compound having high binding affinity to a biological target.
- compounds having high binding affinity to the biological target may be provided as candidate compounds.
- the present invention can contribute to increase the efficiency of new drug development (de novo drug design).
- the present invention can provide a new substance similar to an existing drug for a new biological target that the new drug design system based on the reinforcement learning model has not previously trained in artificial intelligence, that is, there is no data. Accordingly, the present invention can provide a reliable design result with less time and cost than the conventional drug design system.
- the compound generation model is at least one of a Long Short Term Memory networks (LSTM) model, a Recurrent Neural Network (RNN) model, a Convolution Neural Network (CNN) model, a Gated Recurrent Unit (GRU) model, and a Transformer model.
- LSTM Long Short Term Memory networks
- RNN Recurrent Neural Network
- CNN Convolution Neural Network
- GRU Gated Recurrent Unit
- the compound generation model may be an LSTM model, but is not limited thereto.
- a molecular structure of a learning compound is received ( S310 ). Then, the molecular structure of the learning compound is converted into a SMILES code (S320). Next, the artificial intelligence algorithm-based compound generation model is trained to output a SMILES code similar to the structure of the learning compound by inputting the SMILES code of the learning compound (S330).
- the molecular structure of the learning compound may be received from the ChEMBL database that provides information on biologically active molecules having a plurality of drug-like properties. Then, in the step (S320) in which the molecular structure of the compound is converted into a SMILES code, a SMILES code for the pre-existing compound may be generated. Finally, in the learning step ( S330 ), the compound generation model may be trained to output a similar SMILES code by inputting the SMILES code for the biologically active molecules obtained from the ChEMBL database as an input.
- the molecular structure (or SMILES code) of a new compound is generated, which is a machine learning algorithm-based generative model, pre-trained.
- a compound production model can be built.
- the pre-trained compound generation model is an input layer that receives a SMILES code, an embedding layer that generates an embedded vector from the input SMILES code, three stages An encoding layer composed of LSTM of , and a decoding layer that outputs a new SMILE code through fully connected.
- a new SMILES code may be output through softmax.
- the structure and learning method of the pre-trained compound generation model are not limited to those described above.
- the reinforcement learning compound generation model is configured to biologically target the main protease (Mpro) or RNA-dependent RNA polymerase (RdRp) associated with the proliferation of coronavirus to generate a candidate compound with high binding affinity therefor.
- Mpro main protease
- RdRp RNA-dependent RNA polymerase
- the biological target is not limited thereto, and may be a site (or region) in which a structure associated with virus activity or proliferation is known.
- FIG. 5A a learning curve according to the number of step repetitions of reinforcement learning for a compound generation model is shown.
- the three candidate compounds for coronavirus Mpro, generated by the reinforcement learning compound generation model are, respectively, -12.17 kcal/mol, - It appears to have high binding energies of 11.26 kcal/mol and -11.1 kcal/mol, and high reward scores of 0.8, 0.74 and 0.73.
- RdRp coronavirus RNA-dependent RNA polymerase
- the generic name (Generic Name) is shown.
- These 17 compounds may have inhibitory activity on polymerases associated with the activity of coronavirus, and thus may serve as candidates for the treatment of coronavirus infection.
- the reinforcement-learned compound generation model used in various embodiments of the present invention can provide a novel compound having a high binding energy associated with a reaction with a biological target as a candidate drug. That is, such a candidate drug may bind to a biological target with high affinity and inhibit its activity.
- a reinforcement learning compound generation model applied to various embodiments of the present invention, that is, a model having a trained agent network and a model prior to reinforcement learning having a prior network Characteristics of the compounds generated from each (ie, pre-trained models) are shown in comparison.
- the reinforcement-learned compound generation model applied to various embodiments of the present invention is different from the pre-trained model to bind to the coronavirus Mpro, fluorine (F), carbon (C), oxygen ( There is a tendency to add O) to the compound.
- the reinforcement learning compound generation model applied to various embodiments of the present invention has a tendency to add metalloid elements of boron (B) and selenium (Se) differently from the pre-trained model. appears to be low.
- these results may mean that the reinforcement-learned compound generation model applied to various embodiments of the present invention generates a compound having an improved structure than the pre-trained compound generation model.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Databases & Information Systems (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Bioethics (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
본 발명은, 프로세서 및 통신부에 의해 구현되는 약물 설계 방법으로서, 통신부를 통해, 생물학적 표적 (biological target) 에 대한 구조를 수신하는 단계, 프로세서를 통해, 강화 학습된 화합물 생성 모델을 획득하도록, 화합물의 분자 구조를 입력으로 하여 유사 화합물의 분자 구조를 출력하도록 선행 학습된, 화합물 생성 모델에 대하여, 생물학적 표적과의 결합 친화도 (binding affinity) 를 이용하여 강화 학습 (reinforcement learning) 을 수행하는 단계, 강화 학습된 화합물 생성 모델을 이용하여, 생물학적 표적에 대한 후보 화합물을 생성하는 단계, 및 상기 후보 화합물을 제공하는 단계를 포함하는, 약물 설계 방법 방법 및 이를 이용한 디바이스를 제공한다.
Description
본 발명은 약물 설계 방법 및 이를 이용한 디바이스에 관한 것으로, 보다 구체적으로는 약물의 구조적 특징에 기초한 약물 설계 방법 및 이를 이용한 약물 설계용 디바이스에 관한 것이다.
약물의 설계와 관련하여, 약물의 작용 경로에 대한 연구는 지속적으로 수행되어 왔다. 표현형 선별에서부터 시판 후 부작용 감시에 이르기까지 수 많은 보고서와 후속 연구가 이루어져왔다. 하지만, 약물 작용에 대한 설계는 약물의 의도된 치료 효과, 또는 빈번히 발생되는 부작용에 대한 연구에 치중되어 있고, 이로 인해 의도치 않은 약물의 효과에 대한 작용 메커니즘을 해독하는 일에 있어서는 많은 어려움이 있다.
이때, 약물 작용의 이해, 새로운 약물 효과의 발견 또는 부작용의 예측과 같은 약물 설계에 있어서는 약물 작용에 대한 비편향적인 분석 방법에 기초한 연구가 필요하다.
한편, 약리 유전학, 약물 유발 유전자 발현 프로파일 및 약물 부작용 정보 등을 포함하는 문헌, 자료 등을 포함하는 약물 데이터베이스가 급속히 성장하는 것으로 보고되어 왔다. 동시에, 이러한 약물 데이터베이스를 이용하여 약물 설계의 필요성이 대두되고 있으며, 약물 데이터베이스에 대한 접근성 및 사용성을 강화한 약물 설계 방법이 조명 받고 있다. 이때, 약물 데이터베이스에 기초한 설계 방법은 시간 및 비용 효율성 측면에서 매우 뛰어나고, 체계적인 구현을 통한 재현 가능성이 높을 수 있다.
이와 같이, 데이터베이스에 기초한 약물 설계는 후보 물질 발굴에 적용될 수 있지만, 아직까지 적절한 방법이 제시되지 못하고 있는 실정이다.
이에, 약물 데이터베이스에 기초한 새로운 약물 설계 방법에 대한 설계가 지속적으로 요구되고 있는 실정이다.
발명의 배경이 되는 기술은 본 발명에 대한 이해를 보다 용이하게 하기 위해 작성되었다. 발명의 배경이 되는 기술에 기재된 사항들이 선행기술로 존재한다고 인정하는 것으로 이해되어서는 안 된다.
약물 설계와 관련하여, 약물의 화학적 성질 (chemical property) 에 근거하여 약물의 표적, 화학 구조 및 부작용의 약물 작용을 예측하려는 시도가 있어 왔다. 이러한 약물의 설계는 신약 설계에 있어서 유용하지만, 약물의 내재적 메커니즘에 의존하는 경향이 있다. 상기와 같은 약물 설계는 실제 임상 단계에서 저조한 표적 (예를 들어, 바이러스 단백질) 과의 상호작용에 따른 문제를 야기할 수 있다.
약물 설계와 더욱 관련하여, 뉴럴 네트워크 (neural network) 기반 생성 모델 (generative model) 을 이용하여, 후보 물질의 분자를 무작위로 생성하고, 이로부터 후보 물질을 발굴하려는 시도가 있었다. 그러나, 그 구조가 잘 알려지지 않은 표적에 대한 후보 물질 발굴, 즉 초기 의약품 후보 물질 단계에서 소요되는 시간 및 비용이 상당하다는 문제가 존재할 수 있다.
한편, 본 발명의 발명자들은 종래의 약물 설계 시스템이 갖는 문제점을 해결하기 위한 방안으로, 약물의 구조적 특징, 특히 표적과의 결합 친화도 (binding affinity) 를 고려하여 후보 약물의 적정성을 평가하고자 하였다.
관련하여, 본 발명의 발명자들은, 강화 학습 (reinforcement learning) 모델을 이용하여, 도킹 시뮬레이션 (docking simulation) 환경에서 표적-후보 물질의 결합 에너지 (binding energy) 에 따른 보상을 최대로 받는 물질을 선별하고자 하였다.
그 결과, 본 발명의 발명자들은 약물에 대하여 구조적 적정성을 평가하도록 구성된 새로운 약물 설계 시스템을 설계하기에 이르렀다.
보다 구체적으로, 본 발명의 발명자들은 표적-후보 물질의 결합 에너지 기반의 보상 함수 (reward function) 를 설계하였고, 이로부터 생물학적 표적과 상호 작용할 것으로 예상되는 분자를 생성하는 에이전트 네트워크 (agent network) 를 설계할 수 있었다.
특히, 본 발명의 발명자들은 강화 학습된 화합물 생성 모델에 대하여, 단순히 화합물을 이루는 분자의 수를 늘려 친화도를 증가시키는 것이 아니라, 화합물을 이루는 단위 원자 (예를 들어, C, H, O, 등) 가 증가될 때, 증가하는 결합 친화도가 최대가 되도록 학습시키고자 하였다.
그 결과, 단위 원자가 증가함에 따른 결합 친화도의 증가 수준이 최대가 되도록 학습된 강화 학습된 화합물 생성 모델이 구축될 수 있었다.
이러한, 강화 학습된 화합물 생성 모델은, 화합물을 구성하는 분자의 숫자를 단순 증가시켜 총 결합 에너지를 증가시키도록 학습된 생성 모델 및 강화 학습 모델의 단순 결합 모델에서 나타날 수 있는, 모드 붕괴 (Mode collapse) 의 경향성을 해결할 수 있다.
또한, 본 발명의 발명자들은, 보상 함수의 변형에 따라, 두 개 이상의 생물학적 표적 (예를 들어, 복수의 표적 단백질) 에 대하여 공통으로 결합력을 갖는 화합물을 생성하도록 강화 학습된 생성 모델을 설계하고자 하였다. 또한, 본 발명의 발명자들은, 보상 함수의 변형에 따라, 선택적으로 단일의 표적에 대하여 결합 친화도가 높고, 다른 표적에 대하여 결합 친화도가 낮은 화합물의 획득이 가능함을 인지할 수 있었다. 이에, 본 발명의 발명자들은, 복수의 표적에 대한 저해능을 갖거나, 표적 선택적 저해능의 후보 약물을 제공함으로써, 단일의 약물에 대한 복수의 질환의 치료 효과, 또는 선택적 치료 효과를 기대할 수 있었다.
더욱이, 본 발명의 발명자들은, 이와 같은 강화 학습 모델 기반의 새로운 약물 설계 시스템이 기존에 인공지능에 따로 학습 시키지 않은, 즉 데이터가 없는 새로운 생물학적 표적 (또는 이의 리간드 (ligand)) 에 대하여, 기존 약물과 유사한 후보 물질을 제공할 수 있음을 기대할 수 있었다.
특히, 본 발명의 발명자들은, 새로운 약물 설계 시스템이, 코로나 바이러스 감염증 19 (COVID-19) 와 같은 글로벌 펜데믹 (global pandemic) 상황을 개선하기 위한 연구에 기여할 수 있음을 기대할 수 있었다.
나아가, 본 발명의 발명자들은 후보 약물 및 표적에 대한 작용 메커니즘 및 구조적 특징을 모두 고려하여 약물간 적정성을 평가할 수 있어, 종래의 약물 설계 시스템보다 약물에 대한 신뢰도 높은 설계 결과를 제공할 수 있음을 기대할 수 있었다.
따라서, 본 발명이 해결하고자 하는 과제는, 강화 학습 모델 기반의 결합 친화도에 따른 보상을 이용하여 후보 약물을 생성하도록 구성된, 약물 설계 방법 및 디바이스를 제공하는 것이다.
본 발명의 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른 약물 설계 방법을 제공한다. 상기 방법은, 프로세서 및 통신부에 의해 구현되는 약물 설계 방법으로서, 통신부를 통해, 생물학적 표적 (biological target) 에 대한 구조를 수신하는 단계, 프로세서를 통해, 강화 학습된 화합물 생성 모델을 획득하도록, 화합물의 분자 구조를 입력으로 하여 유사 화합물의 분자 구조를 출력하도록 선행 학습된, 화합물 생성 모델에 대하여, 생물학적 표적과의 결합 친화도 (binding affinity) 를 이용하여 강화 학습 (reinforcement learning) 을 수행하는 단계, 강화 학습된 화합물 생성 모델을 이용하여, 생물학적 표적에 대한 후보 화합물을 생성하는 단계, 및 후보 화합물을 제공하는 단계를 포함할 수 있다.
본 발명의 특징에 따르면, 후보 화합물을 생성하는 단계는, 강화 학습된 화합물 생성 모델을 이용하여, 복수의 후보 화합물을 생성하는 단계, 생물학적 표적 및 복수의 후보 화합물 각각에 대한 결합 친화도를 결정하는 단계, 및 각각에 대한 결합 친화도에 기초하여, 복수의 후보 화합물 중, 생물학적 표적에 대한 후보 화합물을 결정하는 단계를 포함할 수 있다.
본 발명의 다른 특징에 따르면, 각각에 대한 결합 친화도를 결정하는 단계는, 도킹 시뮬레이션 (docking simulation) 환경에서, 생물학적 표적과의 결합 에너지 (binding energy) 를 평가하도록 구성된 보상 함수를 이용하여, 각각에 대한 보상 점수를 결정하는 단계를 포함할 수 있다. 또한, 후보 화합물을 결정하는 단계는, 보상 점수에 기초하여 복수의 후보 화합물 중, 생물학적 표적에 대한 후보 화합물을 결정하는 단계를 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, 후보 화합물을 결정하는 단계는, 복수의 후보 화합물 중 보상 점수가 최대인 화합물을, 생물학적 표적에 대한 후보 화합물로 결정하는 단계를 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, 보상 함수는, 기수신된 표준 생물학적 표적 및 표준 화합물의 결합 에너지의 분포에 기초하여, 상기 결합 친화도를 평가하도록 구성될 수 있다.
본 발명의 또 다른 특징에 따르면, 보상 함수는, 0 내지 1 사이의 값으로 상기 결합 친화도 점수를 결정하도록 구성될 수 있다.
본 발명의 또 다른 특징에 따르면, 보상 함수는, 생물학적 표적과의 결합 친화도가 낮을 수록 높은 보상 점수를 받도록 구성될 수 있다. 또한, 후보 화합물을 결정하는 단계는, 보상 점수에 기초하여 상기 복수의 후보 화합물 중, 상기 생물학적 표적과 결합 친화도가 낮은 후보 화합물을 결정하는 단계를 더 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, 강화 학습을 수행하는 단계 이전에, 학습용 화합물의 분자 구조를 수신하는 단계, 학습용 화합물의 분자 구조를 학습용 SMILES (Simplified molecular-input line-entry system) 코드로 변환하는 단계, 및 학습용 SMILES 코드를 입력으로 하여, 학습용 화합물과 유사한 SMILES 코드를 출력하도록, 상기 화합물 생성 모델을 학습시키는 단계를 더 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, 후보 화합물을 생성하는 단계는, 강화 학습된 화합물 생성 모델을 이용하여, 복수의 SMILES 코드를 생성하는 단계, 복수의 SMILES 코드를 기초로, 복수의 후보 화합물 결정하는 단계, 생물학적 표적 및 복수의 후보 화합물 각각에 대한 결합 친화도를 결정하는 단계, 및 각각에 대한 결합 친화도에 기초하여, 복수의 후보 화합물 중, 생물학적 표적에 대한 후보 화합물을 결정하는 단계를 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, 강화된 화합물 생성 모델은, 에이전트 네트워크 (agent network) 를 포함할 수 있다. 또한, 강화 학습을 수행하는 단계는, 생물학적 표적과의 결합 에너지에 기초하여 결합 친화도를 평가하도록 구성된 보상 함수를 이용하여, 에이전트 네트워크를 업데이트하는 단계를 포함할 수 있다.
본 발명의 또 다른 특징에 따르면, 생물학적 표적은, 바이러스 (virus) 의 특정 영역, 바이러스 단백질 (virus protein), 예를 들어 코로나바이러스 (Coronavirus) 및 사스-코로나바이러스 (Severe acute respiratory syndrome coronavirus) 의 활성과 연관된 메인 프로테아제 (main protease; Mpro), 폴리머라아제 (polymerase) 중 적어도 하나일 수 있다.
전술한 바와 같은 과제를 해결하기 위하여 본 발명의 일 실시예에 따른 약물 설계용 디바이스가 제공된다. 상기 디바이스는, 생물학적 표적 (biological target) 에 대한 구조를 수신하도록 구성된, 통신부, 및 상기 통신부와 통신하도록 구성된 프로세서를 포함한다. 이때, 프로세서는, 강화 학습된 화합물 생성 모델을 획득하도록, 화합물의 분자 구조를 입력으로 하여 유사 화합물의 분자 구조를 출력하도록 선행 학습된, 화합물 생성 모델에 대하여, 생물학적 표적과의 결합 친화도 (binding affinity) 를 이용하여 강화 학습 (reinforcement learning) 을 수행하고, 강화 학습된 화합물 생성 모델을 이용하여, 생물학적 표적에 대한 후보 화합물을 생성하고, 후보 화합물을 제공하도록 구성된다.
본 발명의 특징에 따르면, 프로세서는, 강화 학습된 화합물 생성 모델을 이용하여, 복수의 후보 화합물을 생성하고, 생물학적 표적 및 복수의 후보 화합물 각각에 대한 결합 친화도를 결정하고, 각각에 대한 결합 친화도에 기초하여, 복수의 후보 화합물 중, 상기 생물학적 표적에 대한 후보 화합물을 결정하도록 더 구성될 수 있다.
본 발명의 다른 특징에 따르면, 프로세서는, 도킹 시뮬레이션 (docking simulation) 환경에서, 생물학적 표적과의 결합 에너지 (binding energy) 를 평가하도록 구성된 보상 함수를 이용하여, 각각에 대한 보상 점수를 결정하고, 보상 점수에 기초하여 상기 복수의 후보 화합물 중, 상기 생물학적 표적에 대한 후보 화합물을 결정하도록 더 구성될 수 있다.
본 발명의 또 다른 특징에 따르면, 프로세서는, 복수의 후보 화합물 중 보상 점수가 최대인 화합물을, 생물학적 표적에 대한 후보 화합물로 결정하도록 더 구성될 수 있다.
본 발명의 또 다른 특징에 따르면, 보상 함수는, 기수신된 표준 생물학적 표적 및 표준 화합물의 결합 에너지의 분포에 기초하여, 상기 결합 친화도를 평가하도록 구성될 수 있다.
본 발명의 또 다른 특징에 따르면, 보상 함수는, 0 내지 1 사이의 값으로 상기 결합 친화도 점수를 결정하도록 구성될 수 있다.
본 발명의 또 다른 특징에 따르면, 보상 함수는, 생물학적 표적과의 결합 친화도가 낮을 수록 높은 보상 점수를 받도록 구성될 수 있다. 이때, 프로세서는, 보상 점수에 기초하여 복수의 후보 화합물 중, 생물학적 표적과 결합 친화도가 낮은 후보 화합물을 결정하도록 더 구성될 수 있다.
본 발명의 또 다른 특징에 따르면, 통신부는, 학습용 화합물의 분자 구조를 수신하도록 더 구성되고, 프로세서는, 학습용 화합물의 분자 구조를 학습용 SMILES (Simplified molecular-input line-entry system) 코드로 변환하고, 학습용 SMILES 코드를 입력으로 하여, 상기 학습용 화합물과 유사한 SMILES 코드를 출력하도록, 상기 화합물 생성 모델을 학습하도록 더 구성될 수 있다.
본 발명의 또 다른 특징에 따르면, 프로세서는, 강화 학습된 화합물 생성 모델을 이용하여, 복수의 SMILES 코드를 생성하고, 복수의 SMILES 코드를 기초로, 복수의 후보 화합물 결정하고, 생물학적 표적 및 복수의 후보 화합물 각각에 대한 결합 친화도를 결정하고, 각각에 대한 결합 친화도에 기초하여, 상기 복수의 후보 화합물 중, 생물학적 표적에 대한 후보 화합물을 결정하도록 더 구성될 수 있다.
본 발명의 또 다른 특징에 따르면, 강화된 화합물 생성 모델은, 에이전트 네트워크 (agent network) 를 포함할 수 있다. 이때, 프로세서는, 생물학적 표적과의 결합 에너지에 기초하여 상기 결합 친화도를 평가하도록 구성된 보상 함수를 이용하여, 상기 에이전트 네트워크를 업데이트하도록 더 구성될 수 있다.
본 발명의 또 다른 특징에 따르면, 생물학적 표적은, 바이러스 (virus) 의 특정 영역, 바이러스 단백질 (virus protein), 예를 들어 코로나바이러스 (Coronavirus) 및 사스-코로나바이러스 (Severe acute respiratory syndrome coronavirus) 의 증식과 연관된 메인 프로테아제 (main protease; Mpro), 폴리머라아제 (polymerase) 중 하나일 수 있다.
이하, 실시예를 통하여 본 발명을 보다 상세히 설명한다. 다만, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것에 불과하므로 본 발명의 범위가 이들 실시예에 의해 한정되는 것으로 해석되어서는 아니 된다.
본 발명은, 뉴럴 네트워크 (neural network) 기반 생성 모델 (generative model) 을 이용하여, 후보 물질의 분자를 무작위로 생성하고, 이로부터 후보 물질을 생성하는 것에 기초한 종래의 약물 설계 시스템이 갖는 한계를 극복할 수 있는 효과가 있다.
보다 구체적으로, 본 발명은, 구조가 잘 알려지지 않은 표적에 대한 후보 물질 발굴, 즉 초기 의약품 후보 물질 발굴 단계에서 소요되는 시간 및 비용이 상당한 종래의 약물 설계 시스템을 보완할 수 있다.
특히, 본 발명은, 강화 학습 (reinforcement learning) 모델을 이용하여, 도킹 시뮬레이션 (docking simulation) 환경에서 표적-후보 물질의 결합 에너지 (binding energy) 에 따른 보상을 최대로 받는 물질을 선별하도록 구성된, 새로운 약물 설계 시스템을 제공할 수 있다.
이에, 본 발명은, 강화 학습 모델 기반의 새로운 약물 설계 시스템이 기존에 인공지능에 따로 학습 시키지 않은, 즉 데이터가 없는 새로운 생물학적 표적에 대하여, 존재하는 약물과 유사한 신규 물질을 제공할 수 있다.
이에, 본 발명은, 종래의 약물 설계 시스템보다, 적은 소요 시간 및 비용으로 신뢰도 높은 설계 결과를 제공할 수 있다.
특히, 본 발명은, 생물학적 표적에 대하여 결합 친화도가 높은, 새롭고 유효한 다수의 화합물을 제공할 수 있어, 신약 개발 (de novo drug design) 의 효율 증대에 기여할 수 있다.
더욱이, 본 발명은 글로벌 펜데믹 (global pandemic) 상황을 개선하기 위한 연구에 기여할 수 있는 효과가 있다.
본 발명에 따른 효과는 이상에서 예시된 내용에 의해 제한되지 않으며, 더욱 다양한 효과들이 본 발명 내에 포함되어 있다.
도 1a은 본 발명의 일 실시예에 따른 약물 설계 시스템을 설명하기 위한 개략도이다.
도 1b는 본 발명의 일 실시예에 따른 약물 설계용 디바이스의 구성의 개략도이다.
도 1c는 본 발명의 일 실시예에 따른 약물 설계용 디바이스로부터 정보를 제공받는 사용자 모바일 디바이스를 설명하기 위한 개략도이다.
도 2a는 본 발명의 일 실시예에 따른 약물 설계 방법을 설명하기 위한 개략적인 순서도이다.
도 2b는 본 발명의 일 실시예에 따른 강화 학습의 절차를 예시적으로 도시한 것이다.
도 2c는 본 발명의 다양한 실시예에 이용되는 강화 학습된 화합물 생성 모델에 적용되는 보상 함수의 설계를 위한 ChEMBL 데이터베이스의 활성 데이터를 도시한 것이다.
도 2d는 본 발명의 일 실시예에 따른 약물 설계 절처에 의해 후보 화합물이 결정되는 절차를 예시적으로 도시한 것이다.
도 3은 본 발명의 다양한 실시예에 이용되는 화합물 생성 모델의 사전 학습 절차를 예시적으로 도시한 것이다.
도 4는 본 발명의 다양한 실시예에 이용되는 화합물 생성 모델의 구조를 예시적으로 도시한 것이다.
도 5a 내지 5d는 본 발명의 다양한 실시예에 이용되는 강화 학습된 화합물 생성 모델의 평가 결과를 도시한 것이다.
도 6a 및 6b는 본 발명의 다양한 실시예에 이용되는 강화 학습된 화합물 생성 모델 및 사전 학습된 화합물 생성 모델 각각에 의해 생성된 후보 화합물의 특징을 비교하여 도시한 것이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
비록 제1, 제2 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
본 발명의 여러 실시예들의 각각 특징들이 부분적으로 또는 전체적으로 서로 결합 또는 조합 가능하며, 당업자가 충분히 이해할 수 있듯이 기술적으로 다양한 연동 및 구동이 가능하며, 각 실시예들이 서로에 대하여 독립적으로 실시 가능할 수도 있고 연관 관계로 함께 실시 가능할 수도 있다.
본 명세서의 해석의 명확함을 위해, 이하에서는 본 명세서에서 사용되는 용어들을 정의하기로 한다.
본원 명세서 내에서 이용되는 용어 “생물학적 표적”은, 질환 또는 어떠한 증상을 야기하는 것으로서, 이의 활성 또는 생성 (또는, 합성) 을 억제하고자 하는 대상을 의미할 수 있다.
바람직하게, 생물학적 표적은 바이러스 그 자체 또는 바이러스 단백질일 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 생물학적 표적은 코로나바이러스 (Coronavirus) 또는 사스-코로나바이러스 (Severe acute respiratory syndrome coronavirus) 의 증식과 연관된, 메인 프로테아제 (main protease; Mpro), 또는 RNA-의존 RNA 폴리머라아제 (RNA-dependent RNA polymerase; RdRp) 일 수 있다.
본 발명의 특징에 따르면, 생물학적 표적은 그 구조 (특히, 단백질 구조) 가 공지된 물질일 수 있다.
본원 명세서 내에서 이용되는 용어 “후보 화합물”은, 생물학적 표적에 결합하여 생물학적 표적의 활성 또는 생성을 억제하여 병인을 차단하는 화합물을 의미할 수 있다.
예를 들어, 후보 화합물은 바이러스의 증식 또는 활성과 연관된 핵심 부위 (특히, 프로테아제, 폴리머라아제) 에 결합하여, 이의 활성을 억제하거나, 바이러스의 침투 경로를 차단하는 후보 물질을 의미할 수 있다.
본원 명세서에서, 후보 화합물은, 후보 약물, 후보 물질과 상호 교환적으로 이용될 수 있다.
나아가, 후보 화합물은, 리간드 (ligand) 와 동일한 의미로 해석될 수도 있다.
본원 명세서 내에서 이용되는 용어 “결합 친화도”는 화합물 및 생물학적 표적의 결합 정도를 의미할 수 있다.
한편, 결합 친화도는 결합 에너지에 대응할 수 있으나, 이에 제한되는 것은 아니다.
예를 들어, 생물학적 표적과의 결합 친화도가 높은 화합물은, 도킹 시뮬레이션 환경에서 생물학적 표적과 높은 결합 에너지로 결합하는 화합물을 의미할 수 있다. 나아가, 이는 생물학적 표적의 활성을 억제할 수 있어, 표적 바이러스의 활성을 또한 억제할 수 있는, 후보 약물일 확률이 높다는 것을 의미할 수 있다.
본원 명세서 내에서 이용되는 용어 “화합물 생성 모델”은, 화합물의 분자 구조를 입력으로 하여 유사 화합물의 분자 구조를 출력하도록 선행 학습된 모델을 의미할 수 있다.
즉, 본원 명세서 내에서 화합물 생성 모델은, 선행 학습된 화합물 생성 모델과 동일하게 해석될 수 있다.
이때, 화합물 생성 모델에 입력되는 화합물의 분자 구조는, SMILES (Simplified molecular-input line-entry system) 코드 형태일 수 있으나, 이에 제한되는 것은 아니다.
예를 들어, 화합물 생성 모델은, 복수의 약물-유사 특성을 갖는 생물학적 활성 분자들에 대한 정보를 제공하는 ChEMBL 데이터베이스로부터 획득된 생물학적 활성 분자들에 대한 SMILES 코드를 입력으로 하여 유사한 SMILES 코드를 출력하도록 학습될 수 있다.
즉, 화합물 생성 모델은 기존에 존재하는 화합물의 분포와 특성을 학습하여, 새로운 화합물의 분자 구조 (또는, SMILES 코드) 를 생성하는, 머신러닝 알고리즘 기반의 생성 (generative) 모델일 수 있다.
이때, 화합물 생성 모델은, LSTM (Long Short Term Memory networks) 모델, RNN (Recurrent Neural Network) 모델, CNN (Convolution Neural Network) 모델, GRU (Gated Recurrent Unit) 모델, 및 트랜스포머 (Transformer) 모델 중 적어도 하나일 수 있다.
본 발명의 특징에 따르면, 화합물 생성 모델은, LSTM 모델일 수 있으나, 이에 제한되는 것은 아니다.
본원 명세서 내에서 이용되는 용어 “강화 학습된 화합물 생성 모델”은, 생물학적 표적에 대한 결합 친화도에 따라 보상이 최대가 되도록 학습된 에이전트 (trained agent) 를 갖는 모델을 의미할 수 있다.
보다 구체적으로, 강화 학습된 화합물 생성 모델은, 생물학적 표적-후보 화합물과의 결합 에너지 (binding energy) 기반의 보상 함수에 기초하여, 생물학적 표적과 상호 작용할 것으로 예상되는 적정성 높은 화합물을 생성하도록, 학습된 모델일 수 있다.
즉, 강화 학습된 화합물 생성 모델은, 무작위로 화합물을 생성하도록 학습된 화합물 생성 모델 (또는, 선행 학습된 화합물 생성 모델) 과 달리, 보상 함수에 의해 생물학적 표적의 구조에 따라 결합 친화도가 높은 화합물을 생성하도록 강화 학습된 모델일 수 있다.
이때, 강화 학습된 화합물 생성 모델은, 단순히 화합물을 이루는 분자의 수를 늘려 친화도를 증가시키는 것이 아니라, 화합물을 이루는 단위 원자 (예를 들어, C, H, O, 등) 가 증가될 때, 증가하는 결합 친화도가 최대가 되도록 학습된 모델일 수 있다.
즉, 강화 학습된 화합물 생성 모델은, 단위 원자가 증가함에 따른 결합 친화도의 증가 수준이 최대가 되도록 학습된 모델일 수 있다.
이러한, 강화 학습된 화합물 생성 모델은, 화합물을 구성하는 분자의 숫자를 단순 증가시켜 총 결합 에너지를 증가시키도록 학습된 생성 모델 및 강화 학습 모델의 단순 결합 모델에서 나타날 수 있는, 모드 붕괴 (Mode collapse) 의 경향성을 해결할 수 있다.
또한, 강화 학습된 화합물 생성 모델은, 두 개 이상의 생물학적 표적 (예를 들어, 복수의 표적 단백질) 에 대하여 공통으로 결합력을 높이는 방향으로 학습될 수 있다. 즉, 강화 학습된 화합물 생성 모델은, 복수의 표적에 대한 저해능의 후보 약물을 제공할 수 있어, 복수의 질환에 대한 치료 효과를 제공할 수도 있다.
나아가, 강화 학습된 화합물 생성 모델은, 선택적으로 하나의 생물학적 표적에 대한 결합력은 낮추면서 다른 생물학적 표적에 대한 결합력은 높이는 방법으로 학습될 수 있다.
이러한 생물학적 표적은, 학습 보상 함수의 설계에 따라 다양하게 설정될 수 있다. 여기서, “보상 함수”는, 생물학적 표적과 화합물의 결합 에너지 (binding energy) 를 평가하도록 설계된 함수를 의미할 수 있다.
보다 구체적으로, 보상 함수는, 도킹 시뮬레이션 (docking simulation) 환경에서 생물학적 표적과 화합물의 결합 친화도를 함수화한 것을 의미할 수 있다.
예를 들어, 생물학적 표적과 화합물의 결합 친화도 (B(A))는 하기의 [수학식 1]에 의해 산출될 수 있다.
[수학식 1]
B(A) = max (결합 에너지/화합물의 경험적 최소 결합 에너지, 0)
이때, 결합 친화도는 0 내지 1 사이의 값을 가질 수 있다. 관련하여, 수학식 1은, 공지된 바이오 활성 분자의 데이터베이스로부터 획득된, 생물학적 표적 및 리간드 (화합물) 의 활성 데이터의 분포에 기초하여 결합 칩화도를 산출하도록 설계된 수식일 수 있다. 그러나, 이에 제한되지 않고 결합 친화도는 보다 다양한 방법에 의해 결정될 수 있다.
즉, 본 명세서에서 사용된 용어, “표준 생물학적 표적”은, ChEMBL과 같은 데이터베이스로부터 획득 가능한 약물 유사 특성을 갖는 공지된 생물학적 활성 분자들일 수 있고 “표준 화합물의 결합 에너지”는 ChEMBL과 같은 데이터베이스로부터 획득 가능한 생물학적 활성 분자의 활성 에너지를 의미할 수 있다.
한편, 화합물 생성 모델의 보상은, 하기 [수학식 2]를 기준으로 결정될 수 있다.
[수학식 2]
QED*0.1 + [도킹 프리 에너지]*0.9
여기서, QED (quantitative estimate of drug-likeness) 는 약물 유사성의 정량 추정값으로, 가중치를 변경시킬 수 있는 파라미터일 수 있다.
즉, 학습된 에이전트를 갖고, 결합 친화도에 따른 보상을 최대로 받도록 강화 학습된 화합물 생성 모델은, 이전의 화합물 생성 모델보다 생물학적 표적에 적합한 후보 화합물을 생성할 수 있다.
한편, 이에 제한되지 않고, 보상 함수의 QED 값에 다양한 가중치 (예를 들어, - 가중치) 가 적용될 수 있어, 화합물 생성 모델은, 친화도가 낮은 화합물을 배제시키거나, 선택적으로 하나의 생물학적 표적에 대한 결합 친화도가 낮고, 다른 생물학적 표적에 대한 결합 친화도가 높은 화합물을 생성할 수도 있다. 나아가, 화합물 생성 모델은, 복수의 생물학적 표적에 결합 친화도가 높은 화합물을 생성할 수도 있다.
이하에서는, 도 1a 내지 도 1c를 참조하여, 본 발명의 다양한 실시예에 따른 약물 설계용 디바이스를 상세히 설명한다.
먼저, 도 1a을 참조하면, 약물 설계 시스템 (1000) 은, 생물학적 표적에 대한 억제능을 갖는 후보 약물에 대한 정보를 제공하도록 구성된 시스템일 수 있다. 이때, 약물 설계 시스템 (1000) 은, 생물학적 표적과 화합물의 결합 친화도에 기초하여, 후보 화합물을 결정하도록 구성된 약물 설계용 디바이스 (100), 사용자의 모바일 디바이스 (200) 및 생물학적 표적 또는 화합물에 대하여 다양한 정보를 제공하는 정보 제공 서버 (300) 로 구성될 수 있다.
먼저, 약물 설계용 디바이스 (100) 는 정보 제공 서버 (300) 로부터 제공된 생물학적 표적 또는 화합물에 대한 데이터를 기초로 약물을 평가하기 위해 다양한 연산을 수행하는 범용 컴퓨터, 랩탑, 및/또는 데이터 서버 등을 포함할 수 있다. 이때, 사용자 모바일 디바이스 (200) 는 후보 약물에 대한 웹 페이지를 제공하는 웹 서버 (web server) 또는 모바일 웹 사이트를 제공하는 모바일 웹 서버 (mobile web server) 에 액세스하기 위한 디바이스일 수 있으나, 이에 한정되지 않는다.
구체적으로, 약물 설계용 디바이스 (100) 는 정보 제공 서버 (300) 로부터 제공된 생물학적 표적의 구조에 대한 데이터를 수신하고, 인공지능 알고리즘 기반의 화합물 생성 모델을 이용하여 수신된 생물학적 표적과 화합물의 결합 친화도를 결정하여, 결합 친화도가 높은 화합물을 후보 화합물로 제공하도록 구성될 수 있다.
약물 설계용 디바이스 (100) 는 생물학적 표적에 대한 후보 약물을 분석한 데이터를 사용자 모바일 디바이스 (200) 로 제공할 수 있다.
이와 같이 약물 설계용 디바이스 (100) 로부터 제공되는 데이터는 사용자 모바일 디바이스 (200) 에 설치된 웹 브라우저를 통해 웹 페이지로 제공되거나, 어플리케이션, 또는 프로그램 형태로 제공될 수 있다. 다양한 실시예에서 이러한 데이터는 클라이언트-서버 환경에서 플랫폼에 포함되는 형태로 제공될 수 있다.
다음으로, 사용자 모바일 디바이스 (200) 는 생물학적 표적에 대한 약물 설계를 요청하고 분석 결과 데이터를 나타내기 위한 사용자 인터페이스를 제공하는 전자 장치로서, 스마트폰, 태블릿 PC (Personal Computer), 노트북 및/또는 PC 등 중 적어도 하나를 포함할 수 있다.
사용자 모바일 디바이스 (200) 는 약물 설계용 디바이스 (100) 로부터 생물학적 표적에 대한 후보 약물 분석 결과를 수신하고, 수신된 결과를 표시부를 통해 표시할 수 있다. 여기서, 분석 결과는, 생물학적 표적과 결합 친화도가 높은 후보 화합물의 구조, 이의 SMILES 코드, 결합 친화도 (또는, 보상 점수) 등을 포함할 수 있다. 이때, 후보 화합물은 복수일 수 있다.
다음으로, 도 1b를 참조하여, 본 발명의 약물 설계용 디바이스 (100) 의 구성 요소에 대하여 구체적으로 설명한다.
도 1b를 참조하면, 약물 설계용 디바이스 (100) 는 저장부 (110), 통신부 (120) 및 프로세서 (130) 를 포함한다.
먼저, 저장부 (110) 는 생물학적 표적에 대한 후보 약물을 평가를 위한 다양한 데이터를 저장할 수 있다. 다양한 실시예에서 저장부 (110) 는 플래시 메모리 타입, 하드디스크 타입, 멀티미디어 카드 마이크로 타입, 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램, SRAM, 롬, EEPROM, PROM, 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.
통신부 (120) 는 약물 설계용 디바이스 (100) 가 외부 장치와 통신이 가능하도록 연결한다. 통신부 (120) 는 유/무선 통신을 이용하여 사용자 모바일 디바이스 (200), 나아가 정보 제공 서버 (300) 와 연결되어 다양한 데이터를 송수신할 수 있다. 구체적으로, 통신부 (120) 는 정보 제공 서버 (300) 로부터 생물학적 표적에 대한 구조, 나아가 ChEMBL과 같은 공개된 화합물에 대한 데이터를 수신할 수 있다. 또한, 통신부 (120) 는 사용자 모바일 디바이스 (200) 에 분석 결과를 전달할 수 있다.
프로세서 (130) 는 저장부 (110) 및 통신부 (120) 와 동작 가능하게 연결되며, 생물학적 표적에 대한 후보 약물을 분석하기 위한 다양한 명령들을 수행할 수 있다.
구체적으로, 프로세서 (130) 는 통신부 (120) 를 통해 정보 제공 서버 (300) 로부터 생물학적 표적에 대한 구조를 수신하고, 도킹 시뮬레이션 환경에서 생물학적 표적과의 결합 에너지가 높은 화합물을 후보 화합물로 제공할 수 있다.
이때, 프로세서 (130) 는 생물학적 표적-후보 화합물과의 결합 에너지 (binding energy) 기반의 보상 함수에 기초하여, 생물학적 표적과 상호 작용할 것으로 예상되는 적정성 높은 화합물을 생성하도록 강화 학습된 화합물 생성 모델에 기초할 수 있다.
따라서, 사용자는 사용자 모바일 디바이스 (200) 를 통해, 구조만 알려진 생물학적 표적에 대하여 활성을 억제하거나, 이의 복제를 억제하는 신규 화합물을 제공받을 수 있다.
즉, 사용자는, 초기 의약품 후보 물질 발굴 단계에서 소요되는 시간 및 비용을 줄일 수 있다.
이와 같이 본 발명은, 생물학적 표적에 대하여 결합 친화도가 높은, 새롭고 (novelty) 유효한 (validity) 다수의 화합물을 제공할 수 있어, 신약 개발 (de novo drug design) 의 효율 증대에 기여할 수 있다.
한편, 도 1c를 함께 참조하면, 사용자 모바일 디바이스 (200) 는 통신부 (210), 표시부 (220), 저장부 (230) 및 프로세서 (240) 를 포함한다.
통신부 (210) 는 사용자 모바일 디바이스 (200) 가 외부 장치와 통신이 가능하도록 연결한다. 통신부 (210) 는 유/무선 통신을 이용하여 약물 설계용 디바이스 (100) 와 연결되어 다양한 데이터를 송수신할 수 있다. 구체적으로, 통신부 (210) 는 약물 설계용 디바이스 (100) 로부터 생물학적 표적과 연관된 분석 결과를 수신할 수 있다.
표시부 (220) 는 생물학적 표적과 연관된 분석 결과를 나타내기 위한 다양한 인터페이스 화면을 표시할 수 있다.
다양한 실시예에서 표시부 (220) 는 터치스크린을 포함할 수 있으며, 예를 들면, 전자 펜 또는 사용자의 신체의 일부를 이용한 터치 (touch), 제스처 (gesture), 근접, 드래그 (drag), 스와이프 (swipe) 또는 호버링 (hovering) 입력 등을 수신할 수 있다.
저장부 (230) 는 결과 데이터를 나타내기 위한 사용자 인터페이스를 제공하기 위해 사용되는 다양한 데이터를 저장할 수 있다. 다양한 실시예에서 저장부 (230) 는 플래시 메모리 타입 (flash memory type), 하드디스크 타입 (hard disk type), 멀티미디어 카드 마이크로 타입 (multimedia card micro type), 카드 타입의 메모리 (예를 들어 SD 또는 XD 메모리 등), 램 (Random Access Memory, RAM), SRAM (Static Random Access Memory), 롬 (Read-Only Memory, ROM), EEPROM (Electrically Erasable Programmable Read-Only Memory), PROM (Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.
프로세서 (240) 는 통신부 (210), 표시부 (220) 및 저장부 (230) 와 동작 가능하게 연결되며, 결과 데이터를 나타내기 위한 사용자 인터페이스를 제공하기 위한 다양한 명령들을 수행할 수 있다.
이하에서는, 도 2a 내지 도 2d를 참조하여, 본 발명의 다양한 실시예에 이용되는 강화 학습된 화합물 생성 모델을 이용한 후보 화합물 생성 방법에 대하여 설명한다.
먼저, 도 2a를 참조하면, 생물학적 표적에 대한 분자 구조가 수신된다 (S210). 그 다음, 화합물 생성 모델에 대한 강화 학습이 수행되고 (S220), 강화 학습된 모델에 의해 생물학적 표적에 대한 후보 화합물이 생성된다 (S230). 마지막으로, 결과가 제공된다 (S240).
보다 구체적으로, 생물학적 표적에 대한 분자 구조가 수신되는 단계 (S210) 에서, 바이러스 단백질 (예를 들어, Mpro) 과 같은 생물학적 표적에 대한 단백질 구조가 수신된다.
그 다음, 강화 학습이 수행되는 단계 (S220) 에서, 화합물의 분자 구조를 입력으로 하여 유사 화합물의 분자 구조를 출력하도록 선행 학습된, 화합물 생성 모델에 대하여, 생물학적 표적과의 결합 친화도를 이용하여 강화 학습이 수행된다.
예를 들어, 도 2b를 함께 참조하면, 강화 학습이 수행되는 단계 (S220) 에서, 사전 학습된 화합물 생성 모델 (410) 의 초기 네트워크 (prior network) 로부터 사전 가능성 (Prior Likelihood) 이 결정되고, 에이전트 네트워크 (agent network) (420) 로부터 시퀀스가 생성된 후, 에이전트 가능성 (Agent Likelihood) 이 결정된다. 동시에, SMILES 코드가 생성되고, 기수신된 생물학적 표적과의 결합 친화도 (Binding Affinity) 가 결정된다. 그 다음, 생물학적 표적과 화합물의 결합 에너지를 평가하도록 설계된 보상 함수 (reward function) (430) 에 의해, 보상이 최대로 되는 화합물을 생성하도록 에이전트 학습되고, 학습된 내용이 업데이트되면서 강화 학습된 화합물 생성 모델이 생성될 수 있다.
이때, 보상 함수는, 공지된 바이오 활성 분자의 데이터베이스로부터 획득된, 생물학적 표적 및 리간드 (화합물) 의 활성 데이터의 분포에 기초하여 결합 칩화도를 산출하도록 설계된 수식일 수 있다.
예를 들어, 2c의 (a)를 참조하면, ChEMBL 데이터베이스의 활성 데이터로부터 범위화된 결합 에너지 (Scaled Binding Energy) (또는, 사전 보상 점수) 는, 0.5 이상의 높은 값을 갖는 경우가 거의 없고 대체적으로 낮은 값으로 분포하는 것으로 나타난다. 나아가, 도 2c의 (b)를 참조하면, 표준화 (Normalization) 이전의 결합 에너지는, 최소값이 -15.21kcal/mol이고, 상대적으로 고르게 분포되어 있는 것으로 나타난다.
이때, 보상 함수는, ChEMBL 데이터베이스와 같은 실제 생물학적 표적-화합물 활성 실험 데이터로부터 획득된 결합 에너지 분포에 기초하여, 결합 에너지의 범위를 0 내지 -15.21 kcal/mol로 가정하여, 0 내지 1 사이의 값으로 스케일하도록 구성될 수 있다.
본 발명의 특징에 따르면, 보상 함수는 다음의 수학식 1에 의해 산출될 수 있다.
[수학식 1]
B(A) = max (결합 에너지/화합물의 경험적 최소 결합 에너지, 0)
그러나, 이에 제한되는 것은 아니다.
다시, 도 2a를 참조하면, 강화 학습이 수행되는 단계 (S220) 의 결과로, 강화 학습이 수행된, 즉 학습된 에이전트를 갖는 화합물 생성 모델이 구축될 수 있다.
한편, 강화 학습이 수행되는 단계 (S220), 전술한 절차에 제한되어 생성되는 것이 아니다. 예를 들어, 강화 학습이 수행되는 단계 (S220) 에서, 화합물의 분자 구조를 나타내는 SMILES 코드를 입력으로 하여 유사한 SMILE 코드를 출력으로 하는 화합물 생성 모델에 대하여 강화 학습이 수행될 수 있다. 보다 구체적으로, 강화 학습이 수행되는 단계 (S220) 에서, 화합물 생성 모델은, 기 수신된 생물학적 표적과의 결합 친화도가 높은 새로운 SMILES 코드를 생성할 때, 높은 보상 점수를 받도록 학습될 수 있다.
다음으로, 후보 화합물이 생성되는 단계 (S230) 에서, 화합물 생성 모델에 의해 무작위로 생성된 복수의 후보 화합물에 대하여, 생물학적 표적과의 결합 친화도가 결정되고, 결합 친화도에 기초하여, 복수의 후보 화합물 중, 생물학적 표적에 대한 후보 화합물이 결정된다.
보다 구체적으로, 도 2d를 함께 참조하면, 후보 화합물이 생성되는 단계 (S230) 에서, 화합물 생성 모델에 복수의 후보 화합물이 무작위로 생성된다 (S2100). 그 다음, 도킹 시뮬레이션 (docking simulation) 환경에서, 생물학적 표적과의 결합 에너지 (binding energy) 를 평가하도록 구성된 보상 함수에 의해 각각에 대한 보상 점수가 결정될 수 있다 (S2200). 그 다음, 보상 점수에 기초하여 복수의 후보 화합물 중, 생물학적 표적에 대한 후보 화합물이 결정될 수 있다 (S2300).
예를 들어, 후보 화합물이 결정되는 단계 (S2300) 에서, 복수의 화합물 중 보상 점수가 최대인 화합물 또는, 보상 점수가 상위 순위에 있는 화합물들, 또는 미리 결정된 수준 이상의 보상 점수를 갖는 화합물들이, 생물학적 표적에 대한 후보 화합물 (또는, 후보 약물) 로서 결정될 수 있다.
나아가, 생물학적 표적이 복수일 경우, 후보 화합물이 결정되는 단계 (S2300) 에서, 기설정된 보상 함수에 따라, 복수의 생물학적 표적에 대하여 결합 친화도가 높은 후보 화합물이 결정될 수 있다. 즉, 후보 화합물이 결정되는 단계 (S2300) 에서, 복수의 표적에 대한 저해능을 갖고, 이에 복수의 질환에 대한 치료 효과를 제공하는 후보 화합물을 제공할 수도 있다.
나아가, 후보 화합물이 결정되는 단계 (S2300) 에서, 기설정된 보상 함수에 따라, 택적으로 하나의 생물학적 표적에 대한 결합력이 낮으면서도, 다른 생물학적 표적에 대한 결합력은 높은 후보 화합물이 결정될 수도 있다.
이와 같이 후보 화합물이 생성되는 단계 (S230) 에서는, 강화 학습 절차와 유사한 방법으로 생물학적 표적에 대한 후보 화합물이 결합 친화도에 기초하여 최종 결정될 수 있으나, 이에 제한되는 것은 아니다. 예를 들어, 복수의 후보 화합물이 무작위로 생성되는 단계 (S2100) 에서, 강화 학습이 수행된 화합물 생성 모델로부터, 무작위로 생성된 복수의 후보 화합물 자체가 생물학적 표적과의 결합 친화도가 높은 화합물일 수 있다. 이에, 보상 점수가 결정되는 단계 (S2200) 없이, 후보 화합물이 결정되는 단계 (S2300) 에서 무작위로 생성된 복수의 후보 화합물들이 생물학적 표적과 결합 친화도가 높은 최종 후보 화합물로서 결정될 수 있다.
다시, 도 2a를 참조하면, 결과가 제공되는 단계 (S240) 에서, 생물학적 표적에 대하여 결합 친화도가 높은 화합물들이 후보 화합물로 제공될 수 있다.
즉, 상기와 같은 절차에 의해 생물학적 표적에 대하여 결합 친화도가 높은, 새롭고 유효한 다수의 화합물이 제공될 수 있다.
이에, 본 발명은, 신약 개발 (de novo drug design) 의 효율 증대에 기여할 수 있다. 특히, 본 발명은 강화 학습 모델 기반의 새로운 약물 설계 시스템이 기존에 인공지능에 따로 학습 시키지 않은, 즉 데이터가 없는 새로운 생물학적 표적에 대하여, 존재하는 약물과 유사한 신규 물질을 제공할 수 있다. 이에, 본 발명은 종래의 약물 설계 시스템보다, 적은 소요 시간 및 비용으로 신뢰도 높은 설계 결과를 제공할 수 있다.
이하에서는, 도 3 및 도 4를 참조하여, 본 발명의 다양한 실시예에 적용되는 사전 학습된 화합물 생성 모델의 학습 방법 및 이의 구조에 대하여 설명한다.
이때, 화합물 생성 모델은, LSTM (Long Short Term Memory networks) 모델, RNN (Recurrent Neural Network) 모델, CNN (Convolution Neural Network) 모델, GRU (Gated Recurrent Unit) 모델, 및 트랜스포머 (Transformer) 모델 중 적어도 하나일 수 있다.
본 발명의 특징에 따르면, 화합물 생성 모델은, LSTM 모델일 수 있으나, 이에 제한되는 것은 아니다.
먼저, 도 3을 참조하면, 본 발명의 다양한 실시예에 이용되는 약물 설계 모델의 설계를 위해, 학습용 화합물의 분자 구조가 수신된다 (S310). 그 다음 학습용 화합물의 분자 구조가 SMILES 코드로 변환된다 (S320). 그 다음, 인공지능 알고리즘 기반 화합물 생성 모델은, 학습용 화합물의 SMILES 코드를 입력으로 하여 학습용 화합물의 구조와 유사한 SMILES 코드를 출력하도록 학습된다 (S330).
예를 들어, 화합물의 분자 구조가 수신되는 단계 (S230) 에서, 복수의 약물-유사 특성을 갖는 생물학적 활성 분자들에 대한 정보를 제공하는 ChEMBL 데이터베이스로부터 학습용 화합물의 분자 구조를 수신할 수 있다. 그 다음, 화합물의 분자 구조가 SMILES 코드로 변환되는 단계 (S320) 에서, 기 존재 화합물에 대한 SMILES 코드가 생성될 수 있다. 마지막으로, 학습되는 단계 (S330) 에서, ChEMBL 데이터베이스로부터 획득된 생물학적 활성 분자들에 대한 SMILES 코드를 입력으로 하여 유사한 SMILES 코드를 출력하도록, 화합물 생성 모델이 학습될 수 있다.
즉, 상기 절차에 의해, 기존에 존재하는 화합물의 분포와 특성을 학습하여, 새로운 화합물의 분자 구조 (또는, SMILES 코드) 를 생성하는, 머신러닝 알고리즘 기반의 생성 (generative) 모델인, 사전 학습된 화합물 생성 모델이 구축될 수 있다.
이때, 도 4를 함께 참조하면, 사전 학습된 화합물 생성 모델은, SMILES 코드를 입력 받는, 입력 레이어 (input layer), 입력된 SMILES 코드로부터 임베딩된 백터를 생성하는 임베딩 레이어 (embedding layer), 3 단의 LSTM으로 이루어진 인코딩 레이어 (encoding layer), 완전 연결 (fully connected) 을 통해 새로운 SMILE 코드를 출력하는 디코딩 레이어 (decoding layer) 로 이루어질 수 있다.
보다 구체적으로, 아세톤 (Acetone) 의 SMILES 코드인 CC(=O)C가 입력 레이어를 통해 입력되면, 임베딩 레이어, 인코딩 레이어, 및 디코딩 레이어를 거친 후, softmax를 통해 새로운 SMILES 코드가 출력될 수 있다.
한편, 사전 학습된 화합물 생성 모델의 구조 및 학습 방법은 전술한 것에 제한되지 않는다.
평가: 강화 학습된 화합물 생성 모델의 평가
이하에서는 도 5a 내지 5d, 6a 및 6b를 참조하여 본 발명의 다양한 실시예에 적용되는 강화 학습된 화합물 생성 모델의 평가 결과에 대하여 설명한다.
이때, 강화 학습된 화합물 생성 모델은, 코로나바이러스의 증식과 연관된 메인 프로테아제 (Mpro) 또는 RNA-의존 RNA 폴리머라아제 (RdRp) 를 생물학적 표적으로 하여 이에 대하여 결합 친화도가 높은 후보 화합물을 생성하도록 구성될 수 있다. 그러나, 생물학적 표적은 이에 제한되지 않고, 바이러스의 활성 또는 증식과 연관된 구조가 밝혀진 부위 (또는, 영역) 일 수도 있다.
먼저, 도 5a를 참조하면, 화합물 생성 모델에 대한 강화 학습의 스텝 반복 수에 따른 학습 커브 (learning curve) 가 도시된다.
보다 구체적으로, 강화 학습을 수행할수록, 코로나바이러스 Mpro와의 결합 에너지가 향상되는 것으로 나타난다.
*도 5b의 (a), (b) 및 (c)를 함께 참조하면, 강화 학습된 화합물 생성 모델에 의해 생성된, 코로나바이러스 Mpro에 대한 3 가지 후보 화합물은 각각, -12.17 kcal/mol, -11.26 kcal/mol 및 -11.1 kcal/mol의 높은 바인딩 에너지를 갖고, 0.8, 0.74 및 0.73의 높은 보상 점수를 갖는 것으로 나타난다.
도 5c를 함께 참조하면, 본 발명의 다양한 실시예에 이용되는 강화 학습된 화합물 생성 모델에 의해 생성된, 코로나바이러스 프로테아제와 결합 친화도가 높은 화합물의 SMILES 코드와 함께, ChEMBL ID, 성분명 (일반명) (Generic Name) 이 도시된다. 이들 46 개의 화합물은, 코로나바이러스의 활성, 나아가 복제와 연관된 프로테아제에 대한 저해능을 가질 수 있어, 코로나바이러스 감염증의 치료를 위한 후보 물질로서 제공될 수 있다.
또한, 도 5d를 참조하면, 본 발명의 다양한 실시예에 이용되는 강화 학습된 화합물 생성 모델에 의해 생성된, 코로나바이러스 RNA-의존 RNA 폴리머라아제 (RdRp) 와 결합 친화도가 높은 화합물의 SMILES 코드와 함께, ChEMBL ID, 성분명 (일반명) (Generic Name) 이 도시된다. 이들 17 개의 화합물은, 코로나바이러스의 활성과 연관된 폴리머라아제에 대한 저해능을 가질 수 있어, 코로나바이러스 감염증의 치료를 위한 후보 물질로서 제공될 수 있다.
즉, 본 발명의 다양한 실시예에 이용되는 강화 학습된 화합물 생성 모델은, 생물학적 표적과의 반응과 연관된 바인딩 에너지가 높은 신규 화합물을, 후보 약물로서 제공할 수 있다. 즉, 이러한 후보 약물은, 생물학적 표적과 높은 친화도로 결합하여, 이의 활성을 억제할 수 있다.
도 6a 및 6b를 참조하면, 본 발명의 다양한 실시예에 적용되는 강화 학습된 화합물 생성 모델, 즉 학습된 에이전트 네트워크 (trained agent network) 를 갖는 모델과 초기 네트워크 (prior network) 를 갖는 강화 학습 이전 모델 (즉, 사전 학습 모델) 각각으로부터 생성된 화합물의 특징이 비교하여 도시된다.
보다 구체적으로, 도 6a 본 발명의 다양한 실시예에 적용되는 강화 학습된 화합물 생성 모델은, 사전 학습된 모델과 상이하게 코로나바이러스 Mpro에 결합하기 위해, 불소 (F), 탄소 (C), 산소 (O)를 화합물에 추가하려는 경향이 나타나다.
나아가, 도 6b를 참조하면, 본 발명의 다양한 실시예에 적용되는 강화 학습된 화합물 생성 모델은, 사전 학습된 모델과 상이하게 붕소 (B), 셀레늄 (Se) 의 준금속 원소를 추가하려는 경향성이 낮은 것으로 나타난다.
즉, 이러한 결과는, 발명의 다양한 실시예에 적용되는 강화 학습된 화합물 생성 모델이 사전 학습된 화합물 생성 모델보다 개선된 구조의 화합물을 생성하는 것을 의미할 수 있다.
이상 첨부된 도면을 참조하여 본 발명의 일 실시예들을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시예로 국한되는 것은 아니고, 본 발명의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형 실시될 수 있다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
[부호의 설명]
100: 약물 설계용 디바이스
110, 230: 저장부
120, 210: 통신부
130, 240: 프로세서
200: 사용자 모바일 디바이스
220: 표시부
410: 화합물 생성 모델
420: 에이전트 네트워크
430: 보상함수
1000: 약물 설계 시스템
[이 발명을 지원한 국가연구개발사업]
[과제고유번호] 1711106599
[과제번호] 2018R1C1B6009531
[부처명] 과학기술정보통신부
[과제관리(전문)기관명] 한국연구재단
[연구사업명] 개인기초연구(과기정통부)(R&D)
[연구과제명] 임상-병리, 딥러닝 기반 폐선암 종양 내 다양성 질환
분석 연구
[기여율] 1/1
[과제수행기관명] 연세대학교
[연구기간] 2020.03.01 ~ 2021.02.28
Claims (22)
- 프로세서 및 통신부에 의해 구현되는 약물 설계 방법으로서,상기 통신부를 통해, 생물학적 표적 (biological target) 에 대한 구조를 수신하는 단계;상기 프로세서를 통해, 강화 학습된 화합물 생성 모델을 획득하도록, 화합물의 분자 구조를 입력으로 하여 유사 화합물의 분자 구조를 출력하도록 선행 학습된, 화합물 생성 모델에 대하여, 상기 생물학적 표적과의 결합 친화도 (binding affinity) 를 이용하여 강화 학습 (reinforcement learning) 을 수행하는 단계;상기 강화 학습된 화합물 생성 모델을 이용하여, 상기 생물학적 표적에 대한 후보 화합물을 생성하는 단계, 및상기 후보 화합물을 제공하는 단계를 포함하는, 약물 설계 방법.
- 제1항에 있어서,상기 후보 화합물을 생성하는 단계는,상기 강화 학습된 화합물 생성 모델을 이용하여, 복수의 후보 화합물을 생성하는 단계;상기 생물학적 표적 및 상기 복수의 후보 화합물 각각에 대한 결합 친화도를 결정하는 단계, 및상기 각각에 대한 결합 친화도에 기초하여, 상기 복수의 후보 화합물 중, 상기 생물학적 표적에 대한 후보 화합물을 결정하는 단계를 포함하는, 약물 설계 방법.
- 제2항에 있어서,상기 각각에 대한 결합 친화도를 결정하는 단계는,도킹 시뮬레이션 (docking simulation) 환경에서, 생물학적 표적과의 결합 에너지 (binding energy) 를 평가하도록 구성된 보상 함수를 이용하여, 상기 각각에 대한 보상 점수를 결정하는 단계를 포함하고,상기 후보 화합물을 결정하는 단계는,상기 보상 점수에 기초하여 상기 복수의 후보 화합물 중, 상기 생물학적 표적에 대한 후보 화합물을 결정하는 단계를 포함하는, 약물 설계 방법.
- 제3항에 있어서,상기 후보 화합물을 결정하는 단계는,상기 복수의 후보 화합물 중 상기 보상 점수가 최대인 화합물을, 상기 생물학적 표적에 대한 후보 화합물로 결정하는 단계를 포함하는, 약물 설계 방법.
- 제3항에 있어서,상기 보상 함수는,기수신된 표준 생물학적 표적 및 표준 화합물의 결합 에너지의 분포에 기초하여, 상기 결합 친화도를 평가하도록 구성된, 약물 설계 방법.
- 제3항에 있어서,상기 보상 함수는,0 내지 1 사이의 값으로 상기 결합 친화도 점수를 결정하도록 구성된, 약물 설계 방법.
- 제3항에 있어서,상기 보상 함수는,상기 생물학적 표적과의 결합 친화도가 낮을 수록 높은 보상 점수를 받도록 구성되고,상기 후보 화합물을 결정하는 단계는,상기 보상 점수에 기초하여 상기 복수의 후보 화합물 중, 상기 생물학적 표적과 결합 친화도가 낮은 후보 화합물을 결정하는 단계를 더 포함하는, 약물 설계 방법.
- 제1항에 있어서,상기 강화 학습을 수행하는 단계 이전에,학습용 화합물의 분자 구조를 수신하는 단계;상기 학습용 화합물의 분자 구조를 학습용 SMILES (Simplified molecular-input line-entry system) 코드로 변환하는 단계, 및상기 학습용 SMILES 코드를 입력으로 하여, 상기 학습용 화합물과 유사한 SMILES 코드를 출력하도록, 상기 화합물 생성 모델을 학습시키는 단계를 더 포함하는, 약물 설계 방법.
- 제8항에 있어서,상기 후보 화합물을 생성하는 단계는,상기 강화 학습된 화합물 생성 모델을 이용하여, 복수의 SMILES 코드를 생성하는 단계;상기 복수의 SMILES 코드를 기초로, 복수의 후보 화합물 결정하는 단계;상기 생물학적 표적 및 상기 복수의 후보 화합물 각각에 대한 결합 친화도를 결정하는 단계, 및상기 각각에 대한 결합 친화도에 기초하여, 상기 복수의 후보 화합물 중, 상기 생물학적 표적에 대한 후보 화합물을 결정하는 단계를 포함하는, 약물 설계 방법.
- 제1항에 있어서,상기 강화된 화합물 생성 모델은,에이전트 네트워크 (agent network) 를 포함하고,상기 강화 학습을 수행하는 단계는,생물학적 표적과의 결합 에너지에 기초하여 상기 결합 친화도를 평가하도록 구성된 보상 함수를 이용하여, 상기 에이전트 네트워크를 업데이트하는 단계를 포함하는, 약물 설계 방법.
- 제1항에 있어서,상기 생물학적 표적은,바이러스 단백질 (virus protein), 코로나바이러스 (Coronavirus) 의 활성 핵심 부위 및 사스-코로나바이러스 (Severe acute respiratory syndrome coronavirus) 의 활성 핵심 부위 중 적어도 하나인, 약물 설계 방법.
- 생물학적 표적 (biological target) 에 대한 구조를 수신하도록 구성된, 통신부, 및상기 통신부와 통신하도록 구성된 프로세서를 포함하고,상기 프로세서는,강화 학습된 화합물 생성 모델을 획득하도록, 화합물의 분자 구조를 입력으로 하여 유사 화합물의 분자 구조를 출력하도록 선행 학습된, 화합물 생성 모델에 대하여, 상기 생물학적 표적과의 결합 친화도 (binding affinity) 를 이용하여 강화 학습 (reinforcement learning) 을 수행하고,상기 강화 학습된 화합물 생성 모델을 이용하여, 상기 생물학적 표적에 대한 후보 화합물을 생성하고,상기 후보 화합물을 제공하도록 구성된, 약물 설계용 디바이스.
- 제12항에 있어서,상기 프로세서는,상기 강화 학습된 화합물 생성 모델을 이용하여, 복수의 후보 화합물을 생성하고,상기 생물학적 표적 및 상기 복수의 후보 화합물 각각에 대한 결합 친화도를 결정하고,상기 각각에 대한 결합 친화도에 기초하여, 상기 복수의 후보 화합물 중, 상기 생물학적 표적에 대한 후보 화합물을 결정하도록 더 구성된, 약물 설계용 디바이스.
- 제13항에 있어서,상기 프로세서는,도킹 시뮬레이션 (docking simulation) 환경에서, 생물학적 표적과의 결합 에너지 (binding energy) 를 평가하도록 구성된 보상 함수를 이용하여, 상기 각각에 대한 보상 점수를 결정하고,상기 보상 점수에 기초하여 상기 복수의 후보 화합물 중, 상기 생물학적 표적에 대한 후보 화합물을 결정하도록 더 구성된, 약물 설계용 디바이스.
- 제14항에 있어서,상기 프로세서는,상기 복수의 후보 화합물 중 상기 보상 점수가 최대인 화합물을, 상기 생물학적 표적에 대한 후보 화합물로 결정하도록 더 구성된, 약물 설계용 디바이스.
- 제14항에 있어서,상기 보상 함수는,기수신된 표준 생물학적 표적 및 표준 화합물의 결합 에너지의 분포에 기초하여, 상기 결합 친화도를 평가하도록 구성된, 약물 설계용 디바이스.
- 제14항에 있어서,상기 보상 함수는,0 내지 1 사이의 값으로 상기 결합 친화도 점수를 결정하도록 구성된, 약물 설계용 디바이스.
- 제14항에 있어서,상기 보상 함수는,상기 생물학적 표적과의 결합 친화도가 낮을 수록 높은 보상 점수를 받도록 구성되고,상기 프로세서는,상기 보상 점수에 기초하여 상기 복수의 후보 화합물 중, 상기 생물학적 표적과 결합 친화도가 낮은 후보 화합물을 결정하도록 더 구성된, 약물 설계용 디바이스.
- 제12항에 있어서,상기 통신부는,학습용 화합물의 분자 구조를 수신하도록 더 구성되고,상기 프로세서는,상기 학습용 화합물의 분자 구조를 학습용 SMILES (Simplified molecular-input line-entry system) 코드로 변환하고,상기 학습용 SMILES 코드를 입력으로 하여, 상기 학습용 화합물과 유사한 SMILES 코드를 출력하도록, 상기 화합물 생성 모델을 학습하도록 더 구성된, 약물 설계용 디바이스.
- 제19항에 있어서,상기 프로세서는,상기 강화 학습된 화합물 생성 모델을 이용하여, 복수의 SMILES 코드를 생성하고,상기 복수의 SMILES 코드를 기초로, 복수의 후보 화합물 결정하고,상기 생물학적 표적 및 상기 복수의 후보 화합물 각각에 대한 결합 친화도를 결정하고,상기 각각에 대한 결합 친화도에 기초하여, 상기 복수의 후보 화합물 중, 상기 생물학적 표적에 대한 후보 화합물을 결정하도록 더 구성된, 약물 설계용 디바이스.
- 제12항에 있어서,상기 강화된 화합물 생성 모델은,에이전트 네트워크 (agent network) 를 포함하고,상기 프로세서는,생물학적 표적과의 결합 에너지에 기초하여 상기 결합 친화도를 평가하도록 구성된 보상 함수를 이용하여, 상기 에이전트 네트워크를 업데이트하도록 더 구성된, 약물 설계용 디바이스.
- 제12항에 있어서,상기 생물학적 표적은,바이러스 단백질 (virus protein), 코로나바이러스 (Coronavirus) 의 활성 핵심 부위 및 사스-코로나바이러스 (Severe acute respiratory syndrome coronavirus) 의 활성 핵심 부위 중 적어도 하나인, 약물 설계용 디바이스.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP22767355.5A EP4307308A4 (en) | 2021-03-08 | 2022-02-17 | METHOD FOR DESIGNING A MEDICINE AND DEVICE IMPLEMENTING SUCH A METHOD |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR10-2021-0030344 | 2021-03-08 | ||
| KR1020210030344A KR102604462B1 (ko) | 2021-03-08 | 2021-03-08 | 약물 설계 방법 및 이를 이용한 디바이스 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2022191459A1 true WO2022191459A1 (ko) | 2022-09-15 |
Family
ID=83227992
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/KR2022/002340 Ceased WO2022191459A1 (ko) | 2021-03-08 | 2022-02-17 | 약물 설계 방법 및 이를 이용한 디바이스 |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP4307308A4 (ko) |
| KR (1) | KR102604462B1 (ko) |
| WO (1) | WO2022191459A1 (ko) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117037946A (zh) * | 2022-11-14 | 2023-11-10 | 上海微观纪元数字科技有限公司 | 基于蛋白质结合口袋的优化化合物结构的方法 |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102765955B1 (ko) * | 2023-07-26 | 2025-02-13 | (주) 칼리시 | 신약 후보 물질 발굴 시스템 |
| KR102752994B1 (ko) * | 2024-03-21 | 2025-01-14 | (주)신테카바이오 | 인공지능 신약 플랫폼 구축을 위한 표적 단백질에 대한 화합물 유도체 생성방법 |
| KR102909257B1 (ko) * | 2025-02-18 | 2026-01-08 | (주) 칼리시 | 항바이러스제 제조 방법 및 장치 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2001013958A2 (en) * | 1999-08-26 | 2001-03-01 | Sydney Brenner | Drug conjugates and methods of designing the same |
| KR20200129367A (ko) * | 2019-05-08 | 2020-11-18 | 고려대학교 산학협력단 | 신약 후보 물질의 발굴 시스템 및 그 방법 |
-
2021
- 2021-03-08 KR KR1020210030344A patent/KR102604462B1/ko active Active
-
2022
- 2022-02-17 WO PCT/KR2022/002340 patent/WO2022191459A1/ko not_active Ceased
- 2022-02-17 EP EP22767355.5A patent/EP4307308A4/en active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2001013958A2 (en) * | 1999-08-26 | 2001-03-01 | Sydney Brenner | Drug conjugates and methods of designing the same |
| KR20200129367A (ko) * | 2019-05-08 | 2020-11-18 | 고려대학교 산학협력단 | 신약 후보 물질의 발굴 시스템 및 그 방법 |
Non-Patent Citations (4)
| Title |
|---|
| BOITREAUD JACQUES, MALLET VINCENT, OLIVER CARLOS, WALDISPÜHL JÉRÔME: "OptiMol: Optimization of Binding Affinities in Chemical Space for Drug Discovery", JOURNAL OF CHEMICAL INFORMATION AND MODELING, AMERICAN CHEMICAL SOCIETY , WASHINGTON DC, US, vol. 60, no. 12, 28 December 2020 (2020-12-28), US , pages 5658 - 5666, XP055965390, ISSN: 1549-9596, DOI: 10.1021/acs.jcim.0c00833 * |
| JEON WOOSUNG, KIM DONGSUP: "Autonomous molecule generation using reinforcement learning and docking to develop potential novel inhibitors", SCIENTIFIC REPORTS, NATURE PUBLISHING GROUP, US, vol. 10, no. 1, 1 December 2020 (2020-12-01), US , pages 22104 - 11, XP055965386, ISSN: 2045-2322, DOI: 10.1038/s41598-020-78537-2 * |
| See also references of EP4307308A4 * |
| VIJIL CHENTHAMARAKSHAN; PAYEL DAS; SAMUEL C. HOFFMAN; HENDRIK STROBELT; INKIT PADHI; KAR WAI LIM; BENJAMIN HOOVER; MATTEO MANICA; : "CogMol: Target-Specific and Selective Drug Design for COVID-19 Using Deep Generative Models", ARXIV.ORG, CORNELL UNIVERSITY LIBRARY, 201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA, NY 14853, 24 June 2020 (2020-06-24), 201 Olin Library Cornell University Ithaca, NY 14853 , XP081687577 * |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN117037946A (zh) * | 2022-11-14 | 2023-11-10 | 上海微观纪元数字科技有限公司 | 基于蛋白质结合口袋的优化化合物结构的方法 |
| CN117037946B (zh) * | 2022-11-14 | 2024-05-10 | 合肥微观纪元数字科技有限公司 | 基于蛋白质结合口袋的优化化合物结构的方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR102604462B1 (ko) | 2023-11-22 |
| EP4307308A1 (en) | 2024-01-17 |
| EP4307308A4 (en) | 2025-03-19 |
| KR20220126120A (ko) | 2022-09-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| WO2022191459A1 (ko) | 약물 설계 방법 및 이를 이용한 디바이스 | |
| DaSilva et al. | DNA-diffusion: leveraging generative models for controlling chromatin accessibility and gene expression via synthetic regulatory elements | |
| WO2017150860A1 (en) | Predicting text input based on user demographic information and context information | |
| CN103080873A (zh) | 用于输入法编辑器的扩展框 | |
| WO2021006596A1 (ko) | 기계학습 모델에 기반한 필수 유전자 식별 방법 및 분석장치 | |
| WO2019009451A1 (ko) | 정량적 구조-성능 관계식의 수치적 반전과 분자동역학 전산모사를 통한 표적신약의 스크리닝 방법 | |
| WO2019022567A2 (en) | METHOD FOR AUTOMATICALLY PROVIDING AUTOMATIC COMPLETION SUGGESTIONS BASED ON GESTURES AND ASSOCIATED ELECTRONIC DEVICE | |
| CN104123012A (zh) | 使用替代评分的非字典字符串的姿态键盘输入 | |
| WO2022114631A1 (ko) | 인공지능 기반 암 진단 및 암 종 예측방법 | |
| WO2017135496A1 (ko) | 약물과 단백질 간 관계 분석 방법 및 장치 | |
| Usluer et al. | Optimized whole-genome CRISPR interference screens identify ARID1A-dependent growth regulators in human induced pluripotent stem cells | |
| Umarov et al. | ReFeaFi: genome-wide prediction of regulatory elements driving transcription initiation | |
| WO2010131899A2 (ko) | 알파벳 입력 방법 및 장치 | |
| CN102169417A (zh) | 触摸屏终端的键盘及利用所述键盘进行输入的方法 | |
| WO2022169096A1 (ko) | 화장품의 색조 원료 획득 장치 | |
| WO2025198106A1 (ko) | 단백질-리간드 간 3차원 결합 구조정보를 통해 유효물질을 발굴하는 방법 및 장치 | |
| WO2023287239A1 (ko) | 함수 최적화 방법 및 장치 | |
| WO2012063981A1 (ko) | 터치스크린을 이용한 빠른 문자입력방법 및 문자입력장치 | |
| Gonzalez‐García et al. | Efficient homology‐based annotation of transposable elements using minimizers | |
| Gothe et al. | Language detection engine for multilingual texting on mobile devices | |
| JP2014175689A (ja) | 情報機器、表示方法、及びプログラム | |
| WO2022097844A1 (ko) | 유전자 복제수 변이 정보를 이용하여 췌장암 환자의 생존 예후를 예측하는 방법 | |
| WO2020071693A1 (ko) | 전자 장치, 서버 및 이를 이용한 서명 인증 방법 | |
| Silva et al. | Insights into SARS-CoV-2, the coronavirus underlying COVID-19: recent genomic data and the development of reverse genetics systems | |
| JP5716718B2 (ja) | 中国語表示制御装置、中国語表示制御プログラム及び中国語表示制御方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22767355 Country of ref document: EP Kind code of ref document: A1 |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 2022767355 Country of ref document: EP |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| ENP | Entry into the national phase |
Ref document number: 2022767355 Country of ref document: EP Effective date: 20231009 |