WO2019172280A1 - ポリマーの物性予測装置、記憶媒体、及びポリマーの物性予測方法 - Google Patents

ポリマーの物性予測装置、記憶媒体、及びポリマーの物性予測方法 Download PDF

Info

Publication number
WO2019172280A1
WO2019172280A1 PCT/JP2019/008704 JP2019008704W WO2019172280A1 WO 2019172280 A1 WO2019172280 A1 WO 2019172280A1 JP 2019008704 W JP2019008704 W JP 2019008704W WO 2019172280 A1 WO2019172280 A1 WO 2019172280A1
Authority
WO
WIPO (PCT)
Prior art keywords
polymer
physical property
unit
partial
partial structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2019/008704
Other languages
English (en)
French (fr)
Inventor
南 拓也
好成 奥野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Resonac Holdings Corp
Original Assignee
Showa Denko KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Showa Denko KK filed Critical Showa Denko KK
Priority to EP19763785.3A priority Critical patent/EP3764252B1/en
Priority to JP2019538694A priority patent/JP6633820B1/ja
Priority to CN201980017349.7A priority patent/CN111819441B/zh
Publication of WO2019172280A1 publication Critical patent/WO2019172280A1/ja
Priority to US17/008,999 priority patent/US11915799B2/en
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08FMACROMOLECULAR COMPOUNDS OBTAINED BY REACTIONS ONLY INVOLVING CARBON-TO-CARBON UNSATURATED BONDS
    • C08F110/00Homopolymers of unsaturated aliphatic hydrocarbons having only one carbon-to-carbon double bond
    • C08F110/02Ethene
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/44Resins; Plastics; Rubber; Leather
    • G01N33/442Resins; Plastics
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Definitions

  • the present invention relates to a polymer property prediction apparatus, a storage medium, and a polymer property prediction method.
  • an object of one aspect is to accurately predict the physical properties of the polymer.
  • the structural unit constituting the polymer is repeatedly read from the storage unit, the partial unit number calculating unit for calculating the number of partial structures of the polymer using the structural unit, and the number of atoms of the structural unit
  • An atomic number calculation unit for calculating the partial structure number density calculation unit for calculating the number density of the partial structure from the number of the partial structures and the number of atoms of the structural unit, and physical properties of the polymer obtained from the storage unit A regression model construction unit that constructs a regression model that predicts a physical property value using the experimental value of and the number density of the partial structure, a polymer structure input unit that inputs a polymer structure for which the physical property value is to be predicted, and
  • a polymer property predicting device comprising: a polymer property predicting unit that predicts the property value corresponding to the inputted polymer structure using a regression model.
  • a polymer property prediction program and method can be used.
  • FIG. 1 is a diagram illustrating a system configuration example according to the present embodiment.
  • a system 1000 includes a physical property prediction apparatus 100 and a plurality of terminals 3, and each terminal 3 can be connected via a network 2.
  • the terminal 3 is an information processing terminal used by the user, and connects to the physical property prediction apparatus 100 to use processing by the prediction processing unit 40.
  • the physical property prediction apparatus 100 is an information processing apparatus having a prediction processing unit 40 that predicts physical properties of a polymer.
  • the prediction processing unit 40 creates a regression model by performing machine learning using a polymer structure given in advance and data indicating the physical property.
  • a physical property value is predicted for the received polymer structure 6 a using the created regression model, and the predicted physical property value 6 b is transmitted to the terminal 3.
  • the configuration of the system 1000 is not limited to the example of FIG.
  • the physical property prediction apparatus 100 may be used standalone. In this case, when the polymer structure 6a is input by the user's operation of the input device 14 (FIG. 2), the physical property value 6b is output to the display device 15 (FIG. 2).
  • the physical property prediction apparatus 100 in the present embodiment has a hardware configuration as shown in FIG.
  • FIG. 2 is a diagram illustrating a hardware configuration example of the physical property prediction apparatus.
  • a physical property prediction apparatus 100 is an information processing apparatus controlled by a computer, and includes a central processing unit (CPU) 11, a main storage device 12, an auxiliary storage device 13, an input device 14, and a display device. 15, a communication I / F (interface) 17, and a drive device 18 are connected to the bus B.
  • the CPU 11 corresponds to a processor that controls the physical property prediction apparatus 100 in accordance with a program stored in the main storage device 12.
  • the main storage device 12 uses RAM (Random Access Memory), ROM (Read Only Memory), etc., and is obtained by a program executed by the CPU 11, data necessary for processing by the CPU 11, and processing by the CPU 11. Store or temporarily store the data.
  • the auxiliary storage device 13 uses an HDD (Hard Disk Drive) or the like, and stores data such as programs for executing various processes. A part of the program stored in the auxiliary storage device 13 is loaded into the main storage device 12 and executed by the CPU 11, whereby various processes are realized.
  • the main storage device 12, the auxiliary storage device 13, and the external storage device accessible by the physical property prediction device 100 are collectively referred to as a storage unit 130.
  • the input device 14 includes a mouse, a keyboard, and the like, and is used for a user to input various information necessary for processing by the physical property prediction device 100.
  • the display device 15 displays various information required under the control of the CPU 11.
  • the input device 14 and the display device 15 may be a user interface such as an integrated touch panel.
  • the communication I / F 17 performs communication through a wired or wireless network. Communication by the communication I / F 17 is not limited to wireless or wired.
  • the drive device 18 interfaces the storage medium 19 (for example, CD-ROM (Compact Disc Read-Only Memory) etc.) set in the drive device 18 with the physical property prediction device 100.
  • the program for realizing the processing performed by the physical property prediction apparatus 100 is provided to the physical property prediction apparatus 100 by a storage medium 19 such as a CD-ROM.
  • the storage medium 19 stores a program for realizing various processes according to the present embodiment, which will be described later, and the program stored in the storage medium 19 is installed in the physical property prediction apparatus 100 via the drive device 18. .
  • the installed program can be executed by the physical property prediction apparatus 100.
  • the storage medium 19 for storing the program is not limited to a CD-ROM, but one or more non-transitory tangible (tangible) data having a data structure that can be read by a computer. Any medium can be used.
  • a computer-readable storage medium in addition to a CD-ROM, a DVD (Digital Versatile Disk) disk, a portable recording medium such as a USB memory, or a semiconductor memory such as a flash memory may be used.
  • FIG. 3 is a diagram illustrating a first functional configuration example of the physical property prediction apparatus.
  • the physical property prediction apparatus 100 includes a prediction processing unit 40.
  • the prediction processing unit 40 corresponds to a prediction process performed by the CPU 11 executing a corresponding program.
  • the storage unit 130 stores a polymer structure / physical property DB 31, a model structure 33a, a partial structure number 33b, an atom number 33c, a partial structure number density 33d, an important partial structure 33e, a regression model 33f, a polymer structure 6a, a physical property value 6b, and the like.
  • the prediction processing unit 40 obtains a regression model 33f for predicting the physical properties of the polymer structure 6a specified by the user by machine learning, predicts the physical properties of the polymer structure 6a using the obtained regression model 33f, and obtains the physical property values obtained. 6b is output.
  • the prediction processing unit 40 includes a model creation unit 41 and a physical property prediction unit 45 as processing units.
  • the model creation unit 41 uses the polymer structure / physical property DB 31 to learn the physical properties of the polymer structure in which the structural units are replicated and connected to determine the regression model 33f.
  • a structural unit constituting a polymer by repetition is referred to as “repeating unit”.
  • the polymer structure / physical property DB 31 stores, for each polymer, a repeating unit and an experimental value of physical properties obtained in advance in an experiment in association with each other.
  • the model creation unit 41 includes a model structure generation unit 43a, a partial structure number calculation unit 43b, an atom number calculation unit 43c, a partial structure number density calculation unit 43d, a dimension reduction unit 43e, and a regression model construction unit 43f. It has as a processing part. Either or both of the model structure generation unit 43a and the dimension reduction unit 43e can be omitted.
  • the model structure generation unit 43a acquires a repeating unit from the polymer structure / physical property DB 31, and generates a model structure 33a by repeating the process of duplicating and connecting the acquired repeating unit a predetermined number of times.
  • the repeating unit includes a partial structure.
  • the repeating unit may be the entire partial structure.
  • a polymer is represented by connecting a plurality of repeating units.
  • the generated model structure 33a is stored in the storage unit 130.
  • the repeating unit and the model structure 33a may be expressed in a predetermined format.
  • a description will be given of a case where the repeating unit and the model structure 33a are expressed by SMILES (Simplified Molecular Input Line Entry Syntax)), but the present invention is not limited to this notation format.
  • the partial structure number calculation unit 43b calculates the partial structure number 33b based on the model structure 33a.
  • the partial structure number 33 b is expressed by an n-dimensional vector and is stored in the storage unit 130.
  • the atomic number calculation unit 43c calculates the atomic number 33c based on the model structure 33a.
  • the obtained number of atoms 33 c is stored in the storage unit 130.
  • the partial structure number density calculation unit 43d calculates the partial structure number density 33d using the partial structure number 33b and the number of atoms 33c.
  • the obtained partial structure number density 33d is represented by the same n-dimensional vector as the partial structure number 33b and is stored in the storage unit 130.
  • the dimension reduction unit 43e constructs a provisional regression model using the partial structure number density 33d and the experimental value, and reduces the number of dimensions of the provisional regression model based on a predetermined dimension reduction method. Get.
  • the important partial structure 33e is stored in the storage unit 130.
  • the important partial structure 33e is data specifying elements (for example, vectors) that will contribute to the prediction accuracy of the regression model 33f to be constructed in the partial structure number density 33d.
  • the dimension reduction method is determined in advance according to the regression analysis method to be used. For example, when Lasso regression is used, the dimension can be reduced by deleting the coefficient term of 0. When random forest regression is used, the importance of explanatory variables can be calculated, and dimensions can be reduced by excluding variables whose importance is below a threshold. In the stepwise method, when constructing a provisional regression model, the explanatory variables are added or reduced one by one, thereby reducing the dimension by searching for a combination of explanatory variables with the highest prediction accuracy.
  • the regression model construction unit 43f performs regression analysis based on the important partial structure 33e obtained by the dimension reduction unit 43e using the partial structure number density 33d and the experimental value, and constructs a regression model 33f.
  • the regression model 33f is stored in the storage unit 130.
  • the regression analysis for obtaining the provisional regression model and the regression model 33f includes lasso regression, random forest regression, stepwise method, partial linear regression, ridge regression, kernel ridge regression, support vector regression, decision tree regression, Gaussian process regression, etc. Either is applicable.
  • a provisional regression model can be obtained by lasso regression
  • a regression model 33f can be obtained by Gaussian process regression.
  • the physical property prediction unit 45 predicts the polymer physical property based on the polymer structure 6a using the regression model 33f in accordance with the input of the polymer structure 6a designated by the user.
  • a repeating unit may be specified by SMILES notation or the like.
  • the physical property prediction unit 45 includes a polymer structure input unit 47a and a polymer physical property prediction unit 47b as processing units.
  • the polymer structure input unit 47a inputs the polymer structure 6a designated by the user and stores it in the storage unit 130.
  • the polymer structure input unit 47a may input the polymer structure 6a when the communication I / F 17 receives it via the network 2, or the user specifies the polymer structure 6a by the input device 14 or the like of the physical property prediction apparatus 100. You may input according to.
  • the polymer physical property prediction unit 47b obtains the model structure, the number of partial structures, and the number of atoms from the polymer structure 6a, calculates the partial structure number density, and predicts the physical property value using the regression model 33f stored in the storage unit 130. .
  • the method for obtaining the model structure, the number of partial structures, the number of atoms, and the partial structure number density based on the polymer structure 6a is the same as that of the model creation unit 41.
  • the predicted physical property value 6b is output to the storage unit 130.
  • the obtained physical property value 6b is transmitted to the user terminal 3 and displayed.
  • the polymer structure 6 a is designated by a user operation on the physical property prediction apparatus 100, the physical property value 6 b is displayed on the display device 15 as the obtained physical property value 6 b.
  • FIG. 4 is a diagram showing a data configuration example of the polymer structure / physical property DB.
  • a polymer structure / physical property DB 31 is a database for managing experimental values of various physical properties such as a repeating unit and a refractive index for each polymer, and includes a polymer name, a repeating unit, a refractive index, a glass transition point, and the like. Have items.
  • the polymer name indicates specific information for specifying the polymer structure. Although an example in which a repeating unit is shown in SMILES notation will be described, the notation method of a repeating unit is not limited to SMILES notation.
  • a refractive index, a glass transition point, and the like are examples of various physical properties of a polymer obtained by experiments in advance, and experimental values are shown for each physical property name.
  • repeating unit “* CC *” is associated with the polymer name “poly (ethylene)”, and experimental values such as a refractive index “1.472” are shown. Similarly, experimental values of physical properties are shown for other polymers.
  • the work table 32 is a table in which calculated values are recorded for each polymer repeating unit for which the partial structure number density 33d is obtained, and includes items such as polymer name, repeating unit, number of atoms, and partial structure number density.
  • the polymer name indicates a polymer name registered in the polymer structure / physical property DB 31.
  • the number of partial structures indicates the number of partial structures 33b obtained by the partial structure number calculation unit 43b.
  • the number of atoms indicates the number of atoms 33c obtained by the number of atoms calculator 43c.
  • the partial structure number density indicates the partial structure number density 33d obtained by the partial structure number density calculation unit 43d.
  • the partial structure number density of the work table 32 and the experimental values of the physical properties of the polymer structure / physical property DB 31 are used for machine learning by regression analysis. Therefore, the work table 32 may be associated with the polymer structure / physical property DB 31 by the polymer name.
  • the data structure example of the polymer structure / physical property DB 31 and the work table 32 shown in FIG. 4 is merely an example, and is not limited to this example.
  • FIG. 5 is a diagram for explaining the outline of the prediction processing in the present embodiment.
  • the model structure generation unit 43a acquires a repeating unit from the polymer structure / physical property DB 31 (FIG. 5A). For example, the repeating unit “* CCO *” is obtained.
  • the repeating unit “* CCO *” is obtained.
  • “*” indicating the start and end indicating a certain structure is omitted.
  • the model structure generation unit 43a generates the model structure 33a by using the acquired partial structure as a repeating unit and duplicating the repeating unit (FIG. 5B).
  • the model structure generation unit 43a repeats the repeat unit “CCO” by repeating a predetermined number of times to the right, and stores the model structure 33a of “CCOCCOCCOCCOCCOCCOCCOCCOCCOCCO” in which a plurality of repeat units “CCO” are connected. 130.
  • the partial structure number calculation unit 43b generates a partial structure number vector x 0 (partial structure number 33b) of the structural model 33a (FIG. 5C).
  • Partial structure number vector x 0 is, ECFP (Extended Circular FingerPrint), Atom Pair, Topological Torsion, represented by an n-dimensional by structural descriptors such as Neural Finger Print.
  • ECFP Extended Circular FingerPrint
  • Atom Pair Atom Pair
  • Topological Torsion represented by an n-dimensional by structural descriptors such as Neural Finger Print.
  • a structure descriptor represented by the number of C atoms, the number of O atoms, the number of COC, and the like will be described.
  • the present invention is not limited to this structure descriptor.
  • CCOCCOCCOCCOCCOCCOCCOCCOCCOCCOCCOCCOCCOCCO an n-dimensional partial structure number vector x 0 with the number of C atoms “20”, the number of O atoms “10”,.
  • the structure assigned to each vector such as “C”, “O”, and “COC” indicates the type of the partial structure of the polymer.
  • n is an arbitrary natural number. Usually it is about 256 to 2048.
  • the atomic number calculation unit 43c calculates the number of atoms included in the model structure 33a (FIG. 5 (d)).
  • the number of atoms is “30”.
  • the partial structure number density calculation unit 43d includes the partial structure number vector x 0 (partial structure number 33b) obtained by the partial structure number calculation unit 43b in FIG. 5B and the atomic number calculation unit 43c in FIG. 5C.
  • the partial structure number density vector x (partial structure number density 33d) is generated by dividing by the number of atoms 33c obtained by (Fig. 5 (e)).
  • 5A to 5E are repeated for each record in the polymer structure / physical property DB 31.
  • the obtained partial structure number 33b, atom number 33c, and partial structure number density 33d may be stored in the work table 32 in association with the polymer name.
  • the provisional regression model is constructed by the dimension reduction unit 43e, and dimension reduction is performed (FIG. 5 (f)).
  • the n dimension can be reduced to the n ′ dimension (n ′ ⁇ n).
  • the important partial structure 33e that contributes to the prediction accuracy is specified.
  • n ′ is a natural number smaller than n and is usually about 16 to 128 in many cases.
  • the regression model construction unit 43f constructs a regression model 33f used for prediction of physical property values (FIG. 5G).
  • a regression model 33f reduced to several tens of dimensions is obtained.
  • the regression model 33f is a formula (1) for obtaining a predicted value y of the polymer physical property by a partial structure number density vector x (partial structure number density 33d).
  • y f (x) (1) It is represented by
  • the number of partial structure number density vectors x is n as the number of dimensions, but after the dimension reduction, the number of partial structure number density vectors x is n ′. Since the predicted value is calculated using only the dimension contributing to the prediction accuracy by the important partial structure 33e, the physical property prediction process can be performed efficiently.
  • 5A to 5E described above corresponds to the model creation process of the model creation unit 41.
  • the physical property prediction process by the physical property prediction unit 45 is performed.
  • the property prediction unit 45 in response to input of a polymer structure A to be determined the physical properties, generates a partial structure number density vector x A, predicting a physical property value y A (FIG. 5 (h)).
  • the polymer structure input unit 47a inputs the polymer structure A, and the polymer physical property prediction unit 47b predicts the physical property value y A using the regression model 33f.
  • the regression model 33f for one physical property, a predetermined physical property value is predicted.
  • the regression model 33f is acquired for each of various physical properties, the user may specify the polymer structure A and all or specific physical properties.
  • the polymer physical property predicting unit 47b predicts the physical property value 6b using the regression model 33f and the important partial structure 33e corresponding to each physical property.
  • the calculation process of the partial structure number 33b may be performed, or may be performed in parallel.
  • the “predicted value” of physical properties and the predicted “physical property value” are synonymous.
  • FIG. 6 is a diagram illustrating an example of number density.
  • the number of carbon atoms of polyethylene oxide will be described as an example.
  • structure B has a longer representation than structure A.
  • the polymers represented by each of Structure A and Structure B are exactly the same polymer.
  • the carbon number of structure A is “2” and the carbon number of structure B is “4”, which is different from structure A. It will be recognized as a polymer. That is, from this example, it can be seen that when comparing polymers having different lengths of repeating units, the number of partial structures cannot adequately capture the structural characteristics of the polymer.
  • the partial structure number density calculation unit 43d obtains the same partial structure number density (carbon number density) “2/3” for the structures A and B. Therefore, in the dimension reduction unit 43e and the regression model construction unit 43f, it can be recognized that the structure A and the structure B correctly represent the same polymer. Based on such an example, the inventor has found that polymers having different repeating unit lengths can be handled equivalently by using the partial structure number density 33d.
  • FIG. 7 is a diagram for explaining the difference depending on the presence or absence of duplication of the repetition unit.
  • polyethylene oxide is taken as an example, but the repeating unit is the same in the presence or absence of replication.
  • the number density of COC is “0”.
  • the repeating unit is duplicated, and the right side of the repeating unit is connected to the oxygen atom on the left side of the next repeating unit.
  • the partial structure “COC” appears, and “1/6” is obtained with respect to the number density of the originally existing partial structure “COC”.
  • the regression model 33f is acquired using the partial structure number density 33d obtained in this way, the prediction accuracy of the existing technology can be improved.
  • the prediction processing by the prediction processing unit 40 is performed as shown in FIGS. 8A and 8B.
  • 8A and 8B are flowcharts for explaining the prediction process.
  • the model creation unit 41 performs model creation processing P51.
  • the model structure generation unit 43a selects and reads one record from the polymer structure / physical property DB 31, and obtains a repeat unit and an experimental value (step S511). Then, the model structure generation unit 43a repeats the operation of duplicating and connecting the acquired repeating units a predetermined number of times to generate the model structure 33a (step S512).
  • the partial structure number calculation unit 43b calculates the partial structure number 33b of the model structure 33a using a predetermined structure descriptor (for example, ECFP) (step S513).
  • the atomic number calculation unit 43c calculates the atomic number 33c of the model structure 33a (step S514). Note that step S513 may be performed after step S514 is performed. Alternatively, steps S513 and S514 may be processed in parallel.
  • the partial structure number density calculation unit 43d calculates the partial structure number density 33d by dividing the partial structure number 33b by the number of atoms 33c (step S515). As described above, the partial structure number 33b and the partial structure number density 33d are represented by n-dimensional vectors.
  • the model creation unit 41 determines whether all the records in the polymer structure / physical property DB 31 have been completed (step S516). If all the records have not been completed (NO in step S516), the model creation unit 41 returns to step S511 and performs the same processing as described above.
  • the dimension reduction unit 43e obtains a provisional regression model f ′ using the partial structure number density 33d corresponding to the important partial structure 33e as the variable x ′ and the experimental value y ′. Perform the first regression analysis.
  • the dimension reduction unit 43e reduces the dimension of the provisional regression model f ′ by a predetermined dimension reduction method, and acquires the important partial structure 33e (step S517).
  • the regression model construction unit 43f obtains the regression model f using the partial structure number density 33d corresponding to the important partial structure 33e as the variable x and the experimental value y (step S518).
  • the experimental value y is a value specified by the polymer name and physical property in the polymer structure / physical property DB 31.
  • the regression model f that is, the regression model 33 f is stored in the storage unit 130.
  • a physical property prediction process P55 by the physical property prediction unit 45 is performed.
  • the prediction processing unit 40 when the polymer structure input unit 47a receives the polymer structure 6a (step S521), the model structure, the number of partial structures, the number of atoms, and the partial structure number density are obtained using the polymer structure 6a as a repeating unit (Ste S522).
  • the model structure, the number of partial structures, the number of atoms, and the partial structure number density of the polymer structure 6a are obtained by performing the same process as steps S512 to S515 in the model creation process P51.
  • the polymer property predicting unit 47b reduces the dimension of the partial structure number density of the polymer structure 6a based on the important partial structure 33e obtained in step S517, and the regression model f (stored in the storage unit 130) obtained in step S518.
  • the physical property value 6b is predicted using the stored regression model 33f) (step S524).
  • the obtained physical property value 6 b is transmitted to the terminal 3 or displayed on the display device 15.
  • FIG. 9 is a diagram illustrating a data configuration example of the regression model management table.
  • the regression model management table 33k is a table for managing the regression model 33f for each physical property, and includes items such as physical properties, regression model, and important partial structure.
  • the physical properties indicate names for specifying physical properties such as refractive index and glass transition point.
  • the regression model indicates the regression model 33f corresponding to the physical property constructed by the regression model construction unit 43f.
  • an effective vector (effective vector after dimension reduction) is specified among the vectors of the partial structure number density 33d obtained after dimension reduction for using the regression model 33f.
  • the important partial structure item is omitted.
  • the polymer physical property prediction unit 47b may acquire the regression model 33f and the important partial structure 33e associated with the predicted physical property from the regression model management table 33k.
  • the inventor is verifying prediction accuracy due to differences in various functional configurations, which will be described later. According to the verification result, the first functional configuration example described above was able to improve the prediction accuracy most. Further, it has been verified by the inventors that the prediction accuracy can be sufficiently improved even in a configuration in which one or both of the model structure generation unit 43a and the dimension reduction unit 43e are omitted.
  • FIG. 10 is a diagram illustrating a second functional configuration example of the physical property prediction apparatus. 10, in the second functional configuration example, the model structure generation unit 43a and the dimension reduction unit 43e are omitted from the first functional configuration example shown in FIG. 3, and therefore the model structure 33a and the important partial structure 33e are omitted. Is not generated.
  • the partial structure number calculation unit 43b and the atomic number calculation unit 43c acquire the repeating unit from the polymer structure / physical property DB 31, and acquire the partial structure number 33b and the atomic number 33c.
  • the partial structure number density calculation unit 43d calculates the partial structure number density 33d. Then, the regression model construction unit 43f obtains a regression model 33f using the calculated partial structure number density 33d and the physical property experimental values.
  • the polymer physical property prediction unit 47b when the polymer structure input unit 47a inputs the polymer structure 6a, the polymer physical property prediction unit 47b does not create the model structure 33a, but calculates the number of partial structures and the number of atoms using the polymer structure 6a. . Then, the polymer physical property predicting unit 47b obtains the partial structure number density by dividing the obtained partial structure number by the number of atoms, and obtains the physical property value 6b by the regression model 33f using the partial structure number density 33d.
  • the regression analysis is performed only once.
  • the number of dimensions of the regression model 33f is the same as the partial structure number density 33d, and the important partial structure 33e is not specified. However, if the values are the same due to the partial structure number density 33d, even polymers having different repeating unit lengths can be handled equivalently, and the prediction accuracy can be sufficiently improved.
  • FIG. 11 is a diagram illustrating a third functional configuration example of the physical property prediction apparatus.
  • the model structure generation unit 43a is omitted from the first functional configuration example shown in FIG. 3, and therefore the model structure 33a is not generated.
  • the partial structure number calculation unit 43b and the atomic number calculation unit 43c acquire the repeating unit from the polymer structure / physical property DB 31, and the partial structure number 33b and the atomic number 33c is acquired.
  • the partial structure number density 33d is obtained by the partial structure number density calculation unit 43d.
  • the important partial structure 33e is acquired by the dimension reduction part 43e, the dimension of the partial structure number density 33d is reduced, and the regression model 33f is output by the regression model construction part 43f.
  • the polymer physical property prediction unit 47b when the polymer structure input unit 47a inputs the polymer structure 6a, the polymer physical property prediction unit 47b does not create the model structure 33a, but calculates the number of partial structures and the number of atoms using the polymer structure 6a. . Then, the polymer property prediction unit 47b obtains the partial structure number density by dividing the obtained partial structure number by the number of atoms, and after reducing the number of dimensions of the partial structure number density based on the partial structure number density 33d, The physical property value 6b is output using the regression model 33f.
  • the model structure 33a is not generated, but since the important partial structure 33e is specified by the dimension reduction unit 43e, the prediction accuracy of the regression model 33f generated by the regression model construction unit 43f can be further improved.
  • FIG. 12 is a diagram illustrating a fourth functional configuration example of the physical property prediction apparatus. 12, in the fourth functional configuration example, the dimension reduction unit 43e is omitted from the first functional configuration example shown in FIG. 3, and therefore, the important partial structure 33e is not generated.
  • a model structure 33a is created by the model structure generation unit 43a, and a partial structure number 33b and an atom number 33c based on the model structure 33a are obtained by the partial structure number calculation unit 43b and the atom number calculation unit 43c.
  • the polymer physical property prediction unit 47b when the polymer structure input unit 47a inputs the polymer structure 6a, the polymer physical property prediction unit 47b creates the model structure 33a and calculates the number of partial structures and the number of atoms using the model structure 33a. Then, the polymer physical property predicting unit 47b obtains the partial structure number density by dividing the obtained partial structure number by the number of atoms, and obtains the physical property value 6b by the regression model 33f using the partial structure number density 33d. The dimension of the partial structure number density obtained from the polymer structure 6a is not reduced.
  • the prediction accuracy of the regression model 33f generated by the regression model construction unit 43f can be improved by the model structure 33a and the partial structure number density 33d.
  • FIG. 13 is a diagram illustrating a functional configuration example of a physical property prediction apparatus based on an existing technology.
  • the physical property prediction apparatus 9 has a functional configuration based on an existing technology.
  • the prediction processing unit 90 of the physical property prediction apparatus 9 includes a model creation unit 91 and a physical property prediction unit 95.
  • the model creation unit 91 is a processing unit that creates a regression model 83f, and includes a partial structure number calculation unit 93b and a regression model construction unit 98f.
  • the partial structure number calculation unit 93b acquires a repetitive structure from the polymer structure / physical property DB 31, obtains the partial structure number 83b, and stores it in the storage unit 130.
  • the regression model construction unit 93 f performs regression analysis using the partial structure number 83 b and the experimental values obtained from the polymer structure / physical property DB 31 to construct a regression model 83 f and stores the regression model 83 f in the storage unit 130.
  • the physical property prediction unit 95 is a processing unit that predicts a physical property value by applying the polymer structure 6a desired by the user to the regression model 83f, and includes a polymer structure input unit 97a and a polymer physical property prediction unit 97b. Have.
  • the polymer structure input unit 97a receives the polymer structure 6a
  • the polymer structure input unit 97a stores the polymer structure 6a in the storage unit 130.
  • the polymer physical property predicting unit 97b obtains the predicted physical property value 6b by obtaining the partial structure number of the polymer structure 6a and applying the obtained partial structure number to the regression model 83f.
  • the physical property value 6b is presented to the user.
  • Example 1 In Example 1, verification was performed using the second functional configuration example (FIG. 10) in which the model structure generation unit 43a and the dimension reduction unit 43e are omitted. In the first embodiment, the model structure 33a is not generated. Further, the regression analysis is performed only once by the regression model construction unit 43f.
  • ECFP4 was used as the structure descriptor.
  • ECFP4 represents an ECFP having a radius of 4,1024 dimensions.
  • ECFP descriptor hereinafter referred to as an ECFP descriptor.
  • ECFP descriptor is represented by a vector, each dimension represents the type of partial structure, and the value of each dimension corresponds to the number of partial structures.
  • Software such as RDKit was used to generate the ECFP descriptor.
  • the ECFP descriptor is defined as a partial structure number descriptor.
  • a partial structure number density descriptor is obtained by dividing each component of the partial structure number descriptor by the number of constituent atoms.
  • the regression model 33f was constructed using the partial structure number density descriptor as the explanatory variable and the refractive index experimental value as the objective variable.
  • the data set is divided into learning and verification by leave-one-out cross-validation, hyperparameter tuning is performed using the learning data set, a regression model is built, and the non-learning polymer is used using the verification data set
  • the accuracy of refractive index prediction was verified.
  • y i is an experimental value of the i-th polymer
  • y_bar is an actual average value
  • f i is a predicted value of the i-th polymer.
  • the number of constituent atoms corresponds to the number of atoms in the repeating unit
  • the partial structure number descriptor corresponds to the partial structure number 33b
  • the partial structure number density descriptor corresponds to the partial structure number density 33d.
  • Example 2 In Example 2, verification was performed using the third functional configuration example (FIG. 11) in which the model structure generation unit 43a is omitted. Since the model structure 33 a is not generated, the partial structure number density 33 d is obtained from the repeating unit of the polymer structure / physical property DB 31. The regression analysis is performed twice by the dimension reduction unit 43e and the regression model construction unit 43f.
  • the Lasso regression model (corresponding to the provisional regression model) is constructed by the dimension reduction unit 43e from the partial structure number density 33d and the experimental values of the polymer properties obtained from the polymer structure / physical property DB 31. Then, dimension reduction was performed by excluding variables with a coefficient of 0. Further, in the regression model construction unit 43f, the regression model 33f is constructed by Gaussian process regression as in the first embodiment. Then, the prediction accuracy of the refractive index was verified by the same method as in Example 1.
  • Example 3 In Example 3, verification was performed using the fourth functional configuration example (FIG. 12) in which the dimension reduction unit 43e is omitted. The important partial structure 33e is not acquired. The regression model 33f is constructed with the number of dimensions of the partial structure number density 33d.
  • Example 4 In Example 4, the verification was performed using the first functional configuration example (FIG. 3) including the important partial structure 33e and the dimension reduction unit 43e.
  • a partial structure number descriptor and an atom number were calculated, and a partial structure number density descriptor was calculated.
  • a lasso regression model (corresponding to a provisional regression model) was constructed by the dimension reduction unit 43e, the dimension was reduced by excluding a variable having a coefficient of 0, and a regression model 33f was constructed by Gaussian process regression. Then, the prediction accuracy of the refractive index was verified by the same method as in Example 1.
  • Comparative Example 1 In Comparative Example 1, the verification was performed with the existing functional configuration example (FIG. 13) in which the regression model 83f is obtained only by the partial structure number calculation unit 93b and the regression model construction unit 93f.
  • the regression model 83f is obtained from the partial structure number 83b (partial structure number descriptor) obtained by using the repeating unit and the experimental value of the refractive index by the partial structure number calculation unit 93b.
  • the regression model 83f was constructed using Gaussian process regression in the same manner as in Example 1. In addition, the prediction accuracy was verified by the same method as in Example 1.
  • FIG. 14 is a diagram illustrating an example of an evaluation result.
  • FIG. 14 shows the evaluation results of the refractive index prediction accuracy performed for each of Comparative Example 1 and Examples 1 to 4, as described above. As an evaluation result, each result of R 2 and RMSE is shown.
  • the physical property value can be predicted in advance by using the physical property prediction apparatus 100, the polymer structure 6a to be manufactured can be accurately selected. Therefore, it is possible to reduce wastes such as costs and time for polymer production.
  • the polymer physical properties can be predicted with high accuracy by generating the structure descriptor based on the structure of the polymer.
  • FIG. 15 is a diagram illustrating an example of a method for producing a polymer.
  • the polymer production method according to the present embodiment includes a step (S601) of obtaining a polymer structure having a physical property value predicted by the polymer physical property prediction method according to the present embodiment, and a raw material for constituting the polymer structure. Preparing (S602) and reacting the raw materials to obtain a polymer represented by the polymer structure (S603).
  • a polymer structure predicted to have a predetermined physical property value is appropriately selected from the input polymer structures.
  • a polymer structure having a refractive index within a predetermined range is selected from the input polymer structures.
  • raw materials such as monomers and oligomers are prepared as raw materials for constituting the polymer structure selected in S1.
  • the selected polymer structure is polyethylene, prepare ethylene.
  • the prepared raw materials are reacted in S602, and a polymer represented by the selected polymer structure is obtained in S601.
  • ethylene is polymerized to synthesize polyethylene.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Polymers & Plastics (AREA)
  • Organic Chemistry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

記憶部から繰り返しによりポリマーを構成する構造単位を読み込み、該構造単位を用いて、該ポリマーの部分構造の数を計算する部分構造数計算部と、前記構造単位の原子数を計算する原子数計算部と、前記部分構造の数と前記構造単位の原子数とから該部分構造の数密度を計算する部分構造数密度計算部と、前記記憶部から得られる前記ポリマーの物性の実験値と、前記部分構造の数密度とを用いて、物性値を予測する回帰モデルを構築する回帰モデル構築部と、前記物性値を予測したいポリマー構造を入力するポリマー構造入力部と、前記回帰モデルを用いて、入力した前記ポリマー構造に対応する前記物性値を予測するポリマー物性予測部と、を備えるポリマーの物性予測装置を提供する。

Description

ポリマーの物性予測装置、記憶媒体、及びポリマーの物性予測方法
 本発明は、ポリマーの物性予測装置、記憶媒体、及びポリマーの物性予測方法に関する。
 近年、機械学習を用いて、ポリマー等の有機化合物の物性をコンピュータを用いて予測するようになっている。
 物性を予測するために、人が設定した様々な構造記述子を用いてポリマー物性を予測する技術が知られている。また、アルゴリズムに基づき機械的に分子の部分構造パターンを識別し、構造記述子を計算する技術が提案されている。
特表2004-514902号公報
David Robers他、「Extended-Connectivity Fingerprints」、American Chemical Society出版、J. Chem. Info. Model., Vol. 50, No. 5, 2010, pp742-754.
 従来、ポリマーの構造記述子となる炭素原子の数等の構造パターンを、予め人が決定する必要があった。一方、低分子の有機分子の部分構造を自動的に抽出する手法が存在するが、ポリマーの物性を予測するには精度が悪いといった問題があった。そのため、ポリマー構造には適用されてこなかった。
 したがって、1つの側面では、ポリマーの物性を精度良く予測することを目的とする。
 一態様によれば、記憶部から繰り返しによりポリマーを構成する構造単位を読み込み、該構造単位を用いて、該ポリマーの部分構造の数を計算する部分構造数計算部と、前記構造単位の原子数を計算する原子数計算部と、前記部分構造の数と前記構造単位の原子数とから該部分構造の数密度を計算する部分構造数密度計算部と、前記記憶部から得られる前記ポリマーの物性の実験値と、前記部分構造の数密度とを用いて、物性値を予測する回帰モデルを構築する回帰モデル構築部と、前記物性値を予測したいポリマー構造を入力するポリマー構造入力部と、前記回帰モデルを用いて、入力した前記ポリマー構造に対応する前記物性値を予測するポリマー物性予測部と、を備えるポリマーの物性予測装置が提供される。
 また、上記課題を解決するための手段として、ポリマーの物性予測プログラム及び方法とすることもできる。
 ポリマーの物性を精度良く予測できる。
本実施の形態におけるシステム構成例を示す図である。 物性予測装置のハードウェア構成例を示す図である。 物性予測装置の第1の機能構成例を示す図である。 ポリマー構造・物性DBのデータ構成例を示す図である。 本実施の形態における予測処理の概要を説明するための図である。 数密度の例を示す図である。 繰り返し単位の複製の有無による差異を説明するための図である。 予測処理を説明するためのフローチャート図である。 予測処理を説明するためのフローチャート図である。 回帰モデル管理テーブルのデータ構成例を示す図である。 物性予測装置の第2の機能構成例を示す図である。 物性予測装置の第3の機能構成例を示す図である。 物性予測装置の第4の機能構成例を示す図である。 既存の技術に基づく物性予測装置の機能構成例を示す図である。 評価結果例を示す図である。 ポリマーの製造方法の一例を示す図である。
 以下、本発明の実施の形態を図面に基づいて説明する。先ず、本実施の形態に係るシステム構成例について説明する。図1は、本実施の形態におけるシステム構成例を示す図である。図1において、システム1000は、物性予測装置100と、複数の端末3とを有し、各端末3は、ネットワーク2を介して接続可能である。
 端末3は、ユーザによって使用される情報処理端末であり、物性予測装置100に接続して、予測処理部40による処理を利用する。
 物性予測装置100は、ポリマーの物性を予測する予測処理部40を有する情報処理装置である。物性予測装置100では、予測処理部40が、予め与えられたポリマー構造及びその物性を示すデータを用いて、機械学習をすることで回帰モデルを作成する。端末3からのポリマー構造6aの受信に応じて、作成した回帰モデルを用いて受信したポリマー構造6aに対して物性値を予測し、予測した物性値6bを端末3に送信する。
 また、システム1000の構成は、図1の例に限定されない。一例として、物性予測装置100は、スタンドアロンで利用されてもよい。この場合、ユーザの入力装置14(図2)の操作により、ポリマー構造6aが入力されると、物性値6bが表示装置15(図2)に出力される。
 本実施の形態における物性予測装置100は、図2に示すようなハードウェア構成を有する。図2は、物性予測装置のハードウェア構成例を示す図である。図2において、物性予測装置100は、コンピュータによって制御される情報処理装置であって、CPU(Central Processing Unit)11と、主記憶装置12と、補助記憶装置13と、入力装置14と、表示装置15と、通信I/F(インターフェース)17と、ドライブ装置18とを有し、バスBに接続される。
 CPU11は、主記憶装置12に格納されたプログラムに従って物性予測装置100を制御するプロセッサに相当する。主記憶装置12には、RAM(Random Access Memory)、ROM(Read Only Memory)等が用いられ、CPU11にて実行されるプログラム、CPU11での処理に必要なデータ、CPU11での処理にて得られたデータ等を記憶又は一時保存する。
 補助記憶装置13には、HDD(Hard Disk Drive)等が用いられ、各種処理を実行するためのプログラム等のデータを格納する。補助記憶装置13に格納されているプログラムの一部が主記憶装置12にロードされ、CPU11に実行されることによって、各種処理が実現される。主記憶装置12、補助記憶装置13、及び物性予測装置100によりアクセス可能な外部記憶装置を含めて、以下、総称して、記憶部130という。
 入力装置14は、マウス、キーボード等を有し、ユーザが物性予測装置100による処理に必要な各種情報を入力するために用いられる。表示装置15は、CPU11の制御のもとに必要な各種情報を表示する。入力装置14と表示装置15とは、一体化したタッチパネル等によるユーザインタフェースであってもよい。通信I/F17は、有線又は無線などのネットワークを通じて通信を行う。通信I/F17による通信は無線又は有線に限定されるものではない。 
 ドライブ装置18は、ドライブ装置18にセットされた記憶媒体19(例えば、CD-ROM(Compact Disc Read-Only Memory)等)と物性予測装置100とのインターフェースを行う。
 物性予測装置100によって行われる処理を実現するプログラムは、例えば、CD-ROM等の記憶媒体19によって物性予測装置100に提供される。記憶媒体19に、後述される本実施の形態に係る種々の処理を実現するプログラムを格納し、この記憶媒体19に格納されたプログラムは、ドライブ装置18を介して物性予測装置100にインストールされる。インストールされたプログラムは、物性予測装置100により実行可能となる。
 尚、プログラムを格納する記憶媒体19はCD-ROMに限定されず、コンピュータが読み取り可能な、データの構造(structure)を有する1つ以上の非一時的(non-transitory)な、有形(tangible)な媒体であればよい。コンピュータ読取可能な記憶媒体として、CD-ROMの他に、DVD(Digital Versatile Disk)ディスク、USBメモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリであっても良い。
 [第1の機能構成例] 
 図3は、物性予測装置の第1の機能構成例を示す図である。図3において、物性予測装置100は、予測処理部40を有する。予測処理部40は、CPU11が対応するプログラムを実行することで行われる予測処理に相当する。
 記憶部130は、ポリマー構造・物性DB31、モデル構造33a、部分構造数33b、原子数33c、部分構造数密度33d、重要部分構造33e、回帰モデル33f、ポリマー構造6a、物性値6b等が記憶される。
 予測処理部40は、機械学習によりユーザが指定するポリマー構造6aの物性を予測する回帰モデル33fを求め、求めた回帰モデル33fを用いて、ポリマー構造6aの物性を予測し、得られた物性値6bを出力する。予測処理部40は、モデル作成部41と物性予測部45とを処理部として有する。
 モデル作成部41は、ポリマー構造・物性DB31を用いて、構造単位を繰り返し複製して連結したポリマー構造の物性を学習し、回帰モデル33fを定める。繰り返しによりポリマーを構成する構造単位を「繰り返し単位」という。ポリマー構造・物性DB31には、ポリマーごとに、繰り返し単位と、実験で予め得られた物性の実験値とが対応付けられて記憶されている。
 モデル作成部41は、モデル構造生成部43aと、部分構造数計算部43bと、原子数計算部43cと、部分構造数密度計算部43dと、次元削減部43eと、回帰モデル構築部43fとを処理部として有する。モデル構造生成部43a及び次元削減部43eのいずれか一方又は両方の省略が可能である。
 モデル構造生成部43aは、ポリマー構造・物性DB31から繰り返し単位を取得し、取得した繰り返し単位を複製し連結する処理を所定回数繰り返してモデル構造33aを生成する。繰り返し単位は、部分構造を包含する。また、繰り返し単位は、部分構造の全体であってもよい。複数の繰り返し単位が連結されることでポリマーが表される。
 生成されたモデル構造33aは、記憶部130に記憶される。繰り返し単位及びモデル構造33aは、所定の形式で表されればよい。第1の機能構成例では、SMILES(Simplified Molecular Input Line Entry Syntax))記法で繰り返し単位及びモデル構造33aを表す場合で説明するが、この表記形式に限定されない。
 部分構造数計算部43bは、モデル構造33aに基づいて部分構造数33bを計算する。部分構造数33bは、n次元のベクトルで表され、記憶部130に記憶される。また、原子数計算部43cは、モデル構造33aに基づいて原子数33cを計算する。得られた原子数33cは、記憶部130に記憶される。
 部分構造数密度計算部43dは、部分構造数33bと原子数33cとを用いて、部分構造数密度33dを算出する。部分構造数密度33dは、
     部分構造数密度 = 部分構造数 ÷ 原子数
により得られる。得られた部分構造数密度33dは、部分構造数33bと同じn次元のベクトルで表され、記憶部130に記憶される。
 次元削減部43eは、部分構造数密度33dと実験値とを用いて仮回帰モデルを構築し、予め定めた次元削減方法に基づいて仮回帰モデルの次元数を削減することで、重要部分構造33eを得る。重要部分構造33eは、記憶部130に記憶される。重要部分構造33eは、部分構造数密度33dにおいて、構築する回帰モデル33fの予測精度に寄与するであろう要素(例えば、ベクトル)を指定したデータである。
 次元削減方法は、使用する回帰分析の手法に応じた手順を予め定めておく。例えば、ラッソ回帰を用いた場合、0の係数項を削除することで次元を削減できる。ランダムフォレスト回帰を用いた場合、説明変数の重要度を計算し、重要度が閾値以下の変数を除外することにより次元を削減できる。ステップワイズ法は、仮回帰モデルを構築する際に、説明変数を1つづつ加えていく又は減らしていくことで、最も予測精度が高い説明変数の組み合わせを探索することにより次元を削減する。
 回帰モデル構築部43fは、部分構造数密度33dと実験値とを用いて、次元削減部43eによって得られた重要部分構造33eに基づく回帰分析を行い、回帰モデル33fを構築する。回帰モデル33fが記憶部130に保存される。
 次元削減部43e及び回帰モデル構築部43fにおいて、実験値はポリマー構造・物性DB31から取得できる。そして、回帰モデル構築部43fで得られる回帰モデル33fは、
     y=f(x)
で表し、部分構造数密度33dを変数xに代入することで、ある物性の予測値yを得る。
 仮回帰モデル及び回帰モデル33fを取得する回帰分析には、ラッソ回帰、ランダムフォレスト回帰、ステップワイズ法、部分線形回帰、リッジ回帰、カーネルリッジ回帰、サポートベクター回帰、決定木回帰、ガウス過程回帰等のいずれも適用可能である。一例として、ラッソ回帰により仮回帰モデルを取得し、ガウス過程回帰により回帰モデル33fを取得することができる。
 次に、物性予測部45は、ユーザにより指定されたポリマー構造6aの入力に応じて、回帰モデル33fを用いて、ポリマー構造6aに基づいて、ポリマー物性を予測する。ポリマー構造6aは、SMILES記法等により繰り返し単位が指定されればよい。そして、物性予測部45は、ポリマー構造入力部47aと、ポリマー物性予測部47bとを処理部として有する。
 ポリマー構造入力部47aは、ユーザによって指定されたポリマー構造6aを入力し、記憶部130に記憶する。ポリマー構造入力部47aは、ポリマー構造6aを、ネットワーク2を介して通信I/F17が受信することにより入力してもよいし、物性予測装置100の入力装置14等によるユーザのポリマー構造6aの指定に応じて入力してもよい。
 ポリマー物性予測部47bは、ポリマー構造6aからモデル構造、部分構造数、及び原子数を得て部分構造数密度を計算し、記憶部130に記憶された回帰モデル33fを用いて物性値を予測する。ポリマー構造6aに基づく、モデル構造、部分構造数、原子数、及び部分構造数密度の取得方法は、モデル作成部41と同様である。
 予測した物性値6bが記憶部130に出力される。ネットワーク2を介してポリマー構造6aが指定された場合には、得られた物性値6bはユーザの端末3に送信され表示される。物性予測装置100でのユーザの操作によりポリマー構造6aが指定された場合、得られた物性値6bは表示装置15に物性値6bが表示される。
 図4は、ポリマー構造・物性DBのデータ構成例を示す図である。図4において、ポリマー構造・物性DB31は、ポリマーごとに、繰り返し単位、屈折率等の種々の物性の実験値等を管理するデータベースであり、ポリマー名、繰り返し単位、屈折率、ガラス転移点等の項目を有する。
 ポリマー名は、ポリマー構造を特定する特定情報を示す。SMILES記法で繰り返し単位を示した例で説明するが、繰り返し単位の表記方法は、SMILES記法に限定されない。屈折率、ガラス転移点等は、予め実験により得られたポリマーの様々な物性の一例であり、物性の名称ごとに実験値が示される。
 この例では、ポリマー名「poly(ethylene)」に対して繰り返し単位「*CC*」が対応付けられ、屈折率「1.472」等の実験値が示されている。他のポリマーについても同様に、各物性の実験値が示される。
 モデル作成部41において、参照されるデータ、生成されたデータ等を作業テーブル32で管理してもよい。作業テーブル32は、部分構造数密度33dを求めたポリマーの繰り返し単位ごとに、算出した値を記録したテーブルであり、ポリマー名、繰り返し単位、原子数、部分構造数密度等の項目を有する。
 ポリマー名は、ポリマー構造・物性DB31に登録されたポリマー名を示す。部分構造数は、部分構造数計算部43bによって得られた部分構造数33bを示す。原子数は、原子数計算部43cによって得られた原子数33cを示す。部分構造数密度は、部分構造数密度計算部43dによって得られた部分構造数密度33dを示す。
 作業テーブル32の部分構造数密度と、ポリマー構造・物性DB31の物性の実験値とが回帰分析による機械学習に用いられる。このことから、作業テーブル32は、ポリマー名によって、ポリマー構造・物性DB31と関連付けられてもよい。なお、図4に示すポリマー構造・物性DB31及び作業テーブル32のデータ構成例は、一例に過ぎず、この例に限定されない。
 予測処理部40による予測処理全体の概要を、繰り返し単位の一例を用いて説明する。図5は、本実施の形態における予測処理の概要を説明するための図である。図5より、予測処理部40のモデル作成部41において、モデル構造生成部43aがポリマー構造・物性DB31から繰り返し単位を取得する(図5(a))。例えば、繰り返し単位「*CCO*」を得る。以下、SMILES記法において、ある構造を表す開始及び終了を示す「*」を省略して説明する。
 モデル構造生成部43aは、取得した部分構造を繰り返し単位とし、繰り返し単位を複製してモデル構造33aを生成する(図5(b))。この例では、モデル構造生成部43aは、繰り返し単位「CCO」を右側に予め定めた回数分繰り返して複製し、複数の繰り返し単位「CCO」が連結された「CCOCCOCCOCCOCCOCCOCCOCCOCCOCCO」のモデル構造33aを記憶部130に生成する。
 部分構造数計算部43bは、構造モデル33aの部分構造数ベクトルx(部分構造数33b)を生成する(図5(c))。部分構造数ベクトルxは、ECFP(Extended Circular FingerPrint)、Atom Pair、Topological Torsion、Neural Finger Print等の構造記述子によりn次元で表される。第1の機能構成例では、C原子数、O原子数、COC数等で表される構造記述子で説明するが、この構造記述子に限定されない。
 この構造モデル「CCOCCOCCOCCOCCOCCOCCOCCOCCOCCO」の場合、C原子数「20」、O原子数「10」、・・・、COC数「9」によるn次元の部分構造数ベクトルxが生成される。「C」、「O」、「COC」等の各ベクトルに割り当てられた構造がポリマーの部分構造の種別を示している。なお、nは任意の自然数である。通常256~2048程度になることが多い。
 そして、原子数計算部43cは、モデル構造33aに含まれる原子数を計算する(図5(d))。構造モデル「CCOCCOCCOCCOCCOCCOCCOCCOCCOCCO」の場合、原子数は「30」個である。
 部分構造数密度計算部43dは、図5(b)において部分構造数計算部43bによって得られた部分構造数ベクトルx(部分構造数33b)と、図5(c)において原子数計算部43cによって得られた原子数33cで割ることにより、部分構造数密度ベクトルx(部分構造数密度33d)を生成する(図5(e))。
 具体的には、構造モデル「CCOCCOCCOCCOCCOCCOCCOCCOCCOCCO」の場合、部分構造数ベクトルxの各値を原子数「30」で割ることにより、C原子数の密度「2/3(=20/30)」、O原子数の密度「1/3(=10/30)」、・・・・、COCの密度「9/30」を示す部分構造数密度ベクトルxを得る。部分構造数密度ベクトルxの次元数は、部分構造数ベクトルxと同じn次元ベクトルである。
 ポリマー構造・物性DB31の各レコードに対して図5(a)から図5(e)を繰り返す。得られた部分構造数33b、原子数33c、及び部分構造数密度33dを、ポリマー名に対応付けて作業用テーブル32に記憶してもよい。
 回帰モデル33fを構築する前に、次元削減部43eにより仮回帰モデルが構築され、次元削減が行われる(図5(f))。これにより、n次元をn'次元(n'<n)に削減することができる。次元削減により、予測精度に寄与する重要部分構造33eが特定される。なお、n'は、nより少ない自然数であり、通常16~128程度になることが多い。
 回帰モデル構築部43fは、重要部分構造33eに基づいて、物性値の予測に用いる回帰モデル33fを構築する(図5(g))。数十次元にまで削減された回帰モデル33fを得る。回帰モデル33fは、部分構造数密度ベクトルx(部分構造数密度33d)によってポリマー物性の予測値yを得る式(1)
     y=f(x)          (1)
で表される。次元が削減されない場合、部分構造数密度ベクトルxの個数は、次元数のnであるが、次元削減後には、部分構造数密度ベクトルxの次元はn'個となる。重要部分構造33eにより、予測精度に寄与する次元のみを用いて予測値を算出するため、効率よく物性予測処理を行える。
 上述した図5(a)~図5(e)による処理が、モデル作成部41のモデル作成処理に相当する。モデル作成処理が行われた後、ユーザから所望のポリマー構造6aの入力を受け付けると、物性予測部45による物性予測処理が行われる。
 物性予測部45では、物性を求めたいポリマー構造Aの入力に応じて、部分構造数密度ベクトルxを生成し、物性値yを予測する(図5(h))。ポリマー構造入力部47aがポリマー構造Aを入力し、ポリマー物性予測部47bが回帰モデル33fを用いて物性値yを予測する。
 所望のポリマー構造Aに対する物性値yは、上記式(1)に部分構造数密度xを代入することで、
     y=f(x)          (2)
により得られる。
 1つの物性に対する回帰モデル33fのみである場合には、予め定められた物性の値が予測される。様々な物性のそれぞれに対して回帰モデル33fを取得している場合、ユーザは、ポリマー構造Aと、それら全て又は特定の物性とを指定すればよい。この場合、ポリマー物性予測部47bは、物性ごとに対応する回帰モデル33fと重要部分構造33eとを用いて物性値6bを予測する。
 なお、図5(c)における部分構造数33bの計算処理と図5(d)における原子数の計算処理の順番は問わない。原子数33cの計算処理を行った後、部分構造数33bの計算処理を行ってもよいし、並列に行ってもよい。また、本実施の形態において、物性の「予測値」と、予測した「物性値」とは同義である。
 第1の機能構成例では、予測処理部40の部分構造数密度計算部43dにより、同じポリマー構造を認識することができる。図6は、数密度の例を示す図である。図6では、ポリエチレンオキサイドの炭素数を例として説明する。
 図6を参照して、構造Aと構造Bとを比較すると、構造Bは、構造Aより表記が長く異なっている。しかしながら、構造Aと構造Bのそれぞれで表されるポリマーは全く同じポリマーである。
 単に、部分構造数を構造記述子とした既存の技術では、構造Aの炭素数は「2」であり、構造Bの炭素数は「4」となり構造Aとは異なっているため、誤って異なるポリマーであると認識してしまう。つまり、この例から、繰り返し単位の長さが異なるポリマーを比較する場合は、部分構造の数は、適切にポリマーの構造的特徴を捉えることが出来ないことがわかる。
 一方、第1の機能構成例では、部分構造数密度計算部43dにより、構造Aと構造Bに対して同じ部分構造数密度(炭素数密度)「2/3」を得る。従って、次元削減部43eと、回帰モデル構築部43fとにおいて、構造Aと構造Bは、正しく同じポリマーを表していると認識できる。このような例に基づき、発明者は、部分構造数密度33dを用いることで、繰り返し単位の長さが異なるポリマーでも等価に扱えることを見出した。
 また、発明者は、繰り返し単位を連結しながら複製することにより、予測精度が悪い既存の技術を改善できることを見出した。複製の有無による差異について図7で説明する。図7は、繰り返し単位の複製の有無による差異を説明するための図である。図7においても、ポリエチレンオキサイドを例とするが、繰り返し単位は、複製の有無とにおいて同一である。
 複製しない場合、繰り返し単位の両端に、本来存在する部分構造「COC」が存在しない。したがって、COCの数密度は「0」となる。一方で、第1の機能構成例では、繰り返し単位が複製され、繰り返し単位の右側が次の繰り返し単位の左側の酸素原子と連結される。2つの繰り返し単位により、部分構造「COC」が出現し、本来の存在する部分構造「COC」の数密度に関して「1/6」を得られる。第1の機能構成例では、このようにして得られた部分構造数密度33dを用いて回帰モデル33fを取得するため、既存の技術の予測精度を改善できる。
 上述より、予測処理部40による予測処理は、図8A及び図8Bに示すように行われる。図8A及び図8Bは、予測処理を説明するためのフローチャート図である。先ず、モデル作成部41によりモデル作成処理P51を行う。
 モデル作成部41において、モデル構造生成部43aは、ポリマー構造・物性DB31から1レコードを選択して読み込み、繰り返し単位と実験値とを取得する(ステップS511)。そして、モデル構造生成部43aは、取得した繰り返し単位を複製して連結する操作を所定回数繰り返し、モデル構造33aを生成する(ステップS512)。
 部分構造数計算部43bは、モデル構造33aの部分構造数33bを、予め定めた構造記述子(例えば、ECFP等)を用いて計算する(ステップS513)。また、原子数計算部43cは、モデル構造33aの原子数33cを計算する(ステップS514)。なお、ステップS514を行った後、ステップS513を行ってもよい。或いは、ステップS513及びS514を並列に処理してもよい。
 部分構造数密度計算部43dは、部分構造数33bを原子数33cで割ることにより部分構造数密度33dを算出する(ステップS515)。上述したように、部分構造数33b及び部分構造数密度33dは、n次元ベクトルで表される。
 モデル作成部41は、ポリマー構造・物性DB31の全レコードを終了したか否かを判断する(ステップS516)。全レコードを終了していない場合(ステップS516のNO)、モデル作成部41は、ステップS511に戻り、上述同様の処理を行う。
 全レコードを終了した場合(ステップS516のYES)、次元削減部43eにより、重要部分構造33eに対応する部分構造数密度33dを変数x'とし、実験値y'として、仮回帰モデルf'を求める1回目の回帰分析を行う。次元削減部43eは、予め定めた次元削減方法により仮回帰モデルf'の次元を削減して、重要部分構造33eを取得する(ステップS517)。
 次に、回帰モデル構築部43fによる2回目の回帰分析が行われる。回帰モデル構築部43fは、重要部分構造33eに対応する部分構造数密度33dを変数xとし、実験値yとして、回帰モデルfを求める(ステップS518)。実験値yは、ポリマー構造・物性DB31において、ポリマー名と物性とで特定される値である。回帰モデルf、即ち、回帰モデル33fが記憶部130に記憶される。
 ポリマー構造・物性DB31に登録されている物性の全て又は一部について回帰モデルfを求める場合には、物性ごとに実験値を取得して、ステップS517からS518を繰り返し行えばよい。
 その後、物性予測部45による物性予測処理P55が行われる。予測処理部40において、ポリマー構造入力部47aは、ポリマー構造6aを受け付けると(ステップS521)、ポリマー構造6aを繰り返し単位として、モデル構造、部分構造数、原子数、及び部分構造数密度を得る(ステップS522)。ポリマー構造6aのモデル構造、部分構造数、原子数、及び部分構造数密度は、モデル作成処理P51におけるステップS512~S515と同様の処理を行うことにより得られる。
 ポリマー物性予測部47bは、ステップS517で得られた重要部分構造33eに基づいて、ポリマー構造6aの部分構造数密度の次元を削減して、ステップS518で得られた回帰モデルf(記憶部130に記憶された回帰モデル33f)を用いて、物性値6bを予測する(ステップS524)。得られた物性値6bは、端末3へ送信又は表示装置15に表示される。
 複数の物性のそれぞれに対応する回帰モデル33fを作成した場合、図9に示すようなテーブルで作成した回帰モデル33fを管理しておくことが望ましい。図9は、回帰モデル管理テーブルのデータ構成例を示す図である。
 図9において、回帰モデル管理テーブル33kは、物性ごとの回帰モデル33fを管理するテーブルであり、物性、回帰モデル、重要部分構造等の項目を有する。物性は、屈折率、ガラス転移点等の物性を特定するための名称を示す。回帰モデルは、回帰モデル構築部43fで構築された、物性に対応する回帰モデル33fを示す。
 重要部分構造は、回帰モデル33fを用いるための、次元削減後に得られた部分構造数密度33dのベクトルのうち有効とするベクトル(次元削減後の有効ベクトル)を特定する。次元削減処理を省略する場合には、重要部分構造の項目は省略される。
 物性予測部45において、ポリマー物性予測部47bは、回帰モデル管理テーブル33kから、予測する物性に対応付けられた回帰モデル33fと重要部分構造33eとを取得すればよい。
 発明者は、後述される、種々の機能構成の違いによる予測精度の検証を行っている。検証結果によれば、上述した第1の機能構成例が最も予測精度を改善できた。また、モデル構造生成部43a及び次元削減部43eのいずれか一方又は両方が省略された構成であっても十分に予測精度を改善できることが、発明者により検証されている。
 先ず、予測精度を検証した他の機能構成例について以下に説明する。モデル構造生成部43a及び次元削減部43eの両方を省略した場合を第2の機能構成例とし、モデル構造生成部43aを省略した場合を第3の機能構成例とし、次元削減部43eを省略した場合を第4の機能構成例として説明する。第2の機能構成例~第4の機能構成例では、図3に示す第1の機能構成例と同様の処理部には同じ符号を付し、その詳細な説明を省略する。
 [第2の機能構成例] 
 図10は、物性予測装置の第2の機能構成例を示す図である。図10において、第2の機能構成例では、図3に示す第1の機能構成例のうち、モデル構造生成部43aと次元削減部43eとが省略され、したがって、モデル構造33aと重要部分構造33eとは生成されない。
 モデル作成部41において、部分構造数計算部43b及び原子数計算部43cは、ポリマー構造・物性DB31から繰り返し単位を取得して、部分構造数33b及び原子数33cを取得する。
 第2の機能構成例においても、部分構造数密度計算部43dにより部分構造数密度33dが計算される。そして、回帰モデル構築部43fは、計算された部分構造数密度33dと、物性の実験値とを用いて、回帰モデル33fを得る。
 物性予測部45では、ポリマー構造入力部47aがポリマー構造6aを入力すると、ポリマー物性予測部47bは、モデル構造33aを作成せず、ポリマー構造6aを用いて、部分構造数及び原子数を計算する。そして、ポリマー物性予測部47bは、得られた部分構造数を原子数で割ることにより部分構造数密度を取得し、部分構造数密度33dを用いて、回帰モデル33fにより物性値6bを取得する。
 第2の機能構成例では、回帰分析は1回のみ行われる。また、回帰モデル33fの次元数は、部分構造数密度33dと同じであり、重要部分構造33eは特定されない。しかしながら、部分構造数密度33dにより、その値が同じであれば、繰り返し単位の長さが異なるポリマーであっても等価に扱うことができ、予測精度を十分に改善できる。
 [第3の機能構成例] 
 図11は、物性予測装置の第3の機能構成例を示す図である。図11において、第3の機能構成例では、図3に示す第1の機能構成例のうち、モデル構造生成部43aが省略され、したがって、モデル構造33aは生成されない。
 第2の機能構成例と同様に、モデル作成部41では、部分構造数計算部43b及び原子数計算部43cが、ポリマー構造・物性DB31から繰り返し単位を取得して、部分構造数33b及び原子数33cを取得する。部分構造数密度計算部43dにより部分構造数密度33dを得る。そして、次元削減部43eにより重要部分構造33eを取得し、部分構造数密度33dの次元を削減して、回帰モデル構築部43fにより回帰モデル33fが出力される。
 物性予測部45では、ポリマー構造入力部47aがポリマー構造6aを入力すると、ポリマー物性予測部47bは、モデル構造33aを作成せず、ポリマー構造6aを用いて、部分構造数及び原子数を計算する。そして、ポリマー物性予測部47bは、得られた部分構造数を原子数で割ることにより部分構造数密度を取得し、部分構造数密度33dに基づいて部分構造数密度の次元数を削減したのち、回帰モデル33fを用いて物性値6bを出力する。
 第3の機能構成例では、部分構造数密度33dにより、その値が同じであれば、繰り返し単位の長さが異なるポリマーであっても等価に扱うことができる。また、モデル構造33aは生成されないが、次元削減部43eにより重要部分構造33eが特定されるため、回帰モデル構築部43fによって生成された回帰モデル33fの予測精度をより改善できる。
 [第4の機能構成例] 
 図12は、物性予測装置の第4の機能構成例を示す図である。図12において、第4の機能構成例では、図3に示す第1の機能構成例のうち、次元削減部43eが省略され、したがって、重要部分構造33eは生成されない。
 モデル作成部41では、モデル構造生成部43aによってモデル構造33aが作成され、部分構造数計算部43b及び原子数計算部43cによって、モデル構造33aに基づく部分構造数33b及び原子数33cが得られる。
 物性予測部45では、ポリマー構造入力部47aがポリマー構造6aを入力すると、ポリマー物性予測部47bは、モデル構造33aを作成して、モデル構造33aを用いて部分構造数及び原子数を計算する。そして、ポリマー物性予測部47bは、得られた部分構造数を原子数で割ることにより部分構造数密度を取得し、部分構造数密度33dを用いて、回帰モデル33fにより物性値6bを得る。ポリマー構造6aから得られた部分構造数密度の次元は削減されない。
 第4の機能構成例では、部分構造数密度33dにより、その値が同じであれば、繰り返し単位の長さが異なるポリマーであっても等価に扱うことができる。また、重要部分構造33eは作成されないが、モデル構造33aと部分構造数密度33dとにより、回帰モデル構築部43fによって生成された回帰モデル33fの予測精度を改善できる。
 次に、既存の技術に基づく機能構成例を比較例として説明する。 
 [既存の機能構成例] 
 図13は、既存の技術に基づく物性予測装置の機能構成例を示す図である。図13において、物性予測装置9は、既存の技術に基づく機能構成を有する。図13に示す比較例では、物性予測装置9の予測処理部90は、モデル作成部91と、物性予測部95とを有する。
 モデル作成部91は、回帰モデル83fを作成する処理部であり、部分構造数計算部93bと、回帰モデル構築部98fとを有する。部分構造数計算部93bは、ポリマー構造・物性DB31から繰り返し構造を取得し、部分構造数83bを求めて記憶部130に記憶する。回帰モデル構築部93fは、部分構造数83bと、ポリマー構造・物性DB31から得られる実験値とを用いて回帰分析を行って回帰モデル83fを構築し、記憶部130に記憶する。
 物性予測部95は、ユーザが所望するポリマー構造6aに対して、回帰モデル83fに適用することにより、物性値を予測する処理部であり、ポリマー構造入力部97aと、ポリマー物性予測部97bとを有する。ポリマー構造入力部97aは、ポリマー構造6aを受け付けると記憶部130に記憶する。ポリマー物性予測部97bは、ポリマー構造6aの部分構造数を求めて、得られた部分構造数を回帰モデル83fに適用することで予測された物性値6bを得る。物性値6bはユーザに提示される。
 [予測精度の検証] 
 次に、比較例としての機能構成例、第1~第4の機能構成例のそれぞれの予測精度を検証した結果を説明する。各機能構成例において、発明者は、屈折率を予測する場合で検証を行った。
 (実施例1)
 実施例1では、モデル構造生成部43aと次元削減部43eとが省略される第2の機能構成例(図10)で検証を行った。実施例1では、モデル構造33aは生成されない。また、回帰分析は、回帰モデル構築部43fにより1回のみ行われる。
 上述した第2の機能構成例において、ポリエチレン、ポリプロピレンなど一般的な無限直鎖ポリマー51種の構造(即ち、繰り返し単位)と、屈折率の実験値とを訓練データとした。構造記述子として、ECFP4を用いた。ここでECFP4は、半径4、1024次元のECFPを表す。以下、ECFP記述子という。
 ECFP記述子は、ベクトルにより表され、各次元が部分構造の種類を表し、各次元の値が部分構造の数に相当する。ECFP記述子の生成には、RDKit等のソフトウェアを用いた。便宜上、ECFP記述子を部分構造数記述子と定義する。その後、構成原子数で部分構造数記述子の各成分を割ることにより、部分構造数密度記述子を得る。
 回帰手法として、ガウス過程回帰を用いた。説明変数として部分構造数密度記述子を用い、目的変数として屈折率の実験値を用いて回帰モデル33fを構築した。
 リーブワンアウト交差検証によりデータセットを学習用と検証用とに分割し、学習用データセットを用いて、ハイパーパラメータチューニングを実施したのち回帰モデルを構築し、検証用データセットを用いて非学習ポリマーの屈折率の予測精度を検証した。予測精度の評価指標として、決定係数Rと平均二乗誤差平方(RMSE:Root Mean Squared Error)とを用いた。Rの定義式は様々存在するが、今回は以下の定義式を用いた。
Figure JPOXMLDOC01-appb-M000001

ここで、yはi番目のポリマーの実験値、y_barは実測の平均値、fはi番目のポリマーの予測値である。
 上述において、構成原子数は繰り返し単位の原子数に相当し、部分構造数記述子は部分構造数33bに相当し、部分構造数密度記述子は部分構造数密度33dに相当する。
 (実施例2)
 実施例2では、モデル構造生成部43aが省略される第3の機能構成例(図11)で検証を行った。モデル構造33aが生成されないため、ポリマー構造・物性DB31の繰り返し単位から部分構造数密度33dが求められる。回帰分析は、次元削減部43eと、回帰モデル構築部43fとで2回行われる。
 回帰モデル33fを構築する前に、部分構造数密度33dと、ポリマー構造・物性DB31から得られるポリマーの物性の実験値から、次元削減部43eによって、ラッソ回帰モデル(仮回帰モデルに相当)を構築し、係数が0である変数を除外して次元削減を行った。また、回帰モデル構築部43fでは、実施例1と同様に、ガウス過程回帰により回帰モデル33fを構築した。そして、実施例1と同様の方法によって、屈折率の予測精度の検証を実施した。
 (実施例3)
 実施例3では、次元削減部43eが省略される第4の機能構成例(図12)で検証を行った。重要部分構造33eは取得されない。部分構造数密度33dの次元数で回帰モデル33fが構築される。
 先ず、10個の繰り返し単位をモデル構造33aとして生成したのち、部分構造数記述子と原子数とを算出し、部分構造数密度記述子を算出した。部分構造数密度記述子を算出した後は、実施例1と同様の方法によって屈折率の予測値を求め、予測精度の検証を行った。
 (実施例4)
 実施例4では、重要部分構造33e及び次元削減部43eを含む第1の機能構成例(図3)で検証を行った。
 先ず、10個の繰り返し単位をモデル構造33aとして生成したのち、部分構造数記述子と原子数とを算出し、部分構造数密度記述子を算出した。また、次元削減部43eによって、ラッソ回帰モデル(仮回帰モデルに相当)を構築し、係数が0である変数を除外して次元削減したのち、ガウス過程回帰により回帰モデル33fを構築した。そして、実施例1と同様の方法によって、屈折率の予測精度の検証を実施した。
 (比較例1)
 比較例1では、部分構造数計算部93bと回帰モデル構築部93fのみで回帰モデル83fを求める既存の機能構成例(図13)で検証を行った。
 部分構造数計算部93bによって、繰り返し単位を用いて得られた部分構造数83b(部分構造数記述子)と、屈折率の実験値とから回帰モデル83fを得る。回帰モデル83fは、実施例1と同様の方法で、ガウス過程回帰を用いて構築した。また、予測精度の検証も実施例1と同様の方法で行った。
 図14は、評価結果例を示す図である。図14では、上述したように、比較例1、実施例1~実施例4のそれぞれに対して行った屈折率の予測精度の評価結果を示している。評価結果として、R2とRMSEの各結果を示している。
 R2の評価結果では、比較例1の「-0.063」に対して、実施例1では「0.890」、実施例2では「0.900」、実施例3では「0.932」、そして、実施例4では「0.950」を示した。R2では、「1」に近づくほど予測精度が高い。従って、この評価結果より、本実施の形態におけるいずれの機能構成例であっても、有意に予測精度を改善できることが分かる。
 また、RMSEの場合、比較例1の「0.084」に対して、実施例1では「0.027」、実施例2では「0.026」、実施例3では「0.021」、そして、実施例4では「0.018」を示した。RMSEでは、「0」に近づくほど予測精度が高い。従って、この評価結果においても、本実施の形態における全ての機能構成例において、有意に予測精度を改善できることが分かる。
 このような評価結果から、本実施の形態における、発明者が着目した部分構造数密度33dが予測精度の改善に大きく貢献しているといえる。
 物性予測装置100を利用することで、予め物性値を予測しておくことができるため、製造すべきポリマー構造6aを精度よく選別することが可能となる。従って、ポリマー製造に係る費用、時間等の無駄を削減できる。
 以上より、本実施の形態によれば、ポリマーの構造に基づいて構造記述子を生成することで、高精度にポリマー物性を予測できる。
 次に、所望のポリマー構造6aと、予測した物性値とを用いて、ポリマーを製造する方法について説明する。図15は、ポリマーの製造方法の一例を示す図である。
 図15より、本実施形態におけるポリマーの製造方法は、本実施形態におけるポリマーの物性予測方法により予測された物性値を有するポリマー構造を得るステップ(S601)と、上記ポリマー構造を構成するための原料を準備するステップ(S602)と、上記原料を反応させて、上記ポリマー構造で表されるポリマーを得るステップ(S603)と、を含む。
 S601においては、入力したポリマー構造の中から、所定の物性値を有すると予測されるポリマーの構造を適宜選択する。例えば、入力したポリマー構造の中から、屈折率が所定の範囲内であるポリマー構造を選択する。
 S602においては、S1において、選択されたポリマー構造を構成するための、原料として、モノマー、オリゴマー等の原料を準備する。例えば、選択されたポリマー構造がポリエチレンである場合、エチレンを準備する。
 S603においては、S602において、準備された原料を反応させて、S601において、選択されたポリマー構造で表されるポリマーを得る。例えば、エチレンを重合して、ポリエチレンを合成する。
 本発明は、具体的に開示された実施例に限定されるものではなく、特許請求の範囲から逸脱することなく、主々の変形や変更が可能である。
 本出願は、2018年3月9日に日本国特許庁に出願された特願2018-043171号に基づく優先権を主張するものであり、特願2018-043171号の全内容を本国際出願に援用する。
 2      ネットワーク
 3      端末
 6a     ポリマー構造
 6b     物性値
 31     ポリマー構造・物性DB
 33a    モデル構造
 33b    部分構造数
 33c    原子数
 33d    部分構造数密度
 33e    重要部分構造
 33f    回帰モデル
 40     予測処理部
 41     モデル作成部
 43a    モデル構造生成部
 43b    部分構造数計算部
 43c    原子数計算部
 43d    部分構造数密度計算部
 43e    次元削減部
 43f    回帰モデル構築部
 45     物性予測部
 47a    ポリマー構造入力部
 47b    ポリマー物性予測部
 100    物性予測装置

Claims (14)

  1.  記憶部から繰り返しによりポリマーを構成する構造単位を読み込み、該構造単位を用いて、該ポリマーの部分構造の数を計算する部分構造数計算部と、
     前記構造単位の原子数を計算する原子数計算部と、
     前記部分構造の数と前記構造単位の原子数とから該部分構造の数密度を計算する部分構造数密度計算部と、
     前記記憶部から得られる前記ポリマーの物性の実験値と、前記部分構造の数密度とを用いて、物性値を予測する回帰モデルを構築する回帰モデル構築部と、
     前記物性値を予測したいポリマー構造を入力するポリマー構造入力部と、
     前記回帰モデルを用いて、入力した前記ポリマー構造に対応する前記物性値を予測するポリマー物性予測部と、
    を備えるポリマーの物性予測装置。
  2.  前記部分構造数計算部は、前記ポリマーの部分構造の種類をアルゴリズムに基づき特定し、該種類の数を前記部分構造の数とする請求項1に記載のポリマーの物性予測装置。
  3.  前記部分構造数密度計算部により得られた前記部分構造の数密度の一部を削除する削除部を備える請求項1又は2に記載のポリマーの物性予測装置。
  4.  前記記憶部から得られた前記構造単位を複数用いてモデル構造を生成するモデル構造生成部を備える請求項1又は2に記載のポリマーの物性予測装置。
  5.  前記記憶部から得られた前記構造単位を複数用いてモデル構造を生成するモデル構造生成部と、
     前記部分構造数密度計算部により得られた前記部分構造の数密度を示す構造記述子の一部を削除する次元削減部とを備え、
     前記部分構造数計算部と原子数計算部は、生成された前記モデル構造から、前記部分構造の数と原子の数を計算する請求項1又は2に記載のポリマーの物性予測装置。
  6.  ポリマー物性予測部は、入力した前記ポリマー構造を用いて、該ポリマー構造の部分構造の数と原子数とを計算し、得られた該部分構造と該原子数とから該部分構造の数密度を計算し、前記回帰モデル構築部によって構築された前記回帰モデルに対して、得られた該数密度を適用することで、該ポリマー構造の該物性値を予測する請求項1に記載のポリマーの物性予測装置。
  7.  ポリマー物性予測部は、入力した前記ポリマー構造を用いて、該ポリマー構造の部分構造の数と原子数とを計算し、得られた該部分構造と該原子数とから該部分構造の数密度を計算し、得られた該部分構造の数密度の一部を削除し、前記回帰モデル構築部によって構築された前記回帰モデルに対して、該一部が削除された該数密度を適用することで、該ポリマー構造の該物性値を予測する請求項3に記載のポリマーの物性予測装置。
  8.  ポリマー物性予測部は、入力した前記ポリマー構造を用いて、該ポリマー構造を複数用いてモデル構造を生成し、該モデル構造の部分構造の数と原子数とを計算し、得られた該部分構造と該原子数とから該部分構造の数密度を計算し、前記回帰モデル構築部によって構築された前記回帰モデルに対して、得られた該数密度を適用することで、該ポリマー構造の該物性値を予測する請求項4に記載のポリマーの物性予測装置。
  9.  ポリマー物性予測部は、入力した前記ポリマー構造を用いて、該ポリマー構造を複数用いてモデル構造を生成し、該モデル構造の部分構造の数と原子数とを計算し、得られた該部分構造と該原子数とから該部分構造の数密度を計算し、得られた該部分構造の数密度を示す構造記述子の一部を削除し、前記回帰モデル構築部によって構築された前記回帰モデルに対して、該一部が削除された該数密度を適用することで、該ポリマー構造の該物性値を予測する請求項5に記載のポリマーの物性予測装置。
  10.  コンピュータに、
     記憶部から繰り返しによりポリマーを構成する構造単位を読み込み、該構造単位を用いて、該ポリマーの部分構造の数を計算するステップと、
     前記構造単位の原子数を計算するステップと、
     前記部分構造の数と前記構造単位の原子数とから該部分構造の数密度を計算するステップと、
     前記記憶部から得られる前記ポリマーの物性の実験値と、前記部分構造の数密度とを用いて、物性値を予測する回帰モデルを構築するステップと、
     前記回帰モデルを用いて、前記物性値を予測したいポリマー構造を入力するステップと、
     入力した前記ポリマー構造に対応する前記物性値を予測するステップと、
    を実行させるポリマーの物性予測プログラムを記憶した記憶媒体。
  11.  前記予測するステップは、入力した前記ポリマー構造を用いて、該ポリマー構造の部分構造の数と原子数とを計算し、得られた該部分構造と該原子数とから該部分構造の数密度を計算し、前記回帰モデルに対して、得られた該数密度を適用することで、該ポリマー構造の該物性値を予測する請求項10に記載の記憶媒体。
  12.  コンピュータが、
     記憶部から繰り返しによりポリマーを構成する構造単位を読み込み、該構造単位を用いて、該ポリマーの部分構造の数を計算するステップと、
     前記構造単位の原子数を計算するステップと、
     前記部分構造の数と前記構造単位の原子数とから該部分構造の数密度を計算するステップと、
     前記記憶部から得られる前記ポリマーの物性の実験値と、前記部分構造の数密度とを用いて、物性値を予測する回帰モデルを構築するステップと、
     前記物性値を予測したいポリマー構造を入力するステップと、
     前記回帰モデルを用いて、入力した前記ポリマー構造に対応する前記物性値を予測するステップと、
    を実行するポリマーの物性予測方法。
  13.  前記予測するステップは、入力した前記ポリマー構造を用いて、該ポリマー構造の部分構造の数と原子数とを計算し、得られた該部分構造と該原子数とから該部分構造の数密度を計算し、前記回帰モデルに対して、得られた該数密度を適用することで、該ポリマー構造の該物性値を予測する請求項12に記載のポリマーの物性予測方法。
  14.  請求項12又は13に記載のポリマーの物性予測方法により予測された物性値を有するポリマー構造を得るステップと、
     前記ポリマー構造を構成するための原料を準備するステップと、
     前記原料を反応させて、前記ポリマー構造で表されるポリマーを得るステップと、
    を含むポリマーの製造方法。
PCT/JP2019/008704 2018-03-09 2019-03-05 ポリマーの物性予測装置、記憶媒体、及びポリマーの物性予測方法 Ceased WO2019172280A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP19763785.3A EP3764252B1 (en) 2018-03-09 2019-03-05 Polymer physical property prediction device, storage medium, and polymer physical property prediction method
JP2019538694A JP6633820B1 (ja) 2018-03-09 2019-03-05 ポリマーの物性予測装置、プログラム、及び方法
CN201980017349.7A CN111819441B (zh) 2018-03-09 2019-03-05 聚合物的物理性质预测装置、存储介质、及聚合物的物理性质预测方法
US17/008,999 US11915799B2 (en) 2018-03-09 2020-09-01 Polymer physical property prediction device, recording medium, and polymer physical property prediction method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-043171 2018-03-09
JP2018043171 2018-03-09

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/008,999 Continuation-In-Part US11915799B2 (en) 2018-03-09 2020-09-01 Polymer physical property prediction device, recording medium, and polymer physical property prediction method

Publications (1)

Publication Number Publication Date
WO2019172280A1 true WO2019172280A1 (ja) 2019-09-12

Family

ID=67847075

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/008704 Ceased WO2019172280A1 (ja) 2018-03-09 2019-03-05 ポリマーの物性予測装置、記憶媒体、及びポリマーの物性予測方法

Country Status (5)

Country Link
US (1) US11915799B2 (ja)
EP (1) EP3764252B1 (ja)
JP (2) JP6633820B1 (ja)
CN (1) CN111819441B (ja)
WO (1) WO2019172280A1 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020166299A1 (ja) * 2019-02-12 2020-08-20 株式会社日立製作所 材料特性予測装置および材料特性予測方法
WO2021054026A1 (ja) * 2019-09-18 2021-03-25 株式会社日立製作所 材料特性予測システムおよび材料特性予測方法
JPWO2021079985A1 (ja) * 2019-10-25 2021-04-29
JP2021102732A (ja) * 2019-12-25 2021-07-15 太陽ホールディングス株式会社 コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造
JP2021117798A (ja) * 2020-01-28 2021-08-10 国立大学法人山形大学 分子設計支援システム、分子特性値予測方法、分子設計支援プログラム
CN113326664A (zh) * 2021-06-28 2021-08-31 南京玻璃纤维研究设计院有限公司 一种基于m5p算法预测玻璃介电常数的方法
JP2022023482A (ja) * 2020-07-27 2022-02-08 ポーラ化成工業株式会社 予測モデルの学習方法
JPWO2022254835A1 (ja) * 2021-06-02 2022-12-08
WO2023058576A1 (ja) * 2021-10-04 2023-04-13 ダイキン工業株式会社 低分子化合物探索方法、プログラム、装置、およびシステム
WO2023120290A1 (ja) * 2021-12-20 2023-06-29 株式会社レゾナック 設計支援装置、設計支援方法、及びプログラム
WO2025169360A1 (ja) * 2024-02-07 2025-08-14 日本電気株式会社 情報処理装置、情報処理方法、及びプログラム

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7353874B2 (ja) * 2019-09-03 2023-10-02 株式会社日立製作所 材料特性予測装置および材料特性予測方法
WO2021110690A1 (en) * 2019-12-04 2021-06-10 Basf Se Method for determining material properties from foam samples
JP7577934B2 (ja) * 2020-06-10 2024-11-06 株式会社レゾナック 物性予測装置、物性予測方法及び製造方法
JP7219374B1 (ja) * 2021-06-23 2023-02-07 昭和電工株式会社 物性予測装置、物性予測方法、及びプログラム
EP4398257A4 (en) 2021-08-31 2025-08-20 Resonac Corp PROPERTY PREDICTION DEVICE, PROPERTY PREDICTION METHOD, AND PROGRAM
KR102865297B1 (ko) * 2021-10-26 2025-09-25 한화솔루션 주식회사 고분자 유리 전이 온도 예측 시스템
JP7806629B2 (ja) * 2022-07-08 2026-01-27 株式会社プロテリアル 複合材料の物性値予測装置、物性値予測プログラム及び物性値予測方法
WO2024054900A1 (en) * 2022-09-07 2024-03-14 Georgia Tech Research Corporation Systems and methods for predicting polymer properties
CN115616204A (zh) * 2022-12-21 2023-01-17 金发科技股份有限公司 一种聚对苯二甲酸乙二醇酯再生料的鉴别方法及系统
CN115862786A (zh) * 2022-12-26 2023-03-28 国网山东省电力公司济宁供电公司 基于纳米复合电介质材料的性能预测方法、装置及设备
US12587274B2 (en) 2023-03-28 2026-03-24 Quantum Generative Materials Llc Satellite optimization management system based on natural language input and artificial intelligence
US12603701B2 (en) 2023-12-27 2026-04-14 Quantum Generative Materials Llc Distributed satellite constellation management and control system
US12368503B2 (en) 2023-12-27 2025-07-22 Quantum Generative Materials Llc Intent-based satellite transmit management based on preexisting historical location and machine learning
WO2025169359A1 (ja) * 2024-02-07 2025-08-14 日本電気株式会社 情報処理装置、情報処理方法、及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06271823A (ja) * 1993-03-19 1994-09-27 Sekisui Chem Co Ltd 配合設計システム
JP2004514902A (ja) 2000-11-20 2004-05-20 ザ、プロクター、エンド、ギャンブル、カンパニー ポリマーの予測方法
WO2008116495A1 (en) * 2007-03-26 2008-10-02 Molcode Ltd Method and apparatus for the design of chemical compounds with predetermined properties
JP2018043171A (ja) 2016-09-12 2018-03-22 株式会社三谷バルブ エアゾール用スプレーキャップ、および、エアゾール

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5946045B2 (ja) 1976-08-10 1984-11-10 ソニー株式会社 磁気再生装置
US4365303A (en) * 1980-02-07 1982-12-21 The Perkin-Elmer Corporation Method and apparatus for determining the nature of an unknown chemical substance
CA2012139C (en) * 1990-03-08 2004-01-13 Michael P. Teter Apparatus and method for predicting physical and chemical properties of materials
US5260882A (en) * 1991-01-02 1993-11-09 Rohm And Haas Company Process for the estimation of physical and chemical properties of a proposed polymeric or copolymeric substance or material
JPH08255190A (ja) * 1995-03-17 1996-10-01 Sekisui Chem Co Ltd 粘着剤及び粘着テープの設計支援システム
CA2441931A1 (en) * 2001-03-23 2002-10-03 Douglas A. Levinson Method and system for high-throughput screening
US20150310162A1 (en) 2012-08-27 2015-10-29 Kyoto Constella Technologies Co., Ltd. Compound Design Device, Compound Design Method, And Computer Program
WO2015032505A1 (en) * 2013-09-06 2015-03-12 Maersk Olie Og Gas A/S Evaluation of chemical components
JP6225136B2 (ja) * 2015-03-24 2017-11-01 日本電信電話株式会社 推定方法および推定装置
CN105868540B (zh) * 2016-03-25 2018-04-13 哈尔滨理工大学 应用智能支持向量机对多环芳烃性质/毒性的预测方法
JP6627624B2 (ja) * 2016-04-08 2020-01-08 住友ゴム工業株式会社 ポリマー組成物の性能の予測方法
JP6630640B2 (ja) 2016-07-12 2020-01-15 株式会社日立製作所 材料創成装置、および材料創成方法
US20200082913A1 (en) 2017-11-29 2020-03-12 Xgenomes Corp. Systems and methods for determining sequence
CN112513561B (zh) 2018-04-06 2022-04-15 布拉斯科美国有限公司 用于质量控制的拉曼光谱法和机器学习
US10896744B2 (en) 2018-08-13 2021-01-19 American Chemical Society Systems and methods for validating and predicting polymer functions using polymer properties

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06271823A (ja) * 1993-03-19 1994-09-27 Sekisui Chem Co Ltd 配合設計システム
JP2004514902A (ja) 2000-11-20 2004-05-20 ザ、プロクター、エンド、ギャンブル、カンパニー ポリマーの予測方法
WO2008116495A1 (en) * 2007-03-26 2008-10-02 Molcode Ltd Method and apparatus for the design of chemical compounds with predetermined properties
JP2018043171A (ja) 2016-09-12 2018-03-22 株式会社三谷バルブ エアゾール用スプレーキャップ、および、エアゾール

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DAVID ROBERS ET AL.: "J. Chem. Info. Model.", vol. 50, 2010, AMERICAN CHEMICAL SOCIETY, article "Extended-Connectivity Fingerprints", pages: 742 - 754
See also references of EP3764252A4
SHUN GOTO: "Development of Predictive Models and Reverse Analysis Method for Polymer Design", JOURNAL OF COMPUTER AIDED CHEMISTRY, vol. 10, 15 May 2019 (2019-05-15), pages 30 - 37, XP055637968 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020166299A1 (ja) * 2019-02-12 2020-08-20 株式会社日立製作所 材料特性予測装置および材料特性予測方法
CN114207729A (zh) * 2019-09-18 2022-03-18 株式会社日立制作所 材料特性预测系统以及材料特性预测方法
WO2021054026A1 (ja) * 2019-09-18 2021-03-25 株式会社日立製作所 材料特性予測システムおよび材料特性予測方法
JP2021047627A (ja) * 2019-09-18 2021-03-25 株式会社日立製作所 材料特性予測システムおよび材料特性予測方法
JP7267883B2 (ja) 2019-09-18 2023-05-02 株式会社日立製作所 材料特性予測システムおよび材料特性予測方法
JPWO2021079985A1 (ja) * 2019-10-25 2021-04-29
WO2021079985A1 (ja) * 2019-10-25 2021-04-29 コニカミノルタ株式会社 特性予測装置
JP7468542B2 (ja) 2019-10-25 2024-04-16 コニカミノルタ株式会社 特性予測装置
JP2021102732A (ja) * 2019-12-25 2021-07-15 太陽ホールディングス株式会社 コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造
JP7448353B2 (ja) 2019-12-25 2024-03-12 太陽ホールディングス株式会社 コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造
JP2021117798A (ja) * 2020-01-28 2021-08-10 国立大学法人山形大学 分子設計支援システム、分子特性値予測方法、分子設計支援プログラム
JP7504692B2 (ja) 2020-07-27 2024-06-24 ポーラ化成工業株式会社 予測モデルの学習方法
JP2022023482A (ja) * 2020-07-27 2022-02-08 ポーラ化成工業株式会社 予測モデルの学習方法
WO2022254835A1 (ja) * 2021-06-02 2022-12-08 コニカミノルタ株式会社 難燃性予測装置、難燃性予測モデル生成装置、難燃性予測モデルおよび特徴量抽出装置
JPWO2022254835A1 (ja) * 2021-06-02 2022-12-08
JP7848797B2 (ja) 2021-06-02 2026-04-21 コニカミノルタ株式会社 難燃性予測装置および難燃性予測モデル生成装置
CN113326664A (zh) * 2021-06-28 2021-08-31 南京玻璃纤维研究设计院有限公司 一种基于m5p算法预测玻璃介电常数的方法
CN113326664B (zh) * 2021-06-28 2022-10-21 南京玻璃纤维研究设计院有限公司 一种基于m5p算法预测玻璃介电常数的方法
JP2023054446A (ja) * 2021-10-04 2023-04-14 ダイキン工業株式会社 低分子化合物探索方法、プログラム、装置、およびシステム
JP7288207B2 (ja) 2021-10-04 2023-06-07 ダイキン工業株式会社 低分子化合物探索方法、プログラム、装置、およびシステム
WO2023058576A1 (ja) * 2021-10-04 2023-04-13 ダイキン工業株式会社 低分子化合物探索方法、プログラム、装置、およびシステム
WO2023120290A1 (ja) * 2021-12-20 2023-06-29 株式会社レゾナック 設計支援装置、設計支援方法、及びプログラム
WO2025169360A1 (ja) * 2024-02-07 2025-08-14 日本電気株式会社 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
CN111819441B (zh) 2022-08-09
US11915799B2 (en) 2024-02-27
EP3764252B1 (en) 2025-06-25
JP2020074095A (ja) 2020-05-14
EP3764252A4 (en) 2021-12-01
JP6633820B1 (ja) 2020-01-22
CN111819441A (zh) 2020-10-23
JP7217696B2 (ja) 2023-02-03
EP3764252A1 (en) 2021-01-13
US20200395102A1 (en) 2020-12-17
JPWO2019172280A1 (ja) 2020-04-16

Similar Documents

Publication Publication Date Title
JP6633820B1 (ja) ポリマーの物性予測装置、プログラム、及び方法
CN109657805B (zh) 超参数确定方法、装置、电子设备及计算机可读介质
US20230098285A1 (en) Apparatus and method for generating a protein-drug interaction prediction model for predicting protein-drug interaction and determining its uncertainty, and protein-drug interaction prediction apparatus and method
CN112634992A (zh) 分子性质预测方法及其模型的训练方法及相关装置、设备
KR102823155B1 (ko) 인공지능 기반의 목표 물성에 부합하는 복합체 생성을 위한 조성물 포뮬레이션을 제공하는 방법 및 전자 장치
US20240232574A9 (en) Method and apparatus for predicting recipe property reflecting similarity between chemical materials
JP6325762B1 (ja) 情報処理装置、情報処理方法、および情報処理プログラム
JP7221590B2 (ja) 抽出装置、抽出方法、及び抽出プログラム
CN118229465B (zh) 基于聚类中心表征的申请前专利质量评估方法及系统
CN115965082B (zh) 基于深度学习和集束搜索的系统发育树构建方法及系统
CN118246484A (zh) 基于LSTM与Transformer的四序列系统发育树重建方法及系统
CN112416431B (zh) 一种基于编码序列表示的源代码片段成对比较方法
CN107944045B (zh) 基于t分布哈希的图像检索方法及系统
CN114882515B (zh) 基于神经网络模型的表格类型判定方法、设备及介质
CN117708683A (zh) 基于对抗神经网络实现数据共享授权信息管理的方法、装置、处理器及其存储介质
CN119848250A (zh) 文本分类、聚类和检索方法、装置和计算机设备
JP5008096B2 (ja) 文書自動分類方法及び文書自動分類システム
KR102916967B1 (ko) 화학 반응 예측 시스템 및 이의 제어 방법, 그리고 화학 반응 예측 시스템의 학습 방법
US12346383B1 (en) Methods and systems for clustering documents based on semantic similarity
US20250342909A1 (en) Computer-readable recording medium having stored therein information processing program, information processing method, and information processing device
KR20200015300A (ko) 신경망 피처 벡터 결정 장치 및 방법
CN118057495A (zh) 一种人脸聚类方法、装置、电子设备及存储介质
CN118733660A (zh) 基于迁移学习的跨领域多模态工业数据抽取与融合方法
WO2023007848A1 (ja) データ解析方法、データ解析装置、及び、データ解析プログラム
CN120219016A (zh) 基于遗传算法与机器学习的矿山设备采矿成本预测方法

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2019538694

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19763785

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2019763785

Country of ref document: EP

WWG Wipo information: grant in national office

Ref document number: 2019763785

Country of ref document: EP