JP7619443B2 - 情報処理プログラム、情報処理方法および情報処理装置 - Google Patents
情報処理プログラム、情報処理方法および情報処理装置 Download PDFInfo
- Publication number
- JP7619443B2 JP7619443B2 JP2023515916A JP2023515916A JP7619443B2 JP 7619443 B2 JP7619443 B2 JP 7619443B2 JP 2023515916 A JP2023515916 A JP 2023515916A JP 2023515916 A JP2023515916 A JP 2023515916A JP 7619443 B2 JP7619443 B2 JP 7619443B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- vectors
- genome
- information processing
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional [2D] or three-dimensional [3D] molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Public Health (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Software Systems (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Biochemistry (AREA)
- Library & Information Science (AREA)
- Molecular Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Communication Control (AREA)
Description
120,220 入力部
130,230 表示部
140,240 記憶部
150,250 制御部
151,251 前処理部
152,252 学習部
153,253 算出部
154,254 分析部
Claims (7)
- コンピュータに、
ゲノムに対応するベクトルを入力データとし、前記ゲノムを構成する複数のサブゲノムにそれぞれ対応するベクトルを正解値とする学習データを基にして、前記入力データを学習モデルに入力した際の出力が前記正解値に近づくように前記学習モデルのパラメータを調整する学習を実行し、
分析対象のゲノムを受け付けた場合、前記分析対象のゲノムを前記学習モデルに入力することで、前記分析対象のゲノムに対応する複数のサブゲノムのベクトルを算出する
処理を実行させることを特徴とする情報処理プログラム。 - 前記算出する処理によって、算出された複数のサブゲノムのベクトルと、代替候補となる複数の代替遺伝子ベクターのベクトルとの類似度合いに基づき、前記サブゲノムと代替可能な代替遺伝子ベクターを検索する処理を更にコンピュータに実行させることを特徴とする請求項1に記載の情報処理プログラム。
- 前記分析対象のゲノムは、タンパク質の二次構造を複数含み、前記分析対象のゲノムに含まる複数の二次構造のベクトルを積算することで、前記分析対象のゲノムのベクトルを算出する処理を更にコンピュータに実行させることを特徴とする請求項1に記載の情報処理プログラム。
- コンピュータに、
ゲノムを製造する際の合成経路に含まれる複数のサブゲノムのベクトルを入力データとし、サブゲノムの構造および遺伝子ベクターの構造のうち共通する構造を示す共通構造のベクトルを正解値とする学習データに基づき、前記入力データを学習モデルに入力した際の出力が前記正解値に近づくように前記学習モデルのパラメータを調整する学習を実行し、
分析対象のサブゲノムの入力を受け付けた場合に、前記分析対象のサブゲノムのベクトルを前記学習モデルに入力することで、前記分析対象のサブゲノムに対応する共通構造のベクトルを算出する
処理を実行させることを特徴とする情報処理プログラム。 - コンピュータが実行する情報処理方法であって、
ゲノムに対応するベクトルを入力データとし、前記ゲノムを構成する複数のサブゲノムにそれぞれ対応するベクトルを正解値とする学習データを基にして、前記入力データを学習モデルに入力した際の出力が前記正解値に近づくように前記学習モデルのパラメータを調整する学習を実行し、
分析対象のゲノムを受け付けた場合、前記分析対象のゲノムを前記学習モデルに入力することで、前記分析対象の遺伝子ベクターに対応する複数のサブベクターのベクトルを算出する
処理を実行することを特徴とする情報処理方法。 - コンピュータが実行する情報処理方法であって、
ゲノムを製造する際の合成経路に含まれる複数のサブゲノムのベクトルを入力データとし、サブゲノムの構造および遺伝子ベクターの構造のうち共通する構造を示す共通構造のベクトルを正解値とする学習データに基づき、前記入力データを学習モデルに入力した際の出力が前記正解値に近づくように前記学習モデルのパラメータを調整する学習を実行し、
分析対象のサブゲノムを受け付けた場合、前記分析対象のサブゲノムのベクトルを前記学習モデルに入力することで、前記分析対象のサブゲノムに対応する共通構造のベクトルを算出する
処理を実行することを特徴とする情報処理方法。 - ゲノムに対応するベクトルを入力データとし、前記ゲノムを構成する複数のサブゲノムにそれぞれ対応するベクトルを正解値とする学習データを基にして、前記入力データを学習モデルに入力した際の出力が前記正解値に近づくように前記学習モデルのパラメータを調整する学習を実行する学習部と、
分析対象のゲノムを受け付けた場合、前記分析対象のゲノムを前記学習モデルに入力することで、前記分析対象のゲノムに対応する複数のサブゲノムのベクトルを算出する算出部と
を有することを特徴とする情報処理装置。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/JP2021/015983 WO2022224336A1 (ja) | 2021-04-20 | 2021-04-20 | 情報処理プログラム、情報処理方法および情報処理装置 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JPWO2022224336A1 JPWO2022224336A1 (ja) | 2022-10-27 |
| JPWO2022224336A5 JPWO2022224336A5 (ja) | 2024-01-04 |
| JP7619443B2 true JP7619443B2 (ja) | 2025-01-22 |
Family
ID=83723418
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023515916A Active JP7619443B2 (ja) | 2021-04-20 | 2021-04-20 | 情報処理プログラム、情報処理方法および情報処理装置 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US20240006028A1 (ja) |
| EP (1) | EP4328921A4 (ja) |
| JP (1) | JP7619443B2 (ja) |
| CN (1) | CN117043868A (ja) |
| AU (1) | AU2021441603A1 (ja) |
| WO (1) | WO2022224336A1 (ja) |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000507940A (ja) | 1996-03-22 | 2000-06-27 | ユニバーシティー オブ グエルフ | 共通の機能特性を有する化学構造をコンピューターによって設計する方法 |
| US20110131027A1 (en) | 2004-05-18 | 2011-06-02 | Solomon Research Llc | Bioinformatics system |
| CN103189550A (zh) | 2010-11-04 | 2013-07-03 | 先正达参股股份有限公司 | 高表达基因组合和其他生物组分组合的计算机模拟预测 |
| JP2017504913A (ja) | 2013-11-15 | 2017-02-09 | インフィニットバイオInfinitebio | 治療設計のためのコンピュータ支援モデル化 |
| JP2020154442A (ja) | 2019-03-18 | 2020-09-24 | 株式会社日立製作所 | 生物反応情報処理システムおよび生物反応情報処理方法 |
| JP2020530918A (ja) | 2017-10-16 | 2020-10-29 | イルミナ インコーポレイテッド | バリアントの分類のための深層畳み込みニューラルネットワーク |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7047137B1 (en) * | 2000-11-28 | 2006-05-16 | Hewlett-Packard Development Company, L.P. | Computer method and apparatus for uniform representation of genome sequences |
| WO2007102578A1 (ja) | 2006-03-09 | 2007-09-13 | Keio University | 塩基配列設計方法 |
| CN107025386B (zh) * | 2017-03-22 | 2020-07-17 | 杭州电子科技大学 | 一种基于深度学习算法进行基因关联分析的方法 |
| WO2018226900A2 (en) * | 2017-06-06 | 2018-12-13 | Zymergen Inc. | A htp genomic engineering platform for improving fungal strains |
| US20200363414A1 (en) * | 2017-09-05 | 2020-11-19 | Gritstone Oncology, Inc. | Neoantigen Identification for T-Cell Therapy |
| WO2019084559A1 (en) * | 2017-10-27 | 2019-05-02 | Apostle, Inc. | SOMATIC MUTATION CANCER PATHOGENIC IMPACT PREDICTION USING DEEP LEARNING BASED METHODS |
| EP3759131A4 (en) * | 2018-02-27 | 2021-12-01 | Gritstone bio, Inc. | NEOANTIGEN IDENTIFICATION WITH PAN ALLELE MODELS |
| JP2020181959A (ja) * | 2019-04-26 | 2020-11-05 | 東京エレクトロン株式会社 | 学習方法、管理装置および管理プログラム |
| CN113811949A (zh) | 2019-05-13 | 2021-12-17 | 富士通株式会社 | 评价方法、评价程序和评价装置 |
-
2021
- 2021-04-20 JP JP2023515916A patent/JP7619443B2/ja active Active
- 2021-04-20 CN CN202180095792.3A patent/CN117043868A/zh active Pending
- 2021-04-20 EP EP21937833.8A patent/EP4328921A4/en active Pending
- 2021-04-20 AU AU2021441603A patent/AU2021441603A1/en not_active Abandoned
- 2021-04-20 WO PCT/JP2021/015983 patent/WO2022224336A1/ja not_active Ceased
-
2023
- 2023-09-15 US US18/468,023 patent/US20240006028A1/en active Pending
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000507940A (ja) | 1996-03-22 | 2000-06-27 | ユニバーシティー オブ グエルフ | 共通の機能特性を有する化学構造をコンピューターによって設計する方法 |
| US20110131027A1 (en) | 2004-05-18 | 2011-06-02 | Solomon Research Llc | Bioinformatics system |
| CN103189550A (zh) | 2010-11-04 | 2013-07-03 | 先正达参股股份有限公司 | 高表达基因组合和其他生物组分组合的计算机模拟预测 |
| JP2017504913A (ja) | 2013-11-15 | 2017-02-09 | インフィニットバイオInfinitebio | 治療設計のためのコンピュータ支援モデル化 |
| JP2020530918A (ja) | 2017-10-16 | 2020-10-29 | イルミナ インコーポレイテッド | バリアントの分類のための深層畳み込みニューラルネットワーク |
| JP2020154442A (ja) | 2019-03-18 | 2020-09-24 | 株式会社日立製作所 | 生物反応情報処理システムおよび生物反応情報処理方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2022224336A1 (ja) | 2022-10-27 |
| CN117043868A (zh) | 2023-11-10 |
| US20240006028A1 (en) | 2024-01-04 |
| EP4328921A1 (en) | 2024-02-28 |
| JPWO2022224336A1 (ja) | 2022-10-27 |
| EP4328921A4 (en) | 2024-06-26 |
| AU2021441603A1 (en) | 2023-09-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2021532439A (ja) | コドン最適化 | |
| Kukic et al. | Toward an accurate prediction of inter-residue distances in proteins using 2D recursive neural networks | |
| US11851704B2 (en) | Deepsimulator method and system for mimicking nanopore sequencing | |
| Lupo et al. | Pairing interacting protein sequences using masked language modeling | |
| CN109360596B (zh) | 一种基于差分进化局部扰动的蛋白质构象空间优化方法 | |
| Liu et al. | Computational prediction of sigma-54 promoters in bacterial genomes by integrating motif finding and machine learning strategies | |
| Xie et al. | Multilevel attention network with semi-supervised domain adaptation for drug-target prediction | |
| He et al. | Predicting the sequence specificities of DNA-binding proteins by DNA fine-tuned language model with decaying learning rates | |
| Zhang et al. | Physics-aware graph neural network for accurate RNA 3D structure prediction | |
| JP7619443B2 (ja) | 情報処理プログラム、情報処理方法および情報処理装置 | |
| Kaghed et al. | Multiple sequence alignment based on developed genetic algorithm | |
| Bi | A Monte Carlo EM algorithm for de novo motif discovery in biomolecular sequences | |
| Elsayed et al. | Evolutionary behavior of dna sequences analysis using non-uniform probabilistic cellular automata model | |
| Bi | A genetic-based EM motif-finding algorithm for biological sequence analysis | |
| Huang et al. | Computation of conformational entropy from protein sequences using the machine‐learning method—Application to the study of the relationship between structural conservation and local structural stability | |
| Ghanty et al. | Prediction of protein secondary structure using probability based features and a hybrid system | |
| Shen et al. | DARE: Sequence-structure dual-aware encoder for RNA-protein binding prediction | |
| Zhang et al. | Predicting TF-DNA binding motifs from chip-seq datasets using the bag-based classifier combined with a multi-fold learning scheme | |
| Nizam et al. | Cyclic genetic algorithm for multiple sequence alignment | |
| AU2013206364B2 (en) | Methods for identifying sequence motifs, and applications thereof | |
| Leiva et al. | NN-PRED: A novel consensus secondary structure prediction program using neural networks | |
| Dey et al. | A survey on multiple sequence alignment using metaheuristics | |
| Raja et al. | Nature inspired algorithms for genome subsequence assembly in Hadoop | |
| Prema et al. | Predicting Forward and Reverse Mutations from Protein Sequences Using Embeddings and Deep Learning | |
| KR102060874B1 (ko) | 니렌버그 rna 표준 유전자 코드의 수학적 설계 및 블록 순환 자켓 행렬에 기초한 분석 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230928 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230928 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240903 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241030 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241210 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241223 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7619443 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |