JP7319197B2 - 標的核酸のシークエンシングデータをアライメントする方法 - Google Patents
標的核酸のシークエンシングデータをアライメントする方法 Download PDFInfo
- Publication number
- JP7319197B2 JP7319197B2 JP2019566247A JP2019566247A JP7319197B2 JP 7319197 B2 JP7319197 B2 JP 7319197B2 JP 2019566247 A JP2019566247 A JP 2019566247A JP 2019566247 A JP2019566247 A JP 2019566247A JP 7319197 B2 JP7319197 B2 JP 7319197B2
- Authority
- JP
- Japan
- Prior art keywords
- sequences
- primer
- sequence
- target
- reference genome
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 142
- 108020004707 nucleic acids Proteins 0.000 title description 20
- 102000039446 nucleic acids Human genes 0.000 title description 20
- 150000007523 nucleic acids Chemical class 0.000 title description 20
- 238000012163 sequencing technique Methods 0.000 title description 11
- 230000004927 fusion Effects 0.000 claims description 138
- 238000012360 testing method Methods 0.000 claims description 48
- 230000002068 genetic effect Effects 0.000 claims description 30
- 230000015654 memory Effects 0.000 claims description 21
- 108091093088 Amplicon Proteins 0.000 claims description 17
- 108090000623 proteins and genes Proteins 0.000 claims description 12
- 238000013500 data storage Methods 0.000 claims description 6
- 230000014509 gene expression Effects 0.000 claims description 5
- 239000013615 primer Substances 0.000 description 442
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 127
- 239000000523 sample Substances 0.000 description 59
- 230000003321 amplification Effects 0.000 description 51
- 238000003199 nucleic acid amplification method Methods 0.000 description 51
- 230000000875 corresponding effect Effects 0.000 description 45
- 238000010586 diagram Methods 0.000 description 43
- 238000004364 calculation method Methods 0.000 description 39
- 239000002773 nucleotide Substances 0.000 description 29
- 125000003729 nucleotide group Chemical group 0.000 description 29
- 238000001514 detection method Methods 0.000 description 27
- 108020004414 DNA Proteins 0.000 description 25
- 238000012545 processing Methods 0.000 description 24
- 210000004027 cell Anatomy 0.000 description 23
- 230000002441 reversible effect Effects 0.000 description 23
- 238000007403 mPCR Methods 0.000 description 19
- 230000000295 complement effect Effects 0.000 description 15
- 238000009396 hybridization Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 15
- 210000001519 tissue Anatomy 0.000 description 12
- 238000001914 filtration Methods 0.000 description 10
- 238000012795 verification Methods 0.000 description 10
- 230000002759 chromosomal effect Effects 0.000 description 9
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 8
- 108700024394 Exon Proteins 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- 238000011144 upstream manufacturing Methods 0.000 description 8
- 238000013459 approach Methods 0.000 description 7
- 238000003556 assay Methods 0.000 description 7
- 210000000349 chromosome Anatomy 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 238000003491 array Methods 0.000 description 5
- 210000000056 organ Anatomy 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000002987 primer (paints) Substances 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007717 exclusion Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 230000004544 DNA amplification Effects 0.000 description 2
- 239000003155 DNA primer Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Bioethics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Molecular Biology (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本出願は、参照によりそのすべての内容が本明細書に組み込まれる、2018年1月5日に出願された米国特許仮出願第62/614,088号の優先権の利益を主張する。
オフターゲット一致検出を実装する例示的なシステム
図1は、転写物配列180から改変参照ゲノム配列を生成するためのオフターゲット一致検出を実装する例示的なシステム100のブロック図である。本明細書の例のいずれにおいても、文字列は、値の文字列を表す文字の配列の形態をとることができる。ここでは「文字列」と呼ばれるが、内部表現は文字列、配列、又はその他のデータ構造の形式をとることができる。文字は、文字又はそのような文字を表すコードの形式を取ることができる。
オフターゲット一致検出の例示的な方法
図2は、オフターゲット一致検出を実装する例示的な方法200のフローチャートであり、例えば、図1に示すようなシステムで実装することができる。転写物配列上の複数の標的を標的化する複数の候補プライマー配列が支援され得る。
例示的なオフターゲット一致検出
本明細書の例のいずれにおいても、オフターゲット一致は、本明細書に記載の近接位置で一致する一対の候補プライマー配列(例えば、元の対又は2つの異なる対から)の形をとることができる。実際には、近接位置は、本明細書に記載されているように、2つの異なる(例えば、1つの元のものであり、1つが逆向きで元のものに相補的である)転写物配列上にあり得、候補プライマー配列の逆相補物を取り、それを候補プライマー配列に含めることにより、単一の転写物配列で演算を達成することができる。本明細書に記載されるように、そのようなオフターゲット一致の検出は、候補プライマー配列が許容可能かどうかを判定するために使用され得る。オフターゲットの一致条件の閾値を超える候補プライマー配列(及びその対)は、許容可能でないとみなすことができる。
例示的なk-mer
本明細書の例のいずれにおいても、候補プライマー配列は、一致の発見を促進するために、長さk(k-mer)のサブ文字列又はサブ配列に分解することができる。k-merは、候補プライマー配列に対して生成できる。実際には、このようなサブ文字列又はサブ配列はすべて生成されるが、他の配置も可能である。
例示的な一致
本明細書の例のいずれにおいても、規則が充足された場合、配列は、特定の位置で転写物配列と一致するとみなされる。例示的な一致規則には、次のものが含まれる。
例示的な候補一致検証
本明細書の例のいずれにおいても、転写物配列上の一致を同定することは、候補一致を検証するという形をとることができる。図3は、候補プライマー配列310の候補一致を検証する例示的なシステム300のブロック図であり、本明細書の例のいずれかで使用することができる。一致を判定するための計算を分離することにより、共通領域を共有する候補プライマー配列に対して一部の計算を再利用できる。例えば、特定の候補一致325は安全にスキップできる。そのような構成は、図1に示されるシステムを実装するために使用することができる。
候補一致を検証する例示的な方法
図4は、候補一致を検証する例示的な方法400のフローチャートであり、例えば、図3に示すようなシステムで実装することができる。
共通領域に対する例示的な規則計算キャッシュ
図5は、本明細書に記載の例のいずれかで使用することができる候補プライマー配列内の共通領域に対する規則充足計算キャッシュを有する例示的なシステム500のブロック図である。この例では、クラスター510A、510B又は候補プライマー配列520A~Fは共通領域530A~Bに関連付けられており、共通領域530A~Bは転写物配列580上の位置に関連付けられている。
例示的な規則充足計算キャッシュ
本明細書の例のいずれにおいても、規則が充足されるかどうかを判定するための計算は、規則充足計算キャッシュ(例えば、一致規則充足計算キャッシュ)内の複数の候補プライマー配列による使用のためにキャッシュできる。本明細書に記載されるように、候補プライマー配列間の共通領域が判定され得る。
キャッシュを介して一致を同定する例示的な方法
図6は、キャッシュを介して候補プライマー配列の一致を同定する例示的な方法600のフローチャートであり、例えば、図5に示すようなシステムで実装することができる。実際には、そのような方法は、典型的に、一致ファインダー又はオフターゲット検証ツールの他の部分によって実行され、図4に示す方法の一部として実行することができる。
規則充足計算キャッシュを介して一致を同定する例示的な方法
図7は、候補プライマー配列のためのキャッシュを構築する例示的な方法700のフローチャートであり、図5に示されるようなキャッシュを使用する任意のシステムで実装することができる。キャッシュの構築は、一致処理の前に、又はそれと併せて実行できる(例えば、図4に示すように)。
マルチレベルキャッシュを実装する例示的なシステム
図8は、マルチレベルキャッシュ810を実装する例示的なシステム800のブロック図であり、キャッシュを使用する本明細書の例のいずれかに実装することができる。
k-merインデックスを実装する例示的なシステム
図9は、k-merインデックス950を実装する例示的なシステム900のブロック図である。この例は、基本的な実装を示している。実際には、さまざまなバリエーションが可能である。技術には、さまざまなk-merインデックススキームを使用できる。
例示的なオフターゲット予測子
プライマーの特異性をチェックする実装では、オフターゲット判定は、プライマーがゲノムの意図しない領域を増幅するかどうかを参照して実施できる。図14は、例示的なオフターゲット一致条件のブロック図である。
y=e(a×logx+b*l+c*floor[l*e]+d)
式中、
y:ヒット数(プラス又はマイナス鎖、高度に相関している)
x:候補プライマー配列のk-merインデックスによって返された候補ヒット(一致)の数
l:候補プライマー配列の長さ
e:(規則2から)許容される不一致の割合、又は許容される不一致率、又は許容されるエラー率。
y=e(a×logx+b*l+c*floor[l*e]+d)
オフターゲット予測の例示的な方法
図11は、候補プライマー配列のオフターゲット予測を生成する例示的な方法1100のフローチャートであり、例えば、図10に示すようなシステムで実装することができる。このような方法は、キャッシュの使用の有無にかかわらず実装で使用できる。
近接グループ化を実装する例示的なシステム
図12は、文字列又は配列近接グループ化を実装する例示的なシステム1200のブロック図であり、本明細書の例のいずれかで使用して、オフターゲット一致条件を同定することができる。オフターゲット相関器1250は、オフターゲット検出ツールに組み込まれ得る(例えば、図1のツール150の相関器127として)。配列近接グループ化は、キャッシュを持たないシステムで使用できる。
近接グループ化を介してオフターゲット一致条件を同定する例示的な方法
図13は、配列近接グループ化を介してオフターゲット一致を同定する例示的な方法1300のフローチャートであり、例えば、図12に示されるようなシステムで実装することができる。(例えば、オフターゲット相関器による)。配列近接グループ化は、キャッシュの使用の有無にかかわらず方法で使用できる。
例示的な配列近接グループ化
本明細書の例のいずれにおいても、転写物配列は位置の範囲に分割することができる。範囲のサイズは、オフターゲット条件ウィンドウの長さに基づくことができる。したがって、第1のグループは位置1からwindow_lengthを包含し、第2のグループは位置window_length+1からwindow_length*2等を包含する。したがって、グループgの範囲は1+(window_length×(g-1))から(window_length×g)である。
例示的な実装:プライマー対の特異性計算
本明細書で記載されるように、k-merインデックスを適用でき、中間結果を規則充足計算キャッシュにキャッシュして、精度を損なうことなく実行時間を低減できる。
例示的な実装:オフターゲット判定
図15は、オフターゲット判定のために配列近接グループ化を採用する例示的なシステム1500のブロック図であり、図12及び図13に示される構成に使用することができる。この例では、転写物配列の標的配列鎖1580は、オフターゲット条件ウィンドウ長1525Aに従って範囲に分割された転写物配列セットによって表される。マイナス鎖は、プライマーの逆相補体もプライマー候補配列として含まれているという点で、転写物配列1580によって表されている。したがって、PCRプロセス中に標的位置の望ましくない増幅又は増幅との干渉を引き起こすオフターゲット位置を同定することができる。このようにして、本明細書で記載される配列近接グループ化が実装される。代替的な実施形態では、異なる鎖を表すために2つの異なる配列(互いに逆向きで相補的)を使用することができる。
例示的な詳細説明
図16は、共通領域のキャッシュを示すブロック図である。この例では、プライマークラスターのシード配列が見出された。シード配列は共通領域に拡張された。マルチレベルキャッシュには、k個の連続した一致を有する共通領域の計算が保存される。したがって、このような共通領域は、他のプライマーを再計算する必要なく、規則1を充足するとみなすことができる。
例示的な実装結果:キャッシュ
キャッシュを実装すると、キャッシュにより一部の配列を検索できた。一部の候補は、キャッシュを介して検証又はスキップできるため、判定時間が10倍高速化された。
例示的な実装結果:オフターゲット予測
図20は、参照ヒトゲノム配列のプラス鎖とマイナス鎖とのヒット間の相関を示すブロック図である。示されているように、プライマーのプラス鎖へのヒット数とマイナス鎖へのヒット数は、通常、例えばヒトゲノム上で高度に相関している可能性がある。したがって、マイナスの結果を生じることなく、1つの鎖の予測を両方の鎖に使用できる。したがって、本明細書に示される予測子は、単一鎖について単一の予測を生成し、オーバーフィルタリング又はアンダーフィルタリングなしで候補プライマー配列をフィルタリングするために使用され得る。遺伝子モデルに従って参照ヒトゲノムから転写可能な転写物を使用する場合、同等の分析が適用される。
更なる組み合わせ
更に、これらの技術を組み合わせて、キャッシング、一致予測によるフィルタリング、及び配列近接グループ化を同時に実行できる。そのような例では、転写物配列上のオフターゲット一致を同定するコンピュータ実装方法は、候補プライマー配列を受け取る工程と、候補プライマー配列について、転写物配列上の複数の候補一致位置を同定する工程と、候補一致位置から、転写物配列上の検証済み一致位置を同定し、検証済み一致位置を同定することが、転写物配列上のどの候補一致位置が1つ又は複数の一致検証規則を充足するかを判定し、すでに計算された規則充足計算を、候補プライマー配列と共通領域を共有する異なる候補プライマー配列について再利用することを含む、工程と、少なくとも1つの他の候補プライマー配列に対する少なくとも1つの他の一致と併せて考慮されたときに、検証済み一致位置が転写物配列上のオフターゲット一致条件を形成するかどうかを判定する工程とを含み、方法は、少なくとも1つの追加の候補プライマー配列をフィルタリングすることを更に含み、ここで、フィルタリングすることは、追加の候補プライマー配列の転写物配列上の一致の数の予測を生成し、一致の数が閾値を超えると判定することに応答して、追加の候補プライマー配列を破棄することを含み、方法は、検証済み一致を配列近接グループ化に配置することを更に含み、近接グループ化をチェックすることはオフターゲット一致条件を同定することを更に含む。
例示的な演算システム
図25は、記載されたイノベーションのいくつかを実装することができる適切な演算システム2500の一般化された例を示す。演算システム2500は、用途又は機能性の範囲に関する制限を示唆することを意図したものではない。なぜなら、イノベーションは、特殊用途の演算システムを含む多様な演算システムで実施できるからである。実際には、演算システムは、図示された演算システムの複数のネットワーク化されたインスタンスを含むことができる。
コンピュータ可読媒体
本明細書の任意のコンピュータ可読媒体は、非一時的(例えば、DRAM若しくはSRAM等の揮発性メモリ、磁気記憶装置、光学記憶装置等の不揮発性メモリ)及び/又は有形であり得る。本明細書で記載される保存行為のいずれかは、1つ又は複数のコンピュータ可読媒体(例えば、コンピュータ可読記憶媒体又は他の有形媒体)に保存することにより実装され得る。保存されていると記載される任意のもの(例えば、実装中に作成及び使用されるデータ)は、1つ又は複数のコンピュータ可読媒体(例えば、コンピュータ可読記憶媒体又は他の有形媒体)に保存することができる。コンピュータ可読媒体は、信号で構成されていない実装に限定できる。
RNAの改変参照ゲノムへのアライメント
図26は、本明細書に開示されるRNAアライメントのフローチャート2600を示す。転写物配列及びプライマー配列は、データストレージユニット又はコンピュータシステムのユニットに受信されてもよい2610。プライマーは、選択された標的の増幅のために選択又は設計できるか、増幅に有用であると判定される未知の標的の同定のために提案できるか、又はその両方の組み合わせであり得る。転写物配列には、遺伝子モデルに従って参照ゲノムから転写できる転写物が含まれる。遺伝子モデルの構造とパラメータに応じて、転写物配列には、どの配列が転写される領域に対応するかを示す参照ゲノムに含まれる配列情報に基づいて、参照ゲノムから転写され得る一次転写物を含み、転写物で発生すると予測されるスプライシング事象、及び転写物から発生することが既知、予測、又は仮説であるRNA融合事象に関する情報をも含み得、又は上述のすべてを含み得る。理解されるように、プライマー配列と改変参照ゲノムを一緒に受け取る必要はなく、これは、どちらか一方を他方とは別に準備して提供できるためである。
プライマーと転写物配列の一致
図27は、改変参照ゲノムを作成する際の標的の生成のために、プライマーセットから転写物配列へのプライマーの一致を決定するためのプロセスの例を示す。転写物配列が示され、転写物配列内で強調表示されているのは、さまざまなプライマーが一致配列を有している配列であり、いくつかがフォワード方向(fwdA1、fwdB1'、fwdB1、fwdB2、及びfwdA3)並びに他がリバース方向(revA1、revB1、revA2、revB2、revA3)である。転写物配列の3'末端から開始して、潜在的なプライマー一致部位を同定できる。フォワード方向のプライマー一致部位が同定されると、プライマーとその位置がキャッシュされ、その後、第1のプライマー一致部位の下流にある潜在的な一致部位について他のプライマーがチェックされる。別のリバース方向プライマーの一致部位が同定された場合、以前のキャッシュされたプライマーの位置を参照して、改変参照ゲノムに標的配列を含めるためのパラメータを充足する標的(例えば、最小長)が充足されているかどうかを判定できる。その場合、標的は改変参照ゲノムに含まれ得る。プライマーが転写物配列に一致する部位が転写物配列に沿って十分に遠くなり、キャッシュされたプライマーと現在一致するプライマーとの間で増幅可能な標的配列が最大標的配列長パラメータを超えると、フォワードプライマーをキャッシュから削除できる。
プライマーへの遺伝子座の割り当て
図28は、1つ又は複数の遺伝子座が1つ又は複数のプライマーにどのように割り当てられるかの例を示す。プライマー配列が1つの転写物配列遺伝子座のみに一致する場合、その遺伝子座が割り当てられる。プライマー配列が2つの転写物配列遺伝子座に一致する場合、その割り当てられた遺伝子座は、標的の増幅で対になっているプライマー(すなわち、転写物配列の増幅で対になっている反対方向のプライマー)に依存する。両方のプライマーが一致する転写物配列遺伝子座が1つしかない場合、その遺伝子座にはプライマーが割り当てられる。上述の規則に従ってプライマーに複数の遺伝子座が割り当てられる場合、アルファベット順に最初の遺伝子座IDを持つ遺伝子座が割り当てられる。
遺伝子座横断標的のフィルタリング
図29は、予想される遺伝子座横断標的をフィルタリングするための例の概略図を示す。プライマーセットのいくつかのプライマー対が、互いに比較的近接した標的を増幅すると予測される場合、遺伝子座横断標的が予想されるだろう。そのような場合、標的の増幅に関与するプライマーのサブセットを組み合わせて、2つの元の標的を含む複数の遺伝子座からより大きな標的を増幅することもできる。上流の遺伝子座特異的オリゴ(ULSO)と下流の遺伝子座特異的オリゴ(DLSO)が隣接する3つの意図された標的が示されている。以下に示すように、意図された標的を増幅するために使用される組み合わせ以外のULSOとDLSOの他の組み合わせも、それらを増幅するために使用される6つのプライマーの中から利用可能である。例えば、遺伝子座横断標的は、左端の意図された標的からのULSOと右端の意図された標的からのDLSOを使用して増幅でき、遺伝子座横断標的は、すべての標的の配列を包含する。同様に、右端の2つの意図された標的、又は左端の2つの意図された標的を含む遺伝子座横断標的を増幅できる。そのようなオフターゲットの遺伝子座横断標的は、改変参照ゲノムから除外されてもよい。例えば、オフターゲット配列がULSOとDLSOを有し、それぞれが意図された標的と一致し、いずれかの標的よりも大きい場合、遺伝子座横断標的として改変参照ゲノムから除外できる。
さまざまな転写物からのアンプリコンの同定
図30は、いくつかの配列(例えば、いくつかのエクソン)を共有するが他の配列を共有しない異なるRNA転写物から生成され得る異なる増幅可能な標的の概略図である。プライマーの異なる対は、一方、他方、又は両方の転写物から配列を増幅すると予測される。改変参照ゲノムの生成において、参照は、参照ゲノムのどの転写物配列からどの標的が増幅され得るかに関して維持される。例えば、プライマーgreenAとgreenBは、赤と青の転写物から同一の配列を増幅するが、プライマーorangeAとorangeB/yellowBは、互いに異なる赤と青の転写物から配列を増幅し(青の転写物に介在するエクソン3が存在し、赤の転写物に存在しないため)、プライマーyellowA及びorangeB/yellowBは青の転写物の配列を増幅するが、赤の転写物は増幅しない(プライマーyellowAはエクソン3の配列と一致するため)。
スプライス及び融合ジャンクションに由来する標的にアライメントされた配列リードの翻訳
いくつかの例では、本明細書に開示される遺伝子モデルに基づいた転写可能な転写物配列の同定等により、改変参照ゲノムにアライメントされたリードは、改変参照ゲノムが生成された参照ゲノムに更にアライメントされ得る。場合によっては、配列がエクソン-エクソン境界を越えるRNAリードは、改変参照ゲノムにアライメントする。例えば、リードは、改変参照ゲノムからの所与の標的に対応するものとして同定され得る。そのような標的は、リード内の配列の連続部分に反映されるように、エクソン-エクソンジャンクションを含み得る。リードに対応する、改変参照ゲノムが由来する参照ゲノム内の遺伝子座を同定することが望ましい場合がある。改変参照ゲノムには、参照ゲノムからの所与の染色体上のどこにその配列、特に例えばそのエクソンが由来するかという対応する情報が含まれていてもよい。そのようなエクソン配列は、参照ゲノムの転写されていない部分、又はスプライシング中に除去されたイントロン配列に対応するゲノムの転写された部分によって分離され得ることが理解されよう。そのようなゲノム遺伝子座の同定を含む改変参照ゲノムにリードがアライメントされる場合、リードは改変参照ゲノムだけでなく、改変参照ゲノムの対応する位置に翻訳して戻されて、リードの部分を発生させるためゲノムのどの部分が転写されたかを示すことができる。
アライメントされていない融合ジャンクションを参照ゲノムにアライメントする
本明細書に開示されているように、配列リードは、配列リードが融合ジャンクションに対応し、融合ジャンクションが改変参照ゲノムの生成に使用される遺伝子モデルに含まれていない場合等、改変参照ゲノムに対してアライメント可能ではないか、又はアライメントされていない場合がある。そのような場合、改変参照ゲノムへとアライメントされていないものが参照ゲノムにアライメントされ得た後、配列リードはアライメントされていない融合ジャンクションとして分類される。そのようなアライメントが、配列リードの融合ジャンクション偽陽性として特徴付けを回避するための最小要件を充足する場合、配列リードは、融合ジャンクションとして特徴付けられ得、それ自体がアライメントプロファイルに含まれることがある。
任意の例の技術は、1つ又は複数の他の例で記載されている技術と組み合わせることができる。開示された技術の原理が適用され得る多くの可能な実施形態に鑑みて、図示された実施形態は開示された技術の例であり、開示された技術の範囲に対する制限として解釈されるべきではないことを認識すべきである。むしろ、開示された技術の範囲には、以下の特許請求の範囲によって包含されるものが含まれる。したがって、特許請求の範囲及び趣旨に含まれるすべてが請求される。
110 候補プライマー配列
150 オフターゲット検出ツール
120 規則
125 キャッシュ
127 オフターゲット相関器
160 許容可能な配列
170 転写物配列のK-MERインデックス
180 転写物配列
200 オフターゲット一致検出を実装する例示的な方法
220 候補プライマー配列を受け取る
230 候補プライマー配列について、転写物配列の一致を同定する
240 候補プライマー配列の一致についてオフターゲット条件を判定する
300 候補一致を検証する例示的なシステム
350 オフターゲット検出ツール
310 候補プライマー配列
340 一致ファインダー
320 規則
360 検証済み一致
370 転写物配列のためのK-MERインデックス
328A 検証済み一致
328B 検証済み一致
325 候補一致
380 転写物配列
400 候補一致を検証する例示的な方法
430 候補一致を同定する
440 候補一致が検証規則を充足するのを検証する
500 候補プライマー配列内の共通領域に対する規則充足計算キャッシュを有する例示的なシステム
510A クラスター1
520A 候補配列1
520B 候補配列2
520C 候補配列3
510B クラスター2
520D 候補配列4
520E 候補配列5
520F 候補配列6
540 キャッシュ
530A 共通領域1
530B 共通領域2
532A 規則充足計算
532B 規則充足計算
538A 候補一致
538B 候補一致
580 転写物配列
600 キャッシュを介して候補プライマー配列の一致を同定する例示的な方法
630 候補プライマー配列について、共通領域を同定する
640 候補プライマー配列について、共通領域の規則充足計算を再利用する
700 候補プライマー配列のためのキャッシュを構築する例示的な方法
730 候補文字列を受け取り、クラスターにグループ化する
740 クラスターについて共通領域を同定する
750 共通領域を拡張する
760 共通領域について規則充足計算を保存する
800 マルチレベルキャッシュを実装する例示的なシステム
810 キャッシュ
830A 共通領域
832AA 規則充足計算
832AB 規則充足計算
838A 候補一致
838B 候補一致
880 転写物配列
900 k-merインデックスを実装する例示的なシステム
950 K-MERインデックス
952A K-MER1キー
952B K-MER1キー
952N K-MER1キー
954A k-merが生じる位置
954B k-merが生じる位置
954N k-merが生じる位置
980 転写物配列
1000 オフターゲット予測子を実装する例示的なシステム
1010 候補プライマー配列
1050 オフターゲット予測子
1055 パラメータ
1060 予測エンジン
1100 候補プライマー配列のオフターゲット予測を生成する例示的な方法
1130 候補プライマー配列を受け取る
1140 パラメータを介してエンジンにより予測を生成する
1150 予測に基づいて破棄する
1200 文字列又は配列近接グループ化を実装する例示的なシステム
1210 検証された一致
1220 意図された標的
1250 オフターゲット相関器
1260 配列近接グループ化
1280 オフターゲット判定
1300 配列近接グループ化を介してオフターゲット一致を同定する例示的な方法
1330 検証済み一致を受け取る
1340 一致を配列近接グループ化に配置する
1350 オフターゲット一致条件を同定するために配列近接グループ化をチェックする
1500 オフターゲット判定のために配列近接グループ化を採用する例示的なシステム
1525 オフターゲット条件ウィンドウ長
1530 一致をチェックすること
1580 転写物配列
1520A リスト1
1520B リスト2
1520C リスト3
1520D リスト4
1520E リスト5
1520N リストN
1600 共通領域のキャッシュを示すブロック図
1700 キャッシュを介してスキップされた候補を示すブロック図
1800 クラスター化されたプライマー配列の共通領域を拡張するための配置
1820 プライマーの特定の位置に同一のヌクレオチドを有するプライマーの数
1825 最初に発見された共通領域
1840 クラスター化されたプライマー配列
1900 規則充足キャッシュを有する結果を示すブロック図
2000 参照ヒトゲノム配列のプラス鎖とマイナス鎖とのヒット間の相関を示すブロック図
2100 異なる配列長についての候補の数とヒットの数との間の相関を示すブロック図
2200 上述の計算Aを使用したヒット数対予測(例えば、ヒットの予測数)の履歴データ
2300 上述の計算Aを介して一致予測を適用した結果を示すブロック図
2400 一致を検索する前に一致予測を適用した結果
2500 演算環境
2510 中央演算処理装置
2515 グラフィックス処理装置又は共同処理装置
2520 メモリ
2525 メモリ
2570 通信接続
2550 入力デバイス
2560 出力デバイス
2540 ストレージ
2580 ソフトウェア
2600 RNAアライメントのフローチャート
2610 プライマー配列及び参照ゲノムからの転写物配列を受け取る
2620 転写物配列から増幅可能な標的配列を生成する
2530 増幅可能な標的配列から改変参照ゲノムを生成する
2640 配列リードを受け取る
2650 改変参照ゲノムによって配列リードをアライメントする
2660 アライメントプロファイルを生成する
3100 RNAリードの一部が転写された部位に対応する染色体遺伝子座
3110 RNAリード
3120 改変参照ゲノム標的
Claims (23)
- RNAをアライメントするコンピュータ実装方法であって、
複数のプライマー配列及び複数の転写物配列をデータストレージユニットに受け取る工程であって、前記転写物配列が、遺伝子モデルに基づいて参照ゲノムから転写可能なものである、工程と、
前記複数のプライマー配列を用いて、前記複数の転写物配列から増幅可能な複数の標的配列を、マイクロプロセッサを使用して生成する工程と、
マイクロプロセッサを使用して、前記複数の標的配列を含む改変参照ゲノムを生成する工程と、
RNAアンプリコン分子を含む試験試料から、前記複数のプライマー配列を有するプライマーを用いて生成された配列リードを、マイクロプロセッサを使用して、前記改変参照ゲノムにアライメントする工程と
を含む方法。 - プライマー配列を、それぞれの転写物配列の遺伝子座に対応する個々の遺伝子座に割り当てる工程を更に含む、請求項1に記載の方法。
- 1つを超えるオンターゲット配列にまたがる前記生成された標的配列の1つ又は複数に基づいて、前記生成された標的配列の1つ又は複数を除去する工程を更に含む、請求項2に記載の方法。
- 前記複数のプライマー配列が複数のプライマー対を含み、第1のプライマー対が第1の遺伝子座に対する第1のプライマー及び第2のプライマーを含み、第2のプライマー対が第2の遺伝子座に対する第1のプライマー及び第2のプライマーを含む、請求項2に記載の方法。
- 前記遺伝子モデルが、前記改変参照ゲノムにおけるスプライスジャンクション、融合ジャンクション、又はその両方の同定を含む、請求項1に記載の方法。
- スプライス及び融合ジャンクションに由来する標的にアライメントした配列リードを翻訳する工程を更に含む、請求項5に記載の方法。
- 前記複数の標的配列が、オンターゲット配列とオフターゲット配列を含む、請求項1に記載の方法。
- 前記複数のプライマー配列から1つ又は複数のプライマー配列を除外することにより、オフターゲット配列の数を低減する工程を更に含む、請求項7に記載の方法。
- 2つ以上の試料の遺伝子発現を演算で比較する工程を更に含み、RNAの第1の試料から生成されたアライメントされたリードを、RNAの第2の試料から生成されたアライメントされたリードと比較し、前記アライメントは前記複数の標的配列を使用して実施される、請求項1に記載の方法。
- 前記配列リードを前記参照ゲノムにアライメントする工程
を更に含む、請求項1に記載の方法。 - 前記アライメントに基づいて、試験試料についてのアライメントプロファイルを生成する工程を更に含み、前記アライメントプロファイルを生成する工程が、アライメントされていない融合ジャンクションを含む配列リードを前記参照ゲノムの非連続配列にアライメントする工程を含み、前記アライメントされていない融合ジャンクションは前記遺伝子モデルで同定されていなかった、請求項1に記載の方法。
- 前記アライメントに基づいて、試験試料についてのアライメントプロファイルを生成する工程を更に含み、前記アライメントプロファイルは融合ジャンクションを含み、前記融合ジャンクションは前記遺伝子モデルで同定されていた、請求項5に記載の方法。
- RNAをアライメントするコンピュータ実装方法であって、
複数のプライマー配列、及び複数の転写物配列をデータストレージユニットに受け取る工程であって、前記転写物配列が、参照ゲノムにおけるスプライスジャンクション、融合ジャンクション、又はその両方の同定を含む遺伝子モデルに基づいて、前記参照ゲノムから転写可能なものである、工程と、
プライマー配列を、それぞれの転写物配列の遺伝子座に対応する個々の遺伝子座に割り当てる工程と、
前記複数のプライマー配列を用いて、前記複数の転写物配列から増幅可能な複数の標的配列を、マイクロプロセッサを使用して生成する工程と、
マイクロプロセッサを使用して、前記複数の標的配列を含む改変参照ゲノムを生成する工程と、
RNAアンプリコン分子を含む試験試料から、前記複数のプライマー配列を有するプライマーを用いて生成された配列リードを、マイクロプロセッサを使用して、前記改変参照ゲノムにアライメントする工程と、
前記改変参照ゲノムから前記配列リードを前記参照ゲノムに更にアライメントする工程と
を含む方法。 - RNAをアライメントするコンピュータシステムであって、
1つ又は複数のマイクロプロセッサと、
複数のプライマー配列及び複数の転写物配列を保存する1つ又は複数のメモリであって、前記転写物配列が、遺伝子モデルに基づいて参照ゲノムから転写可能なものである、メモリと
を備え、
前記1つ又は複数のメモリが、前記1つ又は複数のマイクロプロセッサによって実行されると、コンピュータシステムに、
前記複数のプライマー配列を用いて、前記複数の転写物配列から増幅可能な複数の標的配列を生成させ、
前記複数の標的配列を含む改変参照ゲノムを生成させ、
RNAアンプリコン分子を含む試験試料から、前記複数のプライマー配列を有するプライマーを用いて生成された配列リードを、前記改変参照ゲノムにアライメントさせる
命令を保存する、コンピュータシステム。 - 前記命令が、前記コンピュータシステムに、プライマー配列をそれぞれの転写物配列の遺伝子座に対応する個々の遺伝子座に割り当てさせる、請求項14に記載のコンピュータシステム。
- 前記命令が、前記コンピュータシステムに、1つを超えるオンターゲット配列にまたがる前記生成された標的配列の1つ又は複数に基づいて、前記生成された標的配列の1つ又は複数を除去させる、請求項15に記載のコンピュータシステム。
- 前記複数のプライマー配列が複数のプライマー対を含み、第1のプライマー対が第1の遺伝子座に対する第1のプライマー及び第2のプライマーを含み、第2のプライマー対が第2の遺伝子座に対する第1のプライマー及び第2のプライマーを含む、請求項15に記載のコンピュータシステム。
- 前記遺伝子モデルが、前記改変参照ゲノムにおけるスプライスジャンクション、融合ジャンクション、又はその両方の同定を含む、請求項14に記載のコンピュータシステム。
- 前記複数の標的配列が、オンターゲット配列とオフターゲット配列を含む、請求項14に記載のコンピュータシステム。
- 前記命令が、前記コンピュータシステムに、前記複数のプライマー配列から1つ又は複数のプライマー配列を除外することにより、オフターゲット配列の数を低減させる、請求項19に記載のコンピュータシステム。
- 前記命令が、前記コンピュータシステムに、2つ以上の試料の遺伝子発現を比較させ、それによってRNAの第1の試料から生成されたアライメントされたリードを、RNAの第2の試料から生成されたアライメントされたリードと比較する、請求項20に記載のコンピュータシステム。
- アライメントプロファイルを生成する工程が、アライメントされていない融合ジャンクションを含む配列リードを前記参照ゲノムの非連続配列にアライメントする工程を更に含み、前記アライメントされていない融合ジャンクションは前記遺伝子モデルで同定されていなかった、請求項14に記載のコンピュータシステム。
- アライメントプロファイルが融合ジャンクションを含み、前記融合ジャンクションが前記遺伝子モデルで同定されていた、請求項18に記載のコンピュータシステム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201862614088P | 2018-01-05 | 2018-01-05 | |
| US62/614,088 | 2018-01-05 | ||
| PCT/US2019/012511 WO2019136364A1 (en) | 2018-01-05 | 2019-01-07 | Process for aligning targeted nucleic acid sequencing data |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2021509572A JP2021509572A (ja) | 2021-04-01 |
| JP7319197B2 true JP7319197B2 (ja) | 2023-08-01 |
Family
ID=65433730
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019566247A Active JP7319197B2 (ja) | 2018-01-05 | 2019-01-07 | 標的核酸のシークエンシングデータをアライメントする方法 |
Country Status (11)
| Country | Link |
|---|---|
| US (1) | US20190325990A1 (ja) |
| EP (1) | EP3616204B1 (ja) |
| JP (1) | JP7319197B2 (ja) |
| KR (1) | KR102858552B1 (ja) |
| CN (1) | CN110692101B (ja) |
| AU (1) | AU2019205780A1 (ja) |
| CA (1) | CA3061740A1 (ja) |
| IL (1) | IL270372B2 (ja) |
| NZ (1) | NZ759420A (ja) |
| SG (1) | SG11201910046SA (ja) |
| WO (1) | WO2019136364A1 (ja) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110942809B (zh) * | 2019-11-08 | 2022-06-10 | 浪潮电子信息产业股份有限公司 | 一种序列比对的Seed处理方法、系统、装置及可读存储介质 |
| CN111261223B (zh) * | 2020-01-12 | 2022-05-03 | 湖南大学 | 一种基于深度学习的crispr脱靶效应预测方法 |
| EP4172990A4 (en) * | 2020-06-24 | 2024-09-25 | Seegene, Inc. | COMPUTER-IMPLEMENTED METHOD FOR PROVIDING OLIGONUCLEOTIDE SET COVERAGE FOR MULTIPLE NUCLEIC ACID SEQUENCES |
| CN111681711B (zh) * | 2020-06-28 | 2021-03-16 | 江苏先声医学诊断有限公司 | 一种兼并引物的设计筛选方法 |
| CN113241118A (zh) * | 2021-07-12 | 2021-08-10 | 法玛门多(常州)生物科技有限公司 | 一种基因突变有害性预测的方法 |
| KR102821587B1 (ko) * | 2022-01-28 | 2025-06-17 | 한국과학기술정보연구원 | 유전자 스크리닝 시퀀싱 데이터 맵핑 처리장치 및 그 장치에서 각 기능을 실행시키기 위해 매체에 저장된 컴퓨터 프로그램 |
| US20240296908A1 (en) * | 2022-03-28 | 2024-09-05 | Chengdu Boe Optoelectronics Technology Co., Ltd. | Method and apparatus for identifying fusion gene, device, program and storage medium |
| KR20240072026A (ko) * | 2022-11-16 | 2024-05-23 | 주식회사 세니젠 | 기준 서열 데이터와 타겟 및 비-타겟종의 교차검증을 활용한, PCR을 위한 K-mer 유전자 데이터 프로세싱 방법 및 그 장치 |
| CN115896256A (zh) * | 2022-11-25 | 2023-04-04 | 臻悦生物科技江苏有限公司 | 基于二代测序技术的rna插入缺失突变的检测方法、装置、设备和存储介质 |
| WO2025245657A1 (zh) * | 2024-05-27 | 2025-12-04 | 京东方科技集团股份有限公司 | 预测扩增反应引物是否适用的方法及装置、存储介质 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20160194694A1 (en) | 2011-04-28 | 2016-07-07 | Life Technologies Corporation | Multiplex transcriptome analysis |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20160078168A1 (en) * | 2012-02-13 | 2016-03-17 | Splicingcodes.Com | Fusion transcript detection methods and fusion transcripts identified thereby |
| KR20160107237A (ko) * | 2014-01-10 | 2016-09-13 | 세븐 브릿지스 지노믹스 인크. | 판독물 맵핑에서 알려진 대립 유전자의 사용을 위한 시스템 및 방법 |
| WO2016011378A1 (en) * | 2014-07-18 | 2016-01-21 | Life Technologies Corporation | Systems and methods for detecting structural variants |
| CN104657628A (zh) * | 2015-01-08 | 2015-05-27 | 深圳华大基因科技服务有限公司 | 基于Proton的转录组测序数据的比较分析方法和系统 |
| US20170009304A1 (en) | 2015-07-07 | 2017-01-12 | Splicingcodes.Com | Method and kit for detecting fusion transcripts |
| US10971249B2 (en) * | 2016-09-15 | 2021-04-06 | Illumina, Inc. | Systems and methods for off-target sequence detection |
-
2019
- 2019-01-07 CN CN201980002652.XA patent/CN110692101B/zh active Active
- 2019-01-07 WO PCT/US2019/012511 patent/WO2019136364A1/en not_active Ceased
- 2019-01-07 JP JP2019566247A patent/JP7319197B2/ja active Active
- 2019-01-07 SG SG11201910046S patent/SG11201910046SA/en unknown
- 2019-01-07 CA CA3061740A patent/CA3061740A1/en active Pending
- 2019-01-07 NZ NZ759420A patent/NZ759420A/en not_active IP Right Cessation
- 2019-01-07 EP EP19705421.6A patent/EP3616204B1/en active Active
- 2019-01-07 KR KR1020197035546A patent/KR102858552B1/ko active Active
- 2019-01-07 US US16/241,288 patent/US20190325990A1/en not_active Abandoned
- 2019-01-07 AU AU2019205780A patent/AU2019205780A1/en not_active Abandoned
- 2019-01-07 IL IL270372A patent/IL270372B2/en unknown
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20160194694A1 (en) | 2011-04-28 | 2016-07-07 | Life Technologies Corporation | Multiplex transcriptome analysis |
Non-Patent Citations (2)
| Title |
|---|
| Nat Biotechnol.,2013年,29(7),pp. 644-652 |
| PLOS ONE,2015年,10(9), e0136343,pp. 1/15-15/15 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP3616204C0 (en) | 2024-07-17 |
| NZ759420A (en) | 2022-07-01 |
| SG11201910046SA (en) | 2019-11-28 |
| KR102858552B1 (ko) | 2025-09-10 |
| CN110692101B (zh) | 2024-01-26 |
| IL270372A (ja) | 2019-12-31 |
| CA3061740A1 (en) | 2019-07-11 |
| AU2019205780A1 (en) | 2019-12-12 |
| WO2019136364A1 (en) | 2019-07-11 |
| CN110692101A (zh) | 2020-01-14 |
| EP3616204B1 (en) | 2024-07-17 |
| EP3616204A1 (en) | 2020-03-04 |
| US20190325990A1 (en) | 2019-10-24 |
| JP2021509572A (ja) | 2021-04-01 |
| IL270372B2 (en) | 2025-09-01 |
| KR20200107774A (ko) | 2020-09-16 |
| IL270372B1 (en) | 2025-05-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7319197B2 (ja) | 標的核酸のシークエンシングデータをアライメントする方法 | |
| US20240321389A1 (en) | Models for Targeted Sequencing | |
| Pla et al. | miRAW: A deep learning-based approach to predict microRNA targets by analyzing whole microRNA transcripts | |
| US20220130488A1 (en) | Methods for detecting copy-number variations in next-generation sequencing | |
| US20190108311A1 (en) | Site-specific noise model for targeted sequencing | |
| US20150142334A1 (en) | System, method and computer-accessible medium for genetic base calling and mapping | |
| CN102682224A (zh) | 检测拷贝数变异的方法和装置 | |
| US20210233612A1 (en) | Systems and methods for off-target sequence detection | |
| Xiao et al. | Modified screening and ranking algorithm for copy number variation detection | |
| Beretta et al. | Modeling alternative splicing variants from RNA-Seq data with isoform graphs | |
| Wang et al. | Genome-wide identification and characterization of DNA enhancers with a stacked multivariate fusion framework | |
| WO2019132010A1 (ja) | 塩基配列における塩基種を推定する方法、装置及びプログラム | |
| US20220399079A1 (en) | Method and system for combined dna-rna sequencing analysis to enhance variant-calling performance and characterize variant expression status | |
| HK40016985B (en) | Process for aligning targeted nucleic acid sequencing data | |
| HK40016985A (en) | Process for aligning targeted nucleic acid sequencing data | |
| US20240428882A1 (en) | Computer-implemented methods and systems for transcriptomics | |
| Wang et al. | CircCNNs, a convolutional neural network framework to better understand the biogenesis of exonic circRNAs | |
| Cheng et al. | Loc4Lnc: Accurate prediction of long noncoding RNA subcellular localization via enhanced RNA sequence representation | |
| WO2025158030A1 (en) | Prediction of gene expression | |
| NZ788962A (en) | Process for aligning targeted nucleic acid sequencing data | |
| WO2025158025A1 (en) | Prediction of chromatin state | |
| CN119763663A (zh) | 一种基于群体规模三代测序数据的变异检测方法、系统、设备及介质 | |
| Chlis et al. | Extracting reliable gene expression signatures through stable bootstrap validation | |
| HK40110801A (zh) | 确定读段质量分数的方法、测序方法及装置 | |
| CN112825267A (zh) | 确定小核酸序列集合的方法及其应用 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220106 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221130 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221212 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230217 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230626 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230720 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7319197 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
