JP2017537657A - 標的配列の濃縮 - Google Patents

標的配列の濃縮 Download PDF

Info

Publication number
JP2017537657A
JP2017537657A JP2017550457A JP2017550457A JP2017537657A JP 2017537657 A JP2017537657 A JP 2017537657A JP 2017550457 A JP2017550457 A JP 2017550457A JP 2017550457 A JP2017550457 A JP 2017550457A JP 2017537657 A JP2017537657 A JP 2017537657A
Authority
JP
Japan
Prior art keywords
target
adapter
probe
sequence
target sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017550457A
Other languages
English (en)
Inventor
シンシア エル. リチャード,
シンシア エル. リチャード,
Original Assignee
ニユー・イングランド・バイオレイブス・インコーポレイテツド
ダイレクテッド ジェノミクス, エルエルシー
ダイレクテッド ジェノミクス, エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ニユー・イングランド・バイオレイブス・インコーポレイテツド, ダイレクテッド ジェノミクス, エルエルシー, ダイレクテッド ジェノミクス, エルエルシー filed Critical ニユー・イングランド・バイオレイブス・インコーポレイテツド
Publication of JP2017537657A publication Critical patent/JP2017537657A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

核酸の集団から標的配列を濃縮するための方法及び組成物であって、核酸の集団と、親和性結合ドメインを含む標的単離プローブとを溶液中で組み合わせること;標的単離プローブの一本鎖領域を、核酸の集団中の標的配列の全部又は一部にハイブリダイズさせることと;標的単離プローブを捕捉ドメインと結合させ、非結合物質を除去することにより、標的配列を含有する集団からハイブリダイズされた核酸を選択的に固定化すること;1以上の3’エキソヌクレアーゼによって、標的配列の3’末端から非標的配列を除去し、それにより標的配列の3’末端に平滑末端二重鎖又は付着端を生じさせること;任意選択的に3’二重鎖アダプター又はヘアピンアダプターの二重鎖末端を標的配列の3’末端及び標的分離プローブの5’末端にライゲートすること;標的単離プローブの3’末端を伸長させて、ライゲーションに適した標的配列の5’末端に平滑末端又は付着端を形成し、標的配列の5’末端及び標的単離プローブの3’伸長末端へのアダプターをライゲートすることを含む、方法が提供される。【選択図】図10

Description

次世代シーケンシング(NGS)は、がん(Dancey, et al. Cell, 48:409-420 (2012); Dawson, et al. NEJM, 368:1199-1209 (2013))、心筋症(Meder, et al. Circ. Cardiovasc. Genet., 4:110-122 (2011); Norton, et al. Curr. Opin. Cariol., 27:214-20 (2012))、遺伝性障害(Boycott, et al. Nature Genetics, 14:681-691 (2013))、出生前診断(Nepomnyashchaya, et al. Clin Chem Lab Med., 51:1141-54 (2013); Papgeorgiou, et al. Genome Medicine, 4:46 (2012))、及び神経障害(Nemeth, et al. Brain, 136:3106-180 (2013))を含めた多くの疾患の診断及び治療において貴重なツールであることが判明している。一方で、NGSによってヒトゲノム全体のシーケンシングが数日で可能になるものの、シーケンシングのコスト及びデータ分析の負担が、全ゲノムシーケンシングの臨床への橋渡しを著しく妨げている。結果として、標的配列の濃縮により、NGS(Agilent, (Santa Clara, CA), Roche/NimbleGen (Madison, WI), Illumina (San Diego, CA), Life Technologies (Grand Island, NY))、マルチプレックスPCR(Life Technologies, Illumina, Qiagen (Valencia, CA), Kailos Genetics (Huntsville, AL))、分子反転プローブ(Hiatt, et al. Genome Res., 23, 843-54 (2013))、高並列PCR(highly-parallel PCR)(Fluidigm (San Francisco, CA), Raindance (Billerica, MA))、及び単一プライマー増幅法(Enzymatics/ArcherDx (Beverly, MA), NuGen (San Carlos, CA))に依拠する分子診断を容易にすることが望ましい。
濃縮のための現行法としては、調製されたDNAライブラリーからのハイブリダイゼーション捕捉(Albert, et al. Nature Methods, 4:903-905 (2007); Okou, et al. Nature Methods, 4:907-909 (2007))が含まれる。ハイブリダイゼーション捕捉は、固定化プローブのアレイを必要とする。理論的には、溶液中の断片化核酸は、それが相補的配列を有する場合、これらの固定化プローブにハイブリダイズする。これらの方法は、二重鎖両方の鎖が捕捉され得ることを除いて、溶液ハイブリダイゼーションの場合と同じ欠点を有する。しかし、これらの方法のさらなる欠点は、ハイブリダイゼーション前にプローブが表面に結合される場合、ハイブリダイゼーションの効率が下がることを含む。さらなる欠点としては、2−3日にもわたる非常に長いプロトコール、試験のコストを増大させる複数の工程、大量の初期インプットDNA(1μg−5μg)の必要性、ライブラリーの広範なサイズ分布、特異性がわずか55%−65%、80%+/−200から500塩基対(bp)、及び反復を捕捉することができないこと、又は非標的配列内の反復配列を含有する核酸を取り扱うことができないことが含まれる。
現行の方法は、標的の末端における人工配列に依拠することから、リード開始点(核酸分子のシーケンシングが開始される位置)を特定するのに適していない。さらに、現行法は、両方の標的鎖を捕捉するのに適していない。本ハイブリダイゼーション法は、通常、Sakharkarら、In Silico Biology,4:387−393(2004)で記載されている通り、200bp未満であるエキソン上の平均サイズを超える核酸断片を捕捉することから、結果的にリード開始点を明確に決定することができないことに因り、実質的に非標的のシーケンシングになる。ハイブリダイゼーションに基づくエキソーム捕捉技術の性能比較は、Clarkら、Nature Biotechnology,29:908-914(2011)で総論されている。
マルチプレックスPCRは、捕捉ハイブリダイゼーションの代替である。マルチプレックスPCR法はかなり高速であり、濃縮前にライブラリーを調製する必要はないが、プライマー相互作用のために反応ごとに拡張性が制限され、異なる効率で増幅するプライマーのセットを使用することから生じる増幅バイアスによる標的全体にわたる増幅の均一性変動、重複をフィルターにかけることができないこと、及び標的へのアニーリングに用いられるプライマー配列の追加が、アンプリコンの末端に含まれる。シーケンシング中、これらの配列を一通り読まざるを得ないため、それによってシーケンシングの時間及びコストが増加する。さらに、不要な配列複雑性を生成する標的配列に加えて、合成プライマーの配列が配列レポートに含まれる。分子反転プローブ及び高並列PCRはいずれも、マルチプレックスPCRによって遭遇する問題の一部を解決するが、両方法ともよりかなり高額である。分子反転プローブは長いオリゴヌクレオチド上で合成する必要があることから、高並列PCR法に関連する装置コストが生じる。その上、いずれの方法も、アンプリコンの末端に合成プライマー配列を導入する。単一プライマー法は、アンプリコンの末端の一方のみにプライマー配列を導入することから、配列決定されたプライマーの量を半減させるが、2のプライマーを用いて正確な標的配列を濃縮することによって得られるさらなる選択性を犠牲にする。その結果、高い拡張性、特異性、及び均一性でオフターゲット又はプライマー領域のシーケンシングを最小にする標的濃縮の方法が依然として必要とされている。
概して、核酸の集団から標的配列を濃縮するための方法及び組成物が提供される。本方法は、核酸の集団と、親和性結合ドメインを含む標的単離プローブとを溶液中で組み合わせること;標的単離プローブの一本鎖領域を、核酸の集団中の標的配列の全部又は一部にハイブリダイズさせること;標的単離プローブを捕捉ドメインと結合させ、非結合物質を除去することにより、標的配列を含有する集団からハイブリダイズされた核酸を選択的に固定化すること;及び1以上の3’一本鎖特異的エキソヌクレアーゼによって、標的配列の3’末端から非標的配列を除去することを含む。
種々の態様において、集団中の核酸の一部又は全部は反復配列を含み、核酸の集団は、標的単離プローブの前に又はそれと共に反復配列にハイブリダイズする除去可能なブロッキングオリゴヌクレオチドと組み合わされ得る。過剰の除去可能なブロッキングオリゴヌクレオチドを使用し、二重鎖変性工程の後にハイブリダイゼーションを可能にすることが有利であり得る。次いで、核酸/除去可能なオリゴヌクレオチド二重鎖中の除去可能なブロッキングオリゴヌクレオチドは、3’一本鎖特異的エキソヌクレアーゼを有する3’非標的配列の分解と同時に又はそれより前に、選択的に分解され得る。除去可能なブロッキングオリゴヌクレオチドの分解は、除去可能なブロッキングオリゴヌクレオチドがRNAである場合にはRNAseによって、又は、例えば除去可能なブロッキングオリゴヌクレオチドが複数のウラシルを含有するDNAである場合にはウラシルグリコシラーゼ及びエンドヌクレアーゼによって、又は除去可能なブロッキングオリゴヌクレオチドを特異的に切断するためのその他任意の適切な技術によって達成され得る。
様々な態様において、上記の標的単離プローブの一本鎖領域は、標的配列の3’末端及び5’末端の両方にハイブリダイズし得る。これらの状況において、親和性ドメインは、好ましくは標的単離プローブの3’末端と5’末端の間に位置するが、3’末端又は5’末端にはない部位で標的単離プローブと結合される。標的配列とのハイブリダイゼーションは、中程度にストリンジェントなハイブリダイゼーション条件下で、標的単離プローブの長さに沿って生じ得る。これらの条件は、本方法の使用が一塩基多型(SNP)を検出するためである場合に予想されるように、個々の塩基対のミスマッチが起こることを許容し得る。あるいは、ハイブリダイゼーションは、異なる供給源由来の選択された標的配列を特徴付ける可能性のある挿入又は欠失のために生じる恐れのあるミスマッチの重要な内部領域を有する標的単離プローブの末端で生じ得る。標的配列/標的単離プローブが親和性ドメインと固定化された捕捉ドメインとの結合により固定化され、3’非標的配列が除去された後か又は1以上の3’エキソヌクレアーゼを用いた除去と同時に、5’非標的配列は、1以上の5’一本鎖特異的エキソヌクレアーゼによって標的配列の5’末端から除去され得る。標的配列の3’及び5’末端でのエキソヌクレアーゼ消化に続いて、アダプターのライゲーションに適した平滑末端又は付着端を生成するために、アダプターを標的配列にライゲートさせることにより、標的配列は、容易に同定、単離、増幅、配列決定、特徴付けされ、及び/又は表現型的に重要な配列差異について分析され得る。
本方法の態様において、標的単離プローブの異なる構造を利用し、本明細書に記載の第二のプローブと併せて使用することができる。プローブに関係なく、本方法のいくつかの共通の特徴、すなわち集団中の核酸の、親和性ドメインと結合した標的単離プローブとのハイブリダイゼーション、それに続く、標的単離プローブが固定化されている場合に生じ、非ハイブリダイズ核酸及び試薬を洗浄により、次いで3’非標的配列をエキソヌクレアーゼ消化により除去することを可能にする濃縮の第一の工程は、保存される。
本方法の一態様において、標的単離プローブは、フラッププローブであってもよく、フラッププローブは一本鎖領域の3’末端から伸長する非ハイブリダイズ二本鎖領域を有する。非ハイブリダイズ二本鎖領域は、一方の鎖の5’末端でプローブの一本鎖領域の3’末端にライゲートされてもよいし、又は非ハイブリダイズ二本鎖領域において第二の鎖を構成する3’−5’オリゴヌクレオチドがアニールされている、一本鎖プローブの一部であってもよい。あるいは、非ハイブリダイズ二本鎖領域は、折り返してそれ自体とハイブリダイズして二本鎖領域を形成する、一本鎖プローブの3’末端のヘアピンから形成され得る。フラッププローブの、標的配列の5’末端へのハイブリダイゼーションの後、5’非標的配列は、5’フラップエンドヌクレアーゼ消化により除去することができ、3’−5’オリゴヌクレオチド又はヘアピンは、5’アダプターとして働くようにニッキング工程の後の標的配列の5’末端にライゲートされ得る。3’アダプターは、標的配列の3’末端にライゲートされ得る。3’及び5’アダプターは、シーケンシングプライマー部位、ライブラリー増幅プライマー部位、一意なサンプル識別子(unique sample identifier)、及び一意な分子識別子配列のうちの1以上をそれぞれ含有し得る。
本方法の他の態様において、標的単離プローブの一本鎖領域は、標的配列の第一の部分にハイブリダイズする。例えば、標的単離プローブの末端は、標的配列の3’末端若しくは5’末端又はその近傍の配列を有する二重鎖を形成する。第二のプローブの一本鎖領域が標的単離プローブに隣接する、又はその近傍若しくは遠位の位置で標的配列の第二の部分にハイブリダイズすることがさらに可能になり、この位置によって第二のプローブが標的単離プローブと反対側にある標的配列の末端を決定することになる。一態様において、第二のプローブは、標的配列中のヌクレオチドの90%、70%、50%、30%又は10%以下の非ランダム配列を有し、それに対応して標的単離配列は標的配列の10%、30%、50%、70%又は90%以下のヌクレオチド配列を有する。
これらの方法の態様において、3’標的単離プローブ上の親和性ドメインは、標的単離プローブの3’末端に、又は標的単離プローブ内のどこにでも(ただし5’末端は除く)配置することができ、一方、5’標的単離プローブ上の親和性ドメインは、標的分離プローブの5’末端に、又は標的分離プローブの内のどこにでも(ただし3’末端は除く)配置され得る。
これらの方法の態様において、標的単離プローブが標的配列の一部に、例えば標的配列の3’末端でハイブリダイズする場合、4−10ヌクレオチドの範囲の長さを持つランダム配列を有するオリゴヌクレオチドを用いることができ、このオリゴヌクレオチドは、ポリメラーゼ伸長のためのプライマーとして働き、アダプターライゲーションに適した二本鎖の5’末端を形成する。
本方法の別の態様において、標的単離プローブ又は標的配列の5’部分に配置される第二のプローブは、ハイブリダイズする一本鎖領域と一本鎖領域の3’末端から伸長するハイブリダイズしない二本鎖領域とを有する前述のものと類似のフラッププローブである。5’非標的配列は、5’エキソヌクレアーゼ消化によって除去されて、線状プローブが標的配列の5’末端で用いられる場合には標的配列へのアダプターライゲーションに適した平滑末端又は付着端を、5’フラッププローブが用いられる場合には5’フラップエンドヌクレアーゼを提供することができる。例えば、ブロッキング部分は、標的単離プローブ又は第二のプローブへのアダプターのライゲーションを防ぐために、修飾されたヌクレオチドが提供される。5’末端のエキソヌクレアーゼ消化が5’非標的配列よりも多い又は少ないものを除去する場合、5’アダプターのライゲーション前に、付着端を埋める追加の工程を用いることができる。
前述の方法の態様のいずれにおいても、3’アダプター及び任意選択的に5’アダプターは、ヘアピンアダプターであってもよい。ヘアピンアダプターの使用は、標的配列の末端を決定する標的単離プローブ又は第二のプローブがヘアピンアダプターの一方の末端に共有結合され得、標的配列はヘアピンアダプターのもう一端に共有結合されるような、さらなる利点をもたらす。変性条件下で、一本鎖核酸は、標的配列の、プライムされた増幅(primed amplification)を開始するために利用可能なアダプター配列を生じる。
本方法の一態様において、5’エキソヌクレアーゼ消化後に5’プローブを置換するように、標的単離配列の3’末端をポリメラーゼによって伸長させることができる。
本発明の方法の態様において、アダプターは、標的配列の各末端及び直接又は増幅後に配列決定される標的配列にライゲートされる。シーケンシング反応におけるリード開始点は、標的配列の3’末端又はその近傍に存在し、標的配列をわかりにくくするか又は標的配列における重大な突然変異をわかりにくくするプライマーの懸念なしに標的配列中の各ヌクレオチドのシーケンシングを可能にする方法で、標的配列の5’末端又はその近傍で終結する。突然変異の例には、挿入、欠失又はヌクレオチド多型若しくは一塩基多型のうちの1以上が含まれる。このようにして、生物の突然変異と表現型との相関は、忠実に記録することができる。
標的配列の一方又は両方の末端での非標的配列の除去に因って、非標的配列の不必要なシーケンシング及び分析は回避される。概して、動物又は植物の抽出物を分析するための方法であって、抽出物から核酸サンプルを得ること;前述の標的配列について濃縮すること;及び濃縮された標的分子のヌクレオチド配列を得ることを含む方法が提供される。一態様において、濃縮された標的分子から得られるヌクレオチド配列は、3’末端の5つ未満の非標的ヌクレオチドか;又は標的配列の少なくとも90%を含む。シーケンシングの前に、標的配列は、標的配列の3’及び5’末端に位置するアダプター内の配列にハイブリダイズするプライマー配列を用いて、増幅することができる。標的配列が得られたら、それを用いて、原核生物又は真核生物から変化した表現型との配列変化の相関を確立することができる。
概して、核酸の集団から標的配列を濃縮するための方法であって、次の工程の1つ以上を含む方法が提供される:核酸の集団と、親和性結合ドメインを含む標的単離プローブとを溶液中で組み合わせる工程;標的単離プローブの一本鎖領域を、核酸の集団中の標的配列の全部又は一部にハイブリダイズさせる工程;標的単離プローブを捕捉ドメインと結合させ、非結合物質を除去することにより、標的配列を含有する集団からハイブリダイズされた核酸を選択的に固定化する工程;1以上の3’エキソヌクレアーゼ(例えばエキソヌクレアーゼI、エキソヌクレアーゼT)及び/又は3’エキソヌクレアーゼ活性を有する1以上のポリメラーゼによって、標的配列の3’末端から非標的配列を除去する工程。エキソヌクレアーゼ活性は、標的配列の3’末端及び標的単離プローブの5’末端に、標的配列の3’末端及び標的単離プローブの5’末端がその後アダプターとのライゲーションに適するようにする、平滑末端二重鎖(blunt ended duplex)又は付着端を生じさせることができる。標的単離プローブの3’末端を伸長させて、標的配列の5’末端に平滑末端又は付着端を形成することができ、ここで伸長工程は、例えばdUTPなどの修飾デオキシヌクレオチドの存在下で実施される。一態様では、本方法は、上に大まかに記載したすべての工程を含む。
一態様において、上記の標的単離プローブの一本鎖領域は、標的配列の一部にハイブリダイズする。一態様において、前記部分は、標的配列の3’末端に配置される。別の態様では、親和性結合ドメインは、標的単離プローブの3’末端と5’末端の間に配置される。別の態様では、標的単離プローブのエキソヌクレアーゼ分解を防ぐために、標的単離プローブは、その3’末端及び/又はその5’末端において修飾される。別の態様では、標的単離プローブの3’末端でのライゲーションを防ぐために、標的単離プローブは、その3’末端で修飾される。別の態様では、5’末端での標的単離プローブのポリメラーゼ伸長を防ぐために、標的単離プローブは、その5’末端で修飾され、修飾は例えば、インバーテッド塩基(inverted base)、炭素リンカー、ホスホロチオエート結合又はジデオキシヌクレオチドから選択される。一態様において、増幅を防ぐために、標的単離プローブは、デオキシウラシル、内部炭素リンカー又は1以上のリボヌクレオチドを含有するように修飾される。
一態様では、二重鎖アダプターかヘアピンアダプターの二重鎖領域のいずれかが、標的配列の3’末端(3’アダプター)に、任意選択的に標的単離プローブの5’末端にライゲートされる。別の態様では、二重鎖アダプターかヘアピンアダプターの二重鎖領域のいずれかが、標的配列の5’末端(5’アダプター)に、場合によって標的単離プローブの3’末端にライゲートされる。
一態様では、アダプターは、NGSプラットフォーム特異的アダプター、単一ヌクレオチドオーバーハングを含有するアダプター、切断可能部位を有するY構造若しくはヘアピンアダプター、完全に相補的な二本鎖DNA(dsDNA)アダプター、又はライゲーション接合部の反対側に一本鎖DNA(ssDNA)オーバーハングを有するdsDNAアダプターであり得る。別の態様では、3’アダプターの3’末端(標的配列の3’末端に連結するアダプター)は、ジデオキシヌクレオチドを含有することができ;及び/又は標的配列の3’末端へのライゲーションが意図されるアダプターの5’末端は、リン酸基を欠いており;及び/又は標的へのライゲーションが意図されていないアダプターの5’末端若しくは3’末端は、インバーテッドヌクレオチド(inverted nucleotide)を含有する。別の態様では、アダプター配列は、シーケンシングプライマー部位、ライブラリー増幅プライマー部位、一意なサンプル識別子、及び一意な分子識別子配列のうちの少なくとも1つを含む。
別の態様では、本方法は、アダプターにライゲートされた標的配列を増幅することを含む。増幅反応は、シーケンシングプラットフォームにより必要とされる配列などの、追加の配列をアダプターにライゲートされた標的に追加するプライマーを用いて実施することができる。標的配列は、定量され、配列決定され得る。
標的選択及び濃縮のための方法の概略図を示す。(1)は、一本鎖核酸又は熱変性二本鎖核酸の一本の鎖を示す。(2)は、(1)にハイブリダイズされた、標的単離プローブの3’末端と5’末端の間の位置であるが3’及び5’末端ではない位置で親和性ドメイン(
Figure 2017537657
)に共有結合された標的単離プローブを示す。ここで、標的単離プローブは、標的核酸配列の全長にハイブリダイズされる。標的単離プローブは、エキソヌクレアーゼ分解、ライゲーション、及び/又はポリメラーゼ伸長を防ぐために、3’及び5’末端の一方又は両方に修飾を含むことができる。修飾には、次のうちの1以上が含まれ得る:インバーテッド塩基;炭素リンカー;ホスホロチオエート結合;及びジデオキシヌクレオチド。さらに、内部修飾としては、標的単離プローブの増幅を防ぐために、もう1つのdU又は1以上のリボヌクレオチドなどが含まれ得る。(3)は、捕捉ドメイン(
Figure 2017537657
)への(2)の結合を示す。捕捉ドメインに結合していない核酸は、洗浄によって除去される。(4)は、標的分子/標的単離プローブ二重鎖の3’及び5’末端の両方に二本鎖平滑末端をもたらす、1以上の3’及び5’一本鎖DNAエキソヌクレアーゼ若しくはRNAエキソヌクレアーゼによる消化産物に該当する。3’及び5’消化は、共に又は連続して実施することができる。消化後、酵素及び緩衝液は、洗い流される。(5)は、アダプターが標的配列の各末端にライゲートされている標的核酸を示す。標的単離プローブへのライゲーションは、遮断される。ここで用いられるアダプターは、DNA標的についてはT4 DNAリガーゼなどのDNAリガーゼを、又はRNA標的についてはT4 RNAリガーゼ2などのRNAリガーゼを使用して末端にライゲートされるNGSプラットフォーム−特異的アダプター;単一ヌクレオチドオーバーハングを含むアダプター(クレノウ(エキソ−)を用いたdAのDNA標的上への付加など、単一ヌクレオチドによって伸長された3’末端にライゲートされている);一意配列が標的DNA又はRNAの3’及び5’末端に特異的に追加され得るように切断可能部位を有する、Y構造又はヘアピンアダプター;完全に相補的なdsDNAアダプター、又はライゲーション接合部の反対側の末端にssDNAオーバーハングを有するdsDNAアダプターであり得る。これらのアダプターは、標的単離プローブへのライゲーション及び/又はコンカテマー化を回避するために、標的核酸へのライゲーションが意図されていないアダプター終端上に、5’リン酸の非存在、インバーテッドヌクレオチド又はジデオキシヌクレオチドなどの1以上の修飾を含むことができる。標的DNAの3’末端にライゲートするアダプター鎖は、ライゲーションのために5’−リン酸を含有することができる。あるいは、プローブの3’末端及びそのアダプターの5’末端が修飾されないでライゲーションを阻害する場合、このアダプター鎖は、5’−リン酸を欠くことができる。この場合、プローブのアダプターへのライゲーションの後、ニックトランスレーションによってアダプター配列を標的の3’末端に追加することができる。次いで、ライゲートしていないアダプター、酵素、及び緩衝液は、洗い流される。一方又は両方のアダプターは、標的配列が由来する核酸サンプルを同定するための一意DNA配列(UID)又は核酸サンプルが由来する個々の生物を同定するためのバーコードを含有し得る。UID及び/又はバーコードの使用は、多重化反応におけるサンプルの確認及び同定を容易にする。(6)は、固体支持体からの溶出後にアダプターにライゲートされた標的分子の、任意選択的なPCR増幅の産物に該当する。PCR又はRT−PCRを用いる場合、PCRプライマーは、シーケンシングプラットフォームによって必要とされる配列などの追加の配列を追加することもでき、又はアダプターに相補的な配列を含有するだけでもよい。あるいは、アダプターにライゲートされた標的分子が親和性ドメインにより固定化され、ひいては捕捉ドメインに結合される場合、固定化された標的分子は、固体又は半固体マトリックスから溶液への溶出を必要とせず、増幅反応に直接加えることができる。次いで、得られたライブラリーを定量化し、配列決定することができる。
図1に記載の、標的の選択及び濃縮のための方法についての変形例を示す。図2A(7)-(11)は、図1中の(1)−(3)の続きである。(7)は、一本鎖核酸又は親和性ドメインを有する標的単離プローブが結合されており、次に捕捉ドメインに結合された熱変性ランダム核酸断片の一本の鎖を示し、ここで3’非標的核酸は、3’二本鎖平滑末端を残す、1以上の3’一本鎖DNAエキソヌクレアーゼ又はRNAエキソヌクレアーゼによって消化されている。消化後、酵素及び緩衝液を洗い流し、次いで3’末端に3’アダプターを付加する(8)。アダプターの構造は、(5)について記載したものと同じである。(9)は、標的核酸の5’末端又は標的核酸が凹陥するか若しくはオーバーハングを呈する末端で二本鎖の平滑末端を残す、1以上の5’一本鎖のDNAエキソヌクレアーゼ又はRNAエキソヌクレアーゼによる消化の産物を示す。消化後、酵素及び緩衝液は、洗い流される。標的分子の一部が付着末端を含有する場合、この末端は、DNAポリメラーゼ、RNAポリメラーゼ又は逆転写酵素によるプローブの3’末端の伸長又は消化によって平滑末端化され得る。伸長のために標準的なデオキシヌクレオチド又はリボヌクレオチドを使用することができ、又はデオキシウラシル三リン酸(dUTP)などの1以上の修飾されたヌクレオチド三リン酸(NTP)、例えば、デオキシウラシル三リン酸(dUTP)を含有する混合物を使用して、後に任意の伸長配列を消化することができる。平滑末端化した後、酵素及び緩衝液は、洗い流される。上記(5)について記載したような5’アダプターは、標的分子(10)の5’末端にライゲートされて、上記(6)について記載したようなPCR(11)を可能にする。別法として、図2Aに示す方法は、5’一本鎖核酸を除去し、まず5’アダプターのライゲーションの後、3’一本鎖核酸を除去し、3’アダプターのライゲーションを行うことにより実施することができる。図2Bは、図1に示す標的選択及び濃縮のための方法の変形例を示す。(12)は、(1)からの続きであり、フラッププローブである親和性ドメインに共有結合されたフラップ標的単離プローブを示し、標的単離プローブの3’末端は、標的に相補的ではなく、NGSプラットフォーム−特異的アダプター配列の一部又は全部を含有する二本鎖DNA領域を含有する。この二本鎖領域は、標的単離プローブの一本鎖領域の3’末端を、標的単離プローブの標的核酸へのハイブリダイゼーション前、最中又は後に、NGSアダプター配列に相補的な第二のオリゴヌクレオチドにハイブリダイズさせることにより形成することができる。あるいは、標的単離プローブは、切断可能部位を有するヘアピンを形成又はそれにライゲートされて、アダプター配列の一部又は全部にわたる二本鎖領域を生成し得る。二本鎖領域の3’末端は、標的単離プローブの3’末端で終結するか、又は1以上の塩基を越えて標的単離プローブへと伸長する。親和性ドメインは、ヘアピンプローブの3’末端を除いて、標的単離プローブ内の任意の位置に存在し得る。(12)の分子は、捕捉ドメイン(13)に固定化されている。(14)は、図2Aに記載のように達成されるアダプターライゲーション前の3’非標的核酸の消化産物を示す。標的分子上の5’一本鎖DNAは、FEN−1などのフラップエンドヌクレアーゼにより切断されて、標的核酸とベイトの二本鎖領域との間でニックを生成する。ニックは、T4 DNAリガーゼなどのリガーゼとライゲートされる。(15)は、図1に示す通り、標的の、任意選択のPCRの産物を示す。図2Cは、図1に記載の方法の変形例を示す。標的単離プローブにライゲートすることができない3’アダプター(例えば図1に記載のアダプターを参照)は、(4)の3’末端にライゲートされて(16)を生成する。(17)は、3’エキソヌクレアーゼ活性を有し、ジデオキシヌクレオチドなどの修飾を阻害するライゲーションを除去し、続いて3’アダプターを伸長して平滑末端を形成し、固定化された標的単離プローブから標的を放出することができるDNAポリメラーゼ又は逆転写酵素による、アダプターの3’末端の伸長産物を示す。標準的なデオキシヌクレオチド又はリボヌクレオチドを伸長のために用いることができ、又はdUTPなどの1以上の修飾NTPを含有する混合物を使用して、後に任意の伸長された配列を消化することができる。伸長後、酵素及び緩衝液は、洗い流される。(18)において、5’アダプター(例えば図1を参照)は、(17)の5’末端にライゲートされる。 1つのプローブとして標的単離プローブを利用し、第二のプローブとして小さな可変(ランダム)オリゴヌクレオチドを利用する標的選択及び濃縮のための2プローブ法を示す。(19)は、より大きな核酸の機械的又は酵素的断片化の結果として生じる熱変性断片の一本の鎖であり得る一本鎖核酸を示す。(20)は、標的配列の3’末端とハイブリダイズされ、親和性ドメインに共有結合された3’標的単離配列であり、親和性ドメインは標的単離プローブの5’末端でない位置にある。標的単離プローブは、エキソヌクレアーゼ分解、ライゲーション、及び/又はポリメラーゼ伸長を防ぐために、3’末端に修飾を含むことができる。修飾の例には、インバーテッド塩基、炭素リンカー、ホスホロチオエート結合、及びジデオキシヌクレオチドが含まれる。標的単離プローブは、エキソヌクレアーゼ分解を防ぐために、5’末端にホスホロチオエート結合などの修飾を含むことができる。さらに、内部修飾としては、プローブの増幅を防ぐために、もう1つのdU又は1以上のリボヌクレオチドなどが含まれ得る。(21)は、捕捉ドメインへの(20)の固定化を示す。捕捉ドメインに結合していない核酸は、洗浄によって除去される。(22)は、標的核酸/標的単離プローブ二重鎖の3’末端上に二本鎖平滑末端を残す、3’一本鎖DNAエキソヌクレアーゼ又はRNAエキソヌクレアーゼによる消化産物である。消化後、酵素及び緩衝液は、洗い流される。(23)は、3’標的配列及び標的単離プローブの5’末端に共有結合された切断可能部位(X)を有するヘアピンアダプターを示す。(24)は、(23)の標的核酸の5’領域にハイブリダイズされたランダムオリゴヌクレオチドを示す。(25)は、平滑末端を形成するためのDNAポリメラーゼ、RNAポリメラーゼ又は逆転写酵素によるランダムプライマーの3’末端の伸長産物である。標準的なデオキシヌクレオチド又はリボヌクレオチドを伸長のために用いることができ、又はdUTPなどの1以上の修飾dNTPを含有する混合物を使用して、後に任意の伸長された配列を消化することができる。平滑末端化した後、酵素及び緩衝液は、洗い流される。(26)は、(25)に5’アダプターが(例えば図1に記載のようにして)結合されたものである。(27)は、(26)の増幅産物である。 図4は、2つのプローブを利用する標的の単離及び濃縮のための方法を示す図であり、ここで第二のプローブは非ランダム配列を有する。(28)は、(19)−(23)の産物であり、ここで第二のプローブは、ランダム配列を有する4−10ヌクレオチドからなるオリゴヌクレオチドの代わりに、標的核酸の5’部分にハイブリダイズされる。5’プローブは、エキソヌクレアーゼ分解を防ぐために、5’末端にホスホロチオエート結合などの修飾を含むことができる。さらに、内部修飾としては、プローブの増幅を防ぐために、もう1つのdU又は1以上のリボヌクレオチドなどが含まれ得る。(29)では、5’非標的核酸は、1以上の5’一本鎖DNA又はRNAエキソヌクレアーゼにより除去されており、第二のプローブの3’末端の、任意選択の伸長又は消化がこれに続く。(30)は、5’アダプターの(29)への付加を示す。(31)は、(30)の増幅産物に該当する。代替的な態様では、図4に記載の方法は、最初に、親和性ドメインを含有する5’標的単離配列の標的核酸の5’部分におけるハイブリダイゼーション、それに続いて、非結合プローブの捕捉及び除去、5’非標的配列を除去するための5’エキソヌクレアーゼ消化、標的核酸の3’部分への3’第二プローブのハイブリダイゼーション前の5’アダプターのライゲーション及び1以上の3’エキソヌクレアーゼを用いた非標的配列の除去によって実施することができる。 図4に記載の2プローブ法の変形例を示す。図5Aは、工程(19)−(23)で始まり、それに工程(28)−(29)が続く方法を示す。(32)は、標的核酸配列の3’末端にライゲートされたアダプターを有する標的核酸に該当する。標的核酸は、3’標的単離プローブにハイブリダイズされ、親和性ドメインは、標的単離プローブ内(ただし3’又は5’末端ではない)で共有結合される。3’標的単離プローブは、エキソヌクレアーゼ分解を防ぐために、3’及び/又は5’末端にホスホロチオエート結合などの修飾を含むことができる。内部修飾としては、標的単離プローブの増幅を防ぐために、もう1つのdU又は1以上のリボヌクレオチドなどが含まれ得る。(33)は、5’プローブを置換し、5’アダプターがライゲートされる平滑末端を生成する、(32)における3’標的単離プローブの伸長産物を示す。(35)は、増幅産物を示す。図5Bは、2つのプローブを伴う標的選択及び濃縮のための方法の変形例を示す。工程(19)−(23)の後、(35)は、(図2Bに記載の)フラッププローブが親和性ドメインなしで標的領域の5’末端とハイブリダイズされる(23)に該当する。(36)は、FEN−1などのフラップエンドヌクレアーゼによる標的分子上での5’一本鎖核酸の切断後の(35)に該当し、標的核酸とプローブの二本鎖領域との間にニックを生成している。(37)では、(36)中のニックがT4 DNAリガーゼなどのリガーゼとライゲートされる。(37)は、溶出後の標的核酸の産物増幅である。5Bの変形例には、図2Bに記載のように、親和性ドメインを含有する5’標的単離プローブのハイブリダイゼーション、それに続くフラップエンドヌクレアーゼによる5’一本鎖核酸の捕捉及び除去、及び親和性ドメインが欠失した3’標的単離プローブのハイブリダイゼーションに先立つ、ニックのライゲーション、3’一本鎖核酸の除去及び3’アダプターのライゲーションが含まれる。図5Cは、2つのプローブを伴う標的選択及び濃縮のための方法の変形例を示す。(38)は、(19)の産物であり、親和性ドメインを含有する3’標的単離プローブと5プローブの両方又は3’プローブと親和性ドメインを含有する5’標的単離プローブの両方が単一反応において標的核酸配列にハイブリダイズされる。(39)では、標的単離配列上の親和性結合ドメインは、標的配列を固定化する捕捉ドメインに結合する。(40)は、標的核酸/標的単離プローブ二重鎖の3’及び5’両末端上に二本鎖平滑末端を残す、3’及び5’一本鎖DNAエキソヌクレアーゼ又はRNAエキソヌクレアーゼによる消化産物である。3’及び5’消化は、共に又は連続して実施することができる。消化後、酵素及び緩衝液は、洗い流される。(41)は、3’及び5’アダプターが付加されている(40)である。(42)は、(41)の増幅産物である。 図6A−Dは、3’平滑末端化の効率を表すABIシーケンサーについての断片分析を示す図である。図6Aは、3’−ビオチン化プローブにハイブリダイズされ、ストレプトアビジンビーズに結合し、20ntの3’オーバーハングを形成する5’−FAM−標識オリゴヌクレオチドを模式的に示す図である。図6Bは、断片分析のためのABIシーケンサーからのクロマトグラム上の対応するピークを示す。図6Cは、3’ssDNAエキソヌクレアーゼ処理後の平滑末端化された5’−FAM標識オリゴヌクレオチドを模式的に示す。図6Dは、図1Cに対応するピークを示す図であり、単一のピークが平滑末端化されたDNAの存在と相関する。 図7A−Dは、3’−FAM標識オリゴヌクレオチドを用いた5’平滑末端化の効率を示すシーケンサーについての断片分析を示す。3’−FAM標識オリゴは、5’−ビオチン化プローブにハイブリダイズされ、ストレプトアビジンビーズに結合されて、20ntの5’オーバーハングを形成する。5’ssDNAエキソヌクレアーゼによるインキュベーション後、それに続いてビーズ洗浄により酵素を除去し、FAM−標識オリゴをNaOH中で溶出し、断片分析のためのABIシーケンサーで実施する。図7及び図7Bは、出発物質を示す。図7C及び図7Dは、オーバーハングの消化の結果を示し、図中、平滑末端dsDNA、4塩基オーバーハング、及び8塩基オーバーハングに相関する三つのピークが見られる。 血小板由来成増殖因子受容体アルファ遺伝子(PDGFRA)中のエキソンの捕捉を示す。ビオチン化標的特異的プローブは、剪断されたJurkatゲノムDNA(gDNA)にハイブリダイズされた。標的配列は、ストレプトアビジンビーズへの結合により捕捉され、BW緩衝液中での洗浄がそれに続いた。3’エキソヌクレアーゼを添加してgDNA二重鎖であるプローブのgDNA3’を除去し、その結果、プローブの5’末端が標的の3’末端を決定した。3’dA−テーリング及びアダプターライゲーションの後、ランダムプライマーは、ハイブリダイズされ、伸長されて5’平滑末端を形成し、5’アダプターのライゲーションがそれに続いた。ライブラリーは、PCRによって増幅され、Illumina MiSeq(登録商標)システム(カリフォルニア州サンディエゴのIllumina)で配列決定された。プラス及びマイナス鎖上の固定された3’末端及びランダム5’末端によるPDGFRA標的の捕捉を示す。 線維芽細胞増殖因子受容体遺伝子(FGFR2)中のエキソンの捕捉を示す。ビオチン化標的特異的プローブは、剪断されたJurkat gDNAにハイブリダイズされた。標的は、ストレプトアビジンビーズへの結合により捕捉され、Bind and Wash(BW)緩衝液中での洗浄がそれに続いた。3’エキソヌクレアーゼを添加して3’非標的gDNAを除去し、ここでプローブの5’末端が標的の3’末端を決定した。3’dA−テーリング及びアダプターライゲーションの後、標的特異的5’プローブは、標的配列にハイブリダイズされ、5’ssDNAは、平滑末端又は小さな5’オーバーハングのいずれかを残すエキソヌクレアーゼにより消化された。プローブは、DNAポリメラーゼによって伸長されて平滑末端を形成し、5’アダプターのライゲーションがこれに続いた。標的配列は、PCRによって増幅され、Illumina MiSeqで配列決定された。FGFR2標的配列の捕捉は、プラス及びマイナス鎖上の固定された3’及び5’末端により示される。 標的選択及び濃縮のための方法の概略図を示す。 (1)は、一本鎖核酸又は熱変性二本鎖核酸の一本の鎖を示す。(2)は、(1)にハイブリダイズされた標的単離プローブの3’末端と5’末端の間の位置であるが3’及び5’末端ではない位置で親和性ドメイン(
Figure 2017537657
)に共有結合した標的単離プローブを示す。ここで、標的単離プローブは、標的核酸配列の3’末端にハイブリダイズされる。標的単離プローブは、エキソヌクレアーゼ分解、ライゲーション、及び/又はポリメラーゼ伸長を防ぐために、3’及び5’末端の一方又は両方に修飾を含むことができる。修飾には、次のうちの1以上が含まれ得る:インバーテッド塩基;炭素リンカー;ホスホロチオエート結合;及びジデオキシヌクレオチド。さらに、内部修飾としては、標的単離プローブの増幅を防ぐために、もう1つのdU、内部炭素リンカー又は1以上のリボヌクレオチドなどが含まれ得る。(3)は、捕捉ドメイン(
Figure 2017537657
)への(2)の結合を示す。捕捉ドメインに結合していない核酸は、洗浄によって除去される。(4)は、標的分子/標的単離プローブ二重鎖の3’末端上に二本鎖平滑末端をもたらす、一本鎖DNAを切断可能な3’エキソヌクレアーゼ活性を有する1以上の酵素による消化産物に該当する。3’エキソヌクレアーゼを有する酵素は、エキソヌクレアーゼI、エキソヌクレアーゼT、又は3’エキソヌクレアーゼ活性を有する1以上のDNAポリメラーゼを含み得る。消化後、酵素及び緩衝液は、洗い流される。(5)は、アダプターが標的配列の3’末端にライゲートされている標的核酸を示す。ここで使用されるアダプターは、DNA標的についてはT4 DNAリガーゼなどのDNAリガーゼを、RNA標的についてはT4 RNAリガーゼ2などのRNAリガーゼを使用して末端にライゲートされるNGSプラットフォーム特異的アダプター;単一ヌクレオチドオーバーハングを含むアダプター(この場合、アダプターのライゲーションの前に、クレノウ(エキソ−)などの3’エキソヌクレアーゼ活性を欠くDNAポリメラーゼによって単一の非鋳型ヌクレオチドが標的に添加されるであろう);一意であるように切断可能部位を有するY構造又はヘアピンアダプター;完全に相補的なdsDNAアダプター、又はライゲーション接合部の反対側の末端にssDNAオーバーハングを有するdsDNAアダプターであり得る。このアダプターは、標的単離プローブへのライゲーション及び/又はコンカテマー化を回避するために、標的核酸へのライゲーションが意図されていないアダプター終端上に、ジデオキシヌクレオチド、5’リン酸の非存在又はインバーテッドヌクレオチドなどの1以上の修飾を含むことができる。標的DNAの3’末端にライゲートするアダプター鎖は、ライゲーションのために5’−リン酸を含有することができる。あるいは、プローブの3’末端及びそのアダプターの5’末端が修飾されないでライゲーションを阻害する場合、このアダプター鎖は、5’−リン酸を欠くことができる。この場合、プローブのアダプターへのライゲーションの後、ニックトランスレーションによってアダプター配列を標的の3’末端に追加することができる。次いで、ライゲートしていないアダプター、酵素、及び緩衝液は、洗い流される。アダプターは、標的配列が由来する核酸サンプルを同定するためのUID又は核酸サンプルが由来する個々の生物を同定するためのバーコードを含有し得る。UID及び/又はバーコードの使用は、多重化反応におけるサンプルの確認及び同定を容易にする。(6)は、3’エキソヌクレアーゼ活性を有するポリメラーゼを用いて平滑末端を形成するか、又は3’エキソヌクレアーゼ活性なしのポリメラーゼを用いて単一ヌクレオチドの3’オーバーハングを有する末端を形成するための、DNAポリメラーゼによるプローブの3’伸長に該当する。伸長は、標準的なデオキシヌクレオチドを用いて実施することができ、又は修飾デオキシヌクレオチド(例えばdUTP)を含有することができる。dUTPなどの修飾デオキシヌクレオチドの使用は、PCR増幅に先立って伸長産物の除去を可能にする。(7)は、アダプターが標的配列の5’末端にライゲートされている標的核酸を示す。ここで用いられるアダプターは、DNA標的についてはT4 DNAリガーゼなどのDNAリガーゼを、又はRNA標的についてはT4 RNAリガーゼ2などのRNAリガーゼを使用して末端にライゲートされるNGSプラットフォーム−特異的アダプター;単一ヌクレオチドオーバーハングを含むアダプター(クレノウ(エキソ−)を用いた非鋳型ヌクレオチドのDNA標的上への添加など、単一ヌクレオチドによって伸長された3’末端にライゲートされている);一意であるように切断可能部位を有する、Y構造又はヘアピンアダプター;完全に相補的なdsDNAアダプター、又はライゲーション接合部の反対側の末端にssDNAオーバーハングを有するdsDNAアダプターであり得る。このアダプターは、標的単離プローブへのライゲーション及び/又はコンカテマー化を回避するために、標的核酸へのライゲーションが意図されていないアダプター終端上に、ジデオキシヌクレオチド、5’リン酸の欠失又はインバーテッドヌクレオチドなどの1以上の修飾を含むことができる。次いで、ライゲートしていないアダプター、酵素、及び緩衝液は、洗い流される。アダプターは、標的配列が由来する核酸サンプルを同定するためのUID又は核酸サンプルが由来する個々の生物を同定するためのバーコードを含有し得る。UID及び/又はバーコードの使用は、多重化反応におけるサンプルの確認及び同定を容易にする。任意選択のPCR増幅は、固体支持体からの溶出後にアダプターにライゲートされた標的分子を使用して実施することができる。PCR又はRT−PCRを用いる場合、PCRプライマーは、シーケンシングプラットフォームによって必要とされる配列などの追加の配列を追加することもでき、又はアダプターに相補的な配列を含有するだけでもよい。あるいは、アダプターにライゲートされた標的分子が親和性ドメインにより固定化され、ひいては捕捉ドメインに結合される場合、固定化された標的分子は、固体又は半固体マトリックスから溶液への溶出を必要とせず、増幅反応に直接加えることができる。次いで、得られたライブラリーを定量化し、配列決定することができる。
本明細書に記載の方法及び組成物は、特に主張されていない限り、本明細書に記載された特定の方法又は試薬に限定することが意図されているのではなく、単に例として示されるにすぎない。説明のための例示的な用途に関して、いくつかの態様を後述する。方法ステップが当業者に周知の標準的な方法を伴う場合、そのような方法ステップは、詳述していない。本願では、特に断りのない限り、単数形の使用には複数形が含まれる。「含まれる(included)」は、限定するものではなく、「含む(comprising)」と同等の意味を有する。用語「約」又は「およそ」は、当業者によって決定される特定の値について許容される誤差の範囲内を意味し、これは、いかにしてその値が測定又は決定されるかに部分的に依存する。特定の値が本願及び特許請求の範囲に記載されている場合、用語「約」は、特に明記しない限り、特定の値について許容される誤差の範囲内を意味する。用語「近傍(の)」は、記載された特徴部に隣接している、又はその付近の位置を指す。例えば、プローブが標的配列の決定された末端にハイブリダイズするその位置に関して「近傍の」が使用される場合、用語「近傍の」は、記載された特徴部から10ヌクレオチド未満を指し得る。用語「遠位の」は、記載された特徴部の近傍の位置ではなく、その位置が近傍である場合よりも遠い部位にある位置を指す。
概して、核酸サンプルから標的核酸配列を濃縮して、標的が濃縮された核酸ライブラリーを作製するための方法が、本明細書で提供される。核酸に関する「標的濃縮」という用語は、サンプル中の特定の核酸種の相対濃度を高めることを指すものとする。
本明細書に記載の濃縮法によって、次の特徴の1つ以上が達成され得る:二重鎖核酸の両方の標的鎖を分析して希少なSNPの信頼性を高めること;リード開始点を特定する能力、GC含有量に関わらず正規化されたプローブプールの生成、反復領域を標的化する能力、標的部位の検出の全体効率の改善、捕捉前の標的の喪失の回避、標的領域外のDNA損傷とは無関係の標的のライブラリー調製、標的領域にわたる複数のプローブの必要性の低減、プローブ対間のより大きな挿入及び欠失(インデル)の捕捉、最適なクラスター形成のための狭いサイズ分布内でのライブラリーの生成、標的配列に含有される非標的塩基のパーセンテージの低下;必要なシーケンスリード長及び必要なシーケンスカバレッジの深度の最小化、濃縮の均一性向上並びに煩雑さ及び時間の低減、及びハイブリダイゼーションに基づく既存の標的濃縮方法と比較したライブラリーの調製。
精製されてはいるが処理されていないか又は修飾されていない核酸は、本明細書において核酸サンプルと称される。核酸サンプルは、その中から標的配列又は標的分子が濃縮される集団中の核酸分子又は核酸の集団に任意選択的に断片化することができる。
本明細書で使用される「核酸サンプル」という用語は、標的及び非標的配列を含有する任意の供給源から得られたDNA若しくはRNA又はDNA及びRNA分子若しくは配列の混合物を指す。核酸サンプルは、例えば人工供給源から、又は化学合成によって、又はウイルス、微生物を含む原核細胞若しくは真核細胞から得ることができる。生体サンプルは、ヒトを含めた又はヒトを除く脊椎動物、無脊椎動物、植物、微生物、ウイルス、マイコプラズマ、真菌又は古細菌(ancient)であり得る。生体液には、血液、唾液、脳脊髄液、胸膜液、乳、リンパ液、痰、精液、骨髄、細針吸引物等、固形物(例えば大便)が含まれる。真核細胞サンプルには、胚組織、生検組織若しくは死体組織、組織、組織培養、生検、臓器又は他の生物学的、農業的若しくは環境的な供給源が含まれる。核酸サンプルを得るためには、細胞はまず、例えば高速度で小さなビーズを使用することによって物理的に、又は例えば洗浄剤及び他の界面活性剤を使用することによって化学的に破壊するか又は分解することができる。アルコール又は他の化学物質を用いて、核酸を沈殿させることができる。
核酸サンプルは、全ゲノム配列、ゲノム配列の一部、染色体配列、葉緑体配列、ミトコンドリア配列、ポリメラーゼ連鎖反応(PCR)産物、全ゲノム増幅産物又は「増幅」の下に列挙される他の増幅プロトコール、cDNA配列、mRNA配列、ノンコーディングRNA(ncRNA)又は全トランスクリプトーム配列、エキソン、長末端反復領域(LTR)、イントロン領域、及び制御配列を含み得る。これらの例は、本発明の態様に適用可能なサンプルの種類を限定するものと解釈されるべきではない。
核酸サンプルは、集団中の核酸分子のサブセットが濃縮のための標的配列を含有し得る核酸の集団を生じ得る。核酸の集団は、例えば、酵素的、機械的又は化学的手段を用いるランダム切断の産物;制限酵素などの酵素を用いて一般に達成される非ランダム又はバイアス切断(biased cleavage)の産物;切断又は断片化が必要とされないような適切なサイズ;又は環境損傷の産物であり得る。核酸の集団は、標的濃縮のための標的単離プローブと組み合わせて用いられる。
ランダム切断は、例えばFragmentase(登録商標)(マサチューセッツ州イプスウィッチのNew England Biolabs)、DNAse I及びBenzonase(登録商標)(ニュージャージー州ギブスタウンのEMD)又は他の種類のヌクレアーゼなど、単一のヌクレアーゼ又はそれらの組み合わせを含む酵素的方法によって達成することができる。Fragmentaseは、時間依存的にdsDNA切断をもたらして、100bpから800bpのDNA断片を生成するエンドヌクレアーゼである。Benzonaseは、セラチア属マルセッセンス(Serratia marcescens)由来の遺伝子操作されたエンドヌクレアーゼであり、DNAとRNAの両方を効率的に切断することができる。他の酵素的方法には、Vvnヌクレアーゼ単独又はセラチアヌクレアーゼ又はDNase I又は当技術分野の他のヌクレアーゼ、例えばShearaseTM(カリフォルニア州アーバインのZymo Research)又はIon ShearTM(ニューヨーク州グランドアイランドLife Technologies)の使用が含まれる。DNAが断片化後に変性するため、ニッキング酵素を用いることができる。
化学的手段には、RNAを分解するためのマグネシウム又は亜鉛イオンの使用が含まれる。例えば、超音波処理、噴霧、物理的剪断及び加熱などの物理的手段を使用することができる。工業用の機械的剪断方法の例は、Covaris(マサチューセッツ州ウォバーン)によって提供されている。
環境的な核酸損傷は、例えば保存中に若しくは経年によって、あるいは化学的に誘発される切断、酵素によって誘発される切断又は温度若しくは時間の適用による切断などの断片化方法の適用によって生じ得る。用語「損傷DNA」は、別段の記載がない限り、任意のインデル、任意のSNP、エピジェネティックな制御に関連しない任意の修飾塩基、標的DNAに対する任意のさらなる修飾を指すことが意図されている。様々なタイプのDNA損傷が、参照により援用される米国特許第7700283号及び米国特許第8158388号に記載されている。DNA損傷の例は、保存された組織又は細胞から単離され、ホルマリン固定パラフィン包埋(FFPE)に起因して品質が低下したDNAである。集団中の核酸は、より大きな核酸の断片であってもそうでなくてもよい。
標的配列は、核酸の集団において生じ得る。用語「標的配列」は、特別な科学的、医学的又は農業的関連性を有する核酸中の対象とする領域を一般に指す。「標的分子」は、プローブなどにハイブリダイズする独立した化学実体である。これらの用語は、互換可能に用いられる場合もあり、これらの用語の意味は、その用語が用いられる文脈によって明らかになるであろう。標的核酸がDNAである場合、gDNAなどの大きなDNAの断片は、標的配列が濃縮されている核酸の集団を部分的に又は実質的に形成することができる。この例では、対象とする標的配列は、核酸サンプルのサブセットのみであり、したがって濃縮が望ましい。
標的配列は、核酸分子全体であっても核酸分子の一部であってもよい。標的配列は、エキソン配列、突然変異の周囲の核酸配列の短いストレッチ、1又は複数の反復配列、cDNA配列、イントロン配列及び制御配列のうちの1以上を含み得る。対象とする特徴の例には、単一のSNP、遺伝子融合、コピー数の変化、及び/又はインデルが含まれる。統計学的に意味がある場合、これらの特徴は、生物学的有意性のある表現型と相関する可能性がある。標的分子は、1つ以上の疾患、対象とする表現型、代謝経路の調節又は同族核酸若しくはその他の核酸に関連する配列を有し得る。標的分子は、DNA配列の連続的な領域又はDNA配列の集合(例えばcDNA配列)を含み得る。標的分子は、mRNA又はncRNAなどのRNA分子であってもよい。RNA標的分子の例には、リボソームRNA(rRNA)、メッセンジャーRNA(mRNA)、サイレンシングRNA(siRNA)、核内低分子RNA(snRNA)、マイクロRNA(miRNA)、短鎖干渉RNA(siRNA)又は長鎖非コードRNA(IncRNA)が含まれる。
核酸の集団中の個々の核酸は、一般に核酸の集団内に含有される標的配列と同じサイズか又はそれよりも大型である。集団中の核酸のサイズ又は標的配列のサイズに関して上限はない。しかしながら、大きな分子を取り扱う効率及び濃縮された標的配列を配列決定するシーケンシングプラットフォームの能力が、サイズを限定することはあり得る。大きな核酸中の標的配列、例えば生検サンプルからのウイルスゲノムは、5000ヌクレオチド(nt)の大きさであっても、10,000nt又はそれ以上の大きさであってもよい。標的配列の長さは、ゲノム又は大型mRNAにおいて生じる500ヌクレオチド未満であり得る。例えば、標的配列が100ntから200ntの範囲の場合、核酸の集団の個々のメンバーは、およそ500ntであり得る。インタクトなgDNA又はRNAは、標的濃縮に適したサイズに断片化することができる。標的配列の長さは、断片サイズを決定するための一つの基準である。例えば、標的配列は、完全な標的領域の捕捉に都合のよい長さである、少なくとも100bpから1000bpまで、例えば200bpから800bp、例えば300bpから700bp、例えば100bpから300bp、又は100bpから400bp、又は100bpから500bpであり得る。ほとんどのエキソンは、200bp未満である。本明細書に記載の方法は、修飾されたヌクレオシドを利用して、次の特徴の少なくとも1つを達成する:他の特徴の中でもとりわけ、ハイブリダイゼーション特異性又は二重鎖の安定性の増強、ヌクレアーゼ耐性の増加、酵素切断のための部位を導入すること、酵素ライゲーションを阻害すること、酵素伸長を阻害すること又はポリメラーゼの増幅を防止すること。
所期の目的に従って選択される修飾されたヌクレオシドの使用の例は、表1に記載されている。本明細書で使用される「ヌクレオシド」という用語は、例えばKornbergら、DNA Replication,2nd Ed.Freeman,San Francisco(1992)に記載されているような、2’−デオキシ及び2’−ヒドロキシル形態を含む天然のヌクレオシドを含む。ヌクレオシドに関して「類似体」又は「修飾されたヌクレオシド」は、例えばScheit,Nucleotide Analogs,John Wiley,New York(1980);Uhlmanら、Chemical Reviews,90:543−584(1990),Crookeら、Exp.Opin.Ther.Patents,6:855−870(1996);Mesmaekerら、Current Opinion in Structual Biology,5:343−355(1995)などに記載されている、修飾された塩基部分及び/又は修飾された糖部分を有する合成ヌクレオシドを含む。改善された二重鎖安定性を有するいくつかの又は多くの類似体を含むプローブ又はアダプターの使用には、オリゴヌクレオチドN3’−
Figure 2017537657
P5’ホスホルアミデート(本明細書において「アミデート」と称される)、ペプチド核酸(本明細書において「PNA」と称される)、オリゴ−2’−O−アルキルリボヌクレオチド、C−5プロピニルピリミジンを含有するポリヌクレオチド、ロックド核酸(「LNA」)、及び同様の化合物が含まれる。そのようなオリゴヌクレオチドは、市販されており、又は文献に記載の方法を用いて合成することができる。修飾されたヌクレオシド(例えばdU又は8−オキソ−G)を選択して、特異的な酵素(ウラシルデグリコシラーゼ又はエンドヌクレアーゼVIIIを有するfpg)による類似体の部位でのオリゴヌクレオチドの切断を可能にするか、又はDNAポリメラーゼ(例えばrNMP)による増幅を防ぐことができる。修飾されたヌクレオシドは、ライゲーションを可能にするか又はブロックするために、プローブ又はアダプターの終端に配置することもできる。例えば、ライゲーションが望まれない場合、プローブ又はアダプターの5’末端又はその両方が非リン酸化されても脱リン酸化されてもよく、また3’末端がジデオキシヌクレオシド、インバーテッドヌクレオシド又は付着部分を有するか又は有しない炭素リンカーでキャッピングされ得る。オリゴヌクレオチドの5’末端をリン酸で修飾することにより、ライゲーションが可能になる。さらに、ジデオキシヌクレオシド、インバーテッドヌクレオシド又は炭素リンカーを含むがこれらに限定されない3’修飾をプローブ又はアダプターに組み込んで、ポリメラーゼによる3’伸長を防ぐことができる。アダプター、プライマー、標的単離プローブ又は1以上のホスホチオエートのような第二のプローブ上の3’及び/又は5’修飾を利用して、エキソヌクレアーゼ消化を防ぐことができる。
本方法の態様における修飾されたヌクレオシドの使用の具体例には、例えば図1、2A、2B、2C又は5Cに示すように、アダプターの3’末端でのライゲーションをブロックするためのジデオキシヌクレオシドの使用が含まれる。ライゲーションをブロックするための3’修飾を、図1及び5Cの標的単離プローブに加えることができる。第二のプローブ上の3’修飾は、図4及び図5A−Cに示すように、ライゲーションをブロックすることができる。図2Cのアダプターの3’末端及び図5Aに示す標的単離プローブの3’末端でのジデオキシ修飾されたヌクレオシドの添加は、ライゲーションを阻害するが、その後の、3’エキソヌクレアーゼ活性を有する逆転写酵素又はDNAポリメラーゼによる3’末端の伸長を可能にする。さらに、親和性ドメイン及び捕捉ドメインは、標的単離配列の3’終端ヌクレオチドに結合している大きな実体である(図3、4、5B及び5Cを参照)。3’末端の親和性結合分子は、プローブライゲーション及び伸長を防ぐための別個のブロッキング実体(blocking entity)として作用し得る。さらに、捕捉ドメインに結合された親和性結合分子は、図3、4、及び5B−Cに示すように、部分標的配列へのアダプターのライゲーションを立体的に阻止することができる。本方法の一態様において、3’プローブは、5’エキソヌクレアーゼ処理の前にアダプターにライゲートさせることができ、したがって5’エキソヌクレアーゼ活性から保護されるため、2プローブ法では、任意選択で5’リン酸化以外に5’修飾を必要としない。その一方、プローブの増幅可能なライブラリーへの変換を防ぐために、単一プローブ法では、プローブの3’末端上のライゲーションを防ぐことが望ましい。
標的配列の境界は、1以上のプローブによって好ましくは決定される。本方法は、標的単離プローブを利用し、一本鎖分子又はフラッププローブであり得る第二のプローブをさらに含み得る。この方法は、小さなランダム配列オリゴヌクレオチド及び/又は除去可能なブロッキングオリゴヌクレオチドをさらに利用することができる。本明細書で使用される「プローブ」という用語は、濃縮のために同定された標的配列の領域に相補的である既知の配列を有する一本鎖ポリヌクレオチドを指す。プローブは、オリゴヌクレオチドであってもよく、「オリゴヌクレオチド」は、核酸合成機により合成され得る長さの合成核酸を指す。あるいは、オリゴヌクレオチドは、天然に存在する、単離及び精製された、任意選択的に断片化された一本鎖核酸であり得、又は部分的に一本鎖かつ部分的に二本鎖であり得る。オリゴヌクレオチドは、DNA、RNA又はその両方であり得る。
プローブのサイズは、標的配列と同じ長さであってもそれより短くてもよい。例えば、プローブは、10,000ntも含むことができるが、より一般的には500nt未満の長さである。プローブの長さの例は、10nt−200nt、25nt−200nt、10nt−150nt、10nt−100nt、10nt−75nt又は10nt−50ntを含む。プローブは、好ましくは、25nt−200ntの長さを有する。1回の濃縮で利用されるプローブのプールは、好ましくはサイズが同じか又は類似している。
本明細書で使用する「標的単離プローブ」という用語は、決定された長さ及び配列の核酸を指し、合成であってもよい。標的単離プローブは、親和性結合分子と結合し、固体又は半固体基質の上又は中で捕捉ドメインを介して固定化され得る。標的単離プローブは、1プローブ法及び2プローブ法において標的領域の少なくとも一方の末端を決定する。図1及び2A−Cに記載の1プローブ法において、標的単離プローブは、標的配列の両端を決定する。標的単離プローブは、DNA、RNA又はその両方であってもよく、1以上の修飾されたヌクレオシドをさらに含有していてもよい(例えば表1を参照)。標的単離プローブは、3’標的配列とアダプターとの間のライゲーションを可能にしながら、二本鎖アダプターのプローブの5’末端へのライゲーションを阻害するように、5’末端にリン酸を欠いていてもよい(例えば図1、2A−C、及び図5Cを参照)。標的単離プローブは、二本鎖アダプターへのライゲーションを容易にするために5’リン酸を含んでもよい(例えば図3、4、5Bを参照)。標的単離プローブの3’末端は、3’プローブ末端とアダプターの5’末端との間のライゲーションをブロックするように修飾することができる。標的単離プローブはまた、Tmを増加させ、プローブの標的配列へのハイブリダイゼーションを安定化させるためにLNAを含有することもできる。
3’標的単離プローブと結合する親和性ドメインは、3’末端に、又は3’末端と5’末端との間であるが好ましくは3’標的単離プローブの5’末端ではない場所に配置され得る。5’標的単離プローブと結合する親和性ドメインは、5’末端に、又は3’末端と5’末端との間であるが好ましくは5’標的単離プローブの3’末端ではない場所に配置され得る。標的単離プローブが標的配列の3’末端及び5’末端の境界を決定する場合、親和性ドメインは、プローブの両末端の間であって、両末端ではない場所に好ましくは配置される。
標的単離プローブが標的配列の3’末端にハイブリダイズする場合、標的配列の5’末端に相補的な配列を特徴とする第二のプローブが、標的配列の5’末端を決定するために使用され得る。あるいは、標的単離プローブが5’末端にハイブリダイズする場合、第二のプローブは、3’末端にハイブリダイズし得る。
一例では、標的単離プローブが標的配列の3’末端にハイブリダイズされた後に、第二のプローブが優先的に加えられ、エキソヌクレアーゼ消化及び標的単離プローブに相補的な配列に隣接する非標的核酸の除去がそれに続く。第二のプローブを標的配列にハイブリダイズさせることの利点は、記載した方式での二の標的特異的プローブの使用によって偽陽性の可能性が低くなることである。あるいは、標的単離プローブ及び第二のプローブは、核酸の集団に同時に加えられ、それにより標的配列の一方又は両方の末端における非標的核酸配列のエキソヌクレアーゼ消化の前に、標的領域の3’末端及び5’末端を決定することができる。
「フラッププローブ」という用語は、標的核酸にハイブリダイズする一本鎖部分と一本鎖領域の3’末端から伸長する非ハイブリダイズ二本鎖領域とを含有する合成核酸を指す。標的分離プローブは、図2Bに例示するような1プローブ法において標的領域の両端を決定する場合、又は図5Bに例示するような2プローブ法において標的領域の5’末端を決定する場合、フラッププローブであり得る。フラッププローブの二重鎖の3’末端は、ヘアピン構造により、又は短い3’−5’相補的オリゴヌクレオチドにより形成され得る。Fen−1などのフラップエンドヌクレアーゼは、フラッププローブの一本鎖領域の3’末端の反対側の部位において標的の5’末端を切断し、かつ5’非標的配列をも除去する。ニックのライゲーションは、3’ヘアピン配列の追加又はフラッププローブの3領域に相補的な鎖のライゲーションをもたらす。二重鎖の3’領域は、標的配列の5’末端にライゲートされる場合、アダプターとして働くことができ、NGSプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位並びに/又はサンプル同定のためのバーコード及び/若しくはUIDなどのアダプターに日常的に組み込まれる配列要素を含み得る。
前述の1又は2のプローブの使用に加えて、核酸の集団中に反復配列が存在するかもしれない場合、除去可能なブロッキングオリゴヌクレオチドを用いることができる。「除去可能なブロッキングオリゴヌクレオチド」という用語は、短い核酸配列、例えばブロッキング核酸が標的又は非標的配列にハイブリダイズしながら消化されることが可能である、その長さ全体にわたる修飾塩基を有するDNA又はRNAseH消化を受けやすいRNAなどを指す。ブロッキングRNAを用いる場合、これは、反復配列に富むDNA(すなわちCOT−1 DNA)からコピーされたcRNA又は反復DNA配列をコード化する合成RNAに由来し得る。まれな状況では、反復領域が、標的核酸配列内に含有される。より一般的には、一つの反復配列又は複数の反復配列が、非標的DNA全体に生じる。除去可能なブロッキングオリゴヌクレオチドを加熱して、変性させ、次いで冷却して、核酸の集団へのハイブリダイゼーションを可能にすることができる。標的単離プローブ及び任意選択的に第二のプローブとのハイブリダイゼーション後、除去可能なブロッキングオリゴヌクレオチドは、RNaseHIにより、又は反応混合物中で5’及び/又は3’エキソヌクレアーゼと任意選択的に合わせることができる他の適切な酵素により切断される。
標的単離プローブに加えて、第二のプローブの代わりに、10nt未満、例えば4nt、5nt、6nt、7nt、8nt又は9ntの長さのランダム配列(NNNNなど)を有するオリゴヌクレオチドは、標的配列の一本鎖領域にハイブリダイズし得る。この短いオリゴヌクレオチドは、3’末端で伸長させて、そこにアダプターをライゲートさせるのに適した平滑末端又は付着端を形成することができる。
核酸集団内の標的配列の、標的単離プローブ中の相補的配列へのハイブリダイゼ―ションの後、二重鎖は、固体又は半固体マトリックスに結合した捕捉ドメインによって固定化することができる。一旦固定化されると、任意の非ハイブリダイズ核酸は洗浄により除去することができ、その結果、固定化された核酸は、標的配列について濃縮される。
非標的DNAを除去するために必要なこの洗浄工程は、工業的に利用可能なハイブリダイゼーション濃縮方法により用いられる洗浄工程よりもストリンジェンシーが低い可能性がある。なぜなら、そのような方法は、非標的分子を排除して標的分子を濃縮するために、ハイブリダイゼーション温度、洗浄温度、及び洗浄緩衝液のストリンジェンシーに依存しているためである。その結果、そのような方法は、厳格なTm範囲のプローブ及び慎重に制御された洗浄条件を必要とする。本明細書に記載の方法は、完全に結合していないライブラリー断片を除去するために洗浄が必要とされるにすぎないため、プローブについてはかなり広いTm範囲及びよりストリンジェントではない洗浄を許容する。本方法の高い特異性は、正確な標的配列がプローブにハイブリダイズされる場合には、ライゲートさせることができる平滑末端を生成するにすぎない次の工程でのエキソヌクレアーゼの使用により達成される。
「相補的」又は「実質的に相補的」とは、例えば二本鎖DNA分子の2本の鎖の間又は核酸の一本鎖領域上のオリゴヌクレオチドプローブ若しくはプライマーとプローブ若しくはプライマー結合部位との間など、ヌクレオチド間又は核酸間に二重鎖を形成するためのハイブリダイゼーション又は塩基対合を可能にする核酸分子の配列を意味する。一般に、相補的ヌクレオチドは、AとT(若しくはAとU)又はCとGである。2の一本鎖RNA又はDNA分子は、一方の鎖のヌクレオチドが最適に整列して比較され、適切な、潜在的な、認識された又は表現型的に意味のあるヌクレオチドの挿入又は欠失を有し、対が他方の鎖のヌクレオチドの少なくとも約50%又は少なくとも80%、又は少なくとも約90%から95%、より好ましくは約98%から100%を有する場合、実質的に相補的であると言われる。あるいは、RNA鎖又はDNA鎖が選択的ハイブリダイゼーション条件下でその補体にハイブリダイズして、安定した二重鎖を形成する場合、実質的相補性が存在する。通常、選択的ハイブリダイゼーションは、少なくとも14ntから25ntのストレッチにわたって少なくとも約65%の相補、好ましくは少なくとも約75%、より好ましくは少なくとも約90%の相補がある場合に起こる(Kanehisa,Nucleic Acids Res., 12:203 (1984)参照)。特異的なハイブリダイゼーションは、プローブと核サンプルとの間で達成することができ、核酸サンプル及びプローブの少なくとも一部が一本鎖であり、ハイブリダイゼーションに利用可能である。プローブの一部は、二本鎖であり得、したがって標的配列とのハイブリダイゼーションに利用可能ではない。一本鎖領域は、熱変性又は当該技術分野で周知の他の手段によって、二重鎖中内で又は二重鎖から形成され得る。
本方法の一態様において、標的単離プローブのハイブリダイゼーションは、好ましくは溶液中で行われる。ハイブリダイゼーションの条件は、ハイブリダイゼーション配列内のミスマッチが許容され得るという意味で比較的緩和され得る。例えば、TiquiaらのBioTechniques,6:664−675(2004)又はJohnらのBioTechniques,44:259−264(2008)などにより記載の標準的な方法を用いることができる。さらに、AT/U塩基対、GC塩基対又は平衡混合物が優勢である断片はすべて、反応条件下で効率的にハイブリダイズすることができる。ハイブリダイゼーションは、3日から30分、例えば1時間から16時間に及んでもよく、この場合温度は有意に変動し、ハイブリダイゼーション混合物は変化し得る。しかし、かかるハイブリダイゼーション期間は、ハイブリダイゼーション条件に応じて、他の実施態様では、より長くても短くてもよい。
標的核酸にハイブリダイズされた標的単離分子のハイブリダイゼーション産物は、固体又は半固体支持体上にコーティングされ得る捕捉ドメインに対する親和性ドメインの結合によって固定化されるか、又は後述の固体若しくは半固体支持対そのものであってもよい。集団における核酸の固定化は、ハイブリダイゼーションの次の工程、エキソヌクレアーゼ消化、アダプターライゲーション、任意選択的に増幅を容易にするだけでなく、非反応物質、残留試薬、及び切断生成物の洗浄による除去を可能にし、それにより交差汚染が回避され、したがって標的配列濃縮の容易性及び有効性が高まる。
本明細書で使用される「捕捉ドメイン」という用語は、親和性ドメインを結合するための固体支持体(下記参照)又は半固体支持体(例えばアガロース又はアクリルアミド)と結合され、ひいては標的単離プローブと結合される化学構造又は部分を指す。親和性ドメインは、ビオチン、抗原、ハプテン、修飾ヌクレオチド又はリガンドなどの小分子を含むことができ、この小分子は結合することも、(例えば直接又は間接的に捕捉ドメインへの、アミン−チオール(aminethiol)架橋、マレイミド架橋、N−ヒドロキシスクシンイミド又はN−ヒドロキシスルホスクシンイミド、ゼノン又はSiteClickによってさらに例示される、光化学的又は化学的)架橋になることも可能である。
固体支持体にDNAを付着させるための様々な方法が知られており、そのいずれも本発明の態様で使用することができる。これらは、支持体表面への共有結合及びDNAのその表面との非共有結合的相互作用(吸着による結合、例えばカチオン性表面)を含む。通常、共有結合性の固定化には、DNA(親和性ドメイン)上の活性官能基と固体表面上の活性化官能基(捕捉ドメイン)との反応が関与する。反応性官能基の例には、アミン、ヒドロキシルアミン、ヒドラジン、ヒドラジド、チオール、ホスフィン、イソチオシアネート、イソシアネート、N−ヒドロキシスクシンイミド(NHS)エステル、カルボジイミド、チオエステル、ハロアセチル誘導体、塩化スルホニル、ニトロ及びジニトロフェニルエステル、トシレート、メシレート、トリフレート、マレイミド、ジスルフィド、カルボキシル基、ヒドロキシル基、カルボニルジイミダゾール、エポキシド、アルデヒド、アシル−アルデヒド、ケトン、アジド、アルキン、アルケン、ニトロン、テトラジン、イソニトリル、テトラゾール、及びボロネートが含まれる。かかる反応の例には、アミドを形成するアミンと活性化カルボキシ基との間、チオエーテル結合を形成するチオールとマレイミドとの間、1,3−双極子付加環化反応を行うアジドとアルキン誘導体との間、アミンとエポキシ基との間、2つのアミド結合を生じる、活性化ビス−ジカルボン酸誘導体の形式の付加二官能性リンカー試薬と反応する別のアミン官能基とアミンとの間の反応又は当該技術分野で既知の他の組み合わせが含まれる。UV媒介架橋などの他の反応が、DNAの固体支持体への共有結合のために使用され得る。
官能基は、固体支持体用に用いられる物質に本質的に存在してもよく、又は適切な物質で支持体を処理又はコーティングすることにより提供されてもよい。官能基は、固体支持体表面を適切な化学剤と反応させることにより導入することもできる。本明細書で使用される活性化は、結合剤の表面へのカップリングを可能にするための、固体支持体表面上の官能基の修飾を意味する。本明細書で使用される固体支持体は、DNAを捕捉して固定化することが望まれる任意の固体(軟質又は硬質)材料を含むことを意味する。
固体支持体は、生物学的、非生物学的、有機、無機又はその組み合わせであってもよく、粒子、鎖、沈殿物、ゲル、シート、管、球、容器、毛細管、パッド、切片、フィルム、プレート、スライドの形態であってもよく、平ら、円板、球形、円等を含む任意の都合のよい形状を有し得る。固体支持体の表面は、表面が官能基を支持する限り、例えばポリマー、プラスチック、樹脂、多糖類、シリカ又はシリカ系材料、カーボン、金属、無機ガラス、膜等の様々な材料から構成され得る。都合のよい固体支持体の例は、例えばガラススライド、マイクロタイタープレート、及び適切なセンサー要素等のガラス表面、特に(例えばビーズの形態の)官能化ポリマー、化学修飾された酸化物表面、例えば二酸化ケイ素、五酸化タンタル若しくは二酸化チタン、又は化学修飾された金属表面、例えば金若しくは銀などの貴金属表面、銅若しくはアルミニウム表面、磁気表面、例えばFe、Mn、Ni、Co、及びそれらの酸化物、量子ドット、例えばIII−V(GaN、GaP、GaAs、InP若しくはInAs)又はII−VI(ZnO、ZnS、CdS、CdSe若しくはCdTe)半導体、又はLnドープ処理したフッ化物ナノ結晶、希土類によりドープ処理した酸化物ナノマテリアルである。
「固体支持体」は、硬質又は半硬質表面を有する物質又は物質の群を指す。固体支持体は、いくつかの実施態様では、例えばウェル、隆起領域、ピン、エッチングされた溝等を用いて、異なる化合物の合成領域を物理的に分離することが望ましいが、実質的に平らな固体支持体の少なくとも1つの表面であってもよい。あるいは、固体支持体は、ビーズ、樹脂、ゲル、ミクロスフェア又は他の幾何学的な構造であってもよい。ビーズの例には、ストレプトアビジンビーズ、アガロースビーズ、磁気ビーズ、Dynabeads(登録商標)(ニューヨーク州グランドアイランドのLife Technologies)、MACS(登録商標)ミクロビーズ(カリフォルニア州オーバーンのMiltenyi Biotech)、抗体コンジュゲートビーズ(例えば抗免疫グロブリンミクロビーズ)、プロテインAコンジュゲートビーズ、プロテインGコンジュゲートビーズ、プロテインA/Gコンジュゲートビーズ、プロテインLコンジュゲートビーズ、オリゴdTコンジュゲートビーズ、シリカビーズ、シリカ様ビーズ、抗ビオチンミクロビーズ、抗蛍光色素ミクロビーズ、及びBcMagTM(カリフォルニア州サンディエゴのBioclone)カルボキシ末端磁気ビーズが含まれる。標識された核酸を支持体に付着させることは、複数のポリヌクレオチドにビオチンを付着させることと、1つ以上の磁気ビーズをストレプトアビジンでコーティングすることとを含み得る。
固体支持体表面は、ポリマーの層を備えていてもよい。そのような場合、ポリマーは、活性化されるべき官能基を有しているであろう。ポリマーは、ポリエチレングリコール、ポリエチレンイミド、多糖類、ポリペプチド又はポリヌクレオチド等の任意の適切なクラスの化合物から選択され得る。支持体表面へのポリマーの付着は、当業者には容易に明らかな種々の方法によって行うことができる。例えば、トリクロロシリル基又はトリスアルコキシ基を有するポリマーは、基質表面のヒドロキシル基と反応させて、シロキサン結合を形成することができる。金又は銀表面への付着は、ポリマー上のチオール基を介して起こり得る。あるいは、ポリマーは、アルカンチオールの自己組織化単層などの中間体種によって付着させることができる。したがって、選択されるポリマーの種類及びポリマーを表面に付着するために選択される方法は、基質表面に付着させるのに適した反応性を有するポリマーに、特にDNAへの非特異的な吸着に関するポリマーの特性に依存するであろう。官能基は、ポリマー上に存在してもよく、又は1以上の官能基の付加によりポリマーに付加してもよい。任意選択的に、スペーサーアームを用いて、結合DNAに柔軟性を与え、固体支持体による立体障害が最小限になるようにその環境と相互作用させることを可能にすることができる。
核酸を固体支持体の表面に固定化するために、表面上の活性化官能基は、所定の領域のみに、又は表面全体に存在してもよく、DNA分子中に存在する官能基と選択的に反応する。時間、温度、pH、溶媒、添加剤等を含めた必要な反応条件は、用いられる特定の種に特に依存するであろうし、それぞれの特定の状況に適した条件は、当業者に容易に明らかであろう。オリゴヌクレオチドを合成し、所望の官能基を取り込むことができる。個々のヌクレオチドは、所望の反応性をもたらすために、任意のタイプの官能基で化学的に又は酵素的に修飾することができる。この化学的又は酵素的な官能化は、DNA分子に伸長させることができる。
生物物質による表面の官能化は、DNAを固体支持体に付着させるために用いることもできる。例えばマイクロプレートなどの固体支持体は、例えば抗体(若しくは抗体断片)などの結合剤又は別の親和性結合剤(例えばストレプトアビジン)を用いて修飾することができる。その場合、DNA分子は、対応する親和性リガンド(例えばビオチン)及び別の親和性結合剤(例えば、生体分子の配列の一部を認識する抗体)で修飾されている。本明細書で使用される結合剤は、例えば、タンパク質又その断片などのポリペプチド;相補鎖で塩基対合することができる、例えばオリゴヌクレオチド、ポリヌクレオチド又はその誘導体などの核酸を含む、特異的な結合対のメンバーである任意の作用剤を意味する。結合剤の例には、細胞膜に対するアゴニスト及びアンタゴニスト、毒素及び毒液、ウイルスエピトープ、抗原決定基、ホルモン及びホルモン受容体、ステロイド、ペプチド、酵素、基質、補因子、薬物、レクチン、糖、オリゴヌクレオチド、オリゴ糖、タンパク質、糖タンパク質、細胞、細胞膜、オルガネラ、細胞受容体、ビタミン、ウイルスエピトープ、並びに免疫グロブリン、例えばモノクローナル抗体及びポリクローナル抗体が含まれる。結合対の例には、ビオチン−ストレプトアビジン/アビジン、ハプテン/抗原−抗体、炭水化物−レクチン又は当業者に既知のその他のものが含まれる。
DNAの固体支持体への共有結合を可能にする特異的結合対のさらなる例は、例えばSNAP−tag(登録商標)(マサチューセッツ州イプスウィッチのNew England Biolabs)/AGT及びベンジルグアニン誘導体(米国特許第7939284号;同第8367361号;同第7799524号;同第7888090号、及び同第8163479号)又はピリミジン誘導体(米国特許第8178314号)、CLIP−tagTM(マサチューセッツ州イプスウィッチのNew England Biolabs)/ACT及びベンジルシトシン誘導体(米国特許第8227602号)、HaloTag(登録商標)(ウィスコンシン州マディソンのPromega)及びクロロアルカン誘導体(Los, et al. Methods Mol Biol., 356:195-208 (2007))、セリン−ベータ−ラクタマーゼ及びベータ−ラクタム誘導体(国際特許出願公開WO2004/072232号)である。そのような例において、DNAをベンジルグアニン、ピリミジン、ベンジルシトシン、クロロアルカン又はベータ−ラクタム誘導体で官能化し、その後それぞれSNAP−タグ/AGT、CLIP−tag/ACT、HaloTag又はセリン−ベータ−ラクタマーゼで修飾した固体支持体中で捕捉することができる。あるいは、DNAをSNAP−tag/AGT、CLIP−tag/ACT、HaloTag又はセリン−ベータ−ラクタマーゼに特異的に又は非特異的に付着させ、その後それぞれベンジルグアニン、ピリミジン、ベンジルシトシン、クロロアルカン又はベータ−ラクタム誘導体で官能化した固体支持体中で捕捉することができる。DNAの固体支持体への共有結合を可能にする特異的結合対のさらなる例は、アシル担体タンパク質及びその修飾体(結合剤タンパク質)であり、これらは、シンターゼタンパク質によって補酵素A(結合剤基質)由来のホスホパンテテイン(phosphopantheteine)サブユニットに結合する(米国特許第7666612号)。DNAの固体支持体への好都合な結合を可能にするタンパク質又はそのフラグメントの例は、例えばキチン結合ドメイン(CBD)、マルトース結合タンパク質(MBP)、糖タンパク質、トランスグルタミナーゼ、ジヒドロ葉酸還元酵素、グルタチオン−S−トランスフェラーゼal(GST)、FLAGタグ、S−タグ、His−タグ、及び当業者に既知のその他のものである。通常、オリゴヌクレオチド、DNA又はその断片は、特異的結合対の一部であり、かつ固体支持体に共有結合的に又は非共有結合的に結合されたパートナーに特異的に結合することができる分子で修飾される。
標的DNAは上記のように固定化するが、3’エキソヌクレアーゼI及びエキソヌクレアーゼTなどの1以上の適切な3’一本鎖DNAエキソヌクレアーゼを添加して非標的DNAを除去し、標的DNAの特定のリード開始点で平滑末端を形成することができる。「3’一本鎖特異的エキソヌクレアーゼ」という用語は、一本鎖DNA切断活性を有する3’エキソヌクレアーゼを指す。いくつかの3’エキソヌクレアーゼはまた、少量の二本鎖DNA切断活性も有し、本実施態様においても使用され得る。「リード開始点」とは、核酸分子のシーケンシングが始まる位置を指す。シーケンシングリードの開始点は、1以上のヌクレアーゼを用いて一本鎖核酸を消化して、プローブと平滑末端を形成し、次いで、シーケンシングプライマー部位が標的核酸配列と直接境を接するようにアダプターをライゲーションすることにより生成することができる。その結果、選択されたプローブ配列がリード開始点を決定する。好ましくは、ヌクレアーゼは、平滑な二本鎖DNA(dsDNA)末端を形成することができる一本鎖の3’エキソヌクレアーゼであり、エンドヌクレアーゼ活性を有しない。一本鎖結合タンパク質(SSBタンパク質)などのアクセサリータンパク質を添加することができる。クレノウエキソ−及びdATPを添加し、3’末端にdAテイルを設けることができる。dAテーリング工程は、Tオーバーハング3’アダプターと共に用いる場合は任意選択であり、平滑末端アダプターには必要ではない。dAテーリングの場合、用いられる酵素、その濃度、インキュベーション時間及び温度は重要ではない。しかしながら、酵素は、Tオーバーハングアダプターの場合、dsDNAの3’末端にdAなどの単一の非鋳型ヌクレオチドを付加するべきである。
5’エキソヌクレアーゼを用いて、5’非標的一本鎖核酸を除去することができる。5’エキソヌクレアーゼがヌクレアーゼを不活性化するために熱変性温度を必要とする場合、再ハイブリダイゼーション工程を加えてプローブを鋳型に再ハイブリダイズさせることができる。5’エキソヌクレアーゼが5’陥凹末端又は5’オーバーハングを残す場合、ポリメラーゼを用いて3’オーバーハングを消化するか、又はプローブの3’陥凹末端をフィルインし、平滑末端又は1つのヌクレオチドにより伸長される末端を形成することができる。3’エキソヌクレアーゼを有するポリメラーゼを平滑末端を形成するために好ましくは使用することができ、平滑末端は、平滑末端5’アダプターにライゲートすることができる。あるいは、クレノウ(3’→5’エキソ−)又はBstなどの3’エキソ−ポリメラーゼを置換して、Tオーバーハングを有する5’アダプターにライゲートすることができる末端を形成することができる。また、dATP、dCTP、dGTP、及びdTTPの代わりに、dATP、dCTP、dGTP及びdUTPのdNTP混合物を用いてもよい。標的がRNAである場合、dNTPSと共に逆転写酵素を使用することができ、又はリボNTPを用いるRNAポリメラーゼを使用することができる。フィルインポリメラーゼ、ポリメラーゼ濃度、プローブ濃度、インキュベーション時間及び温度は、当該技術分野で教示されている通り変化し得る(例えばTabor, et al. DNA dependent DNA polymerases in Ausebel, et al. Current protocols in Molecular Biology, 3.5.10-3.5.12 (1989), New York, John Wiley and Sons; Sambrook et al. (1989) Molecular Cloning, A laboratory Manual (2nd ed), p 5.44-5.47, CSH pressを参照)。
標的濃縮後又はその間に、アダプター配列を標的配列の一方又は両方の末端にライゲートすることが望ましい場合がある。「ライゲーション」とは、2つ以上の核酸、例えばオリゴヌクレオチド及び/又はポリヌクレオチドの共有結合又は連結による終端間の結合を指す。結合又は連結の特質は、広範に変わることがあり、ライゲーションは、酵素的に又は化学的に行われ得る。本明細書で使用される場合、ライゲーションは、通常酵素的に行われ、1つのオリゴヌクレオチドの終端ヌクレオチドの5’炭素と別のオリゴヌクレオチドの3’炭素との間にホスホジエステル連結を形成する。様々な鋳型主導型のライゲーション反応が、次の参照文献に記載されており、これらは参照により援用される:Whiteleyら、米国特許第4883750号;Letsingerら、米国特許第5476930号;Fungら、米国特許第5593826号;Kool、米国特許第5426180号;Landegrenら、米国特許第5871921号;Xu and Kool,Nucleic Acids Research,27:875−881(1999);Higginstら、Methods in Enzymology,68:50−71(1979);Englerら、The Enzymes,15:3−29(1982);及びNamsaraev、米国特許出願公開第2004/0110213号。
標的配列の末端にライゲートさせることができる様々な種類のアダプターが下記に議論される。用語「アダプター」とは、少なくとも部分的に二本鎖であり、隣接する標的配列の増幅のためのプライマー部位として適切な配列を含有する核酸、シーケンシングプラットフォームにより特定され、標的配列を含むライゲーション部位に隣接する配列に位置するシーケンシングプライマー、及び核酸供給源の同一性を追跡するための一意識別子及び/又はサンプルの同一性を追跡するためのバーコードを指す。シーケンシング反応におけるアダプター及びその使用の例は、米国特許第5888737号、米国特許第6013445号、米国特許第6060245号、米国特許第6175002号、米国特許第7741463号、米国特許第7803550号、米国特許第8029993号、米国特許第8288097号、米国特許出願公開第2004/0209299号、米国特許出願公開第2007/0172839号、及び米国特許出願公開第2012/0238738号などの刊行物に見出すことができる。
次いで、切断可能な一本鎖ヘアピンアダプター、二本鎖Yアダプター、完全二本鎖アダプター又は市販のDNAシーケンシングプラットフォーム上での下流のシーケンシングに適した当該技術分野で既知のその他任意の形態のアダプターを標的DNAの3’及び/又は5’末端にライゲートすることができる。ヘアピンアダプター内の切断可能部位は、dU、他の修飾ヌクレオチド、1つ以上のRNAヌクレオチド又は化学的に切断可能な部位であり得る。これらは、米国特許出願公開第2012/0238738号に記載の修飾塩基のいずれかを含み得る切断可能部位の例としてのみ役立つ。ヘアピンアダプターを使用する利点は、これらのアダプターが当該技術分野のその他のアダプターよりも短く、ライゲーションのために効果的に使用できることである。さらに、これらのアダプターは、残留一本鎖エキソヌクレアーゼ活性に対してより耐性がある。その上、標的分子及び標的単離プローブのヘアピンアダプターへのライゲーションは、標的分子を親和性ドメインに共有結合する。ヘアピンアダプターを切断し、任意の二本鎖領域を変性させた後、切断されたヘアピン配列上のプライマー部位を含有する一本鎖領域を用いて、標的配列を増幅することができる。
アダプターは、Tオーバーハングを含んでもよいが、平滑末端していてもよい。アダプターは、NGSプラットフォーム表面での増幅に必要な追加の配列と共に短いアダプター配列を含有することができ、又はNGSプラットフォームによって必要とされる完全な3’又は5’配列を供給することもできる。
一方又は両方の末端のアダプターは、miSEQ HiSEQ(登録商標)(カリフォルニア州サンディエゴのIllumina)、Ion Torrent(登録商標)(カリフォルニア州カールズバッドのApplied Biosystems)、ナノポアベースのシーケンサー(英国オックスフォードのOxford Nanopore)又はPacBio RS II(カリフォルニア州メンロパークのPacific Biosciences)等のシーケンシングプラットフォームでのシーケンシングに適した一意識別子(UID)又は分子バーコードを任意選択的に含有する。本明細書で使用される「一意識別子」(UID)という用語は、同一性(例えばタグDNA配列)がサンプル中のポリヌクレオチドを識別するために使用され得るポリヌクレオチドと結合される、タグ又はタグの組み合わせを指す。いくつかの実施態様において、ポリヌクレオチド上のUIDは、ポリヌクレオチドが由来する供給源を同定するために使用される。供給源識別子は、バーコードとも称される。例えば、核酸サンプルは、異なる供給源に由来するポリヌクレオチドのプール(例えば異なる個体、異なる組織若しくは細胞に由来するポリヌクレオチド、又は異なる時点で単離されるポリヌクレオチド)であり得、各異なる供給源由来のポリヌクレオチドは一意なUIDでタグ付けされる。このように、UIDは、ポリヌクレオチドとその供給源との間の相関をもたらす。いくつかの実施態様では、UIDは、サンプル中の各個々のポリヌクレオチドに一意にタグを付けるために使用される。サンプル中の一意なUIDの数の同定は、サンプル中に個々のポリヌクレオチドがいくつ存在するのか、又は操作されたポリヌクレオチドサンプルがいくつの元のポリヌクレオチドから由来したかという読み出しを提供することができる。本明細書で利用される識別子の例には、Brennerら、Proc.Natl.Acad.Sci.,97:1665−1670(2000);Churchら、Science,240:184−188(1988);Shoemakerら、Nature Genetics,14:450−456(1996);及びHardenbolら、Nature Biotechnology,21:673−678(2003)に示されている例が含まれる。
アダプター濃度、リガーゼ濃度、リガーゼ反応量、反応緩衝液、反応体積、インキュベーション時間及び温度は変えることができる。さらに、ライゲーション後の洗浄工程によって、非ライゲートアダプター及びアダプターダイマーの除去が可能になる。
本明細書で使用される「プライマー」という用語は、ポリヌクレオチド鋳型とともに二重鎖を形成すると核酸合成の開始点として作用し、伸長二重鎖が形成されるように鋳型に沿ってその3’末端から伸長させることができる、天然又は合成のオリゴヌクレオチドを指す。伸長プロセス中に追加されるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列によって決定される。通常、プライマーは、DNAポリメラーゼによって伸長される。プライマーは一般に、プライマー伸長産物の合成におけるその使用に対応する長さであり、通常、例えば10ntから75nt、15ntから60nt、15ntから40nt、18ntから30nt、20ntから40nt、21ntから50nt、22ntから45nt、25ntから40nt等のように8ntから100ntの間の範囲の長さ、より典型的には18ntから40nt、20ntから35nt、21ntから30ntの間の範囲の長さのサイズから選択される類似の又は同一の長さ及び所定の範囲の任意の長さのものである。典型的なプライマーは、15ntから45nt、18ntから40nt、20ntから30nt、21ntから25nt等のように10ntから50ntの間の長さ及び所定の範囲の任意の長さであり得る。
プライマーは通常、増幅における最大効率のために一本鎖であるが、代わりに二本鎖でもよい。二本鎖の場合、プライマーは通常、まずその鎖を分離するように処理されてから、伸長産物を調製するために使用される。この変性工程は、通常は熱に影響されるが、代わりにアルカリを用いて行い、続いて中和することができる。したがって、「プライマー」は、ポリメラーゼによる合成を開始するためのプライマー/鋳型複合体を生成するために、鋳型に相補的な少なくとも3’配列と、鋳型との水素結合又はハイブリダイゼーションによる複合体とを有し、DNA合成の過程で鋳型に相補的なその3’末端に連結された、共有結合した塩基を付加することにより伸長される。
本方法の実施態様におけるプライマーの使用は、従来のPCR濃縮法と比較して、標的配列のより均一な増幅をもたらす。PCR濃縮において、各プライマー対は標的配列に特異的であるが、本明細書では核酸の集団中のすべての標的配列に対して、単一のプライマー対が用いられる。
一本鎖センス鎖とアンチセンス鎖の双方とも、標的単離配列に結合された捕捉ドメインによって好ましくは固定化され、ひいては標的領域の3’末端にハイブリダイズされて、アダプターへのライゲーションに適した二本鎖のDNA領域を形成する。この時点で、標的配列の3’末端以外の任意の3’一本鎖DNA領域は、エキソヌクレアーゼ切断によって好ましくは除去されている。標的鋳型の5’末端で5’プローブをハイブリダイズし、標的領域以外の外来DNAを除去し、5’アダプターを付加した後、核酸標的鋳型を増幅し、配列決定することができる。
3’アダプター及び5’アダプターが標的配列に共有結合している場合、部分的に二本鎖の分子の変性は、いずれか一方の末端でアダプター配列を有する一本鎖配列をもたらす。ここで、これらのアダプター配列は、PCR又は2つのプライミング配列に依拠する当該技術分野で知られている他の増幅プロトコールによるDNA増幅のためのプライマー部位として働く。濃縮された標的DNAは、例えば熱、NaOH又はホルムアミドを用いて捕捉ドメインから溶出することができるが、又はこれらが捕捉ドメインに用いられる場合には、ビーズに付着したままでもよい。増幅後、増幅したライブラリーは、ビーズ(例えばAmpure(登録商標)ビーズ、Beckman Coulter(カリフォルニア州ブレア)参照)を用いるか又はカラム精製(例えばカリフォルニア州バレンシアのQiagen製の精製製品)又は当該技術分野で既知のその他のDNA精製法により浄化することができる。次いで、得られたライブラリーを定量化し、配列決定することができる。
標的濃縮後に本明細書において任意選択的に用いられる増幅方法には、PCR、逆転写酵素PCR(RT−PCR)、ローリングサークル増幅、リアルタイムPCR、リガーゼ連鎖反応(LCR)、転写増幅、Qベータレプリカーゼ介在RNA増幅又は等温増幅法、例えば転写介在増幅、RNAのシグナル介在増幅技術、鎖置換増幅、ローリングサークル増幅、ループ介在等温増幅(LAMP)又はヘリカーゼ依存性増幅(例えばGill et al. Nucleosides Nucleotides Nucleic Acids, 27:224-43 (2008);米国特許第5242794号、米国特許第5494810号、米国特許第4988617号及び米国特許第6582938号:米国特許第4683195号;米国特許第4965188号;米国特許第4683202号;米国特許第4800159号(PCR);米国特許第5210015号(TaqManTM(カリフォルニア州のLife Technologies)を用いたリアルタイムPCR);米国特許第6174670号;特開平4−262799号(ローリングサークル増幅);Leone, et al. Nucleic Acids Research, 26: 2150-2155 (1998)を参照のこと)のいずれも含まれ得る。
NGSは、従来のシーケンシング法(例えば標準的なサンガー又はマクサム−ギルバートのシークエンシング法)を用いて、前例のないスピードでポリヌクレオチドを配列決定する能力を有するシークエンシング技術を指す。この前例のないスピードは、数千から数百万のシークエンシング反応を並行して実施し、読み取ることにより達成される。NGSシーケンシングプラットフォームには、限定されないが、次のものが含まれる:Massively Parallel Signature Sequencing(カリフォルニア州ヘイワードのLynx Therapeutics);454ピロシーケンシング(コネチカット州ブランフォードの454 Life Sciences/Roche Diagnostics);固相の可逆的色素ターミネーターシーケンシング(カリフォルニア州サンディエゴのSolexa/Illumina);SOLiD(登録商標)技術(ニューヨーク州グランドアイルのApplied Biosystems/Life Technologies);イオン半導体シーケンシング(Ion TorrentTM、ニューヨーク州グランドアイルのLife Technologies);及びDNAナノボールシーケンシング(カリフォルニア州マウンテンビューのComplete Genomics)。いくつかのNGSプラットフォームの説明については、次の文献において見出すことができる:Shendureら、Nature,26:1135−1145(2008);Mardis,Trends in Genetics,24:133−141(2007);Suら、Expert Rev Mol Diagn,11(3):333−43(2011);及びZhangら、J Genet Genomics,38(3):95−109(2011)。
上記の本発明の方法の実施態様は、次のように要約することができる:標的が濃縮された核酸ライブラリーは、例えば真核生物由来のgDNA又は核酸の集団へのRNA転写物などの核酸サンプルを所定のサイズ範囲に断片化すること、マトリックスを結合するための親和性標識を含有する標的単離プローブを加えること(ここで標的単離プローブは核酸断片中の標的配列にわたる)、並びに1以上の3’及び5’特異的ヌクレアーゼ又は1以上の3’エキソヌクレアーゼ、任意選択的に1以上の5’エキソヌクレアーゼ(例えばExoVII)を、同時に(例えば組み合わせて)又は異なる工程で用いて非標的核酸を除去することによって、生成することができる。3’アダプター、任意選択的に5’アダプターは、同時に(例えば組み合わせて)又は本方法における異なる工程で標的DNAの末端に付加することができる。次に、濃縮されたDNAの増幅お及びシーケンシングが続いてもよい。アダプター配列又はプローブ配列には、バーコード及び一意識別子配列を任意選択的に含めることができる。
別の態様において、少なくとも1のプローブが親和性結合ドメインを含む標的単離プローブである3’及び5’標的プローブは、同時に(例えば組み合わせて)又は異なる工程においてハイブリダイズされ、この場合標的の長さは両方のプローブのハイブリダイゼーションにより決定され、一本鎖の非標的配列はエキソヌクレアーゼにより除去される。あるいは、特異的な標的単離プローブ及び3’エキソヌクレアーゼを用いて標的の3’末端を決定し、続いて、標的配列の未決定の5’末端を形成するために、5’ヌクレアーゼの非存在下で非特異的プローブを伸長させることができる。
本明細書に記載の方法についての実施態様は、開始点を特定することを含んでおり、したがって標的配列が決定されて、オフターゲット配列が存在しないという理由から、以前のハイブリダイゼーションに基づく方法よりも有利であり、他のハイブリダイゼーション法において標的配列は、非標的配列との未決定の境界を有する集団中の核酸内に残存する。さらに、両方の鎖を捕捉し、従来のハイブリダイゼーション法よりも多くのAT又はGCリッチ配列を標的内で許容することができる。
先行技術におけるPCRに基づく方法に対する本発明の実施態様の利点は、人工の配列が標的の末端に導入されないことである。さらに、本発明の実施態様は、スケーラブルであり、増幅バイアスがより少なく、標的分子に一意なUIDを付加することが可能である。UIDは、同じ標的分子のPCR複製物の同定を可能にする。その結果、PCR複製物を分析中に濾過することができ、突然変異又は転写物の正確な定量が可能になる。
「キット」という用語は、本発明の方法を実施するための物質又は試薬を送達するための任意の送達システムを指す。反応アッセイに関連して、かかる送達システムは、ある位場所から別の場所への反応試薬(例えば適切な容器内のプローブ、酵素、アダプター、プライマー等)及び/又は支持材(例えば緩衝液、アッセイを実施するための指示書など)の保存、移送又は送達を可能にするシステムを含む。例えば、キットは、該当する反応試薬及び/又は支持材を収容する1つ以上の密閉容器(例えば箱)を含む。かかる内容物は、一緒に又は別々に、対象とするレシピエントに送達され得る。例えば、第一の容器はアッセイにおける使用のための酵素を収容し、第二の容器はプローブを収容してもよい。キットは、非標的及び標的配列を含有する核酸サンプルから標的鋳型を選択し、濃縮するために考案されてもよい。キットは、キットの考案者若しくは製造者によって又は研究者によって定義された第一の親和性結合ドメインを含む3’プローブ(標的単離プローブ);5’プローブ;アダプター;プライマー:ヌクレアーゼ;リガーゼ;ポリメラーゼ;緩衝液;ヌクレオチド;除去可能なブロッキングオリゴヌクレオチド及び/又はマトリックスと結合される捕捉ドメインを含み得る。キットは、DNAライブラリーを作成するための1以上の緩衝溶液及び標準液をさらに含み得る。
図10に記載の方法についての実施態様では、ハイブリダイゼーション法で起こるような大きな断片を配列決定する必要性を排除しながら、二重濾過の必要性も回避する。ハイブリダイゼーション法では、ランダム末端を有する大きな断片が内部で増幅される。バイオインフォマティクススキャンは、同じ末端を有すると同定されたPCR複製を検出し、除去することができる。
対照的に、短い断片にアダプター末端を付加するPCR法は、すべてのリードが同じ開始及び終了配列を有するように決定された末端を有し、したがってコンピューターによってフィルターにかけることができる。
図10に示す実施態様は、5’末端をPCR複製物についてスキャンすることができるように、1つの決定された末端(3’末端)及び1つのランダム末端(5’末端)を有する。
本明細書で引用されるすべての文書は、各個々の文書が参照により援用されることが具体的かつ個別に示された場合と同程度まで、あらゆる目的のために、それらの全体が出典明示により援用される。
表1:本方法の態様における修飾ヌクレオチドの使用の例は、本願に記載されている。図は、修飾がどこでどのように用いられ得るかの例を提供するが、特定の目的のために限定することを意図するものではない。表に記載されている使用を可能にするための修飾の使用は、当該技術分野でよく知られている。
Figure 2017537657
Figure 2017537657
Figure 2017537657
Figure 2017537657
以下の実施例は、特定の温度、インキュベーション時間、及び緩衝液を記載している。ただし、これらの条件は、限定することを意図するものではない。当業者であれば、様々な配列を濃縮するための出発物質として本明細書で例示されているヒトgDNAは限定を意図するものではないこと、また、同程度のハイブリダイゼーション又は増幅を行うためにpH、緩衝液及び塩の条件並びにインキュベーション時間を変化させ得る範囲が以下の指定された条件に限定されないことを理解するはずである。同様に、親和性ドメインとしてのビオチンの記載は、限定することを意図するものではない。特異的切断可能部位を有する特異的アダプターもまた、例として以下に記載されているが、限定することを意図するものではない。工程の順序を例として説明する。工程の順序が変更可能であることは理解されよう。さらに、いくつかの工程は、便宜的に追加又は削除することができる。
実施例1: 1つの標的単離プローブによるシーケンシングのための、標的配列を濃縮するための方法。
300bp断片のための製造業者のプロトコールに従い、Covarisの装置を用いてヒトgDNA(1μg)を剪断した(図1(1))。100塩基長であり、ビオチンと結合された標的単離プローブ20nmolを含有するハイブリダイゼーション反応緩衝液25μlに、剪断したDNAを加えた。この場合、100塩基配列は100nt標的配列に相補的であった(図1(2))。JohnらのBioTechniques,44,259−264(2008)に従って、ハイブリダイゼーション反応を実施した。ハイブリダイゼーション後、標的単離プローブ/標的DNA二重鎖を親水性のストレプトアビジンビーズ(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに30分間結合させ(図1(3))、標準BW Buffer(5mM トリス−HCl(pH7.5)、0.5mM EDTA、1M NaCl)で洗浄した。
本明細書を通して使用される場合、「反応混合物」とは、反応を実施するのに必要な反応物すべてを含有する溶液を意味し、これには、限定されないが、反応中の選択したレベルでpHを維持するための緩衝剤、酵素、基質、塩、補因子、捕捉剤等が含まれ得る。
ビーズを、1×NEBuffer4、2.5UのエキソヌクレアーゼT(マサチューセッツ州イプスウィッチのNew England Biolabs)及び2.5UのエキソヌクレアーゼIを含有する反応混合物(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに再懸濁させ、37℃で10分間インキュベートした。磁気ビーズを洗浄し、30ユニットのRecJfを含有する1XNEBuffer2(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに再懸濁させ、20℃で10分間インキュベートした(図1(4))。
磁気ビーズを洗浄し、dA−Tailing反応混合物(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに再懸濁させ、37℃で30分間インキュベートした。次いで、ビーズを洗浄し、45μlの1XQuick Ligation緩衝液(マサチューセッツ州イプスウィッチのNew England Biolabs)及びIllumina用のNEBNext(登録商標)アダプター(マサチューセッツ州イプスウィッチのNew England Biolabs)に再懸濁させた。Quick T4 DNAリガーゼ(マサチューセッツ州イプスウィッチのNew England Biolabs)5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(図1(5))。
次いで、ビーズを洗浄し、5μlのUSERTM酵素(マサチューセッツ州イプスウィッチのNew England Biolabs)及びIllumina用のNEBNext(登録商標)プライマー(マサチューセッツ州イプスウィッチのNew England Biolabs)を含有する1XHotStart OneTaq(登録商標)PCR Master Mix(マサチューセッツ州イプスウィッチのNew England Biolabs)に再懸濁させた。PCR混合物を37℃で15分間インキュベートした。次のPCRサイクル条件が用いられる:95℃で2分間、続いて95℃で30秒間、60℃で30秒間及び72℃で1分間を25サイクル(図1(6))。25サイクルの終わりに、PCR混合物を72℃で5分間インキュベートした。次いで、標的配列から得られたPCR産物を、従来の方法を用いて配列決定した。
実施例2: 1つの標的単離プローブによるシーケンシングのための、標的配列を濃縮するための方法の変形例。
実施例1及び図1中のプロトコールを、ストレプトアビジンビーズへの結合によって進め、図2A(7)−(11)に記載の工程が(1)−(3)の後に続いた。
1XNEBuffer4、2.5UのエキソヌクレアーゼT及び2.5UのエキソヌクレアーゼIを含有する反応混合物50μlにビーズを再懸濁させ、37℃で10分間インキュベートした(7)。
磁気ビーズを洗浄し、dA−Tailing反応混合物50μlに再懸濁させ、37℃で30分間インキュベートした。次いで、ビーズを洗浄し、45μlの1XQuick Ligation及びIllumina用のNEBNextアダプターに再懸濁させた。Quick T4 DNAリガーゼ5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(図2A(8))。
磁気ビーズを洗浄し、20ユニットのエキソヌクレアーゼVIIを含有する1XエキソヌクレアーゼVII緩衝液(ウィスコンシン州マディソンのEpicentre)50μlに再懸濁させ、30°Cで10分間インキュベートした(9)。製造業者のプロトコールに従って、酵素を熱失活させた。ビーズを洗浄し、15UのT4 DNAポリメラーゼ及び100μM dNTPを含有する1XNEBuffer2(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに再懸濁させた。反応物を20℃で30分間インキュベートした。
次いで、ビーズを洗浄し、45μlの1XQuick Ligation緩衝液及びIllumina用のNEBNextアダプターに再懸濁させた。Quick T4 DNAリガーゼ5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(10)。
アダプターのUSER切断及びPCR増幅を、実施例1に記載の通りに実施した。
実施例3: 1つのFlapプローブによるシーケンシングのための、標的配列を濃縮するための方法。
実施例1に記載のプロトコールを、フラップ標的単離プローブを用いる3’アダプターのライゲーションによって進めた(図2B参照)。フラップ標的単離プローブは、標的配列の5’末端に特異的な一本鎖の3’領域、内部ビオチン−dT、切断可能なdUを含有する5’ヘアピン、NGSプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位、及び一意なサンプル識別子配列(1−3、12−13)によって特徴付けられる。3’アダプターのライゲーション後、ビーズを洗浄し、5μlの10XBSA添加剤(メリーランド州ゲイサーズバーグのTrevigen)及び0.5UのHuman Fen−1(メリーランド州ゲイサーズバーグのTrevigen)を含有する1XREC Reaction Buffer12(メリーランド州ゲイサーズバーグのTrevigen)50μlに再懸濁させ、30℃で30分間インキュベートした(14)。次いで、ビーズを洗浄し、1XQuick Ligation 緩衝液45μl及びQuick T4 DNAリガーゼ5μlに再懸濁させ、室温で15分間インキュベートした。
アダプターのUSER切断及びPCR増幅を、実施例1(15)に記載の通りに実施した。
実施例4: 1つの標的単離プローブによるシーケンシングのための、標的配列を濃縮するための方法の変形例。
実施例1のプロトコールを、3’−ジデオキシヌクレオチドを有する標的単離プローブを用いた一本鎖3’及び5’消化(図1(1)−(4)及び図2C(16)−(18))によって進めた。ビーズを洗浄し、1XQuick Ligation緩衝液45μl及び50μM 3’平滑末端化ヘアピンDNAアダプター10μlに再懸濁させ、Quick T4 DNAリガーゼ5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(16)。3’アダプター配列は、NGSプラットフォーム特異的シーケンシングプライマー部位、5’リン酸、及び3’−ジデオキシヌクレオチドを含有した。
ビーズを洗浄した後、標的/プローブ二重鎖を平滑末端化し、dAテイル化し(dA−tailed)、5’アダプターを標的にライゲートし、サイズ選択なしのライブラリー調製のための製造業者のプロトコールに従って、Illumina用のNEBNext Ultra DNA Library Prep Kit(マサチューセッツ州イプスウィッチのNew England Biolabs)を用いて標的を増幅した(17)(18)。
実施例5: 標的単離プローブ及びランダムオリゴヌクレオチドを用いてシーケンシングするための、標的配列を濃縮するための方法。
500bp断片のための製造業者のプロトコールに従い、Covarisの装置を用いてヒトgDNA(1μg)を剪断した(図3(19))。剪断したDNAは、Tiquiaら(2004年)に記載の技術を用い、500bpのgDNA断片内の100bpから300bpのヌクレオチド標的配列の3’末端に特に相補的な、50塩基長の3’標的単離プローブ20nmolを含有するハイブリダイゼーション反応混合物25μlに添加した(図3(20))。ハイブリダイゼーション後、3’標的単離プローブ/標的DNA二重鎖を、製造業者のプロトコールに従って、親水性のストレプトアビジンビーズ50μlに30分間結合させた(図3(21))。
1XNEBuffer4、2.5UのエキソヌクレアーゼT及び2.5μlのエキソヌクレアーゼIを含有する反応混合物50μlにビーズを再懸濁させ、37℃で10分間インキュベートした(図3(22))。磁気ビーズを洗浄し、dA−Tailing反応混合物50μlに再懸濁させ、37℃で30分間インキュベートした。次いで、ビーズを洗浄し、1XQuick Ligation緩衝液45μlと、dUの切断可能な核酸塩基を含有する3’Tオーバーハングを有する50μM ヘアピンアダプター10μlとに再懸濁させ、Quick T4 DNAリガーゼ5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(図3(23))。3’アダプター配列は、NGSプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位及び一意な鎖識別子配列並びに3’dTオーバーハングを含有した。
ライゲーション後、ビーズを洗浄し、追加の20nmolのランダムヘキサマーを含有する50μlの1XNEBuffer2に再懸濁させた。反応物を95℃で5分間加熱し、次いで氷に移した後(図3(24))、クレノウ(エキソ−)DNAポリメラーゼ(マサチューセッツ州イプスウィッチのNew England Biolabs)及び100μMのdNTPを添加した。反応物を20℃で10分間、続いて37℃で20分間インキュベートした(図3(25))。
次いで、ビーズを洗浄し、45μlの1XQuick Ligation緩衝液(マサチューセッツ州イプスウィッチのNew England Biolabs)及びdUの切断可能な核酸塩基を含有する5’一本鎖ヘアピンアダプターに再懸濁させ、Quick T4 DNAリガーゼ(マサチューセッツ州イプスウィッチのNew England Biolabs)5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(図3(26))。5’アダプター配列は、NGSプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位及びサンプル同定のためのバーコード配列を含有した。
次いで、磁気ビーズを洗浄し、5μlのUSER酵素並びに3’及び5’ライブラリー増幅部位に相補的な10μM増幅プライマーを各々2.5μl含有する1XHotStart OneTaq PCR Master Mixに再懸濁させた。PCR混合物を37℃で15分間インキュベートした。次のPCRサイクル条件が用いられる:95℃で2分間、続いて95℃で30秒間、60℃で30秒間及び72℃で1分間を25サイクル(図3(27))。25サイクルの終わりに、PCR混合物を72℃で5分間インキュベートした。次いで、標的配列から得られたPCR産物を、従来の方法を用いて配列決定した。
実施例6: 標的単離プローブ及び第二のプローブを用いるシーケンシングのための、標的配列を濃縮するための方法の変形例。
実施例5に記載のプロトコールを、3’アダプターのライゲーション((19)−(23))によって進めた。ライゲーション後、磁気ビーズを洗浄し、標的配列の5’末端に相補的な、50塩基長の5’標的単離プローブ20nmolを含む50μlの1XエキソヌクレアーゼVII緩衝液に再懸濁させた。標的単離プローブを95℃で5分間加熱し、続いて30℃までゆっくりと冷却することにより標的にアニールした(図4(28))。10UのエキソヌクレアーゼVIIを反応物に転化し、37℃でさらに10分間インキュベートした(図4(29))。製造業者のプロトコールに従って、酵素を熱失活させた。ビーズを洗浄し、追加の20nmolの5’標的単離プローブを含有する1XNEBuffer2(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに再懸濁させた。反応物を95℃で5分間加熱し、続いて30℃までゆっくりと冷却した後、15UのT4 DNAポリメラーゼ(マサチューセッツ州イプスウィッチのNew England Biolabs)及び100μMのdNTPを添加した。反応物を20℃で30分間インキュベートした。
ビーズを洗浄した後、5’アダプターのライゲーション、該アダプターのUSER切断及びPCR増幅を、3’Tオーバーハングを有するヘアピンアダプターを用いて実施例4に記載の通りに実施した((図4(30)(31))。
実施例7: 2プローブによるシーケンシングのための、標的配列を濃縮するための方法の変形例。
実施例4に記載のプロトコールを、3’ではなく内部にビオチンを有する3’標的単離プローブを用いる5’エキソヌクレアーゼ消化及び熱失活((19)−(23)、(28)−(29))によって進めた。熱失活後、ビーズを洗浄し、15ユニットのクレノウ(エキソ−)DNAポリメラーゼ及び100μMのdNTPを含有する50μlの1XNEBuffer2に再懸濁させた。反応物を20℃で10分間、続いて37℃で20分間インキュベートした(32)。
ビーズを洗浄した後、5’アダプターのライゲーション、該アダプターのUSER切断及びPCR増幅を、実施例5に記載の通りに実施した((26)(27))。
実施例8: 標的単離プローブ及び5’フラッププローブによるシーケンシングのための、標的配列を濃縮するための方法。
実施例6に記載のプロトコールを、3’ヘアピンアダプターのライゲーションによって進めた(図3、(19)−(23))。3’アダプターのライゲーション後、ビーズを洗浄し、フラップ5’プローブ20nmolを含有する50μlの1XREC Reaction Buffer12に再懸濁させた。フラッププローブは、標的の5’末端に相補的な一本鎖の3’領域、切断可能なdUを含有する5’ヘアピン、NGSプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位、及び一意なサンプル識別子配列で構成された。プローブを、95℃で5分間加熱し、その後、30℃までゆっくりと冷却することにより標的配列の5’末端にアニールした(35)。
アニーリング後、10XBSA添加剤5μl及び0.5ユニットのヒトFen−1を添加し、5’一本鎖領域を除去し、反応物を30℃で30分間インキュベートした(36)。次いで、ビーズを洗浄し、1XQuick Ligation 緩衝液45μl及びQuick T4 DNAリガーゼ5μlに再懸濁させ、室温で15分間インキュベートした。
次いで、磁気ビーズを洗浄し、5μlのUSER酵素及び増幅プライマーを含有する1XHotStart OneTaq PCR Master Mixに再懸濁させた。PCR混合物を37℃で15分間インキュベートし、次のPCRサイクル条件を用いた:95℃で2分間、続いて95℃で30秒間、60℃で30秒間及び72℃で1分間を25サイクル。25サイクルの終わりに、PCR混合物を72℃で5分間インキュベートした(37)。次いで、標的配列から得られたPCR産物を、従来の方法を用いて配列決定した。
実施例9: 2プローブによるシーケンシングのための、標的配列を濃縮するための方法の変形例。
500bp断片のための製造業者のプロトコールに従い、Covarisを用いてヒトgDNA(1μg)を剪断した(19)。剪断したDNAを、20nmolの3’標的単離プローブと20nmolの5’プローブ(それぞれが50塩基長で、100の標的の3’及び5’末端を特定する)とを含有するハイブリダイゼーション反応物25μlに添加した(38)。ハイブリダイゼーション後、ハイブリダイズした標的配列を実施例2に記載の通りに捕捉した(39)。
1XNEBuffer4、2.5ユニットのエキソヌクレアーゼT及び2.5μlのエキソヌクレアーゼIを含有する反応混合物50μlにビーズを再懸濁させ、37℃で10分間インキュベートした。磁気ビーズを洗浄し、30ユニットのRecJfを含有する1XNEBuffer2(マサチューセッツ州イプスウィッチのNew England Biolabs)50μlに再懸濁させ、20℃で10分間インキュベートした(図4)。
磁気ビーズを洗浄し、dA−Tailing反応混合物50μlに再懸濁させ、37℃で30分間インキュベートした。次いで、ビーズを洗浄し、45μlの1XQuick Ligation緩衝液及びIllumina用のNEBNextアダプターに再懸濁させた。Quick T4 DNAリガーゼ5μlをライゲーション混合物に添加し、室温で15分間インキュベートした(41)。
アダプターのUSER切断及びPCR増幅を、実施例1(42).に記載の通りに実施した。

Claims (19)

  1. 核酸の集団から標的配列を濃縮するための方法であって、
    (a) 核酸集団と、親和性結合ドメインを含む標的単離プローブとを溶液中で組み合わせることと;
    (b) 標的単離プローブの一本鎖領域を、核酸の集団中の標的配列の全部又は一部にハイブリダイズさせることと;
    (c) 標的単離プローブを捕捉ドメインと結合させ、非結合物質を除去することにより、標的配列を含有する集団からハイブリダイズされた核酸を選択的に固定化することと;
    (d) 1以上の3’エキソヌクレアーゼによって、標的配列の3’末端から非標的配列を除去し、それにより標的配列の3’末端及び標的単離プローブの5’末端に、平滑末端二重鎖又は付着端を生じさせることと;
    (e) 標的単離プローブの3’末端を伸長させて、標的配列の5’末端に平滑末端又は付着端を形成すること
    とを含む、方法。
  2. (b)の標的単離プローブの一本鎖領域が標的配列の一部にハイブリダイズする、請求項1に記載の方法。
  3. 前記一部が標的配列の3’末端に配置される、請求項2に記載の方法。
  4. 親和性結合ドメインが標的単離プローブの3’末端と5’末端の間に配置される、請求項1から3のいずれか一項に記載の方法。
  5. 3’エキソヌクレアーゼがエキソヌクレアーゼI、エキソヌクレアーゼT、及び/又は3’エキソヌクレアーゼ活性を有する1以上のポリメラーゼから選択される、請求項1から4のいずれか一項に記載の方法。
  6. 伸長工程(e)がdUTPなどの修飾デオキシヌクレオチドの存在下で実施される、請求項1から5のいずれか一項に記載の方法。
  7. 標的単離プローブのエキソヌクレアーゼ分解を防ぐために、標的単離プローブがその3’末端及び/又はその5’末端において修飾される、請求項1から6のいずれか一項に記載の方法。
  8. 標的単離プローブの3’末端におけるライゲーションを防ぐために、標的単離プローブがその3’末端において修飾される、請求項1から7のいずれか一項に記載の方法。
  9. 標的単離プローブの5’末端におけるポリメラーゼ伸長を防ぐために、標的単離プローブがその5’末端において修飾される、請求項1から8のいずれか一項に記載の方法。
  10. 修飾がインバーテッド塩基、炭素リンカー、ホスホロチオエート結合又はジデオキシヌクレオチドから選択される、請求項7から9のいずれか一項に記載の方法。
  11. 増幅を防ぐために、標的単離プローブがデオキシウラシル、内部炭素リンカー又は1以上のリボヌクレオチドを含有するように修飾される、請求項1から10のいずれか一項に記載の方法。
  12. (d)が、
    (I) 標的配列の3’末端に対する二重鎖3’アダプター;又は
    (ii) 標的配列の3’末端に対するヘアピン3’アダプターの二重鎖領域
    をライゲートすることをさらに含む、請求項1から11のいずれか一項に記載の方法。
  13. (e)が
    (I) 標的配列の5’末端に対する二重鎖5’アダプター;又は
    (ii) 標的配列の5’末端に対するヘアピン5’アダプターの二重鎖領域
    をライゲートすることをさらに含む、請求項1から12のいずれか一項に記載の方法。
  14. 3’及び/又は5’アダプターがNGSプラットフォーム特異的アダプター、単一ヌクレオチドオーバーハングを含有するアダプター、切断可能部位を有するY構造若しくはヘアピンアダプター、完全に相補的な二本鎖DNA(dsDNA)アダプター、又はライゲーション接合部の反対側に一本鎖DNA(ssDNA)オーバーハングを有するdsDNAアダプターである、請求項12又は13に記載の方法。
  15. 3’アダプターの3’末端がジデオキシヌクレオチドを含有し、
    標的配列の3’末端へのライゲーションを目的とした3’アダプターの5’末端がリン酸基を欠いており、及び/又は
    標的配列の5’末端へのライゲーション用ではない5’アダプターの5’末端がインバーテッドヌクレオチドを含有する、
    請求項12に記載の方法。
  16. 3’及び/又は5’アダプターがシーケンシングプライマー部位、ライブラリー増幅プライマー部位、一意なサンプル識別子、及び一意な分子識別子配列のうちの少なくとも1つを含む、請求項12から15のいずれか一項に記載の方法。
  17. アダプターにライゲートされた標的配列を増幅することをさらに含む、請求項12から16のいずれか一項に記載の方法。
  18. 増幅反応が、シーケンシングプラットフォームにより必要とされる配列などの、追加の配列をアダプターにライゲートされた標的に加えるプライマーを用いて実施される、請求項17に記載の方法。
  19. 標的配列を定量すること及び/又はシーケンシングすることをさらに含む、請求項12から18のいずれか一項に記載の方法。
JP2017550457A 2014-12-11 2014-12-11 標的配列の濃縮 Pending JP2017537657A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2014/069754 WO2016093838A1 (en) 2014-12-11 2014-12-11 Enrichment of target sequences

Publications (1)

Publication Number Publication Date
JP2017537657A true JP2017537657A (ja) 2017-12-21

Family

ID=52278810

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017550457A Pending JP2017537657A (ja) 2014-12-11 2014-12-11 標的配列の濃縮

Country Status (2)

Country Link
JP (1) JP2017537657A (ja)
WO (1) WO2016093838A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022510723A (ja) * 2019-01-02 2022-01-27 上海臻迪基因科技有限公司 遺伝子標的エリアの富化方法及びキット
JP2022523362A (ja) * 2019-02-21 2022-04-22 ストラトス ゲノミクス インコーポレイテッド 単一分子配列決定における使用のための拡張可能ポリマーの固体合成のための方法、組成物、およびデバイス
JP2022553164A (ja) * 2019-10-25 2022-12-22 ガーダント ヘルス, インコーポレイテッド 3’オーバーハングを修復する方法
JP2023519898A (ja) * 2020-03-26 2023-05-15 インテグレーティッド ディーエヌエイ テクノロジーズ インコーポレーティッド ハイブリダイゼーションキャプチャー法および組成物

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7048609B2 (ja) * 2016-12-09 2022-04-05 ボリアル ジェノミクス, インコーポレイテッド 連結型ライゲーション
CN112400026A (zh) * 2018-02-26 2021-02-23 Cy分子诊断公司 用于稀有种类亲和定向富集的组合物和方法
GB201803240D0 (en) * 2018-02-28 2018-04-11 Synpromics Ltd Methods and compositions for enriching nucleic acids
WO2019183640A1 (en) * 2018-03-23 2019-09-26 Board Of Regents, The University Of Texas System Efficient sequencing of dsdna with extremely low level of errors
CA3120713A1 (en) * 2018-11-21 2020-05-28 Avida Biomed, Inc. Methods for targeted nucleic acid library formation
EP4606909A3 (en) * 2018-12-19 2025-12-31 New England Biolabs, Inc. TARGET ENRICHMENT
AU2020233286B2 (en) 2019-03-01 2022-10-20 Mercy Bioanalytics, Inc. Systems, compositions, and methods for target entity detection
WO2025260292A1 (zh) * 2024-06-19 2025-12-26 深圳华大生命科学研究院 纯化待测分子-双链体复合物的方法及试剂盒

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US4883750A (en) 1984-12-13 1989-11-28 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US4988617A (en) 1988-03-25 1991-01-29 California Institute Of Technology Method of detecting a nucleotide change in nucleic acids
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
JP3080178B2 (ja) 1991-02-18 2000-08-21 東洋紡績株式会社 核酸配列の増幅方法およびそのための試薬キット
US5426180A (en) 1991-03-27 1995-06-20 Research Corporation Technologies, Inc. Methods of making single-stranded circular oligonucleotides
US5593826A (en) 1993-03-22 1997-01-14 Perkin-Elmer Corporation, Applied Biosystems, Inc. Enzymatic ligation of 3'amino-substituted oligonucleotides
EP0695305B1 (en) 1993-04-12 2003-08-06 Northwestern University Method of forming oligonucleotides
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
EP1033411B1 (en) 1996-06-04 2006-02-22 University of Utah Research Foundation Fluorescent donor-acceptor pair
US6060245A (en) 1996-12-13 2000-05-09 Stratagene Methods and adaptors for generating specific nucleic acid populations
US5888737A (en) 1997-04-15 1999-03-30 Lynx Therapeutics, Inc. Adaptor-based sequence analysis
US6582938B1 (en) 2001-05-11 2003-06-24 Affymetrix, Inc. Amplification of nucleic acids
ATE419378T1 (de) 2001-04-10 2009-01-15 Ecole Polytech Verfahren zur verwendung von o6-alkylguanin-dns alkyltransferasen
WO2004029223A2 (en) 2002-09-30 2004-04-08 Parallele Bioscience, Inc. Polynucleotide synthesis and labeling by kinetic sampling ligation
KR20050062588A (ko) 2002-10-03 2005-06-23 에콜 폴리테크니크 페데랄레 드 로잔 O6-알킬구아닌-dna 알킬트랜스퍼라제용 기질
EP1594962B1 (en) 2003-01-31 2014-08-27 Promega Corporation Covalent tethering of functional groups to proteins
US20040209299A1 (en) 2003-03-07 2004-10-21 Rubicon Genomics, Inc. In vitro DNA immortalization and whole genome amplification using libraries generated from randomly fragmented DNA
AU2004242249A1 (en) 2003-05-23 2004-12-02 Epfl-Ecole Polytechnique Federale De Lausanne Methods for protein labeling based on acyl carrier protein
US7888090B2 (en) 2004-03-02 2011-02-15 Ecole Polytechnique Federale De Lausanne Mutants of O6-alkylguanine-DNA alkyltransferase
US8163479B2 (en) 2004-03-02 2012-04-24 Ecole Polytechnique Federale De Lausanne Specific substrates for O6-alkylguanine-DNA alkyltransferase
US8158388B2 (en) 2004-10-21 2012-04-17 New England Biolabs, Inc. Repair of nucleic acids for improved amplification
KR20070073917A (ko) 2004-10-21 2007-07-10 뉴 잉글랜드 바이오랩스, 인크 개선된 증폭을 위한 핵산 복구
WO2006114409A1 (en) 2005-04-27 2006-11-02 Covalys Biosciences Ag Pyrimidines reacting with o6-alkylguanine-dna alkyltransferase
WO2007018601A1 (en) 2005-08-02 2007-02-15 Rubicon Genomics, Inc. Compositions and methods for processing and amplification of dna, including using multiple enzymes in a single reaction
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
US20070172839A1 (en) 2006-01-24 2007-07-26 Smith Douglas R Asymmetrical adapters and methods of use thereof
EP1882688A1 (en) 2006-07-25 2008-01-30 EPFL Ecole Polytechnique Fédérale de Lausanne Labelling of fusion proteins with synthetic probes
WO2009133466A2 (en) 2008-04-30 2009-11-05 Population Genetics Technologies Ltd. Asymmetric adapter library construction
US20120238738A1 (en) 2010-07-19 2012-09-20 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
EP4293125A3 (en) * 2012-12-10 2024-02-28 Resolution Bioscience, Inc. Methods for targeted genomic analysis
JP6441893B2 (ja) * 2013-03-19 2018-12-19 ディレクティド・ジェノミクス・エル・エル・シー 標的配列の濃縮

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022510723A (ja) * 2019-01-02 2022-01-27 上海臻迪基因科技有限公司 遺伝子標的エリアの富化方法及びキット
JP7202556B2 (ja) 2019-01-02 2023-01-12 上海臻迪基因科技有限公司 遺伝子標的エリアの富化方法及びキット
US12195785B2 (en) 2019-01-02 2025-01-14 Shanghai Zenisight Ltd. Gene target region enrichment method and kit
US12577606B2 (en) 2019-01-02 2026-03-17 Shanghai Zenisight Ltd. Gene target region enrichment method and kit
JP2022523362A (ja) * 2019-02-21 2022-04-22 ストラトス ゲノミクス インコーポレイテッド 単一分子配列決定における使用のための拡張可能ポリマーの固体合成のための方法、組成物、およびデバイス
JP2024026147A (ja) * 2019-02-21 2024-02-28 ロシュ・ダイアグノスティクス・シアトル・インコーポレーテッド 単一分子配列決定における使用のための拡張可能ポリマーの固体合成のための方法、組成物、およびデバイス
JP2022553164A (ja) * 2019-10-25 2022-12-22 ガーダント ヘルス, インコーポレイテッド 3’オーバーハングを修復する方法
JP7850658B2 (ja) 2019-10-25 2026-04-23 ガーダント ヘルス, インコーポレイテッド 3’オーバーハングを修復する方法
JP2023519898A (ja) * 2020-03-26 2023-05-15 インテグレーティッド ディーエヌエイ テクノロジーズ インコーポレーティッド ハイブリダイゼーションキャプチャー法および組成物
JP7850673B2 (ja) 2020-03-26 2026-04-23 インテグレーティッド ディーエヌエイ テクノロジーズ インコーポレーティッド ハイブリダイゼーションキャプチャー法および組成物

Also Published As

Publication number Publication date
WO2016093838A1 (en) 2016-06-16

Similar Documents

Publication Publication Date Title
JP6441893B2 (ja) 標的配列の濃縮
US10087481B2 (en) Enrichment of target sequences
JP2017537657A (ja) 標的配列の濃縮
US11795492B2 (en) Methods of nucleic acid sample preparation
CN109415758B (zh) 使用含接头的经固定化的转座体进行的标签片段化
EP3077545B1 (en) Methods for sequencing nucleic acids
US8512956B2 (en) Method for clonal amplification
EP3103885B1 (en) Methods for sequencing nucleic acids
US11060139B2 (en) Methods for sequencing nucleic acids
JP2018522543A (ja) 分子タグ付けのための方法、システム、組成物、キット、装置、及びコンピュータ可読媒体
CN104080958A (zh) 用于定向核酸扩增和测序的组合物和方法
EP2247727A2 (en) Method for archiving and clonal expansion
CN106244578A (zh) 用于对核酸进行测序的方法
KR20080005188A (ko) 선별 프로브 증폭
CN106414737A (zh) 维持拷贝数的rna分析方法
WO2015050501A1 (en) Amplification paralleled library enrichment
KR20230124636A (ko) 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법
CN114616342B (zh) 制备用于crispr的个性化的靶标不相关的向导rna池的方法
WO2023116376A1 (zh) 单细胞核酸标记和分析方法
WO2026076125A1 (en) Increasing spatial transcriptomics library yield by surface amplification of index-labeled cdna
CN121693578A (zh) 靶向空间转录组学
HK40066065A (en) Methods of nucleic acid sample preparation
CN118974252A (zh) 基于空间转座的rna测序文库制备方法