JP2017537657A

JP2017537657A - 標的配列の濃縮

Info

Publication number: JP2017537657A
Application number: JP2017550457A
Authority: JP
Inventors: シンシアエル．リチャード，
Original assignee: ニユー・イングランド・バイオレイブス・インコーポレイテツド; ダイレクテッドジェノミクス，エルエルシー
Priority date: 2014-12-11
Filing date: 2014-12-11
Publication date: 2017-12-21
Also published as: WO2016093838A1

Abstract

核酸の集団から標的配列を濃縮するための方法及び組成物であって、核酸の集団と、親和性結合ドメインを含む標的単離プローブとを溶液中で組み合わせること；標的単離プローブの一本鎖領域を、核酸の集団中の標的配列の全部又は一部にハイブリダイズさせることと；標的単離プローブを捕捉ドメインと結合させ、非結合物質を除去することにより、標的配列を含有する集団からハイブリダイズされた核酸を選択的に固定化すること；１以上の３’エキソヌクレアーゼによって、標的配列の３’末端から非標的配列を除去し、それにより標的配列の３’末端に平滑末端二重鎖又は付着端を生じさせること；任意選択的に３’二重鎖アダプター又はヘアピンアダプターの二重鎖末端を標的配列の３’末端及び標的分離プローブの５’末端にライゲートすること；標的単離プローブの３’末端を伸長させて、ライゲーションに適した標的配列の５’末端に平滑末端又は付着端を形成し、標的配列の５’末端及び標的単離プローブの３’伸長末端へのアダプターをライゲートすることを含む、方法が提供される。【選択図】図１０

Description

次世代シーケンシング（ＮＧＳ）は、がん(Dancey, et al. Cell, 48:409-420 (2012); Dawson, et al. NEJM, 368:1199-1209 (2013))、心筋症(Meder, et al. Circ. Cardiovasc. Genet., 4:110-122 (2011); Norton, et al. Curr. Opin. Cariol., 27:214-20 (2012))、遺伝性障害(Boycott, et al. Nature Genetics, 14:681-691 (2013))、出生前診断(Nepomnyashchaya, et al. Clin Chem Lab Med., 51:1141-54 (2013); Papgeorgiou, et al. Genome Medicine, 4:46 (2012))、及び神経障害(Nemeth, et al. Brain, 136:3106-180 (2013))を含めた多くの疾患の診断及び治療において貴重なツールであることが判明している。一方で、ＮＧＳによってヒトゲノム全体のシーケンシングが数日で可能になるものの、シーケンシングのコスト及びデータ分析の負担が、全ゲノムシーケンシングの臨床への橋渡しを著しく妨げている。結果として、標的配列の濃縮により、ＮＧＳ(Agilent, (Santa Clara, CA), Roche/NimbleGen (Madison, WI), Illumina (San Diego, CA), Life Technologies (Grand Island, NY))、マルチプレックスＰＣＲ(Life Technologies, Illumina, Qiagen (Valencia, CA), Kailos Genetics (Huntsville, AL))、分子反転プローブ(Hiatt, et al. Genome Res., 23, 843-54 (2013))、高並列ＰＣＲ(highly-parallel PCR)(Fluidigm (San Francisco, CA), Raindance (Billerica, MA)）、及び単一プライマー増幅法(Enzymatics/ArcherDx (Beverly, MA), NuGen (San Carlos, CA))に依拠する分子診断を容易にすることが望ましい。

濃縮のための現行法としては、調製されたＤＮＡライブラリーからのハイブリダイゼーション捕捉(Albert, et al. Nature Methods, 4:903-905 (2007); Okou, et al. Nature Methods, 4:907-909 (2007))が含まれる。ハイブリダイゼーション捕捉は、固定化プローブのアレイを必要とする。理論的には、溶液中の断片化核酸は、それが相補的配列を有する場合、これらの固定化プローブにハイブリダイズする。これらの方法は、二重鎖両方の鎖が捕捉され得ることを除いて、溶液ハイブリダイゼーションの場合と同じ欠点を有する。しかし、これらの方法のさらなる欠点は、ハイブリダイゼーション前にプローブが表面に結合される場合、ハイブリダイゼーションの効率が下がることを含む。さらなる欠点としては、２−３日にもわたる非常に長いプロトコール、試験のコストを増大させる複数の工程、大量の初期インプットＤＮＡ（１μｇ−５μｇ）の必要性、ライブラリーの広範なサイズ分布、特異性がわずか５５％−６５％、８０％＋／−２００から５００塩基対（ｂｐ）、及び反復を捕捉することができないこと、又は非標的配列内の反復配列を含有する核酸を取り扱うことができないことが含まれる。

現行の方法は、標的の末端における人工配列に依拠することから、リード開始点（核酸分子のシーケンシングが開始される位置）を特定するのに適していない。さらに、現行法は、両方の標的鎖を捕捉するのに適していない。本ハイブリダイゼーション法は、通常、Ｓａｋｈａｒｋａｒら、ＩｎＳｉｌｉｃｏＢｉｏｌｏｇｙ，４：３８７−３９３（２００４）で記載されている通り、２００ｂｐ未満であるエキソン上の平均サイズを超える核酸断片を捕捉することから、結果的にリード開始点を明確に決定することができないことに因り、実質的に非標的のシーケンシングになる。ハイブリダイゼーションに基づくエキソーム捕捉技術の性能比較は、Ｃｌａｒｋら、ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ，２９：９０８-９１４（２０１１）で総論されている。

マルチプレックスＰＣＲは、捕捉ハイブリダイゼーションの代替である。マルチプレックスＰＣＲ法はかなり高速であり、濃縮前にライブラリーを調製する必要はないが、プライマー相互作用のために反応ごとに拡張性が制限され、異なる効率で増幅するプライマーのセットを使用することから生じる増幅バイアスによる標的全体にわたる増幅の均一性変動、重複をフィルターにかけることができないこと、及び標的へのアニーリングに用いられるプライマー配列の追加が、アンプリコンの末端に含まれる。シーケンシング中、これらの配列を一通り読まざるを得ないため、それによってシーケンシングの時間及びコストが増加する。さらに、不要な配列複雑性を生成する標的配列に加えて、合成プライマーの配列が配列レポートに含まれる。分子反転プローブ及び高並列ＰＣＲはいずれも、マルチプレックスＰＣＲによって遭遇する問題の一部を解決するが、両方法ともよりかなり高額である。分子反転プローブは長いオリゴヌクレオチド上で合成する必要があることから、高並列ＰＣＲ法に関連する装置コストが生じる。その上、いずれの方法も、アンプリコンの末端に合成プライマー配列を導入する。単一プライマー法は、アンプリコンの末端の一方のみにプライマー配列を導入することから、配列決定されたプライマーの量を半減させるが、２のプライマーを用いて正確な標的配列を濃縮することによって得られるさらなる選択性を犠牲にする。その結果、高い拡張性、特異性、及び均一性でオフターゲット又はプライマー領域のシーケンシングを最小にする標的濃縮の方法が依然として必要とされている。

概して、核酸の集団から標的配列を濃縮するための方法及び組成物が提供される。本方法は、核酸の集団と、親和性結合ドメインを含む標的単離プローブとを溶液中で組み合わせること；標的単離プローブの一本鎖領域を、核酸の集団中の標的配列の全部又は一部にハイブリダイズさせること；標的単離プローブを捕捉ドメインと結合させ、非結合物質を除去することにより、標的配列を含有する集団からハイブリダイズされた核酸を選択的に固定化すること；及び１以上の３’一本鎖特異的エキソヌクレアーゼによって、標的配列の３’末端から非標的配列を除去することを含む。

種々の態様において、集団中の核酸の一部又は全部は反復配列を含み、核酸の集団は、標的単離プローブの前に又はそれと共に反復配列にハイブリダイズする除去可能なブロッキングオリゴヌクレオチドと組み合わされ得る。過剰の除去可能なブロッキングオリゴヌクレオチドを使用し、二重鎖変性工程の後にハイブリダイゼーションを可能にすることが有利であり得る。次いで、核酸／除去可能なオリゴヌクレオチド二重鎖中の除去可能なブロッキングオリゴヌクレオチドは、３’一本鎖特異的エキソヌクレアーゼを有する３’非標的配列の分解と同時に又はそれより前に、選択的に分解され得る。除去可能なブロッキングオリゴヌクレオチドの分解は、除去可能なブロッキングオリゴヌクレオチドがＲＮＡである場合にはＲＮＡｓｅによって、又は、例えば除去可能なブロッキングオリゴヌクレオチドが複数のウラシルを含有するＤＮＡである場合にはウラシルグリコシラーゼ及びエンドヌクレアーゼによって、又は除去可能なブロッキングオリゴヌクレオチドを特異的に切断するためのその他任意の適切な技術によって達成され得る。

様々な態様において、上記の標的単離プローブの一本鎖領域は、標的配列の３’末端及び５’末端の両方にハイブリダイズし得る。これらの状況において、親和性ドメインは、好ましくは標的単離プローブの３’末端と５’末端の間に位置するが、３’末端又は５’末端にはない部位で標的単離プローブと結合される。標的配列とのハイブリダイゼーションは、中程度にストリンジェントなハイブリダイゼーション条件下で、標的単離プローブの長さに沿って生じ得る。これらの条件は、本方法の使用が一塩基多型（ＳＮＰ）を検出するためである場合に予想されるように、個々の塩基対のミスマッチが起こることを許容し得る。あるいは、ハイブリダイゼーションは、異なる供給源由来の選択された標的配列を特徴付ける可能性のある挿入又は欠失のために生じる恐れのあるミスマッチの重要な内部領域を有する標的単離プローブの末端で生じ得る。標的配列／標的単離プローブが親和性ドメインと固定化された捕捉ドメインとの結合により固定化され、３’非標的配列が除去された後か又は１以上の３’エキソヌクレアーゼを用いた除去と同時に、５’非標的配列は、１以上の５’一本鎖特異的エキソヌクレアーゼによって標的配列の５’末端から除去され得る。標的配列の３’及び５’末端でのエキソヌクレアーゼ消化に続いて、アダプターのライゲーションに適した平滑末端又は付着端を生成するために、アダプターを標的配列にライゲートさせることにより、標的配列は、容易に同定、単離、増幅、配列決定、特徴付けされ、及び／又は表現型的に重要な配列差異について分析され得る。

本方法の態様において、標的単離プローブの異なる構造を利用し、本明細書に記載の第二のプローブと併せて使用することができる。プローブに関係なく、本方法のいくつかの共通の特徴、すなわち集団中の核酸の、親和性ドメインと結合した標的単離プローブとのハイブリダイゼーション、それに続く、標的単離プローブが固定化されている場合に生じ、非ハイブリダイズ核酸及び試薬を洗浄により、次いで３’非標的配列をエキソヌクレアーゼ消化により除去することを可能にする濃縮の第一の工程は、保存される。

本方法の一態様において、標的単離プローブは、フラッププローブであってもよく、フラッププローブは一本鎖領域の３’末端から伸長する非ハイブリダイズ二本鎖領域を有する。非ハイブリダイズ二本鎖領域は、一方の鎖の５’末端でプローブの一本鎖領域の３’末端にライゲートされてもよいし、又は非ハイブリダイズ二本鎖領域において第二の鎖を構成する３’−５’オリゴヌクレオチドがアニールされている、一本鎖プローブの一部であってもよい。あるいは、非ハイブリダイズ二本鎖領域は、折り返してそれ自体とハイブリダイズして二本鎖領域を形成する、一本鎖プローブの３’末端のヘアピンから形成され得る。フラッププローブの、標的配列の５’末端へのハイブリダイゼーションの後、５’非標的配列は、５’フラップエンドヌクレアーゼ消化により除去することができ、３’−５’オリゴヌクレオチド又はヘアピンは、５’アダプターとして働くようにニッキング工程の後の標的配列の５’末端にライゲートされ得る。３’アダプターは、標的配列の３’末端にライゲートされ得る。３’及び５’アダプターは、シーケンシングプライマー部位、ライブラリー増幅プライマー部位、一意なサンプル識別子(unique sample identifier)、及び一意な分子識別子配列のうちの１以上をそれぞれ含有し得る。

本方法の他の態様において、標的単離プローブの一本鎖領域は、標的配列の第一の部分にハイブリダイズする。例えば、標的単離プローブの末端は、標的配列の３’末端若しくは５’末端又はその近傍の配列を有する二重鎖を形成する。第二のプローブの一本鎖領域が標的単離プローブに隣接する、又はその近傍若しくは遠位の位置で標的配列の第二の部分にハイブリダイズすることがさらに可能になり、この位置によって第二のプローブが標的単離プローブと反対側にある標的配列の末端を決定することになる。一態様において、第二のプローブは、標的配列中のヌクレオチドの９０％、７０％、５０％、３０％又は１０％以下の非ランダム配列を有し、それに対応して標的単離配列は標的配列の１０％、３０％、５０％、７０％又は９０％以下のヌクレオチド配列を有する。

これらの方法の態様において、３’標的単離プローブ上の親和性ドメインは、標的単離プローブの３’末端に、又は標的単離プローブ内のどこにでも（ただし５’末端は除く）配置することができ、一方、５’標的単離プローブ上の親和性ドメインは、標的分離プローブの５’末端に、又は標的分離プローブの内のどこにでも（ただし３’末端は除く）配置され得る。

これらの方法の態様において、標的単離プローブが標的配列の一部に、例えば標的配列の３’末端でハイブリダイズする場合、４−１０ヌクレオチドの範囲の長さを持つランダム配列を有するオリゴヌクレオチドを用いることができ、このオリゴヌクレオチドは、ポリメラーゼ伸長のためのプライマーとして働き、アダプターライゲーションに適した二本鎖の５’末端を形成する。

本方法の別の態様において、標的単離プローブ又は標的配列の５’部分に配置される第二のプローブは、ハイブリダイズする一本鎖領域と一本鎖領域の３’末端から伸長するハイブリダイズしない二本鎖領域とを有する前述のものと類似のフラッププローブである。５’非標的配列は、５’エキソヌクレアーゼ消化によって除去されて、線状プローブが標的配列の５’末端で用いられる場合には標的配列へのアダプターライゲーションに適した平滑末端又は付着端を、５’フラッププローブが用いられる場合には５’フラップエンドヌクレアーゼを提供することができる。例えば、ブロッキング部分は、標的単離プローブ又は第二のプローブへのアダプターのライゲーションを防ぐために、修飾されたヌクレオチドが提供される。５’末端のエキソヌクレアーゼ消化が５’非標的配列よりも多い又は少ないものを除去する場合、５’アダプターのライゲーション前に、付着端を埋める追加の工程を用いることができる。

前述の方法の態様のいずれにおいても、３’アダプター及び任意選択的に５’アダプターは、ヘアピンアダプターであってもよい。ヘアピンアダプターの使用は、標的配列の末端を決定する標的単離プローブ又は第二のプローブがヘアピンアダプターの一方の末端に共有結合され得、標的配列はヘアピンアダプターのもう一端に共有結合されるような、さらなる利点をもたらす。変性条件下で、一本鎖核酸は、標的配列の、プライムされた増幅(primed amplification)を開始するために利用可能なアダプター配列を生じる。

本方法の一態様において、５’エキソヌクレアーゼ消化後に５’プローブを置換するように、標的単離配列の３’末端をポリメラーゼによって伸長させることができる。

本発明の方法の態様において、アダプターは、標的配列の各末端及び直接又は増幅後に配列決定される標的配列にライゲートされる。シーケンシング反応におけるリード開始点は、標的配列の３’末端又はその近傍に存在し、標的配列をわかりにくくするか又は標的配列における重大な突然変異をわかりにくくするプライマーの懸念なしに標的配列中の各ヌクレオチドのシーケンシングを可能にする方法で、標的配列の５’末端又はその近傍で終結する。突然変異の例には、挿入、欠失又はヌクレオチド多型若しくは一塩基多型のうちの１以上が含まれる。このようにして、生物の突然変異と表現型との相関は、忠実に記録することができる。

標的配列の一方又は両方の末端での非標的配列の除去に因って、非標的配列の不必要なシーケンシング及び分析は回避される。概して、動物又は植物の抽出物を分析するための方法であって、抽出物から核酸サンプルを得ること；前述の標的配列について濃縮すること；及び濃縮された標的分子のヌクレオチド配列を得ることを含む方法が提供される。一態様において、濃縮された標的分子から得られるヌクレオチド配列は、３’末端の５つ未満の非標的ヌクレオチドか；又は標的配列の少なくとも９０％を含む。シーケンシングの前に、標的配列は、標的配列の３’及び５’末端に位置するアダプター内の配列にハイブリダイズするプライマー配列を用いて、増幅することができる。標的配列が得られたら、それを用いて、原核生物又は真核生物から変化した表現型との配列変化の相関を確立することができる。

概して、核酸の集団から標的配列を濃縮するための方法であって、次の工程の１つ以上を含む方法が提供される：核酸の集団と、親和性結合ドメインを含む標的単離プローブとを溶液中で組み合わせる工程；標的単離プローブの一本鎖領域を、核酸の集団中の標的配列の全部又は一部にハイブリダイズさせる工程；標的単離プローブを捕捉ドメインと結合させ、非結合物質を除去することにより、標的配列を含有する集団からハイブリダイズされた核酸を選択的に固定化する工程；１以上の３’エキソヌクレアーゼ（例えばエキソヌクレアーゼＩ、エキソヌクレアーゼＴ）及び／又は３’エキソヌクレアーゼ活性を有する１以上のポリメラーゼによって、標的配列の３’末端から非標的配列を除去する工程。エキソヌクレアーゼ活性は、標的配列の３’末端及び標的単離プローブの５’末端に、標的配列の３’末端及び標的単離プローブの５’末端がその後アダプターとのライゲーションに適するようにする、平滑末端二重鎖(blunt ended duplex)又は付着端を生じさせることができる。標的単離プローブの３’末端を伸長させて、標的配列の５’末端に平滑末端又は付着端を形成することができ、ここで伸長工程は、例えばｄＵＴＰなどの修飾デオキシヌクレオチドの存在下で実施される。一態様では、本方法は、上に大まかに記載したすべての工程を含む。

一態様において、上記の標的単離プローブの一本鎖領域は、標的配列の一部にハイブリダイズする。一態様において、前記部分は、標的配列の３’末端に配置される。別の態様では、親和性結合ドメインは、標的単離プローブの３’末端と５’末端の間に配置される。別の態様では、標的単離プローブのエキソヌクレアーゼ分解を防ぐために、標的単離プローブは、その３’末端及び／又はその５’末端において修飾される。別の態様では、標的単離プローブの３’末端でのライゲーションを防ぐために、標的単離プローブは、その３’末端で修飾される。別の態様では、５’末端での標的単離プローブのポリメラーゼ伸長を防ぐために、標的単離プローブは、その５’末端で修飾され、修飾は例えば、インバーテッド塩基(inverted base)、炭素リンカー、ホスホロチオエート結合又はジデオキシヌクレオチドから選択される。一態様において、増幅を防ぐために、標的単離プローブは、デオキシウラシル、内部炭素リンカー又は１以上のリボヌクレオチドを含有するように修飾される。

一態様では、二重鎖アダプターかヘアピンアダプターの二重鎖領域のいずれかが、標的配列の３’末端（３’アダプター）に、任意選択的に標的単離プローブの５’末端にライゲートされる。別の態様では、二重鎖アダプターかヘアピンアダプターの二重鎖領域のいずれかが、標的配列の５’末端（５’アダプター）に、場合によって標的単離プローブの３’末端にライゲートされる。

一態様では、アダプターは、ＮＧＳプラットフォーム特異的アダプター、単一ヌクレオチドオーバーハングを含有するアダプター、切断可能部位を有するＹ構造若しくはヘアピンアダプター、完全に相補的な二本鎖ＤＮＡ（ｄｓＤＮＡ）アダプター、又はライゲーション接合部の反対側に一本鎖ＤＮＡ（ｓｓＤＮＡ）オーバーハングを有するｄｓＤＮＡアダプターであり得る。別の態様では、３’アダプターの３’末端（標的配列の３’末端に連結するアダプター）は、ジデオキシヌクレオチドを含有することができ；及び／又は標的配列の３’末端へのライゲーションが意図されるアダプターの５’末端は、リン酸基を欠いており；及び／又は標的へのライゲーションが意図されていないアダプターの５’末端若しくは３’末端は、インバーテッドヌクレオチド(inverted nucleotide)を含有する。別の態様では、アダプター配列は、シーケンシングプライマー部位、ライブラリー増幅プライマー部位、一意なサンプル識別子、及び一意な分子識別子配列のうちの少なくとも１つを含む。

別の態様では、本方法は、アダプターにライゲートされた標的配列を増幅することを含む。増幅反応は、シーケンシングプラットフォームにより必要とされる配列などの、追加の配列をアダプターにライゲートされた標的に追加するプライマーを用いて実施することができる。標的配列は、定量され、配列決定され得る。

標的選択及び濃縮のための方法の概略図を示す。（１）は、一本鎖核酸又は熱変性二本鎖核酸の一本の鎖を示す。（２）は、（１）にハイブリダイズされた、標的単離プローブの３’末端と５’末端の間の位置であるが３’及び５’末端ではない位置で親和性ドメイン（

）に共有結合された標的単離プローブを示す。ここで、標的単離プローブは、標的核酸配列の全長にハイブリダイズされる。標的単離プローブは、エキソヌクレアーゼ分解、ライゲーション、及び／又はポリメラーゼ伸長を防ぐために、３’及び５’末端の一方又は両方に修飾を含むことができる。修飾には、次のうちの１以上が含まれ得る：インバーテッド塩基；炭素リンカー；ホスホロチオエート結合；及びジデオキシヌクレオチド。さらに、内部修飾としては、標的単離プローブの増幅を防ぐために、もう１つのｄＵ又は１以上のリボヌクレオチドなどが含まれ得る。（３）は、捕捉ドメイン（

）への（２）の結合を示す。捕捉ドメインに結合していない核酸は、洗浄によって除去される。（４）は、標的分子／標的単離プローブ二重鎖の３’及び５’末端の両方に二本鎖平滑末端をもたらす、１以上の３’及び５’一本鎖ＤＮＡエキソヌクレアーゼ若しくはＲＮＡエキソヌクレアーゼによる消化産物に該当する。３’及び５’消化は、共に又は連続して実施することができる。消化後、酵素及び緩衝液は、洗い流される。（５）は、アダプターが標的配列の各末端にライゲートされている標的核酸を示す。標的単離プローブへのライゲーションは、遮断される。ここで用いられるアダプターは、ＤＮＡ標的についてはＴ４ＤＮＡリガーゼなどのＤＮＡリガーゼを、又はＲＮＡ標的についてはＴ４ＲＮＡリガーゼ２などのＲＮＡリガーゼを使用して末端にライゲートされるＮＧＳプラットフォーム−特異的アダプター；単一ヌクレオチドオーバーハングを含むアダプター（クレノウ（エキソ−）を用いたｄＡのＤＮＡ標的上への付加など、単一ヌクレオチドによって伸長された３’末端にライゲートされている）；一意配列が標的ＤＮＡ又はＲＮＡの３’及び５’末端に特異的に追加され得るように切断可能部位を有する、Ｙ構造又はヘアピンアダプター；完全に相補的なｄｓＤＮＡアダプター、又はライゲーション接合部の反対側の末端にｓｓＤＮＡオーバーハングを有するｄｓＤＮＡアダプターであり得る。これらのアダプターは、標的単離プローブへのライゲーション及び／又はコンカテマー化を回避するために、標的核酸へのライゲーションが意図されていないアダプター終端上に、５’リン酸の非存在、インバーテッドヌクレオチド又はジデオキシヌクレオチドなどの１以上の修飾を含むことができる。標的ＤＮＡの３’末端にライゲートするアダプター鎖は、ライゲーションのために５’−リン酸を含有することができる。あるいは、プローブの３’末端及びそのアダプターの５’末端が修飾されないでライゲーションを阻害する場合、このアダプター鎖は、５’−リン酸を欠くことができる。この場合、プローブのアダプターへのライゲーションの後、ニックトランスレーションによってアダプター配列を標的の３’末端に追加することができる。次いで、ライゲートしていないアダプター、酵素、及び緩衝液は、洗い流される。一方又は両方のアダプターは、標的配列が由来する核酸サンプルを同定するための一意ＤＮＡ配列（ＵＩＤ）又は核酸サンプルが由来する個々の生物を同定するためのバーコードを含有し得る。ＵＩＤ及び／又はバーコードの使用は、多重化反応におけるサンプルの確認及び同定を容易にする。（６）は、固体支持体からの溶出後にアダプターにライゲートされた標的分子の、任意選択的なＰＣＲ増幅の産物に該当する。ＰＣＲ又はＲＴ−ＰＣＲを用いる場合、ＰＣＲプライマーは、シーケンシングプラットフォームによって必要とされる配列などの追加の配列を追加することもでき、又はアダプターに相補的な配列を含有するだけでもよい。あるいは、アダプターにライゲートされた標的分子が親和性ドメインにより固定化され、ひいては捕捉ドメインに結合される場合、固定化された標的分子は、固体又は半固体マトリックスから溶液への溶出を必要とせず、増幅反応に直接加えることができる。次いで、得られたライブラリーを定量化し、配列決定することができる。
図１に記載の、標的の選択及び濃縮のための方法についての変形例を示す。図２Ａ（７）-（１１）は、図１中の（１）−（３）の続きである。（７）は、一本鎖核酸又は親和性ドメインを有する標的単離プローブが結合されており、次に捕捉ドメインに結合された熱変性ランダム核酸断片の一本の鎖を示し、ここで３’非標的核酸は、３’二本鎖平滑末端を残す、１以上の３’一本鎖ＤＮＡエキソヌクレアーゼ又はＲＮＡエキソヌクレアーゼによって消化されている。消化後、酵素及び緩衝液を洗い流し、次いで３’末端に３’アダプターを付加する（８）。アダプターの構造は、（５）について記載したものと同じである。（９）は、標的核酸の５’末端又は標的核酸が凹陥するか若しくはオーバーハングを呈する末端で二本鎖の平滑末端を残す、１以上の５’一本鎖のＤＮＡエキソヌクレアーゼ又はＲＮＡエキソヌクレアーゼによる消化の産物を示す。消化後、酵素及び緩衝液は、洗い流される。標的分子の一部が付着末端を含有する場合、この末端は、ＤＮＡポリメラーゼ、ＲＮＡポリメラーゼ又は逆転写酵素によるプローブの３’末端の伸長又は消化によって平滑末端化され得る。伸長のために標準的なデオキシヌクレオチド又はリボヌクレオチドを使用することができ、又はデオキシウラシル三リン酸（ｄＵＴＰ）などの１以上の修飾されたヌクレオチド三リン酸（ＮＴＰ）、例えば、デオキシウラシル三リン酸（ｄＵＴＰ）を含有する混合物を使用して、後に任意の伸長配列を消化することができる。平滑末端化した後、酵素及び緩衝液は、洗い流される。上記（５）について記載したような５’アダプターは、標的分子（１０）の５’末端にライゲートされて、上記（６）について記載したようなＰＣＲ（１１）を可能にする。別法として、図２Ａに示す方法は、５’一本鎖核酸を除去し、まず５’アダプターのライゲーションの後、３’一本鎖核酸を除去し、３’アダプターのライゲーションを行うことにより実施することができる。図２Ｂは、図１に示す標的選択及び濃縮のための方法の変形例を示す。（１２）は、（１）からの続きであり、フラッププローブである親和性ドメインに共有結合されたフラップ標的単離プローブを示し、標的単離プローブの３’末端は、標的に相補的ではなく、ＮＧＳプラットフォーム−特異的アダプター配列の一部又は全部を含有する二本鎖ＤＮＡ領域を含有する。この二本鎖領域は、標的単離プローブの一本鎖領域の３’末端を、標的単離プローブの標的核酸へのハイブリダイゼーション前、最中又は後に、ＮＧＳアダプター配列に相補的な第二のオリゴヌクレオチドにハイブリダイズさせることにより形成することができる。あるいは、標的単離プローブは、切断可能部位を有するヘアピンを形成又はそれにライゲートされて、アダプター配列の一部又は全部にわたる二本鎖領域を生成し得る。二本鎖領域の３’末端は、標的単離プローブの３’末端で終結するか、又は１以上の塩基を越えて標的単離プローブへと伸長する。親和性ドメインは、ヘアピンプローブの３’末端を除いて、標的単離プローブ内の任意の位置に存在し得る。（１２）の分子は、捕捉ドメイン（１３）に固定化されている。（１４）は、図２Ａに記載のように達成されるアダプターライゲーション前の３’非標的核酸の消化産物を示す。標的分子上の５’一本鎖ＤＮＡは、ＦＥＮ−１などのフラップエンドヌクレアーゼにより切断されて、標的核酸とベイトの二本鎖領域との間でニックを生成する。ニックは、Ｔ４ＤＮＡリガーゼなどのリガーゼとライゲートされる。（１５）は、図１に示す通り、標的の、任意選択のＰＣＲの産物を示す。図２Ｃは、図１に記載の方法の変形例を示す。標的単離プローブにライゲートすることができない３’アダプター（例えば図１に記載のアダプターを参照）は、（４）の３’末端にライゲートされて（１６）を生成する。（１７）は、３’エキソヌクレアーゼ活性を有し、ジデオキシヌクレオチドなどの修飾を阻害するライゲーションを除去し、続いて３’アダプターを伸長して平滑末端を形成し、固定化された標的単離プローブから標的を放出することができるＤＮＡポリメラーゼ又は逆転写酵素による、アダプターの３’末端の伸長産物を示す。標準的なデオキシヌクレオチド又はリボヌクレオチドを伸長のために用いることができ、又はｄＵＴＰなどの１以上の修飾ＮＴＰを含有する混合物を使用して、後に任意の伸長された配列を消化することができる。伸長後、酵素及び緩衝液は、洗い流される。（１８）において、５’アダプター（例えば図１を参照）は、（１７）の５’末端にライゲートされる。１つのプローブとして標的単離プローブを利用し、第二のプローブとして小さな可変（ランダム）オリゴヌクレオチドを利用する標的選択及び濃縮のための２プローブ法を示す。（１９）は、より大きな核酸の機械的又は酵素的断片化の結果として生じる熱変性断片の一本の鎖であり得る一本鎖核酸を示す。（２０）は、標的配列の３’末端とハイブリダイズされ、親和性ドメインに共有結合された３’標的単離配列であり、親和性ドメインは標的単離プローブの５’末端でない位置にある。標的単離プローブは、エキソヌクレアーゼ分解、ライゲーション、及び／又はポリメラーゼ伸長を防ぐために、３’末端に修飾を含むことができる。修飾の例には、インバーテッド塩基、炭素リンカー、ホスホロチオエート結合、及びジデオキシヌクレオチドが含まれる。標的単離プローブは、エキソヌクレアーゼ分解を防ぐために、５’末端にホスホロチオエート結合などの修飾を含むことができる。さらに、内部修飾としては、プローブの増幅を防ぐために、もう１つのｄＵ又は１以上のリボヌクレオチドなどが含まれ得る。（２１）は、捕捉ドメインへの（２０）の固定化を示す。捕捉ドメインに結合していない核酸は、洗浄によって除去される。（２２）は、標的核酸／標的単離プローブ二重鎖の３’末端上に二本鎖平滑末端を残す、３’一本鎖ＤＮＡエキソヌクレアーゼ又はＲＮＡエキソヌクレアーゼによる消化産物である。消化後、酵素及び緩衝液は、洗い流される。（２３）は、３’標的配列及び標的単離プローブの５’末端に共有結合された切断可能部位（Ｘ）を有するヘアピンアダプターを示す。（２４）は、（２３）の標的核酸の５’領域にハイブリダイズされたランダムオリゴヌクレオチドを示す。（２５）は、平滑末端を形成するためのＤＮＡポリメラーゼ、ＲＮＡポリメラーゼ又は逆転写酵素によるランダムプライマーの３’末端の伸長産物である。標準的なデオキシヌクレオチド又はリボヌクレオチドを伸長のために用いることができ、又はｄＵＴＰなどの１以上の修飾ｄＮＴＰを含有する混合物を使用して、後に任意の伸長された配列を消化することができる。平滑末端化した後、酵素及び緩衝液は、洗い流される。（２６）は、（２５）に５’アダプターが（例えば図１に記載のようにして）結合されたものである。（２７）は、（２６）の増幅産物である。図４は、２つのプローブを利用する標的の単離及び濃縮のための方法を示す図であり、ここで第二のプローブは非ランダム配列を有する。（２８）は、（１９）−（２３）の産物であり、ここで第二のプローブは、ランダム配列を有する４−１０ヌクレオチドからなるオリゴヌクレオチドの代わりに、標的核酸の５’部分にハイブリダイズされる。５’プローブは、エキソヌクレアーゼ分解を防ぐために、５’末端にホスホロチオエート結合などの修飾を含むことができる。さらに、内部修飾としては、プローブの増幅を防ぐために、もう１つのｄＵ又は１以上のリボヌクレオチドなどが含まれ得る。（２９）では、５’非標的核酸は、１以上の５’一本鎖ＤＮＡ又はＲＮＡエキソヌクレアーゼにより除去されており、第二のプローブの３’末端の、任意選択の伸長又は消化がこれに続く。（３０）は、５’アダプターの（２９）への付加を示す。（３１）は、（３０）の増幅産物に該当する。代替的な態様では、図４に記載の方法は、最初に、親和性ドメインを含有する５’標的単離配列の標的核酸の５’部分におけるハイブリダイゼーション、それに続いて、非結合プローブの捕捉及び除去、５’非標的配列を除去するための５’エキソヌクレアーゼ消化、標的核酸の３’部分への３’第二プローブのハイブリダイゼーション前の５’アダプターのライゲーション及び１以上の３’エキソヌクレアーゼを用いた非標的配列の除去によって実施することができる。図４に記載の２プローブ法の変形例を示す。図５Ａは、工程（１９）−（２３）で始まり、それに工程（２８）−（２９）が続く方法を示す。（３２）は、標的核酸配列の３’末端にライゲートされたアダプターを有する標的核酸に該当する。標的核酸は、３’標的単離プローブにハイブリダイズされ、親和性ドメインは、標的単離プローブ内（ただし３’又は５’末端ではない）で共有結合される。３’標的単離プローブは、エキソヌクレアーゼ分解を防ぐために、３’及び／又は５’末端にホスホロチオエート結合などの修飾を含むことができる。内部修飾としては、標的単離プローブの増幅を防ぐために、もう１つのｄＵ又は１以上のリボヌクレオチドなどが含まれ得る。（３３）は、５’プローブを置換し、５’アダプターがライゲートされる平滑末端を生成する、（３２）における３’標的単離プローブの伸長産物を示す。（３５）は、増幅産物を示す。図５Ｂは、２つのプローブを伴う標的選択及び濃縮のための方法の変形例を示す。工程（１９）−（２３）の後、（３５）は、（図２Ｂに記載の）フラッププローブが親和性ドメインなしで標的領域の５’末端とハイブリダイズされる（２３）に該当する。（３６）は、ＦＥＮ−１などのフラップエンドヌクレアーゼによる標的分子上での５’一本鎖核酸の切断後の（３５）に該当し、標的核酸とプローブの二本鎖領域との間にニックを生成している。（３７）では、（３６）中のニックがＴ４ＤＮＡリガーゼなどのリガーゼとライゲートされる。（３７）は、溶出後の標的核酸の産物増幅である。５Ｂの変形例には、図２Ｂに記載のように、親和性ドメインを含有する５’標的単離プローブのハイブリダイゼーション、それに続くフラップエンドヌクレアーゼによる５’一本鎖核酸の捕捉及び除去、及び親和性ドメインが欠失した３’標的単離プローブのハイブリダイゼーションに先立つ、ニックのライゲーション、３’一本鎖核酸の除去及び３’アダプターのライゲーションが含まれる。図５Ｃは、２つのプローブを伴う標的選択及び濃縮のための方法の変形例を示す。（３８）は、（１９）の産物であり、親和性ドメインを含有する３’標的単離プローブと５プローブの両方又は３’プローブと親和性ドメインを含有する５’標的単離プローブの両方が単一反応において標的核酸配列にハイブリダイズされる。（３９）では、標的単離配列上の親和性結合ドメインは、標的配列を固定化する捕捉ドメインに結合する。（４０）は、標的核酸／標的単離プローブ二重鎖の３’及び５’両末端上に二本鎖平滑末端を残す、３’及び５’一本鎖ＤＮＡエキソヌクレアーゼ又はＲＮＡエキソヌクレアーゼによる消化産物である。３’及び５’消化は、共に又は連続して実施することができる。消化後、酵素及び緩衝液は、洗い流される。（４１）は、３’及び５’アダプターが付加されている（４０）である。（４２）は、（４１）の増幅産物である。図６Ａ−Ｄは、３’平滑末端化の効率を表すＡＢＩシーケンサーについての断片分析を示す図である。図６Ａは、３’−ビオチン化プローブにハイブリダイズされ、ストレプトアビジンビーズに結合し、２０ｎｔの３’オーバーハングを形成する５’−ＦＡＭ−標識オリゴヌクレオチドを模式的に示す図である。図６Ｂは、断片分析のためのＡＢＩシーケンサーからのクロマトグラム上の対応するピークを示す。図６Ｃは、３’ｓｓＤＮＡエキソヌクレアーゼ処理後の平滑末端化された５’−ＦＡＭ標識オリゴヌクレオチドを模式的に示す。図６Ｄは、図１Ｃに対応するピークを示す図であり、単一のピークが平滑末端化されたＤＮＡの存在と相関する。図７Ａ−Ｄは、３’−ＦＡＭ標識オリゴヌクレオチドを用いた５’平滑末端化の効率を示すシーケンサーについての断片分析を示す。３’−ＦＡＭ標識オリゴは、５’−ビオチン化プローブにハイブリダイズされ、ストレプトアビジンビーズに結合されて、２０ｎｔの５’オーバーハングを形成する。５’ｓｓＤＮＡエキソヌクレアーゼによるインキュベーション後、それに続いてビーズ洗浄により酵素を除去し、ＦＡＭ−標識オリゴをＮａＯＨ中で溶出し、断片分析のためのＡＢＩシーケンサーで実施する。図７及び図７Ｂは、出発物質を示す。図７Ｃ及び図７Ｄは、オーバーハングの消化の結果を示し、図中、平滑末端ｄｓＤＮＡ、４塩基オーバーハング、及び８塩基オーバーハングに相関する三つのピークが見られる。血小板由来成増殖因子受容体アルファ遺伝子（ＰＤＧＦＲＡ）中のエキソンの捕捉を示す。ビオチン化標的特異的プローブは、剪断されたＪｕｒｋａｔゲノムＤＮＡ（ｇＤＮＡ）にハイブリダイズされた。標的配列は、ストレプトアビジンビーズへの結合により捕捉され、ＢＷ緩衝液中での洗浄がそれに続いた。３’エキソヌクレアーゼを添加してｇＤＮＡ二重鎖であるプローブのｇＤＮＡ３’を除去し、その結果、プローブの５’末端が標的の３’末端を決定した。３’ｄＡ−テーリング及びアダプターライゲーションの後、ランダムプライマーは、ハイブリダイズされ、伸長されて５’平滑末端を形成し、５’アダプターのライゲーションがそれに続いた。ライブラリーは、ＰＣＲによって増幅され、ＩｌｌｕｍｉｎａＭｉＳｅｑ（登録商標）システム（カリフォルニア州サンディエゴのＩｌｌｕｍｉｎａ）で配列決定された。プラス及びマイナス鎖上の固定された３’末端及びランダム５’末端によるＰＤＧＦＲＡ標的の捕捉を示す。線維芽細胞増殖因子受容体遺伝子（ＦＧＦＲ２）中のエキソンの捕捉を示す。ビオチン化標的特異的プローブは、剪断されたＪｕｒｋａｔｇＤＮＡにハイブリダイズされた。標的は、ストレプトアビジンビーズへの結合により捕捉され、ＢｉｎｄａｎｄＷａｓｈ（ＢＷ）緩衝液中での洗浄がそれに続いた。３’エキソヌクレアーゼを添加して３’非標的ｇＤＮＡを除去し、ここでプローブの５’末端が標的の３’末端を決定した。３’ｄＡ−テーリング及びアダプターライゲーションの後、標的特異的５’プローブは、標的配列にハイブリダイズされ、５’ｓｓＤＮＡは、平滑末端又は小さな５’オーバーハングのいずれかを残すエキソヌクレアーゼにより消化された。プローブは、ＤＮＡポリメラーゼによって伸長されて平滑末端を形成し、５’アダプターのライゲーションがこれに続いた。標的配列は、ＰＣＲによって増幅され、ＩｌｌｕｍｉｎａＭｉＳｅｑで配列決定された。ＦＧＦＲ２標的配列の捕捉は、プラス及びマイナス鎖上の固定された３’及び５’末端により示される。標的選択及び濃縮のための方法の概略図を示す。（１）は、一本鎖核酸又は熱変性二本鎖核酸の一本の鎖を示す。（２）は、（１）にハイブリダイズされた標的単離プローブの３’末端と５’末端の間の位置であるが３’及び５’末端ではない位置で親和性ドメイン（

）に共有結合した標的単離プローブを示す。ここで、標的単離プローブは、標的核酸配列の３’末端にハイブリダイズされる。標的単離プローブは、エキソヌクレアーゼ分解、ライゲーション、及び／又はポリメラーゼ伸長を防ぐために、３’及び５’末端の一方又は両方に修飾を含むことができる。修飾には、次のうちの１以上が含まれ得る：インバーテッド塩基；炭素リンカー；ホスホロチオエート結合；及びジデオキシヌクレオチド。さらに、内部修飾としては、標的単離プローブの増幅を防ぐために、もう１つのｄＵ、内部炭素リンカー又は１以上のリボヌクレオチドなどが含まれ得る。（３）は、捕捉ドメイン（

）への（２）の結合を示す。捕捉ドメインに結合していない核酸は、洗浄によって除去される。（４）は、標的分子／標的単離プローブ二重鎖の３’末端上に二本鎖平滑末端をもたらす、一本鎖ＤＮＡを切断可能な３’エキソヌクレアーゼ活性を有する１以上の酵素による消化産物に該当する。３’エキソヌクレアーゼを有する酵素は、エキソヌクレアーゼＩ、エキソヌクレアーゼＴ、又は３’エキソヌクレアーゼ活性を有する１以上のＤＮＡポリメラーゼを含み得る。消化後、酵素及び緩衝液は、洗い流される。（５）は、アダプターが標的配列の３’末端にライゲートされている標的核酸を示す。ここで使用されるアダプターは、ＤＮＡ標的についてはＴ４ＤＮＡリガーゼなどのＤＮＡリガーゼを、ＲＮＡ標的についてはＴ４ＲＮＡリガーゼ２などのＲＮＡリガーゼを使用して末端にライゲートされるＮＧＳプラットフォーム特異的アダプター；単一ヌクレオチドオーバーハングを含むアダプター（この場合、アダプターのライゲーションの前に、クレノウ（エキソ−）などの３’エキソヌクレアーゼ活性を欠くＤＮＡポリメラーゼによって単一の非鋳型ヌクレオチドが標的に添加されるであろう）；一意であるように切断可能部位を有するＹ構造又はヘアピンアダプター；完全に相補的なｄｓＤＮＡアダプター、又はライゲーション接合部の反対側の末端にｓｓＤＮＡオーバーハングを有するｄｓＤＮＡアダプターであり得る。このアダプターは、標的単離プローブへのライゲーション及び／又はコンカテマー化を回避するために、標的核酸へのライゲーションが意図されていないアダプター終端上に、ジデオキシヌクレオチド、５’リン酸の非存在又はインバーテッドヌクレオチドなどの１以上の修飾を含むことができる。標的ＤＮＡの３’末端にライゲートするアダプター鎖は、ライゲーションのために５’−リン酸を含有することができる。あるいは、プローブの３’末端及びそのアダプターの５’末端が修飾されないでライゲーションを阻害する場合、このアダプター鎖は、５’−リン酸を欠くことができる。この場合、プローブのアダプターへのライゲーションの後、ニックトランスレーションによってアダプター配列を標的の３’末端に追加することができる。次いで、ライゲートしていないアダプター、酵素、及び緩衝液は、洗い流される。アダプターは、標的配列が由来する核酸サンプルを同定するためのＵＩＤ又は核酸サンプルが由来する個々の生物を同定するためのバーコードを含有し得る。ＵＩＤ及び／又はバーコードの使用は、多重化反応におけるサンプルの確認及び同定を容易にする。（６）は、３’エキソヌクレアーゼ活性を有するポリメラーゼを用いて平滑末端を形成するか、又は３’エキソヌクレアーゼ活性なしのポリメラーゼを用いて単一ヌクレオチドの３’オーバーハングを有する末端を形成するための、ＤＮＡポリメラーゼによるプローブの３’伸長に該当する。伸長は、標準的なデオキシヌクレオチドを用いて実施することができ、又は修飾デオキシヌクレオチド（例えばｄＵＴＰ）を含有することができる。ｄＵＴＰなどの修飾デオキシヌクレオチドの使用は、ＰＣＲ増幅に先立って伸長産物の除去を可能にする。（７）は、アダプターが標的配列の５’末端にライゲートされている標的核酸を示す。ここで用いられるアダプターは、ＤＮＡ標的についてはＴ４ＤＮＡリガーゼなどのＤＮＡリガーゼを、又はＲＮＡ標的についてはＴ４ＲＮＡリガーゼ２などのＲＮＡリガーゼを使用して末端にライゲートされるＮＧＳプラットフォーム−特異的アダプター；単一ヌクレオチドオーバーハングを含むアダプター（クレノウ（エキソ−）を用いた非鋳型ヌクレオチドのＤＮＡ標的上への添加など、単一ヌクレオチドによって伸長された３’末端にライゲートされている）；一意であるように切断可能部位を有する、Ｙ構造又はヘアピンアダプター；完全に相補的なｄｓＤＮＡアダプター、又はライゲーション接合部の反対側の末端にｓｓＤＮＡオーバーハングを有するｄｓＤＮＡアダプターであり得る。このアダプターは、標的単離プローブへのライゲーション及び／又はコンカテマー化を回避するために、標的核酸へのライゲーションが意図されていないアダプター終端上に、ジデオキシヌクレオチド、５’リン酸の欠失又はインバーテッドヌクレオチドなどの１以上の修飾を含むことができる。次いで、ライゲートしていないアダプター、酵素、及び緩衝液は、洗い流される。アダプターは、標的配列が由来する核酸サンプルを同定するためのＵＩＤ又は核酸サンプルが由来する個々の生物を同定するためのバーコードを含有し得る。ＵＩＤ及び／又はバーコードの使用は、多重化反応におけるサンプルの確認及び同定を容易にする。任意選択のＰＣＲ増幅は、固体支持体からの溶出後にアダプターにライゲートされた標的分子を使用して実施することができる。ＰＣＲ又はＲＴ−ＰＣＲを用いる場合、ＰＣＲプライマーは、シーケンシングプラットフォームによって必要とされる配列などの追加の配列を追加することもでき、又はアダプターに相補的な配列を含有するだけでもよい。あるいは、アダプターにライゲートされた標的分子が親和性ドメインにより固定化され、ひいては捕捉ドメインに結合される場合、固定化された標的分子は、固体又は半固体マトリックスから溶液への溶出を必要とせず、増幅反応に直接加えることができる。次いで、得られたライブラリーを定量化し、配列決定することができる。

本明細書に記載の方法及び組成物は、特に主張されていない限り、本明細書に記載された特定の方法又は試薬に限定することが意図されているのではなく、単に例として示されるにすぎない。説明のための例示的な用途に関して、いくつかの態様を後述する。方法ステップが当業者に周知の標準的な方法を伴う場合、そのような方法ステップは、詳述していない。本願では、特に断りのない限り、単数形の使用には複数形が含まれる。「含まれる（included）」は、限定するものではなく、「含む（comprising）」と同等の意味を有する。用語「約」又は「およそ」は、当業者によって決定される特定の値について許容される誤差の範囲内を意味し、これは、いかにしてその値が測定又は決定されるかに部分的に依存する。特定の値が本願及び特許請求の範囲に記載されている場合、用語「約」は、特に明記しない限り、特定の値について許容される誤差の範囲内を意味する。用語「近傍（の）」は、記載された特徴部に隣接している、又はその付近の位置を指す。例えば、プローブが標的配列の決定された末端にハイブリダイズするその位置に関して「近傍の」が使用される場合、用語「近傍の」は、記載された特徴部から１０ヌクレオチド未満を指し得る。用語「遠位の」は、記載された特徴部の近傍の位置ではなく、その位置が近傍である場合よりも遠い部位にある位置を指す。

概して、核酸サンプルから標的核酸配列を濃縮して、標的が濃縮された核酸ライブラリーを作製するための方法が、本明細書で提供される。核酸に関する「標的濃縮」という用語は、サンプル中の特定の核酸種の相対濃度を高めることを指すものとする。

本明細書に記載の濃縮法によって、次の特徴の１つ以上が達成され得る：二重鎖核酸の両方の標的鎖を分析して希少なＳＮＰの信頼性を高めること；リード開始点を特定する能力、ＧＣ含有量に関わらず正規化されたプローブプールの生成、反復領域を標的化する能力、標的部位の検出の全体効率の改善、捕捉前の標的の喪失の回避、標的領域外のＤＮＡ損傷とは無関係の標的のライブラリー調製、標的領域にわたる複数のプローブの必要性の低減、プローブ対間のより大きな挿入及び欠失（インデル）の捕捉、最適なクラスター形成のための狭いサイズ分布内でのライブラリーの生成、標的配列に含有される非標的塩基のパーセンテージの低下；必要なシーケンスリード長及び必要なシーケンスカバレッジの深度の最小化、濃縮の均一性向上並びに煩雑さ及び時間の低減、及びハイブリダイゼーションに基づく既存の標的濃縮方法と比較したライブラリーの調製。

精製されてはいるが処理されていないか又は修飾されていない核酸は、本明細書において核酸サンプルと称される。核酸サンプルは、その中から標的配列又は標的分子が濃縮される集団中の核酸分子又は核酸の集団に任意選択的に断片化することができる。

本明細書で使用される「核酸サンプル」という用語は、標的及び非標的配列を含有する任意の供給源から得られたＤＮＡ若しくはＲＮＡ又はＤＮＡ及びＲＮＡ分子若しくは配列の混合物を指す。核酸サンプルは、例えば人工供給源から、又は化学合成によって、又はウイルス、微生物を含む原核細胞若しくは真核細胞から得ることができる。生体サンプルは、ヒトを含めた又はヒトを除く脊椎動物、無脊椎動物、植物、微生物、ウイルス、マイコプラズマ、真菌又は古細菌（ａｎｃｉｅｎｔ）であり得る。生体液には、血液、唾液、脳脊髄液、胸膜液、乳、リンパ液、痰、精液、骨髄、細針吸引物等、固形物（例えば大便）が含まれる。真核細胞サンプルには、胚組織、生検組織若しくは死体組織、組織、組織培養、生検、臓器又は他の生物学的、農業的若しくは環境的な供給源が含まれる。核酸サンプルを得るためには、細胞はまず、例えば高速度で小さなビーズを使用することによって物理的に、又は例えば洗浄剤及び他の界面活性剤を使用することによって化学的に破壊するか又は分解することができる。アルコール又は他の化学物質を用いて、核酸を沈殿させることができる。

核酸サンプルは、全ゲノム配列、ゲノム配列の一部、染色体配列、葉緑体配列、ミトコンドリア配列、ポリメラーゼ連鎖反応（ＰＣＲ）産物、全ゲノム増幅産物又は「増幅」の下に列挙される他の増幅プロトコール、ｃＤＮＡ配列、ｍＲＮＡ配列、ノンコーディングＲＮＡ（ｎｃＲＮＡ）又は全トランスクリプトーム配列、エキソン、長末端反復領域（ＬＴＲ）、イントロン領域、及び制御配列を含み得る。これらの例は、本発明の態様に適用可能なサンプルの種類を限定するものと解釈されるべきではない。

核酸サンプルは、集団中の核酸分子のサブセットが濃縮のための標的配列を含有し得る核酸の集団を生じ得る。核酸の集団は、例えば、酵素的、機械的又は化学的手段を用いるランダム切断の産物；制限酵素などの酵素を用いて一般に達成される非ランダム又はバイアス切断(biased cleavage)の産物；切断又は断片化が必要とされないような適切なサイズ；又は環境損傷の産物であり得る。核酸の集団は、標的濃縮のための標的単離プローブと組み合わせて用いられる。

ランダム切断は、例えばＦｒａｇｍｅｎｔａｓｅ（登録商標）（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）、ＤＮＡｓｅＩ及びＢｅｎｚｏｎａｓｅ（登録商標）（ニュージャージー州ギブスタウンのＥＭＤ）又は他の種類のヌクレアーゼなど、単一のヌクレアーゼ又はそれらの組み合わせを含む酵素的方法によって達成することができる。Ｆｒａｇｍｅｎｔａｓｅは、時間依存的にｄｓＤＮＡ切断をもたらして、１００ｂｐから８００ｂｐのＤＮＡ断片を生成するエンドヌクレアーゼである。Ｂｅｎｚｏｎａｓｅは、セラチア属マルセッセンス(Serratia marcescens)由来の遺伝子操作されたエンドヌクレアーゼであり、ＤＮＡとＲＮＡの両方を効率的に切断することができる。他の酵素的方法には、Ｖｖｎヌクレアーゼ単独又はセラチアヌクレアーゼ又はＤＮａｓｅＩ又は当技術分野の他のヌクレアーゼ、例えばＳｈｅａｒａｓｅ^ＴＭ（カリフォルニア州アーバインのＺｙｍｏＲｅｓｅａｒｃｈ）又はＩｏｎＳｈｅａｒ^ＴＭ（ニューヨーク州グランドアイランドＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）の使用が含まれる。ＤＮＡが断片化後に変性するため、ニッキング酵素を用いることができる。

化学的手段には、ＲＮＡを分解するためのマグネシウム又は亜鉛イオンの使用が含まれる。例えば、超音波処理、噴霧、物理的剪断及び加熱などの物理的手段を使用することができる。工業用の機械的剪断方法の例は、Ｃｏｖａｒｉｓ（マサチューセッツ州ウォバーン）によって提供されている。

環境的な核酸損傷は、例えば保存中に若しくは経年によって、あるいは化学的に誘発される切断、酵素によって誘発される切断又は温度若しくは時間の適用による切断などの断片化方法の適用によって生じ得る。用語「損傷ＤＮＡ」は、別段の記載がない限り、任意のインデル、任意のＳＮＰ、エピジェネティックな制御に関連しない任意の修飾塩基、標的ＤＮＡに対する任意のさらなる修飾を指すことが意図されている。様々なタイプのＤＮＡ損傷が、参照により援用される米国特許第７７００２８３号及び米国特許第８１５８３８８号に記載されている。ＤＮＡ損傷の例は、保存された組織又は細胞から単離され、ホルマリン固定パラフィン包埋（ＦＦＰＥ）に起因して品質が低下したＤＮＡである。集団中の核酸は、より大きな核酸の断片であってもそうでなくてもよい。

標的配列は、核酸の集団において生じ得る。用語「標的配列」は、特別な科学的、医学的又は農業的関連性を有する核酸中の対象とする領域を一般に指す。「標的分子」は、プローブなどにハイブリダイズする独立した化学実体である。これらの用語は、互換可能に用いられる場合もあり、これらの用語の意味は、その用語が用いられる文脈によって明らかになるであろう。標的核酸がＤＮＡである場合、ｇＤＮＡなどの大きなＤＮＡの断片は、標的配列が濃縮されている核酸の集団を部分的に又は実質的に形成することができる。この例では、対象とする標的配列は、核酸サンプルのサブセットのみであり、したがって濃縮が望ましい。

標的配列は、核酸分子全体であっても核酸分子の一部であってもよい。標的配列は、エキソン配列、突然変異の周囲の核酸配列の短いストレッチ、１又は複数の反復配列、ｃＤＮＡ配列、イントロン配列及び制御配列のうちの１以上を含み得る。対象とする特徴の例には、単一のＳＮＰ、遺伝子融合、コピー数の変化、及び／又はインデルが含まれる。統計学的に意味がある場合、これらの特徴は、生物学的有意性のある表現型と相関する可能性がある。標的分子は、１つ以上の疾患、対象とする表現型、代謝経路の調節又は同族核酸若しくはその他の核酸に関連する配列を有し得る。標的分子は、ＤＮＡ配列の連続的な領域又はＤＮＡ配列の集合（例えばｃＤＮＡ配列）を含み得る。標的分子は、ｍＲＮＡ又はｎｃＲＮＡなどのＲＮＡ分子であってもよい。ＲＮＡ標的分子の例には、リボソームＲＮＡ（ｒＲＮＡ）、メッセンジャーＲＮＡ（ｍＲＮＡ）、サイレンシングＲＮＡ（ｓｉＲＮＡ）、核内低分子ＲＮＡ（ｓｎＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）、短鎖干渉ＲＮＡ（ｓｉＲＮＡ）又は長鎖非コードＲＮＡ（ＩｎｃＲＮＡ）が含まれる。

核酸の集団中の個々の核酸は、一般に核酸の集団内に含有される標的配列と同じサイズか又はそれよりも大型である。集団中の核酸のサイズ又は標的配列のサイズに関して上限はない。しかしながら、大きな分子を取り扱う効率及び濃縮された標的配列を配列決定するシーケンシングプラットフォームの能力が、サイズを限定することはあり得る。大きな核酸中の標的配列、例えば生検サンプルからのウイルスゲノムは、５０００ヌクレオチド（ｎｔ）の大きさであっても、１０，０００ｎｔ又はそれ以上の大きさであってもよい。標的配列の長さは、ゲノム又は大型ｍＲＮＡにおいて生じる５００ヌクレオチド未満であり得る。例えば、標的配列が１００ｎｔから２００ｎｔの範囲の場合、核酸の集団の個々のメンバーは、およそ５００ｎｔであり得る。インタクトなｇＤＮＡ又はＲＮＡは、標的濃縮に適したサイズに断片化することができる。標的配列の長さは、断片サイズを決定するための一つの基準である。例えば、標的配列は、完全な標的領域の捕捉に都合のよい長さである、少なくとも１００ｂｐから１０００ｂｐまで、例えば２００ｂｐから８００ｂｐ、例えば３００ｂｐから７００ｂｐ、例えば１００ｂｐから３００ｂｐ、又は１００ｂｐから４００ｂｐ、又は１００ｂｐから５００ｂｐであり得る。ほとんどのエキソンは、２００ｂｐ未満である。本明細書に記載の方法は、修飾されたヌクレオシドを利用して、次の特徴の少なくとも１つを達成する：他の特徴の中でもとりわけ、ハイブリダイゼーション特異性又は二重鎖の安定性の増強、ヌクレアーゼ耐性の増加、酵素切断のための部位を導入すること、酵素ライゲーションを阻害すること、酵素伸長を阻害すること又はポリメラーゼの増幅を防止すること。

所期の目的に従って選択される修飾されたヌクレオシドの使用の例は、表１に記載されている。本明細書で使用される「ヌクレオシド」という用語は、例えばＫｏｒｎｂｅｒｇら、ＤＮＡＲｅｐｌｉｃａｔｉｏｎ，２ｎｄＥｄ．Ｆｒｅｅｍａｎ，ＳａｎＦｒａｎｃｉｓｃｏ（１９９２）に記載されているような、２’−デオキシ及び２’−ヒドロキシル形態を含む天然のヌクレオシドを含む。ヌクレオシドに関して「類似体」又は「修飾されたヌクレオシド」は、例えばＳｃｈｅｉｔ，ＮｕｃｌｅｏｔｉｄｅＡｎａｌｏｇｓ，ＪｏｈｎＷｉｌｅｙ，ＮｅｗＹｏｒｋ（１９８０）；Ｕｈｌｍａｎら、ＣｈｅｍｉｃａｌＲｅｖｉｅｗｓ，９０：５４３−５８４（１９９０），Ｃｒｏｏｋｅら、Ｅｘｐ．Ｏｐｉｎ．Ｔｈｅｒ．Ｐａｔｅｎｔｓ，６：８５５−８７０（１９９６）；Ｍｅｓｍａｅｋｅｒら、ＣｕｒｒｅｎｔＯｐｉｎｉｏｎｉｎＳｔｒｕｃｔｕａｌＢｉｏｌｏｇｙ，５：３４３−３５５（１９９５）などに記載されている、修飾された塩基部分及び／又は修飾された糖部分を有する合成ヌクレオシドを含む。改善された二重鎖安定性を有するいくつかの又は多くの類似体を含むプローブ又はアダプターの使用には、オリゴヌクレオチドＮ３’−

Ｐ５’ホスホルアミデート（本明細書において「アミデート」と称される）、ペプチド核酸（本明細書において「ＰＮＡ」と称される）、オリゴ−２’−Ｏ−アルキルリボヌクレオチド、Ｃ−５プロピニルピリミジンを含有するポリヌクレオチド、ロックド核酸（「ＬＮＡ」）、及び同様の化合物が含まれる。そのようなオリゴヌクレオチドは、市販されており、又は文献に記載の方法を用いて合成することができる。修飾されたヌクレオシド（例えばｄＵ又は８−オキソ−Ｇ）を選択して、特異的な酵素（ウラシルデグリコシラーゼ又はエンドヌクレアーゼＶＩＩＩを有するｆｐｇ）による類似体の部位でのオリゴヌクレオチドの切断を可能にするか、又はＤＮＡポリメラーゼ（例えばｒＮＭＰ）による増幅を防ぐことができる。修飾されたヌクレオシドは、ライゲーションを可能にするか又はブロックするために、プローブ又はアダプターの終端に配置することもできる。例えば、ライゲーションが望まれない場合、プローブ又はアダプターの５’末端又はその両方が非リン酸化されても脱リン酸化されてもよく、また３’末端がジデオキシヌクレオシド、インバーテッドヌクレオシド又は付着部分を有するか又は有しない炭素リンカーでキャッピングされ得る。オリゴヌクレオチドの５’末端をリン酸で修飾することにより、ライゲーションが可能になる。さらに、ジデオキシヌクレオシド、インバーテッドヌクレオシド又は炭素リンカーを含むがこれらに限定されない３’修飾をプローブ又はアダプターに組み込んで、ポリメラーゼによる３’伸長を防ぐことができる。アダプター、プライマー、標的単離プローブ又は１以上のホスホチオエートのような第二のプローブ上の３’及び／又は５’修飾を利用して、エキソヌクレアーゼ消化を防ぐことができる。

本方法の態様における修飾されたヌクレオシドの使用の具体例には、例えば図１、２Ａ、２Ｂ、２Ｃ又は５Ｃに示すように、アダプターの３’末端でのライゲーションをブロックするためのジデオキシヌクレオシドの使用が含まれる。ライゲーションをブロックするための３’修飾を、図１及び５Ｃの標的単離プローブに加えることができる。第二のプローブ上の３’修飾は、図４及び図５Ａ−Ｃに示すように、ライゲーションをブロックすることができる。図２Ｃのアダプターの３’末端及び図５Ａに示す標的単離プローブの３’末端でのジデオキシ修飾されたヌクレオシドの添加は、ライゲーションを阻害するが、その後の、３’エキソヌクレアーゼ活性を有する逆転写酵素又はＤＮＡポリメラーゼによる３’末端の伸長を可能にする。さらに、親和性ドメイン及び捕捉ドメインは、標的単離配列の３’終端ヌクレオチドに結合している大きな実体である（図３、４、５Ｂ及び５Ｃを参照）。３’末端の親和性結合分子は、プローブライゲーション及び伸長を防ぐための別個のブロッキング実体(blocking entity)として作用し得る。さらに、捕捉ドメインに結合された親和性結合分子は、図３、４、及び５Ｂ−Ｃに示すように、部分標的配列へのアダプターのライゲーションを立体的に阻止することができる。本方法の一態様において、３’プローブは、５’エキソヌクレアーゼ処理の前にアダプターにライゲートさせることができ、したがって５’エキソヌクレアーゼ活性から保護されるため、２プローブ法では、任意選択で５’リン酸化以外に５’修飾を必要としない。その一方、プローブの増幅可能なライブラリーへの変換を防ぐために、単一プローブ法では、プローブの３’末端上のライゲーションを防ぐことが望ましい。

標的配列の境界は、１以上のプローブによって好ましくは決定される。本方法は、標的単離プローブを利用し、一本鎖分子又はフラッププローブであり得る第二のプローブをさらに含み得る。この方法は、小さなランダム配列オリゴヌクレオチド及び／又は除去可能なブロッキングオリゴヌクレオチドをさらに利用することができる。本明細書で使用される「プローブ」という用語は、濃縮のために同定された標的配列の領域に相補的である既知の配列を有する一本鎖ポリヌクレオチドを指す。プローブは、オリゴヌクレオチドであってもよく、「オリゴヌクレオチド」は、核酸合成機により合成され得る長さの合成核酸を指す。あるいは、オリゴヌクレオチドは、天然に存在する、単離及び精製された、任意選択的に断片化された一本鎖核酸であり得、又は部分的に一本鎖かつ部分的に二本鎖であり得る。オリゴヌクレオチドは、ＤＮＡ、ＲＮＡ又はその両方であり得る。

プローブのサイズは、標的配列と同じ長さであってもそれより短くてもよい。例えば、プローブは、１０，０００ｎｔも含むことができるが、より一般的には５００ｎｔ未満の長さである。プローブの長さの例は、１０ｎｔ−２００ｎｔ、２５ｎｔ−２００ｎｔ、１０ｎｔ−１５０ｎｔ、１０ｎｔ−１００ｎｔ、１０ｎｔ−７５ｎｔ又は１０ｎｔ−５０ｎｔを含む。プローブは、好ましくは、２５ｎｔ−２００ｎｔの長さを有する。１回の濃縮で利用されるプローブのプールは、好ましくはサイズが同じか又は類似している。

本明細書で使用する「標的単離プローブ」という用語は、決定された長さ及び配列の核酸を指し、合成であってもよい。標的単離プローブは、親和性結合分子と結合し、固体又は半固体基質の上又は中で捕捉ドメインを介して固定化され得る。標的単離プローブは、１プローブ法及び２プローブ法において標的領域の少なくとも一方の末端を決定する。図１及び２Ａ−Ｃに記載の１プローブ法において、標的単離プローブは、標的配列の両端を決定する。標的単離プローブは、ＤＮＡ、ＲＮＡ又はその両方であってもよく、１以上の修飾されたヌクレオシドをさらに含有していてもよい（例えば表１を参照）。標的単離プローブは、３’標的配列とアダプターとの間のライゲーションを可能にしながら、二本鎖アダプターのプローブの５’末端へのライゲーションを阻害するように、５’末端にリン酸を欠いていてもよい（例えば図１、２Ａ−Ｃ、及び図５Ｃを参照）。標的単離プローブは、二本鎖アダプターへのライゲーションを容易にするために５’リン酸を含んでもよい（例えば図３、４、５Ｂを参照）。標的単離プローブの３’末端は、３’プローブ末端とアダプターの５’末端との間のライゲーションをブロックするように修飾することができる。標的単離プローブはまた、Ｔｍを増加させ、プローブの標的配列へのハイブリダイゼーションを安定化させるためにＬＮＡを含有することもできる。

３’標的単離プローブと結合する親和性ドメインは、３’末端に、又は３’末端と５’末端との間であるが好ましくは３’標的単離プローブの５’末端ではない場所に配置され得る。５’標的単離プローブと結合する親和性ドメインは、５’末端に、又は３’末端と５’末端との間であるが好ましくは５’標的単離プローブの３’末端ではない場所に配置され得る。標的単離プローブが標的配列の３’末端及び５’末端の境界を決定する場合、親和性ドメインは、プローブの両末端の間であって、両末端ではない場所に好ましくは配置される。

標的単離プローブが標的配列の３’末端にハイブリダイズする場合、標的配列の５’末端に相補的な配列を特徴とする第二のプローブが、標的配列の５’末端を決定するために使用され得る。あるいは、標的単離プローブが５’末端にハイブリダイズする場合、第二のプローブは、３’末端にハイブリダイズし得る。

一例では、標的単離プローブが標的配列の３’末端にハイブリダイズされた後に、第二のプローブが優先的に加えられ、エキソヌクレアーゼ消化及び標的単離プローブに相補的な配列に隣接する非標的核酸の除去がそれに続く。第二のプローブを標的配列にハイブリダイズさせることの利点は、記載した方式での二の標的特異的プローブの使用によって偽陽性の可能性が低くなることである。あるいは、標的単離プローブ及び第二のプローブは、核酸の集団に同時に加えられ、それにより標的配列の一方又は両方の末端における非標的核酸配列のエキソヌクレアーゼ消化の前に、標的領域の３’末端及び５’末端を決定することができる。

「フラッププローブ」という用語は、標的核酸にハイブリダイズする一本鎖部分と一本鎖領域の３’末端から伸長する非ハイブリダイズ二本鎖領域とを含有する合成核酸を指す。標的分離プローブは、図２Ｂに例示するような１プローブ法において標的領域の両端を決定する場合、又は図５Ｂに例示するような２プローブ法において標的領域の５’末端を決定する場合、フラッププローブであり得る。フラッププローブの二重鎖の３’末端は、ヘアピン構造により、又は短い３’−５’相補的オリゴヌクレオチドにより形成され得る。Ｆｅｎ−１などのフラップエンドヌクレアーゼは、フラッププローブの一本鎖領域の３’末端の反対側の部位において標的の５’末端を切断し、かつ５’非標的配列をも除去する。ニックのライゲーションは、３’ヘアピン配列の追加又はフラッププローブの３領域に相補的な鎖のライゲーションをもたらす。二重鎖の３’領域は、標的配列の５’末端にライゲートされる場合、アダプターとして働くことができ、ＮＧＳプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位並びに／又はサンプル同定のためのバーコード及び／若しくはＵＩＤなどのアダプターに日常的に組み込まれる配列要素を含み得る。

前述の１又は２のプローブの使用に加えて、核酸の集団中に反復配列が存在するかもしれない場合、除去可能なブロッキングオリゴヌクレオチドを用いることができる。「除去可能なブロッキングオリゴヌクレオチド」という用語は、短い核酸配列、例えばブロッキング核酸が標的又は非標的配列にハイブリダイズしながら消化されることが可能である、その長さ全体にわたる修飾塩基を有するＤＮＡ又はＲＮＡｓｅＨ消化を受けやすいＲＮＡなどを指す。ブロッキングＲＮＡを用いる場合、これは、反復配列に富むＤＮＡ（すなわちＣＯＴ−１ＤＮＡ）からコピーされたｃＲＮＡ又は反復ＤＮＡ配列をコード化する合成ＲＮＡに由来し得る。まれな状況では、反復領域が、標的核酸配列内に含有される。より一般的には、一つの反復配列又は複数の反復配列が、非標的ＤＮＡ全体に生じる。除去可能なブロッキングオリゴヌクレオチドを加熱して、変性させ、次いで冷却して、核酸の集団へのハイブリダイゼーションを可能にすることができる。標的単離プローブ及び任意選択的に第二のプローブとのハイブリダイゼーション後、除去可能なブロッキングオリゴヌクレオチドは、ＲＮａｓｅＨＩにより、又は反応混合物中で５’及び／又は３’エキソヌクレアーゼと任意選択的に合わせることができる他の適切な酵素により切断される。

標的単離プローブに加えて、第二のプローブの代わりに、１０ｎｔ未満、例えば４ｎｔ、５ｎｔ、６ｎｔ、７ｎｔ、８ｎｔ又は９ｎｔの長さのランダム配列（ＮＮＮＮなど）を有するオリゴヌクレオチドは、標的配列の一本鎖領域にハイブリダイズし得る。この短いオリゴヌクレオチドは、３’末端で伸長させて、そこにアダプターをライゲートさせるのに適した平滑末端又は付着端を形成することができる。

核酸集団内の標的配列の、標的単離プローブ中の相補的配列へのハイブリダイゼ―ションの後、二重鎖は、固体又は半固体マトリックスに結合した捕捉ドメインによって固定化することができる。一旦固定化されると、任意の非ハイブリダイズ核酸は洗浄により除去することができ、その結果、固定化された核酸は、標的配列について濃縮される。

非標的ＤＮＡを除去するために必要なこの洗浄工程は、工業的に利用可能なハイブリダイゼーション濃縮方法により用いられる洗浄工程よりもストリンジェンシーが低い可能性がある。なぜなら、そのような方法は、非標的分子を排除して標的分子を濃縮するために、ハイブリダイゼーション温度、洗浄温度、及び洗浄緩衝液のストリンジェンシーに依存しているためである。その結果、そのような方法は、厳格なＴｍ範囲のプローブ及び慎重に制御された洗浄条件を必要とする。本明細書に記載の方法は、完全に結合していないライブラリー断片を除去するために洗浄が必要とされるにすぎないため、プローブについてはかなり広いＴｍ範囲及びよりストリンジェントではない洗浄を許容する。本方法の高い特異性は、正確な標的配列がプローブにハイブリダイズされる場合には、ライゲートさせることができる平滑末端を生成するにすぎない次の工程でのエキソヌクレアーゼの使用により達成される。

「相補的」又は「実質的に相補的」とは、例えば二本鎖ＤＮＡ分子の２本の鎖の間又は核酸の一本鎖領域上のオリゴヌクレオチドプローブ若しくはプライマーとプローブ若しくはプライマー結合部位との間など、ヌクレオチド間又は核酸間に二重鎖を形成するためのハイブリダイゼーション又は塩基対合を可能にする核酸分子の配列を意味する。一般に、相補的ヌクレオチドは、ＡとＴ（若しくはＡとＵ）又はＣとＧである。２の一本鎖ＲＮＡ又はＤＮＡ分子は、一方の鎖のヌクレオチドが最適に整列して比較され、適切な、潜在的な、認識された又は表現型的に意味のあるヌクレオチドの挿入又は欠失を有し、対が他方の鎖のヌクレオチドの少なくとも約５０％又は少なくとも８０％、又は少なくとも約９０％から９５％、より好ましくは約９８％から１００％を有する場合、実質的に相補的であると言われる。あるいは、ＲＮＡ鎖又はＤＮＡ鎖が選択的ハイブリダイゼーション条件下でその補体にハイブリダイズして、安定した二重鎖を形成する場合、実質的相補性が存在する。通常、選択的ハイブリダイゼーションは、少なくとも１４ｎｔから２５ｎｔのストレッチにわたって少なくとも約６５％の相補、好ましくは少なくとも約７５％、より好ましくは少なくとも約９０％の相補がある場合に起こる（Kanehisa,Nucleic Acids Res., 12:203 (1984)参照）。特異的なハイブリダイゼーションは、プローブと核サンプルとの間で達成することができ、核酸サンプル及びプローブの少なくとも一部が一本鎖であり、ハイブリダイゼーションに利用可能である。プローブの一部は、二本鎖であり得、したがって標的配列とのハイブリダイゼーションに利用可能ではない。一本鎖領域は、熱変性又は当該技術分野で周知の他の手段によって、二重鎖中内で又は二重鎖から形成され得る。

本方法の一態様において、標的単離プローブのハイブリダイゼーションは、好ましくは溶液中で行われる。ハイブリダイゼーションの条件は、ハイブリダイゼーション配列内のミスマッチが許容され得るという意味で比較的緩和され得る。例えば、ＴｉｑｕｉａらのＢｉｏＴｅｃｈｎｉｑｕｅｓ，６：６６４−６７５（２００４）又はＪｏｈｎらのＢｉｏＴｅｃｈｎｉｑｕｅｓ，４４：２５９−２６４（２００８）などにより記載の標準的な方法を用いることができる。さらに、ＡＴ／Ｕ塩基対、ＧＣ塩基対又は平衡混合物が優勢である断片はすべて、反応条件下で効率的にハイブリダイズすることができる。ハイブリダイゼーションは、３日から３０分、例えば１時間から１６時間に及んでもよく、この場合温度は有意に変動し、ハイブリダイゼーション混合物は変化し得る。しかし、かかるハイブリダイゼーション期間は、ハイブリダイゼーション条件に応じて、他の実施態様では、より長くても短くてもよい。

標的核酸にハイブリダイズされた標的単離分子のハイブリダイゼーション産物は、固体又は半固体支持体上にコーティングされ得る捕捉ドメインに対する親和性ドメインの結合によって固定化されるか、又は後述の固体若しくは半固体支持対そのものであってもよい。集団における核酸の固定化は、ハイブリダイゼーションの次の工程、エキソヌクレアーゼ消化、アダプターライゲーション、任意選択的に増幅を容易にするだけでなく、非反応物質、残留試薬、及び切断生成物の洗浄による除去を可能にし、それにより交差汚染が回避され、したがって標的配列濃縮の容易性及び有効性が高まる。

本明細書で使用される「捕捉ドメイン」という用語は、親和性ドメインを結合するための固体支持体（下記参照）又は半固体支持体（例えばアガロース又はアクリルアミド）と結合され、ひいては標的単離プローブと結合される化学構造又は部分を指す。親和性ドメインは、ビオチン、抗原、ハプテン、修飾ヌクレオチド又はリガンドなどの小分子を含むことができ、この小分子は結合することも、（例えば直接又は間接的に捕捉ドメインへの、アミン−チオール（ａｍｉｎｅｔｈｉｏｌ）架橋、マレイミド架橋、Ｎ−ヒドロキシスクシンイミド又はＮ−ヒドロキシスルホスクシンイミド、ゼノン又はＳｉｔｅＣｌｉｃｋによってさらに例示される、光化学的又は化学的）架橋になることも可能である。

固体支持体にＤＮＡを付着させるための様々な方法が知られており、そのいずれも本発明の態様で使用することができる。これらは、支持体表面への共有結合及びＤＮＡのその表面との非共有結合的相互作用（吸着による結合、例えばカチオン性表面）を含む。通常、共有結合性の固定化には、ＤＮＡ（親和性ドメイン）上の活性官能基と固体表面上の活性化官能基（捕捉ドメイン）との反応が関与する。反応性官能基の例には、アミン、ヒドロキシルアミン、ヒドラジン、ヒドラジド、チオール、ホスフィン、イソチオシアネート、イソシアネート、Ｎ−ヒドロキシスクシンイミド（ＮＨＳ）エステル、カルボジイミド、チオエステル、ハロアセチル誘導体、塩化スルホニル、ニトロ及びジニトロフェニルエステル、トシレート、メシレート、トリフレート、マレイミド、ジスルフィド、カルボキシル基、ヒドロキシル基、カルボニルジイミダゾール、エポキシド、アルデヒド、アシル−アルデヒド、ケトン、アジド、アルキン、アルケン、ニトロン、テトラジン、イソニトリル、テトラゾール、及びボロネートが含まれる。かかる反応の例には、アミドを形成するアミンと活性化カルボキシ基との間、チオエーテル結合を形成するチオールとマレイミドとの間、１，３−双極子付加環化反応を行うアジドとアルキン誘導体との間、アミンとエポキシ基との間、２つのアミド結合を生じる、活性化ビス−ジカルボン酸誘導体の形式の付加二官能性リンカー試薬と反応する別のアミン官能基とアミンとの間の反応又は当該技術分野で既知の他の組み合わせが含まれる。ＵＶ媒介架橋などの他の反応が、ＤＮＡの固体支持体への共有結合のために使用され得る。

官能基は、固体支持体用に用いられる物質に本質的に存在してもよく、又は適切な物質で支持体を処理又はコーティングすることにより提供されてもよい。官能基は、固体支持体表面を適切な化学剤と反応させることにより導入することもできる。本明細書で使用される活性化は、結合剤の表面へのカップリングを可能にするための、固体支持体表面上の官能基の修飾を意味する。本明細書で使用される固体支持体は、ＤＮＡを捕捉して固定化することが望まれる任意の固体（軟質又は硬質）材料を含むことを意味する。

固体支持体は、生物学的、非生物学的、有機、無機又はその組み合わせであってもよく、粒子、鎖、沈殿物、ゲル、シート、管、球、容器、毛細管、パッド、切片、フィルム、プレート、スライドの形態であってもよく、平ら、円板、球形、円等を含む任意の都合のよい形状を有し得る。固体支持体の表面は、表面が官能基を支持する限り、例えばポリマー、プラスチック、樹脂、多糖類、シリカ又はシリカ系材料、カーボン、金属、無機ガラス、膜等の様々な材料から構成され得る。都合のよい固体支持体の例は、例えばガラススライド、マイクロタイタープレート、及び適切なセンサー要素等のガラス表面、特に（例えばビーズの形態の）官能化ポリマー、化学修飾された酸化物表面、例えば二酸化ケイ素、五酸化タンタル若しくは二酸化チタン、又は化学修飾された金属表面、例えば金若しくは銀などの貴金属表面、銅若しくはアルミニウム表面、磁気表面、例えばＦｅ、Ｍｎ、Ｎｉ、Ｃｏ、及びそれらの酸化物、量子ドット、例えばＩＩＩ−Ｖ（ＧａＮ、ＧａＰ、ＧａＡｓ、ＩｎＰ若しくはＩｎＡｓ）又はＩＩ−ＶＩ（ＺｎＯ、ＺｎＳ、ＣｄＳ、ＣｄＳｅ若しくはＣｄＴｅ）半導体、又はＬｎドープ処理したフッ化物ナノ結晶、希土類によりドープ処理した酸化物ナノマテリアルである。

「固体支持体」は、硬質又は半硬質表面を有する物質又は物質の群を指す。固体支持体は、いくつかの実施態様では、例えばウェル、隆起領域、ピン、エッチングされた溝等を用いて、異なる化合物の合成領域を物理的に分離することが望ましいが、実質的に平らな固体支持体の少なくとも１つの表面であってもよい。あるいは、固体支持体は、ビーズ、樹脂、ゲル、ミクロスフェア又は他の幾何学的な構造であってもよい。ビーズの例には、ストレプトアビジンビーズ、アガロースビーズ、磁気ビーズ、Ｄｙｎａｂｅａｄｓ（登録商標）（ニューヨーク州グランドアイランドのＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）、ＭＡＣＳ（登録商標）ミクロビーズ（カリフォルニア州オーバーンのＭｉｌｔｅｎｙｉＢｉｏｔｅｃｈ）、抗体コンジュゲートビーズ（例えば抗免疫グロブリンミクロビーズ）、プロテインＡコンジュゲートビーズ、プロテインＧコンジュゲートビーズ、プロテインＡ／Ｇコンジュゲートビーズ、プロテインＬコンジュゲートビーズ、オリゴｄＴコンジュゲートビーズ、シリカビーズ、シリカ様ビーズ、抗ビオチンミクロビーズ、抗蛍光色素ミクロビーズ、及びＢｃＭａｇ^ＴＭ（カリフォルニア州サンディエゴのＢｉｏｃｌｏｎｅ）カルボキシ末端磁気ビーズが含まれる。標識された核酸を支持体に付着させることは、複数のポリヌクレオチドにビオチンを付着させることと、１つ以上の磁気ビーズをストレプトアビジンでコーティングすることとを含み得る。

固体支持体表面は、ポリマーの層を備えていてもよい。そのような場合、ポリマーは、活性化されるべき官能基を有しているであろう。ポリマーは、ポリエチレングリコール、ポリエチレンイミド、多糖類、ポリペプチド又はポリヌクレオチド等の任意の適切なクラスの化合物から選択され得る。支持体表面へのポリマーの付着は、当業者には容易に明らかな種々の方法によって行うことができる。例えば、トリクロロシリル基又はトリスアルコキシ基を有するポリマーは、基質表面のヒドロキシル基と反応させて、シロキサン結合を形成することができる。金又は銀表面への付着は、ポリマー上のチオール基を介して起こり得る。あるいは、ポリマーは、アルカンチオールの自己組織化単層などの中間体種によって付着させることができる。したがって、選択されるポリマーの種類及びポリマーを表面に付着するために選択される方法は、基質表面に付着させるのに適した反応性を有するポリマーに、特にＤＮＡへの非特異的な吸着に関するポリマーの特性に依存するであろう。官能基は、ポリマー上に存在してもよく、又は１以上の官能基の付加によりポリマーに付加してもよい。任意選択的に、スペーサーアームを用いて、結合ＤＮＡに柔軟性を与え、固体支持体による立体障害が最小限になるようにその環境と相互作用させることを可能にすることができる。

核酸を固体支持体の表面に固定化するために、表面上の活性化官能基は、所定の領域のみに、又は表面全体に存在してもよく、ＤＮＡ分子中に存在する官能基と選択的に反応する。時間、温度、ｐＨ、溶媒、添加剤等を含めた必要な反応条件は、用いられる特定の種に特に依存するであろうし、それぞれの特定の状況に適した条件は、当業者に容易に明らかであろう。オリゴヌクレオチドを合成し、所望の官能基を取り込むことができる。個々のヌクレオチドは、所望の反応性をもたらすために、任意のタイプの官能基で化学的に又は酵素的に修飾することができる。この化学的又は酵素的な官能化は、ＤＮＡ分子に伸長させることができる。

生物物質による表面の官能化は、ＤＮＡを固体支持体に付着させるために用いることもできる。例えばマイクロプレートなどの固体支持体は、例えば抗体（若しくは抗体断片）などの結合剤又は別の親和性結合剤（例えばストレプトアビジン）を用いて修飾することができる。その場合、ＤＮＡ分子は、対応する親和性リガンド（例えばビオチン）及び別の親和性結合剤（例えば、生体分子の配列の一部を認識する抗体）で修飾されている。本明細書で使用される結合剤は、例えば、タンパク質又その断片などのポリペプチド；相補鎖で塩基対合することができる、例えばオリゴヌクレオチド、ポリヌクレオチド又はその誘導体などの核酸を含む、特異的な結合対のメンバーである任意の作用剤を意味する。結合剤の例には、細胞膜に対するアゴニスト及びアンタゴニスト、毒素及び毒液、ウイルスエピトープ、抗原決定基、ホルモン及びホルモン受容体、ステロイド、ペプチド、酵素、基質、補因子、薬物、レクチン、糖、オリゴヌクレオチド、オリゴ糖、タンパク質、糖タンパク質、細胞、細胞膜、オルガネラ、細胞受容体、ビタミン、ウイルスエピトープ、並びに免疫グロブリン、例えばモノクローナル抗体及びポリクローナル抗体が含まれる。結合対の例には、ビオチン−ストレプトアビジン／アビジン、ハプテン／抗原−抗体、炭水化物−レクチン又は当業者に既知のその他のものが含まれる。

ＤＮＡの固体支持体への共有結合を可能にする特異的結合対のさらなる例は、例えばＳＮＡＰ−ｔａｇ（登録商標）（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）／ＡＧＴ及びベンジルグアニン誘導体（米国特許第７９３９２８４号；同第８３６７３６１号；同第７７９９５２４号；同第７８８８０９０号、及び同第８１６３４７９号）又はピリミジン誘導体（米国特許第８１７８３１４号）、ＣＬＩＰ−ｔａｇ^ＴＭ（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）／ＡＣＴ及びベンジルシトシン誘導体（米国特許第８２２７６０２号）、ＨａｌｏＴａｇ（登録商標）（ウィスコンシン州マディソンのＰｒｏｍｅｇａ）及びクロロアルカン誘導体（Los, et al. Methods Mol Biol., 356:195-208 (2007)）、セリン−ベータ−ラクタマーゼ及びベータ−ラクタム誘導体（国際特許出願公開ＷＯ２００４／０７２２３２号）である。そのような例において、ＤＮＡをベンジルグアニン、ピリミジン、ベンジルシトシン、クロロアルカン又はベータ−ラクタム誘導体で官能化し、その後それぞれＳＮＡＰ−タグ／ＡＧＴ、ＣＬＩＰ−ｔａｇ／ＡＣＴ、ＨａｌｏＴａｇ又はセリン−ベータ−ラクタマーゼで修飾した固体支持体中で捕捉することができる。あるいは、ＤＮＡをＳＮＡＰ−ｔａｇ／ＡＧＴ、ＣＬＩＰ−ｔａｇ／ＡＣＴ、ＨａｌｏＴａｇ又はセリン−ベータ−ラクタマーゼに特異的に又は非特異的に付着させ、その後それぞれベンジルグアニン、ピリミジン、ベンジルシトシン、クロロアルカン又はベータ−ラクタム誘導体で官能化した固体支持体中で捕捉することができる。ＤＮＡの固体支持体への共有結合を可能にする特異的結合対のさらなる例は、アシル担体タンパク質及びその修飾体（結合剤タンパク質）であり、これらは、シンターゼタンパク質によって補酵素Ａ（結合剤基質）由来のホスホパンテテイン（ｐｈｏｓｐｈｏｐａｎｔｈｅｔｅｉｎｅ）サブユニットに結合する（米国特許第７６６６６１２号）。ＤＮＡの固体支持体への好都合な結合を可能にするタンパク質又はそのフラグメントの例は、例えばキチン結合ドメイン（ＣＢＤ）、マルトース結合タンパク質（ＭＢＰ）、糖タンパク質、トランスグルタミナーゼ、ジヒドロ葉酸還元酵素、グルタチオン−Ｓ−トランスフェラーゼａｌ（ＧＳＴ）、ＦＬＡＧタグ、Ｓ−タグ、Ｈｉｓ−タグ、及び当業者に既知のその他のものである。通常、オリゴヌクレオチド、ＤＮＡ又はその断片は、特異的結合対の一部であり、かつ固体支持体に共有結合的に又は非共有結合的に結合されたパートナーに特異的に結合することができる分子で修飾される。

標的ＤＮＡは上記のように固定化するが、３’エキソヌクレアーゼＩ及びエキソヌクレアーゼＴなどの１以上の適切な３’一本鎖ＤＮＡエキソヌクレアーゼを添加して非標的ＤＮＡを除去し、標的ＤＮＡの特定のリード開始点で平滑末端を形成することができる。「３’一本鎖特異的エキソヌクレアーゼ」という用語は、一本鎖ＤＮＡ切断活性を有する３’エキソヌクレアーゼを指す。いくつかの３’エキソヌクレアーゼはまた、少量の二本鎖ＤＮＡ切断活性も有し、本実施態様においても使用され得る。「リード開始点」とは、核酸分子のシーケンシングが始まる位置を指す。シーケンシングリードの開始点は、１以上のヌクレアーゼを用いて一本鎖核酸を消化して、プローブと平滑末端を形成し、次いで、シーケンシングプライマー部位が標的核酸配列と直接境を接するようにアダプターをライゲーションすることにより生成することができる。その結果、選択されたプローブ配列がリード開始点を決定する。好ましくは、ヌクレアーゼは、平滑な二本鎖ＤＮＡ（ｄｓＤＮＡ）末端を形成することができる一本鎖の３’エキソヌクレアーゼであり、エンドヌクレアーゼ活性を有しない。一本鎖結合タンパク質（ＳＳＢタンパク質）などのアクセサリータンパク質を添加することができる。クレノウエキソ−及びｄＡＴＰを添加し、３’末端にｄＡテイルを設けることができる。ｄＡテーリング工程は、Ｔオーバーハング３’アダプターと共に用いる場合は任意選択であり、平滑末端アダプターには必要ではない。ｄＡテーリングの場合、用いられる酵素、その濃度、インキュベーション時間及び温度は重要ではない。しかしながら、酵素は、Ｔオーバーハングアダプターの場合、ｄｓＤＮＡの３’末端にｄＡなどの単一の非鋳型ヌクレオチドを付加するべきである。

５’エキソヌクレアーゼを用いて、５’非標的一本鎖核酸を除去することができる。５’エキソヌクレアーゼがヌクレアーゼを不活性化するために熱変性温度を必要とする場合、再ハイブリダイゼーション工程を加えてプローブを鋳型に再ハイブリダイズさせることができる。５’エキソヌクレアーゼが５’陥凹末端又は５’オーバーハングを残す場合、ポリメラーゼを用いて３’オーバーハングを消化するか、又はプローブの３’陥凹末端をフィルインし、平滑末端又は１つのヌクレオチドにより伸長される末端を形成することができる。３’エキソヌクレアーゼを有するポリメラーゼを平滑末端を形成するために好ましくは使用することができ、平滑末端は、平滑末端５’アダプターにライゲートすることができる。あるいは、クレノウ（３’→５’エキソ−）又はＢｓｔなどの３’エキソ−ポリメラーゼを置換して、Ｔオーバーハングを有する５’アダプターにライゲートすることができる末端を形成することができる。また、ｄＡＴＰ、ｄＣＴＰ、ｄＧＴＰ、及びｄＴＴＰの代わりに、ｄＡＴＰ、ｄＣＴＰ、ｄＧＴＰ及びｄＵＴＰのｄＮＴＰ混合物を用いてもよい。標的がＲＮＡである場合、ｄＮＴＰＳと共に逆転写酵素を使用することができ、又はリボＮＴＰを用いるＲＮＡポリメラーゼを使用することができる。フィルインポリメラーゼ、ポリメラーゼ濃度、プローブ濃度、インキュベーション時間及び温度は、当該技術分野で教示されている通り変化し得る（例えばTabor, et al. DNA dependent DNA polymerases in Ausebel, et al. Current protocols in Molecular Biology, 3.5.10-3.5.12 (1989), New York, John Wiley and Sons; Sambrook et al. (1989) Molecular Cloning, A laboratory Manual (2^nd ed), p 5.44-5.47, CSH pressを参照）。

標的濃縮後又はその間に、アダプター配列を標的配列の一方又は両方の末端にライゲートすることが望ましい場合がある。「ライゲーション」とは、２つ以上の核酸、例えばオリゴヌクレオチド及び／又はポリヌクレオチドの共有結合又は連結による終端間の結合を指す。結合又は連結の特質は、広範に変わることがあり、ライゲーションは、酵素的に又は化学的に行われ得る。本明細書で使用される場合、ライゲーションは、通常酵素的に行われ、１つのオリゴヌクレオチドの終端ヌクレオチドの５’炭素と別のオリゴヌクレオチドの３’炭素との間にホスホジエステル連結を形成する。様々な鋳型主導型のライゲーション反応が、次の参照文献に記載されており、これらは参照により援用される：Ｗｈｉｔｅｌｅｙら、米国特許第４８８３７５０号；Ｌｅｔｓｉｎｇｅｒら、米国特許第５４７６９３０号；Ｆｕｎｇら、米国特許第５５９３８２６号；Ｋｏｏｌ、米国特許第５４２６１８０号；Ｌａｎｄｅｇｒｅｎら、米国特許第５８７１９２１号；ＸｕａｎｄＫｏｏｌ，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ，２７：８７５−８８１（１９９９）；Ｈｉｇｇｉｎｓｔら、ＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌｏｇｙ，６８：５０−７１（１９７９）；Ｅｎｇｌｅｒら、ＴｈｅＥｎｚｙｍｅｓ，１５：３−２９（１９８２）；及びＮａｍｓａｒａｅｖ、米国特許出願公開第２００４／０１１０２１３号。

標的配列の末端にライゲートさせることができる様々な種類のアダプターが下記に議論される。用語「アダプター」とは、少なくとも部分的に二本鎖であり、隣接する標的配列の増幅のためのプライマー部位として適切な配列を含有する核酸、シーケンシングプラットフォームにより特定され、標的配列を含むライゲーション部位に隣接する配列に位置するシーケンシングプライマー、及び核酸供給源の同一性を追跡するための一意識別子及び／又はサンプルの同一性を追跡するためのバーコードを指す。シーケンシング反応におけるアダプター及びその使用の例は、米国特許第５８８８７３７号、米国特許第６０１３４４５号、米国特許第６０６０２４５号、米国特許第６１７５００２号、米国特許第７７４１４６３号、米国特許第７８０３５５０号、米国特許第８０２９９９３号、米国特許第８２８８０９７号、米国特許出願公開第２００４／０２０９２９９号、米国特許出願公開第２００７／０１７２８３９号、及び米国特許出願公開第２０１２／０２３８７３８号などの刊行物に見出すことができる。

次いで、切断可能な一本鎖ヘアピンアダプター、二本鎖Ｙアダプター、完全二本鎖アダプター又は市販のＤＮＡシーケンシングプラットフォーム上での下流のシーケンシングに適した当該技術分野で既知のその他任意の形態のアダプターを標的ＤＮＡの３’及び／又は５’末端にライゲートすることができる。ヘアピンアダプター内の切断可能部位は、ｄＵ、他の修飾ヌクレオチド、１つ以上のＲＮＡヌクレオチド又は化学的に切断可能な部位であり得る。これらは、米国特許出願公開第２０１２／０２３８７３８号に記載の修飾塩基のいずれかを含み得る切断可能部位の例としてのみ役立つ。ヘアピンアダプターを使用する利点は、これらのアダプターが当該技術分野のその他のアダプターよりも短く、ライゲーションのために効果的に使用できることである。さらに、これらのアダプターは、残留一本鎖エキソヌクレアーゼ活性に対してより耐性がある。その上、標的分子及び標的単離プローブのヘアピンアダプターへのライゲーションは、標的分子を親和性ドメインに共有結合する。ヘアピンアダプターを切断し、任意の二本鎖領域を変性させた後、切断されたヘアピン配列上のプライマー部位を含有する一本鎖領域を用いて、標的配列を増幅することができる。

アダプターは、Ｔオーバーハングを含んでもよいが、平滑末端していてもよい。アダプターは、ＮＧＳプラットフォーム表面での増幅に必要な追加の配列と共に短いアダプター配列を含有することができ、又はＮＧＳプラットフォームによって必要とされる完全な３’又は５’配列を供給することもできる。

一方又は両方の末端のアダプターは、ｍｉＳＥＱＨｉＳＥＱ（登録商標）（カリフォルニア州サンディエゴのＩｌｌｕｍｉｎａ）、ＩｏｎＴｏｒｒｅｎｔ（登録商標）（カリフォルニア州カールズバッドのＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）、ナノポアベースのシーケンサー（英国オックスフォードのＯｘｆｏｒｄＮａｎｏｐｏｒｅ）又はＰａｃＢｉｏＲＳＩＩ（カリフォルニア州メンロパークのＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ）等のシーケンシングプラットフォームでのシーケンシングに適した一意識別子（ＵＩＤ）又は分子バーコードを任意選択的に含有する。本明細書で使用される「一意識別子」（ＵＩＤ）という用語は、同一性（例えばタグＤＮＡ配列）がサンプル中のポリヌクレオチドを識別するために使用され得るポリヌクレオチドと結合される、タグ又はタグの組み合わせを指す。いくつかの実施態様において、ポリヌクレオチド上のＵＩＤは、ポリヌクレオチドが由来する供給源を同定するために使用される。供給源識別子は、バーコードとも称される。例えば、核酸サンプルは、異なる供給源に由来するポリヌクレオチドのプール（例えば異なる個体、異なる組織若しくは細胞に由来するポリヌクレオチド、又は異なる時点で単離されるポリヌクレオチド）であり得、各異なる供給源由来のポリヌクレオチドは一意なＵＩＤでタグ付けされる。このように、ＵＩＤは、ポリヌクレオチドとその供給源との間の相関をもたらす。いくつかの実施態様では、ＵＩＤは、サンプル中の各個々のポリヌクレオチドに一意にタグを付けるために使用される。サンプル中の一意なＵＩＤの数の同定は、サンプル中に個々のポリヌクレオチドがいくつ存在するのか、又は操作されたポリヌクレオチドサンプルがいくつの元のポリヌクレオチドから由来したかという読み出しを提供することができる。本明細書で利用される識別子の例には、Ｂｒｅｎｎｅｒら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．，９７：１６６５−１６７０（２０００）；Ｃｈｕｒｃｈら、Ｓｃｉｅｎｃｅ，２４０：１８４−１８８（１９８８）；Ｓｈｏｅｍａｋｅｒら、ＮａｔｕｒｅＧｅｎｅｔｉｃｓ，１４：４５０−４５６（１９９６）；及びＨａｒｄｅｎｂｏｌら、ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ，２１：６７３−６７８（２００３）に示されている例が含まれる。

アダプター濃度、リガーゼ濃度、リガーゼ反応量、反応緩衝液、反応体積、インキュベーション時間及び温度は変えることができる。さらに、ライゲーション後の洗浄工程によって、非ライゲートアダプター及びアダプターダイマーの除去が可能になる。

本明細書で使用される「プライマー」という用語は、ポリヌクレオチド鋳型とともに二重鎖を形成すると核酸合成の開始点として作用し、伸長二重鎖が形成されるように鋳型に沿ってその３’末端から伸長させることができる、天然又は合成のオリゴヌクレオチドを指す。伸長プロセス中に追加されるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列によって決定される。通常、プライマーは、ＤＮＡポリメラーゼによって伸長される。プライマーは一般に、プライマー伸長産物の合成におけるその使用に対応する長さであり、通常、例えば１０ｎｔから７５ｎｔ、１５ｎｔから６０ｎｔ、１５ｎｔから４０ｎｔ、１８ｎｔから３０ｎｔ、２０ｎｔから４０ｎｔ、２１ｎｔから５０ｎｔ、２２ｎｔから４５ｎｔ、２５ｎｔから４０ｎｔ等のように８ｎｔから１００ｎｔの間の範囲の長さ、より典型的には１８ｎｔから４０ｎｔ、２０ｎｔから３５ｎｔ、２１ｎｔから３０ｎｔの間の範囲の長さのサイズから選択される類似の又は同一の長さ及び所定の範囲の任意の長さのものである。典型的なプライマーは、１５ｎｔから４５ｎｔ、１８ｎｔから４０ｎｔ、２０ｎｔから３０ｎｔ、２１ｎｔから２５ｎｔ等のように１０ｎｔから５０ｎｔの間の長さ及び所定の範囲の任意の長さであり得る。

プライマーは通常、増幅における最大効率のために一本鎖であるが、代わりに二本鎖でもよい。二本鎖の場合、プライマーは通常、まずその鎖を分離するように処理されてから、伸長産物を調製するために使用される。この変性工程は、通常は熱に影響されるが、代わりにアルカリを用いて行い、続いて中和することができる。したがって、「プライマー」は、ポリメラーゼによる合成を開始するためのプライマー／鋳型複合体を生成するために、鋳型に相補的な少なくとも３’配列と、鋳型との水素結合又はハイブリダイゼーションによる複合体とを有し、ＤＮＡ合成の過程で鋳型に相補的なその３’末端に連結された、共有結合した塩基を付加することにより伸長される。

本方法の実施態様におけるプライマーの使用は、従来のＰＣＲ濃縮法と比較して、標的配列のより均一な増幅をもたらす。ＰＣＲ濃縮において、各プライマー対は標的配列に特異的であるが、本明細書では核酸の集団中のすべての標的配列に対して、単一のプライマー対が用いられる。

一本鎖センス鎖とアンチセンス鎖の双方とも、標的単離配列に結合された捕捉ドメインによって好ましくは固定化され、ひいては標的領域の３’末端にハイブリダイズされて、アダプターへのライゲーションに適した二本鎖のＤＮＡ領域を形成する。この時点で、標的配列の３’末端以外の任意の３’一本鎖ＤＮＡ領域は、エキソヌクレアーゼ切断によって好ましくは除去されている。標的鋳型の５’末端で５’プローブをハイブリダイズし、標的領域以外の外来ＤＮＡを除去し、５’アダプターを付加した後、核酸標的鋳型を増幅し、配列決定することができる。

３’アダプター及び５’アダプターが標的配列に共有結合している場合、部分的に二本鎖の分子の変性は、いずれか一方の末端でアダプター配列を有する一本鎖配列をもたらす。ここで、これらのアダプター配列は、ＰＣＲ又は２つのプライミング配列に依拠する当該技術分野で知られている他の増幅プロトコールによるＤＮＡ増幅のためのプライマー部位として働く。濃縮された標的ＤＮＡは、例えば熱、ＮａＯＨ又はホルムアミドを用いて捕捉ドメインから溶出することができるが、又はこれらが捕捉ドメインに用いられる場合には、ビーズに付着したままでもよい。増幅後、増幅したライブラリーは、ビーズ（例えばＡｍｐｕｒｅ（登録商標）ビーズ、ＢｅｃｋｍａｎＣｏｕｌｔｅｒ（カリフォルニア州ブレア）参照）を用いるか又はカラム精製（例えばカリフォルニア州バレンシアのＱｉａｇｅｎ製の精製製品）又は当該技術分野で既知のその他のＤＮＡ精製法により浄化することができる。次いで、得られたライブラリーを定量化し、配列決定することができる。

標的濃縮後に本明細書において任意選択的に用いられる増幅方法には、ＰＣＲ、逆転写酵素ＰＣＲ（ＲＴ−ＰＣＲ）、ローリングサークル増幅、リアルタイムＰＣＲ、リガーゼ連鎖反応（ＬＣＲ）、転写増幅、Ｑベータレプリカーゼ介在ＲＮＡ増幅又は等温増幅法、例えば転写介在増幅、ＲＮＡのシグナル介在増幅技術、鎖置換増幅、ローリングサークル増幅、ループ介在等温増幅（ＬＡＭＰ）又はヘリカーゼ依存性増幅（例えばGill et al. Nucleosides Nucleotides Nucleic Acids, 27:224-43 (2008）；米国特許第５２４２７９４号、米国特許第５４９４８１０号、米国特許第４９８８６１７号及び米国特許第６５８２９３８号：米国特許第４６８３１９５号；米国特許第４９６５１８８号；米国特許第４６８３２０２号；米国特許第４８００１５９号（ＰＣＲ）；米国特許第５２１００１５号（ＴａｑＭａｎ^ＴＭ（カリフォルニア州のＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）を用いたリアルタイムＰＣＲ）；米国特許第６１７４６７０号；特開平４−２６２７９９号（ローリングサークル増幅）；Leone, et al. Nucleic Acids Research, 26: 2150-2155 (1998)を参照のこと）のいずれも含まれ得る。

ＮＧＳは、従来のシーケンシング法（例えば標準的なサンガー又はマクサム−ギルバートのシークエンシング法）を用いて、前例のないスピードでポリヌクレオチドを配列決定する能力を有するシークエンシング技術を指す。この前例のないスピードは、数千から数百万のシークエンシング反応を並行して実施し、読み取ることにより達成される。ＮＧＳシーケンシングプラットフォームには、限定されないが、次のものが含まれる：ＭａｓｓｉｖｅｌｙＰａｒａｌｌｅｌＳｉｇｎａｔｕｒｅＳｅｑｕｅｎｃｉｎｇ（カリフォルニア州ヘイワードのＬｙｎｘＴｈｅｒａｐｅｕｔｉｃｓ）；４５４ピロシーケンシング（コネチカット州ブランフォードの４５４ＬｉｆｅＳｃｉｅｎｃｅｓ／ＲｏｃｈｅＤｉａｇｎｏｓｔｉｃｓ）；固相の可逆的色素ターミネーターシーケンシング（カリフォルニア州サンディエゴのＳｏｌｅｘａ／Ｉｌｌｕｍｉｎａ）；ＳＯＬｉＤ（登録商標）技術（ニューヨーク州グランドアイルのＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ／ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）；イオン半導体シーケンシング（ＩｏｎＴｏｒｒｅｎｔ^ＴＭ、ニューヨーク州グランドアイルのＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）；及びＤＮＡナノボールシーケンシング（カリフォルニア州マウンテンビューのＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓ）。いくつかのＮＧＳプラットフォームの説明については、次の文献において見出すことができる：Ｓｈｅｎｄｕｒｅら、Ｎａｔｕｒｅ，２６：１１３５−１１４５（２００８）；Ｍａｒｄｉｓ，ＴｒｅｎｄｓｉｎＧｅｎｅｔｉｃｓ，２４：１３３−１４１（２００７）；Ｓｕら、ＥｘｐｅｒｔＲｅｖＭｏｌＤｉａｇｎ，１１（３）：３３３−４３（２０１１）；及びＺｈａｎｇら、ＪＧｅｎｅｔＧｅｎｏｍｉｃｓ，３８（３）：９５−１０９（２０１１）。

上記の本発明の方法の実施態様は、次のように要約することができる：標的が濃縮された核酸ライブラリーは、例えば真核生物由来のｇＤＮＡ又は核酸の集団へのＲＮＡ転写物などの核酸サンプルを所定のサイズ範囲に断片化すること、マトリックスを結合するための親和性標識を含有する標的単離プローブを加えること（ここで標的単離プローブは核酸断片中の標的配列にわたる）、並びに１以上の３’及び５’特異的ヌクレアーゼ又は１以上の３’エキソヌクレアーゼ、任意選択的に１以上の５’エキソヌクレアーゼ（例えばＥｘｏＶＩＩ）を、同時に（例えば組み合わせて）又は異なる工程で用いて非標的核酸を除去することによって、生成することができる。３’アダプター、任意選択的に５’アダプターは、同時に（例えば組み合わせて）又は本方法における異なる工程で標的ＤＮＡの末端に付加することができる。次に、濃縮されたＤＮＡの増幅お及びシーケンシングが続いてもよい。アダプター配列又はプローブ配列には、バーコード及び一意識別子配列を任意選択的に含めることができる。

別の態様において、少なくとも１のプローブが親和性結合ドメインを含む標的単離プローブである３’及び５’標的プローブは、同時に（例えば組み合わせて）又は異なる工程においてハイブリダイズされ、この場合標的の長さは両方のプローブのハイブリダイゼーションにより決定され、一本鎖の非標的配列はエキソヌクレアーゼにより除去される。あるいは、特異的な標的単離プローブ及び３’エキソヌクレアーゼを用いて標的の３’末端を決定し、続いて、標的配列の未決定の５’末端を形成するために、５’ヌクレアーゼの非存在下で非特異的プローブを伸長させることができる。

本明細書に記載の方法についての実施態様は、開始点を特定することを含んでおり、したがって標的配列が決定されて、オフターゲット配列が存在しないという理由から、以前のハイブリダイゼーションに基づく方法よりも有利であり、他のハイブリダイゼーション法において標的配列は、非標的配列との未決定の境界を有する集団中の核酸内に残存する。さらに、両方の鎖を捕捉し、従来のハイブリダイゼーション法よりも多くのＡＴ又はＧＣリッチ配列を標的内で許容することができる。

先行技術におけるＰＣＲに基づく方法に対する本発明の実施態様の利点は、人工の配列が標的の末端に導入されないことである。さらに、本発明の実施態様は、スケーラブルであり、増幅バイアスがより少なく、標的分子に一意なＵＩＤを付加することが可能である。ＵＩＤは、同じ標的分子のＰＣＲ複製物の同定を可能にする。その結果、ＰＣＲ複製物を分析中に濾過することができ、突然変異又は転写物の正確な定量が可能になる。

「キット」という用語は、本発明の方法を実施するための物質又は試薬を送達するための任意の送達システムを指す。反応アッセイに関連して、かかる送達システムは、ある位場所から別の場所への反応試薬（例えば適切な容器内のプローブ、酵素、アダプター、プライマー等）及び／又は支持材（例えば緩衝液、アッセイを実施するための指示書など）の保存、移送又は送達を可能にするシステムを含む。例えば、キットは、該当する反応試薬及び／又は支持材を収容する１つ以上の密閉容器（例えば箱）を含む。かかる内容物は、一緒に又は別々に、対象とするレシピエントに送達され得る。例えば、第一の容器はアッセイにおける使用のための酵素を収容し、第二の容器はプローブを収容してもよい。キットは、非標的及び標的配列を含有する核酸サンプルから標的鋳型を選択し、濃縮するために考案されてもよい。キットは、キットの考案者若しくは製造者によって又は研究者によって定義された第一の親和性結合ドメインを含む３’プローブ（標的単離プローブ）；５’プローブ；アダプター；プライマー：ヌクレアーゼ；リガーゼ；ポリメラーゼ；緩衝液；ヌクレオチド；除去可能なブロッキングオリゴヌクレオチド及び／又はマトリックスと結合される捕捉ドメインを含み得る。キットは、ＤＮＡライブラリーを作成するための１以上の緩衝溶液及び標準液をさらに含み得る。

図１０に記載の方法についての実施態様では、ハイブリダイゼーション法で起こるような大きな断片を配列決定する必要性を排除しながら、二重濾過の必要性も回避する。ハイブリダイゼーション法では、ランダム末端を有する大きな断片が内部で増幅される。バイオインフォマティクススキャンは、同じ末端を有すると同定されたＰＣＲ複製を検出し、除去することができる。

対照的に、短い断片にアダプター末端を付加するＰＣＲ法は、すべてのリードが同じ開始及び終了配列を有するように決定された末端を有し、したがってコンピューターによってフィルターにかけることができる。

図１０に示す実施態様は、５’末端をＰＣＲ複製物についてスキャンすることができるように、１つの決定された末端（３’末端）及び１つのランダム末端（５’末端）を有する。

本明細書で引用されるすべての文書は、各個々の文書が参照により援用されることが具体的かつ個別に示された場合と同程度まで、あらゆる目的のために、それらの全体が出典明示により援用される。

表１：本方法の態様における修飾ヌクレオチドの使用の例は、本願に記載されている。図は、修飾がどこでどのように用いられ得るかの例を提供するが、特定の目的のために限定することを意図するものではない。表に記載されている使用を可能にするための修飾の使用は、当該技術分野でよく知られている。

以下の実施例は、特定の温度、インキュベーション時間、及び緩衝液を記載している。ただし、これらの条件は、限定することを意図するものではない。当業者であれば、様々な配列を濃縮するための出発物質として本明細書で例示されているヒトｇＤＮＡは限定を意図するものではないこと、また、同程度のハイブリダイゼーション又は増幅を行うためにｐＨ、緩衝液及び塩の条件並びにインキュベーション時間を変化させ得る範囲が以下の指定された条件に限定されないことを理解するはずである。同様に、親和性ドメインとしてのビオチンの記載は、限定することを意図するものではない。特異的切断可能部位を有する特異的アダプターもまた、例として以下に記載されているが、限定することを意図するものではない。工程の順序を例として説明する。工程の順序が変更可能であることは理解されよう。さらに、いくつかの工程は、便宜的に追加又は削除することができる。

実施例１：１つの標的単離プローブによるシーケンシングのための、標的配列を濃縮するための方法。
３００ｂｐ断片のための製造業者のプロトコールに従い、Ｃｏｖａｒｉｓの装置を用いてヒトｇＤＮＡ（１μｇ）を剪断した（図１（１））。１００塩基長であり、ビオチンと結合された標的単離プローブ２０ｎｍｏｌを含有するハイブリダイゼーション反応緩衝液２５μｌに、剪断したＤＮＡを加えた。この場合、１００塩基配列は１００ｎｔ標的配列に相補的であった（図１（２））。ＪｏｈｎらのＢｉｏＴｅｃｈｎｉｑｕｅｓ，４４，２５９−２６４（２００８）に従って、ハイブリダイゼーション反応を実施した。ハイブリダイゼーション後、標的単離プローブ／標的ＤＮＡ二重鎖を親水性のストレプトアビジンビーズ（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）５０μｌに３０分間結合させ（図１（３））、標準ＢＷＢｕｆｆｅｒ（５ｍＭトリス−ＨＣｌ（ｐＨ７．５）、０．５ｍＭＥＤＴＡ、１ＭＮａＣｌ）で洗浄した。
本明細書を通して使用される場合、「反応混合物」とは、反応を実施するのに必要な反応物すべてを含有する溶液を意味し、これには、限定されないが、反応中の選択したレベルでｐＨを維持するための緩衝剤、酵素、基質、塩、補因子、捕捉剤等が含まれ得る。
ビーズを、１×ＮＥＢｕｆｆｅｒ４、２．５ＵのエキソヌクレアーゼＴ（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）及び２．５ＵのエキソヌクレアーゼＩを含有する反応混合物（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）５０μｌに再懸濁させ、３７℃で１０分間インキュベートした。磁気ビーズを洗浄し、３０ユニットのＲｅｃＪｆを含有する１ＸＮＥＢｕｆｆｅｒ２（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）５０μｌに再懸濁させ、２０℃で１０分間インキュベートした（図１（４））。
磁気ビーズを洗浄し、ｄＡ−Ｔａｉｌｉｎｇ反応混合物（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）５０μｌに再懸濁させ、３７℃で３０分間インキュベートした。次いで、ビーズを洗浄し、４５μｌの１ＸＱｕｉｃｋＬｉｇａｔｉｏｎ緩衝液（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）及びＩｌｌｕｍｉｎａ用のＮＥＢＮｅｘｔ（登録商標）アダプター（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）に再懸濁させた。ＱｕｉｃｋＴ４ＤＮＡリガーゼ（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）５μｌをライゲーション混合物に添加し、室温で１５分間インキュベートした（図１（５））。
次いで、ビーズを洗浄し、５μｌのＵＳＥＲ^ＴＭ酵素（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）及びＩｌｌｕｍｉｎａ用のＮＥＢＮｅｘｔ（登録商標）プライマー（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を含有する１ＸＨｏｔＳｔａｒｔＯｎｅＴａｑ（登録商標）ＰＣＲＭａｓｔｅｒＭｉｘ（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）に再懸濁させた。ＰＣＲ混合物を３７℃で１５分間インキュベートした。次のＰＣＲサイクル条件が用いられる：９５℃で２分間、続いて９５℃で３０秒間、６０℃で３０秒間及び７２℃で１分間を２５サイクル（図１（６））。２５サイクルの終わりに、ＰＣＲ混合物を７２℃で５分間インキュベートした。次いで、標的配列から得られたＰＣＲ産物を、従来の方法を用いて配列決定した。

実施例２：１つの標的単離プローブによるシーケンシングのための、標的配列を濃縮するための方法の変形例。
実施例１及び図１中のプロトコールを、ストレプトアビジンビーズへの結合によって進め、図２Ａ（７）−（１１）に記載の工程が（１）−（３）の後に続いた。
１ＸＮＥＢｕｆｆｅｒ４、２．５ＵのエキソヌクレアーゼＴ及び２．５ＵのエキソヌクレアーゼＩを含有する反応混合物５０μｌにビーズを再懸濁させ、３７℃で１０分間インキュベートした（７）。
磁気ビーズを洗浄し、ｄＡ−Ｔａｉｌｉｎｇ反応混合物５０μｌに再懸濁させ、３７℃で３０分間インキュベートした。次いで、ビーズを洗浄し、４５μｌの１ＸＱｕｉｃｋＬｉｇａｔｉｏｎ及びＩｌｌｕｍｉｎａ用のＮＥＢＮｅｘｔアダプターに再懸濁させた。ＱｕｉｃｋＴ４ＤＮＡリガーゼ５μｌをライゲーション混合物に添加し、室温で１５分間インキュベートした（図２Ａ（８））。
磁気ビーズを洗浄し、２０ユニットのエキソヌクレアーゼＶＩＩを含有する１ＸエキソヌクレアーゼＶＩＩ緩衝液（ウィスコンシン州マディソンのＥｐｉｃｅｎｔｒｅ）５０μｌに再懸濁させ、３０°Ｃで１０分間インキュベートした（９）。製造業者のプロトコールに従って、酵素を熱失活させた。ビーズを洗浄し、１５ＵのＴ４ＤＮＡポリメラーゼ及び１００μＭｄＮＴＰを含有する１ＸＮＥＢｕｆｆｅｒ２（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）５０μｌに再懸濁させた。反応物を２０℃で３０分間インキュベートした。
次いで、ビーズを洗浄し、４５μｌの１ＸＱｕｉｃｋＬｉｇａｔｉｏｎ緩衝液及びＩｌｌｕｍｉｎａ用のＮＥＢＮｅｘｔアダプターに再懸濁させた。ＱｕｉｃｋＴ４ＤＮＡリガーゼ５μｌをライゲーション混合物に添加し、室温で１５分間インキュベートした（１０）。
アダプターのＵＳＥＲ切断及びＰＣＲ増幅を、実施例１に記載の通りに実施した。

実施例３：１つのＦｌａｐプローブによるシーケンシングのための、標的配列を濃縮するための方法。
実施例１に記載のプロトコールを、フラップ標的単離プローブを用いる３’アダプターのライゲーションによって進めた（図２Ｂ参照）。フラップ標的単離プローブは、標的配列の５’末端に特異的な一本鎖の３’領域、内部ビオチン−ｄＴ、切断可能なｄＵを含有する５’ヘアピン、ＮＧＳプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位、及び一意なサンプル識別子配列（１−３、１２−１３）によって特徴付けられる。３’アダプターのライゲーション後、ビーズを洗浄し、５μｌの１０ＸＢＳＡ添加剤（メリーランド州ゲイサーズバーグのＴｒｅｖｉｇｅｎ）及び０．５ＵのＨｕｍａｎＦｅｎ−１（メリーランド州ゲイサーズバーグのＴｒｅｖｉｇｅｎ）を含有する１ＸＲＥＣＲｅａｃｔｉｏｎＢｕｆｆｅｒ１２（メリーランド州ゲイサーズバーグのＴｒｅｖｉｇｅｎ）５０μｌに再懸濁させ、３０℃で３０分間インキュベートした（１４）。次いで、ビーズを洗浄し、１ＸＱｕｉｃｋＬｉｇａｔｉｏｎ緩衝液４５μｌ及びＱｕｉｃｋＴ４ＤＮＡリガーゼ５μｌに再懸濁させ、室温で１５分間インキュベートした。
アダプターのＵＳＥＲ切断及びＰＣＲ増幅を、実施例１（１５）に記載の通りに実施した。

実施例４：１つの標的単離プローブによるシーケンシングのための、標的配列を濃縮するための方法の変形例。
実施例１のプロトコールを、３’−ジデオキシヌクレオチドを有する標的単離プローブを用いた一本鎖３’及び５’消化（図１（１）−（４）及び図２Ｃ（１６）−（１８））によって進めた。ビーズを洗浄し、１ＸＱｕｉｃｋＬｉｇａｔｉｏｎ緩衝液４５μｌ及び５０μＭ３’平滑末端化ヘアピンＤＮＡアダプター１０μｌに再懸濁させ、ＱｕｉｃｋＴ４ＤＮＡリガーゼ５μｌをライゲーション混合物に添加し、室温で１５分間インキュベートした（１６）。３’アダプター配列は、ＮＧＳプラットフォーム特異的シーケンシングプライマー部位、５’リン酸、及び３’−ジデオキシヌクレオチドを含有した。
ビーズを洗浄した後、標的／プローブ二重鎖を平滑末端化し、ｄＡテイル化し（ｄＡ−ｔａｉｌｅｄ）、５’アダプターを標的にライゲートし、サイズ選択なしのライブラリー調製のための製造業者のプロトコールに従って、Ｉｌｌｕｍｉｎａ用のＮＥＢＮｅｘｔＵｌｔｒａＤＮＡＬｉｂｒａｒｙＰｒｅｐＫｉｔ（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を用いて標的を増幅した（１７）（１８）。

実施例５：標的単離プローブ及びランダムオリゴヌクレオチドを用いてシーケンシングするための、標的配列を濃縮するための方法。
５００ｂｐ断片のための製造業者のプロトコールに従い、Ｃｏｖａｒｉｓの装置を用いてヒトｇＤＮＡ（１μｇ）を剪断した（図３（１９））。剪断したＤＮＡは、Ｔｉｑｕｉａら（２００４年）に記載の技術を用い、５００ｂｐのｇＤＮＡ断片内の１００ｂｐから３００ｂｐのヌクレオチド標的配列の３’末端に特に相補的な、５０塩基長の３’標的単離プローブ２０ｎｍｏｌを含有するハイブリダイゼーション反応混合物２５μｌに添加した（図３（２０））。ハイブリダイゼーション後、３’標的単離プローブ／標的ＤＮＡ二重鎖を、製造業者のプロトコールに従って、親水性のストレプトアビジンビーズ５０μｌに３０分間結合させた（図３（２１））。
１ＸＮＥＢｕｆｆｅｒ４、２．５ＵのエキソヌクレアーゼＴ及び２．５μｌのエキソヌクレアーゼＩを含有する反応混合物５０μｌにビーズを再懸濁させ、３７℃で１０分間インキュベートした（図３（２２））。磁気ビーズを洗浄し、ｄＡ−Ｔａｉｌｉｎｇ反応混合物５０μｌに再懸濁させ、３７℃で３０分間インキュベートした。次いで、ビーズを洗浄し、１ＸＱｕｉｃｋＬｉｇａｔｉｏｎ緩衝液４５μｌと、ｄＵの切断可能な核酸塩基を含有する３’Ｔオーバーハングを有する５０μＭヘアピンアダプター１０μｌとに再懸濁させ、ＱｕｉｃｋＴ４ＤＮＡリガーゼ５μｌをライゲーション混合物に添加し、室温で１５分間インキュベートした（図３（２３））。３’アダプター配列は、ＮＧＳプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位及び一意な鎖識別子配列並びに３’ｄＴオーバーハングを含有した。
ライゲーション後、ビーズを洗浄し、追加の２０ｎｍｏｌのランダムヘキサマーを含有する５０μｌの１ＸＮＥＢｕｆｆｅｒ２に再懸濁させた。反応物を９５℃で５分間加熱し、次いで氷に移した後（図３（２４））、クレノウ（エキソ−）ＤＮＡポリメラーゼ（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）及び１００μＭのｄＮＴＰを添加した。反応物を２０℃で１０分間、続いて３７℃で２０分間インキュベートした（図３（２５））。
次いで、ビーズを洗浄し、４５μｌの１ＸＱｕｉｃｋＬｉｇａｔｉｏｎ緩衝液（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）及びｄＵの切断可能な核酸塩基を含有する５’一本鎖ヘアピンアダプターに再懸濁させ、ＱｕｉｃｋＴ４ＤＮＡリガーゼ（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）５μｌをライゲーション混合物に添加し、室温で１５分間インキュベートした（図３（２６））。５’アダプター配列は、ＮＧＳプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位及びサンプル同定のためのバーコード配列を含有した。
次いで、磁気ビーズを洗浄し、５μｌのＵＳＥＲ酵素並びに３’及び５’ライブラリー増幅部位に相補的な１０μＭ増幅プライマーを各々２．５μｌ含有する１ＸＨｏｔＳｔａｒｔＯｎｅＴａｑＰＣＲＭａｓｔｅｒＭｉｘに再懸濁させた。ＰＣＲ混合物を３７℃で１５分間インキュベートした。次のＰＣＲサイクル条件が用いられる：９５℃で２分間、続いて９５℃で３０秒間、６０℃で３０秒間及び７２℃で１分間を２５サイクル（図３（２７））。２５サイクルの終わりに、ＰＣＲ混合物を７２℃で５分間インキュベートした。次いで、標的配列から得られたＰＣＲ産物を、従来の方法を用いて配列決定した。

実施例６：標的単離プローブ及び第二のプローブを用いるシーケンシングのための、標的配列を濃縮するための方法の変形例。
実施例５に記載のプロトコールを、３’アダプターのライゲーション（（１９）−（２３））によって進めた。ライゲーション後、磁気ビーズを洗浄し、標的配列の５’末端に相補的な、５０塩基長の５’標的単離プローブ２０ｎｍｏｌを含む５０μｌの１ＸエキソヌクレアーゼＶＩＩ緩衝液に再懸濁させた。標的単離プローブを９５℃で５分間加熱し、続いて３０℃までゆっくりと冷却することにより標的にアニールした（図４（２８））。１０ＵのエキソヌクレアーゼＶＩＩを反応物に転化し、３７℃でさらに１０分間インキュベートした（図４（２９））。製造業者のプロトコールに従って、酵素を熱失活させた。ビーズを洗浄し、追加の２０ｎｍｏｌの５’標的単離プローブを含有する１ＸＮＥＢｕｆｆｅｒ２（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）５０μｌに再懸濁させた。反応物を９５℃で５分間加熱し、続いて３０℃までゆっくりと冷却した後、１５ＵのＴ４ＤＮＡポリメラーゼ（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）及び１００μＭのｄＮＴＰを添加した。反応物を２０℃で３０分間インキュベートした。
ビーズを洗浄した後、５’アダプターのライゲーション、該アダプターのＵＳＥＲ切断及びＰＣＲ増幅を、３’Ｔオーバーハングを有するヘアピンアダプターを用いて実施例４に記載の通りに実施した（（図４（３０）（３１））。

実施例７：２プローブによるシーケンシングのための、標的配列を濃縮するための方法の変形例。
実施例４に記載のプロトコールを、３’ではなく内部にビオチンを有する３’標的単離プローブを用いる５’エキソヌクレアーゼ消化及び熱失活（（１９）−（２３）、（２８）−（２９））によって進めた。熱失活後、ビーズを洗浄し、１５ユニットのクレノウ（エキソ−）ＤＮＡポリメラーゼ及び１００μＭのｄＮＴＰを含有する５０μｌの１ＸＮＥＢｕｆｆｅｒ２に再懸濁させた。反応物を２０℃で１０分間、続いて３７℃で２０分間インキュベートした（３２）。
ビーズを洗浄した後、５’アダプターのライゲーション、該アダプターのＵＳＥＲ切断及びＰＣＲ増幅を、実施例５に記載の通りに実施した（（２６）（２７））。

実施例８：標的単離プローブ及び５’フラッププローブによるシーケンシングのための、標的配列を濃縮するための方法。
実施例６に記載のプロトコールを、３’ヘアピンアダプターのライゲーションによって進めた（図３、（１９）−（２３））。３’アダプターのライゲーション後、ビーズを洗浄し、フラップ５’プローブ２０ｎｍｏｌを含有する５０μｌの１ＸＲＥＣＲｅａｃｔｉｏｎＢｕｆｆｅｒ１２に再懸濁させた。フラッププローブは、標的の５’末端に相補的な一本鎖の３’領域、切断可能なｄＵを含有する５’ヘアピン、ＮＧＳプラットフォーム特異的シーケンシングプライマー部位、ライブラリー増幅プライマー部位、及び一意なサンプル識別子配列で構成された。プローブを、９５℃で５分間加熱し、その後、３０℃までゆっくりと冷却することにより標的配列の５’末端にアニールした（３５）。
アニーリング後、１０ＸＢＳＡ添加剤５μｌ及び０．５ユニットのヒトＦｅｎ−１を添加し、５’一本鎖領域を除去し、反応物を３０℃で３０分間インキュベートした（３６）。次いで、ビーズを洗浄し、１ＸＱｕｉｃｋＬｉｇａｔｉｏｎ緩衝液４５μｌ及びＱｕｉｃｋＴ４ＤＮＡリガーゼ５μｌに再懸濁させ、室温で１５分間インキュベートした。
次いで、磁気ビーズを洗浄し、５μｌのＵＳＥＲ酵素及び増幅プライマーを含有する１ＸＨｏｔＳｔａｒｔＯｎｅＴａｑＰＣＲＭａｓｔｅｒＭｉｘに再懸濁させた。ＰＣＲ混合物を３７℃で１５分間インキュベートし、次のＰＣＲサイクル条件を用いた：９５℃で２分間、続いて９５℃で３０秒間、６０℃で３０秒間及び７２℃で１分間を２５サイクル。２５サイクルの終わりに、ＰＣＲ混合物を７２℃で５分間インキュベートした（３７）。次いで、標的配列から得られたＰＣＲ産物を、従来の方法を用いて配列決定した。

実施例９：２プローブによるシーケンシングのための、標的配列を濃縮するための方法の変形例。
５００ｂｐ断片のための製造業者のプロトコールに従い、Ｃｏｖａｒｉｓを用いてヒトｇＤＮＡ（１μｇ）を剪断した（１９）。剪断したＤＮＡを、２０ｎｍｏｌの３’標的単離プローブと２０ｎｍｏｌの５’プローブ（それぞれが５０塩基長で、１００の標的の３’及び５’末端を特定する）とを含有するハイブリダイゼーション反応物２５μｌに添加した（３８）。ハイブリダイゼーション後、ハイブリダイズした標的配列を実施例２に記載の通りに捕捉した（３９）。
１ＸＮＥＢｕｆｆｅｒ４、２．５ユニットのエキソヌクレアーゼＴ及び２．５μｌのエキソヌクレアーゼＩを含有する反応混合物５０μｌにビーズを再懸濁させ、３７℃で１０分間インキュベートした。磁気ビーズを洗浄し、３０ユニットのＲｅｃＪｆを含有する１ＸＮＥＢｕｆｆｅｒ２（マサチューセッツ州イプスウィッチのＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）５０μｌに再懸濁させ、２０℃で１０分間インキュベートした（図４）。
磁気ビーズを洗浄し、ｄＡ−Ｔａｉｌｉｎｇ反応混合物５０μｌに再懸濁させ、３７℃で３０分間インキュベートした。次いで、ビーズを洗浄し、４５μｌの１ＸＱｕｉｃｋＬｉｇａｔｉｏｎ緩衝液及びＩｌｌｕｍｉｎａ用のＮＥＢＮｅｘｔアダプターに再懸濁させた。ＱｕｉｃｋＴ４ＤＮＡリガーゼ５μｌをライゲーション混合物に添加し、室温で１５分間インキュベートした（４１）。
アダプターのＵＳＥＲ切断及びＰＣＲ増幅を、実施例１（４２）．に記載の通りに実施した。

Claims

核酸の集団から標的配列を濃縮するための方法であって、
（ａ）核酸集団と、親和性結合ドメインを含む標的単離プローブとを溶液中で組み合わせることと；
（ｂ）標的単離プローブの一本鎖領域を、核酸の集団中の標的配列の全部又は一部にハイブリダイズさせることと；
（ｃ）標的単離プローブを捕捉ドメインと結合させ、非結合物質を除去することにより、標的配列を含有する集団からハイブリダイズされた核酸を選択的に固定化することと；
（ｄ）１以上の３’エキソヌクレアーゼによって、標的配列の３’末端から非標的配列を除去し、それにより標的配列の３’末端及び標的単離プローブの５’末端に、平滑末端二重鎖又は付着端を生じさせることと；
（ｅ）標的単離プローブの３’末端を伸長させて、標的配列の５’末端に平滑末端又は付着端を形成すること
とを含む、方法。
（ｂ）の標的単離プローブの一本鎖領域が標的配列の一部にハイブリダイズする、請求項１に記載の方法。
前記一部が標的配列の３’末端に配置される、請求項２に記載の方法。
親和性結合ドメインが標的単離プローブの３’末端と５’末端の間に配置される、請求項１から３のいずれか一項に記載の方法。
３’エキソヌクレアーゼがエキソヌクレアーゼＩ、エキソヌクレアーゼＴ、及び／又は３’エキソヌクレアーゼ活性を有する１以上のポリメラーゼから選択される、請求項１から４のいずれか一項に記載の方法。
伸長工程（ｅ）がｄＵＴＰなどの修飾デオキシヌクレオチドの存在下で実施される、請求項１から５のいずれか一項に記載の方法。
標的単離プローブのエキソヌクレアーゼ分解を防ぐために、標的単離プローブがその３’末端及び／又はその５’末端において修飾される、請求項１から６のいずれか一項に記載の方法。
標的単離プローブの３’末端におけるライゲーションを防ぐために、標的単離プローブがその３’末端において修飾される、請求項１から７のいずれか一項に記載の方法。
標的単離プローブの５’末端におけるポリメラーゼ伸長を防ぐために、標的単離プローブがその５’末端において修飾される、請求項１から８のいずれか一項に記載の方法。
修飾がインバーテッド塩基、炭素リンカー、ホスホロチオエート結合又はジデオキシヌクレオチドから選択される、請求項７から９のいずれか一項に記載の方法。
増幅を防ぐために、標的単離プローブがデオキシウラシル、内部炭素リンカー又は１以上のリボヌクレオチドを含有するように修飾される、請求項１から１０のいずれか一項に記載の方法。
（ｄ）が、
（Ｉ）標的配列の３’末端に対する二重鎖３’アダプター；又は
（ｉｉ）標的配列の３’末端に対するヘアピン３’アダプターの二重鎖領域
をライゲートすることをさらに含む、請求項１から１１のいずれか一項に記載の方法。
（ｅ）が
（Ｉ）標的配列の５’末端に対する二重鎖５’アダプター；又は
（ｉｉ）標的配列の５’末端に対するヘアピン５’アダプターの二重鎖領域
をライゲートすることをさらに含む、請求項１から１２のいずれか一項に記載の方法。
３’及び／又は５’アダプターがＮＧＳプラットフォーム特異的アダプター、単一ヌクレオチドオーバーハングを含有するアダプター、切断可能部位を有するＹ構造若しくはヘアピンアダプター、完全に相補的な二本鎖ＤＮＡ（ｄｓＤＮＡ）アダプター、又はライゲーション接合部の反対側に一本鎖ＤＮＡ（ｓｓＤＮＡ）オーバーハングを有するｄｓＤＮＡアダプターである、請求項１２又は１３に記載の方法。
３’アダプターの３’末端がジデオキシヌクレオチドを含有し、
標的配列の３’末端へのライゲーションを目的とした３’アダプターの５’末端がリン酸基を欠いており、及び／又は
標的配列の５’末端へのライゲーション用ではない５’アダプターの５’末端がインバーテッドヌクレオチドを含有する、
請求項１２に記載の方法。
３’及び／又は５’アダプターがシーケンシングプライマー部位、ライブラリー増幅プライマー部位、一意なサンプル識別子、及び一意な分子識別子配列のうちの少なくとも１つを含む、請求項１２から１５のいずれか一項に記載の方法。
アダプターにライゲートされた標的配列を増幅することをさらに含む、請求項１２から１６のいずれか一項に記載の方法。
増幅反応が、シーケンシングプラットフォームにより必要とされる配列などの、追加の配列をアダプターにライゲートされた標的に加えるプライマーを用いて実施される、請求項１７に記載の方法。
標的配列を定量すること及び／又はシーケンシングすることをさらに含む、請求項１２から１８のいずれか一項に記載の方法。