定義
本開示がより容易に理解されるように、ある特定の用語が最初に下記で定義される。以下の用語および他の用語についての追加の定義が本明細書のあらゆる箇所で示されることがある。下記に示される用語の定義が、参照により組み込まれる出願または特許における定義と矛盾する場合、本願で示される定義を、その用語の意味を理解するために使用されたい。
本明細書および添付の特許請求の範囲で使用される場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈による別段の明白な指図がない限り、複数の言及対象を含む。したがって、例えば、「方法(amethod)」への言及は、1つもしくは複数の方法、ならびに/または本明細書に記載されるおよび/もしくは本開示を読むことなどにより当業者に明らかになるタイプのステップを含む。
本明細書において使用される専門用語が特定の実施形態の記載を目的にしたものに過ぎず、限定するように意図されていないことも、理解されるはずである。さらに、別段の定義がない限り、本明細書で使用される全ての技術および科学用語は、本開示が属する技術分野の当業者によって一般に理解されているのと同じ意味を有する。方法、コンピュータ可読媒体、およびシステムの記載および特許請求の範囲における記載では、以下の専門用語、およびそれらの文法上の異表記が、下記に示される定義に従って使用されることになる。
約:本明細書で使用される場合、目的の1つまたは複数の値または要素に適用される場合の「約」または「おおよそ」は、述べられている参照値または要素と同様である値または要素を指す。ある特定の実施形態では、用語「約」または「おおよそ」は、別段の記述がない限り、または文脈からそうでないことが明らかでない限り、述べられている参照値または要素の、どちらかの方向で(それより大きいまたはそれより小さい)、25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%またはそれ未満の範囲内に入る値または要素の範囲を指す(但し、そのような数が、可能な値または要素の100%を超える場合を除く)。
アダプター:本明細書で使用される場合、「アダプター」は、典型的には少なくとも部分的に二本鎖であり、所与の試料核酸分子のどちらか一方または両方に連結させるために使用される、短い核酸(例えば、長さ約500ヌクレオチド未満、約100ヌクレオチド未満または約50ヌクレオチド未満)を指す。アダプターは、両端にアダプターが隣接している核酸分子の増幅を可能にする核酸プライマー結合部位、および/または様々な次世代シークエンシング(NGS)適用などのシークエンシング適用のためのプライマー結合部位を含むシークエンシングプライマー結合部位を、含むことができる。アダプターは、フローセル支持体またはこれに類するものなどに結合されたオリゴヌクレオチドなどの、捕捉用プローブのための結合部位も含むことができる。アダプターは、本明細書に記載に記載されるような核酸タグも含むことができる。核酸タグは、増幅プライマーおよびシークエンシングプライマー結合部位に対して、核酸タグが、所与の核酸分子のアンプリコンおよび配列リードに含まれるように通常は位置する。同じまたは異なるアダプターを核酸分子のそれぞれの末端に連結させることができる。一部の実施形態では、核酸タグが異なることを除いて同じ配列のアダプターが、核酸分子のそれぞれの末端に連結される。一部の実施形態では、アダプターは、一方の末端が平滑末端化されているかまたは本明細書に記載されるような尾部を有するY型アダプターであって、同じく平滑末端化されているかまたは1つもしくは複数の相補的ヌクレオチドを有する尾部を有する核酸分子に結合させるための、Y型アダプターである。さらなる他の例となる実施形態では、アダプターは、分析すべき核酸分子に結合させるための、平滑末端または尾部を有する末端を含む釣り鐘型アダプターである。アダプターの他の例としては、T尾部を有するアダプターおよびC尾部を有するアダプターが挙げられる。
投与する:本明細書で使用される場合、対象に治療剤(例えば、免疫学的治療剤)を「投与する」または「投与すること」は、組成物を対象に与えること、適用すること、または対象と接触させることを意味する。投与は、例えば、局所、経口、皮下、筋肉内、腹腔内、静脈内、髄腔内および皮内を含む、多数の経路のいずれかにより遂行することができる。
赤池情報量基準:本明細書で使用される場合、「赤池情報量基準」または「AIC」は、モデルの有限集合の中から統計モデルを選択するための基準を指し、モデルにおけるパラメーターの数についてのペナルティー項を含む。一部の実施形態では、最も低いAICを有するモデルが選択される。
アレル頻度:本明細書で使用される場合、「アレル頻度」は、集団内のまたは所与の対象における特定の遺伝子座でのアレルの相対頻度を指す。アレル頻度は、典型的には割合またはパーセンテージとして表される。
増幅する:本明細書で使用される場合、核酸の文脈での「増幅する」または「増幅」は、増幅産物またはアンプリコンが一般に検出可能である、少量のポリヌクレオチド(例えば、単一ポリヌクレオチド分子)から典型的には出発する、ポリヌクレオチドまたはポリヌクレオチドの一部分の複数のコピーの産生を指す。ポリヌクレオチドの増幅は、様々な化学的および酵素的プロセスを包含する。
バーコード:本明細書で使用される場合、核酸の文脈での「バーコード」または「分子バーコード」は、分子識別子として役立つことができる配列を含む核酸分子を指す。例えば、個々の「バーコード」配列は、典型的には、次世代シークエンシング(NGS)ライブラリー調製中に各DNA断片に付加され、したがって、各シークエンシングリードを識別することおよび最終データ解析の前にソートすることができる。
がん型:本明細書で使用される場合、「がん」、「がん型」または「腫瘍型」は、例えば組織病理学により定義された、がんの型または亜型を指す。がん型は、任意の従来の基準により、例えば、所与の組織(例えば、血液がん、中枢神経系(CNS)、脳がん、肺がん(小細胞および非小細胞)、皮膚がん、鼻のがん、咽喉がん、肝臓がん、骨がん、リンパ腫、膵臓がん、大腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、乳がん、前立腺がん、卵巣がん、肺がん、腸がん、軟部組織がん、神経内分泌がん、胃食道がん、頭頸部がん、婦人科がん、結腸直腸がん、尿路上皮がん、固形状態のがん、不均一ながん、均一ながん)における出現、原発不明およびこれらに類すること基づいて、ならびに/またはHer2、CA15-3、CA19-9、CA-125、CEA、AFP、PSA、HCG、ホルモン受容体およびNMP-22などのがんマーカーを示す同じ細胞系統(例えば、癌腫、肉腫、リンパ腫、胆管細胞癌、白血病、中皮腫、黒色腫もしくは神経膠芽腫)および/もしくはがんに基づいて、定義することができる。がんは、ステージ(例えば、ステージ1、2、3または4)によって、および原発性であるのかまたは続発性であるのかによって分類することもできる。
無細胞核酸:本明細書で使用される場合、「無細胞核酸」は、細胞に含有されても別様に結合されてもいない核酸、または一部の実施形態では、無傷細胞の除去後に試料中に自然に残存する核酸を指す。無細胞核酸は、例えば、対象の体液(例えば、血液、血漿、血清、尿、脳脊髄液(CSF)など)から供給される全ての被包されていない核酸を含むことができる。無細胞核酸は、ゲノムDNA、ミトコンドリアDNA、循環DNA、siRNA、miRNA、循環RNA(cRNA)、tRNA、rRNA、核小体低分子RNA(snoRNA)、Piwi結合RNA(piRNA)、長鎖非コーディングRNA(長鎖ncRNA)および/またはこれらの任意の断片を含む、DNA(cfDNA)、RNA(cfRNA)およびこれらのハイブリッドを含む。無細胞核酸は、二本鎖状、一本鎖状、またはこれらのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞壊死、アポトーシスもしくはこれらに類するものによって体液に放出され得る。がん細胞から体液に放出される無細胞核酸、例えば、循環腫瘍DNA(ctDNA)もある。健康な細胞から放出されるものもある。ctDNAは、被包されていない腫瘍由来断片化DNAであり得る。無細胞核酸のもう1つ例は、母体血流内を自由に循環している胎児DNAであり、これは無細胞胎児DNA(cffDNA)とも呼ばれる。無細胞核酸は、1つまたは複数のエピジェネティック改変を有することがあり、例えば、無細胞核酸は、アセチル化、5-メチル化、ユビキチン化、リン酸化、SUMO化、リボシル化および/またはシトルリン化されていることもある。
コンパレーター結果:本明細書で使用される場合、「コンパレーター結果」は、所与の検査試料または検査結果を、その検査試料もしくは結果の1つもしくは複数の可能性の高い特性、および/または1つもしくは複数の可能性のある予後予測結果、および/または検査試料が採取されたもしくは別様に由来した対象のための1つもしくは複数のカスタマイズされた療法を同定するために比較することができる、結果または結果のセットを意味する。コンパレーター結果は、典型的には、参照試料のセット(例えば、検査対象と同じ疾患もしくはがん型を有する対象からのもの、および/または検査対象と同じ療法を受けているもしくは受けたことがある対象からのもの)から得られる。ある特定の実施形態では、例えば、試料(例えば、不安定なcfDNA試料)のマイクロサテライト不安定性ステータスは、cfDNA検査試料のマイクロサテライト不安定性ステータスと参照試料のセットについて決定されたマイクロサテライト不安定性ステータスとの実質的マッチを同定するために、コンパレーター結果と比較される。参照試料のセットについて決定されたマイクロサテライト不安定性スコアは、典型的には、1つもしくは複数のカスタマイズされた療法でインデックス化される。したがって、実質的マッチが同定された場合、それによって、対応するカスタマイズされた療法も、検査試料が採取された対象のための可能性のある治療経路として同定される。
対照試料:本明細書で使用される場合、「対照試料」または「対照DNA試料」は、分析手順の正確度を評価するために検査試料とともに分析されるまたは検査試料と比較される、既知組成の、ならびに/または既知特性および/もしくは既知パラメーター(例えば、既知腫瘍割合、既知カバレッジ、既知マイクロサテライト不安定性スコア、および/もしくはこれらに類するもの)を有する、試料を指す。
カバレッジ:本明細書で使用される場合、「カバレッジ」は、特定の塩基位置を占める核酸分子の数を指す。
カスタマイズされた療法:本明細書で使用される場合、「カスタマイズされた療法」は、例えば、所与のマイクロサテライト不安定性ステータスを有する、またはマイクロサテライト不安定性スコアの定義された範囲内である、所与の基準に基づいて選択された対象または対象の集団についての所望の治療転帰を伴う療法を指す。
デオキシリボ核酸またはリボ核酸:本明細書で使用される場合、「デオキシリボ核酸」または「DNA」は、糖部分の2’位に水素基を有する天然または改変ヌクレオチドを指す。DNAは、アデニン(A)、チミン(T)、シトシン(C)およびグアニン(G)という4種類のヌクレオチド塩基を含む、ヌクレオチドの鎖を典型的には含む。本明細書で使用される場合、「リボ核酸」または「RNA」は、糖部分の2’位にヒドロキシル基を有する天然または改変ヌクレオチドを指す。RNAは、A、ウラシル(U)、GおよびCという4種類のヌクレオチドを含む、ヌクレオチドの鎖を典型的には含む。本明細書で使用される場合、用語「ヌクレオチド」は、天然ヌクレオチドまたは改変ヌクレオチドを指す。ヌクレオチドのある特定の対は、相補的な形で互いに特異的に結合する(これは、相補的塩基対合と呼ばれる)。DNAの場合、アデニン(A)はチミン(T)と対合し、シトシン(C)はグアニン(G)と対合する。RNAの場合、アデニン(A)はウラシル(U)と対合し、シトシン(C)はグアニン(G)と対合する。第1の核酸鎖が、この第1鎖中のヌクレオチドに相補的であるヌクレオチドで構成されている第2の核酸鎖に結合すると、これらの2本の鎖が結合して二重鎖を形成する。本明細書で使用される場合、「核酸シークエンシングデータ」、「核酸シークエンシング情報」、「配列情報」、「核酸配列」、「ヌクレオチド配列」、「ゲノム配列」、「遺伝子配列」または「断片配列」、または「核酸シークエンシングリード」は、DNAまたはRNAなどの核酸の分子(例えば、全ゲノム、全トランスクリプトーム、エクソーム、オリゴヌクレオチド、ポリヌクレオチド、または断片)中のヌクレオチド塩基(例えば、アデニン、グアニン、シトシン、およびチミンまたはウラシル)の順序および正体を示す任意の情報またはデータを意味する。本教示が、キャピラリー電気泳動、マイクロアレイ、ライゲーションに基づくシステム、ポリメラーゼに基づくシステム、ハイブリダイゼーションに基づくシステム、直接または間接的ヌクレオチド同定システム、パイロシークエンシング、イオンまたはpHに基づく検出システム、および電子シグネチャに基づくシステムを含むがこれらに限定されない、全ての利用可能な種類の技法、プラットフォームまたは技術を使用して得られる配列情報を企図していることを、理解されたい。
免疫療法:本明細書で使用される場合、「免疫療法」は、免疫系を刺激して、がん細胞を死滅させるように、または少なくともがん細胞の成長を阻害するように、好ましくは、がんのさらなる成長を低減させる、がんのサイズを縮小するおよび/もしくはがんを排除するように作用する、1つまたは複数薬剤での処置を指す。一部のそのような薬剤は、がん細胞上に存在する標的に結合し;一部は、免疫細胞上に存在する標的に結合するが、がん細胞上の標的には結合せず;一部は、がん細胞上および免疫細胞上の両方に存在する標的に結合する。そのような薬剤は、チェックポイント阻害剤および/または抗体を含むが、これらに限定されない。チェックポイント阻害剤は、自己免疫寛容を維持し、末梢組織における生理的免疫応答の継続期間および振幅を、付随的組織損傷を最小限に抑えるようにモジュレートする、免疫系の経路の阻害剤である(例えば、Pardoll, Nature Reviews Cancer 12, 252-264 (2012)を参照されたい)。例示的な薬剤としては、PD-1、PD-2、PD-L1、PD-L2、CTLA-4、OX40、B7.1、B7He、LAG3、CD137、KIR、CCR5、CD27、CD40またはCD47のいずれかに対する抗体が挙げられる。他の例示的な薬剤としては、炎症促進性サイトカイン、例えば、IL-1β、IL-6、およびTNF-αが挙げられる。他の例示的な薬剤は、T細胞により認識される腫瘍抗原を標的とするキメラ抗原を発現することにより活性化されるT細胞などの、腫瘍に対して活性化されるT細胞である。
インデル:本明細書で使用される場合、「インデル」は、対象のゲノムにおける1つまたは複数のヌクレオチドの挿入または欠失を含む突然変異を指す。
インデックス化された:本明細書で使用される場合、「インデックス化された」は、第2の要素(例えば、所与の療法)に結び付けられた第1の要素(例えば、マイクロサテライト不安定性スコア)を指す。
不安定性ステータス:本明細書で使用される場合、反復核酸の文脈での「不安定性ステータス」または「不安定性スコア」(例えば、反復核酸/反復DNA不安定性ステータスまたはスコア、マイクロサテライト不安定性ステータスまたはスコア)は、1つもしくは複数の核酸試料中の所与の反復核酸遺伝子座もしくは反復核酸遺伝子座の集団が、その遺伝子座もしくは遺伝子座の集団について決定された閾値レベルより高い突然変異のレベルもしくは程度(例えば、可変リピート長)を示すのか、その閾値レベルである突然変異のレベルもしくは程度(例えば、可変リピート長)を示すのか、またはその閾値レベルより低い突然変異のレベルもしくは程度(例えば、可変リピート長)を示すのかについての尺度または決定を指す。明確にするために、不安定性ステータスおよび不安定性スコアは、置き換え可能ではなく、むしろ関連概念である。不安定性ステータスは、不安定性スコアに基づく。例えば、試料の不安定性スコアが、集団訓練済み閾値であるかまたはそれ未満である場合には、試料は、安定な試料(例えば、MSIについて-MSSまたは低度MSI)と分類され、試料の不安定性スコアが、集団訓練済み閾値より高い場合には、試料は、不安定な試料(例えば、MSIについて-高度MSI)と分類される。
検出限界(LoD):本明細書で使用される場合、「検出限界」または「LoD」は、所与のアッセイまたは分析手法によって測定することができる試料中の物質(例えば、核酸)の最小量を意味する。
最大MAF:本明細書で使用される場合、「最大MAF」または「max MAF」は、試料中の全ての体細胞変異体の最大MAFを指す。
マイクロサテライト:本明細書で使用される場合、「マイクロサテライト」は、長さ約10塩基対またはヌクレオチド未満のリピート単位を有する反復核酸を指す。
ミニサテライト:本明細書で使用される場合、「ミニサテライト」は、長さ約10~約60塩基対またはヌクレオチドのリピート単位を有する反復核酸を指す。
突然変異型アレル割合:本明細書で使用される場合、「突然変異型アレル割合」、「突然変異用量」、または「MAF」は、所与のゲノム位置におけるアレル変化または突然変異を保有する核酸分子の割合を指す。MAFは、一般に割合またはパーセンテージとして表される。例えば、MAFは、典型的には、所与の遺伝子座に存在する全ての体細胞変異体またはアレルの約0.5、0.1、0.05または0.01未満(すなわち、約50%、10%、5%または1%未満)である。
突然変異:本明細書で使用される場合、「突然変異」は、既知参照配列からの変異を指し、例えば、一塩基変異体(SNV)、コピー数変異体または変異(CNV)/異常、挿入または欠失(インデル)、遺伝子融合、トランスバージョン、転座、フレームシフト、重複、リピート伸長、およびエピジェネティック変異体などの、突然変異を含む。突然変異は、生殖細胞系突然変異であってもよく、または体細胞突然変異であってもよい。一部の実施形態では、比較を目的とする参照配列は、検査試料、典型的にはヒトゲノム、を提供する対象の種の野生型ゲノム配列である。
新生物:本明細書で使用される場合、用語「新生物」および「腫瘍」は、同義的に使用される。これらは、対象における細胞の異常な成長を指す。新生物または腫瘍は、良性であってもよく、潜在的に悪性であってもよく、または悪性であってもよい。悪性腫瘍は、がんまたはがん性腫瘍と呼ばれる。
次世代シークエンシング:本明細書で使用される場合、「次世代シークエンシング」または「NGS」は、旧来のサンガーに基づくおよびキャピラリー電気泳動に基づく手法と比較してスループットが増大した、例えば、何十万もの比較的短い配列リードを同時に生成する能力がある、シークエンシング技術を指す。次世代シークエンシング技法の一部の例としては、合成によるシークエンシング、ライゲーションによるシークエンシング、およびハイブリダイゼーションによるシークエンシングが挙げられるが、これらに限定されない。
核酸タグ:本明細書で使用される場合、「核酸タグ」は、短い核酸(例えば、長さ約500ヌクレオチド、約100ヌクレオチド、約50ヌクレオチドまたは約10ヌクレオチド未満)であって、異なる試料からの、異なるタイプのもしくは異なる処理を受けた、核酸を区別するために使用される短い核酸(例えば、試料インデックスを表す)、または同じ試料中の、異なるタイプのもしくは異なる処理を受けた、異なる核酸を区別するために使用される短い核酸(例えば、分子バーコードを表す)を指す。核酸タグは、所定の、固定された、非ランダム、ランダムまたはセミランダムオリゴヌクレオチド配列を含む。そのような核酸タグは、異なる核酸分子または異なる核酸試料もしくは二次試料を標識するために使用することができる。核酸タグは、一本鎖状、二本鎖状、または少なくとも部分的に二本鎖状であり得る。核酸タグは、必要に応じて、同じ長さまたは多様な長さを有する。核酸タグは、1つもしくは複数の平滑末端を有する二本鎖分子を含むこともあり、5’もしくは3’一本鎖領域(例えば、オーバーハング)を含むこともあり、および/または所与の分子中の他の領域に1つもしくは複数の他の一本鎖領域を含むこともある。核酸タグを他の核酸(例えば、増幅および/またはシークエンシングすべき試料核酸)の一方の末端または両方の末端に結合させることができる。核酸タグを解読して、所与の核酸の起源試料、形態または処理などの情報を明らかにすることができる。例えば、核酸タグを使用して、異なる分子バーコードおよび/または試料インデックスを有する核酸を含む複数の試料のプールおよび/または並列処理を可能にすることもでき、これらの核酸は、その後、核酸タグを検出すること(例えば、読み取ること)によりデコンボリューションされる。核酸タグは、識別子(例えば、分子識別子、試料識別子)と呼ばれることもある。加えて、またはあるいは、核酸タグを分子バーコードとして(例えば、同じ試料または二次試料中の異なる分子をまたは異なる親分子のアンプリコンを区別するために)使用することができる。これは、例えば、所与の試料中の異なる核酸分子に一意的にタグ付けすること、またはそのような分子に非一意的にタグ付けすることを含む。非一意的タグ付け適用の場合、限定数のタグ(すなわち、分子バーコード)を使用して核酸分子にタグ付けすることができ、その結果、異なる分子を、少なくとも1つの分子バーコードと組み合わせてそれらの内在性配列情報(例えば、それらが選択参照ゲノムに位置する開始および/もしくは終結位置、配列の一方もしくは両方の末端の部分配列、ならびに/または配列の長さ)に基づいて、区別することができる。典型的には、任意の2分子が、同じ内在性配列情報(例えば、開始および/もしくは終結位置、配列の一方もしくは両方の末端の部分配列、ならびに/または長さ)を有することができ、かつ同じ分子バーコードも有することができるという確率が低くなる(例えば、機会が約10%未満、約5%未満、約1%未満、または約0.1%未満)ように、十分な数の異なる分子バーコードが使用される。
ポリヌクレオチド:本明細書で使用される場合、「ポリヌクレオチド」、「核酸」、「核酸分子」、または「オリゴヌクレオチド」は、ヌクレオシド間連結により結合されたヌクレオシドの直鎖状ポリマー(デオキシリボヌクレオシド、リボヌクレオシド、またはこれらの類似体を含む)を指す。典型的には、ポリヌクレオチドは、少なくとも3つのヌクレオシドを含む。オリゴヌクレオチドは、多くの場合、サイズが少数のモノマー単位、例えば3~4、から数百モノマー単位に及ぶ。ポリヌクレオチドが、「ATGCCTG」などの、文字の配列によって表される場合は常に、別段の断り書きがない限り、ヌクレオチドが左から右へ5’→3’の順序であること、およびDNAの場合、「A」がデオキシアデノシンを示し、「C」がデオキシシチジンを示し、「G」がデオキシグアノシンを示し、「T」がデオキシチミジンを示すことが、理解されるであろう。文字A、C、GおよびTは、当技術分野では一般的であるように、塩基自体を指すために使用されることもあり、ヌクレオシドを指すために使用されることもあり、または塩基を含むヌクレオチドを指すために使用されることもある。
集団訓練済み閾値:本明細書で使用される場合、反復核酸の文脈での「集団訓練済み閾値」は、それらの遺伝子座を含む訓練DNA試料(例えば、非腫瘍試料、腫瘍試料など)において観測されると予想される不安定な反復核酸遺伝子座(例えば、多数の不安定なマイクロサテライト遺伝子座)の別途決定された最大総数を指す。集団訓練済み閾値は、特定の試料についての実験的に決定された反復核酸不安定性スコアを特徴付けるために典型的には使用される。
処理すること:本明細書で使用される場合、用語「処理すること」、「計算すること」および「比較すること」は、同義的に使用される。ある特定の実施形態では、これらの用語は、差、例えば、数または配列の差を決定することを指す。例えば、反復DNA不安定性スコア(例えば、マイクロサテライト不安定性スコア)、遺伝子発現、コピー数変異(CNV)、インデル、および/または一塩基変異体(SNV)の値または配列を処理することができる。
参照配列:本明細書で使用される場合、「参照配列」は、実験的に決定された配列と比較する目的で使用される既知配列を指す。例えば、既知配列は、全ゲノムであってもよく、染色体であってもよく、またはこれらの任意のセグメントであってもよい。参照配列は、典型的には、少なくとも約20、少なくとも約50、少なくとも約100、少なくとも約200、少なくとも約250、少なくとも約300、少なくとも約350、少なくとも約400、少なくとも約450、少なくとも約500、少なくとも約1000、またはそれより多くのヌクレオチドを含む。参照配列は、ゲノムもしくは染色体の単一の連続する配列とアラインメントすることができ、またはゲノムもしくは染色体の異なる領域とアラインメントする不連続なセグメントを含むことができる。例示的な参照配列としては、例えば、hG19およびhG38などのヒトゲノムが挙げられる。
リピート長:本明細書で使用される場合、反復核酸の文脈での「リピート長」は、所与の反復核酸遺伝子座に存在するリピート単位の数を指す。例を挙げて説明すると、次の一本鎖核酸鎖は、8のリピート長を有する:
リピート単位:本明細書で使用される場合、反復核酸の文脈での「リピート単位」は、所与の反復核酸遺伝子座で繰り返される個々のヌクレオチドパターンまたはモチーフ(例えば、ホモポリマーまたはヘテロポリマー)を指す。例を挙げて説明すると、次の一本鎖核酸鎖は、「ATT」のリピート単位を有する:
反復核酸:本明細書で使用される場合、「反復核酸」または「反復エレメント」は、所与のゲノムおよび/またはゲノムの集団全体にわたって複数のコピーで存在するヌクレオチドの繰り返し起こるパターンを指す。反復核酸は、反復DNAおよび反復RNAを含む。反復核酸の非限定的な例としては、マイクロサテライト、末端リピート、タンデムリピート、ミニサテライト、サテライトDNA、散在リピート、転位因子(例えば、DNAトランスポゾン、レトロトランスポゾン(例えば、LTR型レトロトランスポゾン(HERV)およびLTR型レトロトランスポゾン(HERV))など)、クラスターを形成し規則正しい間隔を持つパリンドロームリピート(CRISPR)、ダイレクトリピート、逆位リピート、ミラーリピート、および反転リピートが挙げられる。
反復核酸不安定性スコア:本明細書で使用される場合、反復核酸の文脈での「反復核酸不安定性スコア」(例えば、反復DNA不安定性スコア、マイクロサテライト不安定性スコアなど)は、不安定であるとコールされるまたは別様に決定される所与の試料中の反復核酸遺伝子座の集団からの反復核酸遺伝子座の総数を指す。この反復核酸不安定性スコアは、試料レベルのスコア(または試料スコア)であり、遺伝子座位に特異的である部位スコアとは異なる。
試料:本明細書で使用される場合、「試料」は、本明細書で開示される方法および/またはシステムにより分析することができるあらゆるものを意味する。
感度:本明細書で使用される場合、「感度」は、所与のMAFおよびカバレッジでの突然変異の存在を検出する確率を意味する。
シークエンシング:本明細書で使用される場合、「シークエンシング」は、生体分子、例えばDNAまたはRNAなどの核酸、の配列(例えば、モノマー単位の正体および順序)を決定するために使用される多数の技術のうちのいずれかを指す。例示的なシークエンシング方法としは、標的化されたシークエンシング、単一分子リアルタイムシークエンシング、エクソンまたはエクソームシークエンシング、イントロンシークエンシング、電子顕微鏡法に基づくシークエンシング、パネルシークエンシング、トランジスタ媒介シークエンシング、ダイレクトシークエンシング、ランダムショットガンシークエンシング、サンガージデオキシターミネーションシークエンシング、全ゲノムシークエンシング、ハイブリダイゼーションによるシークエンシング、パイロシークエンシング、キャピラリー電気泳動、デュプレックスシークエンシング、サイクルシークエンシング、一塩基伸長シークエンシング、固相シークエンシング、ハイスループットシークエンシング、大規模並列シグネチャーシークエンシング、エマルジョンPCR、より低い変性温度での共増幅-PCR(COLD-PCR)、マルチプレックスPCR、可逆的ダイターミネーターによるシークエンシング、ペアエンドシークエンシング、ニアタームシークエンシング、エクソヌクレアーゼシークエンシング、ライゲーションによるシークエンシング、ショートリードシークエンシング、単一分子シークエンシング、合成によるシークエンシング、リアルタイムシークエンシング、リバースターミネーターシークエンシング、ナノポアシークエンシング、454シークエンシング、Solexa Genome Analyzerシークエンシング、SOLiD(商標)シークエンシング、MS-PETシークエンシング、およびこれらの組合せが挙げられるが、それらに限定されない。一部の実施形態では、シークエンシングは、例えば、多数ある中でも特に、Illumina,Inc.、Pacific Biosciences,Inc.、またはApplied Biosystems/Thermo Fisher Scientificから市販されている遺伝子解析装置などの、遺伝子解析装置によって行うことができる。
配列情報:本明細書で使用される場合、核酸ポリマーの文脈での「配列情報」は、そのポリマー中のモノマー単位(例えば、ヌクレオチドなど)の順序および正体を意味する。
部位スコア:本明細書で使用される場合、「部位スコア」は、試料中の所与の反復核酸遺伝子座における生殖細胞系リピート長以外の追加のリピート長の存在の尤度の尺度を指す。ある特定の実施形態では、部位スコアは、所与の遺伝子座について、その遺伝子座のデルタ赤池情報量基準(ΔAIC)を計算することにより決定される。
部位特異的訓練済み閾値:本明細書で使用される場合、「部位特異的訓練済み閾値」は、所与の反復核酸遺伝子座(例えば、所与のマイクロサテライト遺伝子座)についての、この遺伝子座が安定であるような部位スコアの、別途決定された最大値を指す。
体細胞突然変異:本明細書で使用される場合、「体細胞突然変異」は、受胎後に起こるゲノムの突然変異を意味する。体細胞突然変異は、胚細胞を除く身体の細胞のあらゆる細胞で起こることがあり、したがって、子孫に伝えられない。
特異度:本明細書で使用される、診断分析またはアッセイの文脈での「特異度」は、分析またはアッセイが所与の試料の他の成分でなくて意図した標的分析物を検出する程度を指す。
実質的マッチ:本明細書で使用される場合、「実質的マッチ」は、少なくとも第1の値または要素が少なくとも第2の値または要素と少なくともほぼ等しいことを意味する。ある特定の実施形態では、例えば、カスタマイズされた療法は、マイクロサテライト不安定性スコアとコンパレーター結果とが少なくとも実質的にまたはほぼマッチしている場合に同定される。
対象:本明細書で使用される場合「対象」は、動物、例えば、哺乳動物種(例えば、ヒト)または鳥類(例えば、トリ)種、または他の生物、例えば植物を指す。より具体的には、対象は、脊椎動物、例えば、哺乳動物、例えばマウス、霊長類、サルまたはヒトであり得る。動物は、家畜(例えば、生産牛、乳牛、家禽、ウマ、ブタおよびこれに類するもの)、競技用動物、および伴侶動物(例えば、ペットまたは支援動物)を含む。対象は、健康な個体であってもよく、疾患を有するもしくは疾患の素因がある個体、または疾患を有することもしくは疾患の素因があることが疑われる個体であってもよく、あるいは治療を必要とする、または治療を必要とすることが疑われる個体であってもよい。用語「個体」または「患者」は、「対象」と置き換え可能であるように意図されている。
例えば、対象は、がんを有すると診断された、がん療法を受ける予定である、および/または少なくとも1種類のがん療法を受けたことがある、個体であってもよい。対象は、がんの寛解期にあってもよい。別の例として、対象は、自己免疫疾患を有すると診断される個体であってもよい。別の例として、対象は、妊娠している雌個体または妊娠することを計画している雌個体であって、疾患、例えばがん、自己免疫疾患、を有すると診断されことがある可能性があるまたは有することが疑われた可能性がある雌個体であってもよい。
閾値:本明細書で使用される場合、「閾値」は、実験的に決定された値を特徴付けるためにまたは分類するために使用される別途決定された値を指す。
訓練DNA試料:本明細書で使用される場合、「訓練DNA試料」は、部位特異的訓練済み閾値および集団訓練済み閾値の推定に使用されるDNA試料を指す。訓練DNA試料データセットは、1つまたは複数の訓練DNA試料を含む。訓練DNA試料は、1または複数の正常DNA試料および/または腫瘍DNA試料を含む。一部の実施形態では、訓練DNA試料は、高度MSIおよび/または低度MSI/MSSステータスを有する1つまたは複数の試料を含む。
腫瘍割合:本明細書で使用される場合、「腫瘍割合」は、所与の試料における腫瘍に由来する核酸分子の割合の推定を指す。例えば、試料の腫瘍割合は、試料のmax MAFまたは試料のカバレッジまたは試料中のcfDNA断片の長さまたは試料の任意の他の選択された特徴から誘導される尺度であってもよい。一部の実施形態では、試料の腫瘍割合は、試料のmax MAFに等しい。
不安定な:本明細書で使用される場合、反復核酸の文脈での「不安定な」または「不安定性」は、核酸試料(例えば、cfDNA試料)中の所与の反復核酸遺伝子座でまたは反復核酸遺伝子座の所与の集団において観測される突然変異(例えば、インデルまたはこれらに類するもの)のレベルであって、閾値(例えば、部位特異的訓練済み閾値-遺伝子座レベル;集団訓練済み閾値-試料レベル;またはこれらに類するもの)を超えるレベルを指す。
詳細な説明
序論
がんは、異常な細胞成長という一般的な特徴を有し、体内の細胞の起源部位を超えて転移する可能性がある、大きい遺伝疾患群を包含する。この疾患の根底にある分子基盤は、形質転換細胞表現型につながる突然変異および/またはエピジェネティック変化であり、これらの有害な変化が、遺伝により獲得されたのか、体細胞系基礎を有するのかを問わない。厄介なことに、これらの分子変化は、同じがん型を有する患者間ばかりでなく、所与の患者自身の腫瘍内でさえも、典型的には異なる。
大部分のがんに観察される突然変異の可変性にかんがみて、がん治療の課題の1つは、患者の個別のがん型を前提に患者が応答する可能性が最も高い療法を同定することである。がん免疫療法を含む、がん患者にぴったりの適切な処置を選ぶために、様々なバイオマーカーが使用される。応答の1つのバイオマーカーは、DNAミスマッチ修復(MMR)機序の低下により引き起こされる遺伝子超突然変異性の状態であるかまたはそのような遺伝子超突然変異性に対する素因である、マイクロサテライト不安定性(MSI)である。高度(MSI-Hまたは高度MSI)と分類されるマイクロサテライト不安定性を有するがん患者は、高い腫瘍変異負荷、ネオ抗原の発現増加および大量に存在する腫瘍浸潤性リンパ球を含むある範囲の分子および生物学的変化をもたらす、腫瘍細胞における体細胞突然変異の蓄積を示すことが多い。Chang et al. "Microsatellite Instability: A PredictiveBiomarker for Cancer Immunotherapy," Appl Immunohistochem Mol Morphol,26(2):e15-e21 (2018)。これらの変化は、進行黒色腫、頭頸部扁平上皮癌、非小細胞肺がん(NSCLC)および古典的ホジキンリンパ腫を処置するために使用されるペムブロリズマブ(Keytruda(登録商標))などのチェックポイント阻害薬に対する感受性増大に関連付けられている。今までのところ、この応答バイオマーカーの適用は、標準的なPCRに基づく技法を使用する固形腫瘍試料におけるMSIステータスの評価に基本的に限られている。
本開示は、患者試料、特に、無細胞DNA(cfDNA)試料におけるMSIの決定および解析に有用である、方法、コンピュータ可読媒体、およびシステムを提供する。これらの方法および関連態様を使用して決定されるMSIステータスは、疾患予後および処置の決断を導くのに役立つ。本明細書で開示される方法および関連態様で達成される結果は、例えば、より従来的なPCRに基づくMSI評価手法を使用して得られる結果と高い程度の一致を一般に有する。
マイクロサテライト不安定性ステータスを決定する方法
本願は、試料(特に、無細胞DNA(cfDNA)試料)のマイクロサテライト不安定性(MSI)ステータスおよび/または他の反復DNA不安定性ステータスを正確に決定する様々な方法を開示する。ある特定の実施形態では、MSIステータスを評価する方法は、マイクロサテライト不安定性が広範ながん型にわたって存在し得る単純リピートの広いカバレッジを可能にする、例えば、Guardant Health,Inc.(Redwood City、CA、USA)からのデジタルシークエンシングプラットフォームを使用する、cfDNAの標的化されたシークエンシングを含む。デジタルシークエンシングプラットフォームは、単純な非侵襲的採血によって単離された無細胞DNA(これは循環腫瘍DNAを含み得る)の質の高いシークエンシングを利用する、がん関連遺伝子のNGSパネルである。デジタルシークエンシングは、ほぼ全ての擬陽性を排除するために、シークエンシング後のバイオインフォマティクス再構成と組み合わせた、個別にタグ付けされたcfDNA分子のデジタルライブラリーのシークエンシング前の調製を利用する。例を挙げて説明すると、図1は、本発明の一部の実施形態に従ってMSIステータスを決定する例示的な方法ステップを概略的に描写するフローチャートを提供する。示されているよう、方法100は、ステップ110において、配列情報から複数のマイクロサテライト遺伝子座の各々に存在する多数の異なるリピート長を定量化して、複数のマイクロサテライト遺伝子座の各々についての部位スコアを生成する。配列情報は、cfDNA試料中のマイクロサテライト遺伝子座の集団から典型的には得られる。本明細書中でさらに記載されるように、所与のマイクロサテライト遺伝子座に存在する異なるリピート長の数は、一部の実施形態では確率的log尤度に基づく部位スコアを使用して定量化される。同じく本明細書中でさらに記載されるように、他の定量化手法も、それらが、試料中の体細胞由来の比較的少数のcfDNA断片を、例えば、試料収集後アーティファクト(例えば、増幅アーティファクト、シークエンシングアーティファクト、およびこれらに類するもの)から生じるノイズと、とても正確に区別するのであれば、必要に応じて利用される。
方法100は、ステップ112において、所与のマイクロサテライト遺伝子座の部位スコアをその特定のマイクロサテライト遺伝子座の各々についての部位特異的訓練済み閾値と比較することも含む。特定の遺伝子座の実験的に決定された部位スコアと、その対応する部位特異的訓練済み閾値は、複数のマイクロサテライト遺伝子座の各々について典型的には比較される。所与の遺伝子座の部位特異的訓練済み閾値は、一般に、正常または非腫瘍cfDNA試料のコホートなどの訓練DNA試料の集団に由来するその特定の遺伝子座についての所定の値である。示されているように、方法100は、ステップ114において、所与のマイクロサテライト遺伝子座を、その所与のマイクロサテライト遺伝子座の部位スコア(例えば、尤度スコアまたはこれに類するもの)が、その所与のマイクロサテライト遺伝子座の部位特異的訓練済み閾値を超える(例えば、それより統計的に大きい)場合、不安定であるとコールすることを含む。これらの比較に基づいて、マイクロサテライト不安定性スコアが生成され、このスコアは、複数のマイクロサテライト遺伝子座からの不安定であるとコールされたマイクロサテライト遺伝子座の数を含む(例えば、試料の全または総MSIスコアである)。加えて、方法100は、ステップ116において、マイクロサテライト不安定性スコアがcfDNA試料中のマイクロサテライト遺伝子座の集団の集団訓練済み閾値を超える場合、cfDNA試料のMSIステータスを不安定であると分類して、それによって不安定なcfDNA試料を同定する(例えば、試料を高度MSIであると採点または予測する)ことも含む。言い換えると、試料のMSIステータスは、ある特定の実施形態では、最小数の不安定なマイクロサテライト遺伝子座の存在により決定される。集団訓練済み閾値は、一般に、正常または非腫瘍cfDNA試料のコホートなどの訓練DNA試料の集団から導出された所定の値である。
一部の実施形態では、閾値(例えば、部位特異的訓練済み閾値、集団訓練済み閾値、およびこれらに類するもの)は、少なくとも1つの訓練DNA試料データセットから決定される、またはそのようなデータセットから別様に導出される。訓練DNA試料データセットは、少なくとも約25~少なくとも約30,000またはそれより多くの訓練試料を典型的には含む。一部の実施形態では、訓練DNA試料データセットは、約50、75、100、150、200、300、400、500、600、700、800、900、1,000、2,500、5,000、7,500、10,000、15,000、20,000、25,000、50,000、100,000、1,000,000、またはそれより多くの訓練DNA試料を含む。
ある特定の実施形態では、方法100は、追加の上流および/または下流ステップを含む。一部の実施形態では、例えば、方法100は、ステップ102において、ステップ104における対象からの試料を提供すること(例えば、対象から採取した血液試料を提供すること)で開始する。これらの実施形態では、方法100のワークフローは、ステップ106において試料中の核酸を増幅して増幅された核酸を生成すること、およびステップ108において増幅された核酸をシークエンシングして配列情報を生成すること、その後、ステップ110において配列情報から複数のマイクロサテライト遺伝子座の各々に存在する異なるリピート長の数を定量化することも典型的には含む。核酸増幅(関連試料調製を含む)、核酸シークエンシング、および関連データ解析は、本明細書中でさらに記載される。
一部の実施形態では、方法100は、ステップ116における不安定なcfDNA試料の同定から下流にある様々なステップを含む。これらについての一部の例は、ステップ118においてcfDNA試料のマイクロサテライト不安定性ステータスを、療法でインデックス化されているコンパレーター結果と比較して、対象における疾患(例えば、がんまたは別の遺伝性疾患、障害もしくは状態)を処置するためのカスタマイズされた療法を同定することを含む。他の例示的実施形態では、方法100は、ステップ122での終了の前に(例えば、対象のがんまたは別の疾患、障害もしくは状態を処置するために)、ステップ120において試料のマイクロサテライト不安定性ステータスとコンパレーター結果とが実質的にマッチする場合、同定されたカスタマイズされた療法のうちの少なくとも1つを対象に投与することも含む。
本明細書に記載の方法は、様々な代替実施形態を含む。例えば、マイクロサテライト遺伝子座の部位スコアは、必要に応じて、尤度スコアを含む。一部の実施形態では、尤度スコアは、確率的log尤度に基づくスコアを含む。これらの実施形態のうちの一部の実施形態では、方法は、アレル頻度または1つもしくは複数のエラーモード(例えば、ランダムエラーモード、鎖特異的エラーモード、および/もしくはこれらに類するもの)などの様々なパラメーターを使用して、試料から得られた配列情報における個々のマイクロサテライト遺伝子座についての確率的log尤度に基づくスコアを決定するステップを含む。アレル頻度は、試料から得られた配列情報における所与のマイクロサテライト遺伝子座に異なるリピート長を有する核酸の観測頻度を一般に含む。一部の実施形態では、特定のマイクロサテライト遺伝子座の部位スコアは、(a)所与のマイクロサテライト遺伝子座が安定であるという帰無仮説への観測核酸配列の支持を測定するスコアと、(b)所与のマイクロサテライト遺伝子座が不安定であるという対立仮説への観測核酸配列の支持を測定するスコアとの差または比を含む。帰無仮説は、部位が安定であるという仮定の下、全ての仮説の中でAICスコアが最小である仮説であり、対立仮説は、部位が不安定であるという仮定の下、全ての仮説の中でAICスコアが最小である仮説である。典型的には、部位スコアは、尤度基準、log尤度基準、事後確率基準、赤池情報量基準(AIC)、ベイズ情報量基準および/またはこれらに類するものなどの、モデル正確度の様々な尺度を使用して生成される。本明細書で開示される方法を実行する際の使用に必要に応じて適合される、統計モデル正確度の尺度を含む、統計モデリングに関するさらなる詳細は、例えば、Bruce, Practical Statistics for Data Scientists: 50 EssentialConcepts, 1st Ed., O'Reilly Media (2017)、Freedman et al.,Statistics, 4th Ed., W. W. Norton & Company (2007)、James et al.,An Introduction to Statistical Learning: with Applications in R, 1stEd., Springer (2013)、およびHastie et al., The Elements of Statistical Learning:Data Mining, Inference, and Prediction, 2nd Ed., Springer (2016)において提供されており、これらは、各々、それら全体が参照により本明細書に組み込まれる。
さらに例を挙げて説明すると、所与のマイクロサテライト遺伝子座の部位スコアは、そのマイクロサテライト遺伝子座の体細胞インデルについて検定するAICに基づく部位スコアを必要に応じて含む。これらの実施形態のうちの一部の実施形態では、所与のAICに基づく部位スコアは、以下の式:
AIC=k-log尤度
(式中、kは、モデルにおいて使用されるパラメーターの数である)
を使用して計算される。一部の実施形態では、方法は、最尤推定(MLE)(例えば、Nelder-Meadアルゴリズムまたは別のシンプレックス検索アルゴリズムを使用する)を使用してモデルのパラメーターを推定するステップを含む。方法は、以下の式:
AIC0=k-log(Pr(obs|β,γ))
(式中、AIC0は、帰無仮説であり、kは、モデルにおいて使用されるパラメーターの数であり、Prは、確率であり、obsは、所与のマイクロサテライト遺伝子座をカバーする多数の観測シーケンシングリードであり、βは、少なくとも1つの鎖特異的エラーパラメーターであり、γは、少なくとも1つのランダムエラーパラメーターである)
を使用してモデルの帰無仮説を計算するステップを必要に応じて含む。これらの実施形態のうちの一部の実施形態では、方法は、以下の式:
AICmin=minα(k-log(Pr(obs|β,γ,α))
(式中、AICminは、対立仮説であり、minαは、αの全値に対する最小化効果であり、kは、モデルにおいて使用されるパラメーターの数であり、Prは、確率であり、obsは、所与のマイクロサテライト遺伝子座をカバーする多数の観測シーケンシングリードであり、βは、少なくとも1つの鎖特異的エラーパラメーターであり、γは、少なくとも1つのランダムエラーパラメーターであり、αは、少なくとも1のアレル頻度であり、ここでαは、1つまたは複数のαiの合計が1に等しいようなアレル頻度のベクトルである)
を使用してモデルの対立仮説を計算するステップを含む。部位スコアを決定するために使用されるモデルの変化(ΔAIC)は、以下の式:
ΔAIC=AIC0-AICmin
を使用して典型的には検出される。
ある特定の実施形態では、パラメーターγは、(a)シークエンシングリード内で観測されるマイクロサテライト長が、起源となる核酸分子の鎖についての予想マイクロサテライト長より1リピート単位長い、リードレベルのエラー率;および/または(b)シークエンシングリード内で観測されるマイクロサテライト長が、起源となる核酸分子の鎖についての予想マイクロサテライト長より1リピート単位短い、リードレベルのエラー率を含む。一部の実施形態では、パラメーターβは、(a)センス鎖の予想マイクロサテライト長が、核酸由来分子の予想マイクロサテライト長より1リピート単位長い、鎖レベルのエラー率、(b)アンチセンス鎖の予想マイクロサテライト長が、核酸由来分子の予想マイクロサテライト長より1リピート単位長い、鎖レベルのエラー率、(c)センス鎖の予想マイクロサテライト長が、核酸由来分子の予想マイクロサテライト長より1リピート単位短い、鎖レベルのエラー率、および/または(d)アンチセンス鎖の予想マイクロサテライト長が、核酸由来分子の予想マイクロサテライト長より1リピート単位短い、鎖レベルのエラー率を含む。
一部の実施形態では、AICに基づく部位スコアは、以下の式:
AIC=2(k-log尤度)
(式中、kは、モデルにおいて使用されるパラメーターの数である)
を使用して計算される。これらの実施形態では、AIC0およびAICminは、上記の式を使用して計算される。
明確にするために、式AIC=2(k-log尤度)を使用してAICに基づくスコアを決定する実施形態では、部位を不安定と分類するために使用される部位特異的閾値は、式AIC=k-log尤度を使用してAICに基づくスコアが決定される、前の実施形態で使用された部位特異的閾値の2倍になる。
本明細書に記載の方法を使用して分析される試料は、典型的には様々な突然変異型アレル割合(MAF)(例えば、異なるリピート長、特異的マイクロサテライト遺伝子座または他のアレル変化を示す、試料割合)を含む。加えて、試料は、一部の実施形態では腫瘍割合を含む。ある特定の実施形態では、最大MAF(max MAF)は、所与の試料中の腫瘍割合の近似値として役立つ。腫瘍割合は、典型的には、試料中の全ての核酸の約0.05%、約0.1%、約0.2%、約0.5%、約1%、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%または約15%未満である。
一部の実施形態では、本明細書で開示される方法は、典型的には所与の試料中の核酸の約0.2%腫瘍割合の検出限界(LOD)で少なくとも約94%の感度を含む。方法は、試料中の非腫瘍DNAについて少なくとも約99%の特異度も一般に有する。試料について決定されるMSIステータスは、約1.4%~約15%の腫瘍割合範囲にわたって標準的なPCRに基づくMSI評価技法を使用して決定される試料の対応するMSIステータスと少なくとも約95%、96%、97%、98%または99%の一致も典型的には有する。一部の実施形態では、この一致は、100%である。
ある特定の実施形態では、特定の試料のMSIステータスは、試料についてのマイクロサテライト不安定性スコアが、その試料における約1、約2、約3、約4、約5、約6、約7、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約30、約40、約50、約60、約70、約80、約90、約100または100を超える不安定なマイクロサテライト遺伝子座数である場合、高度MSI(MSI-H)と分類される。ある特定の実施形態では、試料の不安定性ステータス(例えば、MSIステータス)を決定するために使用される集団訓練済み閾値は、約1、約2、約3、約4、約5、約6、約7、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約30、約40、約50、約60、約70、約80、約90、約100または100を超える不安定な反復核酸(例えば、マイクロサテライト)遺伝子座数である。一部の実施形態では、試料の集団訓練済み閾値は、不安定なマイクロサテライト遺伝子座約5である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約6である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約10である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約15である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約16である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約20である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約25である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約26である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約30である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約35である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約36である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約40である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約45である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約46である。一部の実施形態では、試料の集団訓練済み閾値は、不安定な反復核酸遺伝子座約50である。一部の実施形態では、反復核酸遺伝子座は、マイクロサテライト遺伝子座であり得る。一部の実施形態では、所与の試料のMSIステータスは、不安定なマイクロサテライト遺伝子座の数が、その試料において評価された全てのマイクロサテライト遺伝子座の約0.1%、約1%、約2%、約3%、約4%、約5%、約10%、約15%、約20%または約25%を構成する場合、MSI-Hと分類される。一部の実施形態では、約50、約60、約70、約80、約90、約100、約200、約300、約400、約500、約600、約700、約800、約900、約1000、約1100、約1200、約1300、約1400、約1500、約1600、約1700、約1800、約1900、約2000、または2000を超える反復核酸(例えば、マイクロサテライト)遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約50の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約60の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約70の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約80の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約90の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約100の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約200の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約300の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約400の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約500の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約1000の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約1100の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約1200の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約1300の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約1400の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、少なくとも1500の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、約1600の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、少なくとも1700の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、少なくとも1800の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、少なくとも1900の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、少なくとも2000の反復核酸遺伝子座が、所与の試料の反復核酸不安定性(例えば、MSI)ステータスの決定に使用される。一部の実施形態では、反復核酸遺伝子座は、マイクロサテライト遺伝子座であり得る。一部の実施形態では、反復核酸不安定性ステータスは、MSIステータスであり得る。
一部の実施形態では、方法は、対象から試料を得るステップを含む。本質的に、任意の試料タイプが必要に応じて利用される。ある特定の実施形態では、例えば、試料は、組織、血液、血漿、血清、痰、尿、精液、膣液、糞便、滑液、髄液、唾液、および/またはこれらに類するものである。必要に応じて利用される追加の例示的な試料タイプは、本明細書中でさらに記載される。典型的には、対象は、哺乳動物対象(例えば、ヒト対象)である。核酸(例えば、DNAおよび/またはRNA)の本質的にあらゆるタイプを本願で開示される方法に従って評価することができる。一部の例としては、無細胞核酸(例えば、腫瘍由来の、胎児由来の、母胎由来の、および/またはこれらに類するものの、cfDNA)、循環腫瘍細胞を含む細胞の核酸(例えば、試料中の無傷細胞の溶解により得られるもの)、循環腫瘍核酸、およびこれらに類するものが挙げられる。一部の実施形態では、試料は、無細胞DNA(cfDNA試料)を含む。一部の実施形態では、cfDNA試料は、循環腫瘍核酸を含む。
本願で開示される方法は、対象から採取された試料中の核酸から配列情報を得るステップを一般に含む。ある特定の実施形態では、配列情報は、核酸の標的化されたセグメントから得られる。本質的に任意の数のゲノム領域が必要に応じて標的とされる。標的化されたセグメントは、少なくとも10、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも2000、少なくとも5000、少なくとも10,000、少なくとも20,000または少なくとも50,000(例えば、25、50、75、100、200、300、400、500、600、700、800、900、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、15,000、25,000、30,000、35,000、40,000、45,000)の異なるまたはオーバーラップしているゲノム領域を含むことができる。一部の実施形態では、標的化されたセグメントは、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、少なくとも600、または少なくとも700遺伝子の選択領域を含む。一部の実施形態では、標的化されたセグメントは、少なくとも70遺伝子の選択領域を含む。一部の実施形態では、標的化されたセグメントは、少なくとも500遺伝子の領域を含む。
これらの実施形態では、方法は、シークエンシング用の核酸を調製するための様々な試料またはライブラリー調製ステップを典型的には含む。多くの異なる試料調製技法が当業者には周知である。これらの技法のうちの本質的に任意の技法が、本明細書に記載の方法を実行する際に使用されるか、またはその使用に適合される。例えば、所与の試料中の核酸を他の成分から単離するための様々な精製ステップに加えて、シークエンシング用の核酸を調製するための典型的なステップは、分子識別子もしくはバーコードを核酸にタグ付けすること、アダプター(例えば、これはバーコードを含むこともある)を付加させること、核酸を1回または複数回増幅させること、核酸の標的化されたセグメントを(例えば、様々な標的捕捉戦略などを使用して)濃縮すること、および/またはこれらに類することを含む。例示的なライブラリー調製プロセスは、本明細書中でさらに記載される。核酸試料/ライブラリー調製に関するさらなる詳細は、例えば、van Dijk et al., Library preparation methods for next-generationsequencing: Tone down the bias, Experimental Cell Research, 322(1):12-20 (2014)、Micic(Ed.), Sample Preparation Techniques for Soil, Plant, and Animal Samples (SpringerProtocols Handbooks), 1st Ed., Humana Press (2016)、およびChiu,Next-Generation Sequencing and Sequence Data Analysis, Bentham SciencePublishers (2018)にも記載されており、これらは、各々、それら全体が参照により本明細書に組み込まれる。
本明細書で開示される方法により決定されるマイクロサテライトおよび/または他の反復核酸不安定性ステータスは、対象における疾患もしくは状態、特にがん、の存在を診断するために、そのような疾患もしくは状態を特徴付けるために(例えば、所与のがんをステージ分類するために、がんの不均一性を決定するために、およびこれらに類することのために)、処置に対する応答をモニターするために、所与の疾患もしくは状態を発症する潜在的リスクを評価するために、および/または疾患もしくは状態の予後を評価するために、必要に応じて使用される。マイクロサテライトおよび/または他の反復核酸不安定性ステータスは、がんの特定の形態を特徴付けるためにも必要に応じて使用される。がんは、組成とステージ分類の両方の点で不均一であることが多いので、マイクロサテライトおよび/または他の反復核酸不安定性ステータスは、がんの特異的亜型の特徴付けを可能にし、それによって診断および処置の選択を支援することができる。この情報はまた、がんの特定の型の予後に関する手がかりを対象もしくは医療関係者に提供することができ、対象および/または医療関係者が疾患の進行に従って処置選択肢を適合できるようにすることができる。一部のがんは、それらが進行するにつれて、より侵襲的になり、遺伝的により不安定になる。他の腫瘍は、良性、不活性または休止状態のままである。
マイクロサテライトおよび/または他の反復核酸不安定性ステータスは、疾患進行の決定および/または再発のモニタリングにも有用であり得る。ある特定の場合、例えば、成功した処置は、最初は、観測されるマイクロサテライトおよび/または他の反復核酸不安定性をがん細胞死数および脱落核酸数の増加として増加させる。これらの場合、その後、治療が進むにつれて、マイクロサテライトおよび/または他の反復核酸不安定は、腫瘍のサイズが低減し続けるので、通常は低下することになる。他の場合、成功した処置は、マイクロサテライトおよび/または他の反復核酸不安定を、そのような不安定性の初期増加なしに低下させることもできる。加えて、がんが処置後に寛解期にあることが認められる場合、マイクロサテライトおよび/または他の反復核酸不安定性ステータスを使用して、患者における残存疾患または疾患の再発をモニターすることができる。
試料
試料は、対象から単離された任意の生体試料であり得る。試料は、体組織、全血、血小板、血清、血漿、糞便、赤血球、白血球(white blood cells)または白血球(leucocytes)、内皮細胞、組織生検試料(例えば、既知のまたは疑わしい固形腫瘍からの生検試料)、脳脊髄液、滑液、リンパ液、腹水、間質または細胞外液(例えば、細胞間隙からの流体)、歯肉滲出液、歯肉溝滲出液(crevicular fluid)、骨髄、胸膜滲出液、脳脊髄液、唾液、粘液、痰、精液、汗、尿を含み得る。試料は、好ましくは、体液、特に、血液およびその分画物、ならびに尿である。そのような試料は、腫瘍から脱落した核酸を含む。核酸は、DNAおよびRNAを含むことができ、二本鎖形態および一本鎖形態であり得る。試料は、対象から最初に単離された形態であってもよく、あるいは細胞などの成分を除去もしくは付加するための、ある成分を別の成分に対して濃縮するための、または核酸のある形態を別の形態に、例えば、RNAをDNAに、もしくは一本鎖核酸を二本鎖核酸に変換するための、さらなる処理に付されたものであってもよい。したがって、例えば、分析用の体液試料は、無細胞核酸、例えば無細胞DNA(cfDNA)、を含有する血清または血漿である。
一部の実施形態では、対象から採取される体液の試料体積は、シークエンシングされる領域についての所望のリード深度に依存する。例示的な体積は、約0.4~40ml、約5~20ml、約10~20mlである。例えば、体積は、約0.5ml、約1ml、約5ml、約10ml、約20ml、約30ml、約40ml、またはそれより多いミリリットルであり得る。試料採取される血漿の体積は、典型的には、約5ml~約20mlの間である。
試料は、様々な量の核酸を含むことができる。典型的には、所与の試料中の核酸の量は、複数のゲノム等価物と同等とみなされる。例えば、DNA約30ngの試料は、一倍体ヒトゲノム等価物約10,000(104)個であり、cfDNAの場合は、個々のポリヌクレオチド分子約2千億(2×1011)個である。同様に、DNA約100ngの試料は、一倍体ヒトゲノム等価物約30,000個であり、cfDNAの場合は、個々の分子約6千億個である。
一部の実施形態では、試料は、異なる供給源からの、例えば、細胞からの、および無細胞供給源(例えば、血液試料など)からの、核酸を含む。典型的には、試料は、突然変異を有する核酸を含む。例えば、試料は、生殖細胞系突然変異および/または体細胞突然変異を有するDNAを必要に応じて含む。典型的には、試料は、がん関連突然変異(例えば、がん関連体細胞突然変異)を有するDNAを含む。
増幅前の試料中の無細胞核酸の例示的な量は、典型的には、約1フェムトグラム(fg)~約1マイクログラム(μg)、例えば、約1ピコグラム(pg)~約200ナノグラム(ng)、約1ng~約100ng、約10ng~約1000ngの範囲である。一部の実施形態では、試料は、約600ng以下、約500ng以下、約400ng以下、約300ng以下、約200ng以下、約100ng以下、約50ng以下、または約20ng以下の無細胞核酸分子を含む。必要に応じて、量は、無細胞核酸分子少なくとも約1fg、少なくとも約10fg、少なくとも約100fg、少なくとも約1pg、少なくとも約10pg、少なくとも約100pg、少なくとも約1ng、少なくとも約10ng、少なくとも約100ng、少なくとも約150ng、または少なくとも約200ngである。ある特定の実施形態では、量は、無細胞核酸分子約1fg、約10fg、約100fg、約1pg、約10pg、約100pg、約1ng、約10ng、約100ng、約150ng、または約200ng以下である。ある特定の実施形態では、方法は、試料から約5ng~約30ngの間の無細胞核酸分子を得るステップを含む。ある特定の実施形態では、方法は、試料から約5ng~約100ngの間の無細胞核酸分子を得るステップを含む。ある特定の実施形態では、方法は、試料から約5ng~約150ngの間の無細胞核酸分子を得るステップを含む。ある特定の実施形態では、方法は、試料から約5ng~約200ngの間の無細胞核酸分子を得るステップを含む。一部の実施形態では、量は、試料からの無細胞核酸分子約100ng以下である。一部の実施形態では、量は、試料からの無細胞核酸分子約150ng以下である。一部の実施形態では、量は、試料からの無細胞核酸分子約200ng以下である。一部の実施形態では、量は、試料からの無細胞核酸分子約250ng以下である。一部の実施形態では、量は、試料からの無細胞核酸分子約300ng以下である。ある特定の実施形態では、方法は、試料から約1fg~約200ngの間の無細胞核酸分子を得るステップを含む。
無細胞核酸分子は、典型的には、長さ約100ヌクレオチド~長さ約500ヌクレオチドの間のサイズ分布を有し、長さ約110ヌクレオチド~長さ約230ヌクレオチド分子が試料中の分子の約90%に相当し、最頻値は長さ約168ヌクレオチドであり、第2の副ピークが長さ約240~約440ヌクレオチドの間の範囲内にある。ある特定の実施形態では、無細胞核酸は、長さ約160~約180ヌクレオチド、または長さ約320~約360ヌクレオチド、または長さ約440~約480ヌクレオチドである。
一部の実施形態では、無細胞核酸は、溶液中で見出されるような無細胞核酸が体液の無傷細胞および他の非可溶性成分から分離される、分配ステップによって体液から単離される。これらの実施形態のうちの一部の実施形態では、分配は、遠心分離または濾過などの技法を含む。あるいは、体液中の細胞は溶解され、無細胞核酸と細胞核酸が一緒に処理される。一般に、緩衝剤の添加および洗浄ステップの後、無細胞核酸は、例えばアルコールで、沈殿される。ある特定の実施形態では、夾雑物または塩を除去するためのシリカ系カラムなどの追加の浄化ステップが、使用される。例えば、非特異的バルク担体核酸が、収率などの、例示的手順のある特定の態様を最適化するために、反応の至る所で必要に応じて添加される。そのような処理の後、試料は、二本鎖DNA、一本鎖DNAおよび/または一本鎖RNAを含む様々な形態の核酸を典型的には含む。必要に応じて、一本鎖DNAおよび/または一本鎖RNAは、後続の処理および分析ステップに含められるように二本鎖形態に変換される。
核酸タグ
一部の実施形態では、核酸分子(ポリヌクレオチドの試料からのもの)に、試料インデックスおよび/または分子バーコード(一般に「タグ」と呼ばれる)でタグ付けをすることができる。タグは、数ある方法の中でも特に、化学合成、ライゲーション(例えば、平滑末端ライゲーションもしくは粘着末端ライゲーション)、またはオーバーラップ伸長ポリメラーゼ連鎖反応(PCR)によって、アダプターに組み込むことまたは別様に結合させることができる。最終的にはそのようなアダプターを標的核酸分子に結合させることができる。他の実施形態では、従来の核酸増幅方法を使用して核酸分子に試料インデックスを導入するために1または複数ラウンドの増幅サイクル(例えば、PCR増幅)が適用される。増幅を1つまたは複数の反応混合物(例えば、アレイの形での複数のマイクロウェル)で行うことができる。分子バーコードおよび/または試料インデックスを、同時にまたは任意の順番で導入することができる。一部の実施形態では、分子バーコードおよび/または試料インデックスは、配列捕捉ステップが実行される前および/または実行された後に導入される。一部の実施形態では、分子バーコードのみがプローブの捕捉前に導入され、試料インデックスは、配列捕捉ステップが実行された後に導入される。一部の実施形態では、分子バーコードと試料インデックスの両方が、プローブに基づく捕捉ステップの実行前に導入される。一部の実施形態では、試料インデックスは、配列捕捉ステップが実行された後に導入される。一部の実施形態では、分子バーコードは、ライゲーション(例えば、平滑末端ライゲーションまたは粘着末端ライゲーション)によってアダプターを介して試料中の核酸分子(例えば、cfDNA分子)に組み込まれる。一部の実施形態では、試料インデックスは、オーバーラップ伸長ポリメラーゼ連鎖反応(PCR)によって試料中の核酸分子(例えば、cfDNA分子)に組み込まれる。典型的には、配列捕捉プロトコールは、標的化された核酸配列、例えばゲノム領域のコード配列、に相補的な一本鎖核酸分子を導入することを含み、そのような領域の突然変異は、がん型に関連付けられている。
一部の実施形態では、タグは、試料核酸分子の一方の末端に位置することもあり、または両方の末端に位置することもある。一部の実施形態では、タグは、所定のまたはランダムまたはセミランダム配列オリゴヌクレオチドである。一部の実施形態では、タグは、長さ約500、200、100、50、20、10、9、8、7、6、5、4、3、2または1ヌクレオチド未満である。タグを試料核酸に無作為にまたは作為的に連結させることができる。
一部の実施形態では、各試料に、試料インデックスまたは試料インデックスの組合せが一意的にタグ付けされる。一部の実施形態では、試料または二次試料の各核酸分子に、分子バーコードまたは分子バーコードの組合せが一意的にタグ付けされる。他の実施形態では、複数の分子バーコードの中の分子バーコードが互いに必ずしも一意的でないような複数の分子バーコード(例えば、非一意的分子バーコード)が使用されることもある。これらの実施形態では、分子バーコードは、一般に、個々の分子に(例えば、ライゲーションにより)結合され、その結果、分子バーコードとそれが結合され得る配列との組合せによって、個々に追跡することができる一意の配列が生じる。内在性配列情報(例えば、試料中の元の核酸分子の配列に対応する始まり(開始)および/もしくは終了(終結)部分、配列リードの一方もしくは両方の末端の部分配列、配列リードの長さ、ならびに/または試料中の元の核酸分子の長さ)との組合せでの非一意的にタグ付けされた分子バーコードの検出は、特定の分子に一意の正体を与えることを可能にする。個々の配列リードの長さ、または個々の配列リードの塩基対の数もまた、所与の分子に一意の正体を与えるために必要に応じて使用される。本明細書で記載されるように、一意の正体が与えられた核酸の単一の鎖からの断片は、それによって、親鎖および/または相補鎖からの断片のその後の同定を可能にすることができる。
一部の実施形態では、分子バーコードは、識別子のセット(例えば、一意的分子バーコードと非一意的分子バーコードの組合せ)の予想される比で試料中の分子に導入される。1つの例となる形式は、約2~約1,000,000の異なる分子バーコード、または約5~約150の異なる分子バーコード、または約20~約50の異なる分子バーコードを使用する。あるいは、約25~約1,000,000の異なる分子バーコードが使用されることもある。分子バーコードを標的分子の両方の末端にライゲーションすることができる。例えば、20~50×20~50の分子バーコードを使用することができる。一部の実施形態では、20~50の異なる分子バーコードを使用することができる。一部の実施形態では、5~100の異なる分子バーコードを使用することができる。一部の実施形態では、5~150の分子バーコードを使用することができる。一部の実施形態では、5~200の異なる分子バーコードを使用することができる。識別子のそのような数は、典型的には、同じ始点および終点を有する異なる分子が、識別子の異なる組合せを受け取る高い確率(例えば、少なくとも94%、99.5%、99.99%、または99.999%)を有するのに十分な数である。一部の実施形態では、分子の約80%、約90%、約95%または約99%が、分子バーコードの同じ組合せを有する。
一部の実施形態では、反応中の一意的または非一意的分子バーコードの割り当ては、例えば、米国特許出願公開第20010053519号、同第20030152490号および同第20110160078号、ならびに米国特許第6,582,908号、同第7,537,898号、同第9,598,731号および同第9,902,992号に記載されている方法およびシステムを使用して実行することができ、これらの特許文献の各々は、これによりその全体が参照により本明細書に組み込まれる。あるいは、一部の実施形態では、内在性配列情報(例えば、開始および/もしくは終結位置、配列の一方もしくは両方の末端の部分配列、ならびに/または長さ)のみを使用して、試料の異なる核酸分子を同定することができる。
核酸増幅
アダプターが隣接している試料核酸は、増幅すべきDNA分子に隣接しているアダプター内のプライマー結合部位に結合する核酸プライマーを使用してPCRおよび他の増幅方法により典型的には増幅される。一部の実施形態では、増幅方法は、熱サイクリングの結果として生じる、伸長、変性およびアニーリングのサイクルを含み、または例えば転写媒介増幅の場合のような、等温増幅であってもよい。必要に応じて利用される他の例示的な増幅方法としては、数ある手法の中でも特に、リガーゼ連鎖反応、鎖置換増幅、核酸配列に基づく増幅、および自己持続的配列複製が挙げられる。
従来の核酸増幅方法を使用して核酸分子に試料インデックスを導入するために1または複数ラウンドの増幅サイクルが一般に適用される。増幅は、典型的には、1つまたは複数の反応混合物で行われる。分子タグおよび試料インデックス/タグを、必要に応じて、同時にまたは任意の順番で導入することができる。一部の実施形態では、分子タグおよび試料インデックス/タグは、核酸分子捕捉ステップ(すなわち、核酸濃縮)が実行される前および/または実行された後に導入される。一部の実施形態では、分子タグのみがプローブ捕捉前に導入され、試料インデックス/タグは、配列捕捉ステップが実行された後に導入される。ある特定の実施形態では、分子タグと試料インデックス/タグの両方が、プローブに基づく捕捉ステップの実行前に導入される。一部の実施形態では、試料インデックス/タグは、配列捕捉ステップが実行された後に導入される。典型的には、配列捕捉プロトコールは、標的化された核酸配列、例えばゲノム領域のコード配列、に相補的な一本鎖分子と、がん型に関連付けられているそのような領域の突然変異とを導入することを含む。典型的には、増幅反応は、分子タグおよび試料インデックス/タグが非一意的にまたは一意的にタグ付けされた複数の核酸アンプリコンを、約200ヌクレオチド(nt)~約700nt、250nt~約350nt、または約320nt~約550ntのサイズ範囲で生成する。一部の実施形態では、アンプリコンは約300ntのサイズを有する。一部の実施形態では、アンプリコンは約500ntのサイズを有する。
核酸濃縮
一部の実施形態では、配列は、核酸をシークエンシングする前に濃縮される。濃縮は、特異的標的領域(「標的配列」)に対して必要に応じて実行される。一部の実施形態では、差次的タイリングおよび捕捉機序を使用して、1つまたは複数のベイトセットパネルのために選択された核酸捕捉用プローブ(「ベイト」)を用いて、目的の標的領域を濃縮することができる。差次的タイリングおよび捕捉機序は、一連の制約(例えば、シークエンシング負荷、各ベイトの有用性などのような、シーケンサー制約)を受けることになるベイトに関連するゲノム領域にわたって(例えば、異なる「解像度」で)差次的にタイリングするために、および下流のシークエンシングのための所望のレベルの標的核酸を捕捉するために、異なる相対濃度のベイトセットを一般に使用する。目的のこれらの標的化されたゲノム領域は、核酸構築物の天然または合成ヌクレオチド配列を必要に応じて含む。一部の実施形態では、目的の1つまたは複数の領域に対するプローブを有するビオチン標識ビーズを使用して、標的配列を捕捉することができ、必要に応じて、その後、それらの領域を増幅して目的の領域を濃縮することができる。
配列捕捉は、標的核酸配列にハイブリダイズするオリゴヌクレオチドプローブの使用を典型的には含む。ある特定の実施形態では、プローブセット戦略は、目的の領域全体にわたってプローブをタイリングすることを含む。そのようなプローブは、例えば、長さ約60~約120ヌクレオチドであり得る。セットは、約2倍、3倍、4倍、5倍、6倍、8倍、9倍、10倍、15倍、20倍、30倍、40倍、50倍のまたは50倍を超える深度を有し得る。配列捕捉の有効性は、一般に、プローブの配列に相補的(またはほぼ相補的)である標的分子内の配列の長さに一部は依存する。
核酸シークエンシング
事前に増幅されたまたはされていない、必要に応じてアダプターが隣接している試料核酸が、一般に、シークエンシングを受けることになる。必要に応じて利用さるシークエンシング方法または市販の形式は、例えば、サンガーシークエンシング;ハイスループットシークエンシング;パイロシークエンシング;合成によるシークエンシング;単一分子シークエンシング;ナノポアベースのシークエンシング;半導体シークエンシング;ライゲーションによるシークエンシング;ハイブリダイゼーションによるシークエンシング;RNA-Seq(Illumina);Digital Gene Expression(Helicos);次世代シークエンシング(NGS);Single Molecule Sequencing by Synthesis(SMSS)(Helicos);大規模並列シーケンシング;Clonal Single Molecule Array(Solexa);ショットガンシークエンシング;Ion Torrent;Oxford Nanopore;Roche Genia;Maxim-Gilbertシークエンシング;プライマーウォーキング;PacBio、SOLiD、Ion Torrentまたはナノポアプラットフォームを使用するシークエンシングを含む。複数のレーン、複数のチャネル、複数のウェル、または複数の試料セットを実質的に同時に処理する他の手段を含み得る、様々な試料処理ユニットで、シークエンシング反応を実行することができる。試料処理ユニットは、複数の試行を同時に処理することを可能にする複数の試料チャンバも含むことができる。
シークエンシング反応は、がんのまたは他の疾患のマーカー(例えば、マイクロサテライトおよび/または他の反復核酸エレメント)を含有することが既知の1つまたは複数の核酸断片タイプまたは領域を用いて実行することができる。シークエンシング反応は、試料中に存在する任意の核酸断片を用いて実行することもできる。配列反応は、ゲノムの少なくとも約5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%または100%というゲノムの配列カバレッジを生じさせることができる。他の場合には、ゲノムの配列カバレッジは、ゲノムの約5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%または100%未満であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの約0.01%、0.02%、0.05%、0.1%、0.2%、0.5%、1%、2%または5%未満であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの約0.01%未満であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの約0.02%未満であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの約0.05%未満であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの約0.1%未満であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの約0.2%未満であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの約0.5%未満であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの約1%未満であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの約2%未満であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの約5%未満であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの少なくとも約5%であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの少なくとも約10%であり得る。一部の実施形態では、ゲノムの配列カバレッジは、ゲノムの少なくとも約20%であり得る。
マルチプレックスシークエンシング技法を使用して、同時シークエンシング反応を実行することができる。一部の実施形態では、無細胞ポリヌクレオチドは、少なくとも約1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000または100,000のシークエンシング反応を用いてシークエンシングされる。他の実施形態では、無細胞ポリヌクレオチドは、約1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000または100,000未満のシークエンシング反応を用いてシークエンシングされる。シークエンシング反応は、典型的には逐次的にまたは同時に実行される。その後のデータ解析は、一般に、シークエンシング反応の全てまたは一部に関して実行される。一部の実施形態では、データ解析は、少なくとも約1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000または100,000のシークエンシング反応に関して実行される。他の実施形態では、データ解析は、約1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000または100,000未満のシークエンシング反応に関して実行されることもある。例示的なリード深度は、1遺伝子座(塩基位置)につき約1000~約50000リード、または1遺伝子座につき>50,000リードである。
一部の実施形態では、核酸集団は、一方または両方の末端に一本鎖オーバーハングを有する二本鎖核酸上に平滑末端を酵素的に形成することによってシークエンシング用に調製される。これらの実施形態では、集団は、dNTP形態のヌクレオチド(例えば、A、C、GおよびTまたはU)の存在下、5’-3’DNAポリメラーゼ活性および3’-5’エキソヌクレアーゼ活性を有する酵素で典型的には処置される。必要に応じて使用される例示的な酵素またはそれらの触媒断片としては、大きいクレノウ断片、およびT4ポリメラーゼが挙げられる。5’オーバーハングにおいて、酵素は、対向する鎖の埋め込まれた3’末端を、それが5’末端とぴったり重なって平滑末端を生成するまで典型的には伸長させる。3’オーバーハングにおいて、酵素は、一般に、対向する鎖の3’末端から5’末端までを消化し、5’末端を越えて消化することもある。この消化が対向する鎖の5’末端を越えて進行した場合、5’オーバーハングに使用される同じポリメラーゼ活性を有する酵素がそのギャップを埋めることができる。二本鎖核酸上の平滑末端の形成は、例えば、アダプターの結合およびその後の増幅を容易にすることができる。
一部の実施形態では、核酸集団は、二本鎖への一本酸核酸の変換および/またはDNAへのRNAの変換などの、さらなる処理を受けることになる。核酸のこれらの形態はまた、必要に応じて、アダプターに連結され、増幅される。
事前に増幅されたまたはされていない核酸は、上記の平滑末端を形成するプロセスを受けることになり、必要に応じて、試料中の他の核酸をシークエンシングして、シークエンシングされた核酸を生成することができる。シークエンシングされた核酸は、核酸の配列(すなわち、配列情報)を指すこともあり、または配列が決定された核酸を指すこともある。シークエンシングを実行して、試料中の個々の核酸分子の増幅産物のコンセンサス配列から直接または間接的に個々の核酸分子の配列データを得ることができる。
一部の実施形態では、平滑末端形成後、試料中の一本鎖オーバーハングを有する二本鎖核酸の両方の末端が、バーコードを含むアダプターに連結され、シークエンシングによって、核酸配列はもちろん、アダプターにより導入された直列に配置されているバーコードも決定される。平滑末端DNA分子は、少なくとも部分的に二本鎖のアダプター(例えば、Y型または釣り鐘型アダプター)の平滑末端に必要に応じてライゲーションされる。あるいは、ライゲーション(例えば、粘着末端ライゲーション)を容易にするために、試料核酸およびアダプターの平滑末端に、相補的ヌクレオチドを有する尾部を付加させることができる。
核酸試料は、いずれか2つの同一の同じ核酸が、両末端に連結されたアダプターからアダプターバーコードの同じ組合せを受け取るという確率が低くなる(例えば、<1または<0.1%)ように、十分な数のアダプターと典型的には接触させられる。この方法でのアダプターの使用は、参照核酸上のものと同じ始点および終点を有し、バーコードの同じ組合せに連結されている、核酸配列のファミリーの同定を可能にする。そのようなファミリーは、試料中の核酸の増幅産物の増幅前の配列を示す。ファミリーメンバーの配列をコンパイルして、平滑末端形成およびアダプター結合により改変された元の試料中の核酸のコンセンサスヌクレオチドまたは完全コンセンサス配列を導出することができる。言い換えると、試料中の核酸の特定位置を占有するヌクレオチドは、ファミリーメンバー配列内のその対応する位置を占有するヌクレオチドのコンセンサスヌクレオチドであると決定される。ファミリーは、二本鎖核酸の一方の鎖の配列を含むこともあり、または両方の鎖の配列を含むこともある。ファミリーのメンバーが、二本鎖核酸の両方の鎖の配列を含む場合、全ての配列をコンパイルしてコンセンサスヌクレオチドまたは配列を導出するために、一方の鎖の配列がそれらの相補配列に変換される。一部のファミリーは、単一メンバー配列しか含まない。この場合、この配列を増幅前の試料中の核酸の配列と考えることができる。あるいは、単一メンバー配列しか有さないファミリーをその後の分析から除外することができる。
シークエンシングされた核酸におけるヌクレオチド変異は、シークエンシングされた核酸を参照配列と比較することにより決定することができる。参照配列は、多くの場合、配列が分かっている、例えば、対象からの全または部分ゲノム配列(例えば、ヒト対象の全ゲノム配列)が分かっている。参照配列は、例えば、hG19またはhG38であり得る。シークエンシングされた核酸は、上記のように、試料中の核酸について直接決定された配列を表すこともあり、またはそのような核酸の増幅産物の配列のコンセンサス配列を表すこともある。参照配列上の1つまたは複数の指定位置で比較を実行することができる。それぞれの配列を最大限アラインメントしたときに参照配列の指定位置と一致する位置を含むシークエンシングされた核酸のサブセットを同定することができる。そのようなサブセット内で、もしあれば、シークエンシングされたどの核酸が、指定位置にヌクレオチド変異を含むのかを決定することができ、もしあれば、どれが参照ヌクレオチド(すなわち、参照配列内のものと同じもの)を含むのかを、必要に応じて決定することができる。ヌクレオチド変異体を含むサブセット中のシークエンシングされた核酸の数が選択された閾値を超える場合には、変異型ヌクレオチドが指定位置でコールされ得る。閾値は、数ある可能性の中でも特に、ヌクレオチド変異体を含むサブセット内のシークエンシングされた核酸少なくとも1、2、3、4、5、6、7、9もしくは10などの、単純な数であってもよく、またはヌクレオチド変異体を含むサブセット内のシークエンシングされた核酸に対して少なくとも0.5、1、2、3、4、5、10、15もしくは20などの、比であってもよい。参照配列中の目的の任意の指定位置についての比較を繰り返すことができる。ときには、参照配列上の連続する少なくとも約20、100、200または300位置、例えば、連続する約20~500または約50~300位置を占有する指定位置について比較を実行することができる。
本明細書に記載の形式および適用を含む、核酸シークエンシングに関するさらなる詳細は、例えば、Levy et al., Annual Review of Genomics and Human Genetics, 17:95-115 (2016)、Liu et al., J. of Biomedicine and Biotechnology, Volume 2012,Article ID 251364:1-11 (2012)、Voelkerding et al., Clinical Chem., 55: 641-658(2009)、MacLean et al., Nature Rev. Microbiol., 7: 287-296 (2009)、Astier et al.,J Am Chem Soc., 128(5):1705-10 (2006)、米国特許第6,210,891号、米国特許第6,258,568号、米国特許第6,833,246号、米国特許第7,115,400号、米国特許第6,969,488号、米国特許第5,912,148号、米国特許第6,130,073号、米国特許第7,169,560号、米国特許第7,282,337号、米国特許第7,482,120号、米国特許第7,501,245号、米国特許第6,818,395号、米国特許第6,911,345号、米国特許第7,501,245号、米国特許第7,329,492号、米国特許第7,170,050号、米国特許第7,302,146号、米国特許第7,313,308号、および米国特許第7,476,503号においても提供されており、これらの参考文献は、各々、それら全体が参照により本明細書に組み込まれる。
コンパレーター結果
本願で開示される方法に従って決定される所与の対象のマイクロサテライトおよび/または他の反復核酸不安定性ステータスは、その対象のためのカスタマイズされた療法または標的化療法を同定するために参照集団からのコンパレーター結果のデータベースと典型的には比較される。一部の実施形態では、検査対象のマイクロサテライトおよび/または他の反復核酸不安定性ステータスならびにコンパレーター結果は、例えば、全ゲノムまたは全エクソームにわたって測定されるが、他の実施形態では、これらのマーカーは、例えば、ゲノムまたはエクソームのサブセットまたは標的領域に基づいて測定され、例えば、全ゲノムまたは全エクソームについてのマイクロサテライト不安定性を決定するために、必要に応じて外挿される。典型的には、参照集団は、検査対象と同じがん型を有する患者、および/または検査対象と同じ療法を受けているもしくは受けたことがある患者を含む。一部の実施形態では、検査対象マイクロサテライトおよび/または他の反復核酸不安定性ステータス、ならびにコンパレーターマイクロサテライトおよび/または他の反復核酸不安定性ステータスは、遺伝子またはゲノム領域の所定のまたは選択されたセットにおける突然変異数または荷重を決定することにより測定される。本質的に任意の遺伝子(例えば、がん遺伝子)が必要に応じてそのような解析に選択される。これらの実施形態のうちのある特定の実施形態では、選択される遺伝子またはゲノム領域は、少なくとも約50、100、200、300、400、500、600、700、800、900、1000、1,500、2,000またはそれより多くの選択される遺伝子またはゲノム領域を含む。これらの実施形態のうちの一部の実施形態では、選択される遺伝子またはゲノム領域は、表1に収載されている1つまたは複数の遺伝子を必要に応じて含む。
がんおよび他の疾患
ある特定の実施形態では、本明細書で開示される方法およびシステムは、患者における所与の疾患、障害または状態を処置するためのカスタマイズされた療法を同定するために使用される。典型的には、着目疾患は、ある種のがんである。そのようながんの非限定的な例としては、胆道がん、膀胱がん、移行細胞癌、尿路上皮癌、脳がん、神経膠腫、星細胞腫、乳癌、化生性癌、子宮頸がん、子宮頸部扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス結腸直腸がん、結腸直腸腺癌、消化管間質腫瘍(GIST)、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼黒色腫、ぶどう膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、腎明細胞癌、移行細胞癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ球性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ球性(CLL)、慢性骨髄性(CML)、慢性骨髄単球性(CMML)、肝臓がん、肝臓癌、ヘパトーマ、肝細胞癌、胆管細胞癌、肝芽腫、肺がん、非小細胞肺がん(NSCLC)、中皮腫、B細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、T細胞リンパ腫、非ホジキンリンパ腫、前駆Tリンパ芽球性リンパ腫/白血病、末梢性T細胞リンパ腫、多発性骨髄腫、上咽頭癌(NPC)、神経芽腫、中咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵臓がん、膵管腺癌、偽乳頭新生物、腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍(GIST)、子宮がん、および子宮肉腫が挙げられる。
本明細書で開示される方法およびシステムを使用して必要に応じて評価される他の遺伝性疾患、障害または状態の非限定的な例としては、軟骨形成不全、アルファ-1アンチトリプシン欠損症、抗リン脂質症候群、自閉症、常染色体優性多発性嚢胞腎、シャルコー・マリー・トゥース(CMT)、猫鳴き、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第V因子ライデン血栓性素因、家族性高コレステロール血症、家族性地中海熱、脆弱X症候群、ゴーシェ病、ヘモクロマトーシス、血友病、全前脳胞症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド異常、ポルフィリン症、早老症、網膜色素変性、重症複合免疫不全(scid)、鎌状赤血球症、脊髄性筋萎縮症、テイ・サックス、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心臓顔面症候群、WAGR症候群、ウィルソン病、またはこれらに類するものが挙げられる。
カスタマイズされた療法および関連投与
一部の実施形態では、本明細書で開示される方法は、所与のマイクロサテライトおよび/または他の反復核酸不安定性ステータスを有する患者にカスタマイズされた療法を同定すること、およびそれを投与することに関する。本質的に任意のがん療法(例えば、外科的療法、放射線療法、化学療法、および/またはこれらに類するもの)が、これらの方法の一部として含まれる。典型的には、カスタマイズされた療法は、少なくとも1つの免疫療法(または免疫治療剤)を含む。免疫療法は、所与のがん型に対する免疫応答を強化する方法を一般に指す。ある特定の実施形態では、免疫療法は、腫瘍またはがんに対するT細胞応答を強化する方法を指す。
一部の実施形態では、免疫療法または免疫治療剤は、免疫チェックポイント分子を標的とする。ある特定の腫瘍は、免疫チェックポイント経路を利用することにより免疫系を回避することができる。したがって、免疫チェックポイントの標的化は、免疫系を回避する腫瘍の能力への対抗におよびある特定のがんに対する抗腫瘍免疫の活性化に有効な手法として浮上してきた。Pardoll, Nature Reviews Cancer, 2012, 12:252-264。
ある特定の実施形態では、免疫チェックポイント分子は、抗原に対するT細胞応答に関与するシグナルを低減させる阻害分子である。例えば、CTLA4は、T細胞上に発現され、抗原提示細胞上のCD80(B7.1としても公知)またはCD86(B7.2としても公知)に結合することによってT細胞活性化の下方調節に関与する。PD-1は、T細胞上に発現される別の阻害チェックポイント分子である。PD-1は、炎症反応中の末梢組織におけるT細胞の活性を制限する。加えて、PD-1のリガンド(PD-L1またはPD-L2)は、多くの異なる腫瘍の表面で一般に上方調節され、その結果、腫瘍微小環境における抗腫瘍免疫が下方調節されることになる。ある特定の実施形態では、阻害性免疫チェックポイント分子は、CTLA4またはPD-1である。他の実施形態では、阻害性免疫チェックポイント分子は、PD-L1またはPD-L2などの、PD-1のリガンドである。他の実施形態では、阻害性免疫チェックポイント分子は、CD80またはCD86などの、CTLA4のリガンドである。他の実施形態では、阻害性免疫チェックポイント分子は、リンパ球活性化遺伝子3(LAG3)、キラー細胞免疫グロブリン様受容体(KIR)、T細胞膜タンパク質3(TIM3)、ガレクチン9(GAL9)、またはアデノシンA2a受容体(A2aR)である。
これらの免疫チェックポイント分子を標的とするアンタゴニストを使用して、ある特定のがんに対する抗原特異的T細胞応答を強化することができる。したがって、ある特定の実施形態では、免疫療法または免疫治療剤は、阻害性免疫チェックポイント分子のアンタゴニストである。ある特定の実施形態では、阻害性免疫チェックポイント分子は、PD-1である。ある特定の実施形態では、阻害性免疫チェックポイント分子は、PD-L1である。ある特定の実施形態では、阻害性免疫チェックポイント分子のアンタゴニストは、抗体(例えば、モノクローナル抗体)である。ある特定の実施形態では、抗体またはモノクローナル抗体は、抗CTLA4、抗PD-1、抗PD-L1、または抗PD-L2抗体である。ある特定の実施形態では、抗体は、モノクローナルPD-1抗体である。一部の実施形態では、抗体は、モノクローナルPD-L1抗体である。ある特定の実施形態では、モノクローナル抗体は、抗CTLA4抗体と抗PD-1抗体、抗CTLA4抗体と抗PD-L1抗体、または抗PD-L1抗体と抗PD-1抗体の組合せである。ある特定の実施形態では、抗PD-1抗体は、ペムブロリズマブ(Keytruda(登録商標))またはニボルマブ(Opdivo(登録商標))のうちの1つまたは複数である。ある特定の実施形態では、抗CTLA4抗体は、イピリムマブ(Yervoy(登録商標))である。ある特定の実施形態では、抗PD-L1抗体は、アテゾリズマブ(Tecentriq(登録商標))、アベルマブ(Bavencio(登録商標))またはデュルバルマブ(Imfinzi(登録商標))のうちの1つまたは複数である。
ある特定の実施形態では、免疫療法または免疫治療剤は、CD80、CD86、LAG3、KIR、TIM3、GAL9またはA2aRに対するアンタゴニスト(例えば、抗体)である。他の実施形態では、アンタゴニストは、阻害性免疫チェックポイント分子の可溶性バージョン、例えば、阻害性免疫チェックポイント分子の細胞外ドメインと抗体のFcドメインとを含む可溶性融合タンパク質である。ある特定の実施形態では、可溶性融合タンパク質は、CTLA4、PD-1、PD-L1またはPD-L2の細胞外ドメインを含む。一部の実施形態では、可溶性融合タンパク質は、CD80、CD86、LAG3、KIR、TIM3、GAL9またはA2aRの細胞外ドメインを含む。一実施形態では、可溶性融合タンパク質は、PD-L2またはLAG3の細胞外ドメインを含む。
ある特定の実施形態では、免疫チェックポイント分子は、抗原に対するT細胞応答に関与するシグナルを増幅する共刺激分子ある。例えば、CD28は、T細胞上に発現される共刺激受容体である。T細胞がそのT細胞受容体を介して抗原に結合する場合、CD28は、抗原提示細胞上のCD80(B7.1としても公知)またはCD86(B7.2としても公知)に結合して、T細胞受容体シグナル伝達を増幅し、T細胞活性化を促進する。CD28は、CTLA4と同じリガンド(CD80およびCD86)に結合するため、CTLA4は、CD28によって媒介される共刺激シグナル伝達を妨げることまたは調節することができる。ある特定の実施形態では、免疫チェックポイント分子は、CD28、誘導性T細胞共刺激分子(ICOS)、CD137、OX40またはCD27から選択される共刺激分子である。他の実施形態では、免疫チェックポイント分子は、例えばCD80、CD86、B7RP1、B7-H3、B7-H4、CD137L、OX40LまたはCD70を含む、共刺激分子のリガンドである。
これらの共刺激チェックポイント分子を標的とするアゴニストを使用して、ある特定のがんに対する抗原特異的T細胞応答を強化することができる。したがって、ある特定の実施形態では、免疫療法または免疫治療剤は、共刺激チェックポイント分子のアゴニストである。ある特定の実施形態では、共刺激チェックポイント分子のアゴニストは、アゴニスト抗体であり、好ましくはモノクローナル抗体である。ある特定の実施形態では、アゴニスト抗体またはモノクローナル抗体は、抗CD28抗体である。他の実施形態では、アゴニスト抗体またはモノクローナル抗体は、抗ICOS、抗CD137、抗OX40、または抗CD27抗体である。他の実施形態では、アゴニスト抗体またはモノクローナル抗体は、抗CD80、抗CD86、抗B7RP1、抗B7-H3、抗B7-H4、抗CD137L、抗OX40Lまたは抗CD70抗体である。
がん以外の具体的な遺伝性疾患、障害または状態を処置するための治療選択肢は、一般に当業者に周知であり、考慮している特定の疾患、障害または状態を考えると明らかであろう。
ある特定の実施形態では、本明細書に記載のカスタマイズされた療法は、典型的には非経口(例えば、静脈内または皮下)投与される。免疫治療剤を含有する医薬組成物は、典型的には静脈内投与される。ある特定の治療剤は、経口投与される。しかし、カスタマイズされた療法(例えば、免疫治療剤など)を、例えば、頬側、舌下、直腸、膣、尿道内、局所、眼内、鼻腔内および/または耳介内を含む、当技術分野において公知の任意の方法によって投与することもでき、この投与は、錠剤、カプセル、顆粒、水性懸濁物、ゲル、スプレー、座剤、膏薬、軟膏、またはこれらに類するものを含み得る。
システムおよびコンピュータ可読媒体
本開示は、様々なシステムおよびコンピュータプログラム製品または機械可読媒体も提供する。一部の実施形態では、例えば、本明細書に記載の方法は、少なくとも一部は、システム、分散コンピューティングハードウェアおよびアプリケーション(例えば、クラウドコンピューティングサービス)、電子通信ネットワーク、通信用インターフェース、コンピュータプログラム製品、機械可読媒体、電子記憶媒体、ソフトウェア(例えば、機械実行可能コードもしくは論理命令)ならびに/またはこれらに類するものを使用して、必要に応じて実行または促進される。例を挙げて説明すると、図2は、本願で開示される方法の少なくとも態様の実行に伴う使用に好適な例示的なシステムの概略図を提供する。示されているように、システム200は、プロセッサー204およびメモリー、記憶デバイス、またはメモリー構成要素206を含む、少なくとも1つのコントローラーまたはコンピュータ、例えばサーバー202(例えば、検索エンジンサーバー)と、リモートサーバー202から遠隔の位置にあり、インターネットまたは他のインターネットワークなどの電子通信ネットワーク212を介してリモートサーバー202と通信している、1つまたは複数の他の通信デバイス214および216(例えば、クライアント側コンピュータ端末、電話、タブレット、ラップトップ、他のモバイルデバイスなど)とを含む。通信デバイス214および216は、例えば、サーバー202コンピュータとネットワーク212を介して通信している電子ディスプレイ(例えば、インターネットへの接続が可能なコンピュータまたはこれに類するもの)を典型的には含み、電子ディスプレイは、本明細書に記載の方法の実行時に結果を表示するためのユーザーインターフェース(例えば、グラフィカルユーザーインターフェース(GUI)、ウェブベースのユーザーインターフェース、および/またはこれらに類するもの)を含む。ある特定の実施形態では、通信ネットワークは、ある場所から別の場所への、例えば、ハードドライブ、サムドライブ、または他のデータ記憶機構を使用する、データの物理的転送も包含する。システム200は、例えば、214(デスクトップまたはパーソナルコンピュータとして概略的に示されている)および216(タブレットコンピュータとして概略的に示されている)などの1つまたは複数の他の通信デバイスにより実行可能な誘導検索アプリケーションまたはその他を促進するために、例えば、サーバー202により読み取り可能である、サーバー202のメモリー206などの、様々なタイプのメモリーのうちの1つまたは複数などの、コンピュータまたは機械可読媒体に格納されたプログラム製品208も含む。一部の実施形態では、システム200は、例えば、直接または検索エンジンサーバー202によって検索可能な、データ(例えば、対照試料またはコンパレーター結果データ、インデックス化されたカスタマイズされた療法など)が格納されたオンラインウェブサイトと関連付けられている、サーバー210などの、少なくとも1つのデータベースサーバーも必要に応じて含む。システム200は、サーバー202から遠隔の位置にある1つまたは複数の他のサーバーも必要に応じて含み、これらの他のサーバーの各々は、遠隔設置されているまたは他のサーバーの各々と同一区域内に設置されている、1つまたは複数のデータベースサーバー210と必要に応じて関連付けられている。これらの他のサーバーは、遠隔地のユーザーにサービスを有益に提供することができ、地理的に分散した操作を増進することができる。
当業者には理解されるように、サーバー202のメモリー206は、例えば、数ある中でも特に、RAM、ROMおよび磁気または光ディスクを含む、揮発性および/または不揮発性メモリーを必要に応じて含む。単一のサーバーとして図示されているが、サーバー202の図示されている構成が単に例として与えられていること、および様々な他の方法論または構成に従って構成された他のタイプのサーバーまたはコンピュータも使用することができることも、当業者には理解される。図2に概略的に示されているサーバー202は、サーバーまたはサーバークラスターまたはサーバーファームを表し、いずれの個別の物理的サーバーにも限定されない。サーバーサイトは、サーバーホスティングプロバイダーにより管理されているサーバーファームまたはサーバークラスターとして展開することができる。サーバーならびにそれらの構造および構成の数は、システム200についての使用状況、需要および容量要件に基づいて増加させることができる。当業者には同じく理解されるように、例えば、これらの実施形態での他のユーザー通信デバイス214および216は、ラップトップ、デスクトップ、タブレット、携帯情報端末(PDA)、携帯電話、サーバー、または他のタイプのコンピュータであり得る。当業者には公知であるおよび理解されるように、ネットワーク212は、通信ネットワークを介しておよび/またはローカルもしくは他のエリアネットワークの一部分を介して1つまたは複数の他のコンピュータと通信している複数のコンピュータ/サーバーの、インターネット、イントラネット、電気通信ネットワーク、エクストラネットまたはワールドワイドウェブを含み得る。
さらに当業者には理解されるように、必要に応じて、例示的なプログラム製品または機械可読媒体208は、ハードウェアの機能を制御し、その動作を指示する、1セットまたは複数セットの順序付けられた操作を生じさせる、マイクロコード、プログラム、クラウドコンピューティング形式、ルーチンおよび/または記号言語の形態である。例示的な実施形態によれば、プログラム製品208はまた、その全体が揮発性メモリー内にある必要がなく、当業者には公知であるおよび理解されるような様々な方法論に従って、必要に応じて選択的にロードされ得る。
さらに当業者には理解されるように、用語「コンピュータ可読媒体」または「機械可読媒体」は、実行のための命令をプロセッサーに与えることに関与する任意の媒体を指す。例を挙げて説明すると、用語「コンピュータ可読媒体」または「機械可読媒体」は、例えばコンピュータによる読み取りのための、配布媒体、クラウドコンピューティング形式、中間記憶媒体、コンピュータの実行メモリー、および本開示の様々な実施形態の機能およびプロセスを実行するプログラム製品208を格納することができる任意の他の媒体またはデバイスを包含する。「コンピュータ可読媒体」または「機械可読媒体」は、不揮発性媒体、揮発性媒体および伝送媒体を含むがこれらに限定されない、多くの形態を取ることができる。不揮発性媒体としては、例えば、光または磁気ディスクが挙げられる。揮発性媒体としては、例えば、所与のシステムのメインメモリーなどの、ダイナミックメモリーが挙げられる。伝送媒体としては、同軸ケーブル、銅線および光ファイバー、例えば、母線を含む電線などが挙げられる。伝送媒体はまた、数ある中でも特に、ラジオ波および赤外データ通信中に発生するものなどの、音波または光波の形態を取ることができる。コンピュータ可読媒体の例示的な形態としては、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、フラッシュドライブ、もしくは任意の他の磁気媒体、CD-ROM、任意の他の光媒体、パンチカード、紙テープ、穴のパターンを有する任意の他の物理的媒体、RAM、PROMおよびEPROM、FLASH(登録商標)-EPROM、任意の他のメモリーチップもしくはカートリッジ、搬送波、またはコンピュータが読み取ることができる任意の他の媒体が挙げられる。
プログラム製品208は、コンピュータ可読媒体からハードディスクまたは同様の中間記憶媒体に必要に応じてコピーされる。プログラム製品208またはその一部分は、試行されると、それらの配布媒体、それらの中間記憶媒体、またはこれらに類するものからコンピュータを構成する1つまたは複数のコンピュータ実行メモリーに必要に応じてロードされ、その結果、コンピュータが、様々な実施形態の機能または方法に従って動作するように構成される。全てのこのような操作は、例えばコンピュータシステムの技術分野の当業者には周知である。
さらに例を挙げて説明すると、ある特定の実施形態では、本願は、1つまたは複数のプロセッサー、およびプロセッサーと通信している1つまたは複数のメモリー構成要素を含む、システムを提供する。メモリー構成要素は、実行されたときに、プロセッサーに、配列情報、マイクロサテライトおよび/もしくは他の反復核酸不安定性ステータス、コンパレーター結果、カスタマイズされた療法、ならびに/またはこれらに類するものを(例えば、通信デバイス214、216もしくはこれらに類するものによって)表示させる情報を提供する、ならびに/または他のシステム構成要素からおよび/もしくはシステムユーザーから(例えば、通信デバイス214、216もしくはこれらに類するものによって)情報を受け取る、1つまたは複数の命令を典型的には含む。
一部の実施形態では、プログラム製品208は、電子プロセッサー204により実行されたときに少なくとも(i)試料中のマイクロサテライト遺伝子座の集団からの配列情報を受け取るステップ、(ii)配列情報から複数のマイクロサテライト遺伝子座の各々に存在する多数の異なるリピート長を定量化して、複数のマイクロサテライト遺伝子座の各々についての部位スコアを生成するステップ、(iii)複数のマイクロサテライト遺伝子座の各々についての所与のマイクロサテライト遺伝子座の部位スコアを所与のマイクロサテライト遺伝子座の部位特異的訓練済み閾値と比較するステップ、(iv)所与のマイクロサテライト遺伝子座の部位スコアが、所与のマイクロサテライト遺伝子座の部位特異的訓練済み閾値を超える場合、所与のマイクロサテライト遺伝子座を不安定であるとコールして、複数のマイクロサテライト遺伝子座からの多数の不安定なマイクロサテライト遺伝子座を含むマイクロサテライト不安定性スコアを生成するステップ、(v)マイクロサテライト不安定性スコアが、試料中のマイクロサテライト遺伝子座の集団の集団訓練済み閾値を超える場合、試料のMSIステータスを不安定であると分類して、不安定な試料を同定するステップ、および必要に応じて、(vi)不安定な試料のマイクロサテライト不安定性スコアを1つまたは複数のコンパレーター結果と比較するステップを実行する、非一過性コンピュータ実行可能命令を含み、不安定な試料のマイクロサテライト不安定性スコアと、コンパレーター結果の間の実質的マッチは、対象の療法への予測応答を示す。
システム200は、本明細書に記載の方法の様々な態様を実行するように構成されている追加のシステム構成要素も典型的には含む。これらの実施形態のうちの一部の実施形態では、これらの追加のシステム構成要素のうちの1つまたは複数は、遠隔サーバー202から遠隔に位置し、電子通信ネットワーク212を介して遠隔サーバー202と通信しているが、他の実施形態では、これらの追加のシステム構成要素のうちの1つまたは複数は、同一区域内に位置し、サーバー202と通信している(すなわち、電子通信ネットワーク212が非存在の場合)か、または例えばデスクトップコンピュータ214と、直接通信している。
一部の実施形態では、例えば、追加のシステム構成要素は、コントローラー202に操作可能に(直接または間接的に(例えば、電子通信ネットワーク212を介して))接続されている試料調製構成要素218を含む。試料調製構成要素218は、核酸増幅構成要素(例えば、サーマルサイクラ-など)および/または核酸シーケンサーにより増幅および/またはシークエンシングされる試料中の核酸を調製する(例えば、核酸のライブラリーを調製する)ように構成されている。これらの実施形態のうちのある特定の実施形態では、試料調製構成要素218は、本明細書に記載されるように核酸にバーコードを含む1つもしくは複数のアダプターを結合させるために、シークエンシングの前にゲノムもしくはトランスクリプトームから1つまたは複数の領域を選択的に濃縮するために、および/またはこれらに類することのために、試料中の核酸を他の成分から分離するように構成されている。
ある特定の実施形態では、システム200は、コントローラー202に操作可能に(直接または間接的に(例えば、電子通信ネットワーク212を介して))接続されている核酸増幅構成要素220(例えば、サーマルサイクラ-など)も含む。核酸増幅構成要素220は、対象からの試料中の核酸を増幅するように構成されている。例えば、核酸増幅構成要素220は、本明細書に記載されるように試料中のゲノムまたはトランスクリプトームから選択的に濃縮された領域を増幅するように必要に応じて構成されている。
システム200は、コントローラー202に操作可能に(直接または間接的に(例えば、電子通信ネットワーク212を介して))接続されている少なくとも1つの核酸シーケンサー222も典型的には含む。核酸シーケンサー222は、対象からの試料中の核酸(例えば、増幅された核酸)からの配列情報を提供するように構成されている。本質的に任意のタイプの核酸シーケンサーをこれらのシステムでの使用に適合させることができる。例えば、核酸シーケンサー222は、核酸を用いてパイロシークエンシング、単一分子シークエンシング、ナノポアシークエンシング、半導体シークエンシング、合成によるシークエンシング、ライゲーションによるシークエンシング、ハイブリダイゼーションによるシークエンシングまたは他のシークエンシング技法を実行してシークエンシングリードを生成するように必要に応じて構成されている。必要に応じて、核酸シーケンサー222は、配列リードを配列リードのファミリーにグループ化するように構成され、各ファミリーは、所与の試料中の核酸から生成された配列リードを含む。一部の実施形態では、核酸配列シーケンサー222は、シークエンシングライブラリーから導出されたクローン単一分子アレイを使用してシークエンシングリードを生成する。ある特定の実施形態では、核酸配列シーケンサー222は、シークエンシングライブラリーをシークエンシングしてシークエンシングリードを生成するためのマイクロウェルのアレイを有する少なくとも1つのチップを含む。
完全または部分的システム自動化を容易にするために、システム200は、コントローラー202に操作可能に(直接または間接的に(例えば、電子通信ネットワーク212を介して))接続されている材料移送構成要素224も典型的には含む。材料移送構成要素224は、核酸シーケンサー222、試料調製構成要素218および核酸増幅構成要素220へおよび/またはから1つまたは複数の材料(例えば、核酸試料、アンプリコン、試薬および/またはこれらに類するもの)を移送するように構成されている。
コンピュータシステムおよびネットワーク、データベース、ならびにコンピュータプログラム製品に関するさらなる詳細は、例えば、Peterson, Computer Networks: A Systems Approach, Morgan Kaufmann,5th Ed. (2011)、Kurose, Computer Networking: A Top-Down Approach, Pearson, 7thEd. (2016)、Elmasri, Fundamentals of Database Systems, Addison Wesley, 6thEd.(2010)、Coronel, Database Systems: Design, Implementation, & Management,Cengage Learning, 11th Ed. (2014)、Tucker, Programming Languages,McGraw-Hill Science/Engineering/Math, 2nd Ed.(2006)、およびRhoton, Cloud ComputingArchitected: Solution Design Handbook, Recursive Press (2011)においても提供されており、これらの参考文献は、各々、それら全体が参照により本明細書に組み込まれる。
(実施例1)
非腫瘍試料をバックグラウンドとして使用して、可変的腫瘍割合および不安定部位の数を用いて、高度MSI(MSI-H)試料をコンピュータでシミュレーションした。異なるがん型の3000試料のコホートで観測された分布を不安定部位の数についての以前のもの(prior)として使用した。この解析は、腫瘍含有量の0.2%の検出限界(LoD)で94%の感度を実証した。非腫瘍ドナー試料に対する本明細書に記載の実施形態に従ってMSIステータスを決定する方法の予想特異度は、99.999%であった。標準的なまたは従来のPCRに基づくMSI評価とこれらの結果の比較は、1.4~15%の腫瘍含有量範囲にわたって100%の一致を示した。加えて、MSIステータスの標準的なPCRに基づく評価が利用可能であった(10のMSI-H、145のマイクロサテライト安定(MSS))、3つのがん型からの155の臨床試料に対して、この解析の性能を試験した。本明細書に記載の実施形態に従って生成されたMSIコールは、標準的なPCRに基づくMSI評価と100%の一致を示した。
(実施例2)
デジタルシークエンシング臨床プラットフォーム(Guardant Health,Inc.、Redwood City、CA、USA)を使用して、82試料のMSIステータスを評価した。デジタルシークエンシングプラットフォームは、単純な非侵襲的採血によって単離される無細胞DNA(これは循環腫瘍DNAを含み得る)の質の高いシークエンシングを利用する、がん関連遺伝子のNGSパネルである。デジタルシークエンシングは、ほぼ全ての擬陽性を排除するために、シークエンシング後のバイオインフォマティクス再構築と組み合わせた、個別にタグ付けされたcfDNA分子のデジタルライブラリーのシークエンシング前の調製を利用する。試料中のcfDNAの標的化されたシークエンシングを使用して、配列情報を得た。各試料における61の最も情報価値のあるマイクロサテライト遺伝子座について部位スコア(ΔAIC)を決定した。試料の腫瘍割合は、0.5%~15%の範囲であった。部位スコアを試料ごとに対応する部位特異的訓練済み閾値と比較して、各試料における不安定なマイクロサテライト遺伝子座を同定した。所与の試料において同定された不安定なマイクロサテライト遺伝子座の数をその特定の試料についてのマイクロサテライト不安定性スコア(すなわち、MSI試料スコア)として使用した。試料における61のマイクロサテライト遺伝子座についての集団訓練済み閾値を決定し、その際、5より大きいまたは5に等しいマイクロサテライト不安定性スコアは、試料を高度MSI(MSI-H)であると分類すると予測し、その一方で、4未満のまたは4に等しいマイクロサテライト不安定性スコアは、試料をマイクロサテライト安定(MSS)であると分類すると予測した。82試料のうちの9つは、MSI-Hであると分類された。残りの73試料は、MSSであると分類された。82試料の全てにおいて、予測安定性ステータスは、予想安定性ステータスとマッチした。MSIステータスを直交検証に基づいて確認した。
(実施例3)
序論
マイクロサテライト不安定性(MSI)は、様々な腫瘍型の予後の有意性ならびに免疫チェックポイント阻害剤での処置についての予測有意性に関するガイドライン推奨のバイオマーカーである。旧来、マイクロサテライト不安定性検出は、PCRまたは免疫組織化学による腫瘍組織の検査に依拠してきた。つい最近、次世代シークエンシング(NGS)法が開発されたが、これらの方法もまた腫瘍組織の入手可能性に依拠する。対照的に、血漿に基づくMSI検出方法は、MSIステータスの非侵襲的なリアルタイム評価を提供することができた。Guardant Healthの大パネル無細胞DNA(cfDNA)NGSアッセイは、500のがん関連遺伝子を評価して、ゲノム変化および腫瘍変異負荷(TMB)を同定する。一塩基変異体(SNV)、インデル、コピー数増幅(CNA)、融合およびTMBに加えて、このパネルは、>1,000のMSI部位における体細胞変化に基づいて高度マイクロサテライト不安定性(高度MSI)ステータスを検出することができる。本実施例で提示する分析的検証は、高度MSIの検出のための500のがん関連遺伝子のcfDNA NGSアッセイの性能を決定するために役立つ4つの主要成分:正確度、検出限界(LoD)、精度、およびブランク上限(limit of blank)(LoB)を有する。
方法
正確度解析は、3供給源からの258の試料を使用し、500のがん関連遺伝子のcfDNA NGSアッセイによって予測したMSIステータスを、直交法で決定した組織MSIステータスに基づく真と比較した。組織MSIステータス(真:組織MSIステータス)を有する36の協力者試料と、121の健康なドナー(真:マイクロサテライト安定、MSS)と、500のがん関連遺伝子のcfDNA NGSアッセイ(大パネルアッセイ)および73のがん関連遺伝子のcfDNA GNSアッセイ(小パネル、真としてのMSIステータス)によりシークエンシングした101の試料とを使用した。再現性および反復性解析は、2セットの反復(合計56の反復)を使用した。MSIステータスおよびMSIスコアを試行内および試行間で比較した。LoDは、両方ともシミュレーションによって得た。LoBは、健康なドナーの試料および既知MSS試料を使用して計算した。
結果
1.正確度解析
組織MSIステータスに基づく高度MSI試料13のうちの12が、大パネルアッセイにより高度MSIとコールされた。全てのMSS/低度MSI(MSI-L)試料は、正確に検出された(表2)。小パネルアッセイによりカバーされるマイクロサテライト領域(約90部位)に限定したとき、大パネルアッセイにより高度MSIとして検出された12の試料は、高度MSIとコールされるための小パネルアッセイ閾値も満たした。
2.LoD解析
0.05%~1%の範囲の5つの腫瘍割合にわたってMSIを検出するために使用した>1,000部位でのシミュレーションは、0.1%のLoDを示す(図3)。
3.500のがん関連遺伝子のcfDNA NGSアッセイでの高度MSIの検出は、再現可能であり、反復可能である
24の高度MSI反復を2回の試行で検定した。全ての反復は、500のがん関連遺伝子のcfDNA NGSアッセイで高度MSIとして検出された。MSI数値スコアは、試行内および試行間で±4である(図4A)。10のMSS/低度MSI試料は、同じフローセルで検査した2~3反復(合計32反復)を有する。全ての反復は、500のがん関連遺伝子のcfDNA NGSアッセイでMSS/低度MSIとして検出される。MSIスコアは、各試料内で±3である(図4B)。
4.LoB解析
MSSステータスが既知である健康なドナーの試料121個および協力者の試料25個をLoB解析に使用した。146の試料全てが、大パネルアッセイでMSS/低度MSIと正確に分類され、偽陽性率を0%と示した。
5.腫瘍割合とMSIスコア
MSIスコアを、2,000を超える大パネルアッセイ試料において体細胞コールの最大突然変異型アレル割合(MAF)に対してプロットし(図5AおよびB)、これにより、腫瘍割合(MAFにより測定した)はMSIステータスと相関しないことが明らかになった。
結論
500のがん関連遺伝子のcfDNA NGSアッセイでの高度MSIの検出は、高い感度(>90%)および特異度(100%)を示した。試行内でおよび試行を通して反復性および再現性は高かった。高度MSIの検出のLoDは、0.1%MAFであった。LoB研究は、0%の擬陽性率を示した。500のがん関連遺伝子のcfDNA NGSアッセイは、組織試料を必要とすることなく、医師に処置値を与えることになる、cfDNAでの高度MSIステータスの信頼性のある予測を提供する。
(実施例4)
序論
マイクロサテライト不安定性(MSI)は、ペムブロリズマブの汎がん承認により例示されるように免疫チェックポイント遮断(ICB)への応答についての予測バイオマーカーとしてのその重要性(10、11)のため、少なくとも9つのがん型-子宮頸部、胆管細胞癌、結腸直腸、子宮内膜、食道および食道胃、胃、卵巣、膵臓および前立腺がん(1~9)-における全米総合がん情報ネットワーク(National Comprehensive Cancer Network)(NCCN)臨床診療ガイドライン推奨バイオマーカーである。進行がんを有する患者におけるMSIの検出は、患者の無症状の家族を遺伝性がんのリスクについて評価するように臨床医に警告することもできる。
MSIは、この実体の名前が由来する、マイクロサテライトトラクトとして公知の繰り返しモチーフ内のヌクレオチドの獲得および/または喪失を含む、ゲノム全体にわたって突然変異率の劇的増加をもたらす、DNAミスマッチ修復欠損(dMMR)の典型的な発現である。MSIは、子宮内膜、結腸直腸および胃食道がんに最も蔓延しており、それは、MMR関連遺伝子の散在性突然変異の続発症であり得、またはMLH1、MSH2、MSH6、PMS2もしくはEPCAMの生殖細胞系突然変異によって引き起こされることが最も多い遺伝性がん素因症候群であるリンチ症候群の症状発現であり得る(12)。しかし、これらのがん型における保有率増加にも関わらず、ランドスケープ解析は、MSIが、肺、前立腺および乳がんなどのよく見られる腫瘍型を含む、ほとんどの他の固形腫瘍にも無視できない率で存在することを示した(13)。
最近の研究によって、MSIは、PD-1/PD-L1阻害剤でのICBによる臨床的恩恵を予測することが示され、MSIが存在する場合のいくつかの適応症においてこれらの薬剤、例えば、高度MSI(MSI-H、MSIについて陽性)転移性結腸直腸がんのためのニボルマブ±イピリムマブ、および過去の承認治療での増悪後の切除不能なまたは転移性のMSI-H固形腫瘍のためのペムブロリズマブなど、の承認に至っている(14)。ICBの恩恵についての予測バイオマーカーとしてのその価値に加えて、MSIは、予後の有意性も有し、これは、結腸直腸がん(CRC)において最も顕著であり、全ての患者についての臨床診療ガイドラインで検査することが推奨されている(3、15)。
最近、MSI検査は、腫瘍組織検体のポリメラーゼ連鎖反応(PCR)および/または免疫組織化学(IHC)分析によって最も一般的に行われる。前者は、Bethesdaパネルにより当初推奨された5つの標準的マイクロサテライト遺伝子座(16、17)を評価し、マッチした非腫瘍DNAで評価された生殖細胞系遺伝子型と比べた腫瘍DNA中のそれらの長さを比較し、各マイクロサテライトトラクトの長さの不安定性をMSIの直接的証拠として使用する。しかし、この限定的なマイクロサテライトパネルは、主としてCRCのために開発されたものであり、他のがん型ではより限られた感度を有する(18)。対照的に、IHC手法は、4つのMMRタンパク質のレベルを評価し、1つまたは複数の発現の非存在(MMR欠損、dMMR)は、MSIステータスと強く相関する。しかし、MSI-Hケースの約5~11%は、他の点では非機能性のタンパク質の抗原性および細胞内輸送の保持に起因して、無傷のMMR染色および局在(機能性の(proficient)MMR、pMMR)を明示する(19)。最近の公表文献(20、21)により、次世代シークエンシング(NGS)も腫瘍におけるMSIステータスを正確に特徴付けることができ、その結果、単回NGS検定によってMSIステータスばかりでなく標的化可能なゲノムバイオマーカーも包括的にプロファイリングすることが可能になることが実証された。
NCCNガイドラインにおける多くのがん型にわたっての推奨および付随するFDA承認処置選択肢にもかかわらず、CRCおよび胃食道癌以外の現在のMSI検査率は、依然として非常に低い(22)。MSI検査推奨が2005年以来実施されてきたCRC(17、23)においてでさえ、検査されるのは患者の50%未満であり(24)、その結果、ICB処置の機会が見逃され、家族ががんになるリスクが高い可能性がある患者を認識することができない。多因子であるが、そのようなMSIの過少遺伝子型判定は、組織獲得に関連する障害および複雑な検査推奨/アルゴリズムに起因することが多い。例えば、アーカイブ診断用検体の検査は、この材料の位置特定および獲得に関連する有意な遅延を招くことがあり、腫瘍の進展および/または不均一性に起因してMSIステータスの不正確な評価をもたらすこともある。同様に、新たに得た組織検体の検査もまた、生検のスケジューリングおよび失敗に関連する有意な遅延が生じる結果となることがあり、手順の複雑さに起因するリスクおよびコストがさらに付随する。しかるが故に、侵襲的組織獲得手順は、強い前処置を受けたおよび/または病弱な多くの患者には禁忌である。加えて、急増するバイオマーカー数および検査選択肢の多様化は、既に過度の負担を負っている医師に対して気が遠くなるような複雑さを生じさせる。
無細胞循環腫瘍DNA(ctDNA)アッセイ(「液体生検」)は、同時期の腫瘍DNAの最小侵襲性プロファイリングを可能にすることによって適応症の多くの遺伝子型判定の際のそのような障害にうまく対処している。したがって、液体生検は、組織試料採取制限のため他の方法では同定することができない目的のバイオマーカーを腫瘍が保有する患者を同定すること、および典型的な組織検査よりも迅速にそれを行うことによって、患者が、ICBを含む標準ケア標的化療法を利用する機会を広げる(25)。さらに、包括的液体生検は、単回の検査で全ての成人固形腫瘍についての全てのガイドライン推奨体細胞ゲノムバイオマーカー情報を提供することができる。この研究では、以前に検証されたctDNAに基づく遺伝子型判定検査の有用性をMSI検出の追加によって強化することを模索した。このプラットフォームでのMSI評価の設計および検証をここで説明し、まだ記載されていない最大のctDNA-組織MSI検証コホート(n=1145)でのその性能を報告し、ICBで処置した16名の進行胃がん患者における応答予測を評価する。米国臨床検査室改善法(ClinicalLaboratory Improvement Amendment)(CLIA)により認定され、College of American Pathologists(CAP)よる適格審査に合格し、ニューヨーク州保険局(NewYork State Department of Health)により認可された研究所において検査した28,000名より多くの継続的固形腫瘍患者のMSI-Hランドスケープも、ここで報告する。
材料および方法
1.マイクロサテライト遺伝子座選択
Guardant Healthの小パネル無細胞DNA(cfDNA)NGSアッセイは、進行固形腫瘍についての全てのガイドライン推奨適応症におけるSNV、インデル、CNAおよび融合の検出について以前に検証された74遺伝子パネル(26、27)である。このアッセイは、5つのBethesdaパネル部位のうちの3つ(BAT-25、BAT-26およびNR-21)を含む、複数の腫瘍型にわたって不安定性になりやすい部位を含むように選択した、長さ7またはそれを超えるショートタンデムリピート(STR)からなる99の推定的マイクロサテライト遺伝子座を、最初に取り入れた。残りの2つのBethesda部位(NR-24およびMONO-27)は、領域のマッピング可能性(mappability)が極度に低かったため含めなかった。健康なドナーの試料84個1セットからのシークエンシングデータを使用してこれらの部位におけるカバレッジおよびノイズプロファイルを評価して、最終MSI検出アルゴリズムから情報価値のない部位を除外した。
2.モデルの説明
MSI検出は、単一の確率モデルに分子バーコーディング情報を有する観測リード配列を組み込むことに基づき、それによって、PCRおよびシークエンシングノイズを想定した観測データの尤度と体細胞MSI不安定性を想定した観測データの尤度とを比較する。赤池情報量基準(AIC)(28)を使用して、個々の部位の各々を独立してスコア化する。AICモデルは、任意の所与のマイクロサテライト遺伝子座で観測される可変性がノイズに対する生物学的不安定性に起因する尤度を反映する、遺伝子座スコア(0から無限大に及ぶ)を生成し、遺伝子座は、そのスコア(すなわち、部位スコア)が部位特異的訓練済み閾値より上であった場合、不安定とみなされる。影響を受けた遺伝子座の数を最終90部位にわたって計算し、不安定な遺伝子座の数(「MSIスコア」)が集団訓練済み閾値(n=6)より上であった場合、試料は陽性とコールされる。個々の遺伝子座についての閾値および試料当たりの全MSIスコアについての閾値は、健康なドナーの試料からのデータでの順列に基づくシミュレーションを使用して、異なるリピート長を有する分子の頻度および個々の遺伝子座におけるエラーパラメーターならびにシミュレーション試料中の不安定な遺伝子座の総数を変えて確立した。この手法によるシミュレーションをここでは使用して、マイクロサテライト長と不安定な遺伝子座数の100,000の組合せを調べた。これは、シナリオの多様なランドスケープの評価を可能にし、これらのシナリオの一部は、シミュレーションしていないデータセットでは表示されないことがある。アルゴリズムは、マイクロサテライト安定(MSS)と低度MSI(PCR法を使用する単一の不安定なBethesda遺伝子座の観測により定義されるカテゴリー)とを区別せずに、これらを単一のカテゴリーにグループ分けする。これは、MSI-Lステータスが、明確に異なる表現型ではなく、少数のマイクロサテライトの検査のアーティファクトであり、したがって、多数のマイクロサテライト遺伝子座を検査した場合、以前に特徴付けられたMSI-L試料が全MSI荷重の中でMSS表現型を模倣するという以前の報告に基づく。
3.試料
シミュレーションデータはもちろん、健康なドナーの試料84個1セットも使用して、MSIアルゴリズムの開発および訓練を行った。臨床的検証研究は、以前に記載したGuardant Health CLIA laboratoryにおける通例の標準ケア臨床試験(26)の一部として採取し、処理した1145のアーカイブ試料(残留血漿および/もしくは無細胞DNA)、またはEDTA採血管に採取したアーカイブ患者血漿試料を含んだ。20の健康なドナーの試料も分析特異度研究に使用した。分析的検証研究に使用した考案試料は、細胞株上清および健康なドナーの血漿から抽出したcfDNAプールを含む。次の細胞株からの培養上清から調製した無細胞DNAを使用した(ATCC,Inc.):KM12、NCI-H660、HCC1419、NCI-H2228、NCI-H1650、NCI-H1648、NCI-H1975、NCI-H1993、NCIH596、HCC78、GM12878、MCF-7。細胞株培養上清から単離したcfDNAは、患者由来cfDNAの細胞外放出の断片サイズおよび機序(29)、ライブラリー変換、およびシークエンシング特性を模倣し、その上、検出限界および精度などの、高度な研究材料要件を支持するのに十分な量の明確に定義された材料の再生可能な供給源にもなる。
4.試料処理およびバイオインフォマティクス解析
無細胞DNAを血漿試料または細胞株上清から抽出し(QIAmp Circulating Nucleic Acid Kit、Qiagen,Inc.)、30ng以下の抽出cfDNAに非ランダムオリゴヌクレオチドバーコード(IDT,Inc.)で標識し、その後、ライブラリー調製、ハイブリッド捕捉濃縮(Agilent Technologies,Inc.)、およびペアエンド合成によるシークエンシング(NextSeq 500/550またはHiSeq 2500、Illumina,Inc.)を以前に記載した(26)ように行った。バイオインフォマティクス解析および変異体検出は、以前に記載した(26)ように行った。
5.分析的検証手法
分析的検証のための行った研究は、性能特性および検証原理に関する確立されたCLIA、Nex-StoCT Working Group、およびAssociation of Molecular Pathologist/CAPガイダンスに基づいた。MSIステータスについてのアッセイの感度を決定するために、MSI-H細胞株(KM12)(29)からの細胞株上清からのcfDNAを、マイクロサテライト安定(MSS)細胞株(NCI-H660)(30、31)からのcfDNAで希釈し、標準cfDNA投入量(30ng)および低cfDNA投入量(5ng)の両方で試験した。希釈系列は、5ng投入量については0.03~2%および30ng投入量については0.01~1%の最大突然変異型アレル割合(max MAF)を目標とした。滴定材料および希釈材料に特有の公知生殖細胞系変異体を使用して、目標腫瘍割合を検証した。反復性(実行内での精度)および再現性(実行間での適合性)の評価は、臨床および考案モデル試料に基づいた。精度用の臨床試料のうちの6つ(3つのMSI-H、および3つのMSS)を選択し、これらは、5ngでの予測LoDの約2~3倍に相当する1~2%のmax MAF値を有した。MSI分析特異度は、健康なドナーの試料20個および既知MSSの考案試料245個を解析することにより決定した。
6.臨床的検証手法
標準ケア組織に基づくMSI検査の結果が入手可能であった患者からの臨床試料からのアーカイブ血漿またはcfDNAを、ctDNA MSIアルゴリズムを使用して検定した(n=1145)。組織に基づくMSIステータスは、IHC、PCR、またはそれほど多くはないがNGSから導出した。臨床転帰データは、主治医が患者診療記録から抽出し、匿名化した。
7.28,459の進行がん患者試料からの血漿MSIステータスのランドスケープ解析
コホートは、彼らの臨床ケアの過程で73の癌関連遺伝子cfDNA NGSアッセイ(小パネル)を使用して検査した継続的進行がん患者試料28459個を含んだ。全ての解析は、匿名化データを用いて、IRB承認プロトコールに従って行った。このコホートにおけるMSI-Hの保有率を、次の16の原発腫瘍型にわたって評価した:膀胱癌、乳癌、胆管細胞癌、結腸腺癌、原発不明のがん、頭頸部扁平上皮癌、肝細胞癌、肺腺癌、特定不能の肺がん、肺扁平上皮癌、「その他の」がん診断、膵臓腺癌、前立腺腺癌、胃腺癌、および子宮子宮内膜癌。
8.統計
統計解析は、試料ごとに変異体の数の解析のためにスチューデントt検定を使用し、比率の比較のためにフィッシャー直接確率検定を使用した。二項比率についての95%信頼区画(CI)の下限および上限を、連続性補正を伴うウィルソンのスコア間隔を使用して計算した。
9.倫理規範
この研究は、Quorum Institutional Review Boardにより承認されたプロトコールに従って匿名化データを利用して行った。
結果
1.MSIアルゴリズム開発
NGSを使用するctDNA遺伝子型判定の旧来の課題は、少ない投入量および循環における低い腫瘍割合による効率的分子捕捉(26、27)、ならびにシークエンシングおよび他の技術的アーティファクトの修正を含む。MSI検出は、1)MSIステータスを正確に表す反復ゲノム領域の効率的分子捕捉、シークエンシングおよびマッピング;2)反復領域内のエラー修正および変異体検出;ならびに3)体細胞不安定性による影響を典型的には受ける部位における非MSI体細胞変異に起因するMSIからのシグナルと強いPCRスリップアーティファクトとの差別化が必要であるため、さらなる課題を提示する。実際、技術的なPCRのエラーは、ホモポリマー部位での典型的なシークエンシングエラー率よりも典型的には少なくとも1桁大きく、したがって、多数の候補マイクロサテライト部位にわたって適切なシグナル対ノイズ検出比を達成するために反復部位選択および分子バーコーディングの最適な使用を必要とする。
組織シークエンシングパネルは、単に大きいパネルサイズおよびより長いDNA断片長に起因して、十分な情報価値のあるマイクロサテライト遺伝子座を含むことが多い(13、32)が、ここで利用する中サイズのctDNAパネル、および短い無細胞DNA(cfDNA)断片長は、意図的なマイクロサテライト選択および組み入れを必要とする。これを遂行するために、文献および組織シークエンシング大要から情報を得る反復手法を使用して候補部位を評価して、最小バックグラウンドノイズで汎がんMSI検出を行った。健康なドナーのcfDNAを使用して上述の性能基準に基づいて候補遺伝子座のリストをさらに洗練させた。
訓練健康ドナー試料における性能評価に基づいて、情報価値のある遺伝子座を、有効に捕捉、シークエンシングおよびマッピングされたものと定義し、MSS試料内に変異がほとんどないことと関連付けた(図6Aに薄い灰色で示されている)。情報価値のない遺伝子座は、捕捉もシークエンシングもマッピングもできず、不適切な分子を表示する結果となった(図6Aに黒色で示されている)か、またはMSS試料内で実質的変異を実証し、過剰なアーティファクトシグナルを生じさせる結果となった(図6Aに濃い灰色で示されている)。興味深いことに、旧来のMSI組織検査(16、17)および一部のctDNAパネル(33)に利用したBAT-25、BAT-26およびNR-21 Bethesda遺伝子座は、他の候補と比較して性能が劣り、最終マーカーセットから除外した(図6Aに矢印で示されている)。
この手法を使用して、89のモノヌクレオチドリピートと単一のトリヌクレオチドリピートであり、これらの全てが7またはそれより上のリピート長を有する、90のマイクロサテライト遺伝子座を、最終検査バージョンの組み入れに選択した。特有の分子カバレッジ分布の評価は、これらの遺伝子座の65%が、試料カバレッジ中央値の0.5倍を超えるカバレッジを有することを実証した。
有効な分子捕捉およびマッピングに加えて、MSI検出は、がん関連シグナルと、ctDNAが典型的には見出される非常に低いアレル割合でのシークエンシングおよびポリメラーゼのエラーに起因するバックグラウンドノイズとの、高度に正確な差別化も必然的に伴う(26、27、34)。重要なこととして、in vivoでの細胞複製中のポリメラーゼスリップに起因してマイクロサテライト候補をMSI検出のために情報価値のあるものにする、同じ反復ゲノム状況が、それらを、in vitroでのライブラリー調製およびシークエンシング中に同じポリメラーゼスリップを特に受けやすくもさせ、その結果、技術的ノイズレベルが高くなる。これに対処するために、デジタルシークエンシングのエラー修正を使用して、以前に記載された(26、27)ようにマイクロサテライト遺伝子座における高忠実度での真の生物学的挿入-欠失事象を定義した。デジタルシークエンシングプラットフォームは、単純な非侵襲的採血によって単離される無細胞DNA(これは循環腫瘍DNAを含み得る)の質の高いシークエンシングを利用する、がん関連遺伝子のNGSパネルである。デジタルシークエンシングは、ほぼ全ての擬陽性を排除するために、シークエンシング後のバイオインフォマティクス再構成と組み合わせた、個別にタグ付けされたcfDNA分子のデジタルライブラリーのシークエンシング前の調製を利用する。
これらの高度なバックグラウンドエラーリピートの中で、デジタルシークエンシングは、標準的なシークエンシング手法と比較して1分子当たりのシークエンシングのエラーの100分の1への低減を伴い(図6B)、元の患者血液試料に存在する個々の一意的分子のマイクロサテライト配列の効率的かつ正確な再構成を可能にした。次いで、健康なドナーの試料の順列に基づく閾値シミュレーションを使用して部位特異的および総計試料レベルMSIステータス決定閾値を確立した。これらの部位ごとのおよび試料ごとの閾値をデジタルシークエンシング修正の効果と組み合わせると、試料ごとの偽陽性率は、約10~7.3になると推定された。加えて、臨床的投入量の分布について調整した滴定シミュレーションは、約0.2%腫瘍割合までのロバストなMSI検出を予測したが、その後の検出効率が著しく低下した。しかるが故に、<0.2%の循環腫瘍割合(最大体細胞変異型アレル割合により定義した)を有する試料は、MSIステータスについて評価不能であるとみなした。
2.分析的検証研究
MSI検出の分析感度を評価するために、MSI-H細胞株KM12の上清から採取したcfDNAを、5つの滴定点を目標としてMSS cfDNAに希釈し、これは、上記のコンピュータによるシミュレーションにより予測した検出限界(LoD)を挟んで15の独立して処理した反復を含んだ。各滴定系列を、最小許容可能cfDNA投入量である5ng、および最大の最も一般的なcfDNA投入量である30ngの両方で分析した。プロビット解析を使用して、95%LoD(LOD95)を5ng投入量で0.4%(図7A)および30ng投入量で0.1%(図7B)であると計算した。
分析の中間精度を評価するために、2つのMSSおよび2つのMSI-Hである4つの異なる考案材料の反復を分析した(図7C)。499の反復にわたって、MSIステータスのカテゴリー一致は、100%(499/499、95%CI 99~100%)であり、量的MSIスコアについての変動係数は、MSI-H試料について6.3~7.2%であった(表3)。反復性および投入量ロバストネスも、5ng、10ngおよび30ngのcfDNA投入量でのMSSおよびMSI-H考案材料の反復試験により評価し、同様に100%の一致を実証した(27/27、95%CI 85~100%、図8および表4)。臨床的精度を、3つの独立したバッチ、日付、オペレーターおよび試薬ロットにわたって処理した様々なMSIスコアおよび腫瘍割合を代表する72の独立した患者試料の反復において確認し、根底にある量的MSIスコアについて2.0~15.2%の変動係数で100%の質的一致(72/72、95%CI 94~100%)を実証した(表5)。
分析特異度を評価するために、健康なドナーの血漿試料(訓練に使用したものとは明確に異なる)、MSS考案材料、およびMSS患者試料を偽性MSI-Hコールについて分析した。分析特異度は、健康なドナーの試料(20/20、95%CI 83~100%)、考案試料(245/245、95%CI 98~100%)および患者試料(48/48、95%CI 92~100%)にわたって100%であった。
3.臨床的検証研究
コンパレーターとして使用するために利用することができる直交型のcfDNAに基づく方法がなかったので、40種の異なるがん型であって、そのうちの15種に少なくとも5つ代表検体があったがん型(図9)を含む1145の試料について標準ケア組織検査(IHC法、PCR法およびNGS法の混合)を使用して決定した、診療記録からのMSIステータスと、ctDNA MSI評価を比較することにより、臨床正確度を決定した。949名の一意の評価可能な患者において、ctDNAは、MSI-Hと報告された患者の87%(71/82、95%CI 77~93%)およびMSS/MSI-Lと報告された患者の99.5%(863/867、95%CI 98.7~99.8%)を検出し、全体の正確度については98.4%(934/949、95%CI 97.3~99.1%)であり、陽性的中率(PPV)については95%(71/75、95%CI 86~98%)であった(図10C、表8)。コンピュータによるモデリング研究と一致して、MSI-H検出は、一意の患者試料セット全体(表6~9)において観測されたctDNA-組織不一致の57%(16/28)を説明する低い腫瘍割合(図10A)のために評価不能と分類された試料では稀(0/19)であった。腫瘍割合が1%より高かった試料については、ctDNA PPAが93%に上昇した(54/58、95%CI 82~98%、表9)。
興味深いことに、文献(23、35)で報告されたIHC組織検査とPCR組織検査間の高度な相関にもかかわらず、ここでのctDNAと組織MSIステータスとの一致は、組織検査方法論によって異なった(PCRにより97.4%(450/462)、NGSにより98.0%(239/244)、およびIHCにより83.0%(93/112)、図10Bならびに表10および11)。さらなる調査において、この不一致は、組織IHC陽性、ctDNA陰性集団の増加(PCRにより2.4%、NGSにより2.0%、およびIHCにより12.5%、IHC-PCRとIHC-NGSについてのフィッシャー直接確率検定p<0.001)と、組織IHC陰性、ctDNA陽性集団の増加(PCRにより0.2%、NGSにより0%、およびIHCにより4.5%、両方の比較のためのフィッシャー直接確率検定p<0.01)の両方に起因することが認められた。これらの食い違いのために、本発明者らは、IHCの制約が、ctDNA正確度の低下ではなく観測されたIHC-ctDNA不一致の一因になり得るかどうかを調査することになった。IHCおよび別の組織検査結果が入手可能であった25の試料のうち、12の試料は、IHC-ctDNA不一致を明示した。重要なこととして、PCRおよび/またはNGS組織検査は、12の不一致のうち5つにおいて組織IHCではなくctDNA NGS結果を支持した。まとめると、これらのデータは、IHCが、MSI決定においてPCR診断原型ほど信頼性が高くない可能性があるという以前の報告を支持する(36)。
4.28,459名の継続的進行がん患者におけるctDNA MSIステータス
多数の研究により組織中の異なる腫瘍型にわたってMSIの保有率が評価されてきた(13、32、37)が、今までに、がん型にわたってのctDNA MSIステータスのランドスケープ分析は発表されていない。これを達成するために、Guardant Health Clinical Laboratoryで検査した28,459の継続的進行がん患者臨床試料に上記のMSIアルゴリズムを適用した。このコホートにおいて、16の異なる腫瘍型を含む278の試料(腫瘍割合中央値6.55%、範囲0.09~89%)がctDNAによりMSI-Hと同定された。これは、組織について以前に報告されたもの(13、32、37)と同様の、約1%の全汎がん保有率に相当する。同様に、腫瘍型間のMSI-H保有率も、組織に基づく分析(図11A)で観測されたものをよく反映し;予想通り、MSI-Hは、子宮内膜、結腸直腸および胃がんにおいて最も蔓延していたが、肺、膀胱および頭頸部がんなどの他の腫瘍は、それより低い保有率を明示した。以前のMSI-H保有率推定値からの特異的逸脱は、子宮内膜、結腸直腸および胃がんにおけるわずかに低い保有率、ならびに前立腺がんにおけるわずかに高い保有率を含んだ。
ctDNA使用企図集団の汎固形腫瘍の性質およびMSI-H腫瘍について承認されている免疫療法を考えて、このパネルについてのマイクロサテライト遺伝子座を、全ての固形腫瘍型にわたってMSIステータスの情報が得られるように意図的に選択した。この設計意図と一致して、試料レベルのおよび遺伝子座レベルのMSIスコアの分布-すなわち、それぞれ、MSIスコアおよび部位スコア-の分析(図11Bおよび11C)は、腫瘍型にわたって一貫した性能を実証し、MSI-H試料は、閾値より有意に高いシグナルを実証した。さらに、MSIが一般に検査される腫瘍型以外のMSI評価の診断率は、かなりのものであり、同定されたケースの半分より多く(143/278)が、MSI検査が非常に稀である腫瘍型に存在し、したがって、そうでなければ決して検査されなかった患者が同定された。
組織で報告されたもの(38)と一致して、インデルおよびSNV(非同義および同義変異体を含む)の数は、MSI-H試料では、MSSステータスを有すると特徴付けられたものと比較して有意に増加される(図12)。具体的には、MSI-H試料におけるSNV数中央値は、MSSにおける1.4に対して6.3であり(カイ二乗p<0.0001)、MSI-H試料におけるインデル数中央値は、MSSにおける0.4に対して2.6であった(カイ二乗p<0.0001)。
5.ctDNA MSIステータスは、免疫療法の奏効を予測する
目下、MSIステータスの最も顕著な有用性は、免疫療法のための患者を選択するその能力である。このことおよび多くの患者から組織を得ることへの障害にもかかわらず、免疫療法への奏効を予測するctDNA MSIステータスの能力は、報告されていない。このバイオマーカーについての臨床的妥当性を確立するために、本発明者らは、胃がんにおける第II相ペムブロリズマブ治験(NCT#02589496)での標準ケア化学療法の失敗後、ペムブロリズマブ(n=15)またはニボルマブ(n=1)で処置した16名のctDNA MSI-H転移性胃がん患者についての臨床転帰を提示する。前処置試料におけるcfDNAおよび組織PCR MSI評価は、MSI-Hについて100%の一致(16/16、95%CI 76~100%)であった。16名中10名の患者は、RECIST 1.1基準により治験担当医が客観的に評価して完全奏効(n=3)または部分奏効(n=7)に達し、さらなる3名の患者は安定病態を有しており(図13A)、客観的奏効率については63%(10/16、95%CI 36~84%)であり、病勢コントロール率(disease control rate)については81%(13/16、95%CI 54~95%)であり、これは、組織試験により定義されたMSI-H患者について以前に報告された奏効(39)と同様であった。重要なこととして、この前処置集団でおいてでさえ、これらの奏効は持続的であり、処置期間中央値は39週間であった。実際、例えば患者21は、フルオロピリミジン/白金化学療法の失敗後のペムブロリズマブ処置後に疾患の完全退縮を経験し、35サイクルの治療の完了後に6ヶ月より長く依然として無病である(図13B~13E)。
考察
新規のcfDNAに基づく標的化NGS手法をMSI検出について検証した-マイクロサテライトの大パネルを使用することにより、この手法は、非常に高い特異度を維持しながら組織に基づく方法と比較して高い感度を達成した。16のよく見られる固形腫瘍にわたって血漿で検出されたMSI-H保有率は、公開されている組織に基づく大要と同様であり、したがって、MSI検出アルゴリズム設計で意図した汎腫瘍性能を実証した。さらに、cfDNAにより検出されたMSI-H患者が、組織定義集団について報告されたもの(39)と同様にICB療法の恩恵を受けたことを示すことによって、組織の入手可能性も侵襲的組織獲得手順を受ける必要性も関係なくMSI検出の利用可能性が全ての患者に拡大される臨床的有用性を実証した。
本実施例は、全てのガイドライン推奨適応症において他の4つの変異型の検出について以前に検証したctDNAパネル(26)でのMSI検出についてのロバスト解析性能を実証する。特に、考案試料におけるMSI検出についての分析感度は、インデルおよびSNVについての同様の感度の以前の報告(26)と一致する、0.1%までの再現性のある検出を実証した。重要なこととして、本実施例は、まだ記載されていない最大のctDNA-組織MSI一致コホートを構成する、直交組織MSIを含む1145の試料においてctDNA MSI検査の性能を評価した。同じ患者についての標準ケア組織MSI検査と比較して、ctDNA MSI評価は、局所対中枢組織に基づくMSI評価について報告された90~92%の報告されたPPV(36)に勝るとも劣らない高いPPV(95%)、ならびに他の変異型についての血漿および組織遺伝子型判定の一致を調査した以前の研究(25、26、45、46)と一致する評価可能集団における高いPPA(87%)を実証した。不完全な一致の一因となり得る因子としては、腫瘍不均一性、原発病変 対 転移性病変による異なる脱落、組織および血漿採取の時間的不一致、ならびに一部の腫瘍による少ない腫瘍脱落を挙げることができる(40、44、47~49)。興味深いことに、この報告において血漿によりおよびペンタプレックスPCRによりMSI-Hと同定された胃がん患者は、組織を用いて実施されるIHCとPCRの両方により評価してMSSおよびMSI-H疾患の別個の腫瘍集団を構成すると以前に報告された(40)。同じ研究により、同じ患者における対の組織生検試料間でMSI-Hの9%不一致が認められ(40)、これによりMSIステータスの不一致への腫瘍間不均一性の潜在的寄与が強調された。さらに、この報告におけるPCR組織法とIHC組織法の間の些細ではない不一致の観測は、正確なMSI検査の重要性を強調し、ICB失敗の主原因として報告された(36)。進行固形腫瘍における組織遺伝子型判定により提示された課題と一致して、転移性非小細胞肺がん(NSCLC)における研究は、組織と比較して、血漿に基づく検査が、腫瘍遺伝子型判定の成功裏の結果を増加させるばかりでなく、典型的な組織遺伝子決定結果より少なくとも1週間速く結果を出す上に標的化可能な突然変異を検出する頻度も増加させることを示した(25、45)。
本実施例は、大きい進行汎がんコホートにおけるMSIの初めてのctDNAに基づくランドスケープ解析を提示する。全体的に見れば、>28,000の継続的臨床試料のセットにおける腫瘍型にわたっての相対保有率は、組織について報告されたもの(13、32、37)と一致し、差がほとんどない。例えば、CRCおよび子宮内膜がんにおける保有率は、組織について報告されたもの(13)より低く、これは、組織に基づくランドスケープ解析が、予後がより良好である(15)およびctDNAで検査した進行がん集団の一部である可能性が低い、多数の早期MSI-H腫瘍を含む事実を反映する可能性が最も高い。その一方で、MSI-H前立腺がんの保有率が予想したものより多いことは、進行した患者におけるMSI-H疾患の表示増加が原因であり、進行前立腺がんにおけるMSIステータスに重点を置く2つの最近の研究は、本研究で観測された本発明者らの2.6%と同様である、3.1%および3.8%のMSI-H保有率をその患者集団において示した(50、51)。当然のことながら、汎がんMSI検出の設計意図からして、ランドスケープ解析は、マイクロサテライト不安定性の腫瘍型特異的パターンを明らかにしなかった。しかし、これは、組織において示されたもの(37、52)と同様に、血漿において、腫瘍型特異的パターンがより多数のマイクロサテライト遺伝子座およびより多数の代表MSI-H試料の評価によって出現し得る可能性を排除しない。
ここで報告した臨床転帰は、胃がんに限られたものであるが、それにもかかわらず、観測された客観的奏効率は、組織に基づく研究からの予想と一致し、これは、cfDNA MSI結果に基づくICB処置が、固形腫瘍型にわたって予想転帰を達成するはずであることを示唆している。加えて、生殖細胞系dMMRデータの不足が、cfDNA検出MSIの家族性の影響についての結論を出すことを妨げた。最後に、cfDNA-/組織+の不一致を有する患者の大多数についての処置データを入手することができなかったが、少なくとも一部の患者は、MSI-H疾患を抑制する可能性があり、cfDNAによるMSI検出の欠如につながる可能性がある、ICB療法を、腫瘍結果に基づいて受けたと予想される。しかるが故に、組織と比較してMSI-H検出についての感度87%は、処置未経験であるまたは治療を受けていない患者ではより高くなる可能性がある。さらなる研究をこれらの問題に対処するために進めるべきである。
要約すると、MSIステータスを正確に評価し、その上、包括的な腫瘍遺伝子型判定ももたらし、したがって、高い感度、特異度および精度で汎固形腫瘍のガイドラインを満たす検査を単回の末梢血採取で可能にする、cfDNAに基づく標的化NGSパネルを開発し、検証した。組織検査、集団レベルの保有率解析と、ICB療法で処置したcfDNA MSI-H患者の最初に報告された転帰との比較の両方を使用する臨床的検証は、この手法の臨床正確度および臨床的関連性を支持した。単純な末梢血採取によるMSIステータスと腫瘍遺伝子型のこのような同時特徴付けには、現行の組織に基づく検査パラダイムが不適切である患者を含む全ての進行がん患者に標的化療法と免疫療法の両方を利用する機会を広げる可能性がある。
参考文献
上記開示を明確にすることおよび理解することを目的として説明および実施例によってある程度詳細に説明したが、形態および詳細の様々な変更を、本開示の真の範囲から逸脱することなく加えることができること、および添付の特許請求の範囲に記載の範囲内で実施することができることは、本開示を読むことで当業者には明らかになる。例えば、方法、システム、コンピュータ可読媒体、および/またはこれらの成分特徴、ステップ、要素もしくは他の態様全てを、様々な組合せで使用することができる。
本明細書に引用した特許、特許出願、ウェブサイト、他の公表文献または文献、受託番号およびこれらに類するもの全ては、それら全体があらゆる目的で参照により本明細書に組み入れられ、この組み入れは、各々の個々の事柄が参照によりそのように組み入れられると具体的にかつ個々に示されている場合と同程度のものである。配列の異なるバージョンが、異なる時点で、ある受託番号に結び付けられたとしても、本願の有効出願日の時点でその受託番号に結び付けられているバージョンを意図している。有効出願日とは、利用可能な場合には受託番号を参照して、実際の出願日または優先権出願の出願日のどちらか早いほうの日を意味する。同様に、公表文献、ウェブサイトまたはこれらに類するものの異なるバージョンが、異なる時点で公表されていたとしても、別段の指示がない限り、本出願の有効出願日の最も近日に公表されたバージョンを意図している。
本発明は、例えば、以下の項目を提供する。
(項目1)
核酸試料の反復核酸不安定性ステータスを決定する方法であって、
(a)配列情報から複数の反復核酸遺伝子座の各々に存在する多数の異なるリピート長を定量化して、前記複数の反復核酸遺伝子座の各々についての部位スコアを生成するステップであって、前記配列情報が、前記核酸試料中の反復核酸遺伝子座の集団からのものである、ステップ;
(b)所与の反復核酸遺伝子座の部位スコアが、前記所与の反復核酸遺伝子座の部位特異的訓練済み閾値を超える場合、前記所与の反復核酸遺伝子座を不安定であるとコールして、前記複数の反復核酸遺伝子座からの多数の不安定な反復核酸遺伝子座を含む反復核酸不安定性スコアを生成するステップ;および
(c)前記反復核酸不安定性スコアが、前記核酸試料中の前記反復核酸遺伝子座の集団の集団訓練済み閾値を超える場合、前記核酸試料の前記反復核酸不安定性ステータスを不安定であると分類し、それによって、前記核酸試料の前記反復核酸不安定性ステータスを決定するステップ
を含む、方法。
(項目2)
試料の反復DNA不安定性ステータスを決定する方法であって、
(a)配列情報から複数の反復DNA遺伝子座の各々に存在する多数の異なるリピート長を定量化して、前記複数の反復DNA遺伝子座の各々についての部位スコアを生成するステップであって、前記配列情報が、前記試料中の反復DNA遺伝子座の集団からのものである、ステップ;
(b)前記複数の反復DNA遺伝子座の各々についての所与の反復DNA遺伝子座の前記部位スコアを前記所与の反復DNA遺伝子座の部位特異的訓練済み閾値と比較するステップ;
(c)前記所与の反復DNA遺伝子座の前記部位スコアが、前記所与の反復DNA遺伝子座の前記部位特異的訓練済み閾値を超える場合、前記所与の反復核DNA遺伝子座を不安定であるとコールして、前記複数の反復DNA遺伝子座からの多数の不安定な反復DNA遺伝子座を含む反復DNA不安定性スコアを生成するステップ;および
(d)前記反復DNA不安定性スコアが、前記試料中の前記反復DNA遺伝子座の集団の集団訓練済み閾値を超える場合、前記試料の前記反復DNA不安定性ステータスを不安定であると分類し、それによって、前記試料の前記反復DNA不安定性ステータスを決定するステップ
を含む、方法。
(項目3)
試料のマイクロサテライト不安定性(MSI)ステータスを決定する方法であって、
(a)配列情報から複数のマイクロサテライト遺伝子座の各々に存在する多数の異なるリピート長を定量化して、前記複数のマイクロサテライト遺伝子座の各々についての部位スコアを生成するステップであって、前記配列情報が、前記試料中のマイクロサテライト遺伝子座の集団からのものである、ステップ;
(b)前記複数のマイクロサテライト遺伝子座の各々についての所与のマイクロサテライト遺伝子座の前記部位スコアを前記所与のマイクロサテライト遺伝子座の部位特異的訓練済み閾値と比較するステップ;
(c)前記所与のマイクロサテライト遺伝子座の前記部位スコアが、前記所与のマイクロサテライト遺伝子座の前記部位特異的訓練済み閾値を超える場合、前記所与のマイクロサテライト遺伝子座を不安定であるとコールして、前記複数のマイクロサテライト遺伝子座からの多数の不安定なマイクロサテライト遺伝子座を含むマイクロサテライト不安定性スコアを生成するステップ;および
(d)前記マイクロサテライト不安定性スコアが、前記試料中の前記マイクロサテライト遺伝子座の集団の集団訓練済み閾値を超える場合、前記試料の前記MSIステータスを不安定であると分類し、それによって、前記試料の前記MSIステータスを決定するステップ
を含む、方法。
(項目4)
試料のマイクロサテライト不安定性(MSI)ステータスを決定する方法であって、
(a)前記試料中のマイクロサテライト遺伝子座の集団からの配列情報を受け取るステップ;
(b)前記配列情報から複数のマイクロサテライト遺伝子座の各々に存在する多数の異なるリピート長を定量化して、前記複数のマイクロサテライト遺伝子座の各々についての部位スコアを生成するステップ;
(c)前記複数のマイクロサテライト遺伝子座の各々についての所与のマイクロサテライト遺伝子座の前記部位スコアを前記所与のマイクロサテライト遺伝子座の部位特異的訓練済み閾値と比較するステップ;
(d)前記所与のマイクロサテライト遺伝子座の前記部位スコアが、前記所与のマイクロサテライト遺伝子座の前記部位特異的訓練済み閾値を超える場合、前記所与のマイクロサテライト遺伝子座を不安定であるとコールして、前記複数のマイクロサテライト遺伝子座からの多数の不安定なマイクロサテライト遺伝子座を含むマイクロサテライト不安定性スコアを生成するステップ;および
(e)前記マイクロサテライト不安定性スコアが、前記試料中の前記マイクロサテライト遺伝子座の集団の集団訓練済み閾値を超える場合、前記試料の前記MSIステータスを不安定であると分類し、それによって、前記試料の前記MSIステータスを決定するステップ
を含む、方法。
(項目5)
対象における疾患を処置するための1つまたは複数のカスタマイズされた療法を同定する方法であって、
(a)配列情報から複数のマイクロサテライト遺伝子座の各々に存在する多数の異なるリピート長を定量化して、前記複数のマイクロサテライト遺伝子座の各々についての部位スコアを生成するステップであって、前記配列情報が、試料中のマイクロサテライト遺伝子座の集団からのものである、ステップ;
(b)前記複数のマイクロサテライト遺伝子座の各々についての所与のマイクロサテライト遺伝子座の前記部位スコアを前記所与のマイクロサテライト遺伝子座の部位特異的訓練済み閾値と比較するステップ;
(c)前記所与のマイクロサテライト遺伝子座の前記部位スコアが、前記所与のマイクロサテライト遺伝子座の前記部位特異的訓練済み閾値を超える場合、前記所与のマイクロサテライト遺伝子座を不安定であるとコールして、前記複数のマイクロサテライト遺伝子座からの多数の不安定なマイクロサテライト遺伝子座を含むマイクロサテライト不安定性スコアを生成するステップ;
(d)前記マイクロサテライト不安定性スコアが、前記試料中の前記マイクロサテライト遺伝子座の集団の集団訓練済み閾値を超える場合、前記試料のMSIステータスを不安定であると分類して、不安定な試料を同定するステップ;および
(e)前記試料の前記マイクロサテライト不安定性ステータスを1つまたは複数の療法でインデックス化されている1つまたは複数のコンパレーター結果と比較して、前記対象における前記疾患を処置するための1つまたは複数のカスタマイズされた療法を同定するステップ
を含む、方法。
(項目6)
対象における疾患を処置する方法であって、
(a)配列情報から複数のマイクロサテライト遺伝子座の各々に存在する多数の異なるリピート長を定量化して、前記複数のマイクロサテライト遺伝子座の各々についての部位スコアを生成するステップであって、前記配列情報が、試料中のマイクロサテライト遺伝子座の集団からのものである、ステップ;
(b)前記複数のマイクロサテライト遺伝子座の各々についての所与のマイクロサテライト遺伝子座の前記部位スコアを前記所与のマイクロサテライト遺伝子座の部位特異的訓練済み閾値と比較するステップ;
(c)前記所与のマイクロサテライト遺伝子座の前記部位スコアが、前記所与のマイクロサテライト遺伝子座の前記部位特異的訓練済み閾値を超える場合、前記所与のマイクロサテライト遺伝子座を不安定であるとコールして、前記複数のマイクロサテライト遺伝子座からの多数の不安定なマイクロサテライト遺伝子座を含むマイクロサテライト不安定性スコアを生成するステップ;
(d)前記マイクロサテライト不安定性スコアが、前記試料中の前記マイクロサテライト遺伝子座の集団の集団訓練済み閾値を超える場合、前記試料の前記MSIステータスを不安定であると分類して、不安定な試料を同定するステップ;
(e)前記試料の前記マイクロサテライト不安定性ステータスを1つまたは複数の療法でインデックス化されている1つまたは複数のコンパレーター結果と比較して、前記対象における前記疾患を処置するための1つまたは複数のカスタマイズされた療法を同定するステップ;および
(f)前記試料の前記マイクロサテライト不安定性ステータスと前記コンパレーター結果とが実質的にマッチする場合、同定された前記カスタマイズされた療法のうちの少なくとも1つを前記対象に投与し、それによって、前記対象における前記疾患を処置するステップ
を含む、方法。
(項目7)
対象における疾患を処置する方法であって、前記対象に1つまたは複数のカスタマイズされた療法を投与し、それによって、前記対象における前記疾患を処置するステップを含み、前記カスタマイズされた療法が、以下:
(a)配列情報から複数のマイクロサテライト遺伝子座の各々に存在する多数の異なるリピート長を定量化して、前記複数のマイクロサテライト遺伝子座の各々についての部位スコアを生成するステップであって、前記配列情報が、試料中のマイクロサテライト遺伝子座の集団からのものである、ステップ;
(b)前記複数のマイクロサテライト遺伝子座の各々についての所与のマイクロサテライト遺伝子座の前記部位スコアを前記所与のマイクロサテライト遺伝子座の部位特異的訓練済み閾値と比較するステップ;
(c)前記所与のマイクロサテライト遺伝子座の前記部位スコアが、前記所与のマイクロサテライト遺伝子座の前記部位特異的訓練済み閾値を超える場合、前記所与のマイクロサテライト遺伝子座を不安定であるとコールして、前記複数のマイクロサテライト遺伝子座からの多数の不安定なマイクロサテライト遺伝子座を含むマイクロサテライト不安定性スコアを生成するステップ;
(d)前記マイクロサテライト不安定性スコアが、前記試料中の前記マイクロサテライト遺伝子座の集団の集団訓練済み閾値を超える場合、前記試料のMSIステータスを不安定であると分類して、不安定な試料を同定するステップ;
(e)前記試料の前記マイクロサテライト不安定性ステータスを、1つまたは複数の療法でインデックス化されている1つまたは複数のコンパレーター結果と比較するステップ;および
(f)前記試料の前記マイクロサテライト不安定性ステータスと前記コンパレーター結果とが実質的にマッチする場合、前記対象における前記疾患を処置するための1つまたは複数のカスタマイズされた療法を同定するステップ
によって同定されている、方法。
(項目8)
前記複数のマイクロサテライト遺伝子座の前記部位スコアが、尤度スコアを含む、前記項目のいずれか一項に記載の方法。
(項目9)
前記尤度スコアが、前記試料中の体細胞由来の多数のcfDNA断片に由来する生体シグナルを、前記試料中の試料収集後アーティファクトから生じるノイズと区別する、確率的log尤度に基づくスコアを含む、項目8に記載の方法。
(項目10)
少なくとも第1のパラメーターがアレル頻度を含み、少なくとも第2のパラメーターが少なくとも1つのエラーモードを含む、少なくとも2つのパラメーターを使用して、前記試料からの前記配列情報における個々のマイクロサテライト遺伝子座についての前記確率的log尤度に基づくスコアを決定するステップを含む、項目9に記載の方法。
(項目11)
前記アレル頻度が、前記試料からの前記配列情報における異なるリピート長を含む核酸の頻度を含む、項目10に記載の方法。
(項目12)
前記少なくとも1つのエラーモードが、ランダムエラーモードおよび鎖特異的エラーモードを含む、項目10に記載の方法。
(項目13)
前記複数のマイクロサテライト遺伝子座の前記部位スコアが、
(a)前記所与のマイクロサテライト遺伝子座が安定であるという帰無仮説への観測配列の支持を測定するスコアと、
(b)前記所与のマイクロサテライト遺伝子座が不安定であるという対立仮説への観測配列の支持を測定するスコアと
の差または比を含む、前記項目のいずれか一項に記載の方法。
(項目14)
前記複数のマイクロサテライト遺伝子座の前記部位スコアが、尤度基準、log尤度基準、事後確率基準、赤池情報量基準(AIC)およびベイズ情報量基準のうちの1つまたは複数を使用して生成される、前記項目のいずれか一項に記載の方法。
(項目15)
前記複数のマイクロサテライト遺伝子座の前記部位スコアが、前記複数のマイクロサテライト遺伝子座における体細胞インデルの存在について検定する、赤池情報量基準(AIC)に基づく部位スコアを含む、前記項目のいずれか一項に記載の方法。
(項目16)
所与のAICに基づく部位スコアが、以下の式:
AIC=k-log尤度
を使用して計算され、式中、kは、モデルにおいて使用されるパラメーターの数である、項目15に記載の方法。
(項目17)
最尤推定(MLE)を使用して前記モデルのパラメーターを推定するステップを含む、項目10または16に記載の方法。
(項目18)
Nelder-Meadアルゴリズムを使用して前記MLEを決定するステップを含む、項目17に記載の方法。
(項目19)
以下の式:
AIC
0
=k-log(Pr(obs|β,γ))
を使用して、前記モデルの帰無仮説スコアを計算するステップを含み、式中、AIC
0
は、前記帰無仮説であり、kは、前記モデルにおいて使用されるパラメーターの数であり、Prは、確率であり、obsは、前記所与のマイクロサテライト遺伝子座をカバーする観測シークエンシングリードのリピート長を含み、βは、少なくとも1つの鎖特異的エラーパラメーターであり、γは、少なくとも1つのランダムエラーパラメーターである、項目16に記載の方法。
(項目20)
以下の式:
AIC
min
=min
α
(k-log(Pr(obs|β,γ,α))
を使用して、前記モデルの対立仮説スコアを計算するステップを含み、式中、AIC
min
は、前記対立仮説であり、min
α
は、αの全値に対する最小化効果であり、kは、前記モデルにおいて使用されるパラメーターの数であり、Prは、確率であり、obsは、前記所与のマイクロサテライト遺伝子座をカバーする観測シークエンシングリードのリピート長を含み、βは、少なくとも1つの鎖特異的エラーパラメーターであり、γは、少なくとも1つのランダムエラーパラメーターであり、αは、少なくとも1のアレル頻度であり、ここでαは、1つまたは複数のα
i
の合計が1に等しいようなアレル頻度のベクトルである、
項目16に記載の方法。
(項目21)
以下の式:
ΔAIC=AIC
0
-AIC
min
を使用して、前記部位スコアを検出するステップを含む、前記項目のいずれか一項に記載の方法。
(項目22)
γが、
(a)シークエンシングリード内で観測されるマイクロサテライト長が、起源となる核酸分子の鎖についての予想マイクロサテライト長より1リピート単位長い、リードレベルのエラー率;および/または
(b)シークエンシングリード内で観測されるマイクロサテライト長が、起源となる核酸分子の鎖についての予想マイクロサテライト長より1リピート単位短い、リードレベルのエラー率
を含む、前記項目のいずれか一項に記載の方法。
(項目23)
βが、
(a)センス鎖の予想マイクロサテライト長が、核酸由来分子の予想マイクロサテライト長より1リピート単位長い、鎖レベルのエラー率;
(b)アンチセンス鎖の予想マイクロサテライト長が、核酸由来分子の予想マイクロサテライト長より1リピート単位長い、鎖レベルのエラー率;
(c)センス鎖の予想マイクロサテライト長が、核酸由来分子の予想マイクロサテライト長より1リピート単位短い、鎖レベルのエラー率;および/または
(d)アンチセンス鎖の予想マイクロサテライト長が、核酸由来分子の予想マイクロサテライト長より1リピート単位短い、鎖レベルのエラー率
を含む、前記項目のいずれか一項に記載の方法。
(項目24)
前記所与のマイクロサテライト遺伝子座の前記部位スコアが、前記所与のマイクロサテライト遺伝子座の前記部位特異的訓練済み閾値を統計的に超える場合、前記所与のマイクロサテライト遺伝子座を不安定であるとコールするステップを含む、前記項目のいずれか一項に記載の方法。
(項目25)
前記試料が、突然変異型アレル割合を含む、前記項目のいずれか一項に記載の方法。
(項目26)
前記試料が、腫瘍割合を含む、前記項目のいずれか一項に記載の方法。
(項目27)
前記腫瘍割合が、前記試料中の前記核酸において同定された全ての体細胞突然変異の最大突然変異型アレル割合(MAF)を含む、項目26に記載の方法。
(項目28)
前記腫瘍割合が、前記試料中の全ての核酸の約0.05%、約0.1%、約0.2%、約0.5%、約1%、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約11%、約12%、約13%、約14%または約15%未満である、項目27に記載の方法。
(項目29)
前記複数のマイクロサテライト遺伝子座が、前記マイクロサテライト遺伝子座の集団の全てを含む、前記項目のいずれか一項に記載の方法。
(項目30)
前記複数のマイクロサテライト遺伝子座が、前記マイクロサテライト遺伝子座の集団のサブセットを含む、項目1~28のいずれか一項に記載の方法。
(項目31)
1つまたは複数の訓練DNA試料中のマイクロサテライト遺伝子座の集団からの配列情報から前記部位特異的訓練済み閾値および/または前記集団訓練済み閾値を決定するステップを含む、前記項目のいずれか一項に記載の方法。
(項目32)
前記訓練DNA試料が、非腫瘍cfDNA試料を含む、項目31に記載の方法。
(項目33)
前記訓練DNA試料が、1つまたは複数の腫瘍型からのDNAを含む、項目31に記載の方法。
(項目34)
前記試料中の核酸の約0.2%腫瘍割合の検出限界(LOD)で少なくとも約94%の感度を有する、前記項目のいずれか一項に記載の方法。
(項目35)
前記試料中の非腫瘍DNAについて少なくとも約99%の特異度を有する、前記項目のいずれか一項に記載の方法。
(項目36)
前記試料の決定されたMSIステータスが、約1.4%~約15%の腫瘍割合範囲にわたってPCRに基づくMSI評価技法を使用して決定される前記試料の対応するMSIステータスとの少なくとも約95%、96%、97%、98%または99%の一致を含む、前記項目のいずれか一項に記載の方法。
(項目37)
前記一致が、100%である、項目36に記載の方法。
(項目38)
前記マイクロサテライト不安定性スコアが、前記複数のマイクロサテライト遺伝子座からの約1、約2、約3、約4、約5、約6、約7、約8、約9、約10、約15、約20、約30、約40、約50またはそれを超える値を超える不安定なマイクロサテライト遺伝子座数である場合、前記試料の前記MSIステータスを高度MSI(MSI-H)と分類するステップを含む、前記項目のいずれか一項に記載の方法。
(項目39)
不安定なマイクロサテライト遺伝子座の数が、前記複数のマイクロサテライト遺伝子座の約0.1%、約1%、約2%、約3%、約4%、約5%、約10%、約15%、約20%または約25%を構成する場合、前記試料の前記MSIステータスを高度MSI(MSI-H)と分類するステップを含む、前記項目のいずれか一項に記載の方法。
(項目40)
前記疾患が、胆道がん、膀胱がん、移行細胞癌、尿路上皮癌、脳がん、神経膠腫、星細胞腫、乳癌、化生性癌、子宮頸がん、子宮頸部扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス結腸直腸がん、結腸直腸腺癌、消化管間質腫瘍(GIST)、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼黒色腫、ぶどう膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、腎明細胞癌、移行細胞癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ球性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ球性(CLL)、慢性骨髄性(CML)、慢性骨髄単球性(CMML)、肝臓がん、肝臓癌、ヘパトーマ、肝細胞癌、胆管細胞癌、肝芽腫、肺がん、非小細胞肺がん(NSCLC)、中皮腫、B細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、T細胞リンパ腫、非ホジキンリンパ腫、前駆Tリンパ芽球性リンパ腫/白血病、末梢性T細胞リンパ腫、多発性骨髄腫、上咽頭癌(NPC)、神経芽腫、中咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵臓がん、膵管腺癌、偽乳頭新生物、腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍(GIST)、子宮がん、および子宮肉腫からなる群より選択される少なくとも1つの腫瘍型を含むがんを含む、項目5~7のいずれか一項に記載の方法。
(項目41)
前記療法が、少なくとも1つの免疫療法を含む、項目5~7のいずれか一項に記載の方法。
(項目42)
前記免疫療法が、少なくとも1つのチェックポイント阻害抗体を含む、項目41に記載の方法。
(項目43)
前記免疫療法が、PD-1、PD-2、PD-L1、PD-L2、CTLA-4、OX40、B7.1、B7He、LAG3、CD137、KIR、CCR5、CD27、CD40またはCD47に対する抗体を含む、項目41に記載の方法。
(項目44)
前記免疫療法が、少なくとも1つの腫瘍型に対する炎症促進性サイトカインの投与を含む、項目41に記載の方法。
(項目45)
前記免疫療法が、少なくとも1つの腫瘍型に対するT細胞の投与を含む、項目41に記載の方法。
(項目46)
対象から前記試料を得るステップをさらに含む、前記項目のいずれか一項に記載の方法。
(項目47)
前記試料が、組織、血液、血漿、血清、痰、尿、精液、膣液、糞便、滑液、脊髄液および唾液からなる群より選択される、項目46に記載の方法。
(項目48)
前記対象が、哺乳動物対象である、項目46に記載の方法。
(項目49)
前記哺乳動物対象が、ヒト対象である、項目48に記載の方法。
(項目50)
前記試料が、無細胞核酸を含む、項目46に記載の方法。
(項目51)
前記試料が、循環腫瘍核酸を含む、項目50に記載の方法。
(項目52)
前記試料から生成された前記配列情報を受け取るステップをさらに含み、前記配列情報が、前記試料中の前記マイクロサテライト遺伝子座の集団からのcfDNAシークエンシングリードを含む、前記項目のいずれか一項に記載の方法。
(項目53)
前記試料中の核酸の1つまたは複数のセグメントを増幅して、少なくとも1つの増幅された核酸を生成するステップを含む、項目46~52のいずれか一項に記載の方法。
(項目54)
前記試料からの核酸をシークエンシングして前記配列情報を生成するステップをさらに含む、項目46~53のいずれか一項に記載の方法。
(項目55)
前記配列情報が、前記試料中の核酸の標的化されたセグメントから得られ、前記標的化されたセグメントが、シークエンシングの前に前記試料中の前記核酸からの1つまたは複数の領域を選択的に濃縮することにより得られる、項目46~54のいずれか一項に記載の方法。
(項目56)
得られた前記標的化されたセグメントをシークエンシングの前に増幅するステップをさらに含む、項目55に記載の方法。
(項目57)
バーコードを含む1つまたは複数のアダプターをシークエンシングの前に前記核酸に結合させるステップをさらに含む、項目46~56のいずれか一項に記載の方法。
(項目58)
前記シークエンシングが、標的化されたシークエンシング、イントロンシークエンシング、エクソームシークエンシング、および全ゲノムシークエンシングからなる群より選択される、項目54~57のいずれか一項に記載の方法。
(項目59)
前記試料の前記核酸内の少なくとも約50、約100、約150、約200、約250、約500、約750、約1,000、約1,500、約2,000、またはそれを超える標的化されたゲノム領域をシークエンシングして前記配列情報を生成するステップを含む、項目54~58のいずれか一項に記載の方法。
(項目60)
異なるリピート長の数が、前記複数のマイクロサテライト遺伝子座の各々に存在する各々の異なるリピート長の頻度を含む、前記項目のいずれか一項に記載の方法。
(項目61)
前記方法の少なくとも一部分が、コンピュータで実行される、前記項目のいずれか一項に記載の方法。
(項目62)
前記試料の前記不安定性ステータスに関する情報、前記試料の前記不安定性スコアに関する情報および/または前記対象における前記疾患の処置のための前記1つまたは複数のカスタマイズされた療法に関する情報を必要に応じて含むレポートを生成するステップをさらに含む、前記項目のいずれか一項に記載の方法。
(項目63)
前記対象または医療提供者などの第三者に前記レポートを伝えるステップをさらに含む、項目62に記載の方法またはシステム。
(項目64)
前記反復核酸不安定性スコアが、前記核酸試料中の前記反復核酸遺伝子座の集団の前記集団訓練済み閾値であるかまたはそれ未満である場合、前記核酸試料の前記反復核酸不安定性ステータスを安定であると分類するステップをさらに含む、前記項目のいずれか一項に記載の方法。
(項目65)
前記反復DNA不安定性スコアが、前記試料中の前記反復DNA遺伝子座の集団の前記集団訓練済み閾値であるかまたはそれ未満である場合、前記試料の前記反復DNA不安定性ステータスを安定であると分類するステップをさらに含む、前記項目のいずれか一項に記載の方法。
(項目66)
前記マイクロサテライト不安定性スコアが、前記試料中の前記マイクロサテライト遺伝子座の集団の前記集団訓練済み閾値であるかまたはそれ未満である場合、前記試料の前記マイクロサテライト不安定性ステータスを安定であると分類するステップをさらに含む、前記項目のいずれか一項に記載の方法。