ES2623089T3

ES2623089T3 - Diagnóstico prenatal no invasivo de trisomía fetal mediante el análisis de la relación alélica usando secuenciación masivamente paralela dirigida

Info

Publication number: ES2623089T3
Application number: ES13773129.5T
Authority: ES
Inventors: Wai Kwun Rossa Chiu; Jiawei LIAO; Kwan Chee Chan; Yuk Ming Dennis Lo
Original assignee: Chinese University of Hong Kong CUHK
Current assignee: Chinese University of Hong Kong CUHK
Priority date: 2012-04-06
Filing date: 2013-04-08
Publication date: 2017-07-10
Anticipated expiration: 2033-04-08
Also published as: HK1245851A1; CN104640997A; CA2869371A1; CN107841543B; JP6073461B2; US20200063207A1; AU2013245272A1; US20160201134A1; EP2834376A1; EP3178945A1; AU2018204344B2; AU2018204344A1; CA2869371C; EP2834376B1; CN104640997B; EP3178945B1; US10501797B2; HK1201300A1; JP2015521028A; TR201815541T4

Abstract

Un método de análisis de una muestra biológica de una gestante con un feto, para determinar si el feto tiene una aneuploidía asociada con un primer cromosoma, conteniendo la muestra biológica una mezcla de moléculas de ADN del feto y de la madre, comprendiendo el método: enriquecer la muestra biológica en moléculas de ADN de una pluralidad de regiones diana; secuenciar las moléculas de ADN de la muestra biológica para obtener una pluralidad de lecturas de secuencia; analizar la pluralidad de lecturas de secuencia, incluyendo el análisis de una lectura de secuencia: identificar una ubicación de la lectura de secuencia en un genoma de referencia mediante la alineación de la lectura de secuencia con respecto al genoma de referencia; y determinar un respectivo alelo de la lectura de secuencia; identificar una pluralidad de primeros locus del primer cromosoma, correspondiendo la pluralidad de primeros locus a una parte de las regiones diana; identificar una pluralidad de segundos locus en uno o más cromosomas de referencia, correspondiendo la pluralidad de los segundos locus a una parte de las regiones diana, siendo la gestante homocigótica para un respectivo alelo materno en cada uno del primer y segundo locus, y siendo el feto heterocigótico para el respectivo alelo materno y un respectivo alelo paterno de cada uno del primer y segundo locus, siendo los respectivos alelos paternos diferentes de los respectivos alelos maternos; determinar una primera cantidad materna de los respectivos alelos maternos en la pluralidad de primeros locus; determinar una primera cantidad paterna de los respectivos alelos paternos en la pluralidad de primeros locus; calcular una primera relación de la primera cantidad materna y la primera cantidad paterna; determinar una segunda cantidad materna de los respectivos alelos maternos en la pluralidad de segundos locus; determinar una segunda cantidad paterna de los respectivos alelos paternos en la pluralidad de segundos locus; calcular una segunda relación de la segunda cantidad materna y la segunda cantidad paterna; calcular una tercera relación de la primera relación y la segunda relación; y comparar la tercera relación con uno o más valores de corte para determinar si el feto tiene una aneuploidía asociada con el primer cromosoma.

Description

Diagnóstico prenatal no invasivo de trisomía fetal mediante el análisis de la relación alélica usando secuenciación masivamente paralela dirigida 5

Antecedentes

La detección y el diagnóstico prenatales de las aneuploidías fetales, tales como la trisomía 21 (T21), es un aspecto asentado de la atención obstétrica moderna. La detección prenatal convencional se basa en parámetros tales como la edad de la madre, la ecografía y los marcadores bioquímicos [1]. Dado que estos parámetros se basan principalmente en características fenotípicas, que son esencialmente epifenómenos asociados con la patología molecular principal, su rendimiento de diagnóstico suele ser inferior al óptimo. Los embarazos clasificados como de alto riesgo mediante metodologías de detección anteriores requieren una investigación más profunda de los materiales genéticos fetales obtenidos a través de procedimientos invasivos, tales como el muestreo de vellosidades

15 coriónicas (CVS) y la amniocentesis. Estos últimos procedimientos acarrean un bajo, pero definitivo, riesgo de aborto espontáneo [2]. La demostración del ADN fetal en plasma materno en 1997 ha abierto posibilidades para el diagnóstico prenatal no invasivo (NIPD) [3].

El ADN del plasma materno contiene una mezcla de ADN genómico materno y fetal fragmentado [4]. El gran fondo del ADN principal representa un desafío para el interrogatorio del estado cromosómico fetal. Los primeros estudios de NIPD de la T21 se basaron en polimorfismos, que requieren las mediciones de las relaciones alélicas y su comparación con los valores normales esperados [5-7]. Estos primeros métodos se basaron en identificaciones moleculares específicas del feto tales como marcadores de metilación de ADN [5] y marcadores de ARN [6], o requerían una para aumentar la concentración fraccionada de ADN fetal a un nivel suficientemente alto, tal como

25 usando el tratamiento mediante formaldehído del plasma materno [7]. Sin embargo, para la última metodología, hay controversias sobre la eficacia del tratamiento mediante formaldehído, ya que este método no podría ser reproducido sistemáticamente por diferentes grupos [8-10]. Por lo tanto, la aplicabilidad clínica de dicho método sigue siendo poco clara.

Por lo tanto, es deseable proporcionar nuevas técnicas para el diagnóstico prenatal no invasivo usando relaciones alélicas.

Breve resumen

35 Las realizaciones proporcionan métodos, aparatos y sistemas para determinar de manera no invasiva si un feto tiene una aneuploidía asociada con un primer cromosoma analizando una muestra biológica que contiene una mezcla de ADN fetal y materno exento de células. Por ejemplo, se puede determinar una primera relación alélica para el primer cromosoma y se puede determinar una segunda relación alélica para uno o más cromosomas de referencia. Para determinar las relaciones, el ADN se puede enriquecer de regiones diana asociadas con locus polimórficos y luego secuenciarse. Los locus de las regiones diana con alelos específicos del feto se identifican en el primer cromosoma y en uno o más cromosomas de referencia. Estos locus se pueden usar para determinar las respectivas relaciones alélicas. Se puede comparar una tercera relación de la primera y segunda relación alélica con un corte para determinar si está presente una aneuploidía para el primer cromosoma, y si la aneuploidía deriva de la madre o deriva del padre.

45 Otras realizaciones se dirigen a sistemas, dispositivos portátiles de consumo y medios de lectura informática asociados con métodos descritos en el presente documento.

Se puede obtener una mejor comprensión de la naturaleza y de las ventajas de las realizaciones de la presente invención con referencia a la siguiente descripción detallada y las figuras adjuntas.

Breve descripción de las figuras

La FIG. 1A muestra un diagrama 100 de alelos en un locus para la madre y un feto euploide, y un cálculo de

55 ejemplo de acuerdo con realizaciones de la presente invención. La FIG. 1B muestra un diagrama 120 de alelos en un locus para la madre y un feto aneuploide de origen paterno, y un cálculo de ejemplo de acuerdo con realizaciones de la presente invención. La FIG. 1C muestra un diagrama 140 de alelos en un locus para la madre y un feto aneuploide derivado de la madre, y un cálculo de ejemplo de acuerdo con realizaciones de la presente invención.

La FIG. 2 es un diagrama de flujo que ilustra un método 200 de análisis de una muestra biológica de una gestante con un feto para determinar si el feto tiene una aneuploidía.

La FIG. 3 muestra una tabla de resultados de la secuenciación de 14 mujeres embarazadas de acuerdo con 65 realizaciones de la presente invención.

La FIG. 4 muestra la detección de la T21 mediante la relación F-S en datos de secuenciación no dirigida y

dirigida. Se calcularon los valores de

para diferenciar la T21 de origen paterno y de origen materno de los fetos euploides en datos de secuenciación no dirigida (A) y dirigida (B). (T21 Ma: T21 de origen materno. T21 Pa: T21 de origen paterno). 5 Las FIG. 5A y 5B muestran gráficas de una simulación por ordenador para la detección de la T21 para concentraciones fraccionadas de ADN fetales del 5 % (FIG. 5B) y 15 % (FIG. 5A) de acuerdo con realizaciones de la presente invención.

10 La FIG. 6 muestra una representación gráfica 600 de una simulación por ordenador para investigar el número mínimo de recuentos alélicos informativos para la detección de T21.

La FIG. 7 muestra un diagrama de bloques de un ejemplo de sistema informático 700 que se puede usar con un sistema y métodos de acuerdo con realizaciones de la presente invención.

15 Definiciones

La expresión "muestra biológica", como se usa en el presente documento, se refiere a cualquier muestra que se toma de un sujeto (por ejemplo, un ser humano, tal como una gestante) y que contiene una o más moléculas de

20 ácido nucleico de interés. Los ejemplos incluyen plasma, saliva, fluido pleural, sudor, líquido ascítico, bilis, orina, suero, jugo pancreático, heces y muestras de frotis cervical

La expresión “ácido nucleico” o “polinucleótido” se refiere a un ácido desoxirribonucleico (ADN) o ácido ribonucleico (ARN) y a un polímero de los mismos en forma monocatenaria o bicatenaria. A menos que se limite 25 específicamente, la expresión incluye ácidos nucleicos que contienen análogos conocidos de nucleótidos naturales que tienen propiedades de unión similares a las del ácido nucleico de referencia y que se metabolizan de manera similar a la de los nucleótidos de origen natural. A menos que se indique de otra manera, una determinada secuencia de ácido nucleico también engloba implícitamente variantes conservativamente modificadas de las mismas (por ejemplo, sustituciones de codones degenerados), alelos, ortólogos, SNP y secuencias 30 complementarias, así como la secuencia explícitamente indicada. En concreto, las sustituciones de codones degenerados pueden conseguirse generando secuencias en las que la tercera posición de uno o más codones seleccionados (o todos) está sustituida con restos de bases y/o desoxiinosina mixtos (Batzer M. A. et al., Nucleic Acid Res 1991; 19:5081; Ohtsuka E. et al., J Biol Chem 1985; 260:2605-2608; y Rossolini G. M. et al., Mol Cell Probes 1994; 8:91-98). El término ácido nucleico se usa indistintamente con gen, ADNc, ARNm, ARN pequeño no codificante,

35 micro ARN (miARN), ARN de interacción con Piwi y ARN horquillado corto (ARNhc) codificado por un gen o locus.

El término “gen” significa el segmento de ADN implicado en la producción de una cadena polipeptídica. Este puede incluir regiones anteriores y posteriores a la región codificante (líder y remolque), así como a secuencias de intervención (intrones) entre segmentos codificantes individuales (exones).

40 Como se usa en el presente documento, el término "locus" es una ubicación o dirección de cualquier longitud de nucleótidos (o pares de bases) que tiene una variación a través de los genomas. Un SNP es informativo si es homocigótico en la madre (por ejemplo, genotipo AA) y heterocigótico en el feto (por ejemplo, genotipo AB).

45 La expresión “marcador secuenciado” (también denominado lectura de secuencia) se refiere a una secuencia obtenida de toda o parte de una molécula de ácido nucleico, por ejemplo, un fragmento de ADN. En una realización, solo un extremo del fragmento está secuenciado, por ejemplo, aproximadamente 30 pb. El marcador secuenciado se puede alinear entonces con un genoma de referencia. Como alternativa, ambos extremos del fragmento se pueden secuenciar para generar dos marcadores secuenciados que pueden proporcionar una mayor exactitud en la

50 alineación y también proporcionan una longitud del fragmento. En otra realización más, un fragmento de ADN lineal se puede circularizar, por ejemplo, mediante unión, y la parte que abarca el sitio de unión se puede secuenciar.

La expresión "secuenciación universal" se refiere a la secuenciación en la que se añaden adaptadores al final de un fragmento, y los cebadores para la secuenciación unidos a los adaptadores. Por lo tanto, cualquier fragmento se

55 puede secuenciar con el mismo cebador, y por lo tanto, la secuenciación puede ser aleatoria.

La expresión “concentración de ADN fetal fraccionada” se usa indistintamente con las expresiones “proporción de ADN fetal” y “fracción de ADN fetal”, y se refiere a la proporción de moléculas de ADN que están presentes en un plasma materno o en una muestra de suero que se deriva del feto (Lo Y. M. D. et al., Am J Hum Genet 1 98 62: 768

60 775; Lun F. M. F. et al., Clin Chem. 2008; 54: 1664-1672).

La expresión "secuencia de ácido nucleico sobrerrepresentada", como se usa en el presente documento, se refiere a la secuencia de ácido nucleico entre dos secuencias de interés (por ejemplo, una secuencia clínicamente relevante y una secuencia de fondo) que es más abundante que la otra secuencia en una muestra biológica. Por ejemplo, el

65 alelo materno (alelo compartido) estaría sobrerrepresentado en un locus informativo.

El término "parámetro", como se usa en el presente documento, significa un valor numérico que caracteriza un conjunto de datos cuantitativos y/o una relación numérica entre conjuntos de datos cuantitativos. Por ejemplo, una relación (o función de una relación) entre una primera cantidad de una primera secuencia de ácido nucleico y una segunda cantidad de una segunda secuencia de ácido nucleico es un parámetro.

5 La expresión "valor de corte", como se usa en el presente documento, significa un valor numérico cuyo valor se usa para arbitrar entre dos o más estados (por ejemplo, enfermos y no enfermos) de clasificación para una muestra biológica. Por ejemplo, si un parámetro es superior al valor de corte, se realiza una primera clasificación de los datos cuantitativos (por ejemplo, estado enfermo); o si el parámetro es inferior al valor de corte, se realiza una clasificación diferente de los datos cuantitativos (por ejemplo, estado no enfermo).

La expresión “aneuploidía cromosómica”, como se usa en el presente documento, significa una variación en la cantidad cuantitativa de un cromosoma con respecto a la de un genoma diploide. La variación puede ser una ganancia o una pérdida. Esto puede implicar todo un cromosoma o una región de un cromosoma.

15 Las abreviaturas no convencionales son: NIPD, diagnóstico prenatal no invasivo; MPS, secuenciación masivamente paralela; chr21, cromosoma 21; chrRef, cromosoma de referencia; T21, trisomía 21; SNP, polimorfismo de un solo nucleótido; FSR, relación F-S, relación entre el alelo específico del feto y el alelo compartido; FC, recuentos alélicos específicos del feto; y SC, recuentos alélicos compartidos.

Descripción detallada

El ADN del plasma obtenido de una gestante contiene una mezcla de ADN materno exento de células y ADN fetal exento de células. La proporción de ADN fetal en plasma materno es relativamente uniforme según lo determinado

25 usando marcadores genéticos polimórficos a través de diferentes cromosomas en embarazos euploides. Por ejemplo, la proporción de los recuentos de un primer alelo específico del feto en un primer locus es relativamente coincidente con la proporción de recuentos de un segundo alelo específico del feto en cualquier otro locus. La proporción de ADN fetal puede diferir de una muestra materna a otra, pero la proporción de ADN fetal para diferentes marcadores genéticos polimórficos (en el mismo cromosoma o cromosomas diferentes) es relativamente uniforme dentro de la muestra.

Para los embarazos aneuploides, la proporción de ADN fetal observada medida usando marcadores genéticos polimórficos para el cromosoma aneuploide sería perturbada. Las realizaciones usan polimorfismos (por ejemplo, polimorfismos de un solo nucleótido) con alelos específicos del feto para detectar dichas perturbaciones en madres

35 que portan fetos con aneuploidía (por ejemplo, fetos con la trisomía 21). Aunque el porcentaje de ADN fetal normalmente es inferior al porcentaje de ADN materno, el porcentaje de ADN fetal normalmente es lo suficientemente elevado como para identificar la perturbación. Sin embargo, la proporción de ADN fetal puede diferir de una muestra a otra, agregando así cierta complejidad a la identificación de la complejidad.

Para abordar esta complejidad, las realizaciones pueden determinar una relación usando una primera proporción de ADN fetal a partir de marcadores genéticos polimórficos para el cromosoma aneuploide y una segunda proporción de ADN fetal para cromosomas de referencia no implicados en la aneuploidía. La proporción de ADN fetal para los marcadores genéticos polimórficos en los cromosomas de referencia no sería perturbada por la aneuploidía. Con el uso de dicha segunda proporción determinada a partir de marcadores genéticos en los cromosomas de referencia,

45 se puede proporcionar un parámetro preciso (por ejemplo, la relación de las dos proporciones) para identificar una aneuploidía, en particular, cuando partes específicas del genoma están enriquecidas en sitios polimórficos conocidos. Dicho enriquecimiento puede proporcionar una mayor eficacia aumentando el número de moléculas de ADN analizadas que corresponden a marcadores polimórficos que se pueden usar, en relación con otras moléculas de ADN que no se usan para determinar el parámetro.

I. INTRODUCCIÓN

Una metodología para el NIPD de las aneuploidías (tales como la T21) es medir la proporción de moléculas de ADN derivadas del cromosoma 21 (chr21) en una muestra de plasma materno. Si una madre porta un feto con T21, la

55 copia adicional de chr21 del feto contribuiría con una cantidad adicional de molécula de ADN chr21 a la muestra de plasma materno, lo que conduce a una mayor proporción de secuencias chr21 [1,1]. La secuenciación masivamente paralela (MPS) potencia la exactitud de la cuantificación del ADN y ha permitido la detección de cantidades aberrantes de ARN fetal derivado de un cromosoma aneuploide [11-14]

Las realizaciones usan una metodología de relación alélica para el NIPD de una aneuploidía (tal como T21) usando MAPS. Puesto que los polimorfismos de un solo nucleótido (SNP) solo representan aproximadamente el 1,6 % del genoma humano de acuerdo con el dbSNP Build 135 para seres humanos (www.ncbi.nlm.nih.gov/projects/SNP/), el MAPS no dirigido convencional solo incluiría alelos de SNP en una pequeña proporción de lecturas de secuencias. Por lo tanto, las realizaciones pueden usar MPS dirigida para secuenciar preferentemente los locus de SNP 65 seleccionados en una muestra biológica (por ejemplo, plasma materno) para la detección de aneuploides fetales. En una publicación anterior, usando una plataforma de MPS dirigida basada en la hibridación, los inventores

demostraron el enriquecimiento de moléculas de ADN dentro de las regiones diana, así como la preservación de las relaciones alélicas de los SNP dirigido en el plasma materno después del enriquecimiento diana [15] .

Un SNP (u otro polimorfismo) es informativo si es homocigótico en la madre (por ejemplo, genotipo AA) y

5 heterocigótico en el feto (por ejemplo, genotipo AB). En este escenario, el alelo B es el alelo específico del feto, y el alelo A es el alelo compartido por la madre y el feto. Los recuentos alélicos específicos del feto y los recuentos alélicos compartidos para los SNP informativos pueden obtenerse a partir de la secuenciación del ADN plasmático y se usan para calcular una relación entre el recuento de alelos específicos del feto y los alelos compartidos. Un ejemplo de la relación es FSR marcada.

10 En una realización en la que el cromosoma de interés es el cromosoma 21, la relación puede expresarse como relación de F-S para el chr21 (expresada como FSR21) y los cromosomas de referencia (expresados como FSRRef).

Si una madre porta un feto euploide, la relación entre FSR21 y FSRRef (expresada como ) debería ser igual a 1 (FIG. 1A). Si una madre es portadora de un feto con T21 con un chr21 adicional con respecto al padre 15 (denominado en el presente documento T21 de origen paterno), el genotipo fetal en chr21 se convertiría en ABB. La

copia adicional del alelo específico del feto aumentaría el

hasta 2 (FIG. 1B), si la copia adicional del chr21 es de la madre (denominado en el presente documento T21 de origen materno), el genotipo fetal de chr21 se

convertiría en AAB. La copia adicional del alelo compartido reduciría la hasta menos de 1 (FIG. 1).

20 A. Euploide

La FIG. 1A muestra un diagrama 100 de alelos en un locus para la madre y un feto euploide, y un cálculo de ejemplo de acuerdo con realizaciones de la presente invención. El locus 103 es para un cromosoma de referencia y el locus 106 es para el cromosoma 21 (pero podría ser cualquier cromosoma de interés). El genoma materno es

25 homocigótico en cada locus, y el feto es heterocigótico en cada locus. Como se representa, el alelo materno se marca como A en cada locus, aunque la secuencia real de los dos locus sería diferente. Por lo tanto, A y B son simplemente marcadores que destacan dos alelos diferentes en un mismo locus (es decir, alelos de dos copias diferentes del cromosoma) y, en este caso, dos alelos en el genoma fetal.

30 El alelo paterno B es heredado por el feto del padre, haciendo con ello que el feto sea heterocigótico en los dos locus. En el cromosoma de referencia y en el cromosoma de interés se pueden encontrar otros locus (locus informativos) de ubicación similar. Por lo tanto, el locus 103 puede ser, en realidad, el locus 103, y el locus 106 puede ser el locus 106. También puede haber más de un cromosoma de referencia.

35 Para el caso euploide, el feto tiene un alelo A y un alelo B en el locus 103 y el locus 106. En un ejemplo en el que el porcentaje de ADN fetal es del 50 % (es decir, ARN materno y fetal en partes iguales), habría una proporción del 25 % de alelos B paternos detectados en el locus 103 y una proporción del 25 % de alelos B paternos en el locus

106. Por lo tanto, el cociente de las dos proporciones (es decir, 25 % dividido entre 25 %) sería igual a uno. De forma similar, una relación de los alelos B con respecto a los alelos A es de 1/3 para los locus 103 y 106, y 1/3

40 dividida entre 1/3 sería igual a uno. Como es evidente, debido a la naturaleza estadística del conjunto de muestras de los alelos detectados, la relación probablemente no sería exactamente igual a uno. Por lo tanto, una proporción (por ejemplo, cualquier relación de los recuentos de los alelos) de los alelos B paternos en el locus 103 debería ser igual a la proporción de los alelos B paternos.

45 La FIG. 1A proporciona una formulación más general para diferentes concentraciones fraccionadas de ADN fetal f. Como se muestra, en cada locus 103, el feto aportaría una proporción de f/2 del alelo B de todos los alelos detectados en el locus 103. Como se ha mencionado anteriormente, si f es 0,5, entonces la proporción sería de 0,25

o del 25 %. De manera similar, el feto aportaría f/2 del alelo A. Cuanto mayor fuese la concentración fraccionada de

ADN fetal, mayor sería la proporción del alelo B. En este caso, f se define como el ADN de cualquiera de los 50 genotipos del feto y, por lo tanto, el factor de dos.

Para la madre, cada copia del cromosoma aporta la misma proporción (1-f)/2. Cuando f es 0,5, la proporción es de 0,25 (2,5 %) como se ha indicado anteriormente. En el límite del 0 % del ADN fetal, cada alelo A aporta el 50 %, y solo se detecta la secuencia A, ya que la madre es homocigótica.

55 La relación de los alelos B con respecto a los alelos A detectados en cada locus 103 y 106 se da como f/(2-f). Por ejemplo, si f es 0,5, entonces la proporción es de 1/3, ya que hay un alelo B por cada alelo A. Se pueden usar otras proporciones, por ejemplo, el porcentaje de alelos B paternos detectados para todos los locus 103, como se da por B/(A+B) o 2B/(A+B), donde A y B son los recuentos de los correspondientes alelos. La proporción mostrada es FSR

60 marcada, como la relación del recuento del alelo específico del feto (paterno) y del alelo (materno) compartido.

B. Aneuploidía de origen paterno

La FIG. 1B muestra un diagrama 120 de alelos en un locus para la madre y un feto aneuploide de origen paterno, y un cálculo de ejemplo de acuerdo con realizaciones de la presente invención. El locus 123 es para un cromosoma 5 de referencia y el locus 126 es para el cromosoma 21. En cuanto a la FIG. 1A, el genoma materno es homocigótico en cada locus y el feto es heterocigótico en cada locus.

Para este caso aneuploide, el feto tiene un alelo A y un alelo B en el locus 123, pero tiene un alelo A y dos alelos B en el locus 126, ya que hay una copia extra del cromosoma 21 del padre. En un ejemplo donde el porcentaje de ADN fetal es del 50 % (es decir, ADN materno y fetal en partes iguales), la proporción de los alelos B con respecto a los alelos A para los locus 123 sería de 1/3, pero sería de 2/3 para los locus 126 ya que hay dos alelos B.

Para la fórmula general, se puede considerar que cada copia del cromosoma contribuye f/2, ya que la concentración fetal se determina con respecto al/a los cromosoma/s de referencia. Por lo tanto, la suma de los recuentos del alelo

15 B proporciona f/2 + f/2 = f. La suma de los recuentos del alelo A proporciona f/2 + 1 -f. La proporción de estos proporciona 2f/(2 -f), como se muestra. La proporción FSRRef para el cromosoma de referencia sigue siendo la misma que para la FIG. 1A, ya que este cromosoma sigue siendo euploide.

La proporción de la relación de FSR21 y FSRRef es dos. Por supuesto, debido a la naturaleza estadística del conjunto de muestras de alelos detectados, es probable que la relación no sea exactamente dos. La aneuploidía de origen paterno es más fácil de detectar que la aneuploidía de origen materno como se ha descrito a continuación.

C. Aneuploidía de origen materno

25 La FIG. 1C muestra un diagrama 140 de alelos en un locus para la madre y un feto aneuploide de origen materno, y un cálculo de ejemplo de acuerdo con realizaciones de la presente invención. El locus 143 es para un cromosoma de referencia y el locus 146 es para el cromosoma 21. En cuanto a la FIG. 1A, el genoma materno es homocigótico en cada locus y el feto es heterocigótico en cada locus.

Para este caso aneuploide, el feto tiene un alelo A y un alelo B en el locus 143, pero tiene dos alelo A y un alelo B en el locus 146, ya que hay una copia extra del cromosoma 21 de la madre. En un ejemplo donde el porcentaje de ADN fetal es del 50 % (es decir, ARN materno y fetal en partes iguales), la relación de los alelos B con respecto a los alelos A para el locus 143 sería de 1/3, pero sería de 1/4 para el locus 146, ya que hay un alelo B por cada 1 alelo A.

35 Para la fórmula general, cada copia del cromosoma se puede considerar que contribuye f/2, ya que la concentración fetal se determina con respecto al/a los cromosoma/s de referencia. Por lo tanto, la suma de los recuentos del alelo B proporciona f/2. La suma de los recuentos del alelo A proporciona 1 -f + f/2 + f/2, que da simplemente 1. La relación de estos proporciona f/2, como se muestra. La relación FSRRef para el cromosoma de referencia sigue siendo la misma que para la FIG. 1A, ya que este cromosoma sigue siendo euploide. La proporción de la relación de FSR21 y FSRRef es 1-f/2. Por supuesto, debido a la naturaleza estadística del conjunto de muestras de los alelos detectados, es probable que la relación no sea exactamente 1-f/2.

Para determinar a cuál de estas categorías corresponde una muestra, se puede comparar la relación final con un valor de corte. Por ejemplo, un corte en algún punto entre 1 y 2 puede distinguir el caso euploide con el caso de

45 aneuploidía de origen paterno. Se podría usar más de un valor de corte entre 1 y 2, proporcionando así diferentes niveles de confianza para una determinación. El valor de corte entre el euploide y la aneuploidía de origen materno es más difícil, ya que el espaciamiento entre los dos valores es menor y depende de la concentración fetal de la fracción f. El punto de corte se puede determinar a partir de una medida separada de f para determinar un valor esperado del feto en una aneuploidía de origen materno. Como otro ejemplo, se podría requerir un valor mínimo de f, y entonces se podría usar un mismo valor de corte adecuado para esa concentración fetal mínima.

Por consiguiente, para el ejemplo de T21, suponiendo que la concentración de ADN fetal fraccionada en chrRef es f, la relación F-S sería f(2-f) en chrRef independientemente del estado de aneuploidía del feto. Por otro lado, la relación F-S en chr21 sería f/(2-f) si la madre porta un feto euploide, 2f/(2-f) si la madre porta un feto con T21 de

55 origen paterno y f/2 si la madre porta un feto con T21 de origen materno. Por lo tanto, sería 1 si la madre porta un feto euploide, sería 2 si la madre porta un feto con T21 de origen paterno, y sería (1-f/2) si la madre porta un feto con T21 de origen materno.

II. MÉTODO

La FIG. 2 es un diagrama de flujo que ilustra un método 200 de análisis de una muestra biológica de una gestante con un feto para determinar si el feto tiene una aneuploidía. La muestra biológica contiene una mezcla de moléculas de ADN del feto y de la madre. Partes del método 200 pueden realizarse mediante un sistema informático.

65 En el bloque 210, la muestra biológica está enriquecida en moléculas de ADN de una pluralidad de regiones diana.

El enriquecimiento, puede realizarse mediante técnicas de hibridación o técnicas de amplificación, o una combinación de ambas. Las regiones diana pueden ser regiones genómicas que son conocidas para tener sitios polimórficos. Dichas regiones pueden incluir las de matriz de SNP de todo el genoma humano Genome-Wide Human SNP Array 6.0 (Affymetrix).

5 En el bloque 220, las moléculas de ADN de la muestra biológica se secuencian para obtener una pluralidad de lecturas de secuencia. La secuenciación puede realizarse en una variedad de maneras. Por ejemplo, una secuenciación universal puede usar los mismos adaptadores ligados al final de las moléculas para secuenciar cualquier molécula de ADN. Una realización usa una secuenciación masivamente paralela de ADN, tal como, pero sin limitarse a la realizada por la plataforma de análisis del genoma de Illumina (Bentley D. R. et al., Nature 2008; 456:53-59), la plataforma Roche 454 (Margulies M. et al., Nature 2005; 437: 376-380), la plataforma ABI SOLiD (McKernan K. J. et al. Genome Res 2009; 19: 1527-1541), la plataforma de secuenciación de moléculas individuales de Helicos (Harris T. D. et al., Science 2008, 320: 306-309), la secuenciación en tiempo real usando moléculas de polimerasa individuales (Science 2009; 323:133-138) y la secuenciación de nanoporos (Clarke J. et al. Nat

15 Nanotechnol. 2009; 4:265-70). En una implementación, la secuenciación es una secuenciación de extremos emparejados que proporciona un par de lecturas por cada molécula de ADN secuenciada.

En el bloque 230, se analizan la pluralidad de lecturas de secuencias. El análisis de la lectura de una secuencia puede incluir la identificación de una ubicación de la lectura de secuencia en un genoma de referencia alineando la lectura de secuencia con el genoma de referencia y determinando un respectivo alelo de la lectura de secuencia. El alelo respectivo se determina a partir de la secuencia de la lectura. Para un locus heterocigótico, la lectura de secuencia puede informar qué alelo corresponde a la lectura de secuencia. El genoma de referencia puede incluir ubicaciones donde se sabe que existen polimorfismos y permitir la alineación para cualquier alelo.

25 En el bloque 240, se identifica una pluralidad de primeros locus en un primer cromosoma, donde la pluralidad de los primeros locus corresponde a una parte de las regiones diana. Los primeros locus informan de que la madre es homocigótica en los locus y el feto es heterocigótico. Estos locus pueden determinarse a partir de las lecturas de secuenciación cuando las lecturas que tienen dos alelos diferentes se alinean con la misma ubicación en el genoma de referencia, y donde un alelo está en una mayoría significativa. Dado que se espera que la concentración fetal esté entre el 5 % y el 2 %, se podría esperar que los locus informativos tuvieran un alelo minoritario que apareciera aproximadamente un 2,5 %-10 %. Estos porcentajes son ilustrativos, y se pueden usar otros porcentajes. Dichos primeros locus que están dentro de una región diana (es decir, una región que fue enriquecida) se pueden identificar para un análisis posterior.

35 En el bloque 250, se identifica una pluralidad de segundos locus en uno o más cromosomas de referencia, donde la pluralidad de segundos locus corresponde a una parte de las regiones diana. La gestante es homocigótica para un respectivo alelo materno en cada uno de los primeros y segundos locus, y el feto es heterocigótico para el respectivo alelo materno y un respectivo alelo paterno en cada uno de los primeros y segundos locus. El alelo paterno es el alelo específico del feto, y por tanto, los respectivos alelos paternos son diferentes de los respectivos alelos maternos.

En el bloque 260, se calcula una primera relación de una primera cantidad materna y una primera cantidad paterna. La primera cantidad materna es de los respectivos alelos maternos en la pluralidad de primeros locus. Por ejemplo, se puede hacer un recuento del número de alelos maternos contados en cada primer locus. La primera cantidad

45 paterna es de los respectivos alelos paternos en la pluralidad de primeros locus. Como se ha descrito anteriormente, la relación puede ser una división estricta de las dos cantidades, ya sea en el denominador, pero también pueden ser otras relaciones, por ejemplo, cuando el denominador incluye una suma de los dos valores.

En el bloque 270, se calcula una segunda relación de una segunda cantidad materna y una segunda cantidad paterna. La segunda cantidad materna es de los respectivos alelos maternos en la pluralidad de segundos locus. La segunda cantidad paterna es de los respectivos alelos paternos en la pluralidad de segundos locus. La segunda relación debe tener la misma forma que la primera relación, y la fórmula para determinar las relaciones debe ser la misma. Por ejemplo, la suma de los alelos B dividida entre la suma de los alelos A.

55 En el bloque 280, se calcula una tercera relación de la primera relación y la segunda relación. La tercera relación también puede ser una relación simple, estando bien la primera relación o la segunda relación en el denominador. La relación también puede implicar sumas en el denominador o numerador, así como ser una relación de funciones de la primera y segunda relación, como puede todavía expresar un valor relativo entre la primera y la segunda relación.

En el bloque 290, se compara la tercera relación con uno o más valores de corte para determinar si el feto tiene una aneuploidía asociada con el primer cromosoma. Se puede usar más de un punto de corte, por ejemplo, para diferenciar entre el euploide, la aneuploidía de origen materno y la aneuploidía de origen paterno. Los valores de corte se pueden obtener de una variedad de maneras. Por ejemplo, se pueden usar distribuciones entre las 65 muestras de ensayo cuyos resultados son conocidos para determinar la distribución estadística de la tercera relación

(por ejemplo, ) para cada uno de los casos y se puede seleccionar un valor de corte para diferenciar con exactitud nuevos casos que caería dentro de las distribuciones conocidas. También se podrían usar valores teóricos, por ejemplo, basándose en distribuciones esperadas.

5 Se pueden determinar los valores de corte como se indica en las FIG. 1A-1C. Por ejemplo, se puede diferenciar el valor de corte cuando la tercera relación es aproximadamente dos, y así determinar que la aneuploidía es de origen paterno. La determinación de aproximadamente dos puede hacerse según la tercera relación que está por encima de un valor de corte destinado a distinguir un valor de 1 y un valor de 2. Como otro ejemplo, el valor de corte puede diferenciarse cuando la tercera relación es aproximadamente 1-f/2, y determinar así que la aneuploidía es de origen

10 materno, donde f es una concentración de ADN fetal fraccionada en la mezcla. La concentración de ADN fetal fraccionada f puede determinarse a partir de la segunda cantidad paterna y de la segunda cantidad materna. Por ejemplo, se puede usar la siguiente fórmula: concentración de ADN fetal fraccionada = segunda cantidad paterna x 2/(segunda cantidad paterna + segunda cantidad materna) x 100 %. El valor de corte se puede colocar en un valor apropiado entre 1 y 1-f/2 para diferenciar entre los dos casos.

III. ENRIQUECIMIENTO

El enriquecimiento puede realizarse amplificando selectivamente y/o capturando regiones diana de una muestra de ADN antes de la secuenciación. El enriquecimiento se efectúa mediante sondas y/o cebadores que están diseñados

20 para hibridarse con una determinada ubicación del genoma. Muchos de estas sondas/estos cebadores pueden usarse para dirigirse a múltiples regiones del genoma. Varias regiones pueden ser diana en el cromosoma de interés y varias regiones pueden ser diana en un cromosoma de referencia o a través de múltiples cromosomas de referencia.

25 En una implementación, las regiones diana incluyen regiones que se sabe que tienen polimorfismos. De esta manera, uno necesita conocer los polimorfismos específicos del feto antes de tiempo. Sin embargo, ya que las regiones diana corresponden a polimorfismos que se encuentran en general en una población, hay una buena probabilidad de que el padre pase uno de esos polimorfismos al feto. También se podrían genotipar la madre y el padre, permitiendo así un conocimiento específico de los sitios polimórficos del feto, como se describe en el

30 presente documento.

A. Captura

Una justificación de la captura (por ejemplo, usando una matriz) es la hibridación de una biblioteca de ADN a sondas

35 inmovilizadas. Por ejemplo, las sondas corresponden a una región diana, y las moléculas de ADN de estas regiones diana hibridadas a las sondas inmovilizadas. Por lo tanto, el ADN diana está inmovilizado, mientras que el ADN no diana no lo está.

Se pueden eliminar los fragmentos de ADN no diana mediante lavado, y recogerse los fragmentos diana por elución.

40 Puede requerirse un gran exceso de ADN en la biblioteca (20 g por muestra) por encima del cual puede requerirse que las sondas garanticen una hibridación completa. Las técnicas de ejemplo incluyen la captura en la matriz (20) y la captura en la solución (21). En algunas realizaciones, las sondas pueden diseñarse para locus de SNP que se sabe que muestran una alta tasa polimórfica en la población. Solo se usarían para el cálculo los locus de SNP que resultan ser informativos. En general, dicha metodología es más fácil de ejecutar en un entorno clínico que una

45 metodología que requiere una selección personalizada de sondas para cada embarazo, por ejemplo, cuando se conoce un lugar específico para un alelo específico del feto, como se puede hacer identificando los sitios en los que la madre y el padre son homocigóticos para diferentes alelos.

La captura puede no ser perfecta, ya que pueden permanecer algunas moléculas de ADN de regiones no diana, el

50 porcentaje de moléculas ADN de las regiones diana aumentó con relación al porcentaje antes del enriquecimiento. De esta manera, existe una probabilidad más alta de que una lectura de secuencia corresponda a una región diana. Por lo tanto, se necesita menos secuenciación para obtener un mismo número de recuentos alélicos para los diversos locus.

55 B. Amplificación

Para la amplificación, los cebadores se diseñan para amplificar regiones diana del genoma. Mientras que las técnicas de captura eliminan el ADN de regiones no diana, las técnicas de amplificación aumentan preferentemente el número de moléculas de ADN de las regiones diana. De esta manera, vuelve a haber una mayor probabilidad de

60 que una lectura de secuencia corresponda a una región diana.

La amplificación puede proporcionar muchas copias de ADN de las regiones diana para la secuenciación, pero la exactitud global sigue estando relacionada con la exactitud estadística de la muestra original. Es decir, si la muestra original es relativamente pequeña (y, por lo tanto, susceptible a imprecisiones estadísticas debido al tamaño de la

65 muestra), la amplificación no resolverá dichos problemas, aunque ahora existen más copias de ADN.

En una realización, pueden combinarse las dos técnicas. Por ejemplo, se pueden capturar moléculas de ADN para una región diana y eliminar el ADN no diana. El ADN restante tiene un mayor porcentaje de las regiones diana. Entonces, se pueden amplificar las moléculas de ADN restantes para aumentar el porcentaje diana todavía más, y para obtener más copias de ADN de las regiones diana.

IV. IDENTIFICACIÓN DE LOS LOCUS

Como se ha descrito anteriormente, las realizaciones usan locus informativos, donde la madre es homocigótica y el feto es heterocigótico. Estos locus se pueden identificar de diversas maneras. Por ejemplo, pueden identificarse locus informativos (por ejemplo, SNP) de acuerdo con la información del genotipado materno y fetal. Sin embargo, dicho proceso implicaría la obtención de células fetales, por ejemplo, a partir de una técnica invasiva. Por ejemplo, el genotipado se puede realizar en células sanguíneas maternas y en una muestra de tejido fetal obtenida de forma invasiva. Otras realizaciones pueden identificar los locus informativos a partir de técnicas no invasivas. Sin embargo, este genotipado se puede usar como un valioso patrón para comparar la validez de los métodos no invasivos. Para

15 los resultados de secuenciación no dirigida que se presentan a continuación, la profundidad de la lectura no fue lo suficientemente alta como para identificar muchos locus informativos basados solo en la secuenciación y, por lo tanto, se usó la información de genotipado anterior con respecto a los locus informativos.

Para las realizaciones de secuenciación dirigida, hay suficiente profundidad en más locus de SNP, donde se puede identificar la presencia de dos alelos, pero uno en una cantidad inferior, y estos son los locus informativos probables. Por ejemplo, para un locus, se puede contar un primer número de lecturas de secuencia correspondientes a un primer alelo y contar un segundo número de lecturas de secuencia correspondientes a un segundo alelo. La secuencia sobrerrepresentada (alelo) correspondería al alelo compartido, y el alelo subrepresentado correspondería al alelo específico del feto. Los locus en los que la madre es heterocigótica (es decir, aproximadamente 50-50 de los

25 dos alelos) se pueden distinguir desechando los locus en los que la relación de los dos alelos es de aproximadamente uno. Dado que se espera que la concentración fetal esté entre 5-20 %, se podría esperar que los locus informativos tuvieran un alelo minoritario que apareciera en aproximadamente 2,5 %-10 % de todas lecturas de secuencia que se alinean con el locus. Estos porcentajes son ilustrativos, y pueden usarse otros porcentajes.

En una realización, se puede determinar un primer número de lecturas de secuencia correspondientes al primer alelo del primer locus. Puede determinarse un segundo número de lecturas de secuencia correspondientes al segundo alelo del primer locus. Se puede calcular una relación alélica del primer número y del segundo número de una variedad de maneras (por ejemplo, como porcentaje de lecturas con el primer alelo). Si la relación alélica está por encima de un primer umbral y por debajo de un segundo umbral, el primer locus se puede identificar como un

35 locus informativo. Por ejemplo, el segundo umbral se puede usar para garantizar que el locus no sea simplemente heterocigótico en la madre y que el primer umbral pueda ser 0 (o algún otro valor para garantizar que la lectura de secuencia no sea simplemente un error).

V. RESULTADOS

Se extrajo ADN de las muestras de plasma recogidas de catorce mujeres embarazadas portadoras de un solo feto. Se usó la secuenciación dirigida basada en la hibridación para enriquecer 2.906 locus de polimorfismo de un solo nucleótido en chr7, c-hr13, chr18 y chr21. Se analizaron las bibliotecas de ADN de plasma con y sin enriquecimiento diana mediante secuenciación masivamente paralela. Se genotiparon muestras de ADN genómico de la madre y del

45 feto para cada caso mediante el análisis de la micromatriz de polimorfismos de un solo nucleótido.

La FIG. 3 muestra una tabla 300 de resultados de secuenciación de 14 mujeres embarazadas de acuerdo con realizaciones de la presente invención. La Tabla 300 muestra los datos en los que el cromosoma 21 es el cromosoma de interés. El estado fetal se determinó a partir de los datos de genotipado. El resto de los datos se determina a partir de los resultados de secuenciación.

Para las regiones seleccionadas, la profundidad de secuenciación media de las muestras enriquecidas fue 225 veces superior a la de las muestras no enriquecidas. La profundidad de secuenciación se puede definir como el número medio de veces que se ha secuenciado cada base en una determinada región. Como media, se

55 cartografiaron de manera exclusiva 3 millones de lecturas de extremos emparejados en muestras no enriquecidas y enriquecidas en el genoma humano de referencia (Hg18). Tras la filtración de las lecturas de extremos emparejados duplicadas, la profundidad de secuenciación de la región diana se puede calcular dividiendo el número total de bases secuenciadas dentro de la región diana entre la longitud de la región diana. La profundidad media de secuenciación fue de 0,12 veces para las muestras no enriquecidas y de 27 veces para las muestras enriquecidas, lo que indica un enriquecimiento medio de 225 veces. Este hallazgo coincidió con la publicación previa de los presentes inventores [15].

Las concentraciones de ADN fetal fraccionadas (también denominadas porcentaje de ADN fetal) en las muestras no enriquecidas se calcularon usando los SNP informativos de todos los autosomas excepto para chr21, de acuerdo 65 con la ecuación: concentración de ADN fetal fraccionada = recuentos alélicos específicos del feto x 2/(recuentos alélicos específicos del feto + recuentos alélicos compartidos) x 100 %. La mediana de la concentración de ADN fetal

fraccionada para los catorce casos analizados en este estudio fue del 15,5 % (amplitud del 9,1 % al 19,7 %). La concentración de ADN fetal fraccionada se puede usar para determinar la reducción esperada en la tercera relación

del método 200 (por ejemplo, ) de un valor de 1 para aneuploidías de origen materno (FIG. 1C). Como se ha mencionado en el presente documento, se puede determinar un valor de corte basado en la concentración de ADN 5 fetal fraccionada. Como alternativa, se puede escoger un punto de corte basado en una suposición o medición de que existe una concentración mínima de ADN fetal fraccionada en la muestra.

A. Cálculo de la relación F-S usando datos de secuenciación no dirigida

10 La FIG. 4A muestra los valores de que se calcularon para diferenciar el T21 de origen paterno y materno de los fetos euploides de los datos de secuenciación no dirigida de acuerdo con realizaciones de la presente invención. Basándose en la información de genotipado materno y fetal, se identificaron SNP informativos en el chr21 (intervalo entre la muestra: 1.044 a 1.775 SNP) y chrRef que incluyó todos los autosomas excepto chr21 (intervalo entre las muestras: 99.581 a 106.950 SNP). Dentro de los SNP informativos anteriores, se determinaron los recuentos

15 alélicos específicos del feto (expresados como FC) y los recuentos alélicos compartidos (expresados como SC) para chr21 (FC21 = 2 a 19, SC21 = 87 a 213) y chrRef (FCRef = 390 a 1.622, SCRef = 6.880 a 18.892). La FIG. 3 muestra los resultados calculados para FSR21, FSRRef y .

Como se muestra en la FIG. 4A, el caso de T21 de origen paterno ( = 2,35) podría diferenciarse del grupo

20 euploide ( medio de 9,91, mediana de 0,96, amplitud de 0,70 a 1,10). Por otro lado, los casos de T21 de origen materno ( media de 1,10, mediana de 1,30, amplitud de 0,33 a 1,57) se solaparon con los casos euploides (prueba de suma de clasificación de Mann-Whitney, p = 0,366).

B. Cálculo de la relación F-S usando datos de secuenciación dirigida

La FIG. 4B muestra que los valores de que se calcularon para diferenciar el T21 de origen paterno y materno de los fetos euploides de los datos de secuenciación no dirigida de acuerdo con las realizaciones de la presente invención. Entre los 1.437 locus de SNP diana de chr21 y 1.469 locus de SNP de chrRef (incluyendo chr7, chr13 y chr18), se identificaron SNP informativos (chr21 = 151 a 273 SNP, chrRef = 145 a 182 SNP) para cada caso. Se

30 determinó el número de lecturas secuenciadas con los alelos específicos del feto y alelos compartidos para chr21 (FC21 = 197 a 761, SC21 = 3.610 a 7.740) y chrRef (FCRef = 154 a 473, SCRef = 2.786 a 5.557), como se muestra en la tabla 300.

Como se muestra en la FIG. 4B, el caso de T21 de origen paterno ( = 1,68) podría diferenciarse del grupo

35 euploide ( media de 1,06, mediana de 1,06, amplitud de 0,95 a 1,29). Aunque el grupo de T21 de origen

materno tenía valores de inferiores ( media 0,94, mediana 0,93, intervalo de 0,78 a 1,17) (prueba de suma de clasificación de Mann-Whitney, p = 0,051), todavía hubo solapamiento con el grupo euploide. Sin embargo, el solapamiento disminuyó. La existencia de solapamiento sugiere que el número de locus se debe aumentar y/o el nivel de profundidad de secuenciación aumentar.

C. Comparación

El caso de la T21 de origen paterno se detectó con éxito tanto en los datos de secuenciación no dirigida como dirigida. Para los casos de la T21 de origen materno, esta metodología resultó menos eficaz. Aunque los valores

45 medios de fueron inferiores en los casos de T21 de origen materno, hubo un solapamiento significativo en los

valores de entre los casos de T21 euploides y de origen materno. La diferencia en los resultados entre la

detección de T21 de origen paterno y materno se debió principalmente a la magnitud del cambio en , que aumentó el doble para la T21 de origen paterno y se redujo en f/2 veces para la T21 de origen materno (FIG 1B y 1C). Por lo tanto, la aneuploidía heredada del padre podría distinguirse de forma no invasiva a mayor profundidad de

50 la secuenciación que la aneuploidía heredada de la madre.

Dado que el ADN fetal representa una población menor en el plasma materno, la menor concentración fraccionada de ADN fetal disminuiría el grado de variación de en la T21 de origen materno. Por ejemplo, suponiendo que la

concentración de ADN fetal fraccionada es del 5 %, la de T21 de origen materno se convertiría en 0,975, lo

55 que se acerca mucho a un caso euploide (

VI. SIMULACIÓN POR ORDENADOR

Se empleó simulación por ordenador para investigar la exactitud del análisis de la relación F-S para detección de T21. El modelo estadístico se basa en la suposición de que el número de recuentos alélicos específicos del feto y

5 compartidos debe seguir una distribución binomial, de acuerdo con la concentración de ADN fetal fraccionada tanto en los modelos de T21 de origen paterno como materno. Por ejemplo, suponiendo que la concentración de ADN fetal fraccionada en los cromosomas de referencia (chrRef) es f, la probabilidad de detectar el alelo específico del feto para un SNP informativo sería de f/2 en chrRef independientemente del estado de aneuploidía del feto. Por otro lado, la probabilidad de detectar el alelo específico del feto en chr21 sería f/2 si la madre porta un feto euploide, 2f/(2+f) si la madre porta un feto con T21 de origen paterno y f/(2+f) si la madre porta un feto con T21 de origen materno (FIG. 1A-1C)

Con fines ilustrativos, se obtuvieron cantidades iguales de recuentos alélicos informativos (la suma de recuentos alélicos específicos del feto y compartidos) de chr21 y chrRef. Basándose en los supuestos anteriores, se simularon

15 1.000 casos de euploides y 1.000 casos de T21 cada vez para diferentes concentraciones de ADN fetal fraccionadas para investigar la exactitud de la detección en los modelos de T21 de origen paterno y materno.

Las FIG. 5A y 5B muestran gráficos de una simulación por ordenador para la detección de T21 para concentraciones de ADN fetal fraccionadas del 5 % (FIG. 5B) y del 15 % (FIG. 5A) de acuerdo con realizaciones de la presente invención. Los presentes inventores usaron la simulación por ordenador para determinar los parámetros que mejorarían aún más la exactitud de la metodología de la relación alélica para la detección de T21. La simulación por ordenador reveló relaciones entre la proporción de ADN fetal, el número de alelos informativos y la profundidad de secuenciación.

25 Para obtener una especificidad superior al 99 %, los puntos de corte para la diferenciación de T21 se escogieron a 3 desviaciones típicas por encima y por debajo de la relación F-S media del grupo euploide. Se investigó la sensibilidad para la detección de T21 de origen paterno y materno en diferentes números de recuentos alélicos informativos en chr21 y chrRef, respectivamente, para una concentración de ADN fetal fraccionada del 1 5 % (A). Se realizó un análisis similar para una concentración de ADN fetal fraccionada del 5 % (B). (T21 Ma = T21 de origen materno. T21 Pa = T21 de origen paterno. Sen = sensibilidad. % de Fe = concentración de ADN fetal fraccionada. AC info = recuentos alélicos informativos en cada uno de chr21 y chrRef. SNP info = SNP informativos en cada uno de chr2 y chrRef. Prof. de Sec = profundidad de secuenciación. AC info = SNP info x profundidad Sec).

Para obtener los gráficos de la FIG. 5A, se fijó la concentración de ADN fetal fraccionada en el 15 % y se

35 aumentaron gradualmente los números de recuentos alélicos informativos en chr21 y chrRef para investigar la exactitud de la detección de la T21 fetal. Los recuentos alélicos informativos adicionales mejorarían la exactitud de la detección en los modelos de T21 tanto de origen paterno como materno. Para obtener una detección exacta (sensibilidad > 99 %, especificidad > 99 %), se requerían recuentos alélicos más informativos para la detección de T21 de origen materno (recuentos alélicos informativos = 130.000) que la detección de T21 de origen paterno (recuentos alélicos informativos = 1.100) (FIG. 5A). Si la concentración de ADN fetal fraccionada se redujera hasta el 5 %, los recuentos alélicos informativos correspondientes tendrían que aumentarse hasta 3.600.000 para detectar la T21 de origen materno y 3.500 para detectar la T21 de origen paterno (Figura 5B).

La FIG. 6 muestra un gráfico 600 de una simulación por ordenador para investigar el número mínimo de recuentos

45 alélicos informativos para la detección de T21. La curva continua representa el número mínimo de recuentos alélicos informativos requeridos en cada uno de chr21 y chRef (eje Y) para lograr una detección fiable en la T21 de origen materno (sensibilidad > 99 %, especificidad > 99 %) de acuerdo con una concentración de DNA fetal fraccionada dada (eje X). La curva discontinua representa el modelo de T21 de origen paterno.

Cuando la concentración de ADN fetal fraccionada del plasma materno fue disminuyendo gradualmente del 40 % al 1 %, se tuvo que aumentar el número mínimo de recuentos alélicos informativos en los escenarios de T21 tanto de origen paterno como materno para mantener una alta tasa de detección (sensibilidad > 99 %, especificidad > 99 %), pero el aumento del recuento fue más destacado para el escenario de T21 de origen materno. La sensibilidad y la especificidad seleccionadas para este análisis se escogieron con el fin de reflejar los resultados recién presentados

55 de la metodología de recuento de marcadores no polimórficos [12-14].

VII. EXACTITUD CRECIENTE

Como se ha indicado anteriormente, hay varias maneras de mejorar la exactitud de la detección. Una metodología consiste en aumentar la concentración de ADN fetal fraccionada, que aumentaría la magnitud de la variación de

en la T21 de origen materno. Aunque un estudio temprano intentó enriquecer la proporción de ADN fetal mediante el tratamiento con formaldehído del plasma materno [7], este método no está listo para su uso, porque no ha sido uniformemente reproducido por diferentes grupos [8-10]. Como alternativa, la exactitud de la detección de la T21 de origen materno puede mejorarse aumentando el número de recuentos alélicos informativos. De acuerdo con

65 el presente análisis de simulación, los recuentos alélicos informativos adicionales compensarían, en cierta medida, la

pérdida de exactitud de la detección causada por la reducción de la concentración de ADN fetal fraccionada (FIG. 6). Se pueden usar dos metodologías para aumentar el número de recuentos alélicos informativos, en concreto, el reclutamiento de SNP más informativos y la secuencia más profunda de cada locus. En una realización, se usan ambas metodologías.

A. Determinación de locus informativos

El número de SNP informativos, en general, se determina mediante dos factores: el número total de SNP en el cromosoma de interés para la detección y la frecuencia de SNP informativos. Este último es el porcentaje de SNP informativos detectables entre un grupo de SNP analizados. Para la investigación, se usó la información del genotipo fetal, determinada mediante el análisis basado en micromatrices del ADN de la vellosidad coriónica, para maximizar la frecuencia de los SNP informativos, cuyo valor medio es aproximadamente del 12 % en los catorce casos de este estudio. Sin embargo, el material genómico fetal no estaría disponible de antemano para la NIPD real. Por lo tanto, los SNP informativos tendrían que deducirse indirectamente, por ejemplo, mediante la selección de SNP en los que

15 ambos padres son homocigóticos, pero con alelos diferentes (por ejemplo, la madre es AA y el padre es BB). En este escenario, la frecuencia media de los SNP informativos disminuiría del 12 % al 6 %, debido a que dicha metodología excluiría cualquier SNP en el que el padre fuera heterocigótico.

En términos de reclutamiento de SNP, se puede usar un sistema de enriquecimiento basado en la hibridación. En los ejemplos anteriores, los presentes inventores solo emplearon un número relativamente pequeño de sondas para capturar 2.906 locus de SNP en los cromosomas diana. Sin embargo, es posible aumentar el número de locus de SNP analizados. Por ejemplo, si se diseñan sondas para cubrir todos los locus de SNP de chr21 (12.930 SNP) en la matriz de SNP de todo el genoma humano Genome-Wide Human SNP Array 6.0 (Affymetrix), se podría aumentar el número de SNP informativos en chr21 hasta aproximadamente 1.500 SNP para cada caso en el conjunto de datos

25 actual. En caso de obtenerse el mismo número de SNP informativos en chrRef y de secuenciarse el ADN plasmático hasta una profundidad de 87 veces, se recogerían aproximadamente 130.000 recuentos alélicos informativos (1.500 x 87) en chr21 y chrRef, respectivamente.

Dichos números permitirían la clasificación relativamente robusta de la T21 heredada de la madre de los casos euploides asumiendo una concentración de ADN fetal fraccionada del 15 % o superior (FIG. 5A). Dado que, en este estudio, la frecuencia media de SNP informativos es del aproximadamente 12 %, y se podría volver a cartografiar aproximadamente el 50 % de las lecturas hasta las regiones diana (no siendo diana el resto de las lecturas), el número total de lecturas necesarias para obtener 130.000 recuentos alélicos informativos sería de aproximadamente 4,3 millones (130.000 lecturas x 2/(12 % x 50 %)).

35 Sin embargo, si la concentración de ADN fetal fraccionada se reduce hasta el 5 %, habría que aumentarse el número de lecturas hasta aproximadamente 120 millones (Figura 5B). En este caso, se analizaron el 5 % y 15 %, porque el 5 % está cerca del límite inferior para la metodología de recuento de marcadores no basados en el polimorfismo a la profundidad de secuenciación usada en una serie de estudios recientes, y el 15 % es la concentración de ADN fetal fraccionada media en los ensayos clínicos publicados basándose en la metodología de recuento de marcadores [12-14].

B. Secuenciación más profunda

45 Para obtener un número suficiente de recuentos alélicos, una metodología alternativa es secuenciar más profundamente cada locus con un número relativamente pequeño de SNP informativos. De acuerdo con la publicación anterior de los presentes inventores, se demostró que cada mililitro de plasma contenía aproximadamente 1.000 equivalentes genómicos de ADN, lo que daría lugar a 2.000 recuentos alélicos por cada locus [4]. Si se pudieran contar todos los alelos por cada locus en 5 ml de plasma, se obtendrían 10.000 recuentos alélicos por cada locus. En este escenario, 26 SNP informativos (33 SNP sobre chr21, 13 SNP sobre crRef) podrían proporcionar suficientes recuentos alélicos informativos para la detección de T21 de origen materno en una muestra que contuviera el 15 % de ADN fetal, lo que representa 130.000 recuentos alélicos informativos (10.000 x 13) en chr21 y chrRef, respectivamente. Se tendría que aumentar el número de SNP informativos a 720 (360 SNP en chr21, 360 SNP en chrRef) para una muestra que contuviera una concentración de ADN fetal fraccionada del 5 %.

55 Debido a la alta profundidad de lectura requerida por esta estrategia (es decir, 10.000 recuentos por alelo informativo), las metodologías basadas en PCR para el enriquecimiento diana (es decir, métodos de amplificación) podrían ser métodos alternativos para este tipo de aplicación [18,19].

VIII. MATERIALES Y MÉTODOS

Se reclutaron catorce mujeres embarazadas portadoras de un solo feto (variando la edad gestacional de 12 semanas a 13 semanas y 5 días). Se recogieron muestras de sangre periférica materna antes del CVS. Tras el CVS, se obtuvieron muestras de ADN genómico fetal de las vellosidades coriónicas. El estado de aneuploidía o eupofonía se confirmó mediante cariotipaje completo. Entre los catorce casos, siete eran fetos con T21 y el resto eran

65 euploides.

En una implementación, el ADN se extrae de la siguiente manera. Se centrifugaron muestras de sangre periférica materna (5-10 ml) a 1.600 g durante 10 minutos a 4 ºC. Se volvió a centrifugar la parte de plasma (2-5 ml) a 16.000 g durante 10 min a 4 ºC. Se retiró cualquier plasma residual de la parte de células sanguíneas volviendo a centrifugar a 2500 g durante 5 min [16]. Se extrajo ADN de plasma con el Mini Kit de sangre de ADN DSP (Qiagen), como se ha

5 descrito anteriormente [11]. Se extrajo ADN genómico materno y fetal de las vellosidades coriónicas y de células sanguíneas periféricas, respectivamente, con el Mini Kit de sangre de ADN QIAamp (Qiagen) de acuerdo con el protocolo del fabricante. Se cuantificó el ADN de plasma extraído mediante PCR en tiempo real usando un detector de secuencias ABI 7300 (Applied Biosystems). Se realizó un ensayo de PCR en tiempo real de β-globina como se ha descrito anteriormente [4]. Se usó un factor de conversión de 6,6 pg de ADN por célula para calcular la cantidad de ADN de plasma extraído.

A. Secuenciación dirigida de bibliotecas de ADN de plasma

El siguiente es un ejemplo de técnicas de secuenciación que se puede usar en las realizaciones. Como las

15 moléculas de ADN de plasma ya estaban fragmentadas por naturaleza, no fue necesaria ninguna etapa de fragmentación adicional para este ejemplo. Se usaron 10-30 ng de ADN de plasma para cada caso para la construcción de la biblioteca de ADN mediante el Kit de preparación de muestras de ADN genómico (Illumina) como se ha descrito anteriormente [15], a excepción de la sustitución de los adaptadores y de los cebadores con los oligonucleótidos del kit de oligonucleótidos para la preparación de muestras por multiplexación (Ilumina) y el kit del sistema de enriquecimiento diana SureSelec (Agilent) de acuerdo con las instrucciones del fabricante.

Para obtener una alta cobertura de secuenciación para los SNP, se aplicó el sistema de enriquecimiento diana SureSelec (Agilent) para capturar los SNP en las regiones diana. Como un estudio de prueba de principio, aproximadamente el 5 % de las sondas se diseñaron para dirigirse a un total de 2.906 locus de SNP en chr7 (313

25 SNP), chr13 (564 SNP), chr18 (592 SNP) y chr21 (1437 SNP), mientras que las sondas restantes se diseñaron para otro proyecto. Se incubaron 500 ng de cada biblioteca de ADN de plasma construida con las sondas durante 24 h a 65 ºC. Tras la hibridación, se eluyeron las moléculas de ADN capturadas y se amplificaron mediante una PCR de 12 ciclos de acuerdo con las instrucciones del fabricante. Las bibliotecas con y sin enriquecimiento diana se indexaron para la secuenciación de multiplexación en un Analizador del genoma II. (Ilumina) en formato de pares de bases de 50 pb x 2. Se realizaron 7 ciclos adicionales de secuenciación para decodificar la secuencia índice.

Se alinearon todas las lecturas secuenciadas con el genoma de referencia humano no enmascarado (Hg18) (genome.ucsc.edu) con ayuda de SOAPaligner/soap2 (soap.genomics.org.cn). Se permitieron dos desapareamientos durante la alineación. El intervalo de tamaños de fragmentos de las lecturas de extremos

35 apareados se definió como 50-600 pb. Las lecturas de extremos apareados duplicadas (por ejemplo, las lecturas con idénticas secuencias y coordenadas de inicio-fin) se consideraron clones del mismo molde de ADN de plasma original. Se filtraron todas menos una de las lecturas duplicadas, dejando solo 1 copia para los análisis bioinformáticos posteriores como se ha descrito anteriormente [15].

B. Genotipado con micromatriz

Se usó el genotipado para confirmar la exactitud de las técnicas de secuenciación. Se genotiparon las muestras de ADN genómico materno y fetal con la matriz de SNP de todo el genoma humano Genome-Wide Human SNP Array

6.0 (Affymetrix). Se determinó el origen paterno de la copia adicional de chr21 en siete fetos con T21 usando el

45 análisis de micromatriz de las muestras de vellosidades coriónicas, en el que se analizaron las intensidades de la señal alélica para los SNP en chr21. Si el feto tiene T21 de origen paterno, la intensidad de la señal del alelo específico del feto (alelo B) debería ser 2 veces superior a la del alelo compartido (alelo A), porque el genotipo fetal se convertiría en ABB en chr21 y viceversa. Usando esta metodología, se identificó un feto como una T21 de origen paterno, mientras que seis fueron T21 de origen materno.

IX. SISTEMA INFORMÁTICO

Cualquiera de los sistemas informáticos mencionados en el presente documento puede utilizar cualquier número adecuado de subsistemas. Los ejemplos de dichos subsistemas se muestran en la FIG. 7, en el aparato informático

55 700. En algunas realizaciones, un sistema informático incluye un único aparato informático, en el que los subsistemas pueden ser los componentes del aparato informático. En otras realizaciones, un sistema informático puede incluir múltiples aparatos informáticos, siendo cada uno de ellos un subsistema, con componentes internos.

Los subsistemas mostrados en la FIG. 7 están interconectados a través de un bus 775 de sistema. Se muestran subsistemas adicionales tales como una impresora 774, un teclado 778, un disco fijo 779, un monitor 776, que está acoplado al adaptador 782 de pantalla, y otros. Los dispositivos periféricos y dispositivos de entrada/salida (E/S), que se acoplan al controlador de E/S 771, pueden conectarse al sistema informático por cualquier número de medios conocidos en la técnica, tales como el puerto de serie 777. Por ejemplo, el puerto de serie 777 o la interfaz externa 781 (por ejemplo,. Ethernet, Wi-Fi, etc.) se puede usar para conectar el sistema informático 700 a una red de 65 área amplia tal como Internet, un dispositivo de entrada de ratón o un escáner. La interconexión a través del bus 775 del sistema permite que el procesador central 773 se comunique con cada subsistema y controle la ejecución de las

instrucciones desde la memoria 772 del sistema o el disco fijo 779, así como el intercambio de información entre los subsistemas. La memoria 772 del sistema y/o el disco fijo 779 pueden incorporar un medio legible por ordenador. Cualquiera de los valores mencionados en el presente documento se puede enviar de un componente a otro componente, y enviarse al usuario.

5 Un sistema informático puede incluir una pluralidad de los mismos componentes o subsistemas, por ejemplo, conectados entre sí por una interfaz externa 781 o por una interfaz interna. En algunas realizaciones, los sistemas informáticos, subsistemas o aparatos pueden comunicarse a través de una red. En dichos casos, un ordenador se puede considerar un cliente, y otro ordenador, un servidor, pudiendo cada uno formar parte de un mismo sistema

10 informático. Un cliente y un servidor pueden incluir cada uno múltiples sistemas, subsistemas o componentes.

Se ha de entender que cualquiera de las realizaciones de la presente invención se puede implementar en forma de lógica de control usando hardware (por ejemplo, un circuito integrado específico de la aplicación o una selección de puertas programables en campo) y/o usando software informático con un procesador generalmente programable de

15 manera modular o integrada. Basándose en la divulgación y las enseñanzas proporcionadas en el presente documento, el experto habitual en la materia conocerá y apreciará otras formas y/o métodos de implementación de las realizaciones de la presente invención usando hardware y una combinación de hardware y software.

Cualquiera de los componentes o funciones de software descritos en la presente solicitud se puede implementar

20 como código de software para ser ejecutado por un procesador usando cualquier lenguaje informático adecuado tal como, por ejemplo, Java, C++ o Perl, usando, por ejemplo, técnicas convencionales u orientadas a objetos . El código de software puede almacenarse como una serie de instrucciones o comandos en un medio legible por ordenador para el almacenamiento y/o la transmisión, incluyendo los medios adecuados una memoria de acceso aleatorio (RAM), una memoria de solo lectura (ROM), un medio magnético tal como un disco duro o disquete, o un

25 medio óptico tal como un disco compacto (CD) o DVD (disco versátil digital), memoria flash, y similares. El medio legible por ordenador puede ser cualquier combinación de dichos dispositivos de almacenamiento o de transmisión.

Dichos programas también se pueden codificar y transmitir usando señales portadoras adaptadas para la transmisión a través de redes cableadas, ópticas y/o inalámbricas que se ajustan a una variedad de protocolos, 30 incluyendo Internet. Como tal, se puede crear un medio legible por ordenador de acuerdo con una realización de la presente invención usando una señal de datos codificada con dichos programas. Los medios legibles por ordenador codificados con el código de programa se pueden empaquetar con un dispositivo compatible o proporcionarse por separado de otros dispositivos (por ejemplo, a través de descarga de Internet). Cualquiera de dichos medios legibles por ordenador puede residir en o dentro de un único producto de programa informático (por ejemplo, un disco duro,

35 un CD o un sistema informático completo), y puede estar presente en o dentro de diferentes productos de programa informático dentro de un sistema o de una red. Un sistema informático puede incluir un monitor, una impresora u otra pantalla adecuada para proporcionar cualquiera de los resultados mencionados en el presente documento a un usuario.

40 Cualquiera de los métodos descritos en el presente documento puede realizarse total o parcialmente con un sistema informático que incluya uno o más procesadores, que puede configurarse para realizar las etapas. Así pues, las realizaciones se pueden dirigir a sistemas informáticos configurados para realizar las etapas de cualquiera de los métodos descritos en el presente documento, potencialmente con diferentes componentes que realicen una etapa respectiva o un grupo respectivo de etapas. Aunque se presentan como etapas numeradas, las etapas de los

45 métodos del presente documento pueden realizarse al mismo tiempo o en un orden diferente. Además, partes de estas etapas se pueden usar con partes de otras etapas de otros métodos. Además, todas o partes de una etapa pueden ser opcionales. Además, cualquiera de las etapas de cualquiera de los métodos se puede realizar con módulos, circuitos u otros medios de realización de estas etapas.

50 Los detalles específicos de realizaciones particulares pueden combinarse de cualquier manera adecuada sin apartarse del espíritu ni del alcance de las realizaciones de la invención. Sin embargo, otras realizaciones de la invención se pueden dirigir a realizaciones específicas relacionadas con cada aspecto individual, o combinaciones específicas de estos aspectos individuales.

55 La descripción anterior de realizaciones ilustrativas de la invención se ha presentado con fines ilustrativos y descriptivos. No se pretende que sea exhaustiva ni que limite la invención a la forma exacta descrita, y muchas modificaciones y variaciones son posibles a la luz de la enseñanza anterior. Las realizaciones se seleccionaron y se describieron con el fin de explicar mejor los principios de la invención y sus aplicaciones prácticas para permitir así a los expertos en la materia utilizar mejor la invención en diversas realizaciones y con diversas modificaciones que

60 sean adecuadas para el uso que se contempla en particular.

Una mención de "un", "una", “el” o "la" pretende significar "uno/a o más", a menos que se indique específicamente lo contrario.

Referencias

1. Driscoll D. A., Gross S. (2009) “Prenatal screening for aneuploidy”. N Engl J Med 360: 2556-2562.

2. Mujezinovic F., Alfirevic Z. (2007) “Procedure-related complications of amniocentesis and chorionic villous 5 sampling: a systematic review”. Obstet Gynecol 110: 687-694.

3.: Lo Y. M. D., Corbetta N., Chamberlain P. F., Rai V., Sargent I. L., et al. (1997) “Presence of fetal DNA in maternal plasma and serum”. Lancet 350: 485-487.

4.: Lo Y. M. D., Tein M. S. C., Lau T. K., Haines C. J., Leung T. N., et al. (1998) “Quantitative analysis of fetal DNA in maternal plasma and serum: implications for non-invasive prenatal diagnosis”. Am J Hum Genet 62: 768-775.

: 10 5. Tong Y. K., Ding C. M., Chiu R. W. K., Gerovassili A., Chim S. S. C., et al. (2006) “Non-invasive prenatal detection of fetal trisomy 18 by epigenetic allelic ratio analysis in maternal plasma: theoretical and empirical considerations”. Clin Chem 52: 2194-2202.

6. Lo Y. M. D., Tsui N. B. Y., Chiu R. W. K., Lau T. K., Leung T. N., et al. (2007) “Plasma placental RNA allelic ratio permits noninvasive prenatal chromosomal aneuploidy detection”. Nat Med 13: 218-223.

: 15 7. Dhallan R., Guo X., Emche S., Damewood M., Bayliss P., et al. (2007) “A non-invasive test for prenatal diagnosis based on fetal DNA present in maternal blood: a preliminary study”. Lancet 369: 474-481.

8.: Benachi A., Yamgnane A., Olivi M., Dumez Y., Gautier E., et al. (2005) “Impact of formaldehyde on the in vitro proportion of fetal DNA in maternal plasma and serum”. Clin Chem 51: 242-244.

9.: Chinnapapagari S. K. R., Holzgreve W., Lapaire O., Zimmermann B., Hahn S. (2005) “Treatment of maternal

20 blood samples with formaldehyde does not alter the proportion of circulatory fetal nucleic acids (DNA and mRNA) in maternal plasma”. Clin Chem 51: 652-655.

10.: Chung G. T. Y, Chiu R. W. K, Chan K. C. A., Lau T. K., Leung T. N., et al. (2005) “Lack of dramatic enrichment of fetal DNA in maternal plasma by formaldehyde treatment”. Clin Chem 51: 655-658.

11.: Chiu R. W. K., Chan K. C. A., Gao Y. A., Lau V. Y. M., Zheng W. L., et al. (2008) “Non-invasive prenatal

25 diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma”. Proc Natl Acad Sci EE.UU. 105: 20458-20463.

12. Chiu R. W. K., Akolekar R., Zheng Y. W. L., Leung T.Y., Sun H., et al. (2011) “Non-invasive prenatal assessment of trisomy 21 by multiplexed maternal plasma DNA sequencing: large scale validity study”. BMJ 342:

9.

30 13. Palomaki G. E., Kloza E. M., Lambert-Messerlian G. M., Haddow J. E., Neveux L. M., et al. (2011) “DNA sequencing of maternal plasma to detect Down syndrome: an international clinical validation study”. Genet Med

13: 913-920.

14. Bianchi D. W., Platt L. D., Goldberg J. D., Abuhamad A. Z., Sehnert A. J., et al. (2012) “Genome-wide fetal

aneuploidy detection by maternal plasma DNA sequencing”. Obstet Gynecol. En prensa. doi: 35 10.1097/AOG.0b013e31824fb482.

15. Liao G. J. W., Lun F. M. F., Zheng Y. W. L, Chan K. C. A, Leung T. Y., et al. (2011) “Targeted massively parallel sequencing of maternal plasma DNA permits efficient and unbiased detection of fetal alleles”. Clin Chem

57: 92-101.

16. Chiu R. W. K., Poon L. L. M., Lau T. K, Leung T. N., Wong E. M. C, et al. (2001) “Effects of blood-processing 40 protocols on fetal and total DNA quantification in maternal plasma”. Clin Chem 47: 1607-1613.

17.: Antonarakis S. E. (1991) “Parental origin of the extra chromosome in trisomy 21 as indicated by analysis of DNA polymorphisms”. N Engl J Med 324: 872-876.

18.: Mamanova L., Coffey A. J., Scott C. E., Kozatewa I., Turner E. H., et al. (2010) “Target-enrichment strategies for next-generation sequencing”, Nat Methods 7: 111-118.

45 19. Tewhey R., Warner J. B., Nakano M., Libby B., Medkova M., et al. (2009) “Microdmplet-based PCR enrichment for large-scale targeted sequencing”. Nat Biotechnol 27: 1025-1031.

20. Albert T. J., Molla M. N., Muzny D. M., Nazareth L., Wheeler D., Song X., et al. (2007) “Direct selection of human genomic locus by microarray hybridization”. Nat Methods; 4:903-5.

21. Gnirke A., Melnikov A., Maguire J., Rogov P., LeProust E. M., Brockman W., et al. (2009) “Solution hybrid 50 selection with ultra-long oligonucteotides for massively parallel targeted sequencing”. Nat Biotechnol; 27:182-9.

Claims

REIVINDICACIONES

1. Un método de análisis de una muestra biológica de una gestante con un feto, para determinar si el feto tiene una

aneuploidía asociada con un primer cromosoma, conteniendo la muestra biológica una mezcla de moléculas de ADN 5 del feto y de la madre, comprendiendo el método:

enriquecer la muestra biológica en moléculas de ADN de una pluralidad de regiones diana; secuenciar las moléculas de ADN de la muestra biológica para obtener una pluralidad de lecturas de secuencia; analizar la pluralidad de lecturas de secuencia, incluyendo el análisis de una lectura de secuencia:

identificar una ubicación de la lectura de secuencia en un genoma de referencia mediante la alineación de la lectura de secuencia con respecto al genoma de referencia; y determinar un respectivo alelo de la lectura de secuencia;

15 identificar una pluralidad de primeros locus del primer cromosoma, correspondiendo la pluralidad de primeros locus a una parte de las regiones diana; identificar una pluralidad de segundos locus en uno o más cromosomas de referencia, correspondiendo la pluralidad de los segundos locus a una parte de las regiones diana, siendo la gestante homocigótica para un respectivo alelo materno en cada uno del primer y segundo locus, y siendo el feto heterocigótico para el respectivo alelo materno y un respectivo alelo paterno de cada uno del primer y segundo locus, siendo los respectivos alelos paternos diferentes de los respectivos alelos maternos; determinar una primera cantidad materna de los respectivos alelos maternos en la pluralidad de primeros locus; determinar una primera cantidad paterna de los respectivos alelos paternos en la pluralidad de primeros locus; calcular una primera relación de la primera cantidad materna y la primera cantidad paterna;

25 determinar una segunda cantidad materna de los respectivos alelos maternos en la pluralidad de segundos locus; determinar una segunda cantidad paterna de los respectivos alelos paternos en la pluralidad de segundos locus; calcular una segunda relación de la segunda cantidad materna y la segunda cantidad paterna; calcular una tercera relación de la primera relación y la segunda relación; y comparar la tercera relación con uno o más valores de corte para determinar si el feto tiene una aneuploidía asociada con el primer cromosoma.
2. El método de la reivindicación 1, en el que el enriquecimiento de la muestra biológica incluye:

35 capturar moléculas de ADN de la muestra biológica con sondas inmovilizadas correspondientes a la pluralidad de regiones diana o amplificar moléculas de ADN de la muestra biológica con cebadores correspondientes a la pluralidad de regiones diana.
3. El método de la reivindicación 1, en el que la identificación de un primer locus de la pluralidad de primeros locus del primer cromosoma incluye:

alinear una pluralidad de lecturas de secuencia con el primer locus; e identificar dos alelos entre la pluralidad de lecturas de secuencia alineadas con el primer locus. 45
4.

El método de la reivindicación 3, que comprende además:

determinar un primer número de lecturas de secuencia correspondientes al primer alelo del primer locus; determinar un segundo número de lecturas de secuencia correspondientes al segundo alelo del primer locus; calcular una relación alélica del primer número y del segundo número; determinar si la relación alélica es superior a un primer umbral e inferior a un segundo umbral.
5.

El método de la reivindicación 1, en el que identificar un primer locus de la pluralidad de primeros locus del primer cromosoma incluye:

55 identificar que el padre del feto es homocigótico para un primer alelo del primer locus; e identificar que la gestante es homocigótica para el segundo alelo del primer locus.
6. El método de la reivindicación 1, en el que la primera relación corresponde a un primer porcentaje de moléculas de ADN fetal de la mezcla determinado a partir de la primera cantidad materna y la primera cantidad paterna, y en el que la segunda relación corresponde a un segundo porcentaje de moléculas de ácido nucleico fetal de la mezcla determinado a partir de la segunda cantidad materna y de la segunda cantidad paterna.
7. El método de la reivindicación 1, en el que la primera relación incluye la primera cantidad paterna dividida entre 65 una suma de la primera cantidad paterna y la primera cantidad materna.
8. El método de la reivindicación 1, en el que la primera relación incluye la primera cantidad paterna dividida entre la primera cantidad materna, y la segunda relación incluye la segunda cantidad paterna dividida entre la segunda cantidad materna.

5 9. El método de la reivindicación 1, en el que un primer valor de corte corresponde a una aneuploidía que es de origen materno y un segundo valor de corte corresponde a una aneuploidía que es de origen paterno.
10. El método de la reivindicación 9, en el que la tercera relación es de aproximadamente dos cuando la aneuploidía

es de origen paterno. 10
11.

El método de la reivindicación 9, en el que la tercera relación es aproximadamente 1-f/2 cuando la aneuploidía es de origen materno, siendo f una concentración de ADN fetal fraccionada de la mezcla.
12.

El método de la reivindicación 11, que comprende además:

15 determinar la concentración de ADN fetal fraccionada f de la segunda cantidad paterna y de la segunda cantidad materna.
13. El método de la reivindicación 1, en el que el primer cromosoma es el cromosoma 21, el cromosoma 13 o el 20 cromosoma 18.
14. El método de la reivindicación 1, en el que la pluralidad de segundos locus está ubicada en una pluralidad de cromosomas de referencia.

25 15. Un programa informático que comprende una pluralidad de instrucciones capaces de ejecutarse mediante un sistema informático y disponerse cuando se ejecutan para controlar el sistema informático para analizar una muestra biológica de una gestante con un feto para determinar si el feto tiene una aneuploidía asociada con un primer cromosoma, conteniendo la muestra biológica una mezcla de moléculas de ADN del feto y de la madre, comprendiendo el método:

30 recibir una pluralidad de lecturas de secuencia obtenida de la secuenciación de moléculas de ADN de la muestra biológica, estando la muestra biológica enriquecida en moléculas de ADN de una pluralidad de regiones diana; analizar la pluralidad de lecturas de secuencia, incluyendo el análisis de una lectura de secuencia:

35 identificar una ubicación de la lectura de secuencia en un genoma de referencia mediante la alineación de la lectura de secuencia con respecto al genoma de referencia; y determinar un respectivo alelo de la lectura de secuencia;

identificar una pluralidad de primeros locus del primer cromosoma, correspondiendo la pluralidad de primeros

40 locus a una parte de las regiones diana; identificar una pluralidad de segundos locus en uno o más cromosomas de referencia, correspondiendo la pluralidad de los segundos locus a una parte de las regiones diana, siendo la gestante homocigótica para un respectivo alelo materno en cada uno del primer y segundo locus, y siendo el feto heterocigótico para el respectivo alelo materno y un respectivo alelo paterno de cada uno del primer y segundo locus, siendo los

45 respectivos alelos paternos diferentes de los respectivos alelos maternos; determinar una primera cantidad materna de los respectivos alelos maternos en la pluralidad de primeros locus; determinar una primera cantidad paterna de los respectivos alelos paternos en la pluralidad de primeros locus; calcular una primera relación de la primera cantidad materna y la primera cantidad paterna; determinar una segunda cantidad materna de los respectivos alelos maternos en la pluralidad de segundos

50 locus; determinar una segunda cantidad paterna de los respectivos alelos paternos en la pluralidad de segundos locus; calcular una segunda relación de la segunda cantidad materna y la segunda cantidad paterna; calcular una tercera relación de la primera relación y la segunda relación; y comparar la tercera relación con uno o más valores de corte para determinar si el feto tiene una aneuploidía

55 asociada con el primer cromosoma.