ES2512448T3 - Detección no invasiva de anormalidades genéticas fetales - Google Patents

Detección no invasiva de anormalidades genéticas fetales Download PDF

Info

Publication number
ES2512448T3
ES2512448T3 ES11863253.8T ES11863253T ES2512448T3 ES 2512448 T3 ES2512448 T3 ES 2512448T3 ES 11863253 T ES11863253 T ES 11863253T ES 2512448 T3 ES2512448 T3 ES 2512448T3
Authority
ES
Spain
Prior art keywords
chromosome
depth
coverage
content
fragments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11863253.8T
Other languages
English (en)
Inventor
Fuman Jiang
Huifei Chen
Xianghua Chai
Yuying Yuan
Xiuqing Zhang
Fang Chen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Genomics Co Ltd
Original Assignee
BGI Diagnosis Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=47392194&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2512448(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by BGI Diagnosis Co Ltd filed Critical BGI Diagnosis Co Ltd
Application granted granted Critical
Publication of ES2512448T3 publication Critical patent/ES2512448T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Un método implementado por ordenador para determinar una anormalidad genética fetal la cual es una aneuploidía cromosómica, método que comprende: (a) obtener la información de secuencia de múltiples fragmentos de polinucleótidos a partir de una muestra, siendo dicha muestra una muestra de sangre periférica derivada de un sujeto femenino en embarazo y que contiene ADN tanto materno como fetal; (b) asignar dichos fragmentos a cromosomas con base en dicha información de secuencia comparando dichos fragmentos con las lecturas únicas de referencia del mismo tamaño para cada uno de dichos cromosomas, en donde las lecturas únicas de referencia son fragmentos de un cromosoma que tiene una secuencia única la cual puede ser asignada de manera no ambigua a una única localización cromosómica individual con base en una secuencia genómica de referencia; (c) determinar la profundidad de cobertura y el contenido de GC de un cromosoma con base en la información de secuencia para aquellos fragmentos que han sido asignados a las lecturas únicas de referencia de dicho cromosoma en la etapa (b), en donde la profundidad de cobertura es la relación entre el número de fragmentos asignados de manera única a dicho cromosoma y el número de lecturas únicas de referencia para dicho cromosoma del mismo tamaño del fragmento con base en dicha secuencia genómica humana de referencia; (d) determinar la profundidad de cobertura ajustada de dicho cromosoma utilizando dicho contenido de GC de dicho cromosoma y la relación establecida entre la profundidad de cobertura y el contenido de GC para dicho cromosoma en la ausencia de aneuploidía, en donde dicha relación establecida ha sido determinada por un método que comprende las etapas de: (i) obtener información de secuencia de múltiples fragmentos de polinucleótidos que cubren dicho cromosoma a partir de una pluralidad de muestras de sangre periférica euploide que contienen ADN genómico, en donde el tamaño del fragmento es el mismo que el tamaño del fragmento de los fragmentos de polinucleótido múltiples de la etapa (a) anterior; (ii) asignar dichos fragmentos a cromosomas con base en dicha información de secuencia como en la etapa (b) más arriba; (iii) determinar la profundidad de cobertura y el contenido de GC de dicho cromosoma con base en dicha información de secuencia para cada muestra euploide como en la etapa (c) más arriba; y (iv) utilizar la profundidad de cobertura y el contenido de GC determinados para cada muestra en la etapa (iii) para determinar la relación entre la profundidad de cobertura y el contenido de GC de dicho cromosoma en la ausencia de aneuploidía; y (e) comparar dicha profundidad de cobertura ajustada con la profundidad de cobertura de dicho cromosoma determinada en la etapa (c), en donde una diferencia entre ellos indica aneuploidía cromosómica fetal.

Description

5
10
15
20
25
30
35
40
45
50
55
E11863253
06-10-2014
DESCRIPCIÓN
Detección no invasiva de anormalidades genéticas fetales
Campo técnico
La invención se relaciona con métodos no invasivos para la detección de anormalidades genéticas fetales, más particularmente aneuploidía cromosómica, mediante secuenciación de ADN de muestras de sangre periférica tomadas de mujeres embarazadas que contienen ADN tanto materno como fetal. Más particularmente, esta invención se relaciona con el análisis de datos que tiene en cuenta el sesgo de GC introducido por amplificación y secuenciación de muestras de ADN a través de bases sobre relaciones preestablecidas entre el contenido de GC y la profundidad de cobertura para un cromosoma en ausencia de aneuploidía y en el tamaño de fragmentación de ADN seleccionado como se discute en más detalle más adelante. Puede utilizarse análisis estadístico para comparar la profundidad de cobertura calculada para un cromosoma en una muestra con respecto a la profundidad de cobertura esperada de acuerdo con tal relación establecida con lo cual puede lograrse la detección de aneuploidía cromosómica fetal.
Técnica antecedente
Los métodos de diagnóstico prenatales convencionales con procedimientos invasivos, tales como muestreo de vilus coriónico y amniocentesis, conllevan riesgos potenciales tanto para los fetos como para las madres. La selección no invasiva de aneuploidía fetal utilizando marcadores en el suero materno y ultrasonido está disponible, pero tiene sensibilidad y especificidad limitadas (Kagan, et al., Human Reproduction (2008) 23:1968-1975; Malone, et al., N Engl J Med (2005) 353:2001-2011).
Estudios recientes han demostrado que la detección no invasiva de aneuploidía fetal mediante secuenciación paralela masiva de moléculas de ADN en el plasma de mujeres embarazadas es factible. El ADN fetal ha sido detectado y cuantificado en plasma y suero maternos (Lo, et al., Lancet (1997) 350:485 487; Lo, et al., Am. J. hum. Genet. (1998) 62:768-775). Se presentan múltiples tipos de células fetales en la circulación materna, incluyendo granulocitos, linfocitos, glóbulos rojos nucleados y células de trofoblastos fetales (Pertl y Bianchi, Obstetrics and Gynecology (2001) 98:483-490). El ADN fetal puede ser detectado en el suero en la séptima semana de gestación, y se incrementa con el término del embarazo. El ADN fetal presente en el suero y en el plasma materno es comparable a la concentración de ADN obtenida de los protocolos de aislamiento de células fetales.
El ADN fetal en circulación ha sido utilizado para determinar el sexo del feto (Lo, et al., Am. J. hum. Genet. (1998) 62:768-775). También se ha detectado el genotipo D de Rhesus fetal utilizando ADN fetal. Sin embargo, el diagnóstico y las aplicaciones clínicas del ADN fetal en circulación están limitados a genes que están presentes en el feto pero no en la madre (Pertl y Bianchi, Obstetrics and Gynecology (2001) 98:483-490). Así, existe una necesidad por un método no invasivo que pueda determinar la secuencia del ADN fetal y proveer un diagnóstico definitivo de las anormalidades cromosómicas en un feto.
El descubrimiento de las células fetales y de los ácidos nucleicos fetales libres de células en material sanguíneo en las últimas décadas y la aplicación de la secuenciación biolística de alto rendimiento de ADN libre de células en plasma materno lo hace disponible para detectar pequeños cambios en la representación de cromosomas aportados por un feto aneuploide en una muestra de plasma materno. Se ha alcanzado la detección no invasiva de embarazos por trisomía 13, 18 y 21.
Sin embargo, como lo muestran algunos estudios, el sesgo de GC introducido por la amplificación y secuenciación ha puesto un límite práctico sobre la sensibilidad de la detección de aneuploidía. El sesgo de GC podría ser introducido durante la preparación de la muestra y el proceso de secuenciación, bajo diferentes condiciones tales como composición de reactivos, densidad y temperatura de la aglomeración, lo cual lleva a un muestreo diferencial de las moléculas de ADN con diferente composición de GC y variación significativa en los datos de secuenciación para los cromosomas que son ricos en GC o pobres en GC.
Para mejorar la sensibilidad, se han desarrollado protocolos para la eliminación del efecto del sesgo de GC. Fan y Quake desarrollaron un método para eliminar computacionalmente el sesgo de GC aplicando peso a cada densidad de GC con base en el contenido GC genómico local, para mejorar el número de lecturas mapeadas en cada conjunto basura multiplicando el peso correspondiente (Fan y Quake PLoS ONE (2010) 5: e10439). Sin embargo, el método tiene dificultades al tratar con trastornos en cromosomas sexuales, especialmente trastornos relevantes del cromosoma Y por la razón de que el proceso puede producir una ligera distorsión de datos la cual interfiere con la precisión de la detección.
Aquí, hemos descubierto un método que hace uso del sesgo de GC con el fin de obtener una alta sensibilidad en la detección de aneuploidía fetal así como para evitar la distorsión de los datos. Este método permite la definición de parámetros usados para pruebas estadísticas de acuerdo con el contenido de GC. Además, los inventores introdujeron la fracción fetal estimada en el diagnóstico mediante una hipótesis binaria la cual muestra sensibilidad y
10
15
20
25
30
35
40
45
50
E11863253
06-10-2014
especificidad más altas. Nuestro método también muestra que debe ser posible incrementar la sensibilidad de la detección no invasiva de anormalidades genéticas fetales para prefijar la precisión para muestras maternas que contienen una baja fracción de ADN fetal secuenciando más fragmentos de polinucleótidos. El remuestreo del plasma materno en las últimas semanas de la gestación también puede incrementar la sensibilidad del diagnóstico.
Resumen de la invención
La presente invención está dirigida a métodos para la detección no invasiva de aneuploidía cromosómica fetal en los cuales se lleva a cabo un secuenciación a gran escala de nucleótidos a partir de muestras de sangre periférica materna. En un aspecto, la presente invención provee un método implementado por ordenador para determinar una anormalidad genética fetal la cual es una aneuploidía cromosómica o aneuploidía parcial, método que comprende:
(a)
obtener la información de secuencia de múltiples fragmentos de polinucleótidos a partir de una muestra, siendo dicha muestra una muestra de sangre periférica derivada de un sujeto femenino en embarazo y que contiene ADN tanto materno como fetal;
(b)
asignar dichos fragmentos a cromosomas con base en dicha información de secuencia comparando dichos fragmentos con las lecturas únicas de referencia del mismo tamaño para cada uno de dichos cromosomas, en donde las lecturas únicas de referencia son fragmentos de un cromosoma que tiene una secuencia única la cual puede ser asignada de manera no ambigua a una localización cromosómica individual con base en una secuencia genómica de referencia;
(c)
determinar la profundidad de cobertura y el contenido de GC de un cromosoma con base en la información de secuencia para aquellos fragmentos que han sido asignados a las lecturas únicas de referencia de dicho cromosoma en la etapa (b), en donde la profundidad de cobertura es la relación entre el número de fragmentos asignados de manera única a dicho cromosoma y el número de lecturas únicas de referencia para dicho cromosoma del mismo tamaño del fragmento con base en dicha secuencia genómica humana de referencia;
(d)
determinar la profundidad de cobertura ajustada de dicho cromosoma utilizando dicho contenido de GC de dicho cromosoma y la relación establecida entre la profundidad de cobertura y el contenido de GC para dicho cromosoma en la ausencia de aneuploidía, en donde dicha relación establecida ha sido determinada por un método que comprende las etapas de:
(i)
obtener información de secuencia de múltiples fragmentos de polinucleótidos que cubren dicho cromosoma a partir de una pluralidad de muestras de sangre periférica euploide que contienen ADN genómico, en donde el tamaño del fragmento es el mismo que el tamaño del fragmento de los fragmentos de polinucleótido múltiples de la etapa (a) anterior;
(ii)
asignar dichos fragmentos a cromosomas con base en dicha información de secuencia como en la etapa (b) más arriba;
(iii) determinar la profundidad de cobertura y el contenido de GC de dicho cromosoma con base en dicha información de secuencia para cada muestra euploide como en la etapa (c) más arriba; y
(iv)
utilizar la profundidad de cobertura y el contenido de GC determinados para cada muestra en la etapa (iii) para determinar la relación entre la profundidad de cobertura y el contenido de GC de dicho cromosoma en la ausencia de aneuploidía; y
(e)
comparar dicha profundidad de cobertura ajustada con la profundidad de cobertura de dicho cromosoma determinada en la etapa (c), en donde una diferencia entre ellos indica aneuploidía cromosómica fetal.
En una realización los fragmentos de polinucleótidos varían desde aproximadamente 10 hasta aproximadamente 1000 bp en longitud. En otra realización, los fragmentos de polinucleótidos varían desde aproximadamente 15 hasta aproximadamente 500 bp en longitud. En aún otra realización los fragmentos de polinucleótidos varían desde aproximadamente 20 hasta aproximadamente 200 bp en longitud. En todavía otra realización los fragmentos de polinucleótidos varían desde aproximadamente 25 hasta aproximadamente 100 bp en longitud. En una realización adicional los fragmentos de polinucleótidos tienen aproximadamente 35 bp de longitud.
En una realización, la información de secuencia es obtenida por secuenciación genómica paralela. En otra realización la asignación del fragmento a los cromosomas se hace comparando la secuencia de los fragmentos con una secuencia genómica humana de referencia. La secuencia genómica humana de referencia puede ser cualquier construcción de genoma humano adecuada y/o publicada, tal como hg18 o hg19. Se descartan los fragmentos que se asignan a más de un cromosoma o no se asignan a ningún cromosoma.
Como se indicó anteriormente, la profundidad de cobertura de un cromosoma para el propósito del método de la invención es la relación entre el número de fragmentos que se asignan únicamente al cromosoma y el número de
10
15
20
25
30
E11863253
06-10-2014
lecturas únicas de referencia del cromosoma. En otra realización, la profundidad de la cobertura está normalizada. En todavía otra realización, la normalización se calcula contra la cobertura de todos los otros autosomas. En aún otra realización, la normalización se calcula contra la cobertura de todos los otros cromosomas.
En una realización, la relación está en la fórmula:
imagen1
en donde f(GCi,j) representa la función de la relación entre la profundidad de cobertura normalizada y el correspondiente contenido de GC de la muestra i, cromosoma j, εi,j representa el residual de la muestra i, cromosoma j. En otras realizaciones, la relación entre la profundidad de cobertura y el contenido de GC se calcula mediante regresión polinómica local. En algunas realizaciones, la relación puede ser una relación lineal no fuerte. En algunas realizaciones, la relación se determina mediante algoritmo Loess.
En algunas realizaciones, el método comprende adicionalmente calcular la profundidad de cobertura ajustada de acuerdo con la fórmula:
imagen2
En algunas realizaciones, el método comprende adicionalmente calcular la variación estándar de acuerdo con la fórmula:
imagen3
en donde ns representa el número de muestras de referencia.
En algunas realizaciones, el método comprende adicionalmente calcular la estadística t de Student de acuerdo con la fórmula:
imagen4
En una realización, el contenido de GC en un cromosoma es el contenido de GC promedio de todos los fragmentos que están asignados al cromosoma para el propósito de la etapa (c) del método de la invención como se definió más arriba. El contenido de GC de un fragmento puede ser calculado dividiendo el número de nucleótidos G/C en el fragmento por el número total de nucleótidos del fragmento. En otra realización, el contenido de GC de un cromosoma es el contenido de GC agregado de las lecturas únicas de referencia del cromosoma.
Al menos 2, 5, 10, 20, 50, 100, 200, 500 o 1000 muestras euploides pueden ser utilizadas con el fin de determinar la relación entre la profundidad de cobertura y el contenido de GC para un cromosoma en la ausencia de aneuploidía. El cromosoma puede ser cualquiera de los cromosomas 1, 2,..., 22, X o Y.
[0019] Las muestras para este propósito pueden ser de sujetos femeninos en estado de embarazo. Las muestras pueden ser de sujetos masculinos. Alternativamente, las muestras pueden ser tanto de sujetos femeninos en estado de embarazo como de sujetos masculinos. Las muestras son muestras de sangre periférica.
En algunas realizaciones, un método de la invención para determinar una aneuploidía cromosómica fetal comprende adicionalmente la determinación del género del feto. El género del feto puede ser determinado de acuerdo con la fórmula:
5
10
15
20
25
30
35
E11863253
06-10-2014
imagen5
en donde cr.ai,x y cr.ai,y están normalizadas con respecto a la profundidad de cobertura de los cromosomas X y Y, respectivamente.
En algunas realizaciones, el método comprende adicionalmente estimar la fracción fetal. La fracción fetal puede ser calculada de acuerdo con la fórmula:
imagen6
en donde
imagen7es la profundidad de cobertura ajustada calculada a partir de la profundidad de cobertura del cromosoma Y y el correspondiente contenido de GC de muestras de mujeres embarazadas con un feto hembra,
imagen8se refiere a la profundidad de cobertura ajustada calculada a partir de la relación de la profundidad de cobertura del cromosoma Y y el contenido correspondiente de GC de sujetos masculinos. Alternativamente, la fracción fetal puede ser calculada de acuerdo con la fórmula:
imagen9
en donde
imagen10es la profundidad de cobertura ajustada calculada a partir de la relación de la profundidad de cobertura del cromosoma X y el contenido correspondiente de GC de muestras de mujeres embarazadas con un feto imagen11
hembra,
se refiere a la profundidad de cobertura ajustada calculada a partir de la relación de la profundidad de la cobertura del cromosoma X y el contenido correspondiente de GC de muestras de sujetos masculinos. Adicionalmente, la fracción fetal puede ser calculada de acuerdo con la fórmula:
imagen12
en donde
imagen10es la profundidad de cobertura ajustada calcula a partir de la relación de la profundidad de cobertura del cromosoma X y el contenido correspondiente de GC de muestras de mujeres embarazadas con un feto imagen13hembra,
se refiere a la profundidad de cobertura ajustada calculada a partir de la relación de la profundidad de cobertura del cromosoma imagen14Y y el contenido correspondiente de GC de muestras de mujeres
embarazadas con un feto hembra,
se refiere a la profundidad de cobertura ajustada calculada a partir de la relación de la profundidad de cobertura de cromosoma X y el contenido correspondiente de GC de muestras de
sujetos masculinos,
imagen15se refiere a la profundidad de cobertura ajustada calculada a partir de la relación de la profundidad de la cobertura del cromosoma Y y el contenido correspondiente de GC de sujetos masculinos.
La aneuploidía fetal que va a ser detectada puede ser un trastorno para un autosoma seleccionado del grupo consistente de la trisomía 13, 18 y 21. En aún otra realización, la aneuploidía fetal que va a ser detectada puede ser un trastorno para un cromosoma sexual seleccionado del grupo consistente de XO, XXX, XXY y XYY. En algunas realizaciones, la comparación de dicha profundidad de cobertura ajustada con dicha profundidad de cobertura del cromosoma se lleva a cabo mediante una prueba de hipótesis estadística, en donde una hipótesis es que el feto es euploide (H0) y la otra hipótesis es que el feto es aneuploide (H1). Puede calcularse una estadística a partir de
, respectivamente, en donde fxy es la fracción fetal. En algunas realizaciones, la relación probable logarítmica de t1 y t2 se calcula de acuerdo con la fórmula: Li,j = log(p(t1i,j, grado |D)) / log(p(t2i,j, grado|T)), en donde grado se refiere a un grado de distribución t, D se refiere a diploidía, T se refiere a trisomía, y p (T1i,j, grado| *),* = D, T representa la densidad de probabilidad condicional dada a un grado de distribución t.
imagen16
10
15
20
25
30
35
40
45
50
E11863253
06-10-2014
imagen17
En una realización, el género fetal es femenino, y la estadística t de Student se calcula de acuerdo con la fórmula
imagen18, en donde
imagen19es la profundidad de cobertura ajustada calculada a partir de la relación de la profundidad de la cobertura del cromosoma X y el contenido correspondiente de GC de muestras a partir de mujeres embarazadas con un feto femenino. En algunas realizaciones, |t1|> 3.13 indica que el feto puede ser XXX o XO. En algunas realizaciones, |t1|> 5 indica que el feto es XXX o XO.
En otra realización, el género del feto es masculino, y la estadística t de Student se calcula de acuerdo con la
es la profundidad de cobertura ajustada calculada a partir de la relación de la profundidad de la cobertura del cromosoma X y el contenido correspondiente de GC de muestras a partir de mujeres embarazadas con un feto femenino. En algunas realizaciones, |t2|>3,13 indica que el feto puede ser XXY o XYY. En algunas realizaciones, |t2|>5 indica que el feto es XXY o XYY.
En otro aspecto, se provee aquí un medio legible por ordenador que comprende una pluralidad de instrucciones adaptadas para ejecutar un método de la invención para el diagnóstico prenatal de una anormalidad genética fetal cuando dichas instrucciones son suplementadas con información de secuencia de fragmentos múltiples de polinucleótidos a partir de una muestra de sangre periférica derivada de un sujeto femenino en embarazo y que contiene ADN tanto materno como fetal. El medio legible por ordenador: b) asignará dichos fragmentos de polinucleótidos a cromosomas con base en dicha información de secuencia; c) determinará la profundidad de cobertura y el contenido de GC de un cromosoma con base en la información de secuencia para aquellos fragmentos asignados únicamente a dicho cromosoma; d) determinará la profundidad de cobertura ajustada de dicho cromosoma utilizando dicho contenido de GC de dicho cromosoma y establecerá una relación entre la profundidad de cobertura y el contenido de GC de dicho cromosoma; y e) comparará dicha profundidad de cobertura con dicha profundidad de cobertura de dicho cromosoma, en donde una diferencia entre ellos indica aneuploidía cromosómica fetal.
En todavía otro aspecto, se provee aquí un sistema que comprende medios adaptados para llevar a cabo un método de la invención. Tal sistema comprende: a) medios para obtener información de secuencia de múltiples fragmentos de polinucleótidos a partir de una muestra; y b) un medio legible por ordenador como se describió anteriormente.
Breve descripción de los dibujos
La Figura 1 muestra un proceso esquemático para calcular la profundidad de cobertura y el contenido de GC utilizando información de secuencia de fragmentos de polinucleótidos.
La Figura 2 ilustra la correlación entre profundidad de cobertura normalizada-contenido de GC establecida utilizando datos a partir de 300 casos de referencia. La profundidad de cobertura normalizada para cada caso se representa gráficamente contra el contenido de GC secuenciado correspondiente. Las cruces denotan casos con feto femenino euploide, los cuadrados denotan casos con feto masculino euploide. Las líneas sólidas son las líneas de ajuste de la profundidad de cobertura y el contenido de GC.
La Figura 3 ilustra la tendencia entre la profundidad de cobertura normalizada y el correspondiente contenido de GC disponiendo los cromosomas con su contenido de GC ascendente inherente. El contenido de GC ascendente inherente de cada cromosoma se refiere aquí al contenido de GC promedio de etiquetas secuenciadas de ese cromosoma a partir de 300 casos de referencia.
La Figura 4 muestra diferentes composiciones de clase GC para cada cromosoma. El contenido de GC de cada lectura de 35 bp de las lecturas únicas de referencia se calculó para cada cromosoma, el contenido de GC fue clasificado en 36 niveles y el porcentaje de cada nivel fue calculado como la composición en GC de cada cromosoma. Los cromosomas fueron entonces representados gráficamente mediante el mapa de calor y aglomerados jerárquicamente.
La Figura 5 demuestra que la desviación dla secuenciación introduce la correlación mostrada en la Figura 2 mediante la simulación manual del proceso de preferencia del secuenciador.
La Figura 6 representa gráficamente la variación estándar contra el número total de fragmentos de polinucleótidos secuenciados. En 150 muestras, la varianza estándar ajustada de cada cromosoma muestra una relación lineal con el recíproco de la raíz cuadrada del número de lecturas únicas.
La Figura 7 muestra una gráfica Q-Q del residual de cada cromosoma calculado mediante la Fórmula 3. Se muestra una relación lineal con una distribución normal.
La Figura 8 muestra el histograma de profundidad de cobertura del cromosoma Y. Hay dos picos lo cual implica que el género de los casos puede ser distinguido por la profundidad de cobertura del cromosoma Y. La curva es la distribución de la profundidad de cobertura relativa del cromosoma Y estimada por la estimación de la densidad núcleo con el núcleo Gaussiano.
10
15
20
25
30
35
40
45
50
E11863253
06-10-2014
La Figura 9 muestra un diagrama del proceso para el diagnóstico de 903 muestras de prueba para anormalidad cromosómica fetal.
La Figura 10 muestra el resultado de la aneuploidía: casos de trisomía 13, 18, 21 y XO, XXY, XYY y casos normales. La Figura 10A muestra la gráfica de profundidad de cobertura normalizada versus contenido de GC de los cromosomas 13, 18 y 21. La Figura 10B muestra las gráficas de los cromosomas X y Y. Los círculos representan profundidad de cobertura relativa normal de fetos femeninos con contenido de GC, los puntos representan fetos masculinos normales. La línea sólida es la línea de ajuste de la cobertura relativa y el contenido de GC, la línea de rayas es el absoluto del valor t 1, las líneas punteadas son el absoluto del valor t 2 y las líneas de puntos-rayas son el absoluto del valor t 3.
La Figura 11 compara los valores de confianza de diferentes metodologías de diagnóstico.
La Figura 12 muestra la relación entre la fracción de ADN fetal y la edad gestacional. La fracción del ADN fetal en plasma materno se correlaciona con la edad gestacional. La fracción de ADN fetal fue estimada por X y Y juntos. Hay una correlación significativa estadísticamente entre la fracción de ADN fetal promedio y la edad gestacional (P <0.001). Nótese que el valor R2 representa el cuadrado del coeficiente de correlación pequeño. La fracción mínima es 3.49%.
La Figura 13 muestra la relación entre la varianza estándar con el número de casos requeridos para la detección. Las varianzas estándar calculadas por la fórmula 5 de cada cromosoma varían con diferentes números de muestras. La varianza estándar se hace estable cuando el número de muestras es superior a 100.
La Figura 14 muestra el número estimado de lecturas únicas para la detección de aneuploidía fetal en plasma libre de células como función de la fracción de ADN fetal. Los estimados están basados en el nivel de valor t de confianza no inferior a 3 para aneuploidía de cromosomas 13, 18, 21, y X, incluso Y (a partir de la relación entre X y Y) teniendo cada uno diferente longitud. A medida que la fracción de ADN fetal disminuye, el número total de secuencias por biolística requeridas se incrementa. Con un resultado de secuenciación de 4 millones de lecturas de secuencia por canal en la celda de flujo, la trisomía 21 puede ser detectada si el 3.5% del ADN libre de células es fetal. La aneuploidía del cromosoma X no fue detectada fácilmente cuando la fracción y el número de lecturas únicas fueron pequeños, tal como 4% y 5 millones de lecturas. Cromosomas diferentes requieren diferentes niveles de fracción de ADN fetal y un número de lecturas único, el cual puede ser causado por la estructura de GC del cromosoma.
La Figura 15 muestra una gráfica de contornos de sensibilidad mapeada mediante volúmenes de datos y edad gestacional (semanas) para la detección de la trisomía del cromosoma 13 para fetos femeninos, para cada semana gestacional y cada punto de volumen de datos.
La Figura 16 muestra una gráfica de contornos de sensibilidad mapeada por volumen de datos y edad gestacional (semanas) para la detección de trisomía del cromosoma 18 para fetos femeninos, para cada semana gestacional y cada punto de volumen de datos.
La Figura 17 muestra una gráfica de contornos de sensibilidad mapeada por volumen de datos y edad gestacional (semanas) para la detección de la trisomía del cromosoma 21 para fetos femeninos, para cada semana gestacional y cada punto de volumen de datos.
La Figura 18 muestra una gráfica de contornos de sensibilidad mapeada por volumen de datos y edad gestacional (semanas) para la detección de trisomía del cromosoma X para fetos femeninos, para cada semana gestacional y cada punto de volumen de datos.
La Figura 19 muestra una gráfica de contornos de sensibilidad mapeada por volumen de datos y edad gestacional (semanas) para la detección de la trisomía del cromosoma 13 de un sujeto masculino. Para cada semana gestacional y cada punto de volumen de datos, calculamos su distribución empírica de la fracción de ADN fetal y la varianza estándar para cada volumen de datos primeramente, y comparando la fracción estimada por XY o Y calculamos entonces la sensibilidad de cada tipo de aneuploidía.
La Figura 20 muestra una gráfica de contornos de sensibilidad mapeada por volumen de datos y edad gestacional (semanas) para la detección de trisomía del cromosoma 18 de un sujeto masculino.
La Figura 21 muestra una gráfica de contornos de sensibilidad mapeada por volumen de datos y edad gestacional (semanas) para la detección de trisomía del cromosoma 21 de un sujeto masculino.
Descripción detallada de la invención
La presente invención está dirigida a métodos para detección no invasiva de anormalidades genéticas fetales mediante una secuenciación a gran escala de fragmentos de polinucleótidos a partir de una muestra de sangre
10
15
20
25
30
35
40
45
50
55
E11863253
06-10-2014
periférica materna. Como se indicó anteriormente, se proveen métodos que tienen en cuenta el sesgo de GC de los resultados de secuenciación que surgen de la diferencia en el contenido de GC de un cromosoma con base en la relación entre la profundidad de cobertura de un cromosoma y el contenido correspondiente de GC. De acuerdo con lo anterior, se describe aquí un método para ajustar computacionalmente los parámetros de referencia que están siendo usados en un cálculo de t de Student con contenidos de GC pesando localmente la regresión polinómica para ajustar la profundidad de cobertura de un cromosoma en muestras contra el contenido de GC de los fragmentos de polinucleótido.
También se provee aquí un método para determinar la anormalidad cromosómica de un feto tal como se describió anteriormente involucrando análisis estadístico mediante el uso de una prueba de hipótesis estadística. Además, se describen métodos para calcular estándares para control de calidad de los datos (DQC) útiles en la determinación de la cantidad de muestras clínicas necesarias para un cierto nivel de significado estadístico.
I. Definiciones
A menos que se defina de otra manera, todos los términos técnicos y científicos utilizados aquí tienen el mismo significado que se entiende comúnmente por parte de una persona de experiencia normal en la técnica a la cual pertenece esta invención. Todas las patentes, solicitudes, solicitudes publicadas y otras publicaciones referidas aquí se incorporan como referencia en su totalidad. Si una definición fijada en esta sección es contraria o de alguna manera inconsistente con una definición fijada en las patentes, solicitudes, solicitudes publicadas y otras publicaciones que se incorporan aquí como referencia, la definición fijada en esta sección prevalece sobre la definición que se incorpora aquí como referencia.
Tal como se utilizan aquí, las formas singulares "un/una", y "el, la, los, las" incluyen referencias plurales a menos que se indique otra cosa. Por ejemplo, "un" dímero incluye uno o más dímeros.
El término "anormalidad cromosómica" se refiere a una desviación entre la estructura del cromosoma sujeto y un cromosoma homólogo normal. El término "normal" se refiere al cariotipo predominante o patrón de bandas encontrado en individuos saludables de una especie particular. Una anormalidad cromosómica puede ser numérica
o estructural, e incluye pero no se limita a aneuploide, poliploide, inversión, una trisomía, una monosomía, duplicación, eliminación, eliminación de una parte de un cromosoma, adición, adición de una parte de un cromosoma, inserción, un fragmento de un cromosoma, una región de un cromosoma, reordenamiento cromosómico, y translocación. Una anormalidad cromosómica puede estar correlacionada con la presencia de una condición patológica o con una predisposición a desarrollar una condición patológica. Tal como se define aquí, un polimorfismo de nucleótido individual ("SNP") no es una anormalidad cromosómica.
La monosomía X (XO, ausencia de un cromosoma X completo) es el tipo más común del síndrome de Turner, que se presenta en 1 de 2500 hasta 1 a 3000 niñas nacidas vivas (Sybert and McCauley N Engl J Med (2004) 351:12271238). El síndrome XXY es una condición en la cual los sujetos masculinos humanos tienen un cromosoma X extra, existiendo en apenas 1 de cada 1000 sujetos masculinos (Bock, Understanding Klinefelter Syndrome: A Guide for XXY Males and Their Families. NIH Pub. No. 93-3202 (1993)). El síndrome XYY es un aneuploidía de los cromosomas sexuales en los cuales un sujeto masculino humano recibe un cromosoma Y extra, dando un total de 47 cromosomas en vez de los más usuales 46, afectando a 1 de cada 1000 nacimientos masculinos, mientras que potencialmente lleva a infertilidad masculina (Aksglaede, et al., J Clin Endocrinol Metab (2008) 93:169-176).
El síndrome de Turner abarca varias condiciones, de las cuales la monosomía X (XO, ausencia de un cromosoma sexual completo, el cuerpo de Barr) es la más común. Los sujetos femeninos típicos tienen dos cromosomas X, pero en el síndrome de Turner, uno de estos cromosomas sexuales falta. Presentándose en 1 de 2000 a 1 de 5000 sujetos femeninos fenotípicos, el síndrome se manifiesta así mismo de numerosas maneras. El síndrome de Klinefelter es una condición en la cual los sujetos masculinos humanos tienen un cromosoma X extra. En humanos, el síndrome de Klinefelter es el trastorno de cromosomas sexuales más común y la segunda condición más común causada por la presencia de cromosomas extra. La condición existe en apenas 1 de cada 1000 sujetos masculinos. El síndrome XYY es una aneuploidía de los cromosomas sexuales en los cuales un sujeto masculino humano recibe un cromosoma Y extra, dando un total de 47 cromosomas en vez de los más usuales 46. Esto produce un cariotipo XYY 47. Esta condición usualmente es asintomática y afecta a 1 de cada 1000 nacimientos masculinos, mientras que potencialmente lleva a infertilidad masculina.
La trisomía 13 (síndrome de Patau), la trisomía 18 (síndrome de Edward) y la trisomía 21 (síndrome de Down) son las trisomías autosómicas más clínicamente importantes y cómo detectarlas siempre ha sido un tópico candente. La detección de la aberración cromosómica fetal anterior tiene gran significado en el diagnóstico prenatal (Ostler, Diseases of the eye and skin: a color atlas. Lippincott Williams & Wilkins. pp. 72. ISBN 9780781749992 (2004); Driscoll and Gross N Engl J Med (2009) 360: 2556-2562; Kagan, et al., Human Reproduction (2008) 23:1968-1975).
El término " lecturas únicas de referencia" se refiere a fragmentos de un cromosoma que tienen una secuencia única. Por lo tanto, tales fragmentos pueden ser asignados de manera no ambigua a una localización cromosómica
10
15
20
25
30
35
40
45
50
55
E11863253
06-10-2014
individual. Las lecturas únicas de referencia de un cromosoma pueden ser construidas con base en una secuencia genómica de referencia publicada, tal como hg18 o hg19.
Los términos "polinucleótido", "oligonucleótido", "ácido nucleico" y "molécula de ácido nucleico" se utilizan de manera intercambiable aquí para referirse a una forma polimérica de nucleótidos de cualquier longitud, y pueden comprender ribonucleótidos, desoxirribonucleótidos, análogos de los mismos o mezclas de los mismos. Este término se refiere solamente a la estructura primaria de la molécula. Así, el término incluye ácido desoxirribonucleico ("ADN") de cadena triple, doble y sencilla, así como ácido ribonucleico ("ARN") de cadena triple, doble y sencilla. También incluye formas modificadas, por ejemplo por alquilación, y/o por recubrimiento y no modificadas del polinucleótido. Más particularmente, los términos "polinucleótido", "oligonucleótido", "ácido nucleico" y "molécula de ácido nucleico" incluyen polidesoxirribonucleótidos (que contienen 2-desoxi-D-ribosa), polirribonucleótidos (que contienen D-ribosa), incluyendo ARNt, ARNr , ARNh, y ARNm, bien sea divididos o no divididos, y cualquier otro tipo de polinucleótido el cual es un N-o C-glicósido de una base purínica o pirimidínica, y otros polímeros que contienen esqueletos no nucleotídicos, por ejemplo, poliamida (por ejemplo, ácidos nucleicos peptídicos ("APNs")) y polímeros polimorfolino (comercialmente disponibles en Anti-Virals, Inc., Corvallis, OR., como NeuGene®) y otros polímeros de ácidos nucleicos sintéticos específicos para la secuencia considerando que los polímeros contienen nucleobases en una configuración que permite el apareamiento de bases y el apilamiento de bases, tal como se encuentra en el ADN y el ARN. Así, estos términos incluyen, por ejemplo, 3’-desoxi-2’,5’-DNA, oligodesoxiribonucleótido N3’ a P5’ fosforamidatos, ARN sustituido con 2'-O-alquilo, híbridos entre ADN y ARN, o entre APN y ADN o ARN, y también incluyen tipos conocidos de modificaciones, por ejemplo, etiquetas, alquilación, "caperuzas", sustitución de uno o más de los nucleótidos con un análogo, modificaciones de internucleótidos tales como, por ejemplo, aquellas con enlaces no cargados (por ejemplo, metil fosfonatos, fosfotriésteres, fosforamidatos, carbamatos, etc.), con enlaces cargados negativamente (por ejemplo, fosforotioatos, fosforoditioatos, etc.), y con enlaces cargados positivamente (por ejemplo, aminoalquilfosforamidatos, aminoalquilfosfotriésteres), aquellos que contienen unidades estructurales sobrantes, tales como, por ejemplo, proteínas (incluyendo enzimas (por ejemplo, nucleasas), toxinas, anticuerpos, péptidos de señal, poli-L-lisina, etc.), aquellos con intercaladores (por ejemplo, acridina, psoralen, etc.), aquellos que contienen quelatos (de, por ejemplo, metales, metales radioactivos, boro, metales oxidantes, etc.), aquellos que contienen alquiladores, aquellos con enlaces modificados (por ejemplo, ácidos nucleicos alfa anoméricos, etc.), así como formas no modificadas del polinucleótido u oligonucleótido.
"Secuenciación paralela masiva" significa técnicas para secuenciar millones de fragmentos de ácidos nucleicos, por ejemplo, utilizando el enlace de ADN genómico fragmentado aleatoriamente a una superficie plana transparente ópticamente y amplificación en fase sólida para crear una celda de flujo de secuenciación de alta densidad con millones de aglomeraciones, conteniendo cada una ~ 1,000 copias de plantilla por centímetro cuadrado. Estas plantillas son secuenciadas que utilizan la tecnología de secuenciación por síntesis de ADN de cuatro colores. Véanse los productos ofrecidos por Illumina, Inc., San Diego, California. La secuenciación usada actualmente se lleva a cabo preferiblemente sin una preamplificación o etapa de clonación, pero puede ser combinada con métodos basados en amplificación en un chip microfluido que tiene cámaras de reacción para secuenciación tanto por PCR como microscópica con base en plantillas. Solo aproximadamente 30 bp de información de secuencia aleatoria son necesarios para identificar una secuencia como perteneciente a un cromosoma humano específico. Secuencias más largas pueden identificar de manera única objetivos más particulares. En el caso presente, se obtuvo un gran número de lecturas de 35 bp. Se encontrará una descripción adicional de un método de secuenciación en paralelo masivo en Rogers y Ventner, Nature (2005) 437:326-327.
Se entiende que aspectos y realizaciones de la invención descrita aquí incluyen aspectos y realizaciones "consistentes en" y/o "consistentes esencialmente de".
Otros objetivos, ventajas y características de la presente invención serán evidentes a partir de la siguiente especificación tomada en conjunción con los dibujos acompañantes.
II. Establecimiento de una relación entre profundidad de cobertura y contenido de GC
Como se indicó anteriormente, el establecimiento de una relación entre la profundidad de cobertura y el contenido de GC de un cromosoma, comprenderá: obtener información de secuencia de múltiples fragmentos de polinucleótidos que cubren dicho cromosoma a partir de más de una muestra; asignar dichos fragmentos a cromosomas basados en dicha información de secuencia; determinar la profundidad de cobertura y el contenido de GC de dicho cromosoma con base en dicha información de secuencia para cada muestra; y determinar la relación entre la profundidad de cobertura y el contenido de GC de dicho cromosoma.
Para calcular la profundidad de cobertura y el contenido de GC de una localización cromosómica, la información de secuencia de los fragmentos de polinucleótidos se obtiene secuenciando el ADN de plantilla obtenido de una muestra de sangre periférica. En una realización, el ADN de plantilla contiene tanto el ADN materno como el ADN fetal. En otra realización, el ADN de plantilla se obtiene a partir de sangre de un sujeto femenino en embarazo. La sangre puede ser recolectada utilizando cualquier técnica estándar para extracción de sangre incluyendo pero no limitándose a la venipuntura. Por ejemplo, la sangre puede ser extraída de una vena del interior del codo o del dorso de la mano. Las muestras de sangre pueden ser recolectadas de un sujeto femenino en embarazo en cualquier
10
15
20
25
30
35
40
E11863253
06-10-2014
momento durante la gestación del feto. Por ejemplo, las muestras de sangre pueden ser recolectadas de sujetos femeninos humanos a 1-4, 4-8, 8-12, 12-16, 16-20, 20-24, 24-28, 28-32, 32-36, 36-40, o 40-44 semanas de gestación del feto, y preferiblemente entre 8-28 semanas de la gestación del feto.
Los fragmentos de polinucleótidos son asignados a una localización cromosómica basada en la información de secuencia. Se utiliza una secuencia genómica de referencia para obtener las lecturas únicas de referencia. Tal como se utiliza aquí, el término "lecturas únicas de referencia " se refiere a todos los fragmentos de polinucleótidos únicos que han sido asignados a una localización genómica específica con base en una secuencia genómica de referencia. En algunas realizaciones, las lecturas únicas de referencia tienen la misma longitud de, por ejemplo, aproximadamente 10, 12, 15, 20, 25, 30, 35, 40, 50, 100, 200, 300, 500, o 1000 bp. En algunas otras realizaciones, pueden utilizarse construcciones de genoma humano hg18 o hg 19 como secuencia genómica de referencia. Una localización cromosómica puede ser una ventana contigua sobre un cromosoma que tiene una longitud de aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800 , 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000 o más kb. Una localización cromosómica también puede ser un cromosoma individual.
Tal como se utiliza aquí, el término "profundidad de cobertura" se refiere a la relación entre el número de fragmentos que se asigna a una localización cromosómica y el número de lecturas únicas de referencia de la localización cromosómica utilizando la siguiente fórmula:
imagen20
en donde n¡,j es el número de lecturas de secuencia única mapeadas al cromosoma j en la muestra i; Ci,j es la profundidad de cobertura en el cromosoma j en la muestra i; Nj es el número de Lecturas Únicas de Referencia en el cromosoma j.
Los fragmentos de polinucleótidos que no se asignan a una única localización cromosómica individual o se asignan a localizaciones cromosómicas múltiples son descartados. En algunas realizaciones, la profundidad de cobertura es normalizada, con base en la profundidad de cobertura de otra localización cromosómica, otro cromosoma, promedio de todos los otros autosomas, promedio de todos los otros cromosomas, o promedio de todos los cromosomas. En algunas realizaciones, la profundidad de cobertura promedio de 22 autosomas se utiliza como constante de normalización para tener en cuenta las diferencias en el número total de lecturas de secuencia obtenidas para diferentes muestras:
imagen21
en donde cri,j representa la profundidad de cobertura relativa del cromosoma j en la muestra i. Desde este punto en adelante, “profundidad de cobertura relativa" para cada cromosoma se refiere al valor normalizado y se utiliza para comparar diferentes muestras y para análisis subsecuente.
El contenido de GC de una localización cromosómica puede calcularse por el porcentaje de GC promedio de una localización cromosómica con base en las lecturas de referencia únicas en la localización cromosómica, o en los fragmentos de polinucleótido secuenciados que se asignan a la localización del cromosoma. El contenido de GC de un cromosoma puede ser calculado usando la siguiente fórmula:
imagen22
en donde i representa la muestra i, j representa el cromosoma j, NGCi,j representa el número de bases de ADN G y C y BASEi.j representa el número de bases de ADN en el cromosoma j en la muestra i.
Para establecer una relación entre la profundidad de cobertura del contenido de GC de una localización cromosómica, el cálculo puede estar basado en la información de la secuencia de los fragmentos de polinucleótido obtenida a al menos 1, 2, 5, 10, 20, 50, 100, 200, 500 o 1000 muestras.
En algunos casos, la relación entre la profundidad de cobertura y el contenido de GC es una relación lineal no fuerte. Pueden utilizarse el algoritmo de Loess, o una regresión polinómica pesada localmente, para establecer las
5
10
15
20
25
30
35
40
45
50
55
E11863253
06-10-2014
relaciones no lineales (correlaciones) entre pares de valores, tales como entre la profundidad de cobertura y el contenido de GC.
III. Determinación de una anormalidad genética
Como se anotó previamente, un método para determinar una anormalidad genética fetal de acuerdo con la invención, comprende: a) obtener información de secuencia de fragmentos múltiples de polinucleótidos a partir de una muestra de sangre periférica la cual es derivada de un sujeto femenino en embarazo y contiene ADN tanto materno como fetal; b) asignar dichos fragmentos a cromosomas con base en dicha información de secuencia; c) determinar la profundidad de cobertura y el contenido de GC de un cromosoma con base en la información de secuencia para aquellos fragmentos que se asignan únicamente a dicho cromosoma en la etapa (b); d) determinar la profundidad de cobertura ajustada de dicho cromosoma utilizando dicho contenido de GC de dicho cromosoma y relaciones establecidas entre la profundidad de cobertura y el contenido de GC para dicho cromosoma en la ausencia de aneuploidía; y e) comparar dicha profundidad de cobertura ajustada con la profundidad de cobertura de dicho cromosoma determinada en la etapa (c), en donde una diferencia entre ellas indica una anormalidad genética fetal la cual es una aneuploidía cromosómica.
Los métodos de la invención son especialmente útiles para la detección de aneuploidía, poliploidía, monosomía, trisomía, trisomía 21, trisomía 13, trisomía 14, trisomía 15, trisomía 16, trisomía 18, trisomía 22, triploidía, tetraploidía y anormalidades cromosómicas sexuales incluyendo XO, XXY, XYY, y XXX. También se puede focalizar en ciertas regiones dentro del genoma humano de acuerdo con los presentes métodos con el fin de identificar monosomías parciales y trisomías parciales. Por ejemplo, los métodos pueden involucrar el análisis de datos de secuencias en una "ventana" cromosómica deslizante, tal como regiones contiguas, no superpuestas de 50 Kb esparcidas a través de un cromosoma. Se han reportado, entre otras, las trisomías parciales de 13q, 8p (8p23.1), 7q, distal 6p, 5p, 3q (3q25.1), 2q, 1q (1q42.1 y 1q21-qter), Xp parcial y monosomía 4q35.1. Por ejemplo, duplicaciones parciales del brazo largo del cromosoma 18 pueden dar como resultado el síndrome de Edwards en el caso de una duplicación de 18q21.1-qter (Mewar, et al., Am J Hum Genet. (1993) 53:1269-78).
En algunas realizaciones, la fracción fetal se estima con base en la información de secuencia obtenida para los fragmentos de polinucleótido de una muestra. La profundidad de cobertura, y el contenido de GC, de los cromosomas X y Y pueden utilizarse para la estimación de la fracción fetal. En algunas realizaciones, el género del feto se determina con base en la información de secuencia obtenida para los fragmentos de polinucleótido de una muestra. La profundidad de cobertura, y el contenido de GC, de los cromosomas X y Y pueden ser utilizados para determinar el género del feto.
En algunas realizaciones, la comparación de dicha profundidad de cobertura ajustada a dicha profundidad de cobertura del cromosoma se lleva a cabo mediante una prueba de hipótesis estadística, en donde una hipótesis es que el feto es euploide (H0) y la otra hipótesis es que el feto es aneuploide (H1 ). En algunas realizaciones, la estadística t de Student se calcula tanto para la hipótesis t1 como para la t2, respectivamente. En algunas realizaciones, se calcula la relación logarítmica probable de t1 y t2. En algunas realizaciones, una relación logarítmica probable de > 1 indica trisomía del feto.
IV. Medio legible por ordenador y sistema para diagnóstico de una anormalidad genética fetal
En otro aspecto, se provee aquí un medio legible en ordenador que comprende una pluralidad de instrucciones adaptadas para ejecutar un método de la invención para diagnóstico prenatal de una anormalidad genética fetal cuando dichas instrucciones son suplementadas con información de secuencia obtenida como en la etapa (a) del método.
En todavía otro aspecto, como se indicó previamente, también se provee aquí un sistema que comprende medios adaptados para ejecutar un método de la invención. Tal sistema comprende: a) medios para obtener información de secuencia a partir de fragmentos de polinucleótidos adecuados; y b) un medio legible en ordenador como se describió anteriormente.
Será evidente para los experimentados en la técnica que puede usarse un cierto número de métodos de secuenciación y variaciones diferentes. En una realización, la secuenciación se hace utilizando secuenciación en paralelo masiva. La secuenciación en paralelo masiva, tal como el factible sobre la plataforma 454 (Roche) (Margulies, et al., Nature (2005) 437:376-380), Illumina Genome Analyzer (o plataforma Solexa™) o SOLiD System (Applied Biosystems) o la tecnología dla secuenciación Helicos True Single Molecule DNA (Harris, et al., Science (2008) 320:106-109), la tecnología de molécula individual, tiempo real (SMRT™) de Pacific Biosciences y la secuenciación en nanoporo (Soni and Meller, Clin Chem (2007) 53:1996-2001), permiten la secuenciación de muchas moléculas de ácido nucleico aisladas a partir de un espécimen en altos órdenes de multiplexión en una forma paralela (Dear, Brief Funct Genomic Proteomic (2003) 1:397-416). Cada una de estas plataformas secuencia moléculas individuales expandidas por clonación o incluso no amplificadas de fragmentos de ácido nucleico. Los equipos de secuenciación disponibles comercialmente pueden ser utilizados en la obtención de la información de secuencia de los fragmentos de polinucleótidos.
5
10
15
20
25
30
35
40
45
50
55
E11863253
06-10-2014
V. Ejemplos
Los siguientes ejemplos se ofrecen con el fin de ilustrar pero no de limitar la invención.
Ejemplo I. Análisis de factores que afectan la sensibilidad de la detección: sesgo de GC y género
En la Figura 1 se ilustra un marco de procedimiento esquemático para calcular la profundidad de cobertura y el contenido de GC. Hemos utilizado un software para producir las lecturas únicas de referencia haciendo una incisión en las secuencias de referencia hg18 en 1-mer (1-mer aquí es una lectura que es descompuesta artificialmente a partir de la referencia de secuencia humana con la misma longitud "1" con las lecturas de secuenciación de muestras) y recolectamos aquellas 1-mer "únicas" como nuestras lecturas únicas de referencia. En segundo lugar, mapeamos nuestras lecturas de muestra secuenciada a las lecturas únicas de referencia para cada cromosoma. En tercer lugar, eliminamos las que quedaban por fuera aplicando el método de corte quintil atípico para obtener un conjunto de datos claro. Finalmente, contamos la profundidad de cobertura de cada cromosoma para cada muestra y el contenido de GC de las lecturas únicas secuenciadas mapeado en cada cromosoma para cada muestra.
Con el fin de investigar cómo el contenido de GC afecta nuestros datos, escogimos 300 casos euploides con resultado de cariotipo y dispersamos su profundidad de cobertura y el contenido de GC relacionado de las lecturas secuenciadas en una gráfica, la cual mostró una fuerte correlación entre ellos, y este fenómeno no fue reportado previamente (Figura 2). En la Figura 2, la profundidad de cobertura se correlacionaba fuertemente con el contenido de GC, y mostraba una tendencia obviamente hacia abajo en algunos cromosomas tales como 4, 13, etc., mientras que tendía hacia arriba en otros cromosomas tales como 19, 22, etc. Todos los cromosomas fueron dispuestos en orden ascendente en cuanto a su contenido de GC inherente y hay presente una tendencia hacia abajo en los cromosomas del grupo con contenido inferior de GC mientras que hay una tendencia hacia arriba en cromosomas del grupo con contenido mayor de GC como se muestra en la Figura 3. Puede interpretarse que si los fragmentos de polinucleótidos que están siendo secuenciados para una muestra tienen un contenido de GC más alto que la otra muestra, la profundidad de cobertura que representa esta muestra caerá en comparación con la de otra muestra en los cromosomas del grupo con contenido más bajo de GC mientras se eleva en los cromosomas del grupo con contenido más alto de GC.
La posible explicación para tal tendencia cambiante diferente entre cromosomas con diferente contenido de GC es la diferencia en la composición del contenido de GC en diferentes cromosomas mostrada en la Figura 4 en combinación con el sesgo de GC introducido en el proceso de secuenciación. El contenido de GC de cada lectura única de referencia de 35-mer para cada cromosoma se utiliza para clasificar el contenido de GC en 36 niveles. El porcentaje de cada nivel así como la composición en GC de cada cromosoma fueron calculados y luego usados para dibujar el mapa de calor con el software Heatmap2. Tomando el cromosoma 13 como ejemplo, su parte grande consiste de segmentos de secuencia con contenido inferior de GC pero una pequeña parte del mismo consiste de segmentos de secuencia con contenido más alto de GC. Si las condiciones durante el proceso de secuenciación o de PCR favorecen la secuenciación de aquellos segmentos con contenido de GC más alto, entonces una parte relativamente grande del cromosoma 13 con contenido de GC bajo será difícil de ser secuenciada con el resultado de que la profundidad de cobertura en este cromosoma 13 de la muestra se hace más baja. En comparación, en un grupo con contenido más grande de GC tal como el cromosoma 19, la profundidad de cobertura en este cromosoma 19 de la muestra se hace más alto para que una parte grande del cromosoma 19 fuera de contenido de GC más alto la cual es preferida por el secuenciador. No importa en qué cromosoma, los segmentos pobres en GC y ricos en GC fueron difíciles de secuenciar pero la influencia introducida por el sesgo de GC fue diferente en diferentes cromosomas con diferente composición en contenido de GC. Cada cromosoma de referencia fue dividido en porciones basura de 1 KB, y se calculó el contenido de cada lectura de referencia única en la porción basura. Se calcula el contenido de GC de cada porción basura en el intervalo apropiado de [0.3, 0.6] dividido por el tamaño de la etapa de 0.001, y la cobertura relativa en cada intervalo. La Figura 5 muestra la representación gráfica de la cobertura relativa y el contenido de GC para cada cromosoma.
La influencia del género fetal sobre los datos fue analizada utilizando una prueba t de dos muestras independientes. No se encontró una diferencia significativa entre autosomas excepto apenas para los cromosomas sexuales en el mismo contenido de GC, pero hay una diferencia obvia en el porcentaje de UR entre sujetos femeninos y masculinos (Chiu et al., (2008) Proc Natl Acad Sci USA 105:20458-20463), implicando que no hay necesidad de distinguir entre el género fetal cuando se detecta un autosoma aneuploide, pero es necesario distinguir el género fetal primeramente, cuando se detecta un cromosoma aneuploide tal como XO, XYY, etc.
Ejemplo 2. Modelo estadístico
Utilizando este fenómeno discutido anteriormente, tratamos de utilizar polinomios locales para ajustar la relación entre la profundidad de la cobertura y el correspondiente contenido de GC. La profundidad de cobertura consiste de una función de GC y un residual de la distribución normal como sigue:
E11863253
06-10-2014
imagen23
en donde f(GCi,j) representa la función de la relación entre la profundidad de cobertura y el correspondiente contenido de GC de la muestra i, cromosoma j, εi,j representa el residual de la muestra i, cromosoma j.
Hay una relación lineal no fuerte entre la profundidad de cobertura y el correspondiente contenido de GC de tal manera que aplicamos el algoritmo de Loess para ajustar la profundidad de cobertura con el correspondiente contenido de GC, a partir del cual calculamos un valor importante para nuestro modelo, esto es, la profundidad de cobertura ajustada:
imagen24
Con la profundidad de cobertura ajustada, se calcularon la varianza estándar y el t de Student de acuerdo con las 10 siguientes Fórmula 6 y Fórmula 7:
imagen25
Ejemplo 3. Estimación de la fracción fetal
Por la razón de que la fracción fetal es muy importante para nuestra detección estimamos así la fracción fetal antes del procedimiento de prueba. Como hemos mencionado antes, hemos secuenciado 19 adultos masculinos, cuando
15 se comparó su profundidad de cobertura con la de los casos que portaban fetos femeninos, encontrando que la profundidad de cobertura masculina del cromosoma X es casi 1/2 veces la de los femeninos, y la profundidad de cobertura de los masculinos del cromosoma Y es casi 0.5 mayor que la de los femeninos. Así podemos estimar la fracción fetal dependiente de la profundidad de cobertura del cromosoma X y Y como la Fórmula 8, Fórmula 9 y Fórmula 10, considerando la correlación de GC también:
imagen26
en donde
imagen10es la profundidad de cobertura ajustada por la correlación de regresión de la profundidad de cobertura del cromosoma X y el contenido correspondiente de GC de los casos con feto femenino,
imagen27se refiere a la profundidad de cobertura ajustada por la correlación de regresión de la profundidad de cobertura del imagen28
cromosoma Y y el contenido correspondiente de GC de los casos con feto femenino,
se refiere a la 25 profundidad de cobertura ajustada por la correlación de regresión de la profundidad de cobertura del cromosoma X y
el contenido correspondiente de GC de adultos masculinos,
imagen29se refiere a la profundidad de la cobertura ajustada por la correlación de regresión de la profundidad de cobertura del cromosoma Y y el contenido
correspondiente de GC de adultos masculinos. Para la computación simplemente, se da que imagen10
imagen10y
imagen10son iguales
y imagen10, y son iguales.
10
15
20
25
30
35
40
45
E11863253
06-10-2014
Ejemplo 4. Cálculo del residual de cada cromosoma
La Figura 6 muestra que la variación estándar (véase Fórmula 3) para cada cromosoma bajo un cierto número total de lecturas únicas es influenciada por el número de casos participantes de la referencia. La variación estándar escasamente se incrementa cuando el número de casos seleccionados fue más de 150 bajo la condición de que 1.7 millones de número de lecturas únicas totales fueron secuenciadas para cada caso. Sin embargo, la variación estándar fue diferente para diferentes cromosomas. Después de considerar el sesgo de GC, nuestro método tiene una variación estándar moderada para el cromosoma 13 (0.0063), el cromosoma 18 (0.0066) y el cromosoma 21 (0.0072). La variación estándar del cromosoma X es mayor que en los cromosomas antes mencionados los cuales requerirían más estrategias para dar una detección anormal exacta.
La Figura 7 muestra la gráfica Q-Q, en donde el residual es compilado a la distribución normal lo cual implica que el cálculo t de Student es razonable.
Ejemplo 5. Distinción del género fetal
Para descubrir el trastorno del cromosoma sexual, es mejor distinguir el género fetal. Existieron dos picos obvios cuando investigamos la distribución de frecuencia de la profundidad de cobertura del cromosoma Y en nuestros 300 casos, lo cual nos dio una pista para distinguir el género por la profundidad de cobertura del cromosoma Y. Los casos con profundidad de cobertura menor de 0.04 pueden verse como portadores de fetos femeninos, mientras que más de 0.051 son vistos como portadores de fetos masculinos, entre 0.04 y 0.051 son vistos como de género incierto como la Figura 8. Para estos géneros dudosos y casos de aneuploidía, se utilizó la regresión logarítmica para predecir su género como la Fórmula 11 (Fan, et al., Proc Natl Acad Sci USA (2008) 42:16266-16271):
imagen30
en donde cr.ai,x y cr.ai,y son una cobertura relativa normalizada de X y Y, respectivamente.
En comparación con el resultado del cariotipo, nuestro método para la distinción del género fetal funcionó bastante bien en nuestros 300 casos de referencia con 100% de exactitud, mientras que hubo una equivocación en un caso cuando se ejecutó en nuestro conjunto de 901 casos y la profundidad de cobertura del cromosoma Y de este caso erróneo estaba entre 0.04 y 0.051.
Ejemplo 6. Rendimiento diagnóstico de la metodología de prueba t en correlación con GC
Reclutamiento de muestra
Se reclutaron 903 participantes de manera prospectiva del Hospital del Pueblo de Shenzhen y del Materno de Shenzhen y del centro de servicio de cuidado infantil con sus resultados de cariotipos. Las aprobaciones fueron obtenidas de los comités de revisión institucionales de cada sitio de reclutamiento y todos los participantes dieron consentimiento escrito informado. Se registraron las edades de las madres y las semanas de gestación en el momento del muestreo de sangre. Los 903 casos incluyeron 2 casos de trisomía 13, 15 casos de trisomía 18, 16 casos de trisomía 21, 3 casos XO, 2 casos XXY y 1 caso XYY. Su distribución de resultados de cariotipo se muestra en la Figura 9.
Secuenciación de ADN de plasma materno
Se recolectó sangre venosa periférica (5 mililitros) de cada mujer embarazada participante en tubos de EDTA y se centrifugó a 1,600 g durante 10 minutos en 4 horas. El plasma fue transferido a tubos de microcentrífuga y se recentrifugó a 16,000 g durante 10 minutos para retirar células residuales. El plasma libre de células fue almacenado a 80ºC hasta la extracción del ADN. Cada muestra de plasma fue congelada y descongelada sólo una vez.
Para una secuenciación genómica paralela masiva, todo el ADN extraído de 600 µl de plasma materno fue utilizado para la construcción de una biblioteca de ADN de acuerdo con un protocolo modificado de Illumina. En resumen, el reapareamiento en extremos de los fragmentos de ADN de plasma materno fue llevado a cabo utilizando T4 ADN polimerasa, polimerasa Klenow™, y T4 polinucleótido quinasa. Se ligaron adaptadores comercialmente disponibles (Illumina) a los fragmentos de ADN después de la adición de residuos A terminales. El ADN ligado al adaptador fue amplificado adicionalmente utilizando un PCR de 17 ciclos con cebadores multiplex estándar. Se utilizó un kit de 60 ml de Agencourt AMPure™ (Beckman) para la purificación de los productos de PCR. La distribución de tamaño de las bibliotecas de secuenciación fue analizada con un kit de DNA 1000 en el 2100 Bioanalyzer™ (Agilent) y se cuantificó con PCR en tiempo real. Las bibliotecas de secuenciación con diferentes índices fueron reunidas en una
10
15
20
25
30
35
40
E11863253
06-10-2014
sola en cantidades iguales antes de la estación de aglomeración en el Illumina GA II™ (secuenciación de extremo individual)
Se secuenciaron muestras de 19 sujetos masculinos euploides para el análisis subsecuente para la estimación de la fracción de ADN fetal. Una nueva metodología de prueba t de correlación de GC ha sido desarrollada por nosotros para el diagnóstico de trisomía 13, trisomía 18, trisomía 21 y anormalidades del cromosoma sexual. Comparamos este nuevo método con otros dos métodos mencionados más abajo en términos de rendimiento de diagnóstico.
Ejemplo 7. Detección de aneuploidía fetal, tal como trisomía 13, 18 y 21
Para determinar si el número de copias de un cromosoma dentro de un caso de un paciente desviado del normal, la profundidad de cobertura de un cromosoma fue comparada con la de todos los otros casos de referencia. Todo el estudio previo tenía sólo una hipótesis nula. Introdujimos hipótesis binarias por primera vez utilizando una doble hipótesis nula. Una hipótesis nula (H0: el feto es euploide) fue la suposición de que la profundidad de cobertura media de la distribución de caso del paciente y la profundidad de cobertura media de toda la distribución de referencia normal eran iguales, lo que significa que el caso del paciente era euploide si se aceptaba esta hipótesis nula. Utilizando la prueba t de Student, puede calcularse t1 como la Fórmula 12:
imagen31
La otra hipótesis nula (H1: el feto es aneuploide) fue que la profundidad de cobertura media de la distribución del caso del paciente con apenas una fracción fetal era igual a la profundidad de cobertura media de la distribución de casos aneuploides con la misma fracción fetal, lo que significa que este caso del paciente es aneuploide si se aceptara esta hipótesis nula. La estadística t de Student, t2 fue calculada como la Fórmula 13:
imagen32
|t1|>3 y |t2|<3 indicarían un caso aneuploide en la mayoría de las instancias especialmente cuando las distribuciones entre los casos euploides y los casos aneupolides fueron completamente discriminadas, mientras que en otra condición tal como la precisión insuficiente o fracción fetal insuficiente y así sucesivamente, |t1| puede ser menor que 3 pero el feto era anormal. t1 y t2 combinadas pueden ayudarnos a tomar una decisión más exacta, y entonces empleamos la relación de probabilidad Log de t1 y t2 como en la Fórmula 14:
imagen33
en donde Li,j es la relación de probabilidad Log. Si la relación era superior a 1, podríamos inferir que el feto puede tener trisomía.
Pero para casos con fetos femeninos, es difícil para nosotros estimar su fracción fetal de tal forma que es imposible computarla. Sin embargo, podemos dar un valor de referencia (RV) de una fracción del 7% de acuerdo con la distribución empírica de la fracción fetal.
Se investigaron 903 casos, 866 de los cuales portaban fetos euploides dentro de los cuales 300 casos habían sido seleccionados aleatoriamente para desarrollar la metodología t de Student de correlación de GC. Además, participaron de nuestro estudio 2 casos de trisomía 13, 12 de trisomía 18, 16 de trisomía 21, 4 de XO (consistentes de 3 casos XO y 1 caso de quimera 45, xo/46, xx (27:23)), 2 XXY y 1 XYY. Después del alineamiento, obtuvimos una media de 1.7 millones de lecturas alineadas únicas de datos (SD = 306185) por caso sin equivocaciones. Utilizando nuestra recién desarrollada prueba t de Student de correlación de GC, todos los casos T13 (2 de 2) fueron identificados exitosamente, mientras que 901 de los 901 casos sin trisomía 13 fueron clasificados correctamente (Figura 10A). La sensibilidad y especificidad de esta metodología fueron 100% y 100% (Tabla 1).
Para la trisomía 18, 12 de los 12 casos de trisomía 18 y 888 de 891 sin trisomía 18 pudieron ser identificados correctamente (Figura 10A). La sensibilidad y especificidad de esta metodología fue de 100% y 99.66% respectivamente. Para la trisomía 21, 16 de 16 casos de trisomía 21 y 16 de 16 casos sin trisomía 21 también pudieron ser detectados correctamente (Figura 10A). La sensibilidad y especificidad de esta metodología fueron 100% y 100%, respectivamente.
E11863253
06-10-2014
Ejemplo 8. Detección de XO, XXX, XXY, XYY
Más arriba hemos considerado la detección de trisomía para autosomas, trastornos para el cromosoma sexual tales como XO, XXX, XXY y XYY que pueden ser detectados también por nuestro método.
Primeramente, el género fue confirmado por distinción de género. Si se confirmaba que un caso de prueba portaba imagen34
5 feto femenino, fue necesario calcular el valor t de Student t1 t1i,X =
imagen10para detección de XXX o XO, en donde
y
imagen10son las mismas que en la Fórmula 10; si t1 es mayor que 3.13 o menor que -3.13, este caso puede ser XXX o XO. Pero considerando que la precisión estaba limitada por la gran desviación de profundidad de cobertura para el cromosoma X, muestreamos el plasma de nuevo y se repitió el experimento para hacer una decisión más creíble cuando |t1|<5 incluso aunque |t1|>3.13. |t1|>5 fue confirmado como aneuploide en este caso.
10 Todos nuestros procesos de detección se basaron en la premisa de que los datos satisfacían el control de calidad estándar.
Si se confirmó que la muestra de prueba portaba feto masculino, la fracción de ADN fetal fue estimada primero por Y y X. Entre tanto, pudimos extrapolar la profundidad de cobertura ajustada para el cromosoma X con la fracción de ADN fetal estimada solamente por la profundidad de la cobertura del cromosoma Y y puede calcularse t2.
. Si t2 es demasiado grande (mayor de 5) o demasiado pequeño (menor de -5) el feto puede ser XXy o XYY. Además, la brecha entre las fracciones fetales estimadas por X y Y independientemente proveerá información para detectar trastornos acerca de los cromosomas sexuales.
En la detección de XO, se detectaron 3 de cada 4 casos de XO, y el caso que no pudo ser identificado fue un caso de quimera (Figura 10B). La sensibilidad y especificidad para esta metodología fueron de 75% (100% si se descarta
20 el caso de la quimera) y 99.55% respectivamente. Para casos XXY, los dos 2 casos fueron identificados exitosamente, mientras que 901 de 901 casos que no eran XXY fueron clasificados correctamente (Figura 10B) con la sensibilidad de 100% y especificidad de 100%. Para el caso XYY, lo identificamos correctamente (Figura 10B) y la sensibilidad y especificidad fueron de 100% y 100% respectivamente.
Para evaluar si nuestra nueva metodología tenía ventajas en comparación con otras dos metodologías reportadas,
25 marcador z y marcador z con corrección de GC, implementamos todas estas tres metodologías para analizar nuestros 900 casos y los mismos 300 casos como referencia fijados para todas estas metodologías. La precisión de la medición siempre estuvo incorporada en el valor de confianza (CV). En nuestra investigación, el CV de la metodología estándar de marcador z es mayor que las otras metodologías en cromosomas 18 y 21 interesantes clínicamente (Figura 11) llevando a una rata de sensibilidad menor para trisomía 18 y 21 (Tabla 1).
30 Tabla 1 Comparación de sensibilidad y especificidad de diferentes métodos
imagen35
Diagnóstico (# de casos)
Metodología de marcador z estándar Metodología de marcador z con corrección de GC Nuestra metodología con prueba t de correlación de GC
Sensibilidad (%)
Especificidad (%) Sensibilidad (%) Especificidad (%) Sensibilidad (%) Especificidad (%)
Autosoma
Trisomía 13 (2) 50% 99.89 100% 100% 100% 100%
Trisomía 18 (12)
91.67% 100% 100% 99.89% 100% 99.96%
Trisomía 21 (16)
93.75% 100% 100% 100% 100% 100%
Heterosoma
XO (3 XO, 1 XO/XX quimera) no disponible no disponible no disponible no disponible 75% 100%
XXY (1)
no disponible no disponible no disponible no disponible 100% 100%
XXY (2)
no disponible no disponible no disponible no disponible 100% 100%
Hipótesis binaria
no disponible no disponible disponible
5
10
15
20
25
30
35
40
45
50
55
E11863253
06-10-2014
Para la metodología de marcador z con corrección de GC, el valor CV de cromosoma 13 es 0.0066 con una rata de sensibilidad de 100% y una rata de especificidad de 100%. Para la novedosa metodología t de Student de correlación de GC discutida aquí, el valor de CV del cromosoma 13 es 0.0063 y con 100% de rata de sensibilidad y 100% de rata de especificidad. En el cromosoma 18, los CV de estas dos metodologías fueron 0.0062 y 0.0066, respectivamente, ambos con ratas de sensibilidad y especificidad de 100% que para ellos fueron 99.89% y 99.96%, respectivamente. El comportamiento fue similar al comparar los CV de estas dos metodologías para el cromosoma
21: 0.0088 y 0.0072, respectivamente. Ambos dieron como resultado la misma rata de sensibilidad de 100% en nuestro estudio de conjunto de casos pequeños y alcanzó la misma rata de especificidad de 100%. Y estos dos métodos se comportaron mejor que la metodología estándar de marcador z. No solamente nuestra nueva metodología fue desarrollada con correlación de GC comparable con la metodología de corrección de GC con buen rendimiento, sino que también tenía otra ventaja en la detección de anormalidades del cromosoma sexual tales como XO, XXY y XYY. Nuestros datos muestran que cuando se emplea una metodología de corrección de GC habría dificultad en distinguir el género de los fetos por desviación de los datos que representan los cromosomas sexuales introducidos cuando se enmienda el número de etiquetas de secuencia multiplicándolas por el factor de peso de tal forma que la detección del trastorno de los cromosomas sexuales parecería difícil.
Ejemplo 9. Comportamiento teórico de la metodología de prueba t con correlación de GC en consideración del tamaño de datos, semanas de gestación y fracción de ADN fetal
Medir la aneuploidía sigue siendo un reto por la alta señal de fondo del ADN materno (Fan, et al., Proc Natl Acad Sci USA (2008) 42:16266-16271) y la fracción de ADN fetal pequeña arbitraria fue el factor restrictivo más significativo para la detección aneupolide por la metodología de secuenciación de genoma paralelo masiva (MPGS) hasta hoy en día. Sin embargo, no hubo una gran complicación en la determinación de la fracción de ADN fetal mínima clínicamente antes de la detección de MPGS especialmente para fetos femeninos mientras que la única pista clínica relacionada con la implicación de la fracción del ADN fetal era las semanas de gestación. Se reporta que hay una correlación estadísticamente significativa entre la fracción de ADN fetal y la edad gestacional previamente (Lo, et al., Am. J. Human Genet. (1998) 62:768-775). En nuestro estudio, para investigar la relación entre la fracción de ADN fetal estimada y la edad gestacional, representamos gráficamente en la Figura 12 la fracción de ADN fetal de todos aquellos casos participantes con fetos masculinos (en total 427 casos) con referencia a la Fórmula de estimación 10. La fracción de ADN fetal estimada para cada muestra se correlaciona con la edad gestacional (P menor de 0.0001). También mostró que aunque en la edad gestacional 20, hubo 4 de 65 casos con fracción de ADN fetal menor de 5%, lo cual afectaría adversamente la exactitud de la detección. Para evaluar el método de estimación de la fracción fetal seleccionamos más casos distribuidos jerárquicamente en fracción fetal estimada, y luego la Q-PCR ayudó a calcular otra fracción fetal relativa. Obtuvimos entonces una curva estándar de correlación que mostraba una fuerte correlación entre ellas lo cual demostró que la estimación de la fracción fetal por nuestro método es creíble.
Entre tanto, la profundidad de secuenciación (el número total de lecturas únicas) fue otro factor significativo que afectó la precisión de la detección aneuploide incorporándolos en el valor de la variación estándar. La variación estándar para cada cromosoma empleado en nuestra metodología correlacionada con GC pudo ser fijado bajo un cierto nivel de profundidad de secuenciación cuando el número de caso de referencia alcanzó 150 (Figura 13). Para investigar cómo la profundidad de secuenciación influye en la variación estándar para cada cromosoma, secuenciamos 150 casos no solamente en nuestro nivel de 1.7 millones sino en otro nivel de profundidad de secuenciación alcanzando el número de lecturas únicas totales 5 millones (SD = 1.7 millones). Dependiendo de estos dos conjuntos, encontramos que la varianza estándar es lineal con el recíproco de la raíz cuadrada del número de lecturas únicas totales (véase descripción de la Figura 6).
Para una fracción de ADN fetal dada, pudimos estimar el número de lecturas únicas totales requeridas en nuestro método para detectar la variación del número de copias de cromosoma a partir de normal a t1 igual 3 (Figura 14). Mostró que cuanto menor era la fracción de ADN fetal, mayor era la profundidad de secuenciación requerida. En nuestro conjunto de 1.7 millones de lecturas únicas, nuestra metodología es capaz de detectar fetos aneuploides para el cromosoma 13 y X con una fracción de ADN fetal de más de 4.5% y fetos aneuploides para el cromosoma 21 y 18 de más de 4%; mientras que en nuestro conjunto de referencia de 5 millones, nuestra metodología fue capaz de detectar trisomía 18 y trisomía 21 incluso con una fracción de ADN fetal de aproximadamente 3%. Si queremos identificar fetos anormales en cromosoma X tales como XXX o XO con una fracción fetal de aproximadamente 4%, el número único total requerido en esos casos y en casos de referencia correspondientes debería alcanzar 5 millones. Si el ADN fetal es menor de 3.5%, el requerimiento de profundidad de secuenciación estaría más allá de 20M. Y si la fracción fetal de ADN fuera inferior la detección sería no creíble y difícil, de manera que propusimos otra estrategia, esto es, deberíamos remuestrear el plasma de la mujer embarazada, rehacer nuestro experimento y reanalizar los datos cuando la edad gestacional fuese mayor sobre la gran probabilidad de que la fracción de ADN fetal se incrementaría con el incremento de la edad gestacional. Y esta estrategia también podría ser aplicada a muestras de las que se sospecha que tienen una fracción de ADN fetal pequeña.
5
10
15
20
25
30
35
40
45
imagen36
E11863253
06-10-2014
Si bien nuestra metodología se comporta bien no es persuasiva sin un gran conjunto de casos anormales. Para estimar la sensibilidad de esta metodología de t Student con correlación de GC aplicada por nosotros, publicamos la sensibilidad teórica considerando diferentes edades gestacionales y diferentes profundidades de secuenciación.
Calculamos la sensibilidad teórica de la aneuploidía con las siguientes etapas. Primeramente, aplicamos un análisis imagen10
de regresión para ajustar la fracción de ADN fetal con la edad gestacional imagen10, donde
es la media de ajuste de la fracción de ADN fetal en su edad gestacional gsai, y estimamos la distribución de fracción de ADN fetal empleando una estimación de densidad de núcleo Gaussiano (Birke, (2008) Journal of Statistical Planning and Inference 139:2851-2862) con referencia principalmente a la fracción de ADN fetal estimada distribuida en las semanas gestacionales 19 y 20 antes de extrapolar la distribución de fracción de ADN fetal en las otras semanas de acuerdo con la relación entre la fracción de ADN fetal y la edad gestacional
es la densidad de probabilidad de ajuste de la fracción de ADN fetal en la edad gestacional, donde X es los datos de las semanas gestacionales 19 y 20 (figura 12). En segundo lugar, estimamos la varianza estándar de acuerdo con el número de lecturas únicas totales como lo imagen10
mencionamos antes
donde tuqn es el número de lecturas únicas totales. Finalmente, para calcular la sensibilidad en cada edad gestacional a un cierto nivel de profundidad de secuenciación de acuerdo con la distribución de la fracción de ADN fetal y la varianza estándar estimada en cada profundidad de secuenciación, computamos la densidad de probabilidad de negativos falsos en cada fracción de ADN fetal (aquí, supusimos que la fluctuación de la fracción de ADN fetal se distribuía normalmente) y luego las integramos para obtener una rata
donde j es el cromosoma j. Con facilidad, la sensibilidad teórica en una cierta profundidad de secuenciación en esta edad gestacional se calcula como 1-FNR. Las figuras 15-21 muestran las gráficas resultantes de nuestros cálculos. La t de Student mayor de 3 se fijó para identificar fetos femeninos aneuploides mientras que para fetos masculinos, cuando se computa la densidad de probabilidad de negativos falsos en cada fracción, se empleó una probabilidad logarítmica mayor que 1 como el valor crítico que mencionamos en la hipótesis binaria que ayudaba a alcanzar una sensibilidad más alta en comparación con los femeninos.
Sin embargo, nuestra inferencia es relativamente conservadora por la razón de que es difícil obtener una distribución infinitamente aproximada a la distribución real de la fracción de ADN fetal junto con la edad gestacional especialmente en una edad gestacional corta en un muestreo a escala pequeña.
Referencias
1.
Virginia P. Sybert, Elizabeth McCauley (2004). Turner’s Syndrome., N Engl J Med (2004) 351:1227-1238.
2.
Robert Bock (1993). Understanding Klinefelter Syndrome: A Guide for XXY Males and Their Families. NIH Pub.
No. 93-3202 August 1993 3. Aksglaede, Lise; Skakkebaek, Niels E.; Juul, Anders (January 2008). "Abnormal sex chromosome constitution and longitudinal growth: serum levels of insulin-like growth factor (IGF)-I, IGF binding protein-3, luteinizing hormone, and testosterone in 109 males with 47,XXY, 47,XYY, or sex-determining region of the Y chromosome (SRY)-positive 46,XX karyotypes". J Clin Endocrinol Metab 93 (1): 169-176. doi:10.1210/jc.2007-1426.PMID 17940117.
4.
H. Bruce Ostler (2004). Diseases of the eye and skin: a color atlas. Lippincott Williams & Wilkins. pp. 72. ISBN 9780781749992.
5.
Driscoll DA, Gross S (2009) Clinical practice. Prenatal screening for aneuploidy. N Engl J Med 360: 2556-2562.
6.
Karl O.Kagan, Dave Wright, Catalina Valencia etc (2008). Screening for trisomies 21, 18 and 13 by maternal age, fetal nuchal translucency, fetal heart rate, free b-hCG and pregnancy-associated plasma protein-A. Human Reproduction Vol.23, No.9 pp. 1968-1975, 2008 doi:10.1093/humrep/den224
7.
Malone FD, et al. (2005) First-trimester or second-trimester screening, or both, for Down’s syndrome. N Engl J Med 353:2001-2011.
8.
Fan HC, Quake SR (2010) Sensitivity of Noninvasive Prenatal Detection of Fetal Aneuploidy from Maternal Plasma Using Shotgun Sequencing Is Limited Only by Counting Statistics. PLoS ONE 5(5): e10439. doi:10.1371/journal.pone.0010439.
imagen37
E11863253
06-10-2014
9.
Chiu RW, Chan KC, Gao Y, Lau VY, Zheng W, et al. (2008) Noninvasive prenatal diagnosis of fetal chromosomal aneuploidy by massively parallel genomic sequencing of DNA in maternal plasma. Proc Natl Acad Sci USA 105: 20458-20463.
10.
McCullagh, P. and Nelder, J.A. (1989), Generalized Linear Models, London, UK: Chapman & Hall/CRC.
5 11. Fan HC, Blumenfeld YJ, et al. (2008) Noninvasive diagnosis of fetal aneuploidy by shotgun sequencing DNA from maternal blood. Proc Natl Acad Sci USA 42:16266-16271.
12. Melanie Birke. (2008) Shape constrained kernel density estimation. Journal of Statistical Planning and Inference Volume 139, Issue 8, 1 August 2009, Pages 2851-2862.
13. Lo et al., Lancet 350:485 487 (1997). 10 14. Lo et al., Am. J. hum. Genet. 62:768-775 (1998).
15.
Pertl and Bianchi, Obstetrics and Gynecology 98:483-490 (2001).
16.
Rogers and Ventner, "Genomics: Massively parallel sequencing," Nature, 437, 326-327 (15 Sep. 2005).
17.
Mewar et al., "Clinical and molecular evaluation of four patients with partial duplications of the long arm of chromosome 18," Am J Hum Genet. 1993 December; 53(6):1269-78.
15 18. Margulies et al., (2005) Nature 437:376-380.
19.
Harris et al., (2008) Science, 320:106-109.
20.
Soni and Meller, (2007) Clin Chem 53:1996-2001.
21.
Dear, (2003) Brief Funct Genomic Proteomic 1:397-416.

Claims (13)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    E11863253
    06-10-2014
    REIVINDICACIONES
    1. Un método implementado por ordenador para determinar una anormalidad genética fetal la cual es una aneuploidía cromosómica, método que comprende:
    (a)
    obtener la información de secuencia de múltiples fragmentos de polinucleótidos a partir de una muestra, siendo dicha muestra una muestra de sangre periférica derivada de un sujeto femenino en embarazo y que contiene ADN tanto materno como fetal;
    (b)
    asignar dichos fragmentos a cromosomas con base en dicha información de secuencia comparando dichos fragmentos con las lecturas únicas de referencia del mismo tamaño para cada uno de dichos cromosomas, en donde las lecturas únicas de referencia son fragmentos de un cromosoma que tiene una secuencia única la cual puede ser asignada de manera no ambigua a una única localización cromosómica individual con base en una secuencia genómica de referencia;
    (c)
    determinar la profundidad de cobertura y el contenido de GC de un cromosoma con base en la información de secuencia para aquellos fragmentos que han sido asignados a las lecturas únicas de referencia de dicho cromosoma en la etapa (b), en donde la profundidad de cobertura es la relación entre el número de fragmentos asignados de manera única a dicho cromosoma y el número de lecturas únicas de referencia para dicho cromosoma del mismo tamaño del fragmento con base en dicha secuencia genómica humana de referencia;
    (d)
    determinar la profundidad de cobertura ajustada de dicho cromosoma utilizando dicho contenido de GC de dicho cromosoma y la relación establecida entre la profundidad de cobertura y el contenido de GC para dicho cromosoma en la ausencia de aneuploidía, en donde dicha relación establecida ha sido determinada por un método que comprende las etapas de:
    (i)
    obtener información de secuencia de múltiples fragmentos de polinucleótidos que cubren dicho cromosoma a partir de una pluralidad de muestras de sangre periférica euploide que contienen ADN genómico, en donde el tamaño del fragmento es el mismo que el tamaño del fragmento de los fragmentos de polinucleótido múltiples de la etapa (a) anterior;
    (ii)
    asignar dichos fragmentos a cromosomas con base en dicha información de secuencia como en la etapa (b) más arriba;
    (iii) determinar la profundidad de cobertura y el contenido de GC de dicho cromosoma con base en dicha información de secuencia para cada muestra euploide como en la etapa (c) más arriba; y
    (iv)
    utilizar la profundidad de cobertura y el contenido de GC determinados para cada muestra en la etapa (iii) para determinar la relación entre la profundidad de cobertura y el contenido de GC de dicho cromosoma en la ausencia de aneuploidía; y
    (e)
    comparar dicha profundidad de cobertura ajustada con la profundidad de cobertura de dicho cromosoma determinada en la etapa (c), en donde una diferencia entre ellos indica aneuploidía cromosómica fetal.
  2. 2.
    El método de la reivindicación 1, en donde la etapa (a) comprende adicionalmente obtener información de secuencia de múltiples fragmentos de polinucleótidos a partir de muestras diferentes y la profundidad de cobertura es normalizada para tener en cuenta las diferencias en el número total de lecturas de secuencia obtenidas para diferentes muestras, por ejemplo contra la profundidad de cobertura promedio de otro cromosoma, preferiblemente contra la profundidad de cobertura promedio de todos los otros autosomas o contra la profundidad de cobertura promedio de todos los otros cromosomas.
  3. 3.
    El método de acuerdo con la reivindicación 1 o reivindicación 2, en donde el contenido de GC del cromosoma se determina como el contenido de GC promedio de todos los fragmentos que se asignan a dicho cromosoma para el propósito de la etapa (c).
  4. 4.
    El método de acuerdo con la reivindicación 2 que comprende adicionalmente determinar el género fetal, por ejemplo de acuerdo con la fórmula
    imagen1
    20
    5
    10
    15
    20
    25
    30
    35
    E11863253
    06-10-2014
    donde cr.a.i,x y cr.ai,y son la profundidad de cobertura relativa de los cromosomas X y Y de la muestra i, respectivamente.
  5. 5. El método de acuerdo con la reivindicación 2 que comprende adicionalmente estimar la fracción fetal, en donde la fracción fetal es calculada con base en la profundidad de la cobertura del cromosoma X y/o Y determinada como en la etapa (c) de la reivindicación 1 de acuerdo con una fórmula seleccionada de:
    imagen2
    donde cri,Y es la profundidad de cobertura del cromosoma Y de la muestra i,
    imagen3es la profundidad de cobertura ajustada calculada a partir de la relación de la profundidad de la cobertura del cromosoma Y y el contenido
    correspondiente de GC de las muestras de mujeres en embarazo con un feto femenino, y
    imagen4se refiere a la profundidad de la cobertura ajustada calculada a partir de la relación de la profundidad de la cobertura del cromosoma Y y el contenido correspondiente de GC de sujetos masculinos; o
    imagen5
    en donde cri,X es la profundidad de cobertura del cromosoma X de la muestra i,
    imagen6es la profundidad de la cobertura ajustada calculada a partir de la relación de la profundidad de cobertura del cromosoma X y el contenido imagen7
    correspondiente de GC de las muestras de mujeres embarazadas con un feto femenino,
    se refiere a la profundidad de la cobertura ajustada calculada a partir de la relación de la profundidad de cobertura del cromosoma X y el contenido correspondiente de GC de muestras de sujetos masculinos; o
    imagen8
    en donde
    imagen9es la profundidad de la cobertura ajustada calculada a partir de la relación de la profundidad de cobertura del cromosoma X y el contenido correspondiente de GC de muestras de mujeres embarazadas con un imagen10
    feto femenino,
    se refiere a la profundidad de la cobertura ajustada calculada a partir de la relación de la profundidad de la cobertura del cromosoma Y y el contenido correspondiente de GC de muestras de mujeres
    embarazadas con un feto femenino,
    imagen11se refiere a la profundidad de la cobertura ajustada calculada a partir de la relación de la profundidad de cobertura del cromosoma X y el contenido correspondiente de GC de imagen12
    muestras de sujetos masculinos, y
    se refiere a la profundidad de cobertura ajustada calculada a partir de la relación de la profundidad de cobertura del cromosoma Y y el contenido correspondiente de GC de sujetos masculinos.
  6. 6.
    El método de acuerdo con la reivindicación 2, en donde la comparación de dicha profundidad de cobertura ajustada con la profundidad de cobertura del cromosoma determinada en la etapa (c) se lleva a cabo mediante una prueba de hipótesis estadística, en donde una hipótesis es que el feto es euploide (H0) y la otra hipótesis es que el feto exhibe aneuploidía para dicho cromosoma (H1).
  7. 7.
    El método de la reivindicación 6, en donde la estadística t de Student se calcula para ambas hipótesis.
  8. 8.
    El método de la reivindicación 7, en donde la estadística t de Student se calcula para H0 y H1 de acuerdo con las fórmulas
    imagen13
    y
    21
    E11863253
    06-10-2014
    imagen14
    respectivamente, en donde fxy es la fracción fetal, i es el índice de muestra, j es el número de cromosomas,
    imagen15
    en donde f(GCi,j) representa la función para la relación entre la profundidad de cobertura normalizada y el contenido correspondiente de GC de la muestra i, cromosoma j, εi,j representa el residual de la muestra i, cromosoma j,
    imagen16
    y representa la profundidad de cobertura ajustada, y 10 stdj es la variación estándar de acuerdo con la fórmula
    imagen17
    en donde ns representa el número de muestras de referencia.
  9. 9. El método de la reivindicación 8, en donde la relación de probabilidad logarítmica de t1 y t2 se calcula de acuerdo con la fórmula: Li,j = log(p(t1i,j, grado |D))/log(p(t2i,j, grado|T)), en donde Li,j es la relación de probabilidad logarítmica,
    15 en donde grado se refiere a un grado de distribución t, D se refiere a Diploidía, T se refiere a Trisomía, y p(t1i,j, grado |*),*=D, T representa la densidad de probabilidad condicional dada a un grado de distribución t, si la relación es más grande que 1 infiriéndose que el feto exhibe trisomía para dicho cromosoma.
  10. 10. El método de acuerdo con una cualquiera de las reivindicaciones 1 a 9 para uso en la determinación de aneuploidía en autosoma fetal.
    20 11. El método de la reivindicación 10, en donde la aneuploidía fetal se selecciona del grupo consistente de trisomía 13, 18y 21.
  11. 12.
    El método de acuerdo con la reivindicación 4 para uso en la determinación de aneuploidía de cromosoma sexual, tal como aneuploidía de cromosoma sexual seleccionada del grupo consistente de XO, XXX, XXY y XYY.
  12. 13.
    Un medio legible por ordenador que comprende una pluralidad de instrucciones adaptadas para ejecutar el
    25 método de una cualquiera de las reivindicaciones 1 a 12 cuando dichas instrucciones son suplementadas con información de secuencia obtenida como en la etapa (a) de la reivindicación 1.
  13. 14. Un sistema que comprende medios adaptados para ejecutar el método de una cualquiera de las reivindicaciones 1 a 12.
    22
ES11863253.8T 2011-06-29 2011-06-29 Detección no invasiva de anormalidades genéticas fetales Active ES2512448T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/001070 WO2013000100A1 (en) 2011-06-29 2011-06-29 Noninvasive detection of fetal genetic abnormality

Publications (1)

Publication Number Publication Date
ES2512448T3 true ES2512448T3 (es) 2014-10-24

Family

ID=47392194

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11863253.8T Active ES2512448T3 (es) 2011-06-29 2011-06-29 Detección no invasiva de anormalidades genéticas fetales

Country Status (17)

Country Link
US (1) US9547748B2 (es)
EP (1) EP2561103B1 (es)
JP (1) JP5659319B2 (es)
KR (1) KR101489568B1 (es)
CN (1) CN103403183B (es)
AU (1) AU2012261664B2 (es)
BR (1) BR112012033760B1 (es)
CA (2) CA2791118C (es)
DK (1) DK2561103T3 (es)
ES (1) ES2512448T3 (es)
MY (1) MY172864A (es)
PL (1) PL2561103T3 (es)
RU (1) RU2589681C2 (es)
SG (1) SG191757A1 (es)
SI (1) SI2561103T1 (es)
WO (1) WO2013000100A1 (es)
ZA (1) ZA201209583B (es)

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11270781B2 (en) 2011-01-25 2022-03-08 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
US20140235474A1 (en) 2011-06-24 2014-08-21 Sequenom, Inc. Methods and processes for non invasive assessment of a genetic variation
PL2561103T3 (pl) 2011-06-29 2015-02-27 Bgi Diagnosis Co Ltd Nieinwazyjna detekcja anomalii genetycznych płodu
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10196681B2 (en) 2011-10-06 2019-02-05 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2013052907A2 (en) 2011-10-06 2013-04-11 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10424394B2 (en) 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9984198B2 (en) 2011-10-06 2018-05-29 Sequenom, Inc. Reducing sequence read count error in assessment of complex genetic variations
CA2861856C (en) 2012-01-20 2020-06-02 Sequenom, Inc. Diagnostic processes that factor experimental conditions
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10497461B2 (en) 2012-06-22 2019-12-03 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10482994B2 (en) 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20130309666A1 (en) 2013-01-25 2013-11-21 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10844424B2 (en) 2013-02-20 2020-11-24 Bionano Genomics, Inc. Reduction of bias in genomic coverage measurements
WO2015130696A1 (en) * 2014-02-25 2015-09-03 Bionano Genomics, Inc. Reduction of bias in genomic coverage measurements
CN105229168B (zh) 2013-02-20 2020-07-17 生物纳米基因有限公司 纳米流体中分子的表征
KR101614471B1 (ko) 2013-02-28 2016-04-21 주식회사 테라젠이텍스 유전체 서열분석을 이용한 태아 염색체 이수성의 진단 방법 및 장치
US10930368B2 (en) 2013-04-03 2021-02-23 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
KR102665592B1 (ko) * 2013-05-24 2024-05-21 시쿼넘, 인코포레이티드 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
WO2014200579A1 (en) * 2013-06-13 2014-12-18 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
ES3037160T3 (en) * 2013-06-21 2025-09-29 Sequenom Inc Methods and processes for non-invasive assessment of genetic variations
KR102384620B1 (ko) 2013-10-04 2022-04-11 시쿼넘, 인코포레이티드 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
CN105874082B (zh) 2013-10-07 2020-06-02 塞昆纳姆股份有限公司 用于非侵入性评估染色体改变的方法和过程
CN105830077B (zh) * 2013-10-21 2019-07-09 维里纳塔健康公司 用于在确定拷贝数变异中改善检测的灵敏度的方法
CN103525939B (zh) * 2013-10-28 2015-12-02 博奥生物集团有限公司 无创检测胎儿染色体非整倍体的方法和系统
EP3690061B1 (en) 2014-05-30 2025-01-01 Verinata Health, Inc. Detecting, optionally fetal, sub-chromosomal aneuploidies and copy number variations
CN104156631B (zh) * 2014-07-14 2017-07-18 天津华大基因科技有限公司 染色体三倍体检验方法
WO2016010401A1 (ko) * 2014-07-18 2016-01-21 에스케이텔레콘 주식회사 산모의 혈청 dna를 이용한 태아의 단일유전자 유전변이의 예측방법
US11783911B2 (en) 2014-07-30 2023-10-10 Sequenom, Inc Methods and processes for non-invasive assessment of genetic variations
CN106795551B (zh) * 2014-09-26 2020-11-20 深圳华大基因股份有限公司 单细胞染色体的cnv分析方法和检测装置
EP3502273B1 (en) 2014-12-12 2020-07-08 Verinata Health, Inc. Cell-free dna fragment
CN104789466B (zh) * 2015-05-06 2018-03-13 安诺优达基因科技(北京)有限公司 检测染色体非整倍性的试剂盒和装置
BE1022789B1 (nl) 2015-07-17 2016-09-06 Multiplicom Nv Werkwijze en systeem voor geslachtsinschatting van een foetus van een zwangere vrouw
KR101817785B1 (ko) * 2015-08-06 2018-01-11 이원다이애그노믹스(주) 다양한 플랫폼에서 태아의 성별과 성염색체 이상을 구분할 수 있는 새로운 방법
KR101678962B1 (ko) 2015-08-21 2016-12-06 이승재 대규모 병렬형 게놈서열분석 방법을 이용한 비침습적 산전검사 장치 및 방법
WO2017051996A1 (ko) * 2015-09-24 2017-03-30 에스케이텔레콤 주식회사 비침습적 태아 염색체 이수성 판별 방법
CN105354443A (zh) * 2015-12-14 2016-02-24 孔祥军 无创产前基因检测分析软件
CN105483229B (zh) * 2015-12-21 2018-10-16 广东腾飞基因科技股份有限公司 一种检测胎儿染色体非整倍体的方法及系统
KR101817180B1 (ko) * 2016-01-20 2018-01-10 이원다이애그노믹스(주) 염색체 이상 판단 방법
US10095831B2 (en) 2016-02-03 2018-10-09 Verinata Health, Inc. Using cell-free DNA fragment size to determine copy number variations
US12071669B2 (en) * 2016-02-12 2024-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for detection of abnormal karyotypes
CN106096330B (zh) * 2016-05-31 2019-02-01 北京百迈客医学检验所有限公司 一种无创产前生物信息检测分析方法
JP6785068B2 (ja) * 2016-05-31 2020-11-18 富士フイルム株式会社 生物情報解析方法
CA3030890A1 (en) 2016-07-27 2018-02-01 Sequenom, Inc. Genetic copy number alteration classifications
WO2018137141A1 (zh) 2017-01-24 2018-08-02 深圳华大基因研究院 基于外泌体dna进行无创产前诊断的方法及其应用
CA3207879A1 (en) 2017-01-24 2018-08-02 Sequenom, Inc. Methods and processes for assessment of genetic variations
JP7370862B2 (ja) 2017-03-17 2023-10-30 セクエノム, インコーポレイテッド 遺伝子モザイク症のための方法およびプロセス
AU2018244815A1 (en) * 2017-03-31 2019-10-31 Premaitha Limited Method of detecting a fetal chromosomal abnormality
US11342047B2 (en) 2017-04-21 2022-05-24 Illumina, Inc. Using cell-free DNA fragment size to detect tumor-associated variant
EP4650456A3 (en) 2018-01-05 2026-01-21 BillionToOne, Inc. Quality control templates for ensuring validity of sequencing-based assays
CN111868254A (zh) * 2018-04-09 2020-10-30 深圳华大生命科学研究院 基因文库的构建方法及其应用
WO2019205132A1 (zh) * 2018-04-28 2019-10-31 深圳华大生命科学研究院 一种胎儿游离核酸的富集方法及其应用
CN111373054B (zh) * 2018-05-31 2024-06-25 深圳华大临床检验中心 确定男性待测样本是否存在三倍体的方法、系统和计算机可读介质
CN109192243B (zh) * 2018-08-13 2021-03-12 成都凡迪医学检验所有限公司 染色体比例的修正方法、装置、介质
US20210280270A1 (en) * 2018-09-07 2021-09-09 Illumina, Inc. Method to determine if a circulating fetal cell isolated from a pregnant mother is from either the current or a historical pregnancy
KR20200106643A (ko) 2019-03-05 2020-09-15 (주)인실리코젠 바코드 서열 정보 기반 고민감도 유전변이 탐지 및 레포팅 시스템
WO2020226528A1 (ru) * 2019-05-08 2020-11-12 Общество с ограниченной ответственностью "ГЕНОТЕК ИТ" Способ определения кариотипа плода беременной женщины
CN110211654A (zh) * 2019-05-30 2019-09-06 湖南自兴智慧医疗科技有限公司 一种自动隐藏性别信息的核型检测系统及方法
CN111627498B (zh) * 2020-05-21 2022-10-04 北京吉因加医学检验实验室有限公司 一种测序数据gc偏向性校正的方法及其装置
RU2752783C1 (ru) * 2020-12-18 2021-08-03 Федеральное государственное бюджетное учреждение "Ивановский научно-исследовательский институт материнства и детства имени В.Н. Городкова" Министерства здравоохранения Российской Федерации Способ прогнозирования анеуплоидии эмбрионов в программе экстракорпорального оплодотворения у женщин с эндометриоз-ассоциированным бесплодием
WO2023031641A1 (en) * 2021-09-03 2023-03-09 Inserm ( Institut National De La Sante Et De La Recherche Medicale) Methods and devices for non-invasive prenatal testing
KR20250019610A (ko) 2022-03-21 2025-02-10 빌리언투원, 인크. 치료 모니터링을 위한 메틸화된 세포 유리 dna의 분자 계수
WO2025208288A1 (zh) * 2024-04-01 2025-10-09 深圳华大生命科学研究院 基因预测方法、装置、计算机设备及计算机可读存储介质
CN119936386B (zh) * 2025-01-21 2025-12-16 北京航空航天大学杭州创新研究院 一种单分子免疫检测原料及其检测方法

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10021A (en) * 1853-09-13 Screw-eastemtito- for boots and shoes
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
US20010051341A1 (en) 1997-03-04 2001-12-13 Isis Innovation Limited Non-invasive prenatal diagnosis
US6251638B1 (en) 1997-05-30 2001-06-26 Diagen Corporation Methods for detection of nucleic acid sequences in urine
USRE39920E1 (en) 1997-05-30 2007-11-13 Xenomics, Inc. Methods for detection of nucleic acid sequences in urine
US6492144B1 (en) 1997-05-30 2002-12-10 Diagen Corporation Methods for detection of nucleic acid sequences in urine
US20020119478A1 (en) 1997-05-30 2002-08-29 Diagen Corporation Methods for detection of nucleic acid sequences in urine
WO2005007869A2 (en) 2003-07-10 2005-01-27 Third Wave Technologies, Inc. Assays for the direct measurement of gene dosage
ATE435301T1 (de) 2003-10-16 2009-07-15 Sequenom Inc Nicht invasiver nachweis fötaler genetischer merkmale
US20060046258A1 (en) 2004-02-27 2006-03-02 Lapidus Stanley N Applications of single molecule sequencing
US20100216151A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US20100216153A1 (en) * 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
EP3591068A1 (en) 2006-02-02 2020-01-08 The Board of Trustees of the Leland Stanford Junior University Non-invasive fetal genetic screening by digital analysis
EP2351858B1 (en) 2006-02-28 2014-12-31 University of Louisville Research Foundation Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms
US20100184043A1 (en) 2006-02-28 2010-07-22 University Of Louisville Research Foundation Detecting Genetic Abnormalities
US20100184044A1 (en) 2006-02-28 2010-07-22 University Of Louisville Research Foundation Detecting Genetic Abnormalities
WO2007112418A2 (en) 2006-03-28 2007-10-04 Baylor College Of Medicine Screening for down syndrome
EP2589668A1 (en) 2006-06-14 2013-05-08 Verinata Health, Inc Rare cell analysis using sample splitting and DNA tags
WO2007147079A2 (en) 2006-06-14 2007-12-21 Living Microsystems, Inc. Rare cell analysis using sample splitting and dna tags
WO2009035447A1 (en) 2006-06-14 2009-03-19 Living Microsystems, Inc. Diagnosis of fetal abnormalities by comparative genomic hybridization analysis
US20080090239A1 (en) 2006-06-14 2008-04-17 Daniel Shoemaker Rare cell analysis using sample splitting and dna tags
EP2029779A4 (en) * 2006-06-14 2010-01-20 Living Microsystems Inc HIGHLY PARALLEL SNP GENOTYPING UTILIZATION FOR FETAL DIAGNOSIS
US20080050739A1 (en) 2006-06-14 2008-02-28 Roland Stoughton Diagnosis of fetal abnormalities using polymorphisms including short tandem repeats
US8137912B2 (en) 2006-06-14 2012-03-20 The General Hospital Corporation Methods for the diagnosis of fetal abnormalities
US20080113358A1 (en) 2006-07-28 2008-05-15 Ravi Kapur Selection of cells using biomarkers
WO2008070862A2 (en) 2006-12-07 2008-06-12 Biocept, Inc. Non-invasive prenatal genetic screen
US12180549B2 (en) 2007-07-23 2024-12-31 The Chinese University Of Hong Kong Diagnosing fetal chromosomal aneuploidy using genomic sequencing
PL2557520T3 (pl) 2007-07-23 2021-10-11 The Chinese University Of Hong Kong Określanie zaburzenia równowagi sekwencji kwasu nukleinowego
CA3069082C (en) * 2008-09-20 2022-03-22 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
PL2561103T3 (pl) 2011-06-29 2015-02-27 Bgi Diagnosis Co Ltd Nieinwazyjna detekcja anomalii genetycznych płodu

Also Published As

Publication number Publication date
HK1190758A1 (en) 2014-07-11
US9547748B2 (en) 2017-01-17
EP2561103A1 (en) 2013-02-27
EP2561103B1 (en) 2014-08-27
RU2589681C2 (ru) 2016-07-10
ZA201209583B (en) 2014-01-29
DK2561103T3 (da) 2014-10-20
KR101489568B1 (ko) 2015-02-03
CA2948939A1 (en) 2012-12-29
CN103403183B (zh) 2014-10-15
CN103403183A (zh) 2013-11-20
AU2012261664B2 (en) 2014-07-03
JP5659319B2 (ja) 2015-01-28
SI2561103T1 (sl) 2014-11-28
JP2014520509A (ja) 2014-08-25
BR112012033760B1 (pt) 2020-11-17
CA2791118C (en) 2019-05-07
BR112012033760A2 (pt) 2018-02-27
MY172864A (en) 2019-12-13
CA2948939C (en) 2021-02-02
EP2561103A4 (en) 2013-08-07
KR20140023847A (ko) 2014-02-27
AU2012261664A1 (en) 2013-01-17
SG191757A1 (en) 2013-08-30
US20140099642A1 (en) 2014-04-10
RU2012158107A (ru) 2015-08-10
PL2561103T3 (pl) 2015-02-27
CA2791118A1 (en) 2012-12-29
WO2013000100A1 (en) 2013-01-03

Similar Documents

Publication Publication Date Title
ES2512448T3 (es) Detección no invasiva de anormalidades genéticas fetales
CN104120181B (zh) 对染色体测序结果进行gc校正的方法及装置
ES2620294T3 (es) Diagnóstico no invasivo de la aneuploidia fetal por secuenciación
ES2894479T3 (es) Análisis mutacional de ADN de plasma para la detección de cáncer
ES2735993T3 (es) Métodos para predecir el resultado clínico del cáncer
CA3010254C (en) Size-based analysis of fetal dna fraction in maternal plasma
DK2809801T3 (en) NON-INVASIVE CANCER DIAGNOSIS
CN107208153A (zh) 血浆线粒体dna分析的应用
CN101845520A (zh) 一种hpa等位基因分型检测试剂盒
ES2701742T3 (es) Prueba de Papanicolaou para cánceres de ovario y de endometrio
CN117831619B (zh) 肾脏细胞甲基化标志物组合及其应用
TWI489305B (zh) 對胎兒遺傳異常的無創性檢測
CN109136359A (zh) 鉴别诊断NOA患者睾丸内残存精子的试剂及piRNA在其中的应用
CN107190073B (zh) hsa_circRNA_104907在唐氏综合征的诊断、治疗及预后中的应用
CN114107487B (zh) 一种可用于诊断脑卒中的产品
Serio cfDNA-NGS Liquid Biopsy as a new strategy to face advanced cancers: the usefulness of Liquid Biopsy in Cancer molecular characterization, detection of targetable mutations and insights into treatment resistance.
CN107345249B (zh) hsa_circRNA_103112在唐氏综合征的诊断、治疗及预后中的应用
박희수 Telomere Length and Somatic Mutations in Correlation with Response to Immunosuppressive Treatment in Aplastic Anemia
CN119630812A (zh) 作为先兆子痫的生物标志物的细胞游离dna信号
CN105779579A (zh) 评估罹患结肠直肠癌风险的方法及标志物
CN112368399A (zh) miRNA用于高级别浆液性卵巢癌治疗护理的预测和预后用途
HK1205533B (en) Mutational analysis of plasma dna for cancer detection
HK1233684A1 (en) Methylation pattern analysis of tissues in dna mixture