ES2534986T3 - Determinación simultánea de aneuploidía y fracción fetal - Google Patents

Determinación simultánea de aneuploidía y fracción fetal Download PDF

Info

Publication number
ES2534986T3
ES2534986T3 ES10830939.4T ES10830939T ES2534986T3 ES 2534986 T3 ES2534986 T3 ES 2534986T3 ES 10830939 T ES10830939 T ES 10830939T ES 2534986 T3 ES2534986 T3 ES 2534986T3
Authority
ES
Spain
Prior art keywords
chromosome
fetal
sequence
sequencing
nucleic acids
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES10830939.4T
Other languages
English (en)
Inventor
Stephen Quake
Richard P. Rava
Manjula CHINNAPPA
David A. COMSTOCK
Gabrielle HEILEK
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Verinata Health Inc
Original Assignee
Verinata Health Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44307118&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2534986(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Verinata Health Inc filed Critical Verinata Health Inc
Application granted granted Critical
Publication of ES2534986T3 publication Critical patent/ES2534986T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6872Methods for sequencing involving mass spectrometry
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis
    • C12Q2545/101Reactions characterised by their quantitative nature the purpose being quantitative analysis with an internal standard/control
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)

Abstract

Un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna de sangre, plasma o suero que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, en el que la mezcla de moléculas de ácidos nucleicos fetales y maternos son moléculas de ADN libre de células (ADNcf) y dicha fracción fetal es la fracción de dichas moléculas de ácidos nucleicos proporcionadas por un feto a dicha mezcla de moléculas de ácidos nucleicos fetales y maternos, dicho método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde cada uno de dichos ácidos nucleicos objetivo se sabe que comprende al menos un sitio polimórfico, y en donde dicho enriquecimiento comprende: (i) amplificar específicamente dicha pluralidad de ácidos nucleicos objetivo en una porción de dicha mezcla usando pares de cebadores cada uno capaz de amplificar una secuencia de ácidos nucleicos objetivo que comprende un sitio polimórfico en una reacción de PCR multiplex para generar un panel de sitios polimórficos amplificados que contiene un número suficiente de sitios polimórficos de tal forma que al menos dos son sitios polimórficos informativos; y (ii) combinar al menos una porción de todo el producto amplificado con al menos una porción del resto de la muestra no amplificada de la que se obtuvo la porción; (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde dicha secuenciación comprende proporcionar una pluralidad de lecturas de secuencia que se mapean para un genoma para identificar una pluralidad de etiquetas de secuencia mapeadas; y (c) usar dicha pluralidad de etiquetas de secuencia mapeadas, determinar simultáneamente dicha fracción fetal y dicha aneuploidía, en donde: (i) determinar dicha fracción fetal comprende: (1) usar las etiquetas de secuencia mapeadas para identificar al menos dos sitios polimórficos informativos en dicho panel de sitios polimórficos amplificados, en donde dichos sitios polimórficos informativos se identifican por la diferencia en las secuencias alélicas y el número de etiquetas de secuencia mapeadas para cada uno de los alelos posibles en cada sitio polimórfico; y (2) calcular la fracción fetal en base al número total de etiquetas de secuencia que mapean para el primer alelo y el número total de etiquetas de secuencia que mapean para un segundo alelo en cada uno de dichos sitios polimórficos informativos; y (ii) determinar dicha aneuploidía comprende la cuantificación del número de etiquetas de secuencia que alinean con un cromosoma de interés, y comparar los resultados obtenidos para el cromosoma de interés con un valor límite, en donde el valor límite es un número que sirve como un límite de diagnóstico de una aneuploidía y en donde la presencia de una aneuploidía para el cromosoma de interés se identifica si el valor límite es excedido por los resultados obtenidos para el cromosoma de interés.

Description

CAMPO DE LA INVENCION
La invención se refiere de manera general al campo de diagnósticos, y proporciona un método que es aplicable a la práctica de diagnósticos prenatales no invasivos.
ANTECEDENTES DE LA INVENCION
El diagnóstico prenatal para determinar anomalías fetales potenciales proporciona una oportunidad para el cuidado y gestión necesarios durante el embarazo, el periodo neonatal y el parto. Las técnicas de formación de imágenes como ecografía, resonancia magnética y ecocardiografía fetal son útiles para la identificación de anomalías estructurales del feto. La amniocentesis, muestra de vellosidades coriónicas y muestra de sangre fetal proporcionan células y tejidos fetales para el análisis de anomalías cromosómicas, genéticas y bioquímicas, pero son invasivas y plantean riesgo alto al embarazo.
La existencia de ADN libre de células circulante en la sangre materna (Lo et al., Lancet 350:485-487 [1997]) se está aprovechando para desarrollar procesos no invasivos que usan ácidos nucleicos fetales de una muestra de sangre periférica materna para determinar anomalías cromosómicas fetales (Fan HC y Quake SR Anal Chem 79:7576-7579 [2007]; Fan et al., Proc Natl Acad Sci 105:16266-16271 [2008]).
Estos métodos proporcionan un cambio de paradigma en el diagnóstico prenatal, ya que podrían anunciar efectivamente el final de los procedimientos invasivos. Sin embargo, la sensibilidad de la determinación de aneuploidía fetal depende en gran medida de la fracción de ADN fetal, que se ha determinado que es <10% del ADN libre de células (ADNcf) circulante total (Lo et al., Am J Hum Genet 62:768-775 [1998]). Dada la relativamente baja concentración de ácidos nucleicos circulantes fetales, pueden surgir resultados de falsos negativos si hay insuficiente ácido nucleico de partida para el análisis. Por consiguiente, se han desarrollado ensayos para la determinación no invasiva de la fracción de AND fetal, pro típicamente se basan en comparar el locus específico del feto (como el locus SRY en el cromosoma Y en embarazos masculinos) con los de un locus en cualquiera autosoma que es común tanto para la madre como el feto (Dahllan et al., Lancet 369:474-481 [2007]; Li et al., Clin Chem 10021011 [2004]; Fan et al., Proc Natl Acad Sci 105:16266-16271 [2008]). Además, los ensayos usados para cuantificar la fracción fetal se realizan independientemente de los ensayos que se están desarrollando para determinar la presencia o ausencia de aneuploidías en el ADN libre de células circulante.
Los documentos Lo et al., CHEMISTRY, 2008, vol. 54, no. 3, pg. 461-466 y Chu et al., BIOINFORMATICS, 2009, vol. 25, no. 10, pg. 1244-1250 divulgan métodos en los que la secuenciación de ADN en sangre materna se usa para obtener información de la dosis de cromosoma en cachos sospechosos de aneuploidía. Las variaciones anormales en la densidad y/o número de etiquetas de secuencia para cada cromosoma bajo análisis frente a un control para el mismo cromosoma están correlacionados con la presencia de aneuploidía.
Por lo tanto, sería deseable proporcionar un ensayo prenatal que proporcione un control interno para medir la adecuación de los ácidos nucleicos fetales de entrada y evite los diagnósticos incorrectos de anomalías cromosómicas fetales.
La presente invención se refiere a composiciones y métodos que permiten la determinación simultánea de la fracción fetal y la determinación de la presencia o ausencia de aneuploidía a partir de un proceso de secuenciación de diagnóstico individual. El método permite determinar la fracción fetal de una manera independiente del género, que se basa en la cuantificación de alelos en cromosomas múltiples. El método de diagnóstico no invasivo abarca el uso de tecnología de secuenciación de próxima generación (NGS) que puede ser implementada en un proceso racionalizado y rentable para proporcionar diagnósticos prenatales no invasivos de aneuploidías fetales con mayor confianza.
RESUMEN DE LA INVENCION
La invención se refiere a composiciones y métodos para determinar simultáneamente la presencia o ausencia de aneuploidía fetal y la cantidad relativa de ácidos nucleicos fetales en una muestra obtenida de una mujer embarazada. El método abarca el uso de tecnologías de secuenciación y explota la aparición de polimorfismos para proporcionar un proceso no invasivo racionalizado aplicable a la práctica del diagnóstico prenatal.
La invención proporciona un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra de sangre, plasma o suero materno que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, en donde la mezcla de moléculas de ácidos nucleicos fetales y maternos son moléculas de ADN libre de células (ADNcf) y dicha fracción fetal es la fracción de dichas moléculas de ácidos nucleicos aportadas por un feto a
dicha mezcla de moléculas de ácidos nucleicos fetales y maternos, en donde se sabe que cada uno de dichos ácidos nucleicos comprende al menos un sitio polimórficos, y en donde dicho enriquecimiento comprende: (i) amplificar específicamente dicha pluralidad de ácidos nucleicos objetivo en una porción de dicha mezcla usando pares de cebadores cada uno capaz de amplificar una secuencia de ácidos nucleicos objetivo que comprende un sitio polimórfico en una reacción de PCR multiplex para generar un panel de sitios polimórficos amplificados que contiene un número suficiente de sitios polimórficos de tal manera que al menos dos son sitios polimórficos informativos; y (ii) combinar al menos una porción o todo el producto amplificado con al menos una porción del resto de la muestra no amplificada de la que se retiró la porción; (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde dicha secuenciación comprende proporcionar una pluralidad de lecturas de secuencia que se mapean para un genoma para identificar una pluralidad de etiquetas de secuencia mapeadas; y (c) usar dicha pluralidad de etiquetas de secuencia mapeadas, determinar simultáneamente dicha fracción fetal y dicha aneuploidía, en donde: (i) determinar dicha fracción fetal comprende: (1) usar las etiquetas de secuencia mapeadas para identificar al menos dos sitios polimórficos informativos en dicho panel de sitios polimórficos amplificados, en donde dichos sitios polimórficos informativos se identifican por la diferencia en las secuencias alélicas y el número de etiquetas de secuencia mapeadas para cada uno de los posibles alelos en cada sitio polimórfico, y (2) calcular la fracción fetal en base al número total de etiquetas de secuencia que mapean para un primer alelo y el número total de etiquetas de secuencia que mapean para un segundo alelo en cada uno de dichos sitios polimórficos informativos; y (ii) determinar dicha aneuploidía comprende la cuantificación del número de etiquetas de secuencia que se alinean con un cromosoma de interés, y comparar los resultados obtenidos para el cromosoma de interés con un valor límite, en donde el valor límite es un número que sirve como un límite de diagnóstico de una aneuploidía y en donde la presencia de una aneuploidía para el cromosoma de interés se identifica si el valor límite se supera por los resultados obtenidos para el cromosoma de interés.
En una realización, se divulga un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, el método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos; (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde la secuenciación comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en base a la secuenciación, determinar simultáneamente la fracción fetal y la presencia o ausencia de aneuploidía fetal.
En otra realización, se divulga un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, el método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde enriquecer comprende amplificar una pluralidad de ácidos nucleicos objetivo polimórficos en una porción de dicha mezcla; (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde la secuenciación comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en base a la secuenciación, determinar simultáneamente la fracción fetal y la presencia o ausencia de aneuploidía fetal.
En otra realización, se divulga un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, el método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde enriquecer comprende amplificar una pluralidad de ácidos nucleicos objetivo polimórficos en una porción de una mezcla purificada de ácidos nucleicos fetales y maternos; (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde la secuenciación comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en base a la secuenciación, determinar simultáneamente la fracción fetal y la presencia o ausencia de aneuploidía fetal.
En otra realización, se divulga un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, el método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde enriquecer comprende combinar al menos una porción de una primera biblioteca de secuenciación de dicha mezcla de moléculas de ácidos nucleicos fetales y maternos con al menos una porción de una segunda biblioteca de secuenciación de dicha mezcla de moléculas de ácidos nucleicos fetales y maternos; (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde la secuenciación comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en base a la secuenciación, determinar simultáneamente la fracción fetal y la presencia o ausencia de aneuploidía fetal.
En una realización, se divulga un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, el método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde cada uno de la pluralidad de ácidos nucleicos objetivo polimórficos comprende al menos un polimorfismo de nucleótido simple (SNP); (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde la secuenciación comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en base a la secuenciación, determinar simultáneamente la fracción fetal y la presencia o ausencia de aneuploidía fetal. En algunas realizaciones, el al menos un SNP, es un SNP individual seleccionado de cada uno de dicha pluralidad de
ácidos nucleicos objetivo polimórficos que comprende un SNP seleccionado de rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs 4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005, y rs530022. Alternativamente, el al menos un SNP es un conjunto de dos SNPs en tándem seleccionado de los conjuntos rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980-rs987981; rs4143392-rs4143391; rs1691324-rs13050434; rs11909758-rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080-rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141-rs2246777; rs2832959-rs9980934; rs2833734rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485-rs3453; rs9974986-rs2834703; rs2776266rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672.
En una realización, se divulga un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, el método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde cada uno de la pluralidad de ácidos nucleicos objetivo polimórficos comprende al menos un polimorfismo de nucleótido simple (SNP); (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde la secuenciación comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en base a la secuenciación, determinar simultáneamente la fracción fetal y la presencia o ausencia de aneuploidía fetal. El paso de enriquecer comprende amplificar una pluralidad de ácidos nucleicos objetivo polimórficos en una porción de dicha mezcla. En algunas realizaciones, el al menos un SNP, es un SNP individual seleccionado de cada uno de dicha pluralidad de ácidos nucleicos objetivo polimórficos que comprende un SNP seleccionado de rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs 4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005, y rs530022. Alternativamente, el al menos un SNP es un conjunto de dos SNPs en tándem seleccionado de los conjuntos rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980-rs987981; rs4143392-rs4143391; rs1691324-rs13050434; rs11909758rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080-rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141-rs2246777; rs2832959rs9980934; rs2833734-rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485-rs3453; rs9974986rs2834703; rs2776266-rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672.
En una realización, se divulga un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, el método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde cada uno de la pluralidad de ácidos nucleicos objetivo polimórficos comprende al menos un polimorfismo de nucleótido simple (SNP); (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde la secuenciación comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en base a la secuenciación, determinar simultáneamente la fracción fetal y la presencia o ausencia de aneuploidía fetal. El paso de enriquecer comprende amplificar una pluralidad de ácidos nucleicos objetivo polimórficos en una porción de una mezcla purificada de ácidos nucleicos fetales y maternos. En algunas realizaciones, el al menos un SNP, es un SNP individual seleccionado de rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005, y rs530022. Alternativamente, el al menos un SNP es un conjunto de dos SNPs en tándem seleccionado de los conjuntos rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980-rs987981; rs4143392-rs4143391; rs1691324-rs13050434; rs11909758-rs9980111; rs2826842-rs232414; rs1980969rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902-rs2831903;
rs11088086-rs2251447; rs2832040-rs11088088; rs2832141-rs2246777; rs2832959 -rs9980934; rs2833734rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485-rs3453; rs9974986-rs2834703; rs2776266rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672.
En una realización, se divulga un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, el método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde cada uno de la pluralidad de ácidos nucleicos objetivo polimórficos comprende al menos un polimorfismo de nucleótido simple (SNP); (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde la secuenciación comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en base a la secuenciación, determinar simultáneamente la fracción fetal y la presencia o ausencia de aneuploidía fetal. El paso de enriquecer comprende combinar al menos una porción de una primera biblioteca de secuenciación de dicha mezcla de moléculas de ácidos nucleicos fetales y maternos con al menos una porción de una segunda biblioteca de secuenciación de ácidos nucleicos objetivo polimórficos amplificados. En algunas realizaciones, el al menos un SNP, es un SNP individual seleccionado de cada uno de dicha pluralidad de ácidos nucleicos objetivo polimórficos que comprende un SNP seleccionado de rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005,y rs530022. Alternativamente, el al menos un SNP es un conjunto de dos SNPs en tándem seleccionados de los conjuntos rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980-rs987981; rs4143392-rs4143391; rs1691324-rs13050434; rs11909758-rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080-rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040rs11088088; rs2832141-rs2246777; rs2832959-rs9980934; rs2833734-rs2833735; rs933121-rs933122; rs2834140rs12626953; rs2834485-rs3453; rs9974986-rs2834703; rs2776266-rs2835001; rs1984014-rs1984015; rs7281674rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672.
En otra realización, se divulga un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, el método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde cada uno de la pluralidad de ácidos nucleicos objetivo polimórficos comprende al menos una repetición corta en tándem (STR); (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde la secuenciación comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en base a la secuenciación, determinar simultáneamente la fracción fetal y la presencia o ausencia de aneuploidía fetal. En algunas realizaciones, la al menos una STR es menor de alrededor de 200 pares de base. En otras realizaciones, cada uno de dicha pluralidad de ácidos nucleicos objetivo polimórficos comprende una STR seleccionada de CSF1PO, FGA, TH01, TPOX, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, D2S1338, Penta D, Penta E, D22S1045, D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627 y D1GATA113.
En otra realización, se divulga un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, el método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde cada uno de la pluralidad de ácidos nucleicos objetivo polimórficos comprende al menos una repetición corta en tándem (STR); (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde la secuenciación comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en base a la secuenciación, determinar simultáneamente la fracción fetal y la presencia o ausencia de aneuploidía fetal. El paso de enriquecer comprende amplificar una pluralidad de ácidos nucleicos objetivo polimórficos en una porción de la mezcla. En algunas realizaciones, la al menos una STR es menor de alrededor de 200 pares de base. En otras realizaciones, cada uno de dicha pluralidad de ácidos nucleicos objetivo polimórficos comprende una STR seleccionada de CSF1PO, FGA, TH01, TPOX, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, D2S1338, Penta D, Penta E, D22S1045, D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627 y D1GATA113.
En otra realización, se divulga un método para determinar simultáneamente aneuploidía y fracción fetal en
una muestra materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, el método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde cada uno de la pluralidad de ácidos nucleicos objetivo polimórficos comprende al menos una repetición corta en tándem (STR); (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde la secuenciación comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en base a la secuenciación, determinar simultáneamente la fracción fetal y la presencia o ausencia de aneuploidía fetal. El paso de enriquecer comprende amplificar una pluralidad de ácidos nucleicos objetivo polimórficos en una porción de una mezcla purificada de ácidos nucleicos fetales y maternos. En algunas realizaciones, la al menos una STR es menor de alrededor de 200 pares de base. En otras realizaciones, cada uno de dicha pluralidad de ácidos nucleicos objetivo polimórficos comprende una STR seleccionada de CSF1PO, FGA,TH01, TPOX, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, D2S1338, Penta D, Penta E, D22S1045, D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627 y D1GATA113.
En otra realización, se divulga un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, el método comprende: (a) enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde cada uno de la pluralidad de ácidos nucleicos objetivo polimórficos comprende al menos una repetición corta en tándem (STR); (b) secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde la secuenciación comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en base a la secuenciación, determinar simultáneamente la fracción fetal y la presencia o ausencia de aneuploidía fetal. El paso de enriquecer comprende combinar al menos una porción de una primera biblioteca de secuenciación de dicha mezcla de moléculas de ácidos nucleicos fetales y maternos con al menos una porción de una segunda biblioteca de secuenciación de ácidos nucleicos objetivo polimórficos amplificados. En algunas realizaciones, la al menos una STR es menor de alrededor de 200 pares de base. En otras realizaciones, cada uno de dicha pluralidad de ácidos nucleicos objetivo polimórficos comprende una STR seleccionada de CSF1PO, FGA, TH01, TPOX, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, D2S1338, Penta D, Penta E, D22S1045, D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627 y D1GATA113.
En las realizaciones del método resumido anteriormente y descritas con más detalle a continuación, la muestra materna es una muestra biológica que se puede elegir, pero no está limitada a, sangre, plasma, suero, orina y saliva. Preferiblemente, las moléculas de ácidos nucleicos fetales y maternos en la muestra materna son moléculas de ADN libre de células (ADNcf). Los ácidos nucleicos objetivo polimórficos pueden ser del mismo cromosoma o de cromosomas diferentes.
En las realizaciones del método resumido anteriormente y descrito con más detalle a continuación, la aneuploidía que se determina puede ser una aneuploidía cromosómica o parcial. En algunas realizaciones, la aneuploidía es una aneuploidía cromosómica que se selecciona de trisomía 8, trisomía 13, trisomía 15, trisomía 16, trisomía 18, trisomía 21, trisomía 22, monosomía X y XXX. En algunas realizaciones, determinar la aneuploidía comprende calcular una dosis de cromosoma en base al número de dichas etiquetas de secuencia para el cromosoma de interés y para un cromosoma normalizador, y comparar dicha dosis con un valor límite, mientras que determinar la fracción fetal comprende identificar al menso un sitio polimórfico informativo en dicha mezcla enriquecida, y calcular la fracción fetal de la cantidad de sitios polimórficos fetales y maternos en dicha muestra enriquecida.
En las realizaciones del método resumido anteriormente y descrito con más detalle a continuación, la secuenciación que puede usarse para la determinación simultánea se realiza usando secuenciación de próxima generación (NGS). En algunas realizaciones, la secuenciación es secuenciación masivamente paralela usando secuenciación por síntesis con terminadores de colorante reversibles. En otras realizaciones, la secuenciación es secuenciación por ligadura. En otras realizaciones, la secuenciación es secuenciación de moléculas individuales. La secuenciación de la mezcla enriquecida puede comprender además una amplificación.
Preferiblemente, las moléculas de ácidos nucleicos fetales y maternos son moléculas de ADN libre de células. En algunas realizaciones, la muestra materna es una muestra de plasma. EL kit comprende una composición que comprende al menos un conjunto de cebadores para amplificar al menos un ácido nucleico polimórfico comprendido en las moléculas de ácidos nucleicos fetales y maternos. En algunas realizaciones el ácido nucleico polimórfico comprende un SNP. En otra realización, el ácido nucleico polimórfico comprende una STR.
BREVE DESCRIPCION DE LOS DIBUJOS
Las características nuevas de la invención se exponen con particularidad en las reivindicaciones añadidas. Se obtendrá una mejor comprensión de las características y ventajas de la presente invención con referencia a la
siguiente descripción detallada que expone realizaciones ilustrativas, en las que se utilizan los principios de la invención, y los dibujos acompañantes de los cuales:
La Figura 1 es un diagrama de flujo de un método 100 para determinar simultáneamente la presencia o ausencia de aneuploidía y la fracción fetal en una muestra de ensayo materna que comprende una mezcla de ácidos nucleicos fetales y maternos. La Figura 2 es un diagrama de flujo de un método 200 para determinar simultáneamente la presencia o ausencia de aneuploidía fetal y la fracción fetal en una muestra de ensayo materna enriquecida para ácidos nucleicos polimórficos. La Figura 3 es un diagrama de flujo de un método 300 para determinar simultáneamente la presencia o ausencia de aneuploidía fetal y la fracción fetal en una muestra de ensayo de ADN libre de células purificado materno que ha sido enriquecida con ácidos nucleicos polimórficos. La Figura 4 es un diagrama de flujo de un método 400 para determinar simultáneamente la presencia o ausencia de aneuploidía fetal y la fracción fetal en una biblioteca de secuenciación construida de ácidos nucleicos fetales y maternos derivados de una muestra de ensayo materna y enriquecida con ácidos nucleicos polimórficos. La Figura 5 es un diagrama de flujo de un método 500 para determinar la presencia o ausencia de una variación en el número de copias en una muestra de ensayo que comprende una mezcla de ácidos nucleicos. La Figura 6 es un diagrama de barras que muestra la identificación de secuencias polimórficas fetales y maternas (SNPs) usadas para determinar la fracción fetal en un muestra de ensayo. Se muestran el número total de lecturas de secuencias (eje Y) mapeadas para las secuencias SNP identificadas por los números rs (eje X), y el nivel relativo de ácidos nucleicos fetales (*). La Figura 7 ilustra la distribución de la dosis de cromosoma para el cromosoma 21 determinada por la secuenciación del ADN libre de células extraído de un conjunto de 48 muestras de sangre obtenidas de sujetos humanos embarazados con fetos masculinos o femeninos. Se muestran las dosis de cromosoma 21 para muestras de ensayo calificadas, es decir, normales para el cromosoma 21 (O), y para trisomía 21 (∆) para los cromosomas 1-12 y X (Figura 7A), y para los cromosomas 1-22 y X (Figura 7B). La Figura 8 ilustra la distribución de la dosis de cromosoma para el cromosoma 18 determinada de la secuenciación de ADN libre de células extraído de un conjunto de 48 muestras de sangre obtenidas de sujetos humanos embarazados con un feto masculino o femenino. Las dosis de cromosoma 18 para las muestras de ensayo calificadas, es decir, normales para el cromosoma 18 (O), y trisomía 18 (∆) se muestran para los cromosomas 1-12 y X (Figura 8A), y para los cromosomas 1-22 y X (Figura 8B). La Figura 9 ilustra la distribución de la dosis de cromosoma para el cromosoma 13 determinada de la secuenciación de ADN libre de células extraído de un conjunto de 48 muestras de sangre obtenidas de sujetos humanos embarazados con un feto masculino o femenino. Las dosis de cromosoma 13 para las muestras de ensayo calificadas, es decir normales para el cromosoma 13 (O), y trisomía 13 (∆) se muestran para los cromosomas 1-12 y X (Figura 9A), y para los cromosomas 1-22 y X (Figura 9B). La Figura 10 ilustra la distribución de las dosis de cromosoma para el cromosoma X determinada de la secuenciación de ADN libre de células extraído de un conjunto de 48 muestras de sangre obtenidas de sujetos humanos embarazados con un feto masculino o femenino. Las dosis de cromosoma X para las muestras masculinas (46,XY; (O)), femeninas (46,XX(∆)); monosomía X (45,X; (+)), y cariotipos complejos (Cplx (X)) se muestran para los cromosomas 1-12 y X (Figura 10A) y para los cromosomas 1-22 y X (Figura 10B). La Figura 11 ilustra la distribución de las dosis de cromosoma para el cromosoma Y determinada de la secuenciación de ADN libre de células extraído de un conjunto de 48 muestras de sangre obtenidas de sujetos humanos embarazados de un feto masculino o femenino. Las dosis de cromosoma Y para las muestras masculinas (46,XY; (∆)), femeninas (46,XX(O)); monosomía X (45,X; (+)), y cariotipos complejos (Cplx (X)) se muestran para los cromosomas 1-12 (Figura 11A) y para los cromosomas 1-22 (Figura 11B). La Figura 12 muestra el coeficiente de variación (CV) para los cromosomas 21 (□), 18 (O) y 13 (∆) que se determinó de las dosis de cromosoma de muestras calificadas, es decir, no afectadas mostradas en las Figuras 7, 8 y 9, respectivamente. La Figura 13 muestra el coeficiente de variación (CV) para los cromosomas X (□) e Y (O) que se determinó de las dosis de cromosoma de muestras calificadas, es decir, no afectadas mostradas en la Figuras 10 y 11, respectivamente.
DESCRIPCION DETALLADA DE LA INVENCION
La invención se refiere a composiciones y métodos para determinar simultáneamente la presencia o ausencia de aneuploidía fetal y la cantidad relativa de ácidos nucleicos fetales en una muestra obtenida de una mujer embarazada. El método abarca el uso de tecnologías de secuenciación, por ejemplo, secuenciación de próxima generación, y explota la aparición de polimorfismos para proporcionar un proceso no invasivo simplificado aplicable a la práctica del diagnóstico prenatal.
A menos que se indique lo contrario, la práctica de la presente invención implica técnicas convencionales
usadas comúnmente en biología molecular, microbiología, purificación de proteínas, diseño de proteínas, secuenciación de proteínas y ADN y campos de ADN recombinante, que están dentro de la técnica. Dichas técnicas son conocidas por los expertos en la técnica y se describen en numerosos textos estándar y trabajos de referencia.
Los intervalos numéricos incluyen los números que definen el intervalo. Se pretende que cada limitación numérica máxima dada a lo largo de esta especificación incluya cada limitación numérica inferior, como si dichas limitaciones numéricas inferiores estuvieran expresamente escritas en la presente. Cada limitación numérica mínima dad a lo largo de esta especificación incluirá cada limitación numérica más alta, como si dichas limitaciones numéricas más altas estuvieran escritas expresamente en la presente. Cada intervalo numérico dado a lo largo de esta especificación incluirá cada intervalo numérico más estrecho que caiga dentro de dicho intervalo numérico más amplio, como si dichos intervalos numéricos más estrechos estuvieran todos expresamente escritos en la presente.
Los encabezamientos proporcionados en la presente no son limitaciones de los varios aspectos o realizaciones de la invención que pueden ser tenidas con referencia a la Especificación como un todo. Por consiguiente, como se ha indicado anteriormente, los términos definidos inmediatamente a continuación se definen más completamente con referencia a la especificación como un todo.
A menos que se defina lo contrario en la presente, todos los términos técnicos y científicos usados en la presente tienen el mismo significado que el que entendería comúnmente alguien experto en la técnica a la que pertenece esta invención. Varios diccionarios científicos que incluyen los términos incluidos en la presente son bien conocidos y están disponibles para los expertos en la técnica. Aunque cualquier método y material similar o equivalente a los descritos en la presente encuentran uso en la práctica o ensayo de la presente invención, se describen algunos métodos y materiales preferidos. Por consiguiente, los términos definidos inmediatamente a continuación se describen más completamente con referencia a la Especificación como un todo. Se debe entender que esta invención no está limitada a la metodología, protocolos y reactivos particulares descritos, ya que estos pueden variar, dependiendo del contexto en el que se usen por los expertos en la técnica.
DEFINICIONES
Como se usa en la presente, los términos singulares "un", "uno" y "el" incluyen la referencia plural a menos que el contexto indique claramente lo contrario. A menos que se indique lo contrario, los ácidos nucleicos están escritos de izquierda a derecha en orientación 5' a 3' y las secuencias de aminoácidos están escritas de izquierda a derecha en orientación amino a carboxi, respectivamente.
El término "evaluar" en la presente se refiere a caracterizar el estado de una aneuploidía cromosómica por uno de los tres tipos de designaciones: "normal", "afectada" y "no designada". Por ejemplo, en presencia de trisomía la designación "normal" se determina por el valor de un parámetro, por ejemplo una dosis de cromosoma de ensayo que está por debajo de un límite definido por el usuario de fiabilidad, la designación "afectada" está determinada por un parámetro, por ejemplo una dosis de cromosoma de ensayo, que está por encima de un límite definido por el usuario de fiabilidad, y el resultado "no designada" se determina por un parámetro, por ejemplo una dosis de cromosoma de ensayo, que se encuentra entre los límites definidos por el usuario de fiabilidad para hacer una designación "normal" o una "afectada".
El término "variación del número de copias" en la presente se refiere a la variación en el número de copias de una secuencia de ácidos nucleicos que es de 1 kb o mayor presente en una muestra de ensayo en comparación con el número de copias de la secuencia de ácidos nucleicos presente en una muestra calificada. Una "variante del número de copias" se refiere a la secuencia de 1kb o mayor del ácido nucleico en el que las diferencias del número de copias se encuentran por comparación de una secuencia de interés en la muestra de ensayo que se presenta en una muestra calificada. Las variantes/variaciones del número de copias incluyen deleciones, incluyendo microdeleciones, inserciones, incluyendo microinserciones, duplicaciones, multiplicaciones, inversiones, translocaciones y variantes multi-sitio complejas. El CNV abarca aneuploidías cromosómicas y aneuploidías parciales.
El término "aneuploidía" en la presente se refiere a un desequilibrio de material genético causado por una pérdida o ganancia de un cromosoma completo, o parte de un cromosoma.
El término "aneuploidía cromosómica" en la presente se refiere a un desequilibrio de material genético causado por una pérdida o ganancia de un cromosoma completo, e incluye aneuploidía de la línea germinal y aneuploidía en mosaico.
El término "aneuploidía parcial" en la presente se refiere a un desequilibrio de material genético causado por una pérdida o ganancia de parte de un cromosoma, por ejemplo, monosomía parcial y trisomía parcial, y abarca desequilibrios resultantes de translocaciones, deleciones e inserciones.
El término "SNPs en tándem" se refiere en la presente a dos o más SNPs que están presentes dentro de
una secuencia de ácidos nucleicos objetivo polimórficos.
El término "ácido nucleico objetivo polimórfico", "secuencia polimórfica", "secuencia de ácidos nucleicos objetivo polimórficos" y "ácido nucleico polimórfico" se usan de manera intercambiable en la presente para referirse a una secuencia de ácidos nucleicos, por ejemplo una secuencia de ADN, que comprende uno o más sitios polimórficos.
El término "sitio polimórfico" se refiere en la presente a un polimorfismo de nucleótido simple (SNP), una deleción o inserción multi-base a pequeña escala, un Polimorfismo Multi-Nucleótido (MNP) o una Repetición Corta en Tándem (STR).
El término "pluralidad" se usa en la presente con referencia a un número de moléculas de ácidos nucleicos
o etiquetas de secuencia que es suficiente para identificar diferencias significativas en variaciones del número de copias (por ejemplo dosis de cromosoma) en muestras de ensayo y muestras calificadas usando los métodos divulgados en la presente. En algunas realizaciones, se obtienen al menos alrededor de 3 x 106 etiquetas de secuencia, al menos alrededor de 5 x 106 etiquetas de secuencia, al menos alrededor de 8 x 106 etiquetas de secuencia, al menos alrededor de 10 x 106 etiquetas de secuencia, al menos alrededor de 15 x 106 etiquetas de secuencia, al menos alrededor de 20 x 106 etiquetas de secuencia, al menos alrededor de 30 x 106 etiquetas de secuencia, al menos alrededor de405 x 106 etiquetas de secuencia, al menos alrededor de 50 x 106 etiquetas de secuencia que comprenden lecturas entre de 20 y 40bp para cada muestra de ensayo.
El término "polinucleótido", "ácido nucleico" y "moléculas de ácidos nucleicos" se usan de manera intercambiable y se refieren a secuencias ligadas covalentemente de nucleótidos (es decir, ribonucleótidos para ARN y desoxiribonucleótidos para ADN) en las que la posición 3' de la pentosa de un nucleótido está unida por un grupo fosfodiéster a la posición 5' de la pentosa de la siguiente, incluye secuencias de cualquier forma de ácido nucleico incluyendo, pero no limitado a, moléculas de ARN, ADN y ADN libre de células. El término "polinucleótido" incluye, sin limitación, polinucleótidos de cadena sencilla y doble.
El término "porción" se usa en la presente en referencia a la cantidad de información de secuencia de moléculas de ácidos nucleicos fetales y maternos en una muestra biológica que en suma ascienden a menos de la información de la secuencia de <1 genoma humano.
El término "muestra de ensayo" en la presente se refiere a una muestra que comprende una mezcla de ácidos nucleicos que comprende al menos una secuencia de ácidos nucleicos cuyo número de copias se sospecha que ha sufrido variación. Los ácidos nucleicos presentes en la muestra de ensayo son referidos como "ácidos nucleicos de ensayo".
El término "muestra calificada" en la presente se refiere a una muestra que comprende una mezcla de ácidos nucleicos que están presentes en un número de copias conocido con los que los ácidos nucleicos en la muestra de ensayo se comparan, y es una muestra que es normal, es decir, no aneuploide, para la secuencia de interés, por ejemplo una muestra calificada usada para identificar un cromosoma normalizador para el cromosoma 21 es una muestra que no es una muestra de trisomía 21.
El término "enriquecer" en la presente se refiere al proceso de amplificar ácidos nucleicos objetivo polimórficos contenidos en una porción de una muestra materna, y combinar el producto amplificado con el resto de la muestra materna de la que se obtuvo la porción.
El término "acido nucleico calificado" se usa de manera intercambiable con "secuencia calificada" es una secuencia contra la que se compara la cantidad de una secuencia de ensayo o ácido nucleico de ensayo. Una secuencia calificada es una presente en una muestra biológica preferiblemente en una representación conocida, es decir, la cantidad de una secuencia calificada se conoce. Una "secuencia calificada de interés" es una secuencia calificada para la que la cantidad se conoce en una muestra calificada, y es una secuencia que está asociada con una diferencia en la representación de secuencia en un individuo con una condición médica.
El término "secuencia de interés" en la presente se refiere a una secuencia de ácidos nucleicos que está asociada con una diferencia en la representación de secuencia en individuos sanos frente a enfermos. Una secuencia de interés puede ser una secuencia en un cromosoma que está tergiversada, es decir, sobre-o subrepresentado, en una enfermedad o condición genética. Una secuencia de interés puede también ser una porción de un cromosoma, o un cromosoma. Por ejemplo, una secuencia de interés puede ser un cromosoma que está sobrerepresentado en una condición de aneuploidía, o in gen que codifica un supresor tumoral que está sub-representado en un cáncer. Las secuencias de interés incluyen secuencias que estas sobre-o sub-representadas en la población total, o una subpoblación de células de un sujeto. Una "secuencia calificada de interés" es una secuencia de interés en una muestra calificada. Una "secuencia de ensayo de interés" es una secuencia de interés en una muestra de ensayo.
El término "pluralidad de ácidos nucleicos objetivo polimórficos" en la presente se refiere a un número de secuencias de ácidos nucleicos que comprende cada una al menos un sitio polimórfico de tal forma que al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40 o más sitios polimórficos diferentes se amplifican de los ácidos nucleicos objetivo polimórficos para identificar y/o cuantificar alelos fetales presentes en las muestras maternas que comprenden ácidos nucleicos fetales y maternos.
El término "secuencia normalizadora" en la presente se refiere a una secuencia que muestra una variabilidad en el número de etiquetas de secuencia que están mapeadas para ella entre las muestras y ejecuciones de secuenciación que mejor se aproxima a la de la secuencia de interés para la que se usa como un parámetro normalizador, y que puede diferenciar mejor una muestra afectada de una o más muestras no afectadas. Un "cromosoma normalizador" es un ejemplo de "secuencia normalizadora".
El término "diferenciabilidad" en la presente se refiere a la característica de un cromosoma normalizador que permite distinguir una o más muestras no afectadas, es decir, normales de una o más muestras afectadas, es decir, aneuploides.
El término "grupo de cromosomas" en la presente se refiere a dos o más cromosomas.
El término "dosis de secuencia" en la presente se refiere a un parámetro que relaciona la densidad de etiqueta de secuencia de una secuencia de interés con la densidad de etiqueta de una secuencia normalizadora. Un a "dosis de secuencia de ensayo" es un parámetro que relaciona la densidad de etiqueta de secuencia de una secuencia de interés, por ejemplo cromosoma 21, con la de una secuencia normalizadora, por ejemplo cromosoma 9, determinada en una muestra de ensayo. De manera similar, una "dosis de secuencia calificada" es un parámetro que relaciona la densidad de etiqueta de secuencia de una secuencia de interés con la de una secuencia normalizadora determinada en una muestra calificada.
El término "densidad de etiqueta de secuencia" en la presente se refiere al número de lecturas de secuencia que se mapean para una secuencia del genoma de referencia, por ejemplo la densidad de etiqueta de secuencia para el cromosoma 21 es el número de lecturas de secuencia generadas por el método de secuenciación que se mapean para el cromosoma 21 del genoma de referencia. El término "proporción de densidad de etiqueta de secuencia" en la presente se refiere a la proporción del número de etiquetas de secuencia que se mapean para un cromosoma del genoma de referencia, por ejemplo cromosoma 21, para la longitud del cromosoma 21 del genoma de referencia.
El término "parámetro" en la presente se refiere a un valor numérico que caracteriza un conjunto de datos cuantitativos y/o una relación numérica entre conjuntos de datos cuantitativos. Por ejemplo, una proporción (o función de una proporción) entre el número de etiquetas de secuencia mapeadas para un cromosoma y la longitud del cromosoma para el que las etiquetas se mapean, es un parámetro.
El término "valor límite" y "valor límite calificado" en la presente se refieren a cualquier número que se calcula usando un conjunto de datos de calificación y sirve como un límite de diagnóstico de una variación del número de copias, por ejemplo una aneuploidía, en un organismo. Si el límite se excede por los resultados obtenidos de la práctica de la invención, un sujeto puede ser diagnosticado con una variación del número de copias, por ejemplo trisomía 21.
El término "lectura" se refiere a una secuencia de ADN de longitud suficiente (por ejemplo, al menos alrededor de 30 bp) que se puede usar para identificar una secuencia o región más grande, por ejemplo, que puede ser alineada y asignada específicamente a un cromosoma o región genómica o gen.
El término "etiqueta de secuencia" se usa en la presente de manera intercambiable con el término "etiqueta de secuencia mapeada" para referirse a una lectura de secuencia que ha sido asignada específicamente, es decir mapeada, a una secuencia más grande, por ejemplo un genoma de referencia, por alineamiento. Las etiquetas de secuencia mapeadas son mapeadas únicamente para un genoma de referencia, es decir son asignadas a una localización única para el genoma de referencia. Las etiquetas que pueden ser mapeadas para más de una localización en un genoma de referencia, es decir etiquetas que no mapean únicamente, no se incluyen en el análisis.
Los términos "alineada", alineamiento" o "alinear" se refieren a una o más secuencias que se identifican como una equivalencia en términos del orden de sus moléculas de ácidos nucleicos para una secuencia conocida de un genoma de referencia. Dicha alineamiento se puede hacer manualmente o por un algoritmo informático, los ejemplos incluyendo el programa de ordenador Efficient Local Alignment of Nucleotide Data (ELAND) distribuido como parte de la línea Illumina Genomics Analysis. La equivalencia de una lectura de secuencia en la alineamiento puede ser un 100% de equivalencia de secuencia o menor del 100% (equivalencia no perfecta).
El término "genoma de referencia" se refiere a cualquier secuencia del genoma conocida particular, ya sea
parcial o completa, de cualquier organismo o virus que pueda usarse para referenciar secuencias identificadas de un sujeto. Por ejemplo, un genoma de referencia usado para sujetos humanos así como muchos otros organismos se encuentra en el National Center for Biotechnology Information en www.ncbi.nlm.nih.gov. Un "genoma" se refiere a la información genética completa de un organismo o virus, expresada en secuencias de ácidos nucleicos.
El término "genoma de secuencias objetivo artificial" en la presente se refiere a una agrupación de secuencias conocidas que abarca alelos de sitios polimórficos conocidos. Por ejemplo, un "genoma de referencia SNP" es un genoma de secuencias objetivo artificial que comprende una agrupación de secuencias que abarca alelos de SNPs conocidas.
El término "secuencia clínicamente relevante" en la presente se refiere a una secuencia de ácidos nucleicos que se sabe o es sospechosa de estar asociada o implicada con una condición genético o enfermedad. Determinar la ausencia o presencia de una secuencia clínicamente relevante puede ser útil para determinar un diagnóstico o confirmar un diagnóstico de una condición médica, o proporcionar un pronóstico para el desarrollo de una enfermedad.
El término "derivado" cuando se usa en el contexto de un ácido nucleico o mezcla de ácidos nucleicos, en la presente se refiere al medio por el que se obtiene el ácido(s) nucleico de una fuente de la que es originario. Por ejemplo, en una realización, una mezcla de ácidos nucleicos que se deriva de dos genomas diferentes significa que los ácidos nucleicos, por ejemplo ADN libre de células, fueron liberados naturalmente por las células a través de procesos de origen natural como necrosis o apoptosis. En otra realización, una mezcla de ácidos nucleicos que se deriva de dos genomas diferentes significa que los ácidos nucleicos se extrajeron de dos tipos diferentes de células de un sujeto.
El término "muestra materna" se refiere en la presente a una muestra biológica obtenida de un sujeto embarazado, por ejemplo una mujer.
El término "muestra materna original" en la presente se refiere a una muestra biológica obtenida de un sujeto embarazado, por ejemplo una mujer, que sirve como la fuente de la que se extrae una porción para amplificar ácidos nucleicos objetivo polimórficos. La "muestra original" puede ser cualquier muestra obtenida de un sujeto embarazado, y las fracciones procesadas de la misma, por ejemplo una muestra de ADN libre de células purificada extraída de una muestra de plasma materno.
El término "fluido biológico" en la presente se refiere a un líquido tomado de una fuente biológica e incluye, por ejemplo, sangre, suero, plasma, esputo, líquido de lavado, fluido cerebroespinal, orina, semen, sudor, lágrimas, saliva y similares. Como se usa en la presente, los términos "sangre", "plasma" y "suero" abarcan expresamente fracciones o porciones procesadas de los mismos. De manera similar, cuando una muestra se toma de una biopsia, hisopo, frotis, etc., la "muestra" abarca expresamente una fracción procesada o porción derivada de la biopsia, hisopo, frotis, etc.
Los términos "ácidos nucleicos maternos" y "ácidos nucleicos fetales" en la presente se refieren a los ácidos nucleicos de un sujeto femenino embarazado y los ácidos nucleicos del feto que es llevado por la mujer embarazada, respectivamente.
El término "correspondiente a" en la presente se refiere a una secuencia de ácidos nucleicos, por ejemplo un gen o un cromosoma, que está presente en el genoma de diferentes sujetos, y que no tiene necesariamente la misma secuencia en todos los genomas, pero sirve para proporcionar la identidad en lugar de la información genética de una secuencia de interés, por ejemplo un gen o un cromosoma.
El término "sustancialmente libre de células" en la presente se refiere a preparaciones de la muestra deseada de la que los componentes que están normalmente asociados con él se han eliminado. Por ejemplo, una muestra de plasma se vuelve esencialmente libre de células eliminando células sanguíneas, por ejemplo, leucocitos, que están normalmente asociados con ella. En algunas realizaciones, se procesan muestras sustancialmente libres para eliminar células que contribuirían de otra manera al material genético deseado que se va a probar para una aneuploidía.
Como se usa en la presente, el término "fracción fetal" se refiere a la fracción de ácidos nucleicos fetales presentes en una muestra que comprende ácido nucleico fetal y materno.
Como se usa en la presente el término "cromosoma" se refiere al portador del gen que lleva la herencia de una célula viva que se deriva de cromatina y que comprende ADN y componentes de proteína (especialmente histonas). El sistema de numeración de cromosomas del genoma humano individuales internacionalmente reconocido convencional se usa en la presente.
Como se usa en la presente, el término "longitud de polinucleótido" se refiere al número absoluto de
moléculas de ácidos nucleicos (nucleótidos) en una secuencia o en una región de un genoma de referencia. El término "longitud de cromosoma" se refiere a la longitud conocida del cromosoma dada en pares de base, por ejemplo proporcionada en el montaje NCBI36/hg18 del cromosoma humano encontrado en la red mundial en genome.ucsc.edu/cgi-bin/hgTracks?hgsid=167155613 &chromInfoPage=
El término "sujeto" en la presente se refiere a un sujeto humano así como a un sujeto no humano como un mamífero, un invertebrado, un vertebrado, un hongo, una levadura, una bacteria y un virus. Aunque los ejemplos en la presente se refieren a humanos y el lenguaje está dirigido principalmente a preocupaciones humanas, el concepto de esta invención es aplicable a genomas de cualquier planta o animal, y es útil en los campos de medicina veterinaria, ciencias animales, laboratorios de investigación y demás.
El término "condición" en la presente se refiere a "condición médica" como un término amplio que incluye todas las enfermedades y trastornos, pero que también puede incluir lesiones y situaciones de salud normales, como el embarazo, que pueden afectar a la salud de una persona, beneficiarse de la asistencia médica, o tener implicaciones para tratamientos médicos.
DESCRIPCION
El método descrito en la presente es un método de secuenciación que permite la determinación simultánea de la fracción del componente del ácido nucleico fetal menor en una muestra que comprende una mezcla de ácidos nucleicos fetales y maternos. En particular, el método permite la determinación de la fracción de ADN libre de células aportado por un feto a la mezcla de ADN libre de células fetal y materno en una muestra materna, por ejemplo, una muestra de plasma. La diferencia entre la fracción materna y fetal se determina por la aportación relativa de un alelo polimórfico derivado del genoma fetal con la aportación del alelo polimórfico correspondiente derivado del genoma materno. Las secuencias polimórficas se pueden usar en conjunción con ensayos diagnósticos clínicamente relevantes como un control positivo para la presencia de ADN libre de células para resaltar resultados de falsos negativos o falsos positivos derivados de niveles bajos de ADN libre de células por debajo del límite de identificación. El método descrito en la presente es útil a través de un intervalo de estados gestacionales.
Las realizaciones ejemplares del método de la invención se ilustran en las Figuras 1-4 como sigue.
La Figura 1 proporciona un diagrama de flujo de una realización del método de la invención 100 para determinar simultáneamente una aneuploidía fetal y la fracción fetal de ácidos nucleicos fetales en una muestra biológica materna. En el paso 110 se obtiene de un sujeto una muestra de ensayo que comprende una mezcla de ácidos nucleicos fetales y maternos. La muestra es una muestra materna que se obtiene de una mujer embarazada, por ejemplo una mujer embarazada. Se puede usar cualquier muestra biológica materna como fuente de ácidos nucleicos fetales y maternos que estén contenidos en células o sean "libres de células". En algunas realizaciones, es ventajoso obtener una muestra materna que comprenda ácidos nucleicos libres de células, por ejemplo ADN libre de células. Preferiblemente, la muestra biológica materna es una muestra de fluido biológico. Una muestra biológica incluye, como ejemplos no limitativos, muestras de sangre, plasma, suero, sudor, lágrimas, esputo, orina, esputo, flujo del oídos, linfa, saliva, fluido cefalorraquídeo, estragos, suspensión de médula ósea, flujo vaginal, lavado transcervical, fluido cerebral, ascitis, leche, secreciones de los tractos respiratorio, intestinal y genitourinario y leucoforesis. En algunas realizaciones, la muestra de fluido biológico es una muestra que se puede obtener fácilmente por procedimientos no invasivos, por ejemplo, sangre, plasma, suero, sudor, lágrimas, esputo, orina, esputos, fluido del oído y saliva. En algunas realizaciones, la muestra biológica es una muestra de sangre periférica,
o fracciones del plasma y/o suero de la misma. En otras realizaciones la muestra es una mezcla de dos o más muestras biológicas, por ejemplo, una muestra biológica puede comprender dos o más de una muestra de fluido biológico. Como se usa en la presente, los términos "sangre", "plasma" y "suero" abarcan expresamente fracciones o porciones procesadas de los mismos. En algunas realizaciones, la muestra biológica se procesa para obtener una fracción de la muestra, por ejemplo plasma, que contiene la mezcla de ácidos nucleicos fetales y maternos. En algunas realizaciones, la mezcla de ácidos nucleicos fetales y maternos se procesa adicionalmente a partir de la fracción de la muestra, por ejemplo plasma, para obtener una muestra que comprende una mezcla purificada de ácidos nucleicos fetales y maternos, por ejemplo ADN libre de células. Los ácidos nucleicos libres de células, incluyendo del ADN libre de células, se pueden obtener por varios métodos conocidos en la técnica a partir de muestras biológicas que incluyen, pero no están limitadas a, plasma, suero y orina (Fan et al., Proc Natl Acad Sci 105:16266-16271 [2008]; Koide et al., Prenatal Diagnosis 25:604-607 [2005]; Chen et al., Nature Med. 2: 1033-1035 [1996]; Lo et al., Lancet 350: 485-487 [1997). Para separar el ADN de células libres de las células, se pueden usar métodos de fraccionamiento, centrifugación (por ejemplo centrifugación en gradiente de densidad), precipitación específica del ADN, o clasificación de células de alto rendimiento y/o separación. Hay disponibles kits comercialmente disponibles para la separación manual o automática de ADN libre de células (Roche Diagnostics, Indianapolis, IN, Qiagen,Valencia, CA, Macherey-Nagel, Duren, DE). En algunas situaciones, puede ser ventajoso fragmentar las moléculas de ácidos nucleicos en la muestra de ácido nucleico. La fragmentación puede ser aleatoria,
o puede ser específica, como se consigue, por ejemplo, usando digestión con endonucleasas de restricción. Los métodos para la fragmentación aleatoria son bien conocidos en la técnica, e incluyen, por ejemplo, digestión con ADNasa limitada, tratamiento alcalino y corte físico. En una realización, los ácidos nucleicos de la muestra se
obtienen de ADN libre de células, que no está sometido a fragmentación. En otras realizaciones, los ácidos nucleicos de la muestra se obtienen como ADN genómico, que está sometido a fragmentación en fragmentos de aproximadamente 500 o más pares de bases, y a los que se pueden aplicar fácilmente métodos de NGS.
En el paso 120 (Figura 1) la mezcla de ácidos nucleicos presente en la muestra se enriquece para ácidos nucleicos objetivo polimórficos que comprenden cada uno un sitio polimórfico. En algunas realizaciones, los ácidos nucleicos que se enriquecen son ADN libre de células. Los ácidos nucleicos objetivo son segmentos de material genético que se sabe que comprenden al menos un sitio polimórfico. En algunas realizaciones, los ácidos nucleicos objetivo comprenden un SNP. En otras realizaciones, los ácidos nucleicos objetivo comprenden una STR. El enriquecimiento de una mezcla de ácidos nucleicos fetales y maternos comprende amplificar secuencias objetivo de una porción de ácidos nucleicos contenidos en la muestra materna original, y combinar parte de o el producto amplificado completo con el resto de la muestra materna original. En el paso 130, se secuencia al menos una porción de la mezcla enriquecida, se identifican las diferencias de secuencia derivadas de la naturaleza polimórfica de las secuencias objetivo, y la contribución relativa de las de las secuencias polimórficas derivadas del genoma fetal, es decir la fracción fetal, se determina en el paso 140. En algunas realizaciones, la muestra materna original es una muestra de fluido biológico, por ejemplo plasma. En otras realizaciones, la muestra materna original es una fracción procesada de plasma que comprende ADN libre de células fetal y materno purificado.
Los sitios polimórficos que están contenidos en los ácidos nucleicos objetivo incluyen sin limitación polimorfismos de nucleótido simples (SNPs) SNPs en tándem, deleciones o inserciones multi-base a pequeña escala, denominadas IN-DELS (también denominadas polimorfismos de deleción inserción o DIPs), Polimorfismos Multi-Nucleótido (MNPs) y Repeticiones Cortas en Tándem (STRs). Los sitios polimórficos que están abarcados por el método de la invención están localizados en cromosomas autosómicos, permitiendo de esta manera la determinación de la fracción fetal independientemente del sexo del feto. Cualquier sitio polimórfico que pueda ser abarcado por las lecturas generadas por los métodos de secuenciación descritos en la presente se pueden usar para determinar simultáneamente la fracción fetal y la presencia o ausencia de una aneuploidía en una muestra materna.
En una realización, la mezcla de ácidos nucleicos fetales y maternos en la muestra está enriquecida para los ácidos nucleicos que comprenden al menos un SNP. En algunas realizaciones, cada ácido nucleico objetivo comprende una SNP individual, es decir una. Las secuencias de ácidos nucleicos objetivo que comprenden SNPs están disponibles en bases de datos públicamente accesibles incluyendo, pero no limitado a la Human SNP Database en la dirección web de la red mundial wi.mit.edu, la NCBI dbSNP Home Page en la dirección web de la red mundial ncbi.nlm.nih.gov, la dirección web de la red mundial lifesciences.perkinelmer.com, la base de datos Celera Human SNP en la dirección web de la red mundial celera.com, la base de datos de SNP del Genome Analysis Group (GAN) en la dirección web de la red mundial gan.iarc.fr. En una realización, los SNPs elegidos para enriquecer el ADN libre de células fetal y materno se seleccionan del grupo de 92SNPs de identificación de individuos (IISNPs) descrito por Pakstis et al. (Pakstis et al. Hum Genet 127:315-324 [2010]), que ha demostrado tener una variación muy pequeña en la frecuencia a través de las poblaciones (Fstz0,06), y ser altamente informativa en todo el mundo teniendo una heterocigosidad media de ≥0,4. Los SNPs que están abarcados por el método de la invención incluyen SNPs ligados y no ligados. Cada ácido nucleico objetivo comprende al menos un sitio polimórfico, por ejemplo un SNP individual, que difiere del presente en otro ácido nucleico objetivo para generar un panel de sitios polimórficos, por ejemplo SNPs, que contienen un número suficientes de sitios polimórficos de los cuales al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, al menos 10, al menos 11, al menos 12, al menos 13, al menos 14, al menos 15, al menos 16, al menos 17, al menos 18, al menos 19, al menos 20, al menos 25, al menos 30, al menos 35, al menos 40 o más son informativos. Por ejemplo, un panel de SNPs puede ser configurado para comprender al menos un SNP informativo. En una realización, los SNPs que son objetivos para la amplificación se seleccionan de rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs 4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005, y rs530022.
En otras realizaciones, cada ácido nucleico objetivo comprende dos o más SNPs, es decir cada ácido nucleico objetivo comprende SNPs en tándem. Preferiblemente, cada ácido nucleico objetivo comprende dos SNPs en tándem. Los SNPs en tándem son analizados como una única unidad como haplotipos cortos, y se proporcionan en la presente como conjuntos de dos SNPs. Para identificar secuencias de SNP en tándem adecuadas, se puede buscar la base de datos International HapMap Consortium (The International HapMap Project, Nature 426:789-796 [2003]). La base de datos está disponible en la red mundial en hapmap.org. En una realización, los SNPs en tándem que son objetivo para la amplificación se seleccionan de los siguientes conjuntos de parejas de tándem de SNPs rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980-rs987981; rs4143392-rs4143391; rs1691324-rs13050434; rs11909758-rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080-rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141
rs2246777; rs2832959-rs9980934; rs2833734-rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485rs3453; rs9974986-rs2834703; rs2776266-rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672.
En otra realización, la mezcla de ácidos nucleicos fetales y maternos en la muestra está enriquecida para los ácidos nucleicos objetivo que comprenden al menos una STR. Los loci de STR se encuentran en casi cualquier cromosoma en el genoma y pueden ser amplificados usando una variedad de cebadores de reacción en cadena de polimerasa (PCR). Se han preferido las repeticiones de tetranucleótidos entre los científicos forenses debido a su fidelidad en la amplificación por PCR aunque también se usan algunas repeticiones de tri-y pentanucleótidos. Un listado completo de referencias, hechos e información de secuencias sobre SRTs, cebadores de PCR publicados, sistemas múltiplex comunes, y datos de poblaciones relacionados están recopilados en la STRBase, a la que se puede acceder a través de la red mundial en ibm4.carb.nist.gov:8800/dna/home.htm. La información de secuencia del GenBank® (http://www2.ncbi.nlm.nih.gov/cgi-bin/genbank) para loci de STR usados comúnmente también es accesible a través de la STRBase. La naturaleza polimórfica de las secuencias de ADN repetidas en tándem que están ampliamente extendidas a través del genoma humano las han convertido en marcadores genéticos importantes para estudios de mapeado de genes, análisis de ligamiento, y pruebas de identidad humana. Debido al alto polimorfismo de las STRs, la mayoría de los individuos serán heterocigóticos, es decir la mayoría de la gente poseerá dos alelos (versiones) de cada uno heredado de cada padre con un número diferente de repeticiones. Por lo tanto, la secuencia de STR fetal heredad no maternalmente diferirá en el número de repeticiones de la secuencia materna. La amplificación de estas secuencias de STR resultará en dos productos de la amplificación principales correspondientes a los alelos maternos (y el alelo fetal heredado maternalmente) y un producto secundario correspondiente al alelo fetal no maternalmente heredado. Se informó primero de esta técnica en el 2000 (Pertl et al., Human Genetics 106:45-49 [2002]) y ha sido desarrollada posteriormente usando identificación simultanea de múltiples regiones diferentes de SRT usando PCR en tiempo real (Liu et al., Acta Obset Gyn Scand 86:535-541 [2007]). Por lo tanto, la fracción de ácido nucleico fetal en una muestra materna también puede determinarse secuenciando polimórficamente los ácidos nucleicos objetivo que comprenden STRs, que varían entre individuos en el número de unidades repetidas en tándem entre alelos. En una realización, la determinación simultánea de aneuploidía y fracción fetal comprende secuenciar al menos una porción de ácidos nucleicos fetales y maternos presentes en una muestra materna que se ha enriquecido para secuencias polimórficas que comprende STRs. Dado que el tamaño del ADN libre de células fetal es <300 bp, las secuencias polimórficas comprenden miniSTR, que pueden ser amplificadas para generar amplicones que son de longitudes de alrededor del tamaño de los fragmentos de ADN fetal circulante. El método puede usar uno o una combinación de cualquier número de miniSTRs informativos para determinar la fracción del ácido nucleico fetal. Por ejemplo, cualquiera o una combinación de cualquier número de miniSTRs, por ejemplo se pueden usar los miniSTRs divulgados en la Tabla 22. En una realización, la fracción de ácido nucleico fetal en una muestra materna se realiza usando un método que incluye determinar el número de copias del ácido nucleico materno y fetal presente en la muestra materna amplificando al menos un miniSTR autosómico elegido de CSF1PO, FGA, TH01, TPOX, vWA, D3S1358,D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, Penta D, Penta E, D2S1338, D1S1677, D2S441, D4S2364, D10S1248, D14S1434, D22S1045, D22S1045, D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627, y D1GATA113. En otra realización, el al menos un miniSTR autosómico es el grupo de mini STRs CSF1PO, FGA, D13S317, D16S539, D18S51, D2S1338, D21S11 y D7S820.
El enriquecimiento de la muestra para los ácidos nucleicos objetivo se consigue por métodos que comprenden amplificar específicamente secuencias de ácidos nucleicos objetivo que comprenden el sitio polimórfico. La amplificación de las secuencias objetivo puede realizarse por cualquier método que use PCR o variaciones del método incluyendo, pero no limitadas a, PCR asimétrico, amplificación dependiente de la helicasa, PCR hot-start, qPCR, PCR en fase sólida y PCR touchdown. Alternativamente, la replicación de las secuencias de ácidos nucleicos objetivo puede obtenerse por métodos independientes de enzimas, por ejemplo síntesis en fase sólida química usando las fosforamiditas. La amplificación de las secuencias objetivo se consigue usando pares de cebadores cada uno capaz de amplificar una secuencia de ácido nucleico objetico que comprende el sitio polimórfico, por ejemplo SNP, en una reacción de PCR multiplex. Las reacciones de PCR multiplex incluyen combinar al menos 2, al menos tres, al menos 3, al menos 5, al menos 10, al menos 15, al menos 20, al menos 25, al menos 30 al menos 30, al menos 35, al menos 40 o más conjuntos de cebadores en la misma reacción para cuantificar los ácidos nucleicos objetivo amplificados que comprenden al menos dos, al menos tres, al menos 5, al menos 10, al menos 15, al menos 20, al menos 25, al menos 30, al menos 30, al menos 35, al menos 40 o más sitios polimórficos en la misma reacción de secuenciación. Cualquier panel de conjuntos de cebadores se puede configurar para amplificar al menos una secuencia polimórfica informativa.
Amplificación de SNPs
Un número de cebadores de ácidos nucleicos están ya disponibles para amplificar fragmentos de ADN que
contienen los polimorfismos de SNP y sus secuencias se pueden obtener, por ejemplo, de las bases de datos anteriormente identificadas. También se pueden diseñar cebadores adicionales, por ejemplo, usando un método similar al publicado por Vieux, E. F., Kwok, P-Y and Miller, R. D. en BioTechniques (Junio 2002) Vol. 32. Suplemento: "SNPs: Discovery of Marker Disease, pp. 28-32. En una realización, se elige al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, al menos 10, al menos 11, al menos 12, al menos 13, al menos 14, al menos 15, al menos 16, al menos 17, al menos 18, al menos 19, al menos 20, al menos 25, al menos 30, al menos 35, al menos 40 o más conjuntos de cebadores para amplificar un ácido nucleico objetivo que comprende al menos un SNPs informativo en una porción de una mezcla de ADN libre de células fetal y materno. En una realización, los conjuntos de cebadores comprenden cebadores directos e inversos que abarcan al menos un SNP informativo seleccionado de rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs 4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005, y rs530022. Conjuntos ejemplares de cebadores que se usan para amplificar los SNPs divulgados en la presente se proporcionan en el Ejemplo 7 y las Tablas 10 y 11, y se divulgan como SEQ ID NOs:57-112. En otra realización, el grupo de 13 conjuntos de cebadores SEQ ID NOs:57-82 se usa para amplificar un ácido nucleico objetivo cada uno comprendiendo al menos un SNP, por ejemplo un SNP individual, en una porción de una mezcla de ADN libre de células fetal o materno.
En otra realización, se usa al menos un conjunto de cebadores para amplificar un ácido nucleico objetivo comprendiendo cada uno al menos un SNP en tándem, por ejemplo un conjunto de dos SNPs en tándem, en una porción de una mezcla de ADN libre de células fetal y materno. En una realización, los conjuntos son de cebadores que comprenden cebadores directos e inversos que abarcan al menos un SNP en tándem informativo seleccionado de rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980-rs987981; rs4143392-rs4143391; rs1691324-rs13050434; rs11909758-rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921rs2898102; rs2898102-rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080-rs2831524; rs4817219-rs4817220; rs2250911rs2250997; rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141-rs2246777; rs2832959 -rs9980934; rs2833734-rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485-rs3453; rs9974986-rs2834703; rs2776266-rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672.
Los cebadores usados para amplificar las secuencias objetivos que comprenden los SNPs en tándem están diseñados para abarcar ambos sitios de SNP. Conjuntos ejemplares de cebadores usados para amplificar los SNPs en tándem divulgados en la presente se proporcionan en el Ejemplo 12 y se divulgan como SEQ ID Nos:197-310.
La amplificación de ácidos nucleicos objetivo se realiza usando cebadores específicos de la secuencia que permiten la amplificación específica de la secuencia. Por ejemplo, los cebadores de PCR están diseñados para discriminar contra la amplificación de genes o parálogos similares que están en otros cromosomas tomando ventaja de las diferencias de secuencia entre el ácido nucleico objetivo y cualquier parálogo de otros cromosomas. Los cebadores de PCR directos o inversos están diseñados para hibridar cerca del sitio de SNP y para amplificar una secuencia de ácidos nucleicos de longitud suficiente para ser abarcada en las lecturas generadas por métodos de secuenciación masivamente paralelos. Algunos métodos de secuenciación masivamente paralelos requieren que la secuencia de ácidos nucleicos tenga una longitud mínima (bp) para permitir la amplificación por puente que puede usarse antes de la secuenciación. Por lo tanto, los cebadores de PCR usados para amplificar ácidos nucleicos objetivo están diseñados para amplificar secuencias que son de longitud suficiente para ser amplificadas por puente y para identificar SNPs que están abarcados por las lecturas de secuencia. En algunas realizaciones, el primero de dos cebadores en el conjunto de cebadores que comprende el cebador directo y el inverso para amplificar el ácido nucleico objetico está diseñado para identificar un SNP individual presente dentro de una lectura de secuencia de alrededor de 20bp, alrededor de 25bp, alrededor de 30bp, alrededor de 35bp, alrededor de 40bp, alrededor de 45bp, alrededor de 50bp, alrededor de 55bp, alrededor de 60bp, alrededor de 65bp, alrededor de 70bp, alrededor de 75bp, alrededor de 80bp, alrededor de 85bp, alrededor de90bp, alrededor de 95bp, alrededor de 100bp, alrededor de 110bp, alrededor de 120bp, alrededor de 130, alrededor de 140bp, alrededor de 150bp, alrededor de 200bp, alrededor de 250bp, alrededor de 300bp, alrededor de 350bp, alrededor de 400bp, alrededor de 450bp, o alrededor de 500bp. Se espera que los avances tecnológicos en tecnologías de secuenciación masivamente paralelas permitan lecturas de extremos individuales mayores de 500bp. En una realización, uno de los cebadores de PCR está diseñado para amplificar SNPs que están abarcados en lecturas de secuencia de 36 bp. El segundo cebador está diseñado para amplificar el ácido nucleico objetivo como un amplicón de longitud suficiente para permitir la amplificación por puente. en una realización, los cebadores de PCR ejemplares están diseñados para amplificar ácidos nucleicos objetivo que contienen un único SNP seleccionado de los SNPs rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs 4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485,
rs9788670, rs8137254, rs3143, rs2182957, rs3739005, y rs530022. En otras realizaciones, los cebadores directo e inverso están cada uno diseñados para amplificar ácidos nucleicos objetivo que comprenden cada uno un conjunto de dos SNPs en tándem, cada uno estando presente dentro de una lectura de secuencia de alrededor de 20bp, alrededor de 25bp, alrededor de 30bp, alrededor de 35bp, alrededor de 40bp, alrededor de 45bp, alrededor de 50bp, alrededor de 55bp, alrededor de 60bp, alrededor de 65bp, alrededor de 70bp, alrededor de 75bp, alrededor de 80bp, alrededor de 85bp, alrededor de90bp, alrededor de 95bp, alrededor de 100bp, alrededor de 110bp, alrededor de 120bp, alrededor de 130, alrededor de 140bp, alrededor de 150bp, alrededor de 200bp, alrededor de 250bp, alrededor de 300bp, alrededor de 350bp, alrededor de 400bp, alrededor de 450bp,o alrededor de 500bp. En una realización, al menos uno de los cebadores está diseñado para amplificar el ácido nucleico objetivo que comprende un conjunto de dos SNPs en tándem como un amplicón de longitud suficiente para permitir la amplificación por puente.
Los SNPs, Los SNPs individuales o en tándem, están contenidos en amplicones de ácidos nucleicos objetivo amplificados de al menos alrededor de 100bp, al menos alrededor de 150bp, al menos alrededor de 200bp, al menos alrededor de250bp, al menos alrededor de 300bp, al menos alrededor de 350bp, o al menos alrededor de 400bp. En una realización, los ácidos nucleicos objetivo que comprenden un sitio polimórfico, por ejemplo un SNP, son amplificados como amplicones de al menos alrededor de 110 bp, y que comprenden un SNP dentro de 36 bp del extremo 3' o 5' del amplicón. En otra realización, los ácidos nucleicos objetivo que comprenden dos o más sitios polimórficos, por ejemplo dos SNPs en tándem, son amplificados como amplicones de al menos alrededor de 110 bp, y que comprenden el primer SNP dentro de 36 bp del extremo 3' del amplicón, y/o el segundo SNP dentro de 36 bp del extremo 5' del amplicón.
Amplificación de STRs
Hay disponible una variedad de cebadores de ácidos nucleicos para amplificar fragmentos de ADN que contienen las STRs y sus secuencias se pueden obtener, por ejemplo, de las bases de datos identificadas anteriormente. Se han usado varios amplicones de PCR dimensionados para distinguir las distribuciones de tamaño respectivas de las especies de ADN fetal y materno, y han mostrado que las moléculas de ADN fetal en el plasma de mujeres embarazadas son generalmente más cortas que las moléculas de ADN materno (Chan et al., Clin Chem 50:8892 [2004]). El fraccionamiento del tamaño del ADN fetal circulante ha confirmado que la longitud media de los fragmentos de ADN fetal circulante es <300 bp, mientras que se ha estimado que el del ADN materno es de entre alrededor de 0,5 y 1Kb (Li et al., Clin Chem, 50: 1002-1011 [2004]). Estos descubrimientos son consistentes con los de Fan et al., que determinó usando NGS que el ADN libre de células fetal raramente es >340bp (Fan et al., Clin Chem 56:1279-1286 [2010]). El método de la invención abarca determinar la fracción de ácido nucleico fetal en una muestra materna que ha sido enriquecido con ácidos nucleicos objetivo cada uno comprendiendo una miniSTR que comprende cuantificar al menos un alelo fetal y uno materno en una miniSTR polimórfica, que puede ser amplificado para generar amplicones que son de longitudes de alrededor del tamaño de los fragmentos de ADN fetal circulante.
En una realización, el método comprende determinar el número de copias de al menos un alelo fetal y al menos uno materno al menos en una miniSTR polimórfica que se amplifica para generar amplicones que son menores de alrededor 300 bp, menores de alrededor 250 bp, menores de alrededor 200 bp, menores de alrededor 150 bp, menores de alrededor 100 bp o menores de alrededor 50 bp. En otra realización, los amplicones que se generan amplificando las miniSTRs son menores de alrededor de 300 bp. En otra realización, los amplicones que se generan amplificando las miniSTRs son menores de alrededor de 250 bp. En otra realización, los amplicones que se generan amplificando las miniSTRs son menores de alrededor de 200 bp. La amplificación del alelo informativo incluye usar cebadores de miniSTR, que permiten la amplificación de amplicones de tamaño reducido para distinguir alelos de STR que son menores de alrededor de 500 bp, menores de alrededor de 450 bp, menores de alrededor de 400 bp, menores de alrededor de 350 bp, menores de alrededor de 300 pares de bases (bp), menores de alrededor de 250 bp, menores de alrededor de 200 bp, menores de alrededor de 150 bp, menores de alrededor de 100 bp o menores de alrededor de 50 bp. Los amplicones de tamaño reducido generados usando los cebadores de miniSTR son conocidos como miniSTRs que se identifican de acuerdo con el nombre del marcador correspondiente al locus para el que han sido mapeados. En una realización, los cebadores de miniSTR incluyen cebadores de miniSTR que han permitido la máxima reducción de tamaño en el tamaño del amplicón para todos los 13 loci CODIS STR además de D2S1338, Penta D, y pentaE encontrados en los kits de STR comercialmente disponibles (Butler et al., J Forensic Sci 48:1054-1064 [2003]), los loci de miniSTR que no están ligados a los marcadores CODIS se describen por Coble y Butler (Coble and Butler, J Forensic Sci 50:43-53 [2005]), y otros miniSTRs se han caracterizado en el NIST. La información referente a los miniSTRs caracterizados en el NIST es accesible a través de la red mundial en cstl.nist.gov/biotech/strbase/newSTRs.htm. Cualquier par o una combinación de dos o más pares de cebadores de miniSTR se pueden usar para amplificar al menos un miniSTR. Por ejemplo, se selecciona al menos un conjunto de cebadores del conjunto CSF1PO_F (SEQ ID NO:81) y CSF1PO_R (SEQ ID NO:82), conjunto FGA_F (SEQ ID NO:83) y FGA_R (SEQ ID NO:84), conjunto TH01_F (SEQ ID NO:85) y TH01_R (SEQ ID NO:86), conjunto TPOX_F (SEQ ID NO:87) y TPOX_R (SEQ ID NO:88), conjunto vWA_F (SEQ ID NO:89) y vWA_R (SEQ ID NO:90), conjunto D3S1358_F (SEQ ID NO:91) y D3S1358_R (SEQ ID NO:92), conjunto D5S818_F (SEQ ID NO:93) y D5S818_R (SEQ ID NO:94), conjunto D7S820_F (SEQ ID NO:95) y D7S820_R (SEQ ID NO:96), conjunto D7S820_F (SEQ ID NO:97) y D7S820_R (SEQ ID NO:98), conjunto D13S317_F (SEQ ID NO:99) y D13S317_R (SEQ ID NO:100),
conjunto D16S539_F(SEQ ID NO:101) y D16S539_R (SEQ ID NO:102), conjunto D18S51_F (SEQ ID NO:103) y D18S51_R (SEQ ID NO:104), conjunto D21S11_F (SEQ ID NO:105) y D21S11_R (SEQ ID NO:106), conjunto D2S1338_F (SEQ ID NO:107) y D2S1338_R (SEQ ID NO:108), conjunto Penta D_F (SEQ ID NO:109) y Penta D_R (SEQ ID NO:110), conjunto Penta E_F (SEQ ID NO:111) y Penta E_R (SEQ ID NO:112), conjunto (D22S1045_F; SEQ ID NO:113) y D22S1045_F (SEQ ID NO:114), conjunto D20S1082_R (SEQ ID NO:115) y D20S1082_F (SEQ ID NO:116), conjunto D20S482_R (SEQ ID NO:117) y D20S482_F (SEQ ID NO:118), conjunto D18S853_R (SEQ ID NO:119) y D18S853_F (SEQ ID NO:120), conjunto D17S1301_F (SEQ ID NO:121) y D17S1301_R (SEQ ID NO:122), conjunto D17S974_F (SEQ ID NO:123) y D17S974_R (SEQ ID NO:124), conjunto D14S1434_F (SEQ ID NO:125) y D14S1434_R (SEQ ID NO:126), conjunto D12ATA63_F (SEQ ID NO:127) y D12ATA63_R (SEQ ID NO:128), D11S4463_F (SEQ ID NO:129) y D11S4463_R(SEQ ID NO:130), conjunto D10S1435_F (SEQ ID NO:131) y D10S1435_R (SEQ ID NO:132), conjunto D10S1248_F (SEQ ID NO:133) y D10S1248_R (SEQ ID NO:134), conjunto D9S2157_F (SEQ ID NO:135) y D9S2157_R (SEQ ID NO:136), conjunto D9S1122_F (SEQ ID NO:137) y D9S1122_R (SEQ ID NO:138), conjunto D8S1115_F (SEQ ID NO:139) y D8S1115_R (SEQ ID NO:140), conjunto D6S1017_F (SEQ ID NO:141) y D6S1017_R (SEQ ID NO:142), D6S474_F (SEQ ID NO:143) y D6S474_R (SEQ ID NO:144), conjunto D5S2500_F (SEQ ID NO:145) y D5S2500_R (SEQ ID NO:146), conjunto D4S2408_F (SEQ ID NO:147) y D4S2408_R (SEQ ID NO:148), conjunto D4S2364U_F (SEQ ID NO:149) y D4S2364U_R (SEQ ID NO:150), conjunto D3S452_F (SEQ ID NO:151) y D3S452_R (SEQ ID NO:152), conjunto D3S3053_F (SEQ ID NO:153) y D3S3053_R (SEQ ID NO:154), conjunto D2S1776_F (SEQ ID NO:155) y D2S1776_R (SEQ ID NO:156), conjunto D2S441_F (SEQ ID NO:157) y D2S441_R (SEQ ID NO:158), conjunto D1S1677_F (SEQ ID NO:159) y D1S1677_R (SEQ ID NO:160), conjunto D1S1627_F (SEQ ID NO:161) y D1S1627_R (SEQ ID NO:162), y conjunto D1GATA113_F (SEQ ID NO:163) y D1GATA113_R (SEQ ID NO:164).
El enriquecimiento de la muestra se obtiene amplificando ácidos nucleicos objetivo contenidos en una porción de la mezcla de ácidos nucleicos fetales y maternos en la muestra original, y combinando al menos una porción o todo el producto amplificado con el resto de la muestra no amplificada original. El enriquecimiento comprende amplificar los ácidos nucleicos objetivo que están contenidos en una porción de la muestra de fluido biológico. En una realización, la muestra que es enriquecida es la fracción de plasma de una muestra de sangre (ver Figura 2). Por ejemplo, una porción de una muestra de plasma materna original se usa para amplificar secuencias de ácidos nucleicos objetivo. Posteriormente, algo o todo el producto amplificado se combina con el resto de la muestra de plasma original no amplificada enriqueciéndola de esta manera (ver Ejemplo 10). En otra realización, la muestra que se enriquece en la muestra de ADN libre de células purificada que se extrae del plasma (ver Figura 3). Por ejemplo, el enriquecimiento comprende amplificar los ácidos nucleicos objetivo que están contenidos en una porción de una muestra original de mezcla purificada de ácidos nucleicos fetales y maternos, por ejemplo ADN libre de células que ha sido purificada de una muestra de plasma materno, y combinar posteriormente algo o todo el producto amplificado con el resto de la muestra purificada original no amplificada (ver Ejemplo 9). En otra realización, la muestra que es enriquecida es una muestra de biblioteca de secuenciación preparada de una mezcla purificada de ácidos nucleicos fetales y maternos (ver Figura 4). Por ejemplo, el enriquecimiento comprende amplificar los ácidos nucleicos objetivo que están contenidos en una porción de una muestra original de mezcla purificada de ácidos nucleicos fetales y maternos, por ejemplo ADN libre de células, que ha sido purificada de una muestra de plasma materno, preparar una primera biblioteca de secuenciación de secuencias de ácidos nucleicos no amplificados, preparar una segunda biblioteca de secuenciación de ácidos nucleicos polimórficos amplificados, y posteriormente combinar algo o toda la segunda biblioteca de secuenciación con algo o todo de la primera biblioteca de secuenciación (ver Ejemplo 8). La cantidad de producto amplificado que se usa para enriquecer la muestra original se selecciona para obtener suficiente información de secuenciación para determinar tanto la presencia como la ausencia de aneuploidía y la fracción fetal de la misma ejecución de secuenciación. Al menos alrededor del 3%, al menos alrededor del 5%, al menos alrededor del 7%, al menos alrededor del 10%, al menos alrededor del 15%, al menos alrededor del 20%, al menos alrededor del 25%, al menos alrededor del 30% o más del número total de etiquetas de secuencia obtenidas de la secuenciación se mapean para determinar la fracción fetal.
En el paso 130 (Figura 1), se secuencia la mezcla enriquecida de ácidos nucleicos fetales y maternos. La información de secuencia que se necesita para la determinación simultánea de aneuploidía y fracción fetal se puede obtener usando cualquiera de los métodos de secuenciación de ADN conocidos. En una realización, el método descrito en la presente emplea tecnología de secuenciación de próxima generación (NGS) en la que se secuencian plantillas de ADN amplificadas clonalmente o moléculas de ADN individuales de una forma masivamente paralela dentro de una célula de flujo (por ejemplo como se describe en Volkerding et al. Clin Chem 55:641-658 [2009]; Metzker M Nature Rev 11:31-46[2010]). Además de la información de la secuencia de alto rendimiento, la NGS proporciona información cuantitativa digital, en la que cada lectura de secuencia es una "etiqueta de secuencia" que se puede contar que representa una plantilla de ADN clonal individual o una molécula de ADN individual. Esta cuantificación permite al NGS expandir el concepto digital de contar moléculas de ADN libre de células (Fan et al., Proc Natl Acad Sci U S A 105:16266-16271 [2008]; Chiu et al., Proc Natl Acad Sci U S A 2008;105:20458-20463 [2008]). Las tecnologías de secuenciación de NGS incluyen pirosecuenciación, secuenciación por síntesis con terminadores de colorante reversibles, secuenciación por ligadura de sonda de oligonucleótidos y secuenciación en tiempo real.
Algunas de las tecnologías de secuenciación están disponibles comercialmente, como la plataforma de
secuenciación por hibridación de Affymetrix Inc. (Sunnyvale, CA) y las plataformas de secuenciación por síntesis de Life Sciences (Bradford, CT), Illumina/Solexa (Hayward, CA) y Helicos Biosciences (Cambridge, MA), y la plataforma de ligadura por secuenciación de Applied Biosystems (Foster City, CA), como se describe a continuación. Además de la secuenciación de moléculas individuales realizada usando la secuenciación por síntesis de Helicos Biosciences, se abarcan otras tecnologías de secuenciación de moléculas individuales por el método de la invención e incluyen la tecnología SMRT™ de Pacific Biosciences, la tecnología Ion Torrent™, y la secuenciación por nanoporos que está siendo desarrollada por, por ejemplo Oxford Nanopore Technologies.
Aunque el método Sanger automatizado se considera como una tecnología de "primera generación", la secuenciación Sanger que incluye secuenciación Sanger automatizada, también se puede emplear por el método de la invención. Los métodos de secuenciación adicionales que comprenden el uso de desarrollar tecnologías de formación de imágenes de ácidos nucleicos, por ejemplo microscopía de fuerza atómica (AFM) o microscopía electrónica de transmisión (TEM), también se abarcan por el método de la invención. Las tecnologías de secuenciación ejemplares se describen a continuación.
En una realización, la tecnología de secuenciación de ADN que se usa en el método de la invención es la Helicos True Single Molecule Sequencing (tSMS) (por ejemplo, como se describe en Harris T.D. et al., Science 320:106-109 [2008]). En la técnica tSMS, una muestra de ADN se escinde en cadenas de aproximadamente 100 a 200 nucleótidos, y se añade una secuencia polyA al extremo 3' de cada cadena de ADN. Cada cadena es etiquetada por la adición de un nucleótido de adenosina etiquetado fluorescentemente. Las cadenas de ADN son después hibridadas a una célula de flujo, que contiene millones de sitios de captura de oligo-T que se inmovilizan en la superficie de la célula de flujo. Las plantillas pueden estar a una densidad de alrededor de 100 millones de plantillas/cm2. La célula de flujo se carga entonces en un instrumento, por ejemplo, secuenciador HeliScope™, y un laser ilumina la superficie de la célula de flujo, revelando la posición de cada plantilla. Una cámara CCD puede mapear la posición de las plantillas en la superficie de la célula de flujo. La etiqueta fluorescente de la plantilla es después escindida y se hace desaparecer. La reacción de secuenciación empieza introduciendo una polimerasas de ADN y un nucleótido etiquetado por fluorescencia. El ácido nucleico oligo-T sirve como un cebador. La polimerasa incorpora los nucleótidos etiquetados al cebador de una manera dirigida a la plantilla. La polimerasa y los nucleótidos no incorporados se eliminan. Las plantillas que tienen incorporación directa del nucleótido etiquetado por fluorescencia se distinguen por formación de imágenes de la superficie de la célula de flujo. Después de la formación de imágenes, un paso de escindido elimina la etiqueta fluorescente, y el proceso se repite con otros nucleótidos etiquetados por fluorescencia hasta que se consigue la longitud de lectura deseada. La información de la secuencia se recoge con cada paso de adición de nucleótidos.
En una realización, la tecnología de secuenciación que se usa en el método de la invención es la secuenciación 454 (Roche) por ejemplo como se describe en Margulies, M. et al. Nature 437:376-380 [2005]). La secuenciación 454 supone dos pasos. En el primer paso, el ADN es cortado en fragmentos de aproximadamente 300-800 pares de base, y los fragmentos son terminados romos. Los adaptadores de oligonucleótidos son entonces ligados a los extremos de los fragmentos. Los adaptadores sirven como cebadores para la amplificación y secuenciación de los fragmentos. Los fragmentos pueden ser unidos a microesferas de captura de ADN, por ejemplo microesferas recubiertas de estreptavidina usando, por ejemplo Adaptador B, que contiene etiqueta de biotina 5'. Los fragmentos unidos a las microesferas se amplifican por PCR con gotitas de una emulsión de aceite-agua. El resultado son copias múltiples de fragmentos de ADN clonalmente amplificados en cada microesfera. En el segundo paso, las microesferas se capturan en pocillos (de tamaño de pico-litros). La pirosecuenciación se realiza en cada fragmento de ADN en paralelo. La adición de uno o más nucleótidos genera una señal de luz que se registra por una cámara CCD en un instrumento de secuenciación. La fuerza de la señal es proporcional al número de nucleótidos incorporado. La polisecuenciación hace uso de pirofosfato (PPi) que es liberado en el momento de la adición de nucleótidos. El PPi se convierte a ATP por ATP sulfurilasa en presencia de adenosina 5' fosfosulfato. La luciferasa usa ATP para convertir luciferina en oxiluciferina, y esta reacción genera luz que es distinguida y analizada.
En una realización, la tecnología de secuenciación de ADN que se usa en el método de la invención es la tecnología SOLiD™ (Applied Biosystems). En la secuenciación por ligadura SOLiD™, el ADN genómico es cortado en fragmentos, y los adaptadores se unen a los extremos 5' y 3' de los fragmentos para generar una biblioteca de fragmentos. Alternativamente, se pueden introducir adaptadores internos ligando adaptadores a los extremos 5' y 3' de los fragmentos, circularizando los fragmentos, digiriendo el fragmento circularizado para generar un adaptador interno, y uniendo los adaptadores a los extremos 5' y 3' de los fragmentos resultantes para generar una biblioteca de compañeros emparejadas. Después, se preparan las poblaciones de microesferas clonales en microreactores que contienen microesferas, cebadores, plantilla y componentes de PCR. Después del PCR, las plantillas se desnaturalizan y las microesferas se enriquecen para separar las microesferas con plantillas extendidas. Las plantillas en las microesferas seleccionadas se someten a una modificación 3' que permite el enlace con un portaobjetos de vidrio. La secuencia se puede determinar por hibridación secuencial y ligadura de oligonucleótidos parcialmente aleatorios con una base central determinada (o pares de bases) que se identifica por un fluoróforo específico. Después de que se registra un color, el oligonucleótido ligado es escindido y eliminado y el proceso es después repetido.
En una realización, la tecnología de secuenciación de ADN que se usa en el método de la invención es la tecnología de secuenciación de molécula individual, en tiempo real (SMRT™) de Pacific Biosciences. En la secuenciación SMRT, la incorporación continua de nucleótidos marcados con colorante se forma en imágenes durante la síntesis del ADN. Las moléculas de polimerasa de ADN individual se unen a la superficie inferior de los identificadores de longitud de onda de modo cero individuales (identificadores ZMW) que obtienen información de la secuencia a la vez que los nucleótidos fosfoligados están siendo incorporados en la cadena del cebador creciente. Un ZMW es una estructura de confinamiento que permite la observación de incorporación de un nucleótido individual por ADN polimerasa contra el fondo de los nucleótidos fluorescentes que se difunden rápidamente dentro y fuera del ZMW (en microsegundos). Toma varios milisegundos el incorporar un nucleótido en una cadena creciente. Durante este tiempo, la etiqueta fluorescente se excita y produce una señal fluorescente, y la etiqueta fluorescente se escinde. La identificación de la fluorescencia correspondiente del colorante indica que base se incorporó. El proceso se repite.
En una realización, la tecnología de secuenciación de ADN que se usa en el método de la invención es secuenciación por nanoporos (por ejemplo, como se describe en Soni GV y Meller A. Clin Chem 53: 1996-2001 [2007]). Las técnicas de análisis de ADN de secuenciación por nanoporos se están desarrollando industrialmente por una variedad de compañías, incluyendo Oxford Nanopore Technologies (Oxford, Reino Unido). La secuenciación por nanoporos es una tecnología de secuenciación de una sola molécula por la que una única molécula de ADN se secuencia directamente a medida que pasa a través de un nanoporo. Un nanoporo es un agujero pequeño, del orden de 1 nanómetro de diámetro. La inmersión de un nanoporo en un fluido conductor y la aplicación de un potencial (voltaje) a través de él resulta en una ligera corriente eléctrica debido a la conducción de iones a través del nanoporo. La cantidad de corriente que fluye es sensible al tamaño y forma del nanoporo. A medida que una molécula de ADN pasa a través de un nanoporo, cada nucleótido en la molécula de ADN obstruye el nanoporo a un grado diferente, cambiando la magnitud de la corriente a través del nanoporo en grados diferentes. Así, este cambio en la corriente a medida que la molécula de ADN pasa a través del nanoporo representa una lectura de la secuencia de ADN.
En una realización, la tecnología de secuenciación de ADN que se usa en el método de la invención es la matriz de transistor de efecto de campo sensible a sustancias químicas (chemFET) (por ejemplo, como se describe en la Publicación de Solicitud de Patente U.S. Nº 20090026082). En un ejemplo de la técnica, las moléculas de ADN pueden ser colocadas en cámaras de reacción, y las moléculas de la plantilla pueden ser hibridadas a un cebador de secuenciación enlazado a una polimerasa. La incorporación de uno o más trifosfatos en una nueva cadena de ácidos nucleicos en el extremo 3' del cebador de secuenciación puede distinguirse por un cambio en la corriente por un chemFET. Una matriz puede tener múltiples sensores de chemFET. En otro ejemplo, los ácidos nucleicos individuales pueden estar unidos a microesferas, y los ácidos nucleicos pueden amplificarse en la microesfera, y las microesferas individuales pueden transferirse a cámaras de reacción individuales en una matriz de chemFET, con cada cámara teniendo un sensor de chemFET, y los ácidos nucleicos se pueden secuenciar.
En una realización, la tecnología de secuenciación de ADN que se usa en el método de la invención es el método de Halcyon Molecular que usa microscopía electrónica de transmisión (TEM). El método denominado Nano Transferencia Rápida de Colocación de Moléculas Individuales (IMPRNT), comprende utilizar formación de imágenes por microscopía electrónica de transmisión de resolución de átomos individuales de ADN de alto peso molecular (150kb o mayor) etiquetado selectivamente con marcadores de átomos pesados y organizar estas moléculas en películas ultra finas en matrices paralelas ultra-densas (3nm de cadena a cadena) con separación base a base consistente. El microscopio electrónico se usa para formar imágenes de las moléculas en las películas para determinar la posición de marcadores de átomos pesados y para extraer información de la secuencias de bases del ADN. El método se describe adicionalmente en la publicación de patente de PCT WO2009/046445. El método permite secuenciar completamente genomas humanos en menos de diez minutos.
En una realización, la tecnología de secuenciación de ADN es la secuenciación de moléculas individuales Ion Torrent, que empareja tecnología de semiconductores con una química de secuenciación simple para traducir directamente información codificada químicamente (A, C, G, T) en información digital (0, 1) en un chip semiconductor. En la naturaleza, cuando se incorpora un nucleótido en una cadena de ADN por una polimerasa, se libera un ion de hidrógeno como un subproducto. La Ion Torrent usa una matriz de alta densidad de pocillos de micro-mecanizado para realizar este proceso bioquímico de una manera masivamente paralela. Cada pocillo mantiene una molécula de ADN diferente. Por debajo de los pocillos hay una capa sensible a los iones y por debajo de esa un sensor de iones. Cuando se añade un nucleótido, por ejemplo uno C, a una plantilla de ADN y es después incorporado en una cadena de AN, se liberará un ion de hidrógeno. La carga de ese ion cambiará el pH de la solución, que puede ser identificado por el sensor de iones del Ion Torrent. El secuenciador -esencialmente el medidor de pH en estado sólido más pequeño del mundo, designa la base, yendo directamente de la información química a la información digital. El secuenciador Ion personal Genome Machine (PGM™) inunda después secuencialmente el chip con un nucleótido después de otro. Si el siguiente nucleótido que inunda el chip no es una equivalencia, no se registrará cambio de voltaje y no se designará una base. Di hay dos bases idénticas en la cadena de ADN, el voltaje será doble, y el chip registrará dos bases idénticas designadas. La identificación directa permite el registro de la incorporación de nucleótidos en segundos.
Otros métodos de secuenciación incluyen PCR digital y secuenciación por hibridación. La reacción en cadena de polimerasa digital (PCR digital o dPCR) se puede usar para identificar directamente y cuantificar ácidos nucleicos en una muestra. La PCR digital puede realizarse en una emulsión. Los ácidos nucleicos individuales se separan, por ejemplo, en un dispositivo de cámara de microfluidos, y cada ácido nucleico es amplificado individualmente por PCR. Los ácidos nucleicos pueden ser separados de tal manera que haya una media de aproximadamente 0,5 ácidos nucleicos/pocillo, o no más de un ácido nucleico/pocillo. Se pueden usar diferentes sondas para distinguir alelos fetales y alelos maternos. Los alelos se pueden enumerar para determinar el número de copias. En la secuenciación por hibridación, la hibridación comprende poner en contacto la pluralidad de secuencias de polinucleótidos con una pluralidad de sondas de polinucleótidos, en donde cada una de la pluralidad de sondas de polinucleótidos puede estar atada opcionalmente a un sustrato. El sustrato puede ser una superficie plana que comprende una matriz de secuencias de nucleótidos conocidas. El patrón de hibridación a la matriz puede usarse para determinar las secuencias de polinucleótidos presentes en la muestra. En otras realizaciones, cada sonda está atada a una microesfera, por ejemplo, una microesfera magnética o similar. La hibridación a las microesferas puede identificarse y usarse para identificar la pluralidad de secuencias de polinucleótidos dentro de la muestra.
En una realización, el método emplea secuenciación masivamente paralela de millones de fragmentos de ADN usando la secuenciación por síntesis de Illumina y química de secuenciación basada en terminadores reversible (por ejemplo como se describe en Bentley et al., Nature 6:53-59 [2009]). El ADN de la plantilla puede ser ADN genómico, por ejemplo ADN libre de células. En algunas realizaciones, se usa el ADN genómico de células aisladas como la plantilla, y se fragmenta en longitudes de varios cientos de pares de bases. En otras realizaciones, se usa ADN libre de células como la plantilla, y no se requiere fragmentación ya que el ADN libre de células existe como fragmentos cortos. Por ejemplo el ADN libre de células fetal circula en el torrente sanguíneo como fragmentos de <300 bp, y se ha estimado que el ADN libre de células materno circula como fragmentos de entre alrededor de 0,5 y 1 Kb (Li et al., Clin Chem, 50: 1002-1011 [2004]). La tecnología de secuenciación Illumina se basa en la unión de ADN genómico fragmentado con una superficie plana, ópticamente trasparente en la que los anclajes de oligonucleótidos se enlazan. El ADN de la plantilla se repara en los extremos para generar extremos romos 5'fosforilados, y la actividad de polimerasa del fragmento Klenow se usa para añadir una única base A al extremo 3' de los fragmentos de ADN fosforilados romos. Esta adición prepara los fragmentos de ADN para la ligadura con adaptadores de oligonucleótidos, que tienen un saliente de una única base T en sus extremos 30 para aumentar la eficiencia de la ligadura. Los oligonucleótidos adaptadores son complementarios a los anclajes de las células de flujo. Bajo condiciones de dilución limitativas se añade ADN de plantilla modificado por adaptadores, de una sola cadena a la célula de flujo y se inmovilizan por hibridación a los anclajes. Los fragmentos de ADN unidos se extienden y se amplifican por puente para crear una célula de flujo de secuenciación de ultra-alta densidad con cientos de millones de clústeres, cada uno conteniendo ~1000 copias de la misma plantilla. En una realización, el ADN genómico fragmentado aleatoriamente, por ejemplo ADN libre de células, se amplifica usando PCR antes de que se someta a amplificación de clústeres. Alternativamente, se usa una preparación de biblioteca genómica libre de amplificación, y el ADN genómico fragmentado aleatoriamente, por ejemplo ADN libre de células se enriquece usando sólo la amplificación de clústeres (Kozarewa et al., Nature Methods 6:291-295 [2009]). Las plantillas se secuencian usando una tecnología de secuenciación por síntesis de ADN de cuatro colores robusta que emplea terminadores reversibles con colorantes fluorescentes extraíbles. La identificación por fluorescencia de alta sensibilidad se consigue usando excitación por laser y ópticas de reflexión internas totales. Las lecturas de secuencias cortas de alrededor de 20-40 bp, por ejemplo 36 bp, se alinean contra un genoma de referencia enmascarado de repetición y las diferencias genéticas se designan usando software de línea de análisis de datos especialmente desarrollado. Después de la terminación de la primera lectura, las plantillas pueden generarse in situ para permitir una segunda lectura del extremo opuesto de los fragmentos. Así, se usa cualquier secuenciación de extremos emparejados o de único extremo de los fragmentos de ADN de acuerdo con el método. Se realiza la secuenciación parcial de fragmentos de ADN presentes en la muestra, y se cuentan las etiquetas de secuencia que comprenden lecturas de longitud predeterminada , por ejemplo 36 bp, que son mapeadas para un genoma de referencia conocido. En una realización, la secuencia del genoma de referencia es la secuencia NCB136/hg18 que está disponible en la red mundial en genome.ucsc.edu/cgibin/hgGateway?org=Human&db=hg18&hgsid=166260105). Otras fuentes de información de secuencias públicas incluyen el GenBank, dbEST, dbSTS, EMBL (el Laboratorio de Biología Molecular Europeo), y el DDBJ (el Banco de datos de ADN de Japón). Hay disponibles un número de algoritmos informáticos para alinear secuencias, incluyendo sin limitación (Altschul et al., 1990), BLITZ (MPsrch) (Sturrock & Collins, 1993), FASTA (Person & Lipman, 1988), BOWTIE (Langmead et al., Genome Biology 10:R25.1-R25.10 [2009]), o ELAND (Illumina, Inc., San Diego, CA, USA). En una realización, un extremo de las copias expandidas clonalmente de las moléculas de ADN libre de células de plasma se secuencia y procesa por análisis de alineamiento bioinformático para el Illumina Genome Analyzer que usa el software Efficient Large-Scale Alignment of Nucleotide Databases (ELAND).
La longitud de la lectura de secuencia está asociada con la tecnología de secuenciación particular. Los métodos NGS proporcionan lecturas de secuencias que varían de tamaño de decenas a cientos de pares de bases. En algunas realizaciones del método descrito en la presente las lecturas de secuencia son de alrededor de 20bp, de alrededor de 25bp, de alrededor de 30bp, de alrededor de 35bp, de alrededor de 40bp, de alrededor de 45bp, de
alrededor de 50bp, de alrededor de 55bp, de alrededor de 60bp, de alrededor de 65bp, de alrededor de 70bp, de alrededor de 75bp, de alrededor de 80bp, de alrededor de 85bp, de alrededor de 90bp, de alrededor de 95bp, de alrededor de 100bp, de alrededor de 110bp, de alrededor de 120bp, de alrededor de 130, de alrededor de 140bp, de alrededor de 150bp, de alrededor de 200bp, de alrededor de 250bp, de alrededor de 300bp, de alrededor de 350bp, de alrededor de 400bp, de alrededor de 450bp, o de alrededor de 500bp. Se espera que los avances tecnológicos permitan lecturas de extremos individuales de más de 500 bp permitiendo lecturas de más de alrededor de 1000 bp cuando se generan lecturas de extremos emparejados. En una realización, las lecturas de secuencia son 36 bp. Otros métodos de secuenciación que se pueden empelar por el método de la invención incluyen métodos de secuenciación de moléculas individuales que pueden secuenciar moléculas de ácidos nucleicos de >5000 bp. La cantidad masiva de salida de secuencia se transfiere por una línea de análisis que transforma salida de formación de imagen primaria del secuenciador en cuerdas de bases. Un paquete de algoritmos integrados realiza los pasos de transformación de datos primarios del núcleo: análisis de imágenes, puntuación de intensidad, designación de bases y alineamiento.
En una realización, se realiza la secuenciación parcial de fragmentos de ADN presentes en la muestra y se cuentan las etiquetas de secuencia que comprenden lecturas de longitud predeterminada, por ejemplo 36 bp, que mapean para un genoma de referencia conocido. Sólo se cuentan como etiquetas de secuencia las lecturas de secuencia que alinean únicamente con el genoma de referencia. En una realización, el genoma de referencia es la secuencia del genoma de referencia humano NCBI36/ hg 18, que está disponible en la red mundial en genome.ucsc.edu/cgi-bin/hgGateway?org=Human&db=hg18&hgsid=166260105). Otras fuentes de información de secuencias públicas incluyen GenBank, dbEST, dbSTS, EMBL (el Laboratorio de Biología Molecular Europeo), y el DDBJ (el Banco de datos de ADN de Japón). En otra realización el genoma de referencia comprende la secuencia del genoma de referencia humano NCBI36/hg18 y un genoma de secuencias objetivo artificiales, que incluye secuencias objetivo polimórficas, por ejemplo un genoma SNP. El mapeado de las etiquetas de secuencia se consigue comparando la secuencia de la etiqueta con la secuencia del genoma de referencia para determinar el origen cromosómico del molécula de ácidos nucleicos secuenciada (por ejemplo ADN libre de células), y la información de la secuencia genética específica no se necesita. Hay disponibles una variedad de algoritmos informáticos para alinear secuencias, incluyendo sin limitación BLAST (Altschul et al., 1990), BLITZ (MPsrch) (Sturrock & Collins, 1993), FASTA (Person & Lipman, 1988), BOWTIE (Langmead et al., Genome Biology 10:R25.1R25.10 [2009]), o ELAND (Illumina, Inc., San Diego, CA, USA). En una realización, un extremo de las copias expandidas clonalmente de las moléculas de ADN libre de células del plasma se secuencia y procesa por análisis de alineamiento bioinformático para el Illumina Genome Analyzer que usa el software Efficient Large-Scale Alignment of Nucleotide Databases (ELAND). El análisis de la información de secuenciación para la determinación de aneuploidía puede permitir un pequeño grado de discrepancia (0-2 discrepancias por etiqueta de secuencia) para dar cuenta de los polimorfismos menores que pueden existir entre el genoma de referencia y los genomas en la muestra mezclada. El análisis de la información de secuenciación para la determinación de la fracción fetal puede permitir un pequeño grado de discrepancia dependiendo de la secuencia polimórfica. Por ejemplo, se puede permitir un pequeño grado de discrepancia si la secuencia polimórfica es una STR. En casos donde la secuencia polimórfica es un SNP, todas las secuencias que coinciden exactamente con cualquiera de los dos alelos en el sitio del SNP se cuentan primero y se filtran de las lecturas restantes, para las que se puede permitir un pequeño grado de discrepancia.
En el paso 140, la información de secuencia obtenida en el paso 130 se analiza y se hace la determinación simultánea de la fracción fetal y la determinación de la presencia o ausencia de aneuploidía.
Se obtienen una pluralidad de etiquetas de secuencia por muestra. En algunas realizaciones, se obtienen al menos alrededor de 3 x 106 etiquetas de secuencia al menos alrededor de 5 x 106 etiquetas de secuencia, al menos alrededor de 8 x 106 etiquetas de secuencia, al menos alrededor de 10 x 106 etiquetas de secuencia, al menos alrededor de 15 x 106 etiquetas de secuencia, al menos alrededor de 20 x 106 etiquetas de secuencia, al menos alrededor de 30 x 106 etiquetas de secuencia, al menos alrededor de 40 x 106 etiquetas de secuencia, o al menos alrededor de 50 x 106 etiquetas de secuencia que comprenden entre 20 y 40bp de lecturas de mapear las lecturas para el genoma de referencia por muestra. En una realización, todas las lecturas de secuencia se mapean para todas las regiones del genoma de referencia. En una realización, se cuentan las etiquetas que comprenden lecturas que han sido mapeadas para todas las regiones, por ejemplo todos los cromosomas del genoma de referencia humano, y les determina a aneuploidía fetal, es decir la sobre-o sub-representación de una secuencia de interés, por ejemplo un cromosoma o porción del mismo, en la muestra de ADN mezclado, y se cuentan las etiquetas que comprenden lecturas que se mapean para el genoma de secuencias objetivo artificiales para determinar la fracción fetal. El método no requiere diferenciación entre los genomas maternos y fetales.
Determinación de aneuploidía
La precisión requerida para determinar correctamente si hay presencia o ausencia de una aneuploidía en una muestra se determina en parte por la variación del número de etiquetas de secuencia que mapean para el genoma de referencia entre las muestras de una ejecución de secuenciación (variabilidad inter-cromosómica), y la variación del número de etiquetas de secuencia que mapean para el genoma de referencia en diferentes ejecuciones
de secuenciación (variabilidad inter-secuenciación). Por ejemplo, las variaciones pueden ser particularmente pronunciadas para etiquetas que mapean para secuencias de referencia ricas en GC o pobres en GC. En una realización, el método usa información de secuenciación para calcular la dosis de cromosoma, que cuenta intrínsecamente para la variabilidad acumulada derivada de la variabilidad intercromosómica, inter-secuenciación y dependiente de la plataforma. Las dosis de cromosomas se determinan de la información de la secuenciación, es decir, el número de etiquetas de secuencia, para la secuencia de interés, por ejemplo cromosoma 21, y el número de etiquetas de secuencia para una secuencia normalizadora. La identificación de una secuencia normalizadora se realiza en un conjunto de muestras calificadas que se sabe no contienen una aneuploidía de la secuencia de interés. El diagrama de flujo proporcionado en la Figura 5 muestra el proceso 500 por el que se identifican las secuencias normalizadoras, por ejemplo cromosomas normalizadores, y se determina la presencia o ausencia de una aneuploidía. En el paso 510, se obtiene un conjunto de muestras maternas calificadas para identificar secuencias normalizadoras calificadas, por ejemplo cromosomas normalizadores, y para proporcionar valores de varianza para su uso en determinar la identificación estadísticamente significativa de una aneuploidía en las muestras de ensayo. En el paso 510, se obtiene una pluralidad de muestras biológicas calificadas de una pluralidad de sujetos que se sabe comprenden células que tienen un número de copias normales para cualquiera de las secuencias de interés, por ejemplo un cromosoma de interés, como el cromosoma asociado con una aneuploidía. En una realización, las muestras calificadas se obtienen de madres embarazadas con un feto que se ha confirmado usando medios citogenéticos que tienen un número de copias normal de cromosomas en relación con el cromosoma de interés. Las muestras maternas calificadas biológicas pueden ser muestras de fluidos biológicos, por ejemplo muestras de plasma, o cualquier muestra adecuada como se ha descrito anteriormente que contenga una mezcla de moléculas de ADN libre de células fetal o materno.
En el paso 520, se secuencia al menos una porción de cada uno de todos los ácidos nucleicos calificados contenidos en las muestras maternas calificadas. Antes de la secuenciación, la mezcla de ácidos nucleicos fetales y maternos, por ejemplo ADN libre de células purificado, se modifica para preparar una biblioteca de secuenciación para generar lecturas de secuencia de entre 20 y 40 bp, por ejemplo 36 bp, que están alineadas a un genoma de referencia, por ejemplo hg18. En algunas realizaciones, las lecturas de secuencia comprenden alrededor de 20bp, alrededor de 25bp, alrededor de 30bp, alrededor de 35bp, alrededor de 40bp, alrededor de 45bp, alrededor de 50bp, alrededor de 55bp, alrededor de 60bp, alrededor de 65bp, alrededor de 70bp, alrededor de 75bp, alrededor de 80bp, alrededor de 85bp, alrededor de90bp, alrededor de 95bp, alrededor de 100bp, alrededor de 110bp, alrededor de 120bp, alrededor de 130, alrededor de 140bp, alrededor de 150bp, alrededor de 200bp, alrededor de 250bp, alrededor de 300bp, alrededor de 350bp, alrededor de 400bp, alrededor de 450bp, o alrededor de 500bp. Se espera que los avances tecnológicos permitan lecturas de extremos individuales de más de 500bp permitiendo lecturas de más de alrededor de 1000bp cuando se generan lecturas de extremos emparejados. En una realización, las lecturas de secuencia comprenden 36bp. Las lecturas de secuencia están alineadas a un genoma de referencia humano, y las lecturas que se mapean únicamente para el genoma de referencia humana se cuentan como etiquetas de secuencia. En una realización, se obtienen al menos alrededor de 3 x 106 etiquetas de secuencia calificadas, al menos alrededor de 5 x 106 etiquetas de secuencia calificadas, al menos alrededor de 8 x 106 etiquetas de secuencia calificadas, al menos alrededor de 10 x 106 etiquetas de secuencia calificadas, al menos alrededor de 15 x 106 etiquetas de secuencia calificadas, al menos alrededor de 20 x 106 etiquetas de secuencia calificadas, al menos alrededor de 30 x 106 etiquetas de secuencia calificadas, al menos alrededor de 40 x 106 etiquetas de secuencia calificadas, o al menos alrededor de 50 x 106 etiquetas de secuencia calificadas, que comprende lecturas de entre 20 y 40bp se obtienen de lecturas que mapean únicamente para un genoma de referencia.
En el paso 530, todas las etiquetas obtenidas de la secuenciación de ácidos nucleicos en las muestras maternas calificadas se cuentan para determinar una densidad de etiqueta de secuencia calificada. En una realización la densidad de etiqueta de secuencia se determina como el número de etiquetas de secuencia calificadas mapeadas para la secuencia de interés en el genoma de referencia. En otra realización, la densidad de etiqueta de secuencia calificad se determina como el número de etiquetas de secuencia calificadas mapeadas para una secuencia de interés normalizada a la longitud de la secuencia calificada de interés para la que se mapean. Las densidades de etiqueta de secuencia que se determinan como una proporción de la densidad de etiqueta en relación a la longitud de la secuencia de interés se refieren en al presente como proporciones de densidad de etiqueta. La normalización a la longitud de la secuencia de interés no se requiere, y puede ser incluida como un paso para reducir el número de dígitos en un número para simplificarla para la interpretación humana. Como todas las etiquetas de secuencia calificadas se mapean y cuentan en cada una de las muestras calificadas, la densidad de etiqueta de secuencia para una secuencia de interés, por ejemplo cromosoma de interés, se determina en las muestras calificadas, como lo son las densidades de etiquetas de secuencia para las secuencias adicionales de las que se identifican posteriormente las secuencias normalizadoras, por ejemplo cromosomas. En una realización, la secuencia de interés es un cromosoma que está asociado con una aneuploidía cromosómica, por ejemplo cromosoma 21, y la secuencia normalizadora calificada es un cromosoma que no está asociado con una aneuploidía cromosómica y cuya variación en la densidad de etiqueta de secuencia se aproxima mejor a la del cromosoma 21. Por ejemplo, una secuencia normalizadora calificada es una secuencia que tiene la variabilidad más pequeña. En algunas realizaciones, la secuencia normalizadora es una secuencia que distingue mejor una o más muestras calificadas de una o más muestras afectadas, es decir, la secuencia normalizadora es una secuencia que tiene la diferenciabilidad más alta. El nivel de diferenciabilidad puede determinarse como una diferencia estadística entre las
dosis de cromosomas en una población de muestras calificadas y las dosis de cromosomas en una o más muestras de ensayo. En otra realización, la secuencia de interés es un segmento de un cromosoma asociado con una aneuploidía parcial, por ejemplo una deleción o inserción cromosómica, o translocación cromosómica desequilibrada, y la secuencia normalizadora es un segmento cromosómico que no está asociado con la aneuploidía parcial y cuya variación en la densidad de etiqueta de secuencia mejor se aproxima a la del segmento de cromosoma asociado con la aneuploidía parcial
En el paso 540, en base a las densidades de etiquetas calificadas calculadas, se determina una dosis de secuencia calificada para una secuencia de interés como la proporción de la densidad de etiqueta de secuencia para la secuencia de interés y la densidad de etiqueta de secuencia calificada para secuencias adicionales de las que se identifican posteriormente secuencias normalizadoras. En una realización, las dosis para el cromosoma de interés, por ejemplo, cromosoma 21, se determinan como una proporción de la densidad de etiqueta de secuencia del cromosoma 21 y la densidad de etiqueta de secuencia para cada uno de los cromosomas restantes, es decir cromosomas 1-20, cromosoma 22, cromosoma X y cromosoma Y.
En el paso 545, una secuencia normalizadora, por ejemplo un cromosoma normalizador, se identifica para una secuencia de interés, por ejemplo cromosoma 21, en una muestra calificada basada en las dosis de secuencias calculadas. El método identifica secuencias que tienen inherentemente características similares y que son propensas a variaciones similares entre muestras y ejecuciones de secuenciación, y que son útiles para determinar dosis de secuencias en muestras de ensayo. En algunas realizaciones, la secuencia normalizadora es una que diferencia mejor una muestra afectada, por ejemplo una muestra aneuploide, de una o más de las muestras calificadas. En otras realizaciones, una secuencia normalizadora es una secuencia que muestra una variabilidad en el número de etiquetas de secuencia que se mapean para ella entra muestras y ejecuciones de secuenciación que mejor se aproximan a la de la secuencia de interés para la que se usa como un parámetro normalizador y/o que puede diferenciar mejor una muestra afectada de una o más muestras no afectadas.
En algunas realizaciones, se identifica más de una muestra normalizadora. Por ejemplo, la variación, por ejemplo coeficiente de variación, en la dosis de cromosoma para el cromosoma de interés 21 es menor cuando se usa la densidad de etiqueta de secuencia del cromosoma 14. En otras realizaciones, se identifican dos, tres, cuatro, cinco, seis, siete, ocho o más secuencias normalizadoras para su uso al determinar una dosis de secuencia para una secuencia de interés en una muestra de ensayo.
En una realización, la secuencia normalizadora para el cromosoma 21 es seleccionada del cromosoma 9, cromosoma 1, cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 8, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 13, cromosoma 14, cromosoma 15, cromosoma 16, y cromosoma 17. Preferiblemente, la secuencia normalizadora para el cromosoma 21 se selecciona del cromosoma 9, cromosoma 1, cromosoma 2, cromosoma 11, cromosoma 12, y cromosoma 14. Alternativamente, la secuencia normalizadora para el cromosoma 21 es un grupo de cromosomas seleccionados del cromosoma 9, cromosoma 1, cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 8, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 13, cromosoma 14, cromosoma 15, cromosoma 16, y cromosoma
17. En otras realizaciones, la secuencia normalizadora para el cromosoma 21 es un grupo de cromosomas seleccionados del cromosoma 9, cromosoma 1, cromosoma 2, cromosoma 11, cromosoma 12, y cromosoma 14.
En una realización, la secuencia normalizadora para el cromosoma 18 se selecciona del cromosoma 8, cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 9, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 13, y cromosoma 14. Preferiblemente, la secuencia normalizadora para el cromosoma 18 se selecciona del cromosoma 8, cromosoma 2, cromosoma 3, cromosoma 5, cromosoma 6, cromosoma 12, y cromosoma 14. Alternativamente, la secuencia normalizadora para el cromosoma 18 es un grupo de cromosomas seleccionados del cromosoma 8, cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 9, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 13, y cromosoma 14. En otras realizaciones, la secuencia normalizadora para el cromosoma 18 es un grupo de cromosomas seleccionados del cromosoma 8, cromosoma 2, cromosoma 3, cromosoma 5, cromosoma 6, cromosoma 12, y cromosoma 14.
En una realización, la secuencia normalizadora para el cromosoma X se selecciona del cromosoma 1, cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 8, cromosoma 9, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 13, cromosoma 14, cromosoma 15, y cromosoma 16. Preferiblemente, la secuencia normalizadora para el cromosoma X se selecciona del cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, y cromosoma 8. Alternativamente, la secuencia normalizadora para el cromosoma X es un grupo de cromosomas seleccionados del cromosoma 1, cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 8, cromosoma 9, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 13, cromosoma 14, cromosoma 15, y cromosoma 16. En otras realizaciones, la secuencia normalizadora para el cromosoma X es un grupo de cromosomas seleccionados del cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, y cromosoma 8.
En una realización, la secuencia normalizadora para el cromosoma 13 es un cromosoma seleccionado del cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 8, cromosoma 9, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 14, cromosoma 18, y cromosoma 21. Preferiblemente, la secuencia normalizadora para el cromosoma 13 se selecciona del cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, y cromosoma 8. En otra realización, la secuencia normalizadora para el cromosoma 13 es un grupo de cromosomas seleccionados del cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 8, cromosoma 9, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 14, cromosoma 18, y cromosoma 21. En otras realizaciones, la secuencia normalizadora para el cromosoma 13 es un grupo de cromosomas seleccionado del cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, y cromosoma 8.
La variación en la dosis de cromosoma para el cromosoma Y es mayor de 30 independientemente de que cromosoma normalizador se use para determinar la dosis de cromosoma Y. Por lo tanto, cualquier cromosoma, o un grupo de dos o más cromosomas seleccionados de los cromosomas 1-22 y el cromosoma X se puede usar como la secuencia normalizadora para el cromosoma Y. En una realización, el al menos un cromosoma normalizadora es un grupo de cromosomas que consiste de los cromosomas 1-22, y el cromosoma X. En otra realización, el al menos un cromosoma normalizador es un grupo de cromosomas seleccionados del cromosoma 2, cromosoma 3, cromosoma 4, cromosoma ,5 y cromosoma 6.
En base a la identificación de la secuencia(s) normalizadora en muestras calificadas, se determina una dosis de cromosoma para una secuencia de interés en una muestra de ensayo que comprende una mezclad e ácidos nucleicos derivados de genomas que difieren en una o más secuencias de interés.
En el paso 515, se obtiene una muestra de ensayo, por ejemplo muestra de plasma, que comprende ácidos nucleicos fetales y maternos, por ejemplo ADN libre de células, de un sujeto embarazado, por ejemplo una mujer embarazada, para la que se necesita determinar la presencia o ausencia de una aneuploidía fetal.
En el paso 525, al menos una porción de los ácidos nucleicos de ensayo en la muestra de ensayo se secuencia para generar millones de lecturas de secuencia que comprenden entre 20 y 500 bp, por ejemplo 36bp. Como en el paso 520, las lecturas generadas de la secuenciación de ácidas nucleicos en la muestra de ensayo se mapean únicamente para un genoma de referencia humano y se cuentan. Como se describe en el paso 520, se obtienen al menos alrededor de 3 x 106 etiquetas de secuencia calificadas, al menos alrededor de 5 x 106 etiquetas de secuencia calificadas, al menos alrededor de 8 x 106 etiquetas de secuencia calificadas, al menos alrededor de 10 x 106 etiquetas de secuencia calificadas, al menos alrededor de 15 x 106 etiquetas de secuencia calificadas, al menos alrededor de 20 x 106 etiquetas de secuencia calificadas, al menos alrededor de 30 x 106 etiquetas de secuencia calificadas, al menos alrededor de 40 x 106 etiquetas de secuencia calificadas, o al menos alrededor de 50 x 106 etiquetas de secuencia calificadas que comprenden entre 20 y 40bp de lecturas que mapean únicamente para el genoma de referencia humano.
En el paso 535, todas las etiquetas obtenidas de la secuenciación de ácidos nucleicos en las muestras de ensayo se cuentan para determinar la densidad de etiqueta de secuencia. En una realización, el número de etiquetas de secuencia de ensayo mapeadas para una secuencia de interés se normaliza a la longitud conocida de una secuencia de interés a la que están mapeadas para proporcionar una densidad de etiqueta de secuencia de ensayo. Como se describe para las muestras calificadas, no se requiere la normalización a la longitud conocida de una secuencia de interés, y puede incluirse como un paso para reducir al número de dígitos en un número para simplificarla para la interpretación humana. A medida que todas las etiquetas de secuencia de ensayo mapeadas se cuentan en la muestra de ensayo, se determina en las muestras de ensayo la densidad de etiqueta de secuencia para una secuencia de interés, por ejemplo una secuencia clínicamente relevante como el cromosoma 21, como los son las densidades de etiqueta de secuencia para secuencias adicionales que corresponden con la menos una secuencia normalizadora identificada en las muestras calificadas.
En el paso 550, en base a la identidad de al menos una secuencia normalizadora en las muestras calificadas, se determina una dosis de secuencia de ensayo para una secuencia de interés en la muestra de ensayo. La dosis de secuencia, por ejemplo dosis de cromosoma, para una secuencia de interés en una muestra de ensayo es una proporción de la densidad de etiqueta de secuencia determinada para la secuencia de interés en la muestra de ensayo y la densidad de etiqueta de secuencia de al menos una secuencia normalizadora determinada en la muestra de ensayo, en donde la secuencia normalizadora en la muestra de ensayo se corresponde con la secuencia normalizadora identificada en las muestras calificadas para la secuencia particular de interés. Por ejemplo, si se determina que la secuencia normalizadora para el cromosoma 21 en las muestras calificadas es el cromosoma 14, entonces la dosis de secuencia de ensayo para el cromosoma 21 (secuencia de interés) se determina como la proporción de la densidad de etiqueta de secuencia para el cromosoma 21 en y la densidad de etiqueta de secuencia para el cromosoma 14 cada una determinada en la muestra de ensayo. De manera similar, se determinan las dosis de cromosomas para los cromosomas 13, 18, X, Y y otros cromosomas asociados con las aneuploidías cromosómicas. Como se ha descrito anteriormente, una secuencia de interés puede ser parte de un cromosoma, por ejemplo un segmento de cromosoma. Por consiguiente, la dosis para un segmento de cromosoma puede
determinarse como la proporción de la densidad de etiqueta de secuencia determinada para el segmento en la muestra de ensayo y la densidad de etiqueta de secuencia para el segmento de cromosoma normalizador en la muestra de ensayo, en donde el segmento normalizador en la muestra de ensayo corresponde con el segmento normalizador identificado en las muestras calificadas para el segmento particular de interés.
En el paso 555, los valores límite se derivan de los valores de la desviación estándar establecidos por una pluralidad de dosis de secuencia calificadas. La clasificación precisa depende de las diferencias entre las distribuciones de probabilidad para las diferentes clases, es decir tipo de aneuploidía. Preferiblemente, los límites se eligen de la distribución empírica para cada tipo de aneuploidía, por ejemplo trisomía 21. Los valores límites posibles que se establecieron para clasificar las aneuploidías de trisomía 13, trisomía 18, trisomía 21 y monosomía X como se describe en los Ejemplos, que describen el uso del método para determinar las aneuploidías cromosómicas por secuenciación de ADN libre de células extraído de una muestra materna comprenden una mezcla de ácidos nucleicos fetales y maternos.
En el paso 560, la variación del número de copias de la secuencia de interés, por ejemplo aneuploidía cromosómica o parcial, se determina en la muestra de ensayo comparando al dosis de secuencia de ensayo para la secuencia de interés con al menos un valor límite establecido de las dosis de secuencia calificadas.
En el paso 560, la dosis calculada para una secuencia de ensayo de interés se compara con ese conjunto como los valores límite que se eligen de acuerdo con un límite definido por el usuario de fiabilidad para clasificar al muestra como una "normal", una "afectada" o una "no designada" en el paso 565. Las muestras "no designadas" son muestras para las que no se puede hacer un diagnóstico definitivo con fiabilidad.
Otra realización divulgada en la presente es un método para proporcionar diagnóstico prenatal de una aneuploidía cromosómica fetal en una muestra biológica que comprende moléculas de ácidos nucleicos fetales y maternos. El diagnóstico se hace en base a la recepción de datos de la secuenciación en al menos una porción de la mezcla de moléculas de ácidos nucleicos fetales y maternos derivados de una muestra de ensayo biológica, por ejemplo una muestra de plasma materno, calculando de los datos de secuenciación una dosis de cromosoma normalizador para uno o más cromosomas de interés, determinando una diferencia estadísticamente significativa entre la dosis de cromosoma normalizador para el cromosoma de interés en la muestra de ensayo y un valor límite establecido en una pluralidad de muestras calificadas (normales), y proporcionando el diagnóstico prenatal en base a la diferencia estadística. Como se describe en el paso 165 del método, se hace un diagnóstico de normal o afectada. Se proporciona una "no designada" en el caso de que el diagnóstico para la normal o afectada no se pueda hacer con confianza.
La cuantificación del número de lecturas de secuencia que alinean con cada cromosoma para determinar aneuploidías cromosómicas también se puede conseguir normalizando el número medio de etiquetas de secuencia para un cromosoma de interés con el número medio de etiquetas para cada uno de los otros autosomas (Fan et al., Proc Natl Acad Sci 105:16266-16271 [2008]).Alternativamente, el número de lecturas únicas que alinean para cada cromosoma se compara con el número total de lecturas que alinean para todos los cromosomas para derivar un porcentaje de representación genómica para cada cromosoma. Se genera una "puntuación z" para representar la diferencia entre el porcentaje de representación genómica del cromosoma de interés y el porcentaje medio de representación para el mismo cromosoma entre un grupo de control euploide, dividido por la desviación estándar (Chiu et al., Clin Chem 56:459-463 [2010]).
Determinación de la fracción fetal
La determinación de la fracción fetal se basa en el número total de etiquetas que mapean para el primer alelo y el número total de etiquetas que mapean para el segundo alelo en un sitio polimórfico informativo, por ejemplo un SNP, contenido en un genoma de referencia. Por ejemplo, el genoma de referencia es la secuencia NCBI36/hg18 del genoma de referencia humano, o el genoma de referencia comprende la secuencia NCBI36/hg18 del genoma de referencia humano y un genoma de secuencias objetivo artificiales, lo que incluye las secuencias polimórficas objetivo. Por ejemplo, el genoma objetivo artificial abarca secuencias polimórficas que comprenden SNPs rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs 4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005, y rs530022. En otro ejemplo, el genoma artificial incluye las secuencias objetivo polimórficas de las SEQ ID Nos: 1-56 (ver Ejemplo 5). En otro ejemplo, el genoma artificial comprende secuencias polimórficas que comprenden SNPs en tándem rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980-rs987981; rs4143392-rs4143391; rs1691324-rs13050434; rs11909758-rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080-rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141
rs2246777; rs2832959 -rs9980934; rs2833734-rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485rs3453; rs9974986-rs2834703; rs2776266-rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672. En otro ejemplo el genoma objetivo artificial abarca secuencias polimórficas que comprenden STRs seleccionadas de CSF1PO, FGA, TH01, TPOX, vWA, D3S1358,D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, Penta D, Penta E, D2S1338, D1S1677, D2S441, D4S2364, D10S1248, D14S1434, D22S1045, D22S1045, D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627, y D1GATA113. La composición de las secuencias objetivo artificiales variará dependiendo de las secuencias polimórficas que se usan para determinar la fracción fetal. Por consiguiente, un genoma de secuencias objetivo artificiales no está limitado a las secuencias de SNP o STR ejemplificadas en la presente.
El sitio polimórfico informativo, por ejemplo SNP, se identifica por la diferencia en las secuencias alélicas y la cantidad de cada uno de los alelos posibles. El ADN libre de células está presente a una concentración que es <10% del ADN libre de células materno. Por lo tanto, la presencia de una contribución menor de un alelo a la mezcla de ácidos nucleicos fetales y maternos en relación con la contribución principal del alelo materno puede ser asignada al feto. Los alelos que se derivan del genoma materno son referidos en la presente como alelos principales, y los alelos que se derivan del genoma fetal son referidos en la presente como alelos menores. Los alelos que se representan por niveles similares de etiquetas de secuencias mapeadas representan alelos maternos. Los resultados de una amplificación multiplex ejemplar de ácidos nucleicos objetivo que comprenden SNPs y derivados de una muestra de plasma materno se muestran en la Figura 6. Los SNPs informativos son distinguidos del cambio del nucleótido individual en un sitio polimórfico predeterminado, y los alelos fetales se distinguen por su contribución menor relativa a la mezcla de ácidos nucleicos fetales y maternos en la muestra cuando se compara con la contribución mayor a la mezcla por los ácidos nucleicos maternos, es decir las secuencias de SNP son informativas cuando la madre es heterocigótica y hay presente un tercer alelo paternal, permitiendo una comparación cuantitativa entre el alelo heredado maternalmente y el alelo heredado paternalmente para calcular la fracción fetal. Por consiguiente, la abundancia relativa de ADN libre de células fetal en la muestra materna se determina como un parámetro del número total de etiquetas de secuencia únicas mapeadas para la secuencia de ácido nucleicos objetivo en un genoma de referencia para cada uno de los dos alelos del sitio polimórfico predeterminado. En una realización, la fracción de ácidos nucleicos fetales en la mezcla de ácidos nucleicos fetales y maternos se calcula para cada uno de los alelos informativos (alelox) de la manera siguiente:
% del alelox de la fracción fetal = ((Σetiquetas de secuencia fetal para el alelox)/(Σetiquetas de secuencia materna para el alelox)) x 100
y la fracción fetal para la muestra se calcula como la media de la fracción fetal de todos los alelos informativos. Opcionalmente, la fracción de los ácidos nucleicos fetales en la mezcla de ácidos nucleicos fetales y maternos se calcula para cada uno de los alelos informativos (alelox) de la manera siguiente:
% del alelox de la fracción fetal = ((2XΣetiquetas de secuencia fetal para el alelox) / (Σetiquetas de secuencia materna para el alelox)) x 100
para compensar por la presencia de 2 alelos fetales, uno siendo enmascarado por el fondo materno.
El porcentaje de fracción fetal se calcula para al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, al menos 10, al menos 11, al menos 12, al menos 13, al menos 14, al menos 15, al menos 16, al menos 17, al menos 18, al menos 19, al menos 20, o más alelos informativos. En una realización, la fracción fetal es la fracción fetal media determinada para al menos 3 alelos informativos.
En una realización, el paso de enriquecer la mezcla de ácidos nucleicos fetales y maternos para ácidos nucleicos objetivo polimórficos comprende amplificar los ácidos nucleicos objetivo en una porción de una muestra de ensayo, por ejemplo una muestra de ensayo de plasma, y combinar todo o una porción del producto amplificado con el resto de la muestra de ensayo de plasma. La realización del método 200 se representa en el diagrama de flujo proporcionado en la Figura 2. En el paso 210, se obtiene una muestra de ensayo, por ejemplo una muestra de fluido biológico como una muestra de sangre, de una mujer embarazada, y en el paso 220 se usa una porción del ADN libre de células contenido en la fracción de plasma de la muestra de sangre para amplificar ácidos nucleicos objetivo que comprenden sitios polimórficos, por ejemplo SNPs. En una realización, al menos alrededor del 1%, al menos alrededor del 1,5%, al menos alrededor del 2%, al menos alrededor del 10% del plasma materno se usó para amplificar los ácidos nucleicos objetivo. En el paso 230, una porción o todos los ácidos nucleicos objetivo amplificados se combina con la mezcla de ADN libre de células fetal y materno presente en la muestra materna, y el ADN libre de células combinado y los ácidos nucleicos amplificados se purifican en el paso 240, y se usan para preparar una biblioteca que se secuenció en el paso 250. La biblioteca se purificó de ADN libre de células purificado y comprende al menos alrededor del 10%, al menos alrededor del 15%, al menos alrededor del 20%, al menos
alrededor del 25%, al menos alrededor del 30%, al menos alrededor del 35%, al menos alrededor del 40%, al menos alrededor del 45%, o al menos alrededor del 50% del producto amplificado. En el paso 260, los datos de las ejecuciones de secuenciación se analizan y se hace la determinación simultánea de la fracción fetal y la presencia o ausencia de aneuploidía.
En una realización, el paso de enriquecer al mezcla de ácidos nucleicos fetales y maternos para los ácidos nucleicos objetivo polimórficos comprende una pluralidad de ácidos nucleicos objetivo polimórficos en una porción de una mezcla de ácidos nucleicos fetales y maternos purificados de una muestra de ensayo materna. En una realización, una porción de una mezcla de ácidos nucleicos fetales y maternos, por ejemplo ADN libre de células, purificada de una muestra de plasma materno se usa para amplificar las secuencias de ácidos nucleicos polimórficos, y una porción del producto amplificado se combina con la mezcla no amplificada o ácidos nucleicos fetales y maternos, por ejemplo ADN libre de células (ver Figura 3). La realización del método 300 se representa en el diagrama de flujo proporcionado en la Figura 3. En el paso 310, se obtiene de una mujer embarazada una muestra de ensayo, por ejemplo una muestra de fluido biológico como una muestra de sangre, que comprende una mezcla de ácidos nucleicos fetales y maternos, y la mezcla de ácidos nucleicos fetales y maternos se purifica de la fracción de plasma en el paso 320. Como se ha descrito anteriormente, los métodos para la separación de ADN libre de células del plasmo son bien conocidos. En el paso 330, una porción del ADN libre de células contenido en la muestra purificada se usa para amplificar ácidos nucleicos objetivo que comprenden sitios polimórficos, por ejemplo SNPs. Al menos alrededor del 5%, al menos alrededor del 10%, al menos alrededor del 15%, al menos alrededor del 20% , al menos alrededor del 25% , al menos alrededor del 30% , al menos alrededor del 35% , al menos alrededor del 40% , al menos alrededor del 45%, o al menos alrededor del 50% del ADN libre de células purificado se usa para amplificar los ácidos nucleicos objetivo. Preferiblemente, la amplificación de las secuencias objetivo se puede realizar por cualquier método que use PCR o variaciones del método incluyendo pero no limitado a PCR asimétrico, amplificación dependiente de la helicasa, CR hot-start, qPCR, PCR en fase sólida y PCR touchdown. En el paso 340, una porción, por ejemplo al menos alrededor del 0,01% del producto amplificado se combina con la muestra de ADN libre de células purificado no amplificado, y la mezcla de los ácidos nucleicos fetales y maternos amplificados y no amplificados se secuencia en el paso 350. En una realización, la secuenciación se realiza usando cualquiera del as tecnologías NGS. En el paso 360, los datos de las ejecuciones de secuenciación se analizan y se hace la determinación simultánea de la fracción fetal y la presencia o ausencia de aneuploidía como se describe en el paso 140 de la realización representada en la Figura 1.
En otra realización, el paso 120 de enriquecer la mezcla de ácidos nucleicos fetales y maternos para ácidos nucleicos objetivo polimórficos comprende combinar al menos una porción de una primera biblioteca de secuenciación de moléculas de ácidos nucleicos fetales y maternos no amplificados con al menos una porción de una segunda biblioteca de secuenciación de ácidos nucleicos objetivo polimórficos. Por lo tanto, la muestra que es enriquecida es la muestra de la biblioteca que se prepara para la secuenciación (Figura 4). El enriquecimiento de la muestra de la biblioteca para los ácidos nucleicos objetivo se consigue por métodos que comprenden amplificar específicamente las secuencias de ácidos nucleicos que comprenden el sitio polimórfico. En el paso 410, se obtiene de una mujer embarazada una muestra de ensayo, por ejemplo una muestra de fluido biológico como una muestra de sangre, que comprende una mezcla de ácidos nucleicos fetales y maternos, y la mezcla de ácidos nucleicos fetales y maternos se purifica de la fracción de plasma en el paso 420. En el paso 430, se usa una porción del ADN libre de células contenido en la muestra purificada para amplificar ácidos nucleicos objetivo que comprenden sitios polimórficos, por ejemplo SNPs. Al menos alrededor del 5%, al menos alrededor del 10%, al menos alrededor del 15%, al menos alrededor del 20%, al menos alrededor del 25%, o al menos alrededor del 30% del ADN libre de células se usa para amplificar secuencias de ácidos nucleicos objetivo. Preferiblemente, la amplificación de las secuencias objetivo puede realizarse por cualquier método que use PCR o variaciones del método incluyendo, pero no limitadas a, PCR asimétrico, amplificación dependiente de la helicasa, PCR hot-start, qPCR, PCR en fase sólida y PCR touchdown. En el paso 440, los ácidos nucleicos objetivo amplificados que comprenden los sitios polimórficos, por ejemplo SNPs, se usan para preparar una biblioteca de secuenciación de ácidos nucleicos objetivo. De manera similar, la porción de ADN libre de células no amplificado purificado se usa para preparar una biblioteca de secuenciación primaria en el paso 450. En el paso 460, una porción de la biblioteca objetivo se combina con la biblioteca primaria generada de la mezcla no amplificada de ácidos nucleicos, y la mezcla de ácidos nucleicos fetales y maternos comprendida en las dos bibliotecas se secuencia en el paso 470. La biblioteca enriquecida comprende al menos alrededor del 5%, al menos alrededor del 10%, al menos alrededor del 15%, al menos alrededor del 20%, o al menos alrededor del 25% de la biblioteca objetivo. En el paso 480, los datos de las ejecuciones de secuenciación se analizan y se hace la determinación simultánea de la fracción fetal y la presencia o ausencia de aneuploidía como se describe en el paso 140 de la realización representada en la Figura 1.
Determinación de aneuploidías para diagnósticos prenatales
El ARN y ADN fetal libre de células que circula en la sangre materna puede usarse para el diagnóstico prenatal no invasivo temprano (NIPD) de un número creciente de condiciones genéticas, tanto para la gestión del embarazo y para ayudar a la toma de decisiones reproductoras. La presencia de ADN libre de células que circulan en el torrente sanguíneo se ha conocido durante más de 50 años. Más recientemente, la presencia de pequeñas cantidades de ADN fetal circulante se descubrió en el torrente sanguíneo materno durante el embarazo (Lo et al.,
Lancet 350:485-487 [1997]). Creyendo que se origina de células de la placenta que se mueren, el ADN fetal libre de células (ADNcf) ha demostrado que consiste de fragmentos cortos típicamente de menos de 200 bp de longitud Chan et al., Clin Chem 50:88-92 [2004]), que se pueden distinguir tan pronto como desde las 4 semanas de gestación (Illanes et al, Early Human Dev 83:563-566 [2007]), y que se sabe desaparecen de la circulación materna pocas horas después del parto (Lo et al., Am J Hum Genet 64:218-224 [1999]). Además del ADN libre de células, también se pueden distinguir fragmentos de ARN fetal libre de células (ARNcf) en el torrente sanguíneo materno, originado de genes que es transcriben en el feto o la placenta. La extracción y el posterior análisis de estos elementos genéticos fetales de una muestra de sangre materna ofrece nuevas oportunidades para el NIPD.
El presente método es un método independiente de polimorfismos para el uso en NIPD y que no requiere que el ADN libre de células fetal se distinga del ADN libre de células materno para permitir la determinación de una aneuploidía fetal. En algunas realizaciones, la aneuploidía es una trisomía o monosomía cromosómica completa, o una trisomía o monosomía parcial. Las aneuploidías parciales son causadas por la pérdida o ganancia de parte de un cromosoma, y abarcan desequilibrios cromosómicos resultantes de translocaciones desequilibradas, inversiones desequilibradas, deleciones e inserciones. Con mucho, la aneuploidía más común conocida compatible con la vida es la trisomía 21, es decir Síndrome de Down (DS), que es causado por la presencia de parte o todo el cromosoma
21. Raramente, el DS puede ser causa de un defecto heredado o esporádico por el que una copia extra de todo o parte del cromosoma 21 se uno con otro cromosoma (habitualmente el cromosoma 14) para formar un único cromosoma anormal. El DS está asociado con deficiencia intelectual, dificultades de aprendizaje severas y exceso de mortalidad causado por problemas de salud a largo plazo como enfermedades cardiacas. Otras aneuploidías con significancia clínica conocida incluyen el síndrome de Edward (trisomía 18) y Síndrome de Patau (trisomía 13), que son frecuentemente fatales dentro de los primeros meses de vida. También se conocen anomalías asociadas con el número de cromosomas sexuales e incluyen monosomía X, por ejemplo síndrome de Turner (XO), y síndrome de triple X (XXX) en nacimientos de niñas y síndrome de Kleinefelter (XXY) y síndrome de XYY en nacimientos de niños, que están todos asociados con varios fenotipos incluyendo esterilidad y reducción en las habilidades intelectuales. El método de la invención puede ser usado para diagnosticar estas y otras anomalías cromosómicas prenatalmente.
De acuerdo con las realizaciones de la presente invención la trisomía determinada por la presente invención se selecciona de trisomía 21 (T21; Síndrome de Down), trisomía 18 (T18; Síndrome de Edward); trisomía 16 (T16), trisomía 22 (T22; Síndrome de Ojo de Gato); trisomía 15 (T15; Síndrome de Prader Willi), trisomía 13 (T13; Síndrome de Patau), trisomía 8 (T8; Síndrome de Warkany) y trisomías XXY (Síndrome de Kleinefelter), XYY o XXX. Se apreciará que varias otras trisomías y trisomías parciales se pueden determinar en ADN libre de células fetal de acuerdo con las enseñanzas de la presente invención. Estas incluyen, pero no están limitadas a, trisomía parcial 1q32-44, trisomía 9 p con trisomía, trisomía, mosaicismo 4, trisomía 17p, trisomía parcial 4q26-qter, trisomía 9, trisomía parcial 2p, trisomía parcial 1q, y/o trisomía parcial 6p/monosomía 6q.
El método de la presente invención también puede usarse para determinar la monosomía X cromosómica, y monosomías parciales como la monosomía 13, monosomía 15, monosomía 16, monosomía 21 y monosomía 22, que se sabe están implicadas en el aborto involuntario del embarazo. La monosomía parcial de cromosomas típicamente implicados en la aneuploidía completa también pude ser determinada por el método de la invención. La monosomía 18p es un trastorno cromosómico raro en el que todo o parte del brazo corto (p) del cromosoma 18 se elimina (monosómico). Este trastorno está caracterizado típicamente por estatura corta, grados variables de atraso mental, retrasos en el habla, malformaciones de la región craneal y facial (craneofacial), y/o anomalías físicas adicionales. Los defectos craneofaciales asociados pueden variar enormemente en rango y severidad de caso a caso. Las condiciones provocadas por cambios en la estructura o número de copias del cromosoma 15 incluyen el Síndrome de Angelman y el Síndrome de Prader-Willi, que implican una pérdida de actividad génica en la misma parte del cromosoma 15, la región 15q11-q13. Se apreciará que varias translocaciones y microdeleciones pueden ser asintomáticas en el padre portador, sin embargo pueden provocar una enfermedad genética importante en la descendencia. Por ejemplo, una madre sana que porta la microdeleción 15q11-q13 puede dar a luz a un niño con el síndrome de Angelman, un trastorno neurodegenerativo severo. Por lo tanto, la presente invención puede usarse para identificar dicha deleción en el feto. La monosomía parcial 13q es un trastorno cromosómico raro que se produce cuando falta una pieza del brazo largo (q) del cromosoma 13 (monosómico). Los bebés nacidos con monosomía 13q parcial pueden mostrar bajo peso de nacimiento, malformaciones de la cabeza y la cara (región craneofacial), anomalías esqueléticas (especialmente de las manos y pies), y otras anomalías físicas. El retraso mental es característico de esta condición. La tasa de mortalidad durante la niñez es alta entre individuos nacidos con este trastorno. Casi todos los casos de monosomía 13q parcial tienen lugar aleatoriamente sin razón aparente (esporádica). El síndrome de deleción 22q11.2, también conocido como síndrome de DiGeorge, es un síndrome causado por la deleción de una pieza pequeña del cromosoma 22. La deleción (22q11.2) tiene lugar cerca del medio del cromosoma en el brazo largo de uno del par de cromosomas. Las características de este síndrome varían ampliamente, incluso entre miembros de la misma familia, y afectan a muchas partes del cuerpo. Los signos característicos y síntomas pueden incluir defectos de nacimiento como enfermedad cardiaca congénita, defectos en el paladar, más comúnmente relacionados con problemas neuromusculares con cleisis (insuficiencia velo-faríngea), problemas de aprendizaje, diferencias leves en los rasgos faciales e infecciones recurrentes. Las microdeleciones en la región cromosómica 22q11.2 están asociadas con un riesgo aumentado de 20 a 30 veces de esquizofrenia. En
una realización, el método de la invención se usa para determinar monosomías parciales que incluyen per no están limitadas a monosomía 18p, monosomía parcial del cromosoma 15 (15q-11q13), monosomía parcial 13q, y la monosomía parcial del cromosoma 22 también pueden determinarse usando el método.
El método de la invención también puede ser usado para determinar cualquier aneuploidía si uno de los padres es un portador conocido de dicha anomalía. Estas incluyen, pero no están limitadas a, cromosoma marcador supernumerario (SMC) pequeño; translocación t(11;14)(p15;p13); translocación desequilibrada t(8;11)(p23.2;p15.5); microdeleción 11q23; deleción 17p11.2 síndrome de Smith-Magenis; deleción 22q13.3; Microdeleción Xp22.3; 10p14 eliminación; Microdeleción 20p, el síndrome de Di-George [del (22) (q11.2q11.23)], el síndrome de Williams (deleciones 7q11.23 y 7q36); deleción 1p36; microdeleción 2p; neurofibromatosis tipo 1 (microdeleción 17q11.2), deleción Yq; Síndrome de Wolf-Hirschhorn (WHS, microdeleción 4p16.3); microdeleción 1p36.2; deleción 11q14; microdeleción 19q13.2; Rubinstein-Taybi (microdeleción 16 p13.3); microdeleción 7p21; síndrome de Miller-Dieker (17p13.3), deleción 17p11.2; y microdeleción 2q37.
Composiciones y kits
Se divulgan composiciones que comprenden cebadores para amplificar sitios polimórficos para permitir la cuantificación de la fracción fetal y aneuploidía por mezclas de secuenciación de ácidos nucleicos fetales y maternos, por ejemplo ADN libre de células, presentes en la muestra. Preferiblemente, la muestra es una muestra de plasma de sangre materno. En otra realización, la composición incluye cebadores para amplificar ácidos nucleicos objetivo polimórficos que comprenden cada uno al menos un SNP. El al menos un SNP se selecciona de los SNPs rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005 y rs530022. El conjunto de cebadores correspondiente para amplificar los SNPs se proporcionan en el Ejemplo 3 y se divulgan como SEQ ID Nos: 57-112.
En otra realización, la composición incluye cebadores para amplificar ácidos nucleicos objetivo polimórficos que comprenden cada uno al menos un SNP en tándem. En una realización, la composición incluye cebadores para amplificar los SNPs en tándem ejemplares divulgados en la presente, y la composición comprende los cebadores ejemplares correspondientes de las SEQ ID NOS:57-112.
En otra realización, la composición incluye cebadores para amplificar ácidos nucleicos objetivo polimórficos que comprenden cada uno al menos una STR. Las STRs ejemplares incluyen CSF1PO, FGA, TH01, TPOX, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, D2S1338, Penta D, Penta E, D22S1045, D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627 y D1GATA113, que pueden estar amplificadas por los conjuntos correspondientes de cebadores proporcionados en el Ejemplo 5 (Tablas 5 y 6) y divulgadas como SEQ ID NOs; 113
196.
Las composiciones divulgadas en la presente invención incluirse en kits para mezclas de secuenciación masivamente paralelas de moléculas de ácidos nucleicos fetales y maternos, por ejemplo ADN libre de células, presentes en una muestra materna, por ejemplo una muestra de plasma. Los kits comprenden una composición que comprende al menos un conjunto de cebadores para amplificar al menos un ácido nucleico objetivo polimórfico en dichas moléculas de ácidos nucleicos fetales y maternos. Los ácidos nucleicos polimórficos pueden comprender un SNP o una STR. Los métodos de secuenciación son métodos NGS de moléculas de ácidos nucleicos individuales o moléculas de ácidos nucleicos amplificados clonalmente. Los métodos NGS son métodos de secuenciación masivamente paralelos que incluyen pirosecuenciación, secuenciación por síntesis con terminadores de colorante reversibles, secuenciación en tiempo real o secuenciación por ligadura de sonda de oligonucleótidos.
La presente invención se describe con más detalle en los siguientes Ejemplos que no se pretende que limiten de ninguna manera el ámbito de la invención como se reivindica. Se pretende que las Figuras adjuntas se consideren como parte integral de la especificación y descripción de la invención. Los siguientes ejemplos se ofrecen para ilustrar, pero no para limitar la invención reivindicada.
EXPERIMENTAL
Ejemplo 1
Procesamiento de Muestras y Extracción de ADN libre de células
Las muestras de sangre periférica se recogieron de mujeres embarazadas en su primer o segundo trimestre de embarazo y que se consideraron con riesgo de aneuploidía fetal. Se obtuvo el consentimiento informado de cada participante antes de la extracción de sangre. La sangre se recogió antes de la amniocentesis o la muestra de
vellosidades coriónicas. El análisis de cariotipos se realizó usando las muestras de vellosidades coriónicas o amniocentesis para confirmar el cariotipo fetal.
La sangre periférica extraída de cada sujeto se recogió en tubos ACD. Se transmitió un tubo de muestra de sangre (aproximadamente 6-9 ml/tubo en un tubo de centrífuga de baja velocidad de 15 ml. La sangre se centrifugó a 2640 rpm, 4ºC durante 10 minutos usando una centrífuga Beckman Allegra 6 R y un rotor modelo GA 3.8.
Para la extracción de plasma libre de células, la capa de plasma superior se transfirió a un tubo de centrífuga de alta velocidad de 15 ml y se centrifugó a 16000 x g, 4º C durante 10 min. usando una centrífuga Beckman Coulter Avanti J-E y un rotor JA-14. Los dos pasos de centrifugación se realizaron en el plazo de 72 horas después de la recogida de la sangre. El plasma libre de células que comprende ADN libre de células se almacenó a 80º C y se descongeló sólo una vez antes de la amplificación del ADN libre de células del plasma o para la purificación del ADN libre de células.
Se extrajo ADN libre de células (ADNcf) purificado de plasma libre de células usando el QIAamp Blood DNA Mini kit (Qiagen) de acuerdo esencialmente con las instrucciones del fabricante. Se añadieron un mililitro de tampón AL y 100 µl de solución de proteasa a 1ml de plasma. La mezcla se incubó durante 15 minutos a 56º C. Se añadió un mililitro de 100% de etanol a la digestión de plasma. La mezcla resultante se transfirió a minicolumnas QIAamp que se montaron con los VacValves y VacConnectors proporcionado en el montaje de columnas QIAvac 24 Plus (Qiagen). Se aplicó vacio a las muestras, y el ADN libre de células retenido en los filtros de la columna se lavó al vacio con 750 µl de tampón AW1, seguido por un segundo lavado con 750 µl de tampón AW24. La columna se centrifugó a 14.000 RPM durante 5 minutos para eliminar cualquier tampón residual del filtro. El ADN libre de células se eluyó con tampón AE por centrifugación a 14.000 RPM, y se determinó la concentración usando la Qubit™ Quantitation Platform (Invitrogen).
Ejemplo 2
Preparación y secuenciación de bibliotecas de secuenciación primarias y enriquecidas
a. Preparación de bibliotecas de secuenciación
Todas las bibliotecas de secuenciación, es decir bibliotecas primarias y enriquecidas, se prepararon de aproximadamente 2 ng de ADN libre de células purificado que se extrajo de plasma materno. La preparación de la biblioteca se realizó usando reactivos del Conjunto 1 de Reactivos de ADN de Preparación de Muestras NEBNext™ (Parte No. E6000L; New England Biolabs, Ipswich, MA), para Illumina® como sigue. Debido a que el ADN de plasma libre de células está fragmentado en la naturaleza, no se hizo fragmentación adicional por nebulización o sonicación en las muestras de ADN de plasma. Los excesos de aproximadamente 2 ng de fragmentos de ADN libre de células purificados contenidos en 40 µl se convirtieron en extremos romos fosforilados de acuerdo con el NEBNext® End Repair Module incubando en un tubo de microcentrífuga de 1,5 ml el ADN libre de células con 5 µl de tampón de fosoforilación10X, 2 µl de mezcla de solución de desoxinucleótidos (10 mM cada dNTP), 1 µl de una dilución 1:5 de ADN polimerasa, 1 µl de ADN Polimerasa T4 y 1µl de Polinucleótido Quinasa T4 proporcionado en el Conjunto 1 de Reactivos de ADN de Preparación de Muestras de ADN NEBNext™ durante 15 minutos a 20º C. Los enzimas fueron entonces inactivados por calor incubando la mezcla de la reacción a 75º C durante 5 minutos. La mezcla se enfrió a 4º C, y se llevó a cabo la adición de colas de dA del ADN de extremo romo usando 10 µl de la mezcla maestra de adición de colas de dA que contenía el fragmento de Klenow (3' a 5' menos exo) (Conjunto 1 de Reactivos de ADN de Preparación de Muestras NEBNext™), e incubando durante 15 minutos a 37º C. Posteriormente, el fragmento de Klenow se inactivó por calor incubando la mezcla de la reacción a 75º C durante 5 minutos. Después de la inactivación del fragmento de Klenow, se usó 1 µl de una dilución 1:5 de Illumina Genomic Adaptor Oligo Mix (Parte No. 1000521; Illumina Inc., Hayward, CA) para ligar los adaptadores de Illumina (sin Índice Adaptadores Y) al ADN de la adición de colas de dA usando 4 µl de la ADN ligasa T4 proporcionada en el Conjunto 1 de Reactivos de ADN de Preparación de Muestras de ADN NEBNext™, incubando la mezcla de la reacción durante 15 minutos a 25º C. La mezcla se enfrió a 4º C, y el ADN libre de células ligado por adaptadores se purificó a partir de adaptadores no ligados, dímeros de adaptadores y otros reactivos usando microesferas magnéticas proporcionadas en el sistema de purificación Agencourt AMPure XP PCR (Parte No. A63881; Beckman Coulter Genomics, Danvers, MA). Se realizaron dieciocho ciclos de PCR para enriquecer selectivamente el ADN libre de células ligado por adaptadores (25 µl) usando Phusion ® High-Fidelity Master Mix (25ml; Finnzymes, Woburn, MA) y cebadores de PCR de Illumina 0,5 µM cada uno) complementarios a los adaptadores (Partes No. 1000537 y 1000537). El ADN ligado por adaptadores se sometió a PCR (98º C durante 30 segundos; 18 ciclos de 98º C durante 10 segundos, 65º C durante 30 segundos y 72º C durante 30; extensión final a 72º C durante 5 minutos, y mantener a 4º C) usando Cebadores de PCR Genómicos Illumina (Partes Nos. 100537 y 1000538) y la Mezcla Maestra de PCR Phusion HF proporcionado en el Conjunto 1 de Reactivos de ADN de Preparación de Muestras de ADN NEBNext™, de acuerdo con las instrucciones del fabricante. El producto amplificado se purificó usando el sistema de purificación Agencourt AMPure XP PCR (Agencourt Bioscience Corporation, Beverly, MA), de acuerdo con las instrucciones del fabricante disponibles en www.beckmangenomics.com/products/AMPmeXPProtocol_000387v001.pdf. El producto amplificado purificado se eluyó en 40 µl de tampón Qiagen EB, y la concentración y la distribución del tamaño de las bibliotecas
amplificadas se analizó usando el Kit Agilent DNA 1000 para el 2100 Bioanalizador (Agilent technologies Inc., Santa Clara, CA).
b. Secuenciación
La secuenciación del ADN de la biblioteca se realizó usando el Analizador de Genomas II (Illumina Inc., San Diego, CA, USA) de acuerdo con los protocolos del fabricante estándar. Se pueden encontrar copias del protocolo para la secuenciación del genoma completo usando tecnología Illumina/Solexa en BioTechniques.RTM. Protocol Guide 2007 Publicado en Diciembre del 2006: p 29, y en la red mundial en biotechniques.com/default.asp? page=protocol&subsection=article_display&id=112378. La biblioteca de ADN se diluyó a 1 nM y se desnaturalizó. La biblioteca de ADN (5pM) se sometió a amplificación de clústeres de acuerdo con el procedimiento descrito en la Cluster Station User Guide and Cluster Station Operations Guide de Illumina, disponible en la red mundial en illumina.com/systems/genome_analyzer/cluster_station.ilmn. El ADN amplificado se secuenció usando el Analizador de Genomas II de Illumina para obtener lecturas de extremos individuales de 36bp. Sólo se necesitan alrededor de 30bp de la información de secuencia aleatoria para identificar una secuencia como perteneciente a un cromosoma humano específico. Las secuencias más largas pueden identificar objetivos más particulares. En el presente caso, se obtuvieron un gran número de las lecturas de 36 bp, cubriendo aproximadamente un 10% del genoma.
Ejemplo 3
Análisis de los datos de secuenciación para la determinación de aneuploidía y fracción fetal
a. Análisis de datos de secuenciación para la determinación de aneuploidía
Al completarse la secuenciación de la muestra, el "Software de Control del Secuenciador" de Illumina transfirió los archivos de imagen y designación de bases a un servidor Unix que estaba ejecutando el software de Illumina "Genome Analyzer Pipeline" versión 1.51. Se ejecutó el programa "Gerald" de Illumina para alinear las secuencias, es decir lecturas de 36bp, al genoma humano de referencia hg18 proporcionado por el National Center for Biotechnology Information (NCBI36/hg18, disponible en la red mundial en http://genome.ucsc.edu/cgibin/hgGateway?org=Human&db=hg18&hgsid=166260105). Los datos de secuencia generados del procedimiento anterior que alinearon únicamente con el genoma se leyeron de las salidas de Gerald (archivos export.txt) por un programa (c2c.pl) ejecutado en un ordenador con el programa operativo Linux. Se permitieron los alineamientos de secuencia con discrepancias de bases y se incluyeron en los recuentos de alineamientos sólo si se alineaban únicamente con el genoma. Se excluyeron los alineamientos de secuencia con coordenadas de partida y finales idénticas (duplicados).
Se mapearon entre alrededor de 5 y 15 millones de etiquetas de 36 bp con 2 o menos discrepancias únicamente con el genoma humano. Todas las etiquetas mapeadas se contaron y se incluyeron en el cálculo de dosis de cromosomas en ambas muestras de ensayo y calificación. Las regiones que se extienden desde la base 0 a la base 2 x 106, base 10 x 106 a base 13 x 106 y base 23 x 106 al final del cromosoma Y, fueron excluidas específicamente del análisis debido a que las etiquetas derivas de fetos masculinos o femeninos mapean para estas regiones del cromosoma Y.
b. Análisis de los datos de secuenciación para la determinación de la fracción fetal
Concomitante al análisis para determinar aneuploidía, los datos de secuenciación se analizaron para determinar la fracción fetal. Después de la transferencia de los archivos de imagen y designación de bases al servidor Unix ejecutando el software Illumina "Genome Analyzer Pipeline" versión 1.51 como se describe en el Ejemplo 2c, las lecturas de 36bp se alinearon con un 'genoma de SNP' usando el programa BOWTIE. El genoma de SNP se identificó como la agrupación de 30 secuencias de ADN, es decir SEQ ID NOS: 1-30, que abarcan los alelos de las 15 SNP divulgadas en la Tabla 5 en el Ejemplo 5. Sólo se usaron lecturas que mapeaban únicamente para el genoma de SNP para el análisis de la fracción fetal. Las lecturas que equivalían perfectamente con el genoma de SNP se contaron como etiquetas y se filtraron. De las lecturas restantes, sólo se contaron como etiquetas y se incluyeron en el análisis lecturas que tenían una o dos discrepancias. Se contaron las etiquetas mapeadas para cada uno de los alelos de SNP, y se determinó la fracción fetal como se describe en el Ejemplo 6.
Ejemplo 4
Identificación de Cromosomas Normalizadores para Determinar Aneuploidía
Para identificar cromosomas normalizadores para usarse en la determinación de dosis de cromosomas y la posterior presencia o ausencia de aneuploidía, se obtuvo ADN libre de células de plasma de sangre periférica de 48 voluntarios embarazados como se describe en el Ejemplo 1, y se secuenció como se describe en el Ejemplo 2. Los datos de secuenciación proporcionados en este ejemplo se obtuvieron de la secuenciación de una biblioteca construida de ADN libre de células fetal y materno que había sido enriquecido para ácidos nucleicos objetivo
comprendidos en una segunda biblioteca de secuenciación que ha sido construida de secuencias amplificadas que contienen SNPs como se describe a continuación.
Se determinó el número total de etiquetas de secuencia que se mapearon para cada cromosoma en el
5 genoma de referencia (densidad de etiqueta de secuencia). Alternativamente, el número de etiquetas de secuencia mapeadas puede normalizarse a la longitud del cromosoma para generar una proporción de densidad de etiqueta de secuencia. La normalización a la longitud del cromosoma no es un paso requerido, y puede ser realizada únicamente para reducir el número de dígitos en un número para simplificarlo para la interpretación humana. Las longitudes de cromosomas que se pueden usar para normalizar los recuentos de etiqueta de secuencia pueden ser las longitudes proporcionadas en la red mundial en genome.ucsc.edu/goldenPath/stats.html#hg18.
La Tabla 1 proporciona la proporción calculada para los cromosomas X e Y, y los autosomas 1-22 en una muestra de ADN libre de células ejemplar (11351; 46,XY).
TABLA 1
Densidad de Etiqueta de Secuencia para los Cromosomas 1-22, X e Y (n=1; muestra 11351, 46 XY)
Nombre del Cromosoma
Densidad de Etiqueta de Secuencia
chr1
1,857,858
chr2
1,910,676
chr3
1,562,572
chr4
1,376,498
chr5
1,383,453
chr6
1,317,821
chr7
1,192,136
chr8
1,162,856
chr9
914,624
chr10
1,112,763
chr11
1,093,028
chr12
1,051,209
chr13
717,684
chr14
710,878
chr15
675,596
chr16
683,529
chr17
647,571
chr18
615,140
chr19
432,191
chr20
557,068
chr21
284,701
chr22
305,365
chrX
1,060,456
chrY
5380
La densidad de etiqueta de secuencia resultante para cada cromosoma se relacionó con la densidad de
etiqueta de secuencia de cada uno de los cromosomas restantes para derivar una dosis de cromosoma calificada,
que se calculó como la proporción de la densidad de etiqueta de secuencia para el cromosoma de interés, por
65 ejemplo cromosoma 21, y la densidad de etiqueta de secuencia para cada uno de los cromosomas restantes, es
decir cromosomas 1-20, 22 y X. Las dosis de cromosomas se determinaron para todos los cromosomas en todas las muestras, y las dosis medias para los cromosomas de interés 13, 18, 21, X e Y en las muestras calificadas se proporcionan en la Tabla 2 y se representan en las Figuras 7-11. Las Figuras 7-11 también representan las dosis de cromosomas para las muestras de ensayo. Las dosis de cromosomas para cada uno de los cromosomas de interés
5 en las muestras calificadas proporcionan una medición de la variación en el número total de etiquetas de secuencia mapeadas para cada cromosoma de interés en relación a la de cada uno de los cromosomas restantes. Por lo tanto, las dosis de cromosomas calificadas pueden identificar el cromosoma o un grupo de cromosomas, es decir cromosoma normalizador, que tiene una variación entre muestras que está más cercana a la variación del cromosoma de interés, y que serviría como secuencias ideales para valores normalizadores para evaluación estadística adicional. Las Figuras 12 y 13 representan las dosis de cromosomas medias calculadas determinadas en una población de muestras calificadas para los cromosomas 13, 18 y 21, y los cromosomas X e Y.
En algunas situaciones, el mejor cromosoma normalizador puede no tener la menor variación, pero puede tener una distribución de dosis calificadas que distingue mejor una muestra o muestras de ensayo de las muestras
15 calificadas, es decir el mejor cromosoma normalizador puede no tener la variación más baja, pero puede tener la diferenciabilidad más alta. Por lo tanto, la diferenciabilidad cuenta para la variación en la dosis de cromosoma y la distribución de las dosis en las muestras calificadas.
Las Tablas 3 y 4 proporcionan el coeficiente de variación como la medición de la variabilidad, y los valores de la prueba t de student como una medición de diferenciabilidad para los cromosomas 18, 21, X e Y, en donde cuanto más pequeño el valor de la prueba T, mayor es la diferenciabilidad. La diferenciabilidad para el cromosoma 13 se determinó como la proporción de diferencia entre la dosis de cromosoma media en las muestras calificadas y la dosis para el cromosoma 13 en la única muestra de prueba de T13, y la desviación estándar de la media de la dosis calificada.
25 Las dosis de cromosomas calificadas también sirven como la base para determinar los valores límite cuando se identifican aneuploidías en muestras de ensayo como se describe a continuación.
TABLA 2
Dosis de Cromosoma Calificada para los Cromosomas 13, 18, 21, X e Y (n=1; muestra 11351, 46 XY)
Cromosoma
chr 21 chr 18 chr 13 chr X chrY
chr1
0.153242 0.331102 0.386296 0.570795 0.002896
chr2
0.149005 0.321949 0.375618 0.555016 0.002816
chr3
0.1822 0.393671 0.459297 0.678661 0.003443
chr4
0.20683 0.446888 0.521384 0.770401 0.003908
chr5
0.20579 0.444641 0.518763 0.766528 0.003889
chr6
0.216039 0.466786 0.544599 0.804704 0.004082
chr7
0.238816 0.515998 0.602015 0.889543 0.004513
chr8
0.244829 0.528991 0.617174 0.911941 0.004627
chr9
0.311277 0.672561 0.784677 1.159445 0.005882
chr10
0.255851 0.552804 0.644957 0.952994 0.004835
chr11
0.26047 0.562785 0.656602 0.9702 0.004922
chr12
0.270832 0.585174 0.682722 1.008797 0.005118
chr13
0.396694 0.857118 1 1.477609 0.007496
chr14
0.400492 0.865324 1.009574 1.491755 0.007568
chr15
0.421407 0.910515 1.062298 1.56966 0.007963
chr16
0.416516 0.899947 1.049969 1.551443 0.007871
chr17
0.439644 0.949919 1.108271 1.63759 0.008308
chr18
0.462823 1 1.1667 1.723926 0.008746
chr19
0.658739 1.423306 1.660571 2.453674 0.012448
chr20
0.51107 1.104246 1.288324 1.903638 0.009658
chr21
1 2.160653 2.520834 3.724806 0.018897
chr22
0.93233 2.014442 2.35025 3.472749 0.017618
chrX
0.26847 0.580071 0.676769 1 0.005073
chrY
52.9184 114.3383 133.3985 197.1108 1
TABLA 3
Dosis de Cromosoma Calificada, Varianza y Diferenciabilidad para cromosomas 21 y 18
21 (n=35)
18 (n=40)
Media
Des Est CV Prueba T Media Des Est CV Prueba T
chr1
0.15332 0.002129 1.39 1.06E-10 0.32451 0.008954 2.76 2.74E-03
chr2
0.15106 0.002053 1.36 8.52E-08 0.31984 0.001783 0.56 5.32E-05
chr3
0.18654 0.004402 2.36 8.07E-07 0.39511 0.002364 0.60 1.93E-05
(continuada)
Dosis de Cromosoma Calificada, Varianza y Diferenciabilidad para cromosomas 21 y 18
21 (n=35)
18 (n=40)
Media
Des Est CV Prueba T Media Des Est CV Prueba T
chr4
0.21578 0.011174 5.18 1.47E-04 0.45714 0.014794 3.24 1.37E-03
chr5
0.21068 0.005332 2.53 1.08E-06 0.44626 0.003250 0.73 3.18E-05
chr6
0.22112 0.005453 2.47 1.74E-06 0.46818 0.003434 0.73 2.24E-05
chr7
0.24233 0.002314 0.96 2.39E-08 0.51341 0.005289 1.03 1.24E-04
chr8
0.24975 0.003772 1.51 1.06E-07 0.52898 0.002161 0.41 6.32E-05
chr9
0.31217 0.003050 0.98 1.60E-09 0.66100 0.014413 2.18 8.17E-04
chr10
0.25550 0.003164 1.24 2.42E-11 0.54091 0.013953 2.58 2.26E-03
chr11
0.26053 0.002596 1.00 1.32E-10 0.55158 0.013283 2.41 1.29E-03
chr12
0.27401 0.002061 0.75 1.40E-08 0.58032 0.007198 1.24 1.57E-04
chr13
0.41039 0.017637 4.30 3.09E-05 0.86961 0.021614 2.49 2.36E-04
chr14
0.40482 0.002908 0.72 1.10E-08 0.85732 0.011748 1.37 2.16E-04
chr15
0.41821 0.008238 1.97 1.24E-10 0.88503 0.029199 3.30 5.72E-03
chr16
0.40668 0.021232 5.22 2.91E-05 0.86145 0.056245 6.53 1.04E-01
chr17
0.42591 0.027001 6.34 5.85E-04 0.90135 0.068151 7.56 1.24E-01
chr18
0.46529 0.016239 3.49 8.02E-09
chr19
0.63003 0.063272 10.04 3.30E-02 1.33522 0.150794 11.29 3.04E-01
chr20
0.49925 0.023907 4.79 1.65E-05 1.05648 0.064440 6.10 7.98E-02
chr21
2.06768 0.087175 4.22 5.10E-05
chr22
0.88726 0.083330 9.39 3.43E-02 1.87509 0.198316 10.58 2.43E-01
chrX
0.27398 0.016109 5.88 1.16E-04 0.58665 0.027280 4.65 7.50E-02
TABLA 4
Dosis de Cromosoma Calificada, Varianza y Diferenciabilidad para cromosomas 13, X e Y
13 (n=47)
X (n=20)
Media
Des Est CV Dif Media Des Est CV Prueba T
chr1
0.37213 0.018589 5.00 2.41 0.58035 0.02706 4.66 5.68E-05
chr2
0.36707 0.010067 2.74 3.03 0.57260 0.01432 2.50 1.53E-09
chr3
0.45354 0.008121 1.79 3.67 0.70741 0.01126 1.59 9.04E-13
chr4
0.52543 0.005306 1.01 2.39 0.82144 0.01192 1.45 5.86E-16
chr5
0.51228 0.008273 1.61 3.95 0.79921 0.01100 1.38 2.32E-13
chr6
0.53756 0.008901 1.66 3.91 0.83880 0.01261 1.50 3.64E-13
chr7
0.58908 0.018508 3.14 2.83 0.91927 0.02700 2.94 1.86E-08
chr8
0.60695 0.015797 2.60 3.05 0.94675 0.02173 2.30 3.40E-10
chr9
0.75816 0.033107 4.37 2.59 1.18180 0.04827 4.08 9.63E-06
chr10
0.62018 0.029891 4.82 2.56 0.96642 0.04257 4.40 4.55E-05
(continuada)
Dosis de Cromosoma Calificada, Varianza y Diferenciabilidad para cromosomas 13, X e Y
13 (n=47)
X (n=20)
Media
Des Est CV Dif Media Des Est CV Prueba T
chr11
0.63248 0.029204 4.62 2.55 0.98643 0.04222 4.28 1.82E-05
chr12
0.66574 0.023047 3.46 2.76 1.03840 0.03301 3.18 1.26E-07
chr13
1.56355 0.01370 0.88 6.33E-17
chr14
0.98358 0.035331 3.59 2.67 1.58114 0.08076 5.11 2.29E-04
chr15
1.01432 0.055806 5.50 2.39 1.53464 0.12719 8.29 2.01E-02
chr16
0.98577 0.085933 8.72 2.17 1.61094 0.14829 9.21 2.68E-02
chr17
1.03217 0.100389 9.73 2.13 1.74904 0.07290 4.17 1.62E-04
chr18
1.13489 0.040058 3.53 2.62 2.38397 0.30515 12.80 1.07E-01
chr19
1.52678 0.203732 13.34 1.98 1.88186 0.14674 7.80 1.56E-02
chr20
1.20919 0.100371 8.30 2.27 3.71853 0.22406 6.03 4.21E-04
chr21
2.38087 0.132418 5.56 2.29 3.35158 0.40246 12.01 8.66E-02
chr22
2.14557 0.271281 12.64 2.13 0.58035 0.02706 4.66 5.68E-05
chrX
0.66883 0.029157 4.36 1.04
chr2-6
0.46965 0.006987 1.49 4.17
chr3-6
0.50496 0.005373 1.06 5.16
Y (n=25)
Media
Des Est CV Prueba T
Chr 1-22,X
0.00728 0.00227 31.19 1.30E-13
Los ejemplos de diagnósticos de T21, T13, T18 y síndrome de Turner obtenidos usando los cromosomas
normalizadores, dosis de cromosomas y diferenciabilidad para cada uno de los cromosomas de interés se describen
en el Ejemplo 6.
Ejemplo 5
45 Selección de SNPs autosómicos para la determinación de la fracción fetal
Se seleccionó un conjunto de 28 SNPs autosómicos de una lista de 92 SNPs (Pakstis et al., Hum Genet 127:315-324 [2010]), y de las secuencias de SNP disponibles en Applied Biosystems en la dirección de la red mundial appliedbiosystems.com, y validada para su uso en amplificación por PCR multiplexado y para secuenciación masivamente paralela. Los cebadores se diseñaron para hibridar con una secuencia cercana con el sitio de SNPs en el ADN libre de células para asegurar que se incluya en la lectura de 36 bp generada de la secuenciación masivamente paralela en el Analizador GII Illumina, y para generar amplicones de longitud suficiente para someterse a amplificación por puente durante la formación de clústeres. Por lo tanto, los cebadores se diseñaron para generar amplicones que fueron de al menos 110 bp, que cuando se combinan con los adaptadores universales (Illumina Inc.,
55 San Diego, CA) usados para amplificación de clústeres, resultó en moléculas de ADN de al menos 200 bp. Se identificaron secuencias de cebadores, y los conjuntos de cebadores, es decir cebadores directos e inversos, se sintetizaron por Integrated DNA Technologies (San Diego, CA), y se almacenaron como una solución de 1µM para ser usada para amplificar secuencias objetivo polimórficas como se describe en los Ejemplos 5-8. La Tabla 5 proporciona los números de ID de entrada de los RefSNP (rs), los cebadores usados para amplificar la secuencia de ADN libre de células objetivo, y las secuencias de los amplicones que comprenden los posibles alelos de SNP que serían generados usando los cebadores. Los SNPs dados en la Tabla 5 se usaron para la amplificación simultanea de 13 secuencias objetivo en un ensayo multiplexado. El panel proporcionado en la Tabla 5 es un panel de SNP ejemplar. Se pueden emplear menos o más SNPs para enriquecer el ADN fetal y materno para ácidos nucleicos objetivo polimórficos. SNPs adicionales que pueden usarse incluyen los SNPs dados en la Tabla 6. Los alelos de
65 SNP se muestran en negrita y están subrayados. Otros SNPs que se pueden usar para determinar la fracción fetal
de acuerdo con el presente método incluyen rs315791, rs3780962, rs1410059, rs279844, rs38882, rs9951171, rs214955, rs6444724, rs2503107, rs1019029, rs1413212, rs1031825, rs891700, rs1005533, rs2831700, rs354439, rs1979255, rs1454361, rs8037429, y rs1490413, que han sido analizados para determinar la fracción fetal por PCR TaqMan y se divulgan en la solicitudes Provisionales US 61/296,358 y 61/360,837.
Ejemplo 6
Determinación simultánea de Aneuploidía y Fracción fetal: Enriquecimiento de los ácidos nucleicos fetales y maternos en una muestra de biblioteca de secuenciación de ADN libre de células
Para enriquecer el ADN libre de células fetal y materno contenido en una biblioteca de secuenciación primaria construida usando ADN libre de células fetal y materno purificado, se usó una porción de una muestra de ADN libre de células para amplificar secuencias de ácidos nucleicos objetivo polimórficas, y para preparar una biblioteca de secuenciación de ácidos nucleicos objetivo polimórficos amplificados, que se usó para enriquecer las secuencias de ácidos nucleicos fetales y maternos comprendidas en la biblioteca primaria.
Se preparó una biblioteca de secuenciación usando ADN libre de células purificado como se describe en el Ejemplo 1.
Se preparó una biblioteca de secuenciación como sigue: El ADN libre de células contenido en 5 µl de ADN libre de células purificado se amplificó en un volumen de reacción de 50 µl que contenía 7,5µl de una mezcla de cebadores de 1 uM (Tabla 5), 10µl de Mezcla maestra NEB 5X y 27 µl de agua. El ciclado térmico se realizó con el Gene Amp9700 (Applied Biosystems). Usando las siguientes condiciones de ciclado: incubar a 95º C durante 1 minuto, seguido por 30 ciclos a 95º C durante 20 segundos, 68º C durante 1 minuto y 68º C durante 30 segundos, que fue seguido por una incubación final a 68º C durante 5 minutos. Se añadió un mantenimiento final a 4º C hasta que las muestras fueron retiradas para combinarlas con la porción no amplificada de la muestra de ADN libre de células purificada. El producto amplificado se purificó usando el sistema de purificación por PCR Agencourt AMPure XP (Parte No. A63881; Beckman Coulter Genomics, Danvers, MA). Se añadió un mantenimiento final a 4º C hasta que se retiraron las muestras para preparar la biblioteca objetivo. El producto se analizó con un Bioanalizador 2100 (Agilent Technologies, Sunnyvale, CA), y se determinó la concentración del producto amplificado. Se uso un quinto del producto amplificado purificado para preparar una biblioteca de secuenciación objetivo de ácidos nucleicos polimórficos amplificados como se describe en el Ejemplo 2. Las bibliotecas de secuenciación primaria y la objetivo se diluyeron cada una a 10nM, y la biblioteca objetivo se combinó a una proporción de 1:9 con la biblioteca de secuenciación para proporcionar una biblioteca de secuenciación enriquecida. La secuenciación de la biblioteca enriquecida y el análisis de los datos de secuenciación se realizaron como se describe en el Ejemplo 3.
a. Determinación de la fracción fetal
La determinación de la fracción fetal se realizó como se describe en el Ejemplo 5, y la fracción fetal se calculó como se ha descrito anteriormente, es decir:
% del alelox de la fracción fetal = ((Σetiquetas de secuencia fetal para el alelox)/(Σetiquetas de secuencia materna para el alelox)) x 100
TABLA 7
Determinación Simultánea de Aneuploidía y Fracción Fetal: Determinación de la Fracción Fetal
ID de la Muestra (cariotipo)
SNP RECUENTOS DE ETIQUETAS DE SNP FRACCION FETAL (%)
11409 (47, XY+21)
rs13182883.1|Chr.5|longitud=111|alelo=A 261 4.41
rs13182883.2|Chr.5|longitud=111|alelo=G
5918
rs740598.1|Chr.10|longitud=114|alelo=A
5545 7.30
rs740598.2|Chr.10|longitud=114|alelo=G
405
rs8078417.1|Chr.17|longitud=110|alelo=C
8189 6.74
rs8078417.2|Chr.17|longitud=110|alelo=T
121470
rs576261.1|Chr.19|longitud=114|alelo=A
58342 7.62
rs576261.2|Chr.19|longitud=114|alelo=C
4443
Fracción Fetal (Media±D.S.) = 6.53±1.45
ID de la Muestra
95133 (47, XX+18)
rs1109037.1|Chr.2|longitud=126|alelo=A 12229 2.15
rs1109037.2|Chr.2|longitud=126|alelo=G
263
(continuada)
ID de la Muestra
rs13218440.1|Chr.6|longitud=139|alelo=A
55949 3.09
rs13218440.2|Chr.6|longitud=139|alelo=G
1729
rs7041158.1|Chr.9|longitud=117|alelo=C
7281 4.12
rs7041158.2|Chr.9|longitud=117|alelo=T
300
rs7205345.1|Chr.16|longitud=116|alelo=C
53999 2.14
rs7205345.2|Chr.16|longitud=116|alelo=G
1154
Fracción Fetal (Media±D.S.) = 2.9±0.9
ID de la Muestra
51236 (46,XY+13)
rs13218440.1|Chr.6|longitud=139|alelo=A 1119 1.65
rs13218440.2|Chr.6|longitud=139|alelo=G
67756
rs560681.1|Chr.1|longitud=111|alelo=A
14123 5.18
rs560681.2|Chr.1|longitud=111|alelo=G
732
rs7205345.1|Chr.16|longitud=116|alelo=C
18176 1.63
rs7205345.2|Chr.16|longitud=116|alelo=G
296
rs9866013.1|Chr.3|longitud=121|alelo=C
117 2.33
rs9866013.2|Chr.3|longitud=121|alelo=T
5024
Fracción Fetal (Media±D.S.) = 2.7±1.7
ID de la Muestra
54430 (45,XO)
rs1109037.1|Chr.2|longitud=126|alelo=A 19841 1.80
rs1109037.2|Chr.2|longitud=126|alelo=G
357
rs9866013.1|Chr.3|longitud=121|alelo=C
12931 3.81
rs9866013.2|Chr.3|longitud=121|alelo=T
493
rs7041158.1|Chr.9|longitud=117|alelo=C
2800 4.25
rs7041158.2|Chr.9|longitud=117|alelo=T
119
rs740598.1|Chr.10|longitud=114|alelo=A
12903 4.87
rs740598.2|Chr.10|longitud=114|alelo=G
628
rs10773760.1|Chr.12|longitud=128|alelo=A
46324 4.65
rs10773760.2|Chr.12|longitud=128|alelo=G
2154
Fracción Fetal (Media±D.S.) = 3.9±1.2
b. Determinación de aneuploidía
55 La determinación de aneuploidía de los cromosomas 21, 13, 18 y X se realizó usando dosis de cromosomas como se describe en el Ejemplo 4. La dosis de cromosoma 21 se determinó usando el cromosoma 14 como el cromosoma normalizador; la dosis de cromosoma 13 se determinó usando el grupo de cromosomas 3, 4, 5 y 6 como el cromosoma normalizador; la dosis de cromosoma 18 se determinó usando el cromosoma 8 como el cromosoma normalizador; y la dosis de cromosoma X se determinó usando el cromosoma 4 como el cromosoma normalizador. Los límites se calcularon para ser 2 desviaciones estándar por encima y por debajo de la media determinada en las muestras calificadas.
La Tabla 7 muestra los datos para la determinación de la fracción fetal en muestras ejemplares. Los valores 65 de dosis de cromosoma calculados para los cromosomas 21, 18, 13, X e Y en las muestras de ensayo ejemplares
correspondientes se dan en las Tablas 8, 9, 10, 11 y 12, respectivamente.
Trisomía 18
La Tabla 9 proporciona la dosis calculada para el cromosoma 18 en una muestra de ensayo (95133). El cromosoma 8 se usó como el cromosoma normalizador. En esta situación, el cromosoma 8 tenía la variabilidad más baja y la diferenciabilidad más alta. El límite calculado para el diagnóstico positivo de la aneuploidía T18 se estableció en más de 2 desviaciones estándar de la media de las muestras calificadas (no T18). Se dio un diagnóstico para la T18 en base a que la dosis de cromosoma en la muestra de ensayo era mayor que el límite establecido. Se identificaron ocho muestras de T18 usando dosis de cromosomas, y se confirmaron que eran T18 por cariotipado.
TABLA 9
Dosis de Cromosoma para una aneuploidía T18
Cromosoma
Densidad de Etiqueta de Secuencia Dosis de Cromosoma para Chr 18 Límite
Chr18
604,291 0.550731 0.533297
Chr8
1,097,253
Trisomía 13
25 Las Tablas 10 y 11 proporcionan la dosis calculada para el cromosoma 13 en una muestra de ensayo (51236). El límite calculado para el diagnóstico positivo de la aneuploidía T13 se estableció en 2 desviaciones estándar de la media de las muestras calificadas (no T13). La dosis de cromosoma para el cromosoma 13 proporcionada en la Tabla 10 se calculó usando la densidad de etiqueta de secuencia para el cromosoma 4 como el cromosoma normalizador, mientras que la dosis dada en la Tabla 11 se determinó usando la media de las proporciones de densidades de etiquetas de secuencia para el grupo de cromosomas 3, 4, 5 y 6 como el cromosoma normalizador. Se dio un diagnóstico para T13 en base a que la dosis de cromosoma en la muestra de ensayo era mayor que el límite establecido. Una muestra de T13 se identificó usando dosis de cromosomas, y se confirmaron que eran T13 por cariotipado.
35 Los datos muestran que la combinación de cromosomas 3, 4, 5 y 6 proporcionan una variabilidad (1,06) que es similar a la del cromosoma 4 (1,01), demostrando que un grupo de cromosomas se puede usar como el cromosoma normalizador para determinar las dosis de cromosomas e identificar aneuploidías.
TABLA 10
Dosis de Cromosoma para una Aneuploidía T13
Cromosoma
Densidad de Etiqueta de Secuencia Dosis de Cromosoma para Chr 13 Límite
Chr13
669,872 0.538140 0.536044
Chr4
1,244,791
TABLA 11
Dosis de Cromosoma para una Aneuploidía T13
Cromosoma
Densidad de Etiqueta de Secuencia Dosis de Cromosoma para Chr 13 Límite
Chr13
669,872 0.532674 0.515706
Chr3
1,385,881
Chr4
1,244,791
Chr5
1,229,257
Chr6
1,170,331
Síndrome de Turner (monosomía X)
Se identificaron tres muestras que tenían una dosis de cromosoma menor que la del límite establecido que tenían menos de un cromosoma X. Se determinó que las mismas muestras tenían una dosis de cromosoma Y que era menor que el límite establecido, indicando que las muestras no tenían un cromosoma Y.
Las dosis calculadas para los cromosomas X e Y en la muestra de ensayo de monosomía Y ejemplar (54430) se dan en la Tabla 12. El Cromosoma 4 se seleccionó como el cromosoma normalizador para calcular la dosis para el cromosoma X; y todos los cromosomas, es decir 1-22 e Y, se usaron como los cromosomas normalizadores. El límite calculado para el diagnóstico positivo del Síndrome de Turner (monosomía X) se estableció para el cromosoma X en <-2 desviaciones estándar de la medio y para la ausencia del cromosoma Y en <-2 desviaciones estándar de la media para las muestras calificadas (no monosomía Y).
TABLA 12
Dosis de Cromosoma para un Síndrome de Turner (monosomía X)
Cromosoma
Densidad de Etiqueta de Secuencia Dosis de Cromosoma para Chr X Límite
ChrX
904,049 0.777990 0.797603
Chr4
1,162,031
ChrY
390 0.0004462 0.002737754
Chr(1-22, X) (Media)
874,108.1
Por lo tanto, el método permite la determinación simultánea de aneuploidías cromosómicas y la fracción fetal por secuenciación masivamente paralela de una muestra materna que comprende una mezcla de ADN libre de células fetal y materno que ha sido enriquecido para una pluralidad de secuencias polimórficas comprendiendo cada una un SNP. En este ejemplo, la mezcla de ácidos nucleicos fetales y maternos se enriqueció combinando una porción de una biblioteca de secuenciación que se construyó de secuencias polimórficas fetales y maternas con una biblioteca de secuenciación que se construyó de la mezcla de ADN libre de células feral y materno original no amplificado.
Ejemplo 7
Determinación Simultánea de Aneuploidía y Fracción fetal: Enriquecimiento de ácidos nucleicos fetales y maternos en una muestra de ADN libre de células purificada
Para enriquecer el ADN libre de células fetal y materno contenido en una muestra purificada de ADN libre de células extraído de una muestra de plasma materno, se usó una porción del ADN libre de células purificado para amplificar secuencias de ácidos nucleicos objetivo polimórficos que comprenden cada una un SNP elegido del panel de SNPs dado en la tabla 6.
El plasma libre de células se obtuvo de una muestra de sangre materna, y el ADN libre de células se purificó de la muestra de plasma como se describe en el Ejemplo 1. La concentración final se determinó que era de 92,8 pg/µl.
El ADN libre de células contenido en 5 µl de ADN libre de células purificado se amplificó en un volumen de reacción de 50 µl que contenía 7,5µl de una mezcla de cebadores de 1 uM (Tabla 5), 10µl de Mezcla maestra NEB 5X y 27 µl de agua. El ciclado térmico se realizó con el Gene Amp9700 (Applied Biosystems). Usando las siguientes condiciones de ciclado: incubar a 95º C durante 1 minuto, seguido por 30 ciclos a 95º C durante 20 segundos, 68º C durante 1 minuto y 68º C durante 30 segundos, que fue seguido por una incubación final a 68º C durante 5 minutos. Se añadió un mantenimiento final a 4º C hasta que las muestras fueron retiradas para combinarlas con la porción no amplificada de la muestra de ADN libre de células purificada. El producto amplificado se purificó usando el sistema de purificación por PCR Agencourt AMPure XP (Parte No. A63881; Beckman Coulter Genomics, Danvers, MA), y se cuantificó la concentración usando el Nanodrop 2000 (Thermo Scientific, Wilmington, DE). El producto de la amplificación purificado se diluyó al 1:10 en agua y se añadieron 0,9µl (371 pg) a 40 µl de muestra de ADN libre de células purificado para obtener una espiga del 10%. El ADN libre de células fetal y materno enriquecido presente en la muestra de ADN libre de células purificado se usó para preparar una biblioteca de secuenciación, y se secuenció como se describe en el Ejemplo 2.
La Tabla 13 proporciona los recuentos de etiquetas obtenidos para cada uno de los cromosomas 21, 18, 13, X e Y, es decir la densidad de etiqueta de secuencia, y los recuentos de etiquetas obtenidos para las secuencias polimórficas informativas contenidas en el genoma de referencia de SNP, es decir densidad de etiqueta de SNP. Los datos muestran que la información de la secuenciación se puede obtener secuenciando una única biblioteca construida de una muestra de ADN libre de células materna purificada que ha sido enriquecida para secuencias que
comprenden SNPs para determinar simultáneamente la presencia o ausencia de aneuploidía y la fracción fetal. En
el ejemplo dado los datos muestran que la fracción fetal de ADN en la muestra de plasma AFR105 era cuantificable
que los resultados de secuenciación de cinco SNPs informativos y se determinó que era del 3,84%. Las densidades
de etiquetas de secuencia se proporcionan para los cromosomas 21, 13, 18, X e Y. La muestra AFR105 fue la única
5
muestra que se sometió al protocolo de enriquecer ADN libre de células purificado para secuencias polimórficas
amplificadas. Por lo tanto, no se proporcionaron los coeficientes de variación y ensayos para la diferenciabilidad. Sin
embargo, el ejemplo muestra que el protocolo de enriquecimiento proporciona los recuentos de etiquetas requeridos
para determinar la aneuploidía y la fracción fetal a partir de un único proceso de secuenciación.
15
25
35
45
55
Ejemplo 8
Determinación Simultánea de Aneuploidía y Fracción Fetal: Enriquecimiento de ácidos nucleicos fetales y maternos en una muestra de sangre
Para enriquecer el ADN libre de células feral y materno contenido en una muestra de plasma original derivada de una mujer embarazada, se usó una porción de la muestra de plasma original para amplificar secuencias de ácidos nucleicos objetivo polimórficas que comprendía cada una un SNP del panel de SNPs proporcionado en la Tabla 14, y una porción del producto amplificado se combinó con el resto de la muestra de plasma original.
El ADN libre de células contenido en 15µl de plasma libre de células se amplificó en un volumen de reacción de 50µl que contenía 9µl de una mezcla de cebadores de 1µm (15 plex Tabla 5), 1µl de ADN polimerasa de sangre Phusion, 25µl del tampón de PCR de sangre Phusion que contenía desoxinucleótidos trifosfatos (dNTPs: dATP, dCTP, dGTP y dTTP). El ciclado térmico se realizó con el Gene Amp9700 (Applied Biosystems) usando las siguientes condiciones de ciclado: incubar a 95º C durante 3 minutos, seguido por 35 ciclos a 95º C durante 20 segundos, 55º C durante 30 segundos, y 70º C durante 1 minuto, a lo que siguió una incubación final a 68º C durante 5 minutos. Se añadió un mantenimiento final a 4º C hasta que las muestras se retiraron para la combinación con la porción no amplificada del plasma libre de células. El producto amplificado se diluyó a 1:2 con agua y se analizó usando el Bioanalizador. Se diluyeron 3 µl adicionales del producto amplificado con 11,85µl de agua para obtener una concentración final de 2 ng/µl. Se combinaron 2,2µl del producto amplificado diluido con el resto de la muestra de plasma. El ADN libre de células fetal y materno enriquecido presente en la muestra de plasma se purificó como se describe en el Ejemplo 1, y se usó para preparar una biblioteca de secuenciación. La secuenciación y el análisis de los datos de secuenciación se realizaron como se describe en los Ejemplos 2 y 3.
Los resultados se dan en la Tabla 14. En el ejemplo dado, los datos muestran que la fracción de ADN fetal en la muestra de plasma SAC2517 era cuantificable de los resultados de secuenciación de un SNP informativo y se determinó que era del 9,5%. En el ejemplo dado, se mostró por cariotipado que la muestra SAC2517 no se vio afectada por aneuploidías de los cromosomas 21, 13, 18, X e Y. Las densidades de etiquetas de secuencia se proporcionan para los cromosomas 21, 13, 18, X e Y. La muestra SAC2517 fue la única muestra que se sometió al protocolo de enriquecimiento de ADN libre de células de plasma para secuencias polimórficas amplificadas. Por lo tanto, los coeficientes de variación y ensayos de diferenciabilidad no se pudieron determinar. El ejemplo demuestra que enriquecer la muestra de ADN libre de células fetal y materno presente en una muestra de plasma para secuencias de ácidos nucleicos que comprenden al menos un SNP informativo se puede usar para proporcionar la secuencia requisito y los recuentos de etiquetas de SNP para determinar la aneuploidía y la fracción fetal a partir de un único proceso de secuenciación.
Ejemplo 9
Determinación Simultánea de Aneuploidía y Fracción Fetal en muestras maternas enriquecidas para secuencias polimórficas que comprenden STRs
Para determinar simultáneamente la presencia o ausencia de una aneuploidía y la fracción fetal en una mezcla de ADN libre de células fetal y materno obtenido de una muestra materna, la mezcla se enriquece para secuencias polimórficas que comprenden STRs, se secuencia y se analizan los datos. El enriquecimiento puede ser de una biblioteca de secuenciación como se describe en el Ejemplo 6, de una muestra de ADN libre de células purificado como se describe en el ejemplo 7 o de una muestra de plasma como se describe en el ejemplo 8. En cada caso, la información de secuenciación se obtiene de secuenciar una biblioteca individual, lo que permite determinar simultáneamente la presencia o ausencia de una aneuploidía y la fracción fetal. Las STRs que se amplifican se eligen de las STRs codis y no codis divulgadas en la Tabla 9, y la amplificación de las secuencias de STRs polimórficas se obtiene usando los conjuntos correspondientes de cebadores proporcionados. Las STRs de la Tabla
15 9 han sido divulgadas anteriormente, y se han usado las STRs CSF1PO, FGA, D7S820, D13S317, D16S539, D18S51, D21S11, D2S1338 (ver tabla 5) para determinar la fracción fetal en muestras de ADN libre de células de plasma obtenidas de mujeres embarazadas con fetos masculinos o femeninos (ver Solicitudes provisionales US 61/296,358 y 61/360,837). La cuantificación de las STRs se realizó usando electroforesis capilar (ver Ejemplo 11). El Ejemplo 11 muestra que las STRs se pueden usar para determinar la fracción fetal.
TABLA 15
miniSTRS CODIS y NON-CODIS
Locus de STR (Nombre del Marcador)
Localización del Cromosoma Intervalo de Tamaño (bp) Acceso del GenBank Secuencias de Cebadores (Directo/Inverso)
Loci de miniSTR Codis*
CSF1PO
5q33.1 89-129 X14720 ACAGTAACTGCCTTCATAGATAG (CSF1PO_F; SEQ ID NO:113) GTGTCAGACCCTGTTCTAAGTA (CSF1PO_R; SEQ ID NO:114)
FGA
4q31.3 125-281 M64982 AAATAAAATTAGGCATATTTACAAGC (FGA_F; SEQ ID NO:115) GCTGAGTGATTTGTCTGTAATTG(FGA_R; SEQ ID NO:116)
TH01
11p15.5 51-98 D00269 CCTGTTCCTCCCTTATTTCCC(TH01_F; SEQ ID NO:117) GGGAACACAGACTCCATGGTG(TH01_R; SEQ ID NO:118)
TPOX
2p25.3 65-101 M68651 CTTAGGGAACCCTCACTGAATG(TPOX_F ; SEQ ID NO:119) GTCCTTGTCAGCGTTTATTTGC(TPOX_R; SEQ ID NO:120)
vWA
12p13.31 88-148 M25858 AATAATCAGTATGTGACTTGGATTGA(v WA_F; SEQ ID NO:121) ATAGGATGGATGGATAGATGGA(vWA_R ; SEQ ID NO:122)
D3S1358
3p21.31 72-120 NT_005997 CAGAGCAAGACCCTGTCTCAT(D3S1358_ F; SEQ ID NO:123) TCAACAGAGGCTTGCATGTAT(D3S1358_ R; SEQ ID NO:124)
D5S818
5q23.2 81-117 AC008512 GGGTGATTTTCCTCTTTGGT(D5S818_F; SEQ ID NO:125) AACATTTGTATCTTTATCTGTATCCTTAT TTAT(D5S818_R; SEQ ID NO:126)
(continuada) (continuada) (continuada) (continuada)
miniSTRS CODIS y NON-CODIS
Locus de STR (Nombre del Marcador)
Localización del Cromosoma Intervalo de Tamaño (bp) Acceso del GenBank Secuencias de Cebadores (Directo/Inverso)
Loci de miniSTR Codis*
D7S820
7q21.11 136-176 AC004848 GAACACTTGTCATAGTTTAGAACGAAC( D7S 820_F; SEQ ID NO:127) TCATTGACAGAATTGCACCA(D7S820_R; SEQ ID NO:128)
D8S1179
8q24.13 86-134 AF216671 TTTGTATTTCATGTGTACATTCGTATC(D 7S820_F; SEQ ID NO:129) ACCTATCCTGTAGATTATTTTCACTGTG( D7S 820_R; SEQ ID NO:130)
D13S317
13q31.1 88-132 AL353628 TCTGACCCATCTAACGCCTA(D13S317_F; SEQ ID NO:131) CAGACAGAAAGATAGATAGATGATTGA( D13 S317_R; SEQ ID NO:132)
D16S539
16q24.1 81-121 AC024591 ATACAGACAGACAGACAGGTG(D16S539 _F; SEQ ID NO:133) GCATGTATCTATCATCCATCTCT(D16S53 9_R; SEQ ID NO:134)
D18S51
18q21.33 113-193 AP001534 TGAGTGACAAATTGAGACCTT(D18S51_F ; SEQ ID NO:135) GTCTTACAATAACAGTTGCTACTATT(D1 8S51_R; SEQ ID NO:136)
D21S11
21q21.1 153-221 AP000433 ATTCCCCAAGTGAATTGC(D21S11_F; SEQ ID NO:137) GGTAGATAGACTGGATAGATAGACGA(D 21S11_R; SEQ ID NO:138)
D2S1338
2q35 90-142 AC01036 TGGAAACAGAAATGGCTTGG(D2S1338_F ; SEQ ID NO:139) GATTGCAGGAGGGAAGGAAG(D2S 13 38_ R; SEQ ID NO:140)
Penta D
21q22.3 94-167 AP001752 GAGCAAGACACCATCTCAAGAA(Penta D_F; SEQ ID NO:141) GAAATTTTACATTTATGTTTATGATTCTC T(Penta D_R; SEQ ID NO:142)
Penta E
15q26.2 80-175 AC027004 GGCGACTGAGCAAGACTC(PentaE_F;SEQID NO:143) GGTTATTAATTGAGAAAACTCCTTACA( Penta E _R; SEQ ID NO:144)
Loci de miniSTR No Codis*
D22S1045
22q12.3 82 -115 AL022314 (17) ATTTTCCCCGATGATAGTAGTCT(D22S10 45_F; SEQ ID NO:145) GCGAATGTATGATTGGCAATATTTTT(D2 2S1045_R; SEQ ID NO:146)
D20S1082
20q13.2 73 -101 AL158015 ACATGTATCCCAGAACTTAAAGTAAAC( D20S 1082_F; SEQ ID NO:147)
Loci de miniSTR No Codis*
GCAGAAGGGAAAATTGAAGCTG(D20S10 82_R; SEQ ID NO:148)
D20S482
20p13 85 -126 AL121781 (14) CAGAGACACCGAACCAATAAGA(D20S48 2_F; SEQ ID NO:149) GCCACATGAATCAATTCCTATAATAAA( D20S 482_R; SEQ ID NO:150)
D18S853
18p11.31 82 -104 AP005130 (11) GCACATGTACCCTAAAACTTAAAAT(D18 S853_F; SEQ ID NO:151) GTCAACCAAAACTCAACAAGTAGTAA(D 18S853_R; SEQ ID NO:152)
D17S1301
17q25.1 114 -139 AC016888 (12) AAGATGAAATTGCCATGTAAAAATA(D1 7S1301_F; SEQ ID NO:153) GTGTGTATAACAAAATTCCTATGATGG( D17S 1301_R; SEQ ID NO:154)
D17S974
17p13.1 114 -139 AC034303 (10) GCACCCAAAACTGAATGTCATA(D17S97 4_F; SEQ ID NO:155) GGTGAGAGTGAGACCCTGTC(D17S974_R ; SEQ ID NO:156)
D14S1434
14q32.13 70 -98 AL121612 (13) TGTAATAACTCTACGACTGTCTGTCTG(D 14S1434_F; SEQ ID NO:157) GAATAGGAGGTGGATGGATGG(D 14S 143 4_R; SEQ ID NO:158)
D12ATA63
12q23.3 76 -106 AC009771 (13) GAGCGAGACCCTGTCTCAAG(D 12ATA63 _F; SEQ ID NO:159) GGAAAAGACATAGGATAGCAATTT(D12 ATA63_R; SEQ ID NO:160)
D11S4463
11q25 88 -116 AP002806 (14) TCTGGATTGATCTGTCTGTCC(D11S4463_ F; SEQ ID NO:161) GAATTAAATACCATCTGAGCACTGAA(D 11S4463_R; SEQ ID NO:162)
D10S1435
10p15.3 82 -139 AL354747 (11) TGTTATAATGCATTGAGTTTTATTCTG(D 10S1435_F; SEQ ID NO:163) GCCTGTCTCAAAAATAAAGAGATAGAC A(D10S1435_R; SEQ ID NO:164)
D10S1248
10q26.3 79 -123 AL391869 (13) TTAATGAATTGAACAAATGAGTGAG(D1 0S1248_F; SEQ ID NO:165) GCAACTCTGGTTGTATTGTCTTCAT(D10S 1248_R; SEQ ID NO:166)
D9S2157
9q34.2 71 -107 AL162417 (10) CAAAGCGAGACTCTGTCTCAA(D9S2157_ F; SEQ ID NO:167) GAAAATGCTATCCTCTTTGGTATAAAT( D9S2 157_R; SEQ ID NO:168)
D9S1122
9q21.2 93 -125 AL161789 (12) GGGTATTTCAAGATAACTGTAGATAGG( D9S 1122_F; SEQ ID NO:168) GCTTCTGAAAGCTTCTAGTTTACC(D9S11 22_R; SEQ ID NO:170)
D8S1115
8p11.21 63 -96 AC090739 (9) TCCACATCCTCACCAACAC(D8S1115_F; SEQ ID NO:171)
Loci de miniSTR No Codis*
GCCTAGGAAGGCTACTGTCAA(D8S 1115_ R; SEQ ID NO:172)
D6S1017
6p21.1 81 -110 AL035588 (10) CCACCCGTCCATTTAGGC(D6S1017_F; SEQ ID NO:173) GTGAAAAAGTAGATATAATGGTTGGTG( D6S 1017_R; SEQ ID NO:174)
D6S474
6q21 107 -136 AL357514 (17) GGTTTTCCAAGAGATAGACCAATTA(D6S 474_F; SEQ ID NO:175) GTCCTCTCATAAATCCCTACTCATATC(D 6S474_R; SEQ ID NO:176)
D5S2500
5q11.2 85 -126 AC008791 (17) CTGTTGGTACATAATAGGTAGGTAGGT( D5S 2500_F; SEQ ID NO:177) GTCGTGGGCCCCATAAATC(D5S2500_R; SEQ ID NO:178)
D4S2408
4p15.1 85 -109 AC110763 (9) AAGGTACATAACAGTTCAATAGAAAGC( D4S 2408_F; SEQ ID NO:179) GTGAAATGACTGAAAAATAGTAACCA(D 4S2408_R; SEQ ID NO:180)
D4S2364
4q22.3 67 -83 AC022317 (9) CTAGGAGATCATGTGGGTATGATT(D4S2 364U_F; SEQ ID NO:181) GCAGTGAATAAATGAACGAATGGA(D4S 2364_R; SEQ ID NO:182)
D3S4529
3p12.1 111 -139 AC117452 (13) CCCAAAATTACTTGAGCCAAT(D3S452_F ; SEQ ID NO:183) GAGACAAAATGAAGAAACAGACAG(D3S 452_R; SEQ ID NO:184)
D3S3053
3q26.31 84 -108 AC069259 (9) TCTTTGCTCTCATGAATAGATCAGT(D3 S 3053_F; SEQ ID NO:185) GTTTGTGATAATGAACCCACTCAG(D3 S3 053_R; SEQ ID NO:186)
D2S1776
2q24.3 127 -161 AC009475 (11) TGAACACAGATGTTAAGTGTGTATATG( D2S1 776_F; SEQ ID NO:187) GTCTGAGGTGGACAGTTATGAAA(D2S17 76_R; SEQ ID NO:188)
D2S441
2p14 78 -110 AC079112 (12) CTGTGGCTCATCTATGAAAACTT(D2S441 _F; SEQ ID NO:189) GAAGTGGCTGTGGTGTTATGAT(D2S441_ R; SEQ ID NO:190)
D1S1677
1q23.3 81 -117 AL513307 (15) TTCTGTTGGTATAGAGCAGTGTTT(D 1 S 16 77_F; SEQ ID NO:191) GTGACAGGAAGGACGGAATG(D1S1677_ R; SEQ ID NO:192)
D1S1627
1p21.1 81 -100 AC093119 (13) CATGAGGTTTGCAAATACTATCTTAAC( D1S1 627_F; SEQ ID NO:193) GTTTTAATTTTCTCCAAATCTCCA(D 1 S 16 27_R; SEQ ID NO:194)
D1GATA113
1p36.23 81 -105 Z97987 (11) TCTTAGCCTAGATAGATACTTGCTTCC(D 1GATA113_F; SEQ ID NO:195)
Non-Codis miniSTR loci*
GTCAACCTTTGAGGCTATAGGAA(D1GA TA113_R; SEQ ID NO:196)
*(Butler et al., J Forensic Sci 5:1054-1064; Hill et al., Poster #44-17th International Symposium on Human Identification -2006)
La secuenciación de la biblioteca enriquecida para secuencias de STR polimórficas se realiza usando una tecnología NGS, por ejemplo secuenciación por síntesis. Las lecturas de secuencia de longitudes de al menos 100 bp se alinean con un genoma de referencia, por ejemplo la secuencia del genoma de referencia humano NCBI36/hg18, y con un genoma STR, y el número de etiquetas de secuencia mapeadas y etiquetas de STR obtenidas se usa para determinar la presencia o ausencia de aneuploidía y la fracción fetal, respectivamente. El genoma de referencia STR incluye las secuencias de amplicones amplificados de los cebadores dados.
Ejemplo 10
Determinación Simultánea de Aneuploidía y Fracción Fetal en Muestras Maternas Enriquecidas para Secuencias Polimórficas que Comprenden SNPs en tándem
Para determinar simultáneamente aneuploidía y fracción fetal en muestras maternas que comprenden ácidos nucleicos fetales y maternos, se enriquecen muestras de ADN libre de células purificado y muestras de bibliotecas de secuenciación para secuencias de ácidos nucleicos objetivo polimórficos que comprenden cada una un par de SNPs en tándem seleccionados de rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980-rs987981; rs4143392-rs4143391; rs1691324-rs13050434; rs11909758-rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs1 1088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141-rs2246777; rs2832959 -rs9980934; rs2833734rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485-rs3453; rs9974986-rs2834703; rs2776266rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672. Los cebadores usados para amplificar las secuencias objetivo que comprenden los SNPs en tándem están diseñados para abarcar ambos sitios de SNP. Por ejemplo, el cebador directo está diseñado para abarcar el primer SNP, y el cebador inverso está diseñado para abarcar el segundo del par de SNP en tándem, es decir cada uno de los sitios SNP en el par en tándem está abarcado dentro de los 36 bp generados por el método de secuenciación. La secuenciación de extremos emparejados se puede usar para identificar todas las secuencias que abarcan los sitios de SNP en tándem. Los conjuntos ejemplares de cebadores que se usan para amplificar los SNPs en tándem divulgados en la presente son rs7277033-rs2110153_F: TCCTGGAAACAAAAGTATT (SEQ ID NO:197) y rs7277033-rs2110153_R: AACCTTACAACAAAGCTAGAA (SEQ ID NO:198), set rs2822654-rs1882882_F: ACTAAGCCTTGGGGATCCAG (SEQ ID NO:199) y rs2822654-rs1882882_R: TGCTGTGGAAATACTAAAAGG (SEQ ID NO:200), set rs368657-rs376635 F:CTCCAGAGGTAATCCTGTGA (SEQ ID NO:201) y rs368657-rs376635_R:TGGTGTGAGATGGTATCTAGG (SEQ ID NO:202), rs2822731-rs2822732_F:GTATAATCCATGAATCTTGTTT (SEQ ID NO:203) y rs2822731-rs2822732_R:TTCAAATTGTATATAAGAGAGT (SEQ ID NO:204), rs1475881-rs7275487_F:GCAGGAAAGTTATTTTTAAT (SEQ ID NO:205) y rs1475881-rs7275487_R:TGCTTGAGAAAGCTAACACTT (SEQ ID NO:206), rs1735976-rs2827016F:CAGTGTTTGGAAATTGTCTG (SEQ ID NO:207) y rs1735976-rs2827016_R:GGCACTGGGAGATTATTGTA (SEQ ID NO:208), rs447349-rs2824097_F:TCCTGTTGTTAAGTACACAT (SEQ ID NO:209) y rs447349-rs2824097_R:GGGCCGTAATTACTTTTG (SEQ ID NO:210), rs418989-rs13047336_F:ACTCAGTAGGCACTTTGTGTC (SEQ ID NO:211) y rs418989-rs13047336_R:TCTTCCACCACACCAATC (SEQ ID NO:212), rs987980-rs987981_F:TGGCTTTTCAAAGGTAAAA (SEQ ID NO:213) y rs987980-rs987981_R: GCAACGTTAACATCTGAATTT (SEQ ID NO:214), rs4143392rs4143391_F: rs4143392-rs4143391 (SEQ ID NO:215) y rs4143392-rs4143391_R:ATTTTATATGTCATGATCTAAG (SEQ ID NO:216), rs1691324-rs13050434_F: AGAGATTACAGGTGTGAGC (SEQ ID NO:217) y rs1691324rs13050434_R: ATGATCCTCAACTGCCTCT (SEQ ID NO:218), rs11909758-rs9980111_F: TGAAACTCAAAAGAGAAAAG (SEQ ID NO:219) y rs11909758-rs9980111_R: ACAGATTTCTACTTAAAATT (SEQ ID NO:220), rs2826842-rs232414_F: TGAAACTCAAAAGAGAAAAG (SEQ ID NO:221) y rs2826842-rs232414_R: ACAGATTTCTACTTAAAATT (SEQ ID NO:22), rs2826842-rs232414_F: GCAAAGGGGTACTCTATGTA (SEQ ID NO:223) y rs2826842-rs232414_R: TATCGGGTCATCTTGTTAAA (SEQ ID NO:224), rs1980969-rs1980970_F: TCTAACAAAGCTCTGTCCAAAA (SEQ ID NO:225) y rs1980969-rs1980970-R: CCACACTGAATAACTGGAACA (SEQ ID NO:226), rs9978999-rs9979175_F: GCAAGCAAGCTCTCTACCTTC (SEQ ID NO:227) y rs9978999rs9979175_R: TGTTCTTCCAAAATTCACATGC (SEQ ID NO:228), rs1034346-rs12481852_F: ATTTCACTATTCCTTCATTTT (SEQ ID NO:229) y rs1034346-rs12481852_R: TAATTGTTGCACACTAAATTAC (SEQ ID NO:230), rs4817013-rs7277036_F: AAAAAGCCACAGAAATCAGTC (SEQ ID NO:231) y rs4817013rs7277036_R: TTCTTATATCTCACTGGGCATT (SEQ ID NO:232), rs9981121-rs2829696_F: GGATGGTAGAAGAGAAGAAAGG (SEQ ID NO:233) y rs9981121-rs2829696_R: GGATGGTAGAAGAGAAGAAAGG (SEQ ID NO:234), rs455921-rs2898102_F: TGCAAAGATGCAGAACCAAC (SEQ ID NO:235) y rs455921-rs2898102_R: TTTTGTTCCTTGTCCTGGCTGA (SEQ ID NO:236), rs2898102-rs458848_F: TGCAAAGATGCAGAACCAAC (SEQ ID NO:237) y rs2898102-rs458848_R: GCCTCCAGCTCTATCCAAGTT (SEQ ID NO:238), rs961301-rs2830208_F: CCTTAATATCTTCCCATGTCCA (SEQ ID NO:239) y rs961301-rs2830208_R: ATTGTTAGTGCCTCTTCTGCTT (SEQ ID NO:240), rs2174536-rs458076_F: GAGAAGTGAGGTCAGCAGCT (SEQ ID NO:241) y rs2174536-rs458076_R: TTTCTAAATTTCCATTGAACAG (SEQ ID NO:242), rs11088023rs11088024_F: GAAATTGGCAATCTGATTCT (SEQ ID NO:243) y rs11088023-rs11088024_R: CAACTTGTCCTTTATTGATGT (SEQ ID NO:244), rs1011734-rs1011733_F: CTATGTTGATAAAACATTGAAA (SEQ ID NO:245) y rs1011734-rs1011733_R: GCCTGTCTGGAATATAGTTT (SEQ ID NO:246), rs2831244-rs9789838_F: CAGGGCATATAATCTAAGCTGT (SEQ ID NO:247) y rs2831244-rs9789838_R: CAATGACTCTGAGTTGAGCAC (SEQ ID NO:248), rs8132769-rs2831440_F: ACTCTCTCCCTCCCCTCT (SEQ ID NO:249) y rs8132769rs2831440_R: TATGGCCCCAAAACTATTCT (SEQ ID NO:250), rs8134080-rs2831524_F: ACAAGTACTGGGCAGATTGA (SEQ ID NO:251) y rs8134080-rs2831524_R: GCCAGGTTTAGCTTTCAAGT (SEQ ID NO:252), rs4817219-rs4817220_F: TTTTATATCAGGAGAAACACTG (SEQ ID NO:253) y rs4817219rs4817220_R: CCAGAATTTTGGAGGTTTAAT (SEQ ID NO:254), rs2250911-rs2250997_F: TGTCATTCCTCCTTTATCTCCA (SEQ ID NO:255) y rs2250911-rs2250997_R: TTCTTTTGCCTCTCCCAAAG (SEQ ID NO:256), rs2831899-rs2831900_F: ACCCTGGCACAGTGTTGACT (SEQ ID NO:257) y rs2831899-rs2831900_R: TGGGCCTGAGTTGAGAAGAT (SEQ ID NO:258), rs2831902-rs2831903_F: AATTTGTAAGTATGTGCAACG (SEQ ID NO:259) y rs2831902-rs2831903_R: TTTTTCCCATTTCCAACTCT (SEQ ID NO:260), rs11088086-rs2251447_F: AAAAGATGAGACAGGCAGGT (SEQ ID NO:261) y rs11088086-rs2251447 _R: ACCCCTGTGAATCTCAAAAT (SEQ ID NO:262), rs2832040-rs11088088_F: GCACTTGCTTCTATTGTTTGT (SEQ ID NO:263) y rs2832040rs11088088_R: CCCTTCCTCTCTTCCATTCT (SEQ ID NO:264), rs2832141-rs2246777_F: AGCACTGCAGGTA (SEQ ID NO:265) y rs2832141-rs2246777_R: ACAGATACCAAAGAACTGCAA (SEQ ID NO:266), rs2832959 _ rs9980934_F: TGGACACCTTTCAACTTAGA (SEQ ID NO:267) y rs2832959 -rs9980934_R: GAACAGTAATGTTGAACTTTTT (SEQ ID NO:268), rs2833734-rs2833735_F: TCTTGCAAAAAGCTTAGCACA (SEQ ID NO:269) y rs2833734-rs2833735_R: AAAAAGATCTCAAAGGGTCCA (SEQ ID NO:270), rs933121-rs933122_F: GCTTTTGCTGAACATCAAGT (SEQ ID NO:271) y rs933121-rs933122_R: CCTTCCAGCAGCATAGTCT (SEQ ID NO:272), rs2834140-rs12626953_F: AAATCCAGGATGTGCAGT (SEQ ID NO:273) y rs2834140-rs12626953_R: ATGATGAGGTCAGTGGTGT (SEQ ID NO:274), rs2834485-rs3453_F: CATCACAGATCATAGTAAATGG (SEQ ID NO:275) y rs2834485-rs3453_R: AATTATTATTTTGCAGGCAAT (SEQ ID NO:276), rs9974986-rs2834703_F: CATGAGGCAAACACCTTTCC (SEQ ID NO:277) y rs9974986-rs2834703_R: GCTGGACTCAGGATAAAGAACA (SEQ ID NO:278), rs2776266-rs2835001_F: TGGAAGCCTGAGCTGACTAA (SEQ ID NO:279) y rs2776266-rs2835001_R:CCTTCTTTTCCCCCAGAATC (SEQ ID NO:280), rs1984014-rs1984015_F:TAGGAGAACAGAAGATCAGAG (SEQ ID NO:281) y rs1984014-rs1984015_R:AAAGACTATTGCTAAATGCTTG (SEQ ID NO:282), rs7281674-rs2835316_F: TAAGCGTAGGGCTGTGTGTG (SEQ ID NO:283) y rs7281674-rs2835316_R: GGACGGATAGACTCCAGAAGG (SEQ ID NO:284), rs13047304-rs13047322_F: GAATGACCTTGGCACTTTTATCA (SEQ ID NO:285) y rs13047304rs13047322_R: AAGGATAGAGATATACAGATGAATGGA (SEQ ID NO:286), rs2835735-rs2835736_F: CATGCACCGCGCAAATAC (SEQ ID NO:287) y rs2835735-rs2835736_R: ATGCCTCACCCACAAACAC (SEQ ID NO:288), rs13047608-rs2835826_F: TCCAAGCCCTTCTCACTCAC (SEQ ID NO:289) y rs13047608-rs2835826_R: CTGGGACGGTGACATTTTCT (SEQ ID NO:290), rs2836550-rs2212596_F: CCCAGGAAGAGTGGAAAGATT (SEQ ID NO:291) y rs2836550-rs2212596_R: TTAGCTTGCATGTACCTGTGT (SEQ ID NO:292), rs2836660-rs2836661_F: AGCTAGATGGGGTGAATTTT (SEQ ID NO:293) y _R: TGGGCTGAGGGGAGATTC (SEQ ID NO:294), rs465612rs8131220_F: ATCAAGCTAATTAATGTTATCT (SEQ ID NO:295) y rs465612-rs8131220_R: AATGAATAAGGTCCTCAGAG (SEQ ID NO:296), rs9980072-rs8130031_F:TTTAATCTGATCATTGCCCTA (SEQ ID NO:297) y rs9980072-rs8130031_R: AGCTGTGGGTGACCTTGA (SEQ ID NO:298), rs418359-rs2836926_F: TGTCCCACCATTGTGTATTA (SEQ ID NO:299) y rs418359-rs2836926_R: TCAGACTTGAAGTCCAGGAT (SEQ ID NO:300), rs7278447-rs7278858_F: GCTTCAGGGGTGTTAGTTTT (SEQ ID NO:301) y rs7278447-rs7278858_R: CTTTGTGAAAAGTCGTCCAG (SEQ ID NO:302), rs385787-rs367001_F:CCATCATGGAAAGCATGG (SEQ ID NO:303) y rs385787-rs367001_R: TCATCTCCATGACTGCACTA (SEQ ID NO:304), rs367001-rs386095_F: GAGATGACGGAGTAGCTCAT (SEQ ID NO:305) y rs367001-rs386095_R: CCCAGCTGCACTGTCTAC (SEQ ID NO:306), rs2837296-rs2837297_F: TCTTGTTCCAATCACAGGAC (SEQ ID NO:307) y rs2837296-rs2837297_R: ATGCTGTTAGCTGAAGCTCT (SEQ ID NO:308), y rs2837381-rs4816672_F: TGAAAGCTCCTAAAGCAGAG (SEQ ID NO:309) y rs2837381-rs4816672_R:TTGAAGAGATGTGCTATCAT (SEQ ID NO:310). Se pueden incluir secuencias de polinucleótidos, por ejemplo secuencias de abrazadera GC, para asegurar la hibridación específica de los cebadores ricos en AT (Ghanta et al., PLOS ONE 5(10): doi10.1371/journal.pone.0013184 [2010], disponible en la red mundial en plosone.org). Un ejemplo de una secuencia de abrazadera GC que se puede incluir o en el 5' del cebador directo o en el 3' del cebador inverso es la GCCGCCTGCAGCCCGCGCCCCCCGTGCCCCCGCCCCGCCGCCGGCCCGGGCGCC (SEQ ID NO:311). La preparación de la muestra y el enriquecimiento de la biblioteca de secuenciación de ADN libre de células, una muestra de ADN libre de células purificado y una muestra de plasma se realizan de acuerdo con el método descrito en los Ejemplos 6, 7 y 8, respectivamente. Todas las bibliotecas de secuenciación se preparan como se describe en el Ejemplo 2a, y la secuenciación se realiza como se describe en el Ejemplo 2b incluyendo secuenciación de extremos emparejados. El análisis de los datos de secuenciación para la determinación de aneuploidía fetal se realiza como se describe en los Ejemplos 3 y 4. Concomitante al análisis para determinar la aneuploidía, los datos de secuenciación se analizan para determinar la fracción fetal de la manera siguiente. Después de la transferencia de los archivos de imagen y designación de bases al servidor Unix que ejecuta el software "Genome Analyzer Pipeline" versión 1.51 de Illumina como se ha descrito en el Ejemplo 3a, las lecturas de 36bp se alinean con un 'genoma de SNP en tándem' usando el programa BOWTIE. El genoma de SNP en tándem se identifica como el agrupamiento de secuencias de ADN que abarcan los alelos de los 58 pares de SNP en tándem divulgados anteriormente. Sólo se usan lecturas que mapean únicamente para el genoma de SNP en tándem para el análisis de la fracción fetal. Las lecturas que equivalen perfectamente con el genoma de SNP en tándem se cuentan como etiquetas y se filtran. De las lecturas restantes, sólo se cuentan como etiquetas y se incluyen en el análisis las lecturas que tienen una o dos discrepancias. Se cuentan las etiquetas mapeadas para cada uno de los alelos de SNP en tándem, y se determina la fracción fetal esencialmente como se ha descrito en el Ejemplo 6 anterior pero contando para las etiquetas mapeadas para los dos alelos x e y de SNP en tándem presentes en cada una de las secuencias de ácidos nucleicos objetivo polimórficos amplificadas que se amplifican para enriquecer las muestras, ese decir
% de alelox+y de la fracción fetal = ((ΣEtiquetas de secuencia fetal para el alelox+y) / (ΣEtiquetas de secuencia materna para el alelox+y)) x 100.
Sólo se usan SNps en tándem informativos para determinar la fracción fetal.
Opcionalmente, la fracción de los ácidos nucleicos fetales en la mezcla de los ácidos nucleicos fetales y maternos se calcula para cada uno de los alelos informativos (alelox+y) de la manera siguiente:
% de alelox+y de la fracción fetal = ((2 X ΣEtiquetas de secuencia fetal para el alelox+y) / (ΣEtiquetas de secuencia materna para el alelox+y)) x 100,
para compensar por la presencia de 2 conjuntos de alelos fetales en tándem, uno estando enmascarado por el fondo materno.
El porcentaje de fracción fetal se calcula para al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, al menos 10, al menos 11, al menos 12, al menos 13, al menos 14, al menos 15, al menos 16, al menos 17, al menos 18, al menos 19, al menos 20, al menos 25, al menos 30, al menos 35, al menos 40 o más conjuntos informativos de alelos en tándem. En una realización, la fracción fetal es la fracción fetal media determinada para al menos 3 conjuntos informativos de alelos en tándem.
Ejemplo 11
Determinación de Fracción Fetal por Electroforesis Capilar de Secuencias Polimórficas que Comprenden STRs
Para determinar la fracción fetal en muestras maternas que comprenden ADN libre de células fetal y materno, se recogieron muestras de sangre periférica de mujeres embarazadas voluntarias que llevaban fetos masculinos o femeninos. Las muestras de sangre periférica se obtuvieron y procesaron para proporcionar ADN libre de células purificado como se describe en el Ejemplo 1.
Se analizaron diez microlitros de muestras de ADN libre de células usando el kit de amplificación por PCR AmpF1STR® MiniFiler™ (Applied Biosystems, Foster City, CA) de acuerdo con las instrucciones del fabricante. Brevemente, se amplificó el ADN libre de células contenido en 10 µl en un volumen de reacción de 25 µl que contenía 5µl de cebadores etiquetados por fluorescencia (Conjunto de cebadores AmpFlSTR® MiniFiler™) y la Mezcla Maestra AmpFlSTR® MiniFiler™, que incluye ADN polimerasa AmpliTaq Gold® y el tampón asociado, sal (1,5 mM MgCl2) y 200 µM de desoxinucleótido trifosfatos (dNTPs: dATP, dCTP, dGTP y dTTP). Los cebadores etiquetados por fluorescencia son cebadores directos que están etiquetados con colorantes 6FAM™, VIC™, NED™, y PET™. Se realizó el ciclado térmico con el Gene Amp9700 (Applied Biosystems) usando las siguientes condiciones de ciclado: incubación a 95º C durante 10 minutos, seguido por 30 ciclos a 94º C durante 20 segundos, 59º C durante 2 minutos y 72º C durante 1 minuto, a lo que siguió una incubación final a 60º C durante 45 minutos. Se añadió un mantenimiento final a 4º C hasta que las muestras se retiraron para análisis. El producto amplificado se preparó diluyendo 1ul de producto amplificado en 8,7ul de Hi-DiTM formamida (Applied Biosystems) y 0,3 µl de estándar de tamaño interno GeneScanTM-500 LIZ_ (Applied Biosystems), y se analizó con un Analizador Genético ABI PRISM3130x1 (Applied Biosystems) usando el Data Collection HID_G5_POP4 (Applied Biosystems), y una matriz capilar de 36-cm. Todo el genotipado se realizó con el software GeneMapper_ID v3.2 (Applied Biosystems) usando las escaleras alélicas e intervalos y paneles proporcionados por el fabricante.
Toda medición del genotipado se realizó en el Analizador Genético Applied Biosystems 3130xl, usando una "ventana" de ±0,5-nt de alrededor del tamaño obtenido para cada alelo para permitir la detección y asignación correcta de los alelos. Cualquier alelo de la muestra cuyo tamaño estaba fuera de la ventana de ±0,5-nt se determinó que era OL, es decir "Fuera de la escalera". Los alelos OL son alelos de un tamaño que no está representado en la Escalera Alélica AmpFlSTR® MiniFiler™ e un alelo que no corresponde con una escalera alélica, pero cuyo tamaño está justo fuera de una ventana debido a un error de medición. Se estableció el límite de altura del pico mínimo de >50 RFU en base a los experimentos de validación realizados para evitar el tipificado cuando es probable que los efectos estocásticos interfieran con la interpretación precisa de las mezclas. El cálculo de la fracción fetal se basa en hacer la media de todos los marcadores informativos. Los marcadores informativos se identifican por la presencia de picos en el electroferograma que cae dentro de los parámetros de los intervalos preestablecidos para las STRs que se analizan.
Los cálculos de la fracción fetal se realizaron usando la altura de pico media para los alelos principales y menores en cada locus de STR determinado por inyecciones por triplicado. Las reglas aplicadas al cálculo son:
1.
Los datos de alelos fuera de escalera (OL) para alelos no incluidos en el cálculo; y
2.
Sólo se incluyen en el cálculo alturas de pico derivadas de > 50 RFU (unidades de fluorescencia relativas)
3.
Si uno de los intervalos está presente el marcador se considera no informativo; y
4.
Si se designa un segundo intervalo pero los picos del primer y segundo intervalos están dentro del 50-70% de sus unidades de fluorescencia relativa (RFU) en la altura del pico, la fracción minoritaria no se mide y el marcador se considera no informativo.
La fracción del alelo menor para cualquier marcador informativo dado se calcula dividiendo la altura del pico del componente menor por la suma de la altura del pico para el componente principal, y se expresa como un porcentaje que fue primero calculado para cada locus informativo como
fracción fetal = (Σaltura del pico del alelo menor / Σaltura del pico del alelo(s) principal)) x 100
La fracción fetal para una muestra que comprende dos o más STRs informativas, se calcularía como la media de las fracciones fetales calculadas para dos o más marcadores informativos.
La Tabla 16 proporciona los datos obtenido de analizar ADN libre de células de un sujeto embarazado con un feto masculino.
TABLA 16
Fracción Fetal Determinada en ADN libre de células de un Sujeto Embarazado por análisis de STRs
STR
Alelo 1 Alelo2 Alelo3 Altura del Alelo 1 Altura del Alelo 2 Altura del Alelo 3 Fracción Fetal Fracción Fetal (Media/STR)
AMEL
X Y 3599 106 2.9
AMEL
X Y 3602 110 3.1
AMEL
X Y 3652 109 3.0 3.0
CSF1PO
11 12 2870 2730
CSF1PO
11 12 2924 2762
CSF1PO
11 12 2953 2786
D13S317
11 12 2621 2588
D13S317
11 12 2680 2619
D13S317
11 12 2717 2659
D16S539
9 11 1056 1416
D16S539
9 11 1038 1394
D16S539
9 11 1072 1437
D18S51
13 15 2026 1555
D18S51
13 15 2006 1557
D18S51
13 15 2050 1578
D21S11
28 31.2 2450 61 2.5
D21S11
28 31.2 2472 62 2.5
D21S11
28 31.2 2508 67 2.7 2.6
D2S1338
20 23 3417 3017
D2S1338
20 23 3407 3020
D2S1338
20 23 3493 3055
D7S820
9 12 13 2373 178 1123 5.1
D7S820
9 12 13 2411 181 1140 5.1
D7S820
9 12 13 2441 182 1156 5.1 5.1
FGA
17.2 22 25 68 1140 896 3.3
FGA
17.2 22 25 68 1144 909 3.1
FGA
17.2 22 25 68 1151 925 3.3 3.2
Fracción Fetal = 3.5
Los resultados muestran que los miniSTRs pueden usarse para distinguir alelos fetales y maternos en ADN libre de células de una muestra de plasma materno. Se espera que los miniSTRs se puedan usar en secuenciación masivamente paralela para la determinación simultánea de aneuploidía y fracción fetal.

Claims (18)

  1. Reivindicaciones
    1. Un método para determinar simultáneamente aneuploidía y fracción fetal en una muestra materna de sangre, plasma o suero que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, en el que la mezcla de moléculas de ácidos nucleicos fetales y maternos son moléculas de ADN libre de células (ADNcf) y dicha fracción fetal es la fracción de dichas moléculas de ácidos nucleicos proporcionadas por un feto a dicha mezcla de moléculas de ácidos nucleicos fetales y maternos, dicho método comprende:
    (a)
    enriquecer dicha mezcla para una pluralidad de ácidos nucleicos objetivo polimórficos, en donde cada uno de dichos ácidos nucleicos objetivo se sabe que comprende al menos un sitio polimórfico, y en donde dicho enriquecimiento comprende:
    (i)
    amplificar específicamente dicha pluralidad de ácidos nucleicos objetivo en una porción de dicha mezcla usando pares de cebadores cada uno capaz de amplificar una secuencia de ácidos nucleicos objetivo que comprende un sitio polimórfico en una reacción de PCR multiplex para generar un panel de sitios polimórficos amplificados que contiene un número suficiente de sitios polimórficos de tal forma que al menos dos son sitios polimórficos informativos; y
    (ii)
    combinar al menos una porción de todo el producto amplificado con al menos una porción del resto de la muestra no amplificada de la que se obtuvo la porción;
    (b)
    secuenciar al menos una porción de la mezcla enriquecida obtenida en el paso (a), en donde dicha secuenciación comprende proporcionar una pluralidad de lecturas de secuencia que se mapean para un genoma para identificar una pluralidad de etiquetas de secuencia mapeadas; y
    (c)
    usar dicha pluralidad de etiquetas de secuencia mapeadas, determinar simultáneamente dicha fracción fetal y dicha aneuploidía, en donde:
    (i)
    determinar dicha fracción fetal comprende:
    (1)
    usar las etiquetas de secuencia mapeadas para identificar al menos dos sitios polimórficos informativos en dicho panel de sitios polimórficos amplificados, en donde dichos sitios polimórficos informativos se identifican por la diferencia en las secuencias alélicas y el número de etiquetas de secuencia mapeadas para cada uno de los alelos posibles en cada sitio polimórfico; y
    (2)
    calcular la fracción fetal en base al número total de etiquetas de secuencia que mapean para el primer alelo y el número total de etiquetas de secuencia que mapean para un segundo alelo en cada uno de dichos sitios polimórficos informativos; y
    (ii)
    determinar dicha aneuploidía comprende la cuantificación del número de etiquetas de secuencia que alinean con un cromosoma de interés, y comparar los resultados obtenidos para el cromosoma de interés con un valor límite, en donde el valor límite es un número que sirve como un límite de diagnóstico de una aneuploidía y en donde la presencia de una aneuploidía para el cromosoma de interés se identifica si el valor límite es excedido por los resultados obtenidos para el cromosoma de interés.
  2. 2. El método de la reivindicación 1, en donde dicho paso de enriquecimiento (a) comprende:
    (i)
    amplificar una pluralidad de ácidos nucleicos objetivo polimórficos para generar un panel de sitios polimórficos que contiene un número suficiente de sitios polimórficos de tal manera que al menos tres son sitios polimórficos informativos;
    (ii)
    amplificar una pluralidad de ácidos nucleicos objetivo polimórficos para generar un panel de sitios polimórficos que contiene un número suficiente de sitios polimórficos de tal manera que al menos cuatro son sitios polimórficos informativos; o
    (iii) amplificar una pluralidad de ácidos nucleicos objetivo polimórficos para generar un panel de sitios polimórficos que contiene un número suficiente de sitios polimórficos de tal manera que al menos cinco son sitios polimórficos informativos.
  3. 3. El método de la Reivindicación 1 o la Reivindicación 2, en donde determinar dicha fracción fetal en el paso (c) comprende calcular la fracción fetal en base a:
    (i)
    el número total de etiquetas de secuencia que mapean par aun primer alelo y el número total de etiquetas de secuencia que mapean para un segundo alelo para cada uno de los al menos tres alelos informativos;
    (ii)
    el número total de etiquetas de secuencia que mapean par aun primer alelo y el número total de etiquetas de secuencia que mapean para un segundo alelo para cada uno de los menos cuatro alelos informativos; o
    (iii) el número total de etiquetas de secuencia que mapean par aun primer alelo y el número total de etiquetas de secuencia que mapean para un segundo alelo para cada uno de los al menos cinco alelos informativos.
  4. 4.
    El método de cualquiera de las Reivindicaciones 1-3, en donde dicho paso de enriquecimiento (a) comprende
    amplificar una pluralidad de ácidos nucleicos objetivo polimórficos en una porción de una mezcla purificada de ácidos nucleicos fetales y maternos.
  5. 5.
    El método de cualquiera de las Reivindicaciones 1-3, en donde dicho enriquecimiento comprende:
    (i)
    preparar una primera biblioteca de secuenciación de dicha mezcla de moléculas de ácidos nucleicos fetales y maternos;
    (ii)
    preparar una segunda biblioteca de secuenciación de dichos ácidos nucleicos objetivo polimórficos; y
    (iii) combinar al menos una porción de dicha primera biblioteca de secuenciación con al menos una porción de dicha segunda biblioteca de secuenciación.
  6. 6.
    El método de cualquiera de las Reivindicaciones anteriores, en donde dichos ácidos nucleicos objetivo polimórficos están localizados en el mismo cromosoma.
  7. 7.
    El método de cualquiera de las Reivindicaciones anteriores, en donde dichos ácidos nucleicos objetivo polimórficos están localizados en cromosomas diferentes.
  8. 8.
    El método de cualquiera de las Reivindicaciones anteriores, en donde cada uno de dicha pluralidad de ácidos nucleicos objetivo polimórficos comprende al menos un polimorfismo de nucleótido simple (SNP).
  9. 9.
    El método de la Reivindicación 8, en donde el SNP es un SNP individual.
  10. 10.
    El método de la Reivindicación 9, en donde dicho al menos un SNP es un SNP individual seleccionado de cada uno de dicha pluralidad de ácidos nucleicos objetivo polimórficos que comprende un SNP seleccionado de rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005 y rs530022.
  11. 11.
    El método de la Reivindicación 8, en donde el SNP es un SNP en tándem.
  12. 12.
    El método de la Reivindicación 11, en donde dicho al menos un SNP es un SNP en tándem seleccionado de los conjuntos de SNPs en tándem rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980rs987981; rs4143392-rs4143391; rs1691324-rs13050434; rs11909758-rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141-rs2246777; rs2832959-rs9980934; rs2833734rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485-rs3453; rs9974986-rs2834703; rs2776266rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672.
  13. 13.
    El método de cualquiera de las Reivindicaciones 1-7, en donde cada uno de dicha pluralidad de ácidos nucleicos objetivo comprende al menos una repetición corta en tándem (STR).
  14. 14.
    El método de la Reivindicación 13, en donde cada uno de dicha pluralidad de ácidos nucleicos objetivo polimórficos es una STR seleccionada de CSF1PO, FGA, TH01, TPOX, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, D2S1338, Penta D, Penta E, D22S1045, D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627 y D1GATA113.
  15. 15.
    El método de la Reivindicación 13, en donde dicha al menos una STR es menor de alrededor de 300 pares de bases.
  16. 16.
    El método de cualquiera de las Reivindicaciones anteriores, en donde dicha secuenciación:
    (i)
    es secuenciación de próxima generación (NGS);
    (ii)
    es secuenciación masivamente paralela usando secuenciación por síntesis con terminadores de colorante reversibles;
    (iii) es secuenciación por ligadura;
    (iv)
    comprende una amplificación; o
    (v)
    es secuenciación de moléculas individuales.
  17. 17.
    El método de cualquiera de las Reivindicaciones 1-16, en donde dicha aneuploidía es una aneuploidía cromosómica completa; preferiblemente una aneuploidía elegida de trisomía 8, trisomía 13, trisomía 15, trisomía 16, trisomía 18, trisomía 21, trisomía 22, monosomía X, XXX, XXY y XYY.
  18. 18.
    El método de cualquiera de las Reivindicaciones 1-16, en donde dicha aneuploidía es una aneuploidía cromosómica parcial.
ES10830939.4T 2010-01-19 2010-12-01 Determinación simultánea de aneuploidía y fracción fetal Active ES2534986T3 (es)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US296358P 2001-06-05
US29635810P 2010-01-19 2010-01-19
US36083710P 2010-07-01 2010-07-01
US360837P 2010-07-01
US45584910P 2010-10-26 2010-10-26
US40701710P 2010-10-26 2010-10-26
US407017P 2010-10-26
US455849P 2010-10-26
PCT/US2010/058612 WO2011090558A1 (en) 2010-01-19 2010-12-01 Simultaneous determination of aneuploidy and fetal fraction

Publications (1)

Publication Number Publication Date
ES2534986T3 true ES2534986T3 (es) 2015-05-04

Family

ID=44307118

Family Applications (6)

Application Number Title Priority Date Filing Date
ES18160303T Active ES2870533T3 (es) 2010-01-19 2010-12-01 Métodos de determinación de la fracción de ácidos nucleicos fetales en muestras maternas
ES10830939.4T Active ES2534986T3 (es) 2010-01-19 2010-12-01 Determinación simultánea de aneuploidía y fracción fetal
ES10844163.5T Active ES2560929T3 (es) 2010-01-19 2010-12-01 Métodos de determinación de la fracción de ácido nucleico fetal en muestras maternas
ES17180803T Active ES2704701T3 (es) 2010-01-19 2010-12-01 Nuevo protocolo de preparación de bibliotecas de secuenciación
ES18201917T Active ES2909841T3 (es) 2010-01-19 2010-12-01 Nuevo protocolo para preparar bibliotecas de secuenciación
ES10830938.6T Active ES2534758T3 (es) 2010-01-19 2010-12-01 Métodos de secuenciación en diagnósticos prenatales

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES18160303T Active ES2870533T3 (es) 2010-01-19 2010-12-01 Métodos de determinación de la fracción de ácidos nucleicos fetales en muestras maternas

Family Applications After (4)

Application Number Title Priority Date Filing Date
ES10844163.5T Active ES2560929T3 (es) 2010-01-19 2010-12-01 Métodos de determinación de la fracción de ácido nucleico fetal en muestras maternas
ES17180803T Active ES2704701T3 (es) 2010-01-19 2010-12-01 Nuevo protocolo de preparación de bibliotecas de secuenciación
ES18201917T Active ES2909841T3 (es) 2010-01-19 2010-12-01 Nuevo protocolo para preparar bibliotecas de secuenciación
ES10830938.6T Active ES2534758T3 (es) 2010-01-19 2010-12-01 Métodos de secuenciación en diagnósticos prenatales

Country Status (11)

Country Link
US (13) US9657342B2 (es)
EP (14) EP2370599B1 (es)
AU (4) AU2010343278B2 (es)
CA (4) CA2786357C (es)
CY (1) CY1124494T1 (es)
DK (6) DK3382037T3 (es)
ES (6) ES2870533T3 (es)
GB (5) GB2479080B (es)
PL (4) PL3260555T3 (es)
TR (1) TR201807917T4 (es)
WO (3) WO2011090559A1 (es)

Families Citing this family (262)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1712639B1 (en) 2005-04-06 2008-08-27 Maurice Stroun Method for the diagnosis of cancer by detecting circulating DNA and RNA
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
EP2351858B1 (en) * 2006-02-28 2014-12-31 University of Louisville Research Foundation Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms
WO2009105531A1 (en) * 2008-02-19 2009-08-27 Gene Security Network, Inc. Methods for cell genotyping
EP2271772B1 (en) 2008-03-11 2014-07-16 Sequenom, Inc. Nucleic acid-based tests for prenatal gender determination
WO2009146335A1 (en) * 2008-05-27 2009-12-03 Gene Security Network, Inc. Methods for embryo characterization and comparison
EP2321642B1 (en) * 2008-08-04 2017-01-11 Natera, Inc. Methods for allele calling and ploidy calling
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
US8962247B2 (en) 2008-09-16 2015-02-24 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses
WO2011041485A1 (en) 2009-09-30 2011-04-07 Gene Security Network, Inc. Methods for non-invasive prenatal ploidy calling
CA2780016C (en) 2009-11-06 2017-09-19 The Chinese University Of Hong Kong Size-based genomic analysis
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
ES2577017T3 (es) 2009-12-22 2016-07-12 Sequenom, Inc. Procedimientos y kits para identificar la aneuploidia
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
EP2370599B1 (en) 2010-01-19 2015-01-21 Verinata Health, Inc Method for determining copy number variations
US20120010085A1 (en) 2010-01-19 2012-01-12 Rava Richard P Methods for determining fraction of fetal nucleic acids in maternal samples
WO2011091063A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Partition defined detection methods
US20120100548A1 (en) 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
EP2513341B1 (en) 2010-01-19 2017-04-12 Verinata Health, Inc Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US20110312503A1 (en) 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
CA2799746C (en) * 2010-05-17 2020-11-24 Sai Reddy Rapid isolation of monoclonal antibodies from animals
US12152275B2 (en) 2010-05-18 2024-11-26 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
WO2013052557A2 (en) * 2011-10-03 2013-04-11 Natera, Inc. Methods for preimplantation genetic diagnosis by sequencing
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
WO2011146632A1 (en) 2010-05-18 2011-11-24 Gene Security Network Inc. Methods for non-invasive prenatal ploidy calling
US12545960B2 (en) 2010-05-18 2026-02-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US12221653B2 (en) 2010-05-18 2025-02-11 Natera, Inc. Methods for simultaneous amplification of target loci
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US8700338B2 (en) 2011-01-25 2014-04-15 Ariosa Diagnosis, Inc. Risk calculation for evaluation of fetal aneuploidy
US11203786B2 (en) 2010-08-06 2021-12-21 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US20130040375A1 (en) 2011-08-08 2013-02-14 Tandem Diagnotics, Inc. Assay systems for genetic analysis
US10167508B2 (en) 2010-08-06 2019-01-01 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
US11031095B2 (en) 2010-08-06 2021-06-08 Ariosa Diagnostics, Inc. Assay systems for determination of fetal copy number variation
US10533223B2 (en) 2010-08-06 2020-01-14 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
US20130261003A1 (en) 2010-08-06 2013-10-03 Ariosa Diagnostics, In. Ligation-based detection of genetic variants
US20140342940A1 (en) 2011-01-25 2014-11-20 Ariosa Diagnostics, Inc. Detection of Target Nucleic Acids using Hybridization
ES2523140T3 (es) 2010-09-21 2014-11-21 Population Genetics Technologies Ltd. Aumento de la confianza en las identificaciones de alelos con el recuento molecular
CN105243295B (zh) 2010-11-30 2018-08-17 香港中文大学 与癌症相关的遗传或分子畸变的检测
CN103608466B (zh) 2010-12-22 2020-09-18 纳特拉公司 非侵入性产前亲子鉴定方法
US11270781B2 (en) 2011-01-25 2022-03-08 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
US20230101627A1 (en) * 2011-01-25 2023-03-30 Ariosa Diagnostics, Inc. Noninvasive detection of fetal aneuploidy in egg donor pregnancies
US10131947B2 (en) 2011-01-25 2018-11-20 Ariosa Diagnostics, Inc. Noninvasive detection of fetal aneuploidy in egg donor pregnancies
US8756020B2 (en) 2011-01-25 2014-06-17 Ariosa Diagnostics, Inc. Enhanced risk probabilities using biomolecule estimations
US9994897B2 (en) 2013-03-08 2018-06-12 Ariosa Diagnostics, Inc. Non-invasive fetal sex determination
RU2671980C2 (ru) 2011-02-09 2018-11-08 Натера, Инк. Способы неинвазивного пренатального установления плоидности
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
AU2012236200B2 (en) 2011-03-30 2015-05-14 Verinata Health, Inc. Method for verifying bioassay samples
RS57837B1 (sr) 2011-04-12 2018-12-31 Verinata Health Inc Razrešavanje genomskih frakcija upotrebom broja kopija polimorfizama
AU2011365507A1 (en) * 2011-04-14 2013-05-02 Verinata Health, Inc. Normalizing chromosomes for the determination and verification of common and rare chromosomal aneuploidies
GB2484764B (en) 2011-04-14 2012-09-05 Verinata Health Inc Normalizing chromosomes for the determination and verification of common and rare chromosomal aneuploidies
US9411937B2 (en) 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
WO2014014498A1 (en) 2012-07-20 2014-01-23 Verinata Health, Inc. Detecting and classifying copy number variation in a fetal genome
EP3495497B1 (en) 2011-04-28 2021-03-24 Life Technologies Corporation Methods and compositions for multiplex pcr
US20130059762A1 (en) 2011-04-28 2013-03-07 Life Technologies Corporation Methods and compositions for multiplex pcr
US20130059738A1 (en) * 2011-04-28 2013-03-07 Life Technologies Corporation Methods and compositions for multiplex pcr
AU2012249531B2 (en) 2011-04-29 2017-06-29 Sequenom, Inc. Quantification of a minority nucleic acid species
US20140235474A1 (en) 2011-06-24 2014-08-21 Sequenom, Inc. Methods and processes for non invasive assessment of a genetic variation
AU2011373694A1 (en) * 2011-07-26 2013-05-02 Verinata Health, Inc. Method for determining the presence or absence of different aneuploidies in a sample
US8712697B2 (en) 2011-09-07 2014-04-29 Ariosa Diagnostics, Inc. Determination of copy number variations using binomial probability calculations
AU2012304328B2 (en) * 2011-09-09 2017-07-20 The Board Of Trustees Of The Leland Stanford Junior University Methods for obtaining a sequence
WO2013040583A2 (en) * 2011-09-16 2013-03-21 Complete Genomics, Inc Determining variants in a genome of a heterogeneous sample
US9984198B2 (en) 2011-10-06 2018-05-29 Sequenom, Inc. Reducing sequence read count error in assessment of complex genetic variations
US10196681B2 (en) 2011-10-06 2019-02-05 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2013052907A2 (en) 2011-10-06 2013-04-11 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
JP6073902B2 (ja) 2011-10-06 2017-02-01 セクエノム, インコーポレイテッド 遺伝的変異の非侵襲的評価のための方法およびプロセス
US10424394B2 (en) 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
ES2624686T3 (es) 2011-10-11 2017-07-17 Sequenom, Inc. Métodos y procesos para la evaluación no invasiva de variaciones genéticas
US8688388B2 (en) 2011-10-11 2014-04-01 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9845552B2 (en) 2011-10-27 2017-12-19 Verinata Health, Inc. Set membership testers for aligning nucleic acid samples
CA2861856C (en) * 2012-01-20 2020-06-02 Sequenom, Inc. Diagnostic processes that factor experimental conditions
EP2820174B1 (en) 2012-02-27 2019-12-25 The University of North Carolina at Chapel Hill Methods and uses for molecular tags
CA2865575C (en) 2012-02-27 2024-01-16 Cellular Research, Inc. Compositions and kits for molecular counting
WO2013128281A1 (en) 2012-02-28 2013-09-06 Population Genetics Technologies Ltd Method for attaching a counter sequence to a nucleic acid sample
EP2820129A1 (en) 2012-03-02 2015-01-07 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9892230B2 (en) 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
CA2868836C (en) * 2012-03-26 2019-08-06 The Johns Hopkins University Rapid aneuploidy detection
CN204440396U (zh) * 2012-04-12 2015-07-01 维里纳塔健康公司 用于确定胎儿分数的试剂盒
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP3978621B1 (en) 2012-05-21 2023-08-30 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10289800B2 (en) 2012-05-21 2019-05-14 Ariosa Diagnostics, Inc. Processes for calculating phased fetal genomic sequences
CN104053787A (zh) * 2012-05-23 2014-09-17 深圳华大基因医学有限公司 鉴定双胞胎类型的方法和系统
US11261494B2 (en) * 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
US10497461B2 (en) 2012-06-22 2019-12-03 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20140093873A1 (en) 2012-07-13 2014-04-03 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
EP2875156A4 (en) 2012-07-19 2016-02-24 Ariosa Diagnostics Inc SEQUENTIAL LIGATION-BASED MULTIPLEX DETECTION OF GENETIC VARIANTS
US20140100126A1 (en) 2012-08-17 2014-04-10 Natera, Inc. Method for Non-Invasive Prenatal Testing Using Parental Mosaicism Data
US11913065B2 (en) 2012-09-04 2024-02-27 Guardent Health, Inc. Systems and methods to detect rare mutations and copy number variation
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
CN104781421B (zh) 2012-09-04 2020-06-05 夸登特健康公司 检测稀有突变和拷贝数变异的系统和方法
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US20220411875A1 (en) * 2012-10-03 2022-12-29 Natera, Inc. Methods for simultaneous amplification of target loci
CA3120521A1 (en) 2012-10-04 2014-04-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10482994B2 (en) 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10347361B2 (en) 2012-10-24 2019-07-09 Nantomics, Llc Genome explorer system to process and present nucleotide variations in genome sequence data
US10643738B2 (en) * 2013-01-10 2020-05-05 The Chinese University Of Hong Kong Noninvasive prenatal molecular karyotyping from maternal plasma
US20130309666A1 (en) 2013-01-25 2013-11-21 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2014132244A1 (en) 2013-02-28 2014-09-04 The Chinese University Of Hong Kong Maternal plasma transcriptome analysis by massively parallel rna sequencing
US11060145B2 (en) 2013-03-13 2021-07-13 Sequenom, Inc. Methods and compositions for identifying presence or absence of hypermethylation or hypomethylation locus
WO2014145078A1 (en) * 2013-03-15 2014-09-18 Verinata Health, Inc. Generating cell-free dna libraries directly from blood
WO2014151511A2 (en) 2013-03-15 2014-09-25 Abbott Molecular Inc. Systems and methods for detection of genomic copy number changes
US20140278127A1 (en) * 2013-03-15 2014-09-18 Battelle Memorial Institute Computer Files and Methods Supporting Forensic Analysis of Nucleotide Sequence Data
US10930368B2 (en) 2013-04-03 2021-02-23 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
KR102665592B1 (ko) 2013-05-24 2024-05-21 시쿼넘, 인코포레이티드 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
WO2014204991A1 (en) 2013-06-17 2014-12-24 Verinata Health, Inc. Method for determining copy number variations in sex chromosomes
ES3037160T3 (en) 2013-06-21 2025-09-29 Sequenom Inc Methods and processes for non-invasive assessment of genetic variations
GB201318369D0 (en) * 2013-10-17 2013-12-04 Univ Leuven Kath Methods using BAF
KR102758333B1 (ko) 2013-08-28 2025-01-23 벡톤 디킨슨 앤드 컴퍼니 대량의 동시 단일 세포 분석
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
US9499870B2 (en) 2013-09-27 2016-11-22 Natera, Inc. Cell free DNA diagnostic testing standards
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
KR102384620B1 (ko) 2013-10-04 2022-04-11 시쿼넘, 인코포레이티드 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
US9582877B2 (en) 2013-10-07 2017-02-28 Cellular Research, Inc. Methods and systems for digitally counting features on arrays
CN105874082B (zh) 2013-10-07 2020-06-02 塞昆纳姆股份有限公司 用于非侵入性评估染色体改变的方法和过程
ES2660989T3 (es) 2013-12-28 2018-03-27 Guardant Health, Inc. Métodos y sistemas para detectar variantes genéticas
EP3736344A1 (en) 2014-03-13 2020-11-11 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CA2945962C (en) 2014-04-21 2023-08-29 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US12492429B2 (en) 2014-04-21 2025-12-09 Natera, Inc. Detecting mutations and ploidy in chromosomal segments
US20180173846A1 (en) 2014-06-05 2018-06-21 Natera, Inc. Systems and Methods for Detection of Aneuploidy
US11783911B2 (en) 2014-07-30 2023-10-10 Sequenom, Inc Methods and processes for non-invasive assessment of genetic variations
EP3730629A1 (en) 2014-10-10 2020-10-28 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9859394B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US10020300B2 (en) 2014-12-18 2018-07-10 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US10006910B2 (en) 2014-12-18 2018-06-26 Agilome, Inc. Chemically-sensitive field effect transistors, systems, and methods for manufacturing and using the same
CA2971589C (en) 2014-12-18 2021-09-28 Edico Genome Corporation Chemically-sensitive field effect transistor
US9618474B2 (en) 2014-12-18 2017-04-11 Edico Genome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US9857328B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Chemically-sensitive field effect transistors, systems and methods for manufacturing and using the same
HUE058263T2 (hu) 2015-02-10 2022-07-28 Univ Hong Kong Chinese Mutációk detektálása rákszûrési és magzatelemzési célból
EP3259371B1 (en) 2015-02-19 2020-09-02 Becton, Dickinson and Company High-throughput single-cell analysis combining proteomic and genomic information
KR101533792B1 (ko) * 2015-02-24 2015-07-06 대한민국 Ngs 기반 인간 객체의 상염색체 분석방법
WO2016138496A1 (en) 2015-02-27 2016-09-01 Cellular Research, Inc. Spatially addressable molecular barcoding
WO2016160844A2 (en) 2015-03-30 2016-10-06 Cellular Research, Inc. Methods and compositions for combinatorial barcoding
EP4582556A3 (en) 2015-04-23 2025-10-08 Becton, Dickinson and Company Methods and compositions for whole transcriptome amplification
US10844428B2 (en) * 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
EP3666902B1 (en) 2015-05-22 2024-07-03 Medicover Public Co Ltd Multiplexed parallel analysis of targeted genomic regions for non-invasive prenatal testing
WO2016196229A1 (en) 2015-06-01 2016-12-08 Cellular Research, Inc. Methods for rna quantification
EP3135770A1 (en) * 2015-08-28 2017-03-01 Latvian Biomedical Research and Study Centre Set of oligonucleotides and method for detection of fetal dna fraction in maternal plasma
US12540351B2 (en) 2015-09-02 2026-02-03 Guardant Health, Inc. Identification of somatic mutations versus germline variants for cell-free DNA variant calling applications
US11302416B2 (en) 2015-09-02 2022-04-12 Guardant Health Machine learning for somatic single nucleotide variant detection in cell-free tumor nucleic acid sequencing applications
JP6940484B2 (ja) 2015-09-11 2021-09-29 セルラー リサーチ, インコーポレイテッド ライブラリー正規化のための方法および組成物
CA3002449A1 (en) * 2015-11-16 2017-05-26 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
SG11201805119QA (en) 2015-12-17 2018-07-30 Guardant Health Inc Methods to determine tumor gene copy number by analysis of cell-free dna
US10982286B2 (en) 2016-01-22 2021-04-20 Mayo Foundation For Medical Education And Research Algorithmic approach for determining the plasma genome abnormality PGA and the urine genome abnormality UGA scores based on cell free cfDNA copy number variations in plasma and urine
US11753682B2 (en) 2016-03-07 2023-09-12 Father Flanagan's Boys'Home Noninvasive molecular controls
RU2760913C2 (ru) 2016-04-15 2021-12-01 Натера, Инк. Способы выявления рака легкого
JP7129343B2 (ja) 2016-05-02 2022-09-01 ベクトン・ディキンソン・アンド・カンパニー 正確な分子バーコーディング
WO2017201081A1 (en) 2016-05-16 2017-11-23 Agilome, Inc. Graphene fet devices, systems, and methods of using the same for sequencing nucleic acids
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
ES2979395T3 (es) 2016-05-26 2024-09-25 Becton Dickinson Co Métodos de ajuste del recuento de etiquetas moleculares
EP4043581A1 (en) 2016-05-27 2022-08-17 Sequenom, Inc. Method for generating a paralog assay system
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
CA3030894A1 (en) 2016-07-27 2018-02-01 Sequenom, Inc. Methods for non-invasive assessment of genomic instability
CA3030890A1 (en) 2016-07-27 2018-02-01 Sequenom, Inc. Genetic copy number alteration classifications
WO2018053365A1 (en) 2016-09-15 2018-03-22 ArcherDX, Inc. Methods of nucleic acid sample preparation for analysis of cell-free dna
US10704082B2 (en) 2016-09-15 2020-07-07 ArcherDX, Inc. Methods of nucleic acid sample preparation
US20220282305A1 (en) * 2016-09-15 2022-09-08 Archerdx, Llc Methods of nucleic acid sample preparation
CN109791157B (zh) 2016-09-26 2022-06-07 贝克顿迪金森公司 使用具有条形码化的寡核苷酸序列的试剂测量蛋白质表达
WO2018064486A1 (en) * 2016-09-29 2018-04-05 Counsyl, Inc. Noninvasive prenatal screening using dynamic iterative depth optimization
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
EP3461274B1 (en) 2016-09-30 2020-11-04 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
WO2018067517A1 (en) 2016-10-04 2018-04-12 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
ES2940620T3 (es) * 2016-11-02 2023-05-09 Archerdx Llc Métodos de preparación de muestras de ácido nucleico para la secuenciación del repertorio inmunitario
GB201618485D0 (en) 2016-11-02 2016-12-14 Ucl Business Plc Method of detecting tumour recurrence
JP7228510B2 (ja) 2016-11-08 2023-02-24 ベクトン・ディキンソン・アンド・カンパニー 細胞標識分類の方法
US11164659B2 (en) 2016-11-08 2021-11-02 Becton, Dickinson And Company Methods for expression profile classification
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
ES2961580T3 (es) 2017-01-13 2024-03-12 Cellular Res Inc Revestimiento hidrófilo de canales de fluidos
SG11201906428SA (en) 2017-01-18 2019-08-27 Illumina Inc Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths
CA3049682C (en) 2017-01-20 2023-06-27 Sequenom, Inc. Methods for non-invasive assessment of genetic alterations
CA3049457C (en) 2017-01-20 2023-05-16 Sequenom, Inc. Methods for non-invasive assessment of copy number alterations
CA3049455C (en) 2017-01-20 2023-06-13 Sequenom, Inc. Sequencing adapter manufacture and use
CA3207879A1 (en) 2017-01-24 2018-08-02 Sequenom, Inc. Methods and processes for assessment of genetic variations
SG11201906397UA (en) 2017-01-25 2019-08-27 Univ Hong Kong Chinese Diagnostic applications using nucleic acid fragments
CN110382708A (zh) 2017-02-01 2019-10-25 赛卢拉研究公司 使用阻断性寡核苷酸进行选择性扩增
WO2018156418A1 (en) 2017-02-21 2018-08-30 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
JP7370862B2 (ja) 2017-03-17 2023-10-30 セクエノム, インコーポレイテッド 遺伝子モザイク症のための方法およびプロセス
JP7170711B2 (ja) * 2017-04-18 2022-11-14 アジレント・テクノロジーズ・ベルジャム・ナムローゼ・フェンノートシャップ Dna分析のためのオフターゲット配列の使用
CN110719959B (zh) 2017-06-05 2021-08-06 贝克顿迪金森公司 针对单细胞的样品索引
ES2920280T3 (es) 2017-07-07 2022-08-02 Nipd Genetics Public Company Ltd Enriquecimiento de regiones genómicas blanco para análisis paralelo multiplexado
WO2019008172A1 (en) 2017-07-07 2019-01-10 Nipd Genetics Public Company Limited ENRICHED MULTIPLEXED PARALLEL ANALYSIS IN TARGET FOR TUMOR BIOMARKER EVALUATION
PT3649258T (pt) 2017-07-07 2022-05-25 Nipd Genetics Public Company Ltd Análise paralela multiplexada enriquecida com alvo para avaliação de amostras de adn fetal
ES2925394T3 (es) 2017-07-07 2022-10-17 Nipd Genetics Public Company Ltd Análisis paralelo multiplexado con enriquecimiento de blancos para la evaluación del riesgo de portar alteraciones genéticas
CN111051536A (zh) 2017-07-26 2020-04-21 香港中文大学 利用不含细胞的病毒核酸改善癌症筛选
EP3658689B1 (en) 2017-07-26 2021-03-24 Trisomytest, s.r.o. A method for non-invasive prenatal detection of fetal chromosome aneuploidy from maternal blood based on bayesian network
WO2019025004A1 (en) 2017-08-04 2019-02-07 Trisomytest, S.R.O. METHOD FOR NON-INVASIVE PRENATAL DETECTION OF FETUS SEX CHROMOSOMAL ABNORMALITY AND FETUS SEX DETERMINATION FOR SINGLE PREGNANCY AND GEEMELLAR PREGNANCY
CN111094583A (zh) 2017-08-04 2020-05-01 十亿至一公司 与生物靶相关的定量中利用靶相关分子的测序输出确定和分析
US11519024B2 (en) 2017-08-04 2022-12-06 Billiontoone, Inc. Homologous genomic regions for characterization associated with biological targets
WO2019028462A1 (en) 2017-08-04 2019-02-07 Billiontoone, Inc. TARGET-ASSOCIATED MOLECULES FOR CHARACTERIZATION ASSOCIATED WITH BIOLOGICAL TARGETS
US11447818B2 (en) 2017-09-15 2022-09-20 Illumina, Inc. Universal short adapters with variable length non-random unique molecular identifiers
CN108733982B (zh) * 2017-09-26 2021-02-19 上海凡迪基因科技有限公司 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备
CN111526793A (zh) 2017-10-27 2020-08-11 朱诺诊断学公司 用于超低体积液体活检的设备、系统和方法
US12084720B2 (en) 2017-12-14 2024-09-10 Natera, Inc. Assessing graft suitability for transplantation
EP3728636B1 (en) 2017-12-19 2024-09-11 Becton, Dickinson and Company Particles associated with oligonucleotides
KR102031841B1 (ko) * 2017-12-22 2019-10-15 테라젠지놈케어 주식회사 모체 시료 중 태아 분획을 결정하는 방법
EP4650456A3 (en) 2018-01-05 2026-01-21 BillionToOne, Inc. Quality control templates for ensuring validity of sequencing-based assays
US12398389B2 (en) 2018-02-15 2025-08-26 Natera, Inc. Methods for isolating nucleic acids with size selection
US12462935B2 (en) 2018-03-30 2025-11-04 Nucleix Ltd. Deep learning-based methods, devices, and systems for prenatal testing
CN110832086A (zh) 2018-04-02 2020-02-21 伊鲁米那股份有限公司 用于制造用于基于序列的遗传检验的对照的组合物和方法
US12024738B2 (en) 2018-04-14 2024-07-02 Natera, Inc. Methods for cancer detection and monitoring
JP7358388B2 (ja) 2018-05-03 2023-10-10 ベクトン・ディキンソン・アンド・カンパニー 反対側の転写物末端における分子バーコーディング
CN112272710A (zh) 2018-05-03 2021-01-26 贝克顿迪金森公司 高通量多组学样品分析
IL271454B2 (en) 2018-05-17 2025-04-01 Illumina Inc Rapid single-cell genetic sequencing with low Aggregation bias
WO2019227015A1 (en) 2018-05-25 2019-11-28 Illumina, Inc. Circulating rna signatures specific to preeclampsia
US12234509B2 (en) 2018-07-03 2025-02-25 Natera, Inc. Methods for detection of donor-derived cell-free DNA
EP3833776A4 (en) 2018-08-06 2022-04-27 Billiontoone, Inc. DILUTION MARKER FOR QUANTIFICATION OF BIOLOGICAL TARGETS
JP7535998B2 (ja) 2018-08-31 2024-08-19 ガーダント ヘルス, インコーポレイテッド マージされたリードおよびマージされないリードに基づいた遺伝的変異体の検出
ES2992135T3 (es) 2018-10-01 2024-12-09 Becton Dickinson Co Determinar secuencias de transcripción 5’
US11932849B2 (en) 2018-11-08 2024-03-19 Becton, Dickinson And Company Whole transcriptome analysis of single cells using random priming
WO2020113577A1 (zh) * 2018-12-07 2020-06-11 深圳华大生命科学研究院 一种靶基因文库的构建方法、检测装置及其应用
US11492660B2 (en) 2018-12-13 2022-11-08 Becton, Dickinson And Company Selective extension in single cell whole transcriptome analysis
US11371076B2 (en) 2019-01-16 2022-06-28 Becton, Dickinson And Company Polymerase chain reaction normalization through primer titration
ES2945227T3 (es) 2019-01-23 2023-06-29 Becton Dickinson Co Oligonucleótidos asociados con anticuerpos
WO2020160414A1 (en) 2019-01-31 2020-08-06 Guardant Health, Inc. Compositions and methods for isolating cell-free dna
WO2020167920A1 (en) 2019-02-14 2020-08-20 Cellular Research, Inc. Hybrid targeted and whole transcriptome amplification
US11965208B2 (en) 2019-04-19 2024-04-23 Becton, Dickinson And Company Methods of associating phenotypical data and single cell sequencing data
WO2020226528A1 (ru) * 2019-05-08 2020-11-12 Общество с ограниченной ответственностью "ГЕНОТЕК ИТ" Способ определения кариотипа плода беременной женщины
US12305235B2 (en) 2019-06-06 2025-05-20 Natera, Inc. Methods for detecting immune cell DNA and monitoring immune system
CN120099137A (zh) 2019-07-22 2025-06-06 贝克顿迪金森公司 单细胞染色质免疫沉淀测序测定
WO2021037016A1 (en) * 2019-08-30 2021-03-04 The Chinese University Of Hong Kong Methods for detecting absence of heterozygosity by low-pass genome sequencing
CA3159786A1 (en) 2019-10-31 2021-05-06 Sequenom, Inc. Application of mosaicism ratio in multifetal gestations and personalized risk assessment
JP7522189B2 (ja) 2019-11-08 2024-07-24 ベクトン・ディキンソン・アンド・カンパニー 免疫レパートリーシーケンシングのための完全長v(d)j情報を得るためのランダムプライミングの使用
US11753685B2 (en) 2019-11-22 2023-09-12 Illumina, Inc. Circulating RNA signatures specific to preeclampsia
US11649497B2 (en) 2020-01-13 2023-05-16 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and RNA
WO2021146219A1 (en) 2020-01-13 2021-07-22 Becton, Dickinson And Company Cell capture using du-containing oligonucleotides
WO2021155057A1 (en) 2020-01-29 2021-08-05 Becton, Dickinson And Company Barcoded wells for spatial mapping of single cells through sequencing
WO2021173719A1 (en) 2020-02-25 2021-09-02 Becton, Dickinson And Company Bi-specific probes to enable the use of single-cell samples as single color compensation control
US12305242B2 (en) 2020-04-24 2025-05-20 The Johns Hopkins University Methods and related aspects for quantitative polymerase chain reaction to determine fractional abundance
US11661625B2 (en) 2020-05-14 2023-05-30 Becton, Dickinson And Company Primers for immune repertoire profiling
CN111534604B (zh) * 2020-05-27 2024-01-23 广东华美众源生物科技有限公司 一种检测人常染色体dip-str遗传标记的荧光复合扩增试剂盒
US12157913B2 (en) 2020-06-02 2024-12-03 Becton, Dickinson And Company Oligonucleotides and beads for 5 prime gene expression assay
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
US12391940B2 (en) 2020-07-31 2025-08-19 Becton, Dickinson And Company Single cell assay for transposase-accessible chromatin
LT4211260T (lt) 2020-09-11 2025-06-25 New England Biolabs, Inc. Imobilizuotų fermentų taikymas nanoporų bibliotekos konstravimui
EP4247967A1 (en) 2020-11-20 2023-09-27 Becton, Dickinson and Company Profiling of highly expressed and lowly expressed proteins
JP2023552015A (ja) 2020-12-02 2023-12-14 イルミナ ソフトウェア, インコーポレイテッド 遺伝子変異を検出するためのシステム及び方法
CN116685850A (zh) 2020-12-15 2023-09-01 贝克顿迪金森公司 单细胞分泌组分析
EP4409039A4 (en) * 2021-09-29 2025-09-03 Pillar Biosciences Inc CUSTOMIZED LIQUID BIOPSIES FOR CANCER USING PRIMERS FROM A PRIMER BANK
KR20250019610A (ko) 2022-03-21 2025-02-10 빌리언투원, 인크. 치료 모니터링을 위한 메틸화된 세포 유리 dna의 분자 계수
WO2024186778A1 (en) 2023-03-03 2024-09-12 Laboratory Corporation Of America Holdings Methods and systems for positive cfdna screening on genetic variations using mosaicism ratio
EP4713926A1 (en) 2023-05-15 2026-03-25 Laboratory Corporation of America Holdings Machine-learning approaches to pan-cancer screening in whole genome sequencing
CN117965744B (zh) * 2023-12-12 2024-10-11 东莞博奥木华基因科技有限公司 一种基于多重pcr捕获技术检测胎儿样本倍性和母源细胞污染的试剂盒、引物和方法
IL310301B2 (en) * 2024-01-21 2026-02-01 Identifai Genetics Ltd Methods for non-invasive prenatal diagnosis of repeat mutations

Family Cites Families (108)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6270961B1 (en) 1987-04-01 2001-08-07 Hyseq, Inc. Methods and apparatus for DNA sequencing and DNA identification
US5976790A (en) 1992-03-04 1999-11-02 The Regents Of The University Of California Comparative Genomic Hybridization (CGH)
WO1994003638A1 (en) * 1992-07-30 1994-02-17 Applied Biosystems, Inc. Method of detecting aneuploidy by amplified short tandem repeats
US5776737A (en) 1994-12-22 1998-07-07 Visible Genetics Inc. Method and composition for internal identification of samples
US6057103A (en) 1995-07-18 2000-05-02 Diversa Corporation Screening for novel bioactivities
AU735272B2 (en) 1996-10-04 2001-07-05 Intronn Llc Sample collection devices and methods using markers and the use of such markers as controls in sample validation, laboratory evaluation and/or accreditation
US20010051341A1 (en) 1997-03-04 2001-12-13 Isis Innovation Limited Non-invasive prenatal diagnosis
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
JP2002503954A (ja) 1997-04-01 2002-02-05 グラクソ、グループ、リミテッド 核酸増幅法
US5888740A (en) 1997-09-19 1999-03-30 Genaco Biomedical Products, Inc. Detection of aneuploidy and gene deletion by PCR-based gene- dose co-amplification of chromosome specific sequences with synthetic sequences with synthetic internal controls
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
EP1290225A4 (en) 2000-05-20 2004-09-15 Univ Michigan METHOD FOR PRODUCING A DNA BANK BY POSITIONAL REPRODUCTION
US7062418B2 (en) 2000-06-27 2006-06-13 Fluidigm Corporation Computer aided design method and system for developing a microfluidic system
JP2004516813A (ja) 2000-06-30 2004-06-10 インサイト・ゲノミックス・インコーポレイテッド 関連腫瘍マーカー
US20020142324A1 (en) * 2000-09-22 2002-10-03 Xun Wang Fungal target genes and methods to identify those genes
AU2002248149A1 (en) 2000-11-16 2002-08-12 Fluidigm Corporation Microfluidic devices for introducing and dispensing fluids from microfluidic systems
US6691042B2 (en) 2001-07-02 2004-02-10 Rosetta Inpharmatics Llc Methods for generating differential profiles by combining data obtained in separate measurements
US7226732B2 (en) 2001-07-16 2007-06-05 Cepheid Methods, apparatus, and computer programs for verifying the integrity of a probe
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
US7893248B2 (en) 2002-02-20 2011-02-22 Sirna Therapeutics, Inc. RNA interference mediated inhibition of Myc and/or Myb gene expression using short interfering nucleic acid (siNA)
US6977162B2 (en) * 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
IL163600A0 (en) 2002-03-01 2005-12-18 Ravgen Inc Methods for detection of genetic disorders
US20030194704A1 (en) * 2002-04-03 2003-10-16 Penn Sharron Gaynor Human genome-derived single exon nucleic acid probes useful for gene expression analysis two
US7727720B2 (en) 2002-05-08 2010-06-01 Ravgen, Inc. Methods for detection of genetic disorders
EP2359689B1 (en) 2002-09-27 2015-08-26 The General Hospital Corporation Microfluidic device for cell separation and use thereof
US10229244B2 (en) 2002-11-11 2019-03-12 Affymetrix, Inc. Methods for identifying DNA copy number changes using hidden markov model based estimations
US20040224331A1 (en) 2003-01-17 2004-11-11 The Trustees Of Boston University Haplotype analysis
WO2004065629A1 (en) 2003-01-17 2004-08-05 The Chinese University Of Hong Kong Circulating mrna as diagnostic markers for pregnancy-related disorders
CA2513899C (en) 2003-01-29 2013-03-26 454 Corporation Methods of amplifying and sequencing nucleic acids
EP1599608A4 (en) 2003-03-05 2007-07-18 Genetic Technologies Ltd Identification of fetal DNA and fetal cell marker in maternal plasma or serum
US20040209299A1 (en) 2003-03-07 2004-10-21 Rubicon Genomics, Inc. In vitro DNA immortalization and whole genome amplification using libraries generated from randomly fragmented DNA
WO2005007869A2 (en) 2003-07-10 2005-01-27 Third Wave Technologies, Inc. Assays for the direct measurement of gene dosage
WO2005023091A2 (en) 2003-09-05 2005-03-17 The Trustees Of Boston University Method for non-invasive prenatal diagnosis
US20050221341A1 (en) * 2003-10-22 2005-10-06 Shimkets Richard A Sequence-based karyotyping
WO2005072133A2 (en) * 2004-01-27 2005-08-11 Zoragen, Inc. Nucleic acid detection
US20060046258A1 (en) 2004-02-27 2006-03-02 Lapidus Stanley N Applications of single molecule sequencing
US20100216153A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US20100216151A1 (en) 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US20050282293A1 (en) 2004-03-03 2005-12-22 Cosman Maury D System for delivering a diluted solution
WO2005116257A2 (en) 2004-05-17 2005-12-08 The Ohio State University Research Foundation Unique short tandem repeats and methods of their use
DE102004036285A1 (de) 2004-07-27 2006-02-16 Advalytix Ag Verfahren zum Bestimmen der Häufigkeit von Sequenzen einer Probe
TW200624106A (en) 2004-09-07 2006-07-16 Uni Charm Corp Warming article
JP2007327743A (ja) 2004-09-07 2007-12-20 Univ Of Tokyo 遺伝子コピーの解析方法及び装置
US20060178835A1 (en) 2005-02-10 2006-08-10 Applera Corporation Normalization methods for genotyping analysis
US7645576B2 (en) 2005-03-18 2010-01-12 The Chinese University Of Hong Kong Method for the detection of chromosomal aneuploidies
AU2006256374A1 (en) 2005-06-08 2006-12-14 Compugen Ltd. Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis
US20060286558A1 (en) 2005-06-15 2006-12-21 Natalia Novoradovskaya Normalization of samples for amplification reactions
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
DE102005057988A1 (de) 2005-08-04 2007-02-08 Bosch Rexroth Ag Axialkolbenmaschine
EP3591068A1 (en) 2006-02-02 2020-01-08 The Board of Trustees of the Leland Stanford Junior University Non-invasive fetal genetic screening by digital analysis
US20100184043A1 (en) 2006-02-28 2010-07-22 University Of Louisville Research Foundation Detecting Genetic Abnormalities
EP2351858B1 (en) * 2006-02-28 2014-12-31 University of Louisville Research Foundation Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms
US20080064098A1 (en) * 2006-06-05 2008-03-13 Cryo-Cell International, Inc. Procurement, isolation and cryopreservation of maternal placental cells
WO2007147079A2 (en) 2006-06-14 2007-12-21 Living Microsystems, Inc. Rare cell analysis using sample splitting and dna tags
EP2029779A4 (en) 2006-06-14 2010-01-20 Living Microsystems Inc HIGHLY PARALLEL SNP GENOTYPING UTILIZATION FOR FETAL DIAGNOSIS
WO2009035447A1 (en) 2006-06-14 2009-03-19 Living Microsystems, Inc. Diagnosis of fetal abnormalities by comparative genomic hybridization analysis
US20080050739A1 (en) * 2006-06-14 2008-02-28 Roland Stoughton Diagnosis of fetal abnormalities using polymorphisms including short tandem repeats
US8137912B2 (en) 2006-06-14 2012-03-20 The General Hospital Corporation Methods for the diagnosis of fetal abnormalities
DK2029778T3 (en) 2006-06-14 2018-08-20 Verinata Health Inc DIAGNOSIS OF Fetal ABNORMITIES
EP2589668A1 (en) 2006-06-14 2013-05-08 Verinata Health, Inc Rare cell analysis using sample splitting and DNA tags
US20080113358A1 (en) 2006-07-28 2008-05-15 Ravi Kapur Selection of cells using biomarkers
US9328378B2 (en) * 2006-07-31 2016-05-03 Illumina Cambridge Limited Method of library preparation avoiding the formation of adaptor dimers
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
AU2008213634B2 (en) 2007-02-08 2013-09-05 Sequenom, Inc. Nucleic acid-based tests for RhD typing, gender determination and nucleic acid quantification
PL2557520T3 (pl) 2007-07-23 2021-10-11 The Chinese University Of Hong Kong Określanie zaburzenia równowagi sekwencji kwasu nukleinowego
US12180549B2 (en) * 2007-07-23 2024-12-31 The Chinese University Of Hong Kong Diagnosing fetal chromosomal aneuploidy using genomic sequencing
CN101889074A (zh) 2007-10-04 2010-11-17 哈尔西恩莫尔丘勒公司 采用电子显微镜对核酸聚合物测序
KR101810799B1 (ko) * 2008-02-01 2017-12-19 더 제너럴 하스피탈 코포레이션 의학적 질환 및 병태의 진단, 예후, 및 치료에 있어서 미세소포체의 용도
EP2271772B1 (en) 2008-03-11 2014-07-16 Sequenom, Inc. Nucleic acid-based tests for prenatal gender determination
US20090307180A1 (en) 2008-03-19 2009-12-10 Brandon Colby Genetic analysis
WO2009120808A2 (en) 2008-03-26 2009-10-01 Sequenom, Inc. Restriction endonuclease enhanced polymorphic sequence detection
US20090270601A1 (en) * 2008-04-21 2009-10-29 Steven Albert Benner Differential detection of single nucleotide polymorphisms
EP2853601B1 (en) * 2008-07-18 2016-09-21 TrovaGene, Inc. Methods for PCR-based detection of "ultra short" nucleic acid sequences
CA3069082C (en) 2008-09-20 2022-03-22 The Board Of Trustees Of The Leland Stanford Junior University Noninvasive diagnosis of fetal aneuploidy by sequencing
US20100285537A1 (en) 2009-04-02 2010-11-11 Fluidigm Corporation Selective tagging of short nucleic acid fragments and selective protection of target sequences from degradation
WO2011056094A2 (ru) * 2009-10-26 2011-05-12 Общество С Ограниченной Ответственностью "Апoгeй" Пожарный вентиль
AU2010311535B2 (en) * 2009-10-26 2015-05-21 Lifecodexx Ag Means and methods for non-invasive diagnosis of chromosomal aneuploidy
EP3783110B1 (en) 2009-11-05 2022-11-23 The Chinese University Of Hong Kong Fetal genomic analysis from a maternal biological sample
CN102597272A (zh) 2009-11-12 2012-07-18 艾索特里克斯遗传实验室有限责任公司 基因座的拷贝数分析
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
US20120100548A1 (en) 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
EP2513341B1 (en) 2010-01-19 2017-04-12 Verinata Health, Inc Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
US20120270739A1 (en) 2010-01-19 2012-10-25 Verinata Health, Inc. Method for sample analysis of aneuploidies in maternal samples
WO2011091063A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Partition defined detection methods
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
US20120010085A1 (en) 2010-01-19 2012-01-12 Rava Richard P Methods for determining fraction of fetal nucleic acids in maternal samples
US20120237928A1 (en) 2010-10-26 2012-09-20 Verinata Health, Inc. Method for determining copy number variations
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
EP2370599B1 (en) * 2010-01-19 2015-01-21 Verinata Health, Inc Method for determining copy number variations
US20110312503A1 (en) 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
DK2539450T3 (da) 2010-02-25 2016-05-30 Advanced Liquid Logic Inc Fremgangsmåde til fremstilling af nukleinsyrebiblioteker
WO2012012037A1 (en) * 2010-07-19 2012-01-26 New England Biolabs, Inc. Oligonucleotide adaptors: compositions and methods of use
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
CN102409043B (zh) 2010-09-21 2013-12-04 深圳华大基因科技服务有限公司 高通量低成本Fosmid文库构建的方法及其所使用标签和标签接头
CN105243295B (zh) 2010-11-30 2018-08-17 香港中文大学 与癌症相关的遗传或分子畸变的检测
CN103620055A (zh) 2010-12-07 2014-03-05 利兰·斯坦福青年大学托管委员会 在全基因组规模非侵入性确定亲本单倍型的胎儿遗传
CN102127818A (zh) 2010-12-15 2011-07-20 张康 利用孕妇外周血建立胎儿dna文库的方法
WO2012088348A2 (en) 2010-12-23 2012-06-28 Sequenom, Inc. Fetal genetic variation detection
US20120190020A1 (en) 2011-01-25 2012-07-26 Aria Diagnostics, Inc. Detection of genetic abnormalities
RU2671980C2 (ru) 2011-02-09 2018-11-08 Натера, Инк. Способы неинвазивного пренатального установления плоидности
RS57837B1 (sr) 2011-04-12 2018-12-31 Verinata Health Inc Razrešavanje genomskih frakcija upotrebom broja kopija polimorfizama
GB2484764B (en) 2011-04-14 2012-09-05 Verinata Health Inc Normalizing chromosomes for the determination and verification of common and rare chromosomal aneuploidies
US9411937B2 (en) 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
WO2014014498A1 (en) 2012-07-20 2014-01-23 Verinata Health, Inc. Detecting and classifying copy number variation in a fetal genome
AU2011373694A1 (en) 2011-07-26 2013-05-02 Verinata Health, Inc. Method for determining the presence or absence of different aneuploidies in a sample
WO2014081243A1 (en) 2012-11-23 2014-05-30 Seoul Viosys Co., Ltd. Light emitting diode having a plurality of light emitting units
US10114015B2 (en) 2013-03-13 2018-10-30 Meso Scale Technologies, Llc. Assay methods

Also Published As

Publication number Publication date
WO2011090557A1 (en) 2011-07-28
US20170327884A1 (en) 2017-11-16
EP2370599A4 (en) 2012-03-21
EP3382037B1 (en) 2021-02-17
PL3492601T3 (pl) 2022-05-23
EP3006573A1 (en) 2016-04-13
GB2479476B (en) 2012-06-13
EP2366031A4 (en) 2012-03-21
CA2785718C (en) 2017-04-04
EP2883965B1 (en) 2018-05-09
US20120165203A1 (en) 2012-06-28
AU2010343279B2 (en) 2015-04-23
HK1177232A1 (zh) 2013-08-16
GB2479471B (en) 2012-02-08
CA2786357C (en) 2018-08-21
GB201108795D0 (en) 2011-07-06
AU2010343277A1 (en) 2012-09-06
US20240150828A1 (en) 2024-05-09
ES2870533T3 (es) 2021-10-27
US20110201507A1 (en) 2011-08-18
US11884975B2 (en) 2024-01-30
TR201807917T4 (tr) 2018-06-21
HK1170269A1 (en) 2013-02-22
EP4450645A3 (en) 2025-01-22
ES2909841T3 (es) 2022-05-10
AU2010343278A1 (en) 2012-09-06
US20120094849A1 (en) 2012-04-19
GB2479471A (en) 2011-10-12
GB2479476A (en) 2011-10-12
HK1160186A1 (en) 2012-08-10
GB2479080A (en) 2011-09-28
US12522869B2 (en) 2026-01-13
GB2485645A (en) 2012-05-23
US20110224087A1 (en) 2011-09-15
EP2513339A1 (en) 2012-10-24
GB2485645B (en) 2012-11-21
PL2376661T3 (pl) 2015-06-30
PL2366031T3 (pl) 2015-08-31
DK2366031T3 (en) 2015-02-23
DK3260555T3 (en) 2019-01-21
AU2010343276A1 (en) 2012-09-06
CA2786544C (en) 2020-11-10
EP2366031B1 (en) 2015-01-21
ES2704701T3 (es) 2019-03-19
EP3878973A1 (en) 2021-09-15
EP3492601B1 (en) 2022-01-05
GB2485644A (en) 2012-05-23
EP2370599B1 (en) 2015-01-21
EP2848704B1 (en) 2018-08-29
DK3382037T3 (da) 2021-05-25
GB2485644B (en) 2012-11-21
EP3382037A1 (en) 2018-10-03
CA2786544A1 (en) 2011-07-28
CY1124494T1 (el) 2022-07-22
US20210340613A1 (en) 2021-11-04
US20110245085A1 (en) 2011-10-06
DK2513339T3 (en) 2015-12-14
EP4450645A2 (en) 2024-10-23
ES2534758T3 (es) 2015-04-28
AU2010343277B2 (en) 2015-05-28
CA2786351C (en) 2022-01-25
HK1170270A1 (en) 2013-02-22
DK2376661T3 (en) 2015-02-02
EP2513339A4 (en) 2013-05-29
DK3492601T3 (da) 2022-04-04
EP4074838A1 (en) 2022-10-19
EP2376661B1 (en) 2015-01-21
AU2010343279A1 (en) 2012-09-06
AU2010343278B2 (en) 2015-05-21
PL3260555T3 (pl) 2019-05-31
ES2560929T3 (es) 2016-02-23
EP2513339B1 (en) 2015-09-09
GB201108794D0 (en) 2011-07-06
EP3006573B1 (en) 2018-03-07
US12553084B2 (en) 2026-02-17
EP2848703A1 (en) 2015-03-18
WO2011090558A1 (en) 2011-07-28
HK1160185A1 (en) 2012-08-10
US20170327881A1 (en) 2017-11-16
GB201118398D0 (en) 2011-12-07
EP2366031A1 (en) 2011-09-21
EP2376661A4 (en) 2012-03-21
WO2011090559A1 (en) 2011-07-28
EP3878973B1 (en) 2024-07-10
EP2376661A1 (en) 2011-10-19
US11130995B2 (en) 2021-09-28
EP3260555B1 (en) 2018-10-24
US11952623B2 (en) 2024-04-09
GB201118396D0 (en) 2011-12-07
US11286520B2 (en) 2022-03-29
EP2370599A1 (en) 2011-10-05
US20220017958A1 (en) 2022-01-20
US9657342B2 (en) 2017-05-23
CA2786351A1 (en) 2011-07-28
EP3260555A1 (en) 2017-12-27
EP3492601A1 (en) 2019-06-05
CA2785718A1 (en) 2011-07-28
US20170327883A1 (en) 2017-11-16
EP2883965B8 (en) 2018-06-27
US20260098295A1 (en) 2026-04-09
HK1162197A1 (en) 2012-08-24
GB201107268D0 (en) 2011-06-15
EP2883965A1 (en) 2015-06-17
AU2010343276B2 (en) 2015-05-28
US20220106639A1 (en) 2022-04-07
US10941442B2 (en) 2021-03-09
CA2786357A1 (en) 2011-07-28
EP2848704A1 (en) 2015-03-18
GB2479080B (en) 2012-01-18

Similar Documents

Publication Publication Date Title
US11952623B2 (en) Simultaneous determination of aneuploidy and fetal fraction
AU2021200209B2 (en) Sequencing methods and compositions for prenatal diagnoses
HK40073897A (en) Novel protocol for preparing sequencing libraries
HK40008115A (en) Novel protocol for preparing sequencing libraries
HK40008115B (en) Novel protocol for preparing sequencing libraries
HK1248282A1 (en) Novel protocol for preparing sequencing libraries
HK1248282B (en) Novel protocol for preparing sequencing libraries