ES2947873T3

ES2947873T3 - Detección de neoplasias

Info

Publication number: ES2947873T3
Application number: ES21157412T
Authority: ES
Inventors: David A Ahlquist; John B Kisiel; William R Taylor; Tracy C Yab; Douglas W Mahoney; Graham Lidgard; Hatim Allawi
Original assignee: Mayo Foundation for Medical Education and Research; Exact Sciences Corp; Mayo Clinic in Florida
Current assignee: Mayo Foundation for Medical Education and Research; Exact Sciences Corp; Mayo Clinic in Florida
Priority date: 2013-03-14
Filing date: 2014-03-12
Publication date: 2023-08-23
Anticipated expiration: 2034-03-12
Also published as: CN118028467A; EP2971179A4; EP3543360B1; CA2902916A1; US12606873B2; US20240182980A1; ES2712798T3; EP3878977A1; US9982310B2; EP2971179A2; US20180258498A1; US9506116B2; AU2014244608A1; WO2014159652A3; US11821039B2; EP4234721A3; EP3543360A2; AU2014244608B2; US20200283853A1; EP2971179B1

Abstract

En el presente documento se proporciona tecnología relacionada con la detección de neoplasias y en particular, pero no exclusivamente, con métodos, composiciones y usos relacionados para detectar neoplasias premalignas y malignas tales como cáncer de páncreas y colorrectal. Por consiguiente, en el presente documento se proporciona tecnología para marcadores de detección de cáncer de páncreas y otros marcadores de detección de cáncer gastrointestinal que proporcionan una relación señal-ruido alta y un nivel de fondo bajo cuando se detectan a partir de muestras tomadas de un sujeto (por ejemplo, muestra de heces). Como se describe en el presente documento, la tecnología proporciona una serie de marcadores de ADN metilado y subconjuntos de los mismos (por ejemplo, conjuntos de 2, 3, 4, 5, 6, 7, 8, 9, 10, 1, 1, 12 o más marcadores) con alta discriminación. para neoplasias gastrointestinales en general y/o en sitios tumorales individuales. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Detección de neoplasias

Campo de la invención

En la presente descripción se proporciona tecnología relacionada con la detección de neoplasias y en particular, pero no exclusivamente, con métodos, composiciones y usos relacionados para detectar neoplasias premalignas y malignas, tales como cáncer de páncreas y colorrectal.

Antecedentes

En conjunto, los cánceres gastrointestinales son responsables de más mortalidad por cáncer que cualquier otro sistema de órganos. Aunque actualmente se hacen cribados para el cáncer colorrectal, la mortalidad anual en EE. UU. por cánceres en la porción alta del tubo digestivo supera los 90.000 casos, en comparación con los aproximadamente 50.000 de cáncer colorrectal. Sorprendentemente, cada año se diagnostica de cáncer pancreático a 43.000 hombres y mujeres, lo que provocará aproximadamente 37.000 muertes anuales (Jemal y col. (2010) “Cancer statistics” CA Cancer J Clin 60: 277-300). Como resultado, el cáncer de páncreas es la cuarta causa principal de muerte por cáncer (ídem). Los pacientes que muestran síntomas típicamente ya tienen la enfermedad en estadio avanzado y tan solo un 15 % cumplen los criterios para una cirugía potencialmente curativa (Ghaneh y col. (2007) “Biology and management of pancreatic cancer” Gut 56: 1134-52). A pesar de la cirugía, el 85 % fallecerá a causa de recidivas de la enfermedad (Sohn y col. (2000) “Resected adenocarcinoma of the pancreas-616 patients: results, outcomes, and prognostic indicators” J Gastrointest Surg 4: 567-79). La mortalidad del cáncer de páncreas supera el 95 % y la tasa de supervivencia a los 5 años es inferior al 25 % para los pacientes que se someten a una cirugía curativa (Cleary y col. (2004) “Prognostic factors in resected pancreatic adenocarcinoma: analysis of actual 5-year survivors” J Am Coll Surg 198: 722-31; Yeo y col. (1995) “Pancreaticoduodenectomy for cancer of the head of the pancreas. 201 patients” Ann Surg 221: 721-33).

Entre los pacientes con predisposición sindrómica al cáncer de páncreas o con antecedentes familiares importantes, las estrategias de detección agresivas e invasivas que utilizan tomografías computarizadas o ultrasonido endoscópico han mostrado un rendimiento del 10 % para la neoplasia (Canto y col. (2006) “Screening for early pancreatic neoplasia in high-risk individuals: a prospective controlled study” Clin Gastroenterol Hepatol 4: 766-81). Esta estrategia de detección no es práctica para la población general, donde la mayoría casos de cáncer de páncreas surge sin una predisposición conocida (Klein y col. (2001) “Familial pancreatic cancer” Cancer J 7: 266-73).

La letalidad casi uniforme del cáncer de páncreas ha generado un gran interés en la comprensión de la biología del tumor pancreático. Se han identificado lesiones precursoras, que incluyen la neoplasia intraepitelial pancreática (PanIN, grados I-III) y la neoplasia mucinosa papilar intraductal (IPMN) (Fernández-del Castillo y col. (2010) “Intraductal papillary mucinous neoplasms of the pancreas” Gastroenterology 139: 708-13, 713.e1-2; Haugk (2010) “Pancreatic intraepithelial neoplasia - can we detect early pancreatic cancer?” Histopathology 57: 503-14). El estudio tanto de los precursores como de las lesiones malignas ha identificado una serie de características moleculares a nivel genético, epigenético y proteómico que podrían aprovecharse para la terapia o usarse como biomarcadores para la detección temprana y el cribado. (Kaiser (2008) “Cancer genetics. A detailed genetic portrait of the deadliest human cancers” Science 321: 1280-1; Omura y col. (2009) “Epigenetics and epigenetic alterations in pancreatic cancer” Int J Clin Exp Pathol 2: 310-26; Tonack y col. (2009) “Pancreatic cancer: proteomic approaches to a challenging disease” Pancreatology 9: 567-76). Estudios recientes de mapeo de tumores y lesiones metastásicas han demostrado que puede haber un periodo de latencia significativo entre el desarrollo del cáncer de páncreas maligno y el desarrollo de la enfermedad metastásica, lo que sugiere una amplia ventana de oportunidad para la detección y el tratamiento curativo de las lesiones presintomáticas en etapa más temprana (Yachida y col. (2010) “Distant metastasis occurs late during the genetic evolution of pancreatic cancer” Nature 467: 1114-7).

El cáncer de páncreas arroja (p. ej., exfolia) células y ADN en los efluentes locales y, en última instancia, en las heces. Por ejemplo, el ADN que contiene un gen KRAS mutante se puede identificar (p. ej., secuenciar) a partir del jugo pancreático de pacientes con cáncer de páncreas, PanlN e IPMN (Yamaguchi y col. (2005) “Pancreatic juice cytology in IPMN of the pancreas” Pancreatology 5: 416-21). En el pasado, se han utilizado ensayos altamente sensibles para detectar ADN mutante en heces emparejadas de pacientes con cáncer de páncreas cuyos tumores extirpados se sabía que contenían las mismas secuencias (Zou y col. (2009) “T2036 Pan-Detection of Gastrointestinal Neoplasms By Stool DNA Testing: Establishment of Feasibility” Gastroenterology 136: A-625). Una limitación de los marcadores de mutación se relaciona con el proceso difícil de manejar de su detección en ensayos convencionales; típicamente, cada sitio de mutación en múltiples genes debe ensayarse por separado para lograr una alta sensibilidad.

El ADN metilado se ha estudiado como una posible clase de biomarcadores en los tejidos de la mayoría de los tipos de tumores. En muchos casos, las ADN metiltransferasas agregan un grupo metilo al ADN en los sitios de islas de citosina-fosfato-guanina (CpG) como control epigenético de la expresión génica. En un mecanismo biológicamente atractivo, se cree que los eventos de metilación adquiridos en las regiones promotoras de los genes supresores de tumores silencian la expresión, contribuyendo así a la oncogénesis. La metilación del ADN puede ser una herramienta de diagnóstico química y biológicamente más estable que el ARN o la expresión de proteínas (Laird (2010) “Principies and challenges of genome-wide DNA methylation analysis” Nat Rev Genet 11: 191-203). Además, en otros cánceres como el cáncer de colon esporádico, los marcadores de metilación ofrecen una excelente especificidad y son más informativos y sensibles que las mutaciones de ADN individuales (Zou y col. (2007) “Highly methylated genes in colorectal neoplasia: implications for screening” Cancer Epidemiol Biomarkers Prev 16: 2686-96).

El análisis de las islas de CpG ha arrojado resultados importantes cuando se aplica a modelos animales y a líneas celulares humanas. Por ejemplo, Zhang y sus colaboradores descubrieron que los amplicones de diferentes partes de la misma isla de CpG pueden tener diferentes niveles de metilación (Zhang y col. (2009) “DNA methylation analysis of chromosome 21 gene promoters at single base pair and single allele resolution” PLoS Genet 5: e1000438). Además, los niveles de metilación se distribuyeron bimodalmente entre secuencias altamente metiladas y no metiladas, lo que respalda aún más el patrón binario similar a un interruptor de la actividad de la ADN metiltransferasa (Zhang y col. (2009) “DNA methylation analysis of chromosome 21 gene promoters at single base pair and single allele resolution” PLoS Genet 5: e1000438). El análisis de tejidos murinos in vivo y de líneas celulares in vitro demostró que solo alrededor del 0,3 % de los promotores de alta densidad de CpG (HCP, definidos como que tienen >7 % de secuencia de CpG dentro de una región de 300 pares de bases) estaban metilados, mientras que las áreas de baja densidad de CpG (LCP, definido como que tiene <5 % de secuencia de CpG dentro de una región de 300 pares de bases) tendía a metilarse con frecuencia en un patrón dinámico específico de tejido (Meissner y col. (2008) “Genome-scale DNA methylation maps of pluripotent and differentiated cells” Nature 454: 766-70). Los HCP incluyen promotores de genes constitutivos ubicuos y genes de desarrollo altamente regulados. Entre los sitios de HCP metilados en >50 % se encontraban varios marcadores establecidos, como Wnt 2, NDRG2, SFRP2 y BMP3 (Meissner y col. (2008) “Genomescale DNA methylation maps of pluripotent and differentiated cells” Nature 454: 766-70).

Para las lesiones de cáncer de páncreas, PanlN e IPMN, se ha estudiado la metilación del marcador a nivel tisular (Omura y col. (2008) “Genome-wide profiling of methylated promoters in pancreatic adenocarcinoma” Cancer Biol Ther 7: 1146-56; Sato y col. (2008) “CpG island methylation profile of pancreatic intraepithelial neoplasia” Mod Pathol 21: 238-44; Hong y col. (2008) “Multiple genes are hypermethylated in intraductal papillary mucinous neoplasms of the pancreas” Mod Pathol 21: 1499-507). Por ejemplo, los marcadores MDFI, ZNF415, CNTNAP2 y ElOv L4 estaban altamente metilados en el 96 %, 86 %, 82 % y 68 % de los cánceres estudiados, mientras que, comparativamente, solo el 9 %, 6 %, 3 % y 7 % de los páncreas de control (no cancerosos), respectivamente, estaban altamente metilados en estos mismos cuatro locus (Omura y col. (2008) “Genome-wide profiling of methylated promoters in pancreatic adenocarcinoma” Cancer Biol Ther 7: 1146-56). Se descubrió que la medición del estado de metilación de MDFI y CNTNAP2 proporcionó un indicador para el cáncer de páncreas que tenía una alta sensibilidad (>90 %) y una alta especificidad (>85 %) (Omura y col. (2008) “Genome-wide profiling of methylated promoters in pancreatic adenocarcinoma” Cancer Biol Ther 7: 1146-56).

Además, Sato y sus colaboradores encontraron ocho genes expresados diferencialmente en líneas celulares de cáncer de páncreas antes y después del tratamiento con un inhibidor de la metiltransferasa (Sato y col. (2003) “Discovery of novel targets for aberrant methylation in pancreatic carcinoma using high-throughput microarrays” Cancer Res 63: 3735-42). Estos marcadores se evaluaron posteriormente mediante PCR específica de metilación (MSP) de ADN de lesiones de Pan-IN. Los resultados mostraron que SARP-2 (proteína 1 relacionada frizzled secretada, SFRP1) tenía una sensibilidad del 83 % y podía discriminar entre Pan-IN 2 y Pan-IN 3 de grado superior (Sato y col. (2008) “CpG island methylation profile of pancreatic intraepithelial neoplasia” Mod Pathol 21: 238-44). La discriminación de un precursor de alto grado o un cáncer en etapa temprana de una lesión de menor grado es importante cuando se considera la morbilidad de la pancreaticoduodenectomía o la pancreatectomía distal, las principales terapias quirúrgicas para el cáncer de páncreas. Al estudiar los precursores de IPMN tanto del conducto principal como de la rama lateral, Hong y sus colaboradores también mostraron una alta sensibilidad y especificidad para SFRP1, especialmente en combinación con UCHL1 (Hong y col. (2008) “Multiple genes are hypermethylated in intraductal papillary mucinous neoplasms of the pancreas” Mod Pathol 21: 1499-507). El inhibidor de la vía del factor tisular 2 (TFPI2) tiene una función supresora de tumores bien establecida en las neoplasias malignas GU y GI, incluidos los cánceres de próstata, de cuello uterino, colorrectal, gástrico, esofágico y pancreático (Ma y col. (2011) “MicroRNA-616 induces androgen-independent growth of prostate cancer cells by suppressing expression of tissue factor pathway inhibitor TFPI-2” Cancer Res 71: 583-92; Lim y col. (2010) “Cervical dysplasia: assessing methylation status (Methylight) of CCNA1, DAPK1, HS3ST2, PAX1 and TFPI2 to improve diagnostic accuracy” Gynecol Oncol 119: 225 31; Hibi y col. (2010) “Methylation of TFPI2 gene is frequently detected in advanced well-differentiated colorectal cancer” Anticancer Res 30: 1205-7; Glockner y col. (2009) “Methylation of TFPI2 in stool DNA: a potential novel biomarker for the detection of colorectal cancer” Cancer Res 69: 4691-9; Hibi y col. (2010) “Methylation of the TFPI2 gene is frequently detected in advanced gastric carcinoma” Anticancer Res 30: 4131-3; Tsunoda y col. (2009) “Methylation of CLDN6, FBN₂, RBP1, RBP4, TFPI2, and TMEFF2 in esophageal squamous cell carcinoma” Oncol Rep 21: 1067-73; Tang y col. (2010) “Prognostic significance of tissue factor pathway inhibitor-2 in pancreatic carcinoma and its effect on tumor invasion and metastasis” Med Oncol 27: 867-75; Brune y col. (2008) “Genetic and epigenetic alterations of familial pancreatic cancers” Cancer Epidemiol Biomarkers Prev 17: 3536-4). También se ha demostrado que este marcador se derrama en la luz GI y fue un 73 % sensible cuando se ensayó a partir de jugo pancreático de pacientes con cáncer y pacientes normales (Matsubayashi y col. (2006) “DNA methylation alterations in the pancreatic juice of patients with suspected pancreatic disease” Cancer Res 66: 1208-17).

TFPI2 se encontraba entre una gran cantidad de posibles marcadores de mutación y mutilación estudiados en muestras de tejido y heces como candidatos para la neoplasia colorrectal. En un análisis de conjunto de prueba de entrenamiento de heces de archivo de casi 700 sujetos, se demostró que un panel de metilación de múltiples marcadores, incluidos TFPI2, BMP3, NDRG4 y vimentina, tiene una sensibilidad del 85 % en el CCR y una sensibilidad del 64 % en adenomas colorrectales avanzados, ambos con un 90 % de especificidad (Ahlquist D y col. (2010) “Next Generation Stool DNA Testing for Detection of Colorectal Neoplasia - Early Marker Evaluation”, presentado en Colorectal Cancer: Biology to Therapy, American Association for Cancer Research).

Investigaciones anteriores han probado el rendimiento de los marcadores de metilación del cáncer colorrectal en la detección del cáncer de páncreas. En particular, un estudio de casos y controles comparó el ADN de los casos de tumores de cáncer de páncreas con el ADN del epitelio del colon usando marcadores de orientación de MSP previamente informados en el cáncer de páncreas (p. ej., MDFI, SFRP2, UCHL1, CNTNAP2 y TFPI2) y marcadores de neoplasia colónica discriminantes adicionales (p. ej., BMP3, EYA4, Vimentina y NDRG4). Un modelo de regresión de múltiples marcadores mostró que EYA4, UCHL1 y MDFI eran altamente discriminantes, con un área bajo la curva de características operativas del receptor de 0,85. Como marcador individual, se encontró que BMP3 tenía un área bajo la curva de características operativas del receptor de 0,90. Estos cuatro marcadores y KRAS mutante se ensayaron posteriormente en un conjunto más grande de muestras de heces de sujetos con cáncer de páncreas en una comparación con enmascaramiento con heces coincidentes de individuos con una colonoscopia normal. Individualmente, BMP3 y KRAS fueron altamente específicos, pero poco sensibles; en combinación, la sensibilidad mejoró al 65 % mientras se mantuvo una especificidad del 88 % (Kisiel, y col. (2011) “Stool DNA screening for colorectal cancer: opportunities to improve value with next generation tests” J Clin Gastroenterol 45: 301-8. Estos resultados sugirieron que las diferencias de metilación en UCHL1, EYA4 y MDFI a nivel del páncreas estaban oscurecidas por la metilación colónica de fondo en la comparación basada en heces. Como tal, la detección del cáncer necesita un marcador o panel de marcadores para el cáncer de páncreas que sea ampliamente informativo y muestre una alta especificidad para el cáncer de páncreas a nivel de tejido cuando se interroga en muestras tomadas de un sujeto (por ejemplo, una muestra de heces).

Resumen

En consecuencia, en la presente descripción se proporciona tecnología para marcadores de detección de cáncer de páncreas y otros marcadores de detección de cáncer gastrointestinal que proporcionan una alta relación señal/ruido y un bajo nivel de fondo cuando se detectan a partir de muestras tomadas de un sujeto (p. ej., muestra de heces). Los marcadores se identificaron en un estudio de casos y controles al comparar el estado de metilación de los marcadores de ADN de tumores de sujetos con cáncer de páncreas en estadio I y estadio II con el estado de metilación de los mismos marcadores de ADN de sujetos de control (p. ej., tejido normal, tal como colon normal y/o páncreas no neoplásico) (véanse los ejemplos 1 y 11).

Se identificaron marcadores y/o paneles de marcadores (por ejemplo, una región cromosómica que tiene una anotación seleccionada entre ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12 133, CLEC11A, ELMO1, EOMES, CLEC 11, SHH, GJC1, IHIF1, IKZF1, KCNK12, KCNN₂, PCBP3, PRKCB, RSPO₃, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1 y ZNF71) en un estudio de casos y controles al comparar el estado de metilación de los marcadores de ADN (p. ej., de tumores de sujetos con cáncer de páncreas en estadio I y estadio II) con el estado de metilación de los mismos marcadores de ADN de sujetos de control (por ejemplo, tejido normal tal como colon normal y/o páncreas no neoplásico) (véanse los ejemplos 2 y 8).

Se identificaron marcadores y/o paneles de marcadores (p. ej., una región cromosómica con una anotación seleccionada entre NDRG4, s Fr p 1, BMP3, HPP1 y/o APC) en estudios de casos y controles al comparar el estado de metilación de marcadores de ADN de tejido esofágico de sujetos con esófago de Barrett con el estado de metilación de los mismos marcadores de ADN de sujetos de control (véanse los ejemplos 4 y 10).

Se identificaron marcadores y/o paneles de marcadores (p. ej., una región cromosómica con una anotación seleccionada de ADCY1, PRKCB, KCNK12, C13ORF18, IKZF1, TWIST1, ELMO, 55957, CD1D, CLEC11A, KCNN₂, BMP3 y/o NDRG4) en estudios de casos y controles comparando el estado de metilación de los marcadores de ADN de una muestra de jugo pancreático de sujetos con cáncer de páncreas con el estado de metilación de los mismos marcadores de ADN de sujetos de control (véanse los ejemplos 5 y 6).

Se identificó un marcador (p. ej., una región cromosómica con una anotación CD1D) en un estudio de casos y controles comparando el estado de metilación de un marcador de ADN (p. ej., CD1D) de una muestra de heces de sujetos con cáncer de páncreas con el estado de metilación del mismo marcador de ADN de sujetos de control que no tenían cáncer de páncreas (véase el ejemplo 7).

Se identificó un marcador (p. ej., miR-1290) en un estudio de casos y controles al comparar la cantidad cuantificada de un marcador de ADN (p. ej., miR-1290) de una muestra de heces de sujetos con cáncer de páncreas con la cantidad cuantificada del mismo ADN marcador de sujetos de control que no tienen cáncer de páncreas (véase el ejemplo 9).

El análisis estadístico adicional de los resultados demostró que la tecnología descrita en la presente descripción basada en estos marcadores predice específica y sensiblemente un sitio tumoral.

Como se describe en la presente descripción, la tecnología proporciona una serie de marcadores de ADN metilado y subconjuntos de los mismos (por ejemplo, conjuntos de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 o más marcadores) con alta discriminación para Neoplasias gastrointestinales en general y/o en sitios de tumores individuales. Los experimentos aplicaron un filtro de selección a los marcadores candidatos para identificar los marcadores que proporcionan una alta relación señal/ruido y un bajo nivel de fondo para proporcionar una alta especificidad, por ejemplo, cuando se analizan medios distantes (por ejemplo, heces, sangre, orina, tejido metastásico, etc.) con fines de detección o diagnóstico de cáncer. Además, se realizaron experimentos para demostrar que los marcadores de ADN metilado identificados predicen el sitio del tumor. Como tal, la tecnología proporciona marcadores específicos, combinaciones de marcadores y algoritmos para predecir el sitio del tumor.

En algunas realizaciones, la tecnología está relacionada con la evaluación de la presencia y el estado de metilación de uno o más de los marcadores identificados en la presente descripción en una muestra biológica. Estos marcadores comprenden una o más regiones metiladas diferencialmente (DMR) como se analiza en la presente descripción, por ejemplo, como se proporciona en la tabla 1 y/o la tabla 10. El estado de metilación se evalúa en realizaciones de la tecnología. Como tal, la tecnología proporcionada en la presente descripción no está restringida en el método por el cual se mide el estado de metilación de un gen. Por ejemplo, en algunas realizaciones, el estado de metilación se mide mediante un método de exploración del genoma. Por ejemplo, un método implica la exploración genómica de puntos de referencia de restricción (Kawai y col. (1994) Mol. Cell. Biol. 14: 7421-7427) y otro ejemplo implica la PCR cebada arbitrariamente sensible a la metilación (Gonzalgo y col. (1997) Cancer Res. 57: 594-599). En algunas realizaciones, los cambios en los patrones de metilación en sitios de CpG específicos se controlan mediante la digestión del ADN genómico con enzimas de restricción sensibles a la metilación seguido de un análisis de Southern de las regiones de interés (método de digestión-Southern). En algunas realizaciones, el análisis de los cambios en los patrones de metilación implica un proceso basado en la PCR que implica la digestión del ADN genómico con enzimas de restricción sensibles a la metilación antes de la amplificación por PCR (Singer-Sam y col. (1990) Nucl. Acids Res.

18: 687). Además, se han notificado otras técnicas que utilizan el tratamiento con bisulfito del ADN como punto de partida para el análisis de metilación. Estos incluyen PCR específica de metilación (MSP) (Herman y col. (1992) Proc. Natl. Acad. Sci. USA 93: 9821-9826) y digestión con enzimas de restricción de productos de PCR amplificados a partir de ADN convertido con bisulfito (Sadri y Hornsby (1996) Nucl. Acids Res. 24: 5058-5059; y Xiong y Laird (1997) Nucl. Acids Res. 25: 2532-2534). Se han desarrollado técnicas de PCR para la detección de mutaciones genéticas (Kuppuswamy y col. (1991) Proc. Natl. Acad. Sci. USA 88: 1143-1147) y cuantificación de la expresión alélica específica (Szabo y Mann (1995) Genes Dev. 9: 3097-3108; y Singer-Sam y col. (1992) PCR Methods Appl. 1: 160 163). Estas técnicas utilizan cebadores internos, que se hibridan con una plantilla generada por PCR y terminan inmediatamente en 5' del único nucleótido que se va a ensayar. En algunas realizaciones, se utilizan métodos que utilizan un “ensayo cuantitativo Ms-SNuPE” como se describe en la Patente de EE. UU. N.° 7.037.650.

Al evaluar un estado de metilación, el estado de metilación a menudo se expresa como la fracción o el porcentaje de hebras individuales de ADN que están metiladas en un sitio particular (por ejemplo, en un solo nucleótido, en una región o locus particular, en una secuencia más larga de interés, por ejemplo, hasta una subsecuencia de ~100 pb, 200 pb, 500 pb, 1000 pb de un ADN o más) en relación con la población total de ADN en la muestra que comprende ese sitio en particular. Tradicionalmente, la cantidad de ácido nucleico no metilado se determina mediante PCR utilizando calibradores. Posteriormente, se trata una cantidad conocida de ADN con bisulfito y la secuencia específica de metilación resultante se determina utilizando una PCR en tiempo real u otra amplificación exponencial, por ejemplo, un ensayo QuARTS (por ejemplo, como se proporciona en la Patente de EE. UU. N.° 8.361.720; y las Publicaciones de Solicitud de Patente de EE. UU. N.° 2012/0122088 y 2012/0122106).

Por ejemplo, en algunas realizaciones, los métodos comprenden generar una curva patrón para la diana no metilada mediante el uso de patrones externos. La curva patrón se construye a partir de al menos dos puntos y relaciona el valor de Ct en tiempo real del ADN no metilado con patrones cuantitativos conocidos. Posteriormente, se construye una segunda curva patrón para la diana metilada a partir de al menos dos puntos y patrones externos. Esta segunda curva patrón relaciona el Ct para el ADN metilado con patrones cuantitativos conocidos. A continuación, se determinan los valores de Ct de la muestra de prueba para las poblaciones metiladas y no metiladas y se calculan los equivalentes genómicos de ADN a partir de las curvas patrón producidas mediante las dos primeras etapas. El porcentaje de metilación en el sitio de interés se calcula a partir de la cantidad de ADN metilado en relación con la cantidad total de ADN en la población, por ejemplo, (número de ADN metilados) / (número de ADN metilados número de ADN no metilados) * 100.

También se proporcionan en la descripción composiciones y kits para practicar los métodos. Por ejemplo, en algunos aspectos, los reactivos (p. ej., cebadores, sondas) específicos para uno o más marcadores se proporcionan solos o en conjuntos (p. ej., conjuntos de pares de cebadores para amplificar una pluralidad de marcadores). También se pueden proporcionar reactivos adicionales para realizar un ensayo de detección (p. ej., enzimas, tampones, controles positivos y negativos para realizar QuARTS, PCR, secuenciación, bisulfito u otros ensayos). En algunos aspectos, se proporcionan kits que contienen uno o más reactivos necesarios, suficientes o útiles para realizar un método. También se proporcionan mezclas de reacción que contienen los reactivos. Además, se proporcionan conjuntos de reactivos de mezcla maestra que contienen una pluralidad de reactivos que se pueden agregar entre sí y/o a una muestra de prueba para completar una mezcla de reacción.

En algunos aspectos, la tecnología descrita en la presente descripción está asociada con una máquina programare diseñada para realizar una secuencia de operaciones aritméticas o lógicas según lo previsto por los métodos descritos en la presente descripción. Por ejemplo, algunos aspectos de la tecnología están asociados con (por ejemplo, implementados en) software y/o hardware de ordenador. En un aspecto, la tecnología se relaciona con un ordenador que comprende una forma de memoria, un elemento para realizar operaciones aritméticas y lógicas y un elemento de procesamiento (p. ej., un microprocesador) para ejecutar una serie de instrucciones (p. ej., un método como se proporciona en la presente descripción) para leer, manipular y almacenar datos. En algunos aspectos, un microprocesador es parte de un sistema para determinar un estado de metilación (por ejemplo, de una o más DMR, por ejemplo, DMR 1-107 como se proporciona en la tabla 1, por ejemplo, DMR 1-449 en la tabla 10); comparar estados de metilación (por ejemplo, de una o más DMR, por ejemplo, DMR 1-107 como se proporciona en la tabla 1, por ejemplo, DMR 1-449 en la tabla 10); generar curvas patrón; determinar un valor de Ct; calcular una fracción, frecuencia o porcentaje de metilación (por ejemplo, de una o más DMR, por ejemplo, DMR 1-107 como se proporciona en la tabla 1, por ejemplo, DMR 1-449 en la tabla 10); identificar una isla de CpG; determinar una especificidad y/o sensibilidad de un ensayo o marcador; calcular una curva ROC y una ABC asociada; análisis de secuencias; todo como se describe en la presente descripción o se conoce en la técnica.

En algunos aspectos, un microprocesador o un ordenador usa datos del estado de metilación en un algoritmo para predecir el sitio de un cáncer.

En algunos aspectos, un componente de software o hardware recibe los resultados de múltiples ensayos y determina un resultado de valor único para informar a un usuario que indica un riesgo de cáncer basado en los resultados de múltiples ensayos (p. ej., determinar el estado de metilación de múltiples DMR, por ejemplo, como se indica en la tabla 1, por ejemplo, como se indica en la tabla 10). Los aspectos relacionados calculan un factor de riesgo basado en una combinación matemática (por ejemplo, una combinación ponderada, una combinación lineal) de los resultados de múltiples ensayos, por ejemplo, determinando los estados de metilación de múltiples marcadores (como DMR múltiple, por ejemplo, como se proporciona en la tabla 1, por ejemplo, como se indica en la tabla 10). En algunos aspectos, el estado de metilación de una DMR define una dimensión y puede tener valores en un espacio multidimensional y la coordenada definida por los estados de metilación de múltiples DMR es un resultado, por ejemplo, para informar a un usuario, por ejemplo, relacionado con un riesgo de cáncer.

Algunos aspectos comprenden un medio de almacenamiento y componentes de memoria. Los componentes de memoria (p. ej., memoria volátil y/o no volátil) encuentran uso para almacenar instrucciones (p. ej., una realización de un proceso como se proporciona en la presente descripción) y/o datos (p. ej., una pieza de trabajo como mediciones de metilación, secuencias y descripciones estadísticas asociadas con las mismas). Algunos aspectos se relacionan con sistemas que también comprenden una o más de una CPU, una tarjeta gráfica y una interfaz de usuario (p. ej., que comprenden un dispositivo de salida, como una pantalla, y un dispositivo de entrada, como un teclado).

Las máquinas programables asociadas con la tecnología comprenden tecnologías convencionales existentes y tecnologías en desarrollo o aún por desarrollar (por ejemplo, una computadora cuántica, una computadora química, una computadora de ADN, una computadora óptica, una computadora basada en espintrónica, etc.).

En algunos aspectos, la tecnología comprende un medio de transmisión alámbrico (por ejemplo, cable metálico, fibra óptica) o inalámbrico para transmitir datos. Por ejemplo, algunos aspectos se relacionan con la transmisión de datos a través de una red (por ejemplo, una red de área local (LAN), una red de área amplia (WAN), una red ad-hoc, Internet, etc.). En algunos aspectos, las máquinas programables están presentes en dicha red como iguales y en algunos aspectos las máquinas programables tienen una relación cliente/servidor.

En algunos aspectos, los datos se almacenan en un medio de almacenamiento legible por ordenador, como un disco duro, una memoria flash, un medio óptico, un disquete, etc.

En algunos aspectos, la tecnología proporcionada en la presente descripción está asociada con una pluralidad de dispositivos programables que funcionan en conjunto para realizar un método como se describe en la presente descripción. Por ejemplo, en algunos aspectos, una pluralidad de ordenadores (por ejemplo, conectados por una red) pueden trabajar en paralelo para recolectar y procesar datos, por ejemplo, en una implementación de computación en clúster o computación en malla o alguna otra arquitectura de computación distribuida que se basa en ordenadores (con CPU integradas, almacenamiento, fuentes de alimentación, interfaces de red, etc.) conectados a una red (privada, pública o Internet) mediante una interfaz de red convencional, como Ethernet, fibra óptica o tecnología de red inalámbrica.

Por ejemplo, algunos aspectos proporcionan un ordenador que incluye un medio legible por ordenador. La realización incluye una memoria de acceso aleatorio (RAM) acoplada a un procesador. El procesador ejecuta instrucciones de programa ejecutables por ordenador almacenadas en la memoria. Dichos procesadores pueden incluir un microprocesador, un ASIC, una máquina de estado u otro procesador, y pueden ser cualquiera de varios procesadores informáticos, como los procesadores de Intel Corporation de Santa Clara, California y Motorola Corporation de Schaumburg, Illinois. Dichos procesadores incluyen, o pueden estar en comunicación con, medios, por ejemplo, medios legibles por ordenador, que almacenan instrucciones que, cuando son ejecutadas por el procesador, hacen que el procesador realice los pasos descritos en la presente descripción.

Los aspectos de los medios legibles por ordenador incluyen, pero no se limitan a, un dispositivo de almacenamiento o transmisión electrónico, óptico, magnético o de otro tipo capaz de proporcionar a un procesador instrucciones legibles por ordenador. Otros ejemplos de medios adecuados incluyen, entre otros, un disquete, un CD-ROM, un DVD, un disco magnético, un chip de memoria, una ROM, una RAM, un ASIC, un procesador configurado, todos los medios ópticos, todas las cintas magnéticas u otros medios magnéticos, o cualquier otro medio desde el cual un procesador de ordenador pueda leer instrucciones. Además, varias formas diferentes de medios legibles por ordenador pueden transmitir o llevar instrucciones a un ordenador, incluidos un enrutador, una red privada o pública u otro dispositivo o canal de transmisión, tanto por cable como inalámbrico. Las instrucciones pueden incluir código en cualquier lenguaje de programación informático adecuado, incluidos, por ejemplo, C, C++, C#, Visual Basic, Java, Python, Perl y JavaScript.

En algunos aspectos, los ordenadores están conectados a una red. Los ordenadores también pueden incluir varios dispositivos externos o internos, como un ratón, un CD-ROM, un DVD, un teclado, una pantalla u otros dispositivos de entrada o salida. Algunos ejemplos de ordenadores son los ordenadores personales, los asistentes digitales, los asistentes digitales personales, los teléfonos celulares, los teléfonos móviles, los teléfonos inteligentes, los buscapersonas, las tabletas digitales, los ordenadores portátiles, los dispositivos de Internet y otros dispositivos basados en procesadores. En general, los ordenadores relacionados con aspectos de la tecnología proporcionada en la presente descripción pueden ser cualquier tipo de plataforma basada en procesador que opere en cualquier sistema operativo, como Microsoft Windows, Linux, UNIX, Mac OS X, etc., capaz de soportar uno o más programas que comprenden la tecnología proporcionada en la presente descripción. Algunos aspectos comprenden un ordenador personal que ejecuta otros programas de aplicación (por ejemplo, aplicaciones). Las aplicaciones pueden estar contenidas en la memoria y pueden incluir, por ejemplo, una aplicación de procesamiento de texto, una aplicación de hoja de cálculo, una aplicación de correo electrónico, una aplicación de mensajería instantánea, una aplicación de presentación, una aplicación de navegador de Internet, una aplicación de calendario/organizador y cualquier otra aplicación capaz de ser ejecutada por un dispositivo cliente.

Todos los componentes, ordenadores y sistemas descritos en la presente descripción como asociados con la tecnología pueden ser lógicos o virtuales.

Por consiguiente, en la descripción se proporciona tecnología relacionada con un método de cribado de una neoplasia en una muestra obtenida de un sujeto, comprendiendo el método analizar un estado de metilación de un marcador en una muestra obtenida de un sujeto; e identificar que el sujeto tiene una neoplasia cuando el estado de metilación del marcador es diferente al estado de metilación del marcador analizado en un sujeto que no tiene una neoplasia, en donde el marcador comprende una base en una región metilada diferencialmente (DMR) seleccionada de un grupo que consiste en las DMR 1-107 como se proporcionan en la tabla 1 y/o las DMR 1-449 en la tabla 10. Por consiguiente, la invención proporciona un método de cribado de una neoplasia en una muestra obtenida de un sujeto, comprendiendo el método: 1) analizar un estado de metilación de TWIST1 y CLEC11A en una muestra obtenida de un sujeto; y 2) identificar que el sujeto tiene una neoplasia cuando el estado de metilación de TWIST1 y CLEC11A es diferente al estado de metilación del marcador analizado en un sujeto que no tiene una neoplasia, en donde CLEC11A comprende una base en la región metilada diferencialmente (DMR) 64, en donde TWIST1 comprende una base en DMR 418 o 419. En algunas realizaciones, el método comprende además localizar el sitio de la neoplasia dentro del sujeto, en donde el estado de metilación del marcador indica el sitio de la neoplasia dentro del sujeto. La tecnología está relacionada con la identificación y discriminación de cánceres gastrointestinales, por ejemplo, en algunas realizaciones, la neoplasia es una neoplasia gastrointestinal. En algunas realizaciones, la neoplasia está presente en el área gastrointestinal alta del paciente y en algunas realizaciones, la neoplasia está presente en el área gastrointestinal baja del paciente. En realizaciones particulares, la neoplasia es una neoplasia de páncreas, una neoplasia colorrectal, una neoplasia del conducto biliar o un adenoma. La tecnología también abarca la determinación del estado o el estadio de un cáncer, por ejemplo, en algunas realizaciones, la neoplasia es precancerosa. Algunas realizaciones proporcionan métodos que comprenden analizar una pluralidad de marcadores, por ejemplo, que comprenden analizar de 2 a 11 marcadores.

La tecnología no está limitada en el estado de metilación evaluado. En algunas realizaciones, evaluar el estado de metilación del marcador en la muestra comprende determinar el estado de metilación de una base. En algunas realizaciones, analizar el estado de metilación del marcador en la muestra comprende determinar el grado de metilación en una pluralidad de bases. Además, en algunas realizaciones, el estado de metilación del marcador comprende una metilación aumentada del marcador con respecto a un estado de metilación normal del marcador. En algunas realizaciones, el estado de metilación del marcador comprende una metilación disminuida del marcador con respecto a un estado de metilación normal del marcador. En algunas realizaciones, el estado de metilación del marcador comprende un patrón diferente de metilación del marcador con respecto a un estado de metilación normal del marcador.

Además, en algunas realizaciones el marcador es una región de 100 o menos bases, el marcador es una región de 500 o menos bases, el marcador es una región de 1000 o menos bases, el marcador es una región de 5000 o menos bases, o, en algunas realizaciones, el marcador es una base. En algunas realizaciones, el marcador está en un promotor de alta densidad de CpG.

La tecnología no está limitada por el tipo de muestra. Por ejemplo, en algunas realizaciones, la muestra es una muestra de heces, una muestra de tejido, una muestra de jugo pancreático, una muestra de fluido de quiste pancreático, una muestra de sangre (p. ej., plasma, suero, sangre completa), una de excreción o una muestra de orina.

Además, la tecnología no está limitada en el método utilizado para determinar el estado de metilación. En algunas realizaciones, el análisis comprende el uso de la reacción en cadena de la polimerasa específica de metilación, la secuenciación de ácido nucleico, la espectrometría de masas, la nucleasa específica de metilación, la separación basada en masas o la captura de dianas. En algunas realizaciones, el análisis comprende el uso de un oligonucleótido específico de metilación. En algunas realizaciones, la tecnología utiliza secuenciación paralela masiva (por ejemplo, secuenciación de próxima generación) para determinar el estado de metilación, por ejemplo, secuenciación por síntesis, secuenciación en tiempo real (por ejemplo, de una sola molécula), secuenciación de emulsión de perlas, secuenciación de nanoporos, etc.

La descripción proporciona reactivos para detectar una DMR, por ejemplo, en algunos aspectos se proporciona un conjunto de oligonucleótidos que comprenden las secuencias proporcionadas por las SEQ ID NO: 1-202. En algunos aspectos, se proporciona un oligonucleótido que comprende una secuencia complementaria a una región cromosómica que tiene una base en una DMR, por ejemplo, un oligonucleótido sensible al estado de metilación de una DMR.

La tecnología proporciona varios paneles de marcadores, por ejemplo, en algunos aspectos, el marcador comprende una región cromosómica que tiene una anotación que es ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12.133, CLEC11A, ELMO1, EOMES, GJC1, IHIF1, IKZF1, KCNK12, KCNN₂, NDRG4, PCBP3, PRKCB, RSPO₃, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1 o ZNF71, y que comprende el marcador (véanse las tablas 1 y 9). Además, los aspectos proporcionan un método para analizar una DMR de la tabla 1 que es la DMR N.° 11, 14, 15, 65, 21, 22, 23, 5, 29, 30, 38, 39, 41, 50, 51, 55, 57, 60, 61, 8, 75, 81, 82, 84, 87, 93, 94, 98, 99, 103, 104 o 107 y/o una DMR correspondiente a Chr16:58497395-58497458. Algunos aspectos permiten determinar el estado de metilación de un marcador, en donde una región cromosómica que tiene una anotación que es CLEC11A, C13ORF18, KCNN₂, ABCB1, SLC38A3, CD1D, IKZF1, ADCY1, CHR12133, RSPO₃, MBP3, PRKCB, NDRG4, ELMO o TWIST1 comprende el marcador. En algunos aspectos, los métodos comprenden determinar el estado de metilación de dos marcadores, por ejemplo, un par de marcadores proporcionados en una fila de la tabla 5.

En la divulgación se proporcionan kits, por ejemplo, un kit que comprende un reactivo de bisulfito; y un ácido nucleico de control que comprende una secuencia de una DMR seleccionada entre un grupo que consiste en las DMR 1-107 (de la tabla 1) y/o una DMR seleccionada entre un grupo que consiste en las DMR 1-449 (de la tabla 10) y que tiene una metilación asociada con un sujeto que no tiene cáncer. En algunos aspectos, los kits comprenden un reactivo de bisulfito y un oligonucleótido como se describe en la presente descripción. En algunos aspectos, los kits comprenden un reactivo de bisulfito; y un ácido nucleico de control que comprende una secuencia de una DMR seleccionada entre un grupo que consiste en las DMR 1-107 (de la tabla 1) y/o las DMR 1-449 (de la tabla 10) y que tiene un estado de metilación asociado con un sujeto que tiene un cáncer. Algunos aspectos del kit comprenden un recolector de muestras para obtener una muestra de un sujeto (por ejemplo, una muestra de heces); reactivos para aislar un ácido nucleico de la muestra; un reactivo de bisulfito; y un oligonucleótido como se describe en la presente descripción.

La divulgación está relacionada con aspectos de las composiciones (p. ej., mezclas de reacción). En algunos aspectos, se proporciona una composición que comprende un ácido nucleico que comprende una DMR y un reactivo de bisulfito. Algunos aspectos proporcionan una composición que comprende un ácido nucleico que comprende una DMR y un oligonucleótido como se describe en la presente descripción. Algunos aspectos proporcionan una composición que comprende un ácido nucleico que comprende una DMR y una enzima de restricción sensible a la metilación. Algunos aspectos proporcionan una composición que comprende un ácido nucleico que comprende una DMR y una polimerasa.

Se proporcionan realizaciones de métodos relacionados adicionales para la detección de una neoplasia en una muestra obtenida de un sujeto, por ejemplo, un método que comprende determinar un estado de metilación de un marcador en la muestra que comprende una base en una DMR que es una o más de las DMR 1-107 (de la tabla 1) y/o una o más de las DMR 1-449 (de la tabla 10); comparar el estado de metilación del marcador de la muestra del sujeto con un estado de metilación del marcador de una muestra de control normal de un sujeto que no tiene cáncer; y determinar un intervalo de confianza y/o un valor p de la diferencia en el estado de metilación de la muestra del sujeto y la muestra de control normal. En algunas realizaciones, el intervalo de confianza es del 90 %, 95 %, 97,5 %, 98 %, 99 %, 99,5 %, 99,9 % o 99,99 % y el valor de p es 0,1, 0,05, 0,025, 0,02, 0,01, 0,005, 0,001, o 0,0001. Algunas realizaciones de métodos proporcionan etapas para hacer reaccionar un ácido nucleico que comprende una DMR con un reactivo de bisulfito para producir un ácido nucleico que ha reaccionado con bisulfito; secuenciar el ácido nucleico que ha reaccionado con bisulfito para proporcionar una secuencia de nucleótidos del ácido nucleico que ha reaccionado con bisulfito; comparar la secuencia de nucleótidos del ácido nucleico que ha reaccionado con bisulfito con una secuencia de nucleótidos de un ácido nucleico que comprende la DMR de un sujeto que no tiene cáncer para identificar diferencias en las dos secuencias; e identificar que el sujeto tiene una neoplasia cuando está presente una diferencia.

La tecnología proporciona sistemas para la detección de una neoplasia en una muestra obtenida de un sujeto. Algunos ejemplos de realizaciones de sistemas incluyen, por ejemplo, un sistema para detectar una neoplasia en una muestra obtenida de un sujeto, comprendiendo el sistema un componente de análisis configurado para determinar el estado de metilación de una muestra, un componente de software configurado para comparar el estado de metilación de la muestra con una muestra de control o un estado de metilación de muestra de referencia registrado en una base de datos, y un componente de alerta configurado para alertar a un usuario de un estado de metilación asociado con el cáncer. En algunas realizaciones, se determina una alerta mediante un componente de software que recibe los resultados de múltiples ensayos (por ejemplo, determinando los estados de metilación de múltiples marcadores, por ejemplo, DMR, por ejemplo, como se proporciona en la tabla 1, por ejemplo, como se proporciona en la tabla 10) y calcular un valor o resultado para informar en función de los múltiples resultados. Algunas realizaciones proporcionan una base de datos de parámetros ponderados asociados con cada DMR proporcionada en la presente memoria para su uso en el cálculo de un valor o resultado y/o una alerta para informar a un usuario (por ejemplo, como un médico, profesional de enfermería, profesional sanitario, etc.). En algunas realizaciones, se notifican todos los resultados de múltiples ensayos y, en algunas realizaciones, se utilizan uno o más resultados para proporcionar una puntuación, un valor o un resultado basado en una combinación de uno o más resultados de múltiples ensayos que es indicativo de un riesgo de cáncer en un sujeto.

En algunas realizaciones de sistemas, una muestra comprende un ácido nucleico que comprende una DMR. En algunas realizaciones, el sistema comprende además un componente para aislar un ácido nucleico, un componente para recolectar una muestra, como un componente para recolectar una muestra de heces. En algunas realizaciones, el sistema comprende secuencias de ácido nucleico que comprenden una DMR. En algunas realizaciones, la base de datos comprende secuencias de ácido nucleico de sujetos que no tienen cáncer. También se proporcionan ácidos nucleicos, por ejemplo, un conjunto de ácidos nucleicos, teniendo cada ácido nucleico una secuencia que comprende una DMR. En algunas realizaciones, el conjunto de ácidos nucleicos en donde cada ácido nucleico tiene una secuencia de un sujeto que no tiene cáncer. Las realizaciones de sistemas relacionados comprenden un conjunto de ácidos nucleicos como se describe y una base de datos de secuencias de ácidos nucleicos asociadas con el conjunto de ácidos nucleicos. Algunas realizaciones comprenden además un reactivo de bisulfito. Y, algunas realizaciones comprenden además un secuenciador de ácido nucleico.

Algunas realizaciones adicionales serán evidentes para los expertos en la técnica relevante basándose en las enseñanzas contenidas en la presente descripción.

Breve descripción de los dibujos

Estas y otras características, aspectos y ventajas de la presente tecnología se entenderán mejor haciendo referencia a los siguientes dibujos:

La figura 1 es un gráfico que muestra la importancia del marcador de un subconjunto de marcadores de metilación medido por la disminución media en la precisión para la predicción del sitio.

La figura 2 muestra los niveles de marcadores de BMP3 y NDRG4 en cepillados (cardias esófago completo) en casos y controles de esófago de Barrett como se describe en el ejemplo 8.

La figura 3 muestra la ABC de miR-1290 en heces como se describe en el ejemplo 9.

Debe entenderse que las figuras no están necesariamente dibujadas a escala, ni los objetos de las figuras están necesariamente dibujados a escala en relación unos con otros. Las figuras son representaciones que pretenden aportar claridad y comprensión a diversas realizaciones de aparatos, sistemas, composiciones y métodos descritos en la presente descripción. Siempre que sea posible, se usan los mismos números de referencia en todos los dibujos para referirse a las mismas partes o a partes similares. Además, debe apreciarse que los dibujos no pretenden limitar el alcance de las presentes enseñanzas de ningún modo.

Descripción detallada

En la presente descripción se proporciona tecnología relacionada con la detección de neoplasias y en particular, pero no exclusivamente, con métodos, composiciones y usos relacionados para detectar neoplasias premalignas y malignas, tales como cáncer de páncreas y colorrectal. Ya que en la presente descripción se describe la tecnología, los encabezados de las secciones se utilizan con fines organizativos y no deben interpretarse de modo alguno como una limitación de la materia descrita.

En esta descripción detallada de las diversas realizaciones, con fines explicativos, se exponen numerosos detalles específicos para proporcionar una comprensión completa de las realizaciones descritas. Un experto en la técnica apreciará, sin embargo, que estas diversas realizaciones pueden practicarse con o sin estos detalles específicos. En otros casos, las estructuras y los dispositivos se muestran en forma de diagrama de bloques. Además, un experto en la materia puede apreciar fácilmente que las secuencias específicas en las que se presentan y realizan los métodos son ilustrativas y se contempla que las secuencias se pueden variar y permanecer dentro del espíritu y alcance de las diversas realizaciones descritas en la presente descripción.

A menos que se defina de cualquier otra manera, todos los términos técnicos y científicos utilizados en la presente descripción tienen el mismo significado que entiende habitualmente un experto en la materia a la que pertenece la invención. Cuando las definiciones de los términos en las referencias incorporadas parezcan diferir de las definiciones proporcionadas en las presentes enseñanzas, prevalecerá la definición proporcionada en las presentes enseñanzas.

Definiciones

Para facilitar la comprensión de la presente tecnología, a continuación se definen una serie de términos y expresiones. Se establecen definiciones adicionales a lo largo de la descripción detallada.

A lo largo de la memoria descriptiva y las reivindicaciones, los siguientes términos tienen los significados asociados explícitamente en la presente descripción, a menos que el contexto indique claramente lo contrario. La expresión “en una realización”, tal como se usa en la presente descripción, no se refiere necesariamente a la misma realización, aunque podría hacerlo. Además, la expresión “en otra realización”, tal como se usa en la presente descripción, no se refiere necesariamente a una realización diferente, aunque podría hacerlo. Por tanto, como se describe a continuación, varias realizaciones de la invención pueden combinarse fácilmente, sin apartarse del alcance o espíritu de la invención.

Además, como se usa en la presente descripción, el término “o” es un operador “o” inclusivo y es equivalente al término “y/o” a menos que el contexto indique claramente lo contrario. La expresión “basado en” no es exclusiva y permite que esté basado en factores adicionales no descritos, a menos que el contexto indique claramente lo contrario. Además, a lo largo de la memoria descriptiva, el significado de “un”, “una” y “el” incluyen referencias en plural. El significado de “en” incluye “en” y “sobre”.

Como se usa en la presente descripción, un “ácido nucleico” o “molécula de ácido nucleico” generalmente se refiere a cualquier ácido ribonucleico o ácido desoxirribonucleico, que puede ser ADN o ARN no modificado o modificado. Los “ácidos nucleicos” incluyen, sin limitación, ácidos nucleicos monocatenarios y bicatenarios. Como se usa en la presente descripción, la expresión “ácido nucleico” también incluye ADN como se describe anteriormente que contiene una o más bases modificadas. Por lo tanto, el ADN con una cadena principal modificada por motivos de estabilidad o por otras razones es un “ácido nucleico”. La expresión “ácido nucleico”, tal como se utiliza en la presente descripción, abarca tales formas de ácidos nucleicos modificadas química, enzimática o metabólicamente, así como las formas químicas de ADN características de virus y células, incluidas, por ejemplo, células simples y complejas.

Los términos “oligonucleótido” o “polinucleótido” o “nucleótido” o “ácido nucleico” se refieren a una molécula que tiene dos o más desoxirribonucleótidos o ribonucleótidos, preferiblemente más de tres y normalmente más de diez. El tamaño exacto dependerá de muchos factores, que a su vez dependen de la función final o el uso del oligonucleótido. El oligonucleótido puede generarse de cualquier manera, incluida la síntesis química, la replicación del ADN, la transcripción inversa o una combinación de las mismas. Los desoxirribonucleótidos típicos del ADN son la timina, la adenina, la citosina y la guanina. Los ribonucleótidos típicos del ARN son uracilo, adenina, citosina y guanina.

Como se usa en la presente descripción, los términos “locus” o “región” de un ácido nucleico se refieren a una subregión de un ácido nucleico, por ejemplo, un gen en un cromosoma, un solo nucleótido, una isla de CpG, etc.

Los términos “complementario” y “complementariedad” se refieren a nucleótidos (p. ej., 1 nucleótido) o polinucleótidos (p. ej., una secuencia de nucleótidos) relacionados por las reglas de apareamiento de bases. Por ejemplo, la secuencia 5'-A-G-T-3' es complementaria a la secuencia 3-T-C-A-5'. La complementariedad puede ser “parcial”, en la que solo algunas de las bases de los ácidos nucleicos se emparejan según las reglas de emparejamiento de bases. O puede haber una complementariedad “completa” o “total” entre los ácidos nucleicos. El grado de complementariedad entre las cadenas de ácidos nucleicos afecta a la eficacia y a la fuerza de hibridación entre las cadenas de ácidos nucleicos. Esto es de particular importancia en las reacciones de amplificación y en los métodos de detección que dependen de la unión entre ácidos nucleicos.

El término “gen” se refiere a una secuencia de ácido nucleico (por ejemplo, ADN o ARN) que comprende secuencias codificantes necesarias para la producción de un ARN, o de un polipéptido o su precursor. Un polipéptido funcional puede estar codificado por una secuencia codificante de longitud completa o por cualquier parte de la secuencia codificante siempre que se conserven la actividad deseada o las propiedades funcionales (p. ej., actividad enzimática, unión de ligandos, transducción de señales, etc.) del polipéptido. El término “porción” cuando se usa en referencia a un gen se refiere a fragmentos de ese gen. Los fragmentos pueden variar en tamaño desde unos pocos nucleótidos hasta la secuencia completa del gen menos un nucleótido. Por lo tanto, “un nucleótido que comprende al menos una parte de un gen” puede comprender fragmentos del gen o el gen completo.

El término “gen” también abarca las regiones codificantes de un gen estructural e incluye secuencias ubicadas adyacentes a la región codificante en los extremos 5' y 3', por ejemplo, a una distancia de aproximadamente 1 kb en cada extremo, de modo que el gen corresponde a la longitud del ARNm de longitud completa (p. ej., que comprende secuencias codificantes, reguladoras, estructurales y otras). Las secuencias que están ubicadas en 5' de la región codificante y que están presentes en el ARNm se denominan secuencias 5' no traducidas. Las secuencias que están ubicadas en 3' o cadena abajo de la región codificante y que están presentes en el ARNm se denominan secuencias 3' no traducidas o 3' sin traducir. El término “gen” abarca tanto el ADNc como las formas genómicas de un gen. En algunos organismos (p. ej., eucariotas), una forma genómica o clon de un gen contiene la región codificante interrumpida con secuencias no codificantes denominadas “intrones” o “regiones intermedias” o “secuencias intermedias”. Los intrones son segmentos de un gen que se transcriben en ARN nuclear (ARNnh); los intrones pueden contener elementos reguladores como potenciadores. Los intrones se eliminan o “cortan” del transcrito nuclear o primario; por tanto, los intrones están ausentes en el transcrito de ARN mensajero (ARNm). El ARNm funciona durante la traducción para especificar la secuencia o el orden de los aminoácidos en un polipéptido naciente.

Además de contener intrones, las formas genómicas de un gen también pueden incluir secuencias ubicadas en los extremos 5' y 3' de las secuencias que están presentes en el transcrito de ARN. Estas secuencias se denominan secuencias o regiones “flanqueantes” (estas secuencias flanqueantes están ubicadas en 5' o 3' con respecto a las secuencias no traducidas presentes en el transcrito de ARNm). La región flanqueante 5' puede contener secuencias reguladoras tales como promotores y potenciadores que controlan o influyen en la transcripción del gen. La región flanqueante 3' puede contener secuencias que dirigen la terminación de la transcripción, la escisión postranscripcional y la poliadenilación.

La expresión “de tipo silvestre” cuando se emplea en referencia a un gen, se refiere a un gen que tiene las características de un gen aislado de una fuente natural. La expresión “de tipo silvestre” cuando se emplea en referencia a un producto génico, se refiere a un producto génico que tiene las características de un producto génico aislado de una fuente natural. El término “natural”, aplicado a un objeto se refiere al hecho de que un objeto se puede encontrar en la naturaleza. Por ejemplo, una secuencia polipeptídica o polinucleotídica que está presente en un organismo (incluidos los virus) que puede aislarse de una fuente en la naturaleza y que no ha sido modificada intencionalmente por la mano de una persona en el laboratorio es natural. Un gen de tipo silvestre es a menudo ese gen o alelo que se observa con mayor frecuencia en una población y, por lo tanto, se designa arbitrariamente como la forma “normal” o “de tipo silvestre” del gen. Por el contrario, el término “modificado” o “mutante” cuando se hace referencia a un gen o a un producto génico se refiere, respectivamente, a un gen o a un producto génico que presenta modificaciones en la secuencia y/o propiedades funcionales (p. ej., características alteradas) en comparación con el gen o el producto génico de tipo silvestre. Obsérvese que pueden aislarse mutantes de origen natural; estos se identifican por el hecho de que tienen características alteradas en comparación con el gen o el producto génico de tipo silvestre.

El término “alelo” se refiere a una variación de un gen; las variaciones incluyen, pero sin limitación, variantes y mutantes, locus polimórficos y locus polimórficos de un solo nucleótido, desplazamiento del marco de lectura y mutaciones de corte y empalme. Un alelo puede ocurrir naturalmente en una población o puede surgir durante la vida de cualquier individuo particular de la población.

Por tanto, los términos “variante” y “mutante”, cuando se usan en referencia a una secuencia de nucleótidos se refieren a una secuencia de ácido nucleico que difiere en uno o más nucleótidos de otra secuencia de ácido de nucleótido, generalmente relacionada. Una “variación” es una diferencia entre dos secuencias de nucleótidos diferentes; típicamente, una secuencia es una secuencia de referencia.

La “amplificación” es un caso especial de replicación de ácidos nucleicos que implica especificidad de la cadena molde. Debe contrastarse con la replicación de cadena molde no específica (por ejemplo, la replicación que depende de la cadena molde pero no depende de una cadena molde específica). La especificidad de la cadena molde se distingue aquí de la fidelidad de la replicación (por ejemplo, la síntesis de la secuencia de polinucleótidos adecuada) y la especificidad de los nucleótidos (ribonucleótidos o desoxirribonucleótidos). La especificidad de la cadena molde se describe frecuentemente en términos de especificidad del “objetivo”. Las secuencias diana son “dianas” en el sentido de que se busca separarlas de otros ácidos nucleicos. Las técnicas de amplificación se han diseñado principalmente para esta clasificación.

La amplificación de ácidos nucleicos generalmente se refiere a la producción de múltiples copias de un polinucleótido, o una porción del polinucleótido, típicamente a partir de una pequeña cantidad del polinucleótido (por ejemplo, una sola molécula de polinucleótido, de 10 a 100 copias de una molécula de polinucleótido, que pueden o no ser exactamente iguales), donde los productos de amplificación o amplicones son generalmente detectables. La amplificación de polinucleótidos abarca diversos procesos químicos y enzimáticos. La generación de múltiples copias de ADN a partir de una o unas pocas copias de una molécula o cadena molde de ADN diana durante una reacción en cadena de la polimerasa (PCR) o una reacción en cadena de la ligasa (LCR); véase, por ejemplo, la Patente de EE. UU. N.° 5.494.810) son formas de amplificación. Los tipos adicionales de amplificación incluyen, pero sin limitación, PCR específica de alelo (véase, por ejemplo, la Patente de EE. UU. N.° 5.639.611), ensamblaje de PCR (véase, por ejemplo, la Patente de EE. UU. N.° 5.965.408), amplificación dependiente de helicasa (véase, por ejemplo, la Patente de EE. UU. N.° 7.662.594), PCR de inicio en caliente (véanse, por ejemplo, las Patentes de EE. UU. N.° 5.773.258 y 5.338.671), PCR intersecuencial específica, PCR inversa (véase, por ejemplo, Triglia y col. (1988) Nucleic Acids Res., 16:8186), PCR mediada por ligamiento (véase, por ejemplo, Guilfoyle, R. y col., Nucleic Acids Research, 25:18541858 (1997); Patente de EE. UU. N.° 5.508.169), PCR específica de metilación (véase, por ejemplo, Hermán y col., (1996) PNAS 93(13) 9821-9826), PCR de minicebador, amplificación de sonda dependiente de ligadura multiplex (véase, por ejemplo, Schouten y col., (2002) Investigación de ácidos nucleicos 30(12): e57), PCR multiplex (véase, por ejemplo, Chamberlain y col., (1988) Nucleic Acids Research 16(23) 11141-11156; Ballabio y col., (1990) Human Genetics 84(6) 571-573; Hayden y col., (2008) BMC Genetics 9:80), PCR anidada, PCR de superposición-extensión (véase, por ejemplo, Higuchi y col., (1988) Investigación de ácidos nucleicos 16(15) 7351-7367), PCR en tiempo real (véase, por ejemplo, Higuchi y col., (1992) Biotechnology 10:413-417; Higuchi y col., (1993) Biotechnology 11:1026-1030), PCR de transcripción inversa (véase, por ejemplo, Bustin, SA (2000) J. Molecular Endocrinology 25:169-193), PCR en fase sólida, PCR termoasimétrica entrelazada y PCR Touchdown (véase, por ejemplo, Don y col., Nucleic Acids Research (1991) 19(14) 4008; Roux, K. (1994) Biotechniques 16(5) 812-814; Hecker y col., (1996) Biotechniques 20(3) 478-485). La amplificación de polinucleótidos también se puede lograr usando PCR digital (véase, por ejemplo, Kalinina y col., Nucleic Acids Research. 25; 1999-2004, (1997); Vogelstein y Kinzler, Proc Natl Acad Sci ^uS^a. 96; 9236-41, (1999); Publicación de Patente Internacional N.° WO05023091A2; Publicación de solicitud de patente de EE. UU. N.° 20070202525).

La expresión “reacción en cadena de la polimerasa” (“PCR”) se refiere al método de K.B. Mullis Patentes de EE. UU. N.° 4.683.195, 4.683.202, y 4.965.188, que describen un método para aumentar la concentración de un segmento de una secuencia diana en una mezcla de ADN genómico sin clonación o purificación. Este proceso de amplificación de la secuencia diana consiste en introducir un gran exceso de dos cebadores de oligonucleótidos en la mezcla de ADN que contiene la secuencia diana deseada, seguido de una secuencia precisa de ciclos térmicos en presencia de una ADN polimerasa. Los dos cebadores son complementarios a sus cadenas respectivas de la secuencia diana bicatenaria. Para efectuar la amplificación, la mezcla se desnaturaliza y los cebadores se hibridan posteriormente con sus secuencias complementarias dentro de la molécula diana. Después de la hibridación, se extienden los cebadores con una polimerasa a fin de formar un nuevo par de hebras complementarias. Las etapas de desnaturalización, hibridación del cebador y extensión con la polimerasa pueden repetirse muchas veces, es decir, la desnaturalización, la hibridación y la extensión constituyen un “ciclo”; puede haber numerosos “ciclos”) para obtener una alta concentración de un segmento amplificado de la secuencia diana deseada. La longitud del segmento amplificado de la secuencia diana deseada está determinada por las posiciones relativas de los cebadores entre sí y, por lo tanto, esta longitud es un parámetro controlable. Debido al aspecto repetitivo del proceso, el método se denomina “reacción en cadena de la polimerasa” (“PCR”). Debido a que los segmentos amplificados deseados de la secuencia diana se convierten en las secuencias predominantes (en términos de concentración) en la mezcla, se dice que están “amplificados por PCR” y son “productos de PCR” o “amplicones”.

La especificidad de la cadena molde se logra en la mayoría de las técnicas de amplificación mediante la elección de la enzima. Las enzimas de amplificación son enzimas que, en las condiciones en que se usan, procesarán solo secuencias específicas de ácido nucleico en una mezcla heterogénea de ácido nucleico. Por ejemplo, en el caso de la replicasa Q-beta, el ARN de MDV-1 es la plantilla específica para la replicasa (Kacian y col., Proc. Natl. Acad. Sci. USA, 69:3038 [1972]). Esta enzima de amplificación no replicará otros ácidos nucleicos. De manera similar, en el caso de la polimerasa de ARN T7, esta enzima de amplificación tiene una especificidad estricta para sus propios promotores (Chamberlin y col, Nature, 228:227 [1970]). En el caso de la ligasa de ADN T4, la enzima no ligará los dos oligonucleótidos o polinucleótidos, cuando haya una falta de coincidencia entre el sustrato del oligonucleótido o polinucleótido y la cadena molde en la unión de ligadura (Wu y Wallace (1989) Genomics 4:560). Finalmente, debido a su capacidad para funcionar a altas temperaturas, se observa que las ADN polimerasas termoestables dependientes de la cadena molde son capaces de mostrar una alta especificidad por las secuencias unidas y por tanto, definidas por los cebadores; la alta temperatura da como resultado condiciones termodinámicas que favorecen la hibridación del cebador con las secuencias diana y no la hibridación con secuencias no diana (HA Erlich (ed.), PCR Technology, Stockton Press [1989]).

Como se usa en la presente descripción, la expresión “ensayo de detección de ácido nucleico” se refiere a cualquier método para determinar la composición de nucleótidos de un ácido nucleico de interés. Los ensayos de detección de ácidos nucleicos incluyen, pero sin limitación, métodos de secuenciación de ADN, métodos de hibridación de sondas, ensayos de escisión específica de estructura (por ejemplo, el ensayo INVADER, Hologic, Inc.) y se describen, por ejemplo, en las Patentes de EE. UU. N.° 5.846.717, 5.985.557, 5.994.069, 6.001.567, 6.090.543, y 6.872.816; Lyamichev y col, Nat. Biotech., 17:292 (1999), Hall y col, PNAS, USA, 97:8272 (2000), y el documento US 2009/0253142); métodos de escisión de desajustes enzimáticos (p. ej., Variagenics, Patentes de EE. UU. N.° 6.110.684, 5.958.692, 5.851.770); reacción en cadena de la polimerasa; métodos de hibridación ramificados (p. ej., Chiron, Patentes de EE. UU. N.° 5.849.481, 5.710.264, 5.124.246, y 5.624.802); replicación en círculo rodante (p. ej., Patentes de EE. UU. N.° 6.210.884, 6.183.960 y 6.235.502); NASBA (p. ej., Patente de EE. UU. N.° 5.409.818); tecnología de baliza molecular (p. ej., Patente de Ee . UU. N.° 6.150.097); Tecnología de sensor electrónico (Motorola, Patentes de EE. UU. N.° 6.248.229, 6.221.583, 6.013.170, y 6.063.573); tecnología de sonda cíclica (p. ej., Patentes de EE. UU. N.° 5.403.711, 5.011.769 y 5.660.988); Métodos de amplificación de señales de Dade Behring (p. ej., Patentes de EE. UU. N.° 6.121.001, 6.110.677, 5.914.230, 5.882.867, y 5.792.614); reacción en cadena de la ligasa (p. ej., Barnay Proc. Natl. Acad. Sci USA 88, 189-93 (1991)); y métodos de hibridación en sándwich (p. ej., Patente de EE. UU. N.° 5.288.609).

La expresión “ácido nucleico amplificable” se refiere a un ácido nucleico que puede amplificarse mediante cualquier método de amplificación. Se contempla que el “ácido nucleico amplificable” comprenderá normalmente la “cadena molde de muestra”.

La expresión “cadena molde de muestra” se refiere a un ácido nucleico que procede de una muestra que se analiza en busca de la presencia de la “diana” (definida más adelante). Por el contrario, “cadena molde de fondo” se utiliza en referencia a un ácido nucleico distinto de la cadena molde de muestra que puede o no estar presente en una muestra. La cadena molde de fondo normalmente pasa desapercibida. Puede ser el resultado del arrastre o puede deberse a la presencia de contaminantes de ácido nucleico que se busca purificar fuera de la muestra. Por ejemplo, los ácidos nucleicos de organismos distintos de los que se van a detectar pueden estar presentes como fondo en una muestra de prueba.

El término “cebador” se refiere a un oligonucleótido, ya sea de forma natural como en un digerido de restricción purificado o producido sintéticamente, que es capaz de actuar como un punto de iniciación de la síntesis cuando se coloca en condiciones en las que la síntesis de un producto de extensión del cebador que es complementario a una hebra de ácido nucleico (p. ej., en presencia de nucleótidos y un agente inductor tal como una polimerasa de ADN ya una temperatura y un pH adecuados). El cebador es preferiblemente monocatenario para máxima eficiencia en la amplificación, pero como alternativa puede ser bicatenario. Si es bicatenario, el cebador se trata en primer lugar para separar sus hebras antes de usarse para preparar productos de extensión. Preferiblemente, el cebador es un oligodesoxirribonucleótido. El cebador debe ser lo suficientemente largo como para cebar la síntesis de los productos de extensión en presencia del agente inductor. Las longitudes exactas de los cebadores dependerán de muchos factores, incluida la temperatura, la fuente del cebador y el uso del método.

El término “sonda” se refiere a un oligonucleótido (p. ej., una secuencia de nucleótidos), ya sea de forma natural como en una digestión de restricción purificada o producida de forma sintética, recombinante o mediante amplificación por PCR, que es capaz de hibridarse con otro oligonucleótido de interés. Una sonda puede ser monocatenaria o bicatenaria. Las sondas son útiles en la detección, identificación y aislamiento de secuencias de genes particulares (p. ej., una “sonda de captura”). Se contempla que cualquier sonda utilizada en la presente invención pueda, en algunas realizaciones, marcarse con cualquier “molécula indicadora”, de modo que sea detectable en cualquier sistema de detección, incluidos, entre otros, enzimas (p. ej., ELISA, así como ensayos histoquímicos basados en enzimas), sistemas fluorescentes, radiactivos y luminiscentes. No se pretende que la presente invención se limite a ningún sistema de detección o etiqueta en particular.

Como se usa en la presente descripción, “metilación” se refiere a la metilación de citosina en las posiciones C5 o N4 de la citosina, la posición N6 de la adenina u otros tipos de metilación de ácidos nucleicos. El ADN amplificado in vitro generalmente no está metilado porque los métodos típicos de amplificación de ADN in vitro no conservan el patrón de metilación de la cadena molde de amplificación. Sin embargo, “ADN metilado” o “ADN no metilado” también pueden referirse a ADN amplificado cuya cadena molde original está metilada o no metilada, respectivamente.

Por consiguiente, como se usa en la presente descripción, un “nucleótido metilado” o una “base de nucleótido metilada” se refiere a la presencia de un resto de metilo en una base de nucleótido, en donde el resto de metilo no está presente en una base de nucleótido típica reconocida. Por ejemplo, la citosina no contiene un resto de metilo en su anillo de pirimidina, pero la 5-metilcitosina contiene un resto de metilo en la posición 5 de su anillo de pirimidina. Por lo tanto, la citosina no es un nucleótido metilado y la 5-metilcitosina es un nucleótido metilado. En otro ejemplo, la timina contiene un resto metilo en la posición 5 de su anillo de pirimidina; sin embargo, para los fines de la presente descripción, la timina no se considera un nucleótido metilado cuando está presente en el ADN, ya que la timina es una base nucleotídica típica del ADN.

Como se usa en la presente descripción, una “molécula de ácido nucleico metilado” se refiere a una molécula de ácido nucleico que contiene uno o más nucleótidos metilados.

Como se usa en la presente descripción, un “estado de metilación”, “perfil de metilación” y “estatus de metilación” de una molécula de ácido nucleico se refiere a la presencia o ausencia de una o más bases de nucleótido metiladas en la molécula de ácido nucleico. Por ejemplo, una molécula de ácido nucleico que contiene una citosina metilada se considera metilada (p. ej., el estado de metilación de la molécula de ácido nucleico está metilado). Una molécula de ácido nucleico que no contiene nucleótidos metilados se considera no metilada.

El estado de metilación de una secuencia de ácido nucleico en particular (p. ej., un marcador genético o región de ADN como se describe en la presente descripción) puede indicar el estado de metilación de cada base en la secuencia o puede indicar el estado de metilación de un subconjunto de bases (p. ej., de una o más citosinas) dentro de la secuencia, o puede indicar información sobre la densidad de metilación regional dentro de la secuencia proporcionando o sin proporcionar información precisa de las ubicaciones dentro de la secuencia en la que se produce la metilación.

El estado de metilación de un locus de nucleótido en una molécula de ácido nucleico se refiere a la presencia o ausencia de un nucleótido metilado en un locus particular en la molécula de ácido nucleico. Por ejemplo, el estado de metilación de una citosina en el 7° nucleótido de una molécula de ácido nucleico está metilado cuando el nucleótido presente en el 7° nucleótido de la molécula de ácido nucleico es 5-metilcitosina. De manera similar, el estado de mutilación de una citosina en el 7° nucleótido de una molécula de ácido nucleico no está metilado cuando el nucleótido presente en el 7° nucleótido de la molécula de ácido nucleico es citosina (y no 5-metilcitosina).

El estado de metilación se puede representar o indicar opcionalmente mediante un “valor de metilación” (p. ej., que representa una frecuencia, fracción, proporción, porcentaje, etc.). Se puede generar un valor de metilación, por ejemplo, cuantificando la cantidad de ácido nucleico intacto presente después de la digestión de restricción con una enzima de restricción dependiente de la metilación o comparando los perfiles de amplificación después de la reacción con bisulfito o comparando las secuencias de ácidos nucleicos tratados con bisulfito y no tratados. Por consiguiente, un valor, por ejemplo, un valor de metilación, representa el estado de metilación y, por lo tanto, puede usarse como un indicador cuantitativo del estado de metilación en múltiples copias de un locus. Esto es particularmente útil cuando se desea comparar el estado de metilación de una secuencia en una muestra con un umbral o valor de referencia.

Como se usa en la presente descripción, “frecuencia de metilación” o “porcentaje de metilación (%)” se refiere al número de casos en los que una molécula o locus está metilado en relación con el número de casos en que la molécula o el locus no está metilado.

Como tal, el estado de metilación describe el estado de metilación de un ácido nucleico (por ejemplo, una secuencia genómica). Además, el estado de metilación se refiere a las características de un segmento de ácido nucleico en un locus genómico particular relevante para la metilación. Dichas características incluyen, entre otras, si alguno de los restos de citosina (C) dentro de esta secuencia de ADN está metilado, la ubicación de los restos de C metilados, la frecuencia o el porcentaje de C metilado en cualquier región particular de un ácido nucleico y diferencias alélicas en la metilación debidas, por ejemplo, a diferencias en el origen de los alelos. Los términos “estado de metilación”, “perfil de metilación” y “estado de metilación” también se refieren a la concentración relativa, concentración absoluta o patrón de C metilado o C no metilado en cualquier región particular de un ácido nucleico en una muestra biológica. Por ejemplo, si los restos de citosina (C) dentro de una secuencia de ácido nucleico están metilados, se puede decir que están “hipermetilados” o que tienen “metilación aumentada”, mientras que si los restos de citosina (C) dentro de una secuencia de ADN no están metiladas, se puede denominar “hipometilada” o que tiene “metilación disminuida”. Asimismo, si los restos de citosina (C) dentro de una secuencia de ácido nucleico están metilados en comparación con otra secuencia de ácido nucleico (p. ej., de una región diferente o de un individuo diferente, etc.), esa secuencia se considera hipermetilada o con metilación aumentada en comparación con la otra secuencia de ácido nucleico. Como alternativa, si los restos de citosina (C) dentro de una secuencia de ADN no están metilados en comparación con otra secuencia de ácido nucleico (p. ej., de una región diferente o de un individuo diferente, etc.), esa secuencia se considera hipometilada o con metilación disminuida en comparación con la otra secuencia de ácido nucleico. Además, la expresión “patrón de metilación”, como se usa en la presente descripción, se refiere a los sitios colectivos de nucleótidos metilados y no metilados sobre una región de un ácido nucleico. Dos ácidos nucleicos pueden tener la misma o similar frecuencia de metilación o porcentaje de metilación pero tener diferentes patrones de metilación cuando el número de nucleótidos metilados y no metilados es el mismo o similar en toda la región pero las ubicaciones de los nucleótidos metilados y no metilados son diferentes. Se dice que las secuencias están “metiladas diferencialmente” o que tienen una “diferencia en la metilación” o que tienen un “estado de metilación diferente” cuando difieren en el grado (p. ej., una tiene una metilación aumentada o disminuida en relación con la otra), la frecuencia o el patrón de metilación. La expresión “metilación diferencial” se refiere a una diferencia en el nivel o patrón de metilación de ácidos nucleicos en una muestra positiva para cáncer en comparación con el nivel o patrón de metilación de ácidos nucleicos en una muestra negativa para cáncer. También puede referirse a la diferencia en niveles o patrones entre pacientes que tienen recurrencia del cáncer después de la cirugía frente a pacientes que no tienen recurrencia. La metilación diferencial y los niveles o patrones específicos de metilación del ADN son biomarcadores pronósticos y predictivos, por ejemplo, una vez que se han definido las características predictivas o de corte correctas.

La frecuencia del estado de metilación se puede utilizar para describir una población de individuos o una muestra de un solo individuo. Por ejemplo, un locus de nucleótido que tiene una frecuencia de estado de metilación del 50 % está metilado en el 50 % de los casos y no metilado en el 50 % de los casos. Dicha frecuencia se puede utilizar, por ejemplo, para describir el grado en que un locus de nucleótido o región de ácido nucleico está metilado en una población de individuos o una colección de ácidos nucleicos. Por lo tanto, cuando la metilación en una primera población o conjunto de moléculas de ácido nucleico es diferente de la metilación en una segunda población o conjunto de moléculas de ácido nucleico, la frecuencia del estado de metilación de la primera población o conjunto será diferente de la frecuencia del estado de metilación del segundo. población o piscina. Dicha frecuencia también puede utilizarse, por ejemplo, para describir el grado en que un locus de nucleótido o región de ácido nucleico está metilado en un solo individuo. Por ejemplo, dicha frecuencia se puede utilizar para describir el grado en que un grupo de células de una muestra de tejido está metilado o no metilado en un locus de nucleótido o región de ácido nucleico.

Como se usa en la presente descripción, un “ locus de nucleótidos” se refiere a la ubicación de un nucleótido en una molécula de ácido nucleico. Un locus de nucleótido de un nucleótido metilado se refiere a la ubicación de un nucleótido metilado en una molécula de ácido nucleico.

Típicamente, la metilación del ADN humano ocurre en una secuencia de dinucleótidos que incluye una guanina y una citosina adyacentes donde la citosina está ubicada en 5' de la guanina (también denominadas secuencias de dinucleótidos de CpG). La mayoría de las citosinas dentro de los dinucleótidos de CpG están metiladas en el genoma humano, sin embargo, algunas permanecen sin metilar en regiones genómicas ricas en dinucleótidos de CpG específicas, conocidas como islas de CpG (véase, por ejemplo, Antequera y col. (1990) Cell 62: 503-514).

Como se usa en la presente descripción, una “ isla de CpG” se refiere a una región de ADN genómico rica en G:C que contiene un número aumentado de dinucleótidos de CpG en relación con el ADN genómico total. Una isla de CpG puede tener al menos 100, 200 o más pares de bases de longitud, donde el contenido G:C de la región es al menos el 50 % y la relación entre la frecuencia de CpG observada y la frecuencia esperada es 0,6; en algunos casos, una isla de CpG puede tener al menos 500 pares de bases de longitud, donde el contenido G:C de la región es al menos el 55 %) y la relación entre la frecuencia de CpG observada y la frecuencia esperada es 0,65. La frecuencia de CpG observada sobre la frecuencia esperada se puede calcular según el método proporcionado en Gardiner-Garden y col. (1987) J. Mol. Biol. 196: 261-281. Por ejemplo, la frecuencia de CpG observada sobre la frecuencia esperada se puede calcular según la fórmula R = (A * B) / (C * D), donde R es la relación entre la frecuencia de CpG observada y la frecuencia esperada, A es el número de dinucleótidos de CpG en una secuencia analizada, B es el número total de nucleótidos en la secuencia analizada, C es el número total de nucleótidos C en la secuencia analizada y D es el número total de nucleótidos G en la secuencia analizada. El estado de metilación típicamente se determina en las islas de CpG, por ejemplo, en las regiones promotoras. Sin embargo, se apreciará que otras secuencias en el genoma humano son propensas a la metilación del ADN, como CpA y CpT (véase Ramsahoye (2000) Proc. Natl. Acad. Sci. USA 97: 5237-5242; Salmon y Kaye (1970) Biochim. Biophys. Acta. 204: 340-351; Grafstrom (1985) Nucleic Acids Res. 13: 2827-2842; Nyce (1986) Nucleic Acids Res. 14: 4353-4367; Woodcock (1987) Biochem. Biophys. Res. Commun. 145: 888-894).

Como se usa en la presente descripción, un reactivo que modifica un nucleótido de la molécula de ácido nucleico en función del estado de metilación de la molécula de ácido nucleico, o un reactivo específico de metilación, se refiere a un compuesto o composición u otro agente que puede cambiar la secuencia de nucleótidos. de una molécula de ácido nucleico de manera que refleje el estado de metilación de la molécula de ácido nucleico. Los métodos para tratar una molécula de ácido nucleico con dicho reactivo pueden incluir poner en contacto la molécula de ácido nucleico con el reactivo, junto con etapas adicionales, si se desea, para lograr el cambio deseado de secuencia de nucleótidos. Dicho cambio en la secuencia de nucleótidos de la molécula de ácido nucleico puede dar como resultado una molécula de ácido nucleico en la que cada nucleótido metilado se modifica en un nucleótido diferente. Dicho cambio en la secuencia de nucleótidos del ácido nucleico puede dar como resultado una molécula de ácido nucleico en la que cada nucleótido no metilado se modifica en un nucleótido diferente. Dicho cambio en la secuencia de nucleótidos del ácido nucleico puede dar como resultado una molécula de ácido nucleico en la que cada uno de los nucleótidos seleccionados que no está metilado (p. ej., cada citosina no metilada) se modifica en un nucleótido diferente. El uso de dicho reactivo para cambiar la secuencia de nucleótidos del ácido nucleico puede dar como resultado una molécula de ácido nucleico en la que cada nucleótido que es un nucleótido metilado (p. ej., cada citosina metilada) se modifica en un nucleótido diferente. Como se usa en la presente descripción, el uso de un reactivo que modifica un nucleótido seleccionado se refiere a un reactivo que modifica un nucleótido de los cuatro nucleótidos que ocurren típicamente en una molécula de ácido nucleico (C, G, T y A para ADN y C, G, U, y A para ARN), de modo que el reactivo modifica un nucleótido sin modificar los otros tres nucleótidos. En una realización ilustrativa, dicho reactivo modifica un nucleótido seleccionado no metilado para producir un nucleótido diferente. En otra realización ilustrativa, dicho reactivo puede desaminar nucleótidos de citosina no metilados. Un ejemplo de reactivo es bisulfito.

Como se usa en la presente descripción, la expresión “reactivo de bisulfito” se refiere a un reactivo que comprende en algunas realizaciones bisulfito, disulfito, sulfito de hidrógeno o combinaciones de los mismos para distinguir entre citidinas metiladas y no metiladas, por ejemplo, en secuencias de dinucleótidos de CpG.

La expresión “ensayo de metilación” se refiere a cualquier ensayo para determinar el estado de metilación de una o más secuencias de dinucleótidos de CpG dentro de una secuencia de un ácido nucleico.

El término “MS AP-PCR” (reacción en cadena de la polimerasa cebada arbitrariamente sensible a la metilación) se refiere a la tecnología reconocida en la técnica que permite un escaneo global del genoma utilizando cebadores ricos en CG para enfocarse en las regiones con mayor probabilidad de contener dinucleótidos de CpG, y descrita por Gonzalgo y col. (1997) Cancer Research 57: 594-599.

El término “MethyLight™” se refiere a la técnica de PCR en tiempo real basada en fluorescencia reconocida en la técnica descrita por Eads y col. (1999) Cancer Res. 59: 2302-2306.

El término “HeavyMethyl™” se refiere a un ensayo en donde las sondas de bloqueo específicas para la metilación (también denominadas en el presente documento bloqueantes) que cubren las posiciones de CpG entre o cubiertas por los cebadores de amplificación permiten la amplificación selectiva específica de metilación de una muestra de ácido nucleico.

La expresión ensayo “HeavyMethyl™ MethyLight™” se refiere a un ensayo HeavyMethyl™ MethyLight™, que es una variación del ensayo MethyLight™, en donde el ensayo MethyLight™ se combina con sondas de bloqueo específicas de metilación que cubren las posiciones de CpG entre los cebadores de amplificación.

El término “Ms-SNuPE” (extensión del cebador de un solo nucleótido sensible a la mutilación) se refiere al ensayo reconocido en la técnica descrito por Gonzalgo y Jones (1997) Nucleic Acids Res. 25: 2529-2531.

El término “MSP” (PCR específica de metilación) se refiere al ensayo de metilación reconocido en la técnica descrito por Herman y col. (1996) Proc. Natl. Acad. Sci. USA 93: 9821-9826, y en la Patente de EE. UU. N.° 5.786.146.

El término “COBRA” (análisis combinado de restricción de bisulfito) se refiere al ensayo de metilación reconocido en la técnica descrito por Xiong y Laird (1997) Nucleic Acids Res. 25: 2532-2534.

El término “MCA” (amplificación de islas de CpG) se refiere al ensayo de metilación descrito por Toyota y col. (1999) Cancer Res. 59: 2307-12, y en el documento WO 00/26401 A1.

Como se usa en la presente descripción, un “nucleótido seleccionado” se refiere a un nucleótido de los cuatro nucleótidos típicos en una molécula de ácido nucleico (C, G, T y A para ADN y C, G, U y A para ARN), y puede incluyen derivados metilados de los nucleótidos típicos (p. ej., cuando C es el nucleótido seleccionado, tanto C metilado como no metilado se incluyen en el significado de un nucleótido seleccionado), mientras que un nucleótido seleccionado metilado se refiere específicamente a un nucleótido típico metilado y un nucleótido no metilado se refiere específicamente a un nucleótido de aparición típica no metilado.

Las expresiones “enzima de restricción específica de metilación” o “enzima de restricción sensible a la metilación” se refieren a una enzima que digiere selectivamente un ácido nucleico dependiendo del estado de metilación de su sitio de reconocimiento. En el caso de una enzima de restricción que corta específicamente si el sitio de reconocimiento no está metilado o está hemimetilado, el corte no tendrá lugar o tendrá lugar con una eficiencia significativamente reducida si el sitio de reconocimiento está metilado. En el caso de una enzima de restricción que corta específicamente si el sitio de reconocimiento está metilado, el corte no tendrá lugar o tendrá lugar con una eficiencia significativamente reducida si el sitio de reconocimiento no está metilado. Se prefieren enzimas de restricción específicas de metilación, cuya secuencia de reconocimiento contiene un dinucleótido de CG (por ejemplo, una secuencia de reconocimiento tal como CGCG o CCCGGG). Además, para algunas realizaciones se prefieren enzimas de restricción que no cortan si la citosina en este dinucleótido está metilada en el átomo de carbono C5.

Tal como se usa en la presente descripción, un “nucleótido diferente” se refiere a un nucleótido que es químicamente diferente de un nucleótido seleccionado, típicamente de tal forma que el nucleótido diferente tiene propiedades de emparejamiento de bases de Watson-Crick que difieren del nucleótido seleccionado, por lo que el nucleótido que se presenta típicamente que es complementario al nucleótido seleccionado no es lo mismo que el nucleótido típico que es complementario al nucleótido diferente. Por ejemplo, cuando C es el nucleótido seleccionado, U o T pueden ser el nucleótido diferente, lo que se ejemplifica por la complementariedad de C con G y la complementariedad de U o T con A. Como se usa en la presente descripción, un nucleótido que es complementario al nucleótido seleccionado o que es complementario al nucleótido diferente se refiere a un nucleótido que forma pares de bases, en condiciones de alta rigurosidad, con el nucleótido seleccionado o con un nucleótido diferente con mayor afinidad que la unión de bases del nucleótido complementario con tres de los cuatro nucleótidos típicos. Un ejemplo de complementariedad es el apareamiento de bases de Watson-Crick en el ADN (p. ej., A-T y C-G) y el ARN (p. ej., A-U y C-G). Por tanto, por ejemplo, G forma un emparejamiento de bases, en condiciones de alta rigurosidad, con mayor afinidad a C que el emparejamiento de bases de G con G, A o T y por tanto, cuando C es el nucleótido seleccionado, G es un nucleótido complementario al nucleótido seleccionado.

Como se usa en la presente descripción, la “sensibilidad” de un marcador dado se refiere al porcentaje de muestras que informan un valor de metilación del ADN por encima de un valor umbral que distingue entre muestras neoplásicas y no neoplásicas. En algunas realizaciones, un positivo se define como una neoplasia confirmada por histología que informa un valor de metilación del ADN por encima de un valor umbral (por ejemplo, el intervalo asociado con la enfermedad), y un falso negativo se define como una neoplasia confirmada por histología que informa un valor de metilación del ADN por debajo del valor umbral (por ejemplo, el intervalo asociado con la ausencia de enfermedad). El valor de la sensibilidad, por lo tanto, refleja la probabilidad de que una medida de metilación del ADN para un marcador dado obtenido de una muestra de enfermedad conocida esté en el intervalo de medidas asociadas a la enfermedad. Como se define en la presente descripción, la relevancia clínica del valor de sensibilidad calculado representa una estimación de la probabilidad de que un marcador dado pueda detectar la presencia de una afección clínica cuando se aplica a un sujeto con dicha afección.

Como se usa en la presente descripción, la “especificidad” de un marcador dado se refiere al porcentaje de muestras no neoplásicas que informan un valor de metilación del ADN por debajo de un valor umbral que distingue entre muestras neoplásicas y no neoplásicas. En algunas realizaciones, un negativo se define como una muestra no neoplásica confirmada por histología que informa un valor de metilación del ADN por debajo del valor umbral (p. ej., el intervalo asociado con ausencia de enfermedad) y un falso positivo se define como una muestra no neoplásica confirmada por histología que informa un valor de metilación del ADN por encima del valor umbral (p. ej., el intervalo asociado con la enfermedad). El valor de especificidad, por lo tanto, refleja la probabilidad de que una medida de metilación del ADN para un marcador dado obtenido de una muestra no neoplásica conocida esté en el intervalo de medidas no asociadas a enfermedades. Como se define en la presente descripción, la relevancia clínica del valor de especificidad calculado representa una estimación de la probabilidad de que un marcador determinado pueda detectar la ausencia de una afección clínica cuando se aplica a un paciente sin dicha afección.

El término “ABC”, como se usa en la presente descripción, es una abreviatura de “área bajo la curva”. Concretamente, se refiere al área bajo una curva de características operativas del receptor (ROC). La curva ROC es una gráfica de la tasa de verdaderos positivos frente a la tasa de falsos positivos para los diferentes puntos de corte posibles de una prueba de diagnóstico. Muestra el compromiso entre sensibilidad y especificidad según el punto de corte seleccionado (cualquier aumento de la sensibilidad irá acompañado de una disminución de la especificidad). El área bajo una curva ROC (ABC) es una medida de la precisión de una prueba de diagnóstico (cuanto mayor sea el área, mejor; el valor óptimo es 1; una prueba aleatoria tendría una curva ROC en diagonal con un área de 0,5; por referencia: J. P. Egan. (1975) Signal Detection Theory and ROC Analysis, Academic Press, Nueva York).

Como se usa en la presente descripción, el término “neoplasia” se refiere a “una masa anormal de tejido, cuyo crecimiento excede y no está coordinado con el de los tejidos normales”. Véase, por ejemplo, Willis RA, “The Spread of Tumors in the Human Body”, Londres, Butterworth & Co, 1952.

Como se usa en la presente descripción, el término “adenoma” se refiere a un tumor benigno de origen glandular. Aunque estos crecimientos son benignos, con el tiempo pueden progresar y volverse malignos.

El término “precanceroso” o “preneoplásico” y sus equivalentes se refieren a cualquier trastorno proliferativo celular que esté experimentando una transformación maligna.

Un “sitio” de una neoplasia, adenoma, cáncer, etc. es el tejido, órgano, tipo de célula, área anatómica, parte del cuerpo, etc. en el cuerpo de un sujeto donde se localiza la neoplasia, adenoma, cáncer, etc.

Como se usa en la presente descripción, una aplicación de prueba de “diagnóstico” incluye la detectar o identificar una patología o afección en un sujeto, determinar la probabilidad de que un sujeto contraerá una determinada enfermedad o afección, determinar la probabilidad de que un sujeto con una enfermedad o afección responderá a la terapia, determinar el pronóstico de un sujeto con una enfermedad o afección (o su probable progresión o regresión), y determinar el efecto de un tratamiento en un sujeto con una enfermedad o afección. Por ejemplo, se puede usar un diagnósti

El término “marcador”, como se usa en la presente descripción, se refiere a una sustancia (por ejemplo, un ácido nucleico o una región de un ácido nucleico) que es capaz de diagnosticar un cáncer al distinguir las células cancerosas de las células normales, por ejemplo, en función de su estado de metilación.

El término “aislado” cuando se usa en relación con un ácido nucleico, como en “un oligonucleótido aislado” se refiere a una secuencia de ácido nucleico que se identifica y separa de al menos un ácido nucleico contaminante con el que normalmente se asocia en su fuente natural. El ácido nucleico aislado está presente en una forma o configuración que es diferente de aquella en la que se encuentra en la naturaleza. Por el contrario, los ácidos nucleicos no aislados, como el ADN y el ARN, se encuentran en el estado en que existen en la naturaleza. Los ejemplos de ácidos nucleicos no aislados incluyen: una secuencia de ADN dada (p. ej., un gen) que se encuentra en el cromosoma de la célula hospedadora en la proximidad de los genes vecinos; las secuencias de ARN, como una secuencia de ARNm específica que codifica una proteína específica, se encuentran en la célula como una mezcla con muchos otros ARNm que codifican una multitud de proteínas. Sin embargo, el ácido nucleico aislado que codifica una proteína particular incluye, a modo de ejemplo, dicho ácido nucleico en células que normalmente expresan la proteína, donde el ácido nucleico se encuentra en una ubicación cromosómica diferente a la de las células naturales, o está flanqueado por una secuencia de ácido nucleico diferente que la que se encuentra en la naturaleza. El ácido nucleico u oligonucleótido aislado puede estar presente en forma monocatenaria o bicatenaria. Cuando se va a utilizar un ácido nucleico u oligonucleótido aislado para expresar una proteína, el oligonucleótido contendrá como mínimo la cadena codificante o con sentido (es decir, el oligonucleótido puede ser monocatenario), pero puede contener tanto la cadena con sentido como la antisentido (es decir, el oligonucleótido puede ser bicatenario). Un ácido nucleico aislado puede, después del aislamiento de su entorno natural o típico, combinarse con otros ácidos nucleicos o moléculas. Por ejemplo, un ácido nucleico aislado puede estar presente en una célula hospedadora en la que se ha colocado, por ejemplo, para la expresión heteróloga.

El término “purificado” se refiere a moléculas, ya sean secuencias de ácidos nucleicos o de aminoácidos que se extraen, se aíslan o se separan de su entorno natural. Por lo tanto, una “secuencia de ácido nucleico aislada” puede ser una secuencia de ácido nucleico purificada. Las moléculas “sustancialmente purificadas” están libres al menos en un 60 %, preferiblemente al menos en un 75 % y más preferiblemente en al menos un 90 % de otros componentes con los que están asociadas de forma natural. Como se usa en la presente descripción, los términos “purificado” o “para purificar” también se refieren a la eliminación de contaminantes de una muestra. La eliminación de proteínas contaminantes da como resultado un aumento en el porcentaje de polipéptido o ácido nucleico de interés en la muestra.

En otro ejemplo, los polipéptidos recombinantes se expresan en células hospedadoras de plantas, bacterias, levaduras o mamíferos y los polipéptidos se purifican mediante la eliminación de proteínas de células hospedadoras; el porcentaje de polipéptidos recombinantes aumenta de ese modo en la muestra.

La expresión “composición que comprende” una secuencia polinucleotídica o polipéptido dado se refiere, en términos generales, a cualquier composición que contenga la secuencia polinucleotídica o el polipéptido dado. La composición puede comprender una solución acuosa que contenga sales (p. ej., NaCl), detergentes (p. ej., SDS) y otros componentes (p. ej., solución de Denhardt, leche en polvo, ADN de esperma de salmón, etc.).

El término “muestra” se utiliza en su sentido más amplio. En cierto sentido, puede referirse a una célula o tejido animal. En otro sentido, se entiende que incluye un espécimen o cultivo obtenido de cualquier fuente, así como muestras biológicas y ambientales. Las muestras biológicas se pueden obtener de plantas o animales (incluidos los humanos) y abarcan fluidos, sólidos, tejidos y gases. Las muestras ambientales incluyen material ambiental como materia superficial, suelo, agua y muestras industriales. Estos ejemplos no deben interpretarse como limitantes de los tipos de muestras aplicables a la presente invención.

Como se usa en la presente descripción, una “muestra remota”, como se usa en algunos contextos, se refiere a una muestra recolectada indirectamente de un sitio que no es la fuente de células, tejidos u órganos de la muestra. Por ejemplo, cuando el material de la muestra que se origina en el páncreas se evalúa en una muestra de heces (p. ej., no de una muestra tomada directamente del páncreas), la muestra es una muestra remota.

Como se usa en la presente descripción, los términos “paciente” o “sujeto” se refieren a organismos que se someterán a diversas pruebas proporcionadas por la tecnología. El término “sujeto” incluye animales, preferiblemente mamíferos, incluidos los seres humanos. En una realización preferida, el sujeto es un primate. En una realización aún más preferida, el sujeto es un ser humano.

Como se usa en la presente descripción, el término “kit” se refiere a cualquier sistema de administración para administrar materiales. En el contexto de los ensayos de reacción, dichos sistemas de administración incluyen sistemas que permiten el almacenamiento, transporte o administración de reactivos de reacción (p. ej., oligonucleótidos, enzimas, etc. en los contenedores apropiados) y/o materiales de apoyo (p. ej., tampones, instrucciones para realizar el ensayo, etc.) de un lugar a otro. Por ejemplo, los kits incluyen uno o más recintos (p. ej., cajas) que contienen los reactivos de reacción relevantes y/o los materiales de apoyo. Como se usa en la presente descripción, el término “kit fragmentado” se refiere a sistemas de administración que comprenden dos o más contenedores separados, cada uno de los cuales contiene una subporción de los componentes totales del kit. Los contenedores se pueden entregar al destinatario previsto juntos o por separado. Por ejemplo, un primer contenedor puede contener una enzima para usar en un ensayo, mientras que un segundo contenedor contiene oligonucleótidos. La expresión “kit fragmentado” pretende abarcar kits que contienen reactivos específicos de analitos (ASR) regulados por la sección 520(e) de la Ley Federal de Alimentos, Medicamentos y Cosméticos, pero no se limita los mismos. De hecho, cualquier sistema de administración que comprenda dos o más contenedores separados, cada uno de los cuales contiene una subporción de los componentes totales del kit, se incluye en la expresión “kit fragmentado”. Por el contrario, un “kit combinado” se refiere a un sistema de administración que contiene todos los componentes de un ensayo de reacción en un solo contenedor (p. ej., en una sola caja que contiene cada uno de los componentes deseados). El término “kit” incluye tanto kits fragmentados como combinados.

Realizaciones de la tecnología

En la presente descripción se proporciona tecnología para marcadores de detección de cáncer de páncreas y otros marcadores de detección de cáncer gastrointestinal que proporcionan una alta relación señal/ruido y un bajo nivel de fondo cuando se detectan a partir de muestras tomadas de un sujeto (p. ej., muestra de heces). Los marcadores se identificaron en un estudio de casos y controles al comparar el estado de metilación de los marcadores de ADN de tumores de sujetos con cáncer de páncreas en estadio I y estadio II con el estado de metilación de los mismos marcadores de ADN de sujetos de control (p. ej., tejido normal, tal como colon normal y/o páncreas no neoplásico) (véanse los ejemplos 1 y 11).

Además, la descripción proporciona varios paneles de marcadores, por ejemplo, en algunos aspectos, el marcador comprende una región cromosómica que tiene una anotación que es ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12.133, CLEC11A, ELMO1, EOMES, GJC1, IHIF1, IKZF1, KCNK12, KCNN₂, NDRG4, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1 o ZNF71, y que comprende el marcador (véanse las tablas 1 y 9). Además, los aspectos proporcionan un método para analizar una DMR de la tabla 1 que es la DMR N.° 11, 14, 15, 65, 21, 22, 23, 5, 29, 30, 38, 39, 41, 50, 51, 55, 57, 60, 61, 8, 75, 81, 82, 84, 87, 93, 94, 98, 99, 103, 104 o 107 y/o una DMR correspondiente a Chr16:58497395-58497458. Algunos aspectos permiten determinar el estado de metilación de un marcador, en donde una región cromosómica que tiene una anotación que es CLEC11A, C13ORF18, KCNN2, ABCB1, SLC38A3, CD1D, IKZF1, ADCY1, CHR12133, RSPO₃, MBP3, PRKCB, NDRG4, ELMO o TWIST1 comprende el marcador. En algunos aspectos, los métodos comprenden determinar el estado de metilación de dos marcadores, por ejemplo, un par de marcadores proporcionados en una fila de la tabla 5.

Aunque la descripción en la presente descripción se refiere a ciertas realizaciones ilustradas, debe entenderse que estas realizaciones se presentan a modo de ejemplo y no a modo de limitación.

En aspectos particulares, la presente tecnología proporciona composiciones y métodos para identificar, determinar y/o clasificar un cáncer tal como cáncer en la porción alta del tubo digestivo (p. ej., cáncer de esófago, páncreas, estómago) o cáncer en la porción baja del tubo digestivo (p. ej., adenoma, cáncer colorrectal). En aspectos relacionados, la tecnología proporciona composiciones y métodos para identificar, predecir y/o detectar el sitio de un cáncer. Los métodos comprenden determinar el estado de metilación de al menos un marcador de metilación en una muestra biológica aislada de un sujeto, en donde un cambio en el estado de metilación del marcador es indicativo de la presencia, clase o sitio de un cáncer. Los aspectos particulares se relacionan con marcadores que comprenden una región metilada diferencialmente (DMR, por ejemplo, DMR 1-107, consulte la tabla 1, por ejemplo, DMR 1-449, consulte la tabla 10) que se utilizan para el diagnóstico (por ejemplo, detección) de trastornos proliferativos celulares neoplásicos. (p. ej., cáncer), incluida la detección temprana durante las etapas precancerosas de la enfermedad y la predicción de un sitio de neoplasia (p. ej., discriminando entre tipos de cáncer, p. ej., cánceres de la porción alta del tubo digestivo y cánceres de la porción baja del tubo digestivo). Además, los marcadores se utilizan para diferenciar las neoplasias de los trastornos proliferativos celulares benignos. En aspectos particulares, la presente tecnología describe un método en donde un trastorno proliferativo de células neoplásicas se distingue de un trastorno proliferativo de células benignas.

Los marcadores de la presente tecnología son particularmente eficaces para detectar o distinguir entre trastornos proliferativos colorrectales y pancreáticos, proporcionando así medios mejorados para la detección temprana, la clasificación y el tratamiento de dichos trastornos.

Además de los aspectos en donde el análisis de metilación de al menos un marcador, una región de un marcador o una base de un marcador que comprende una DMR (p. ej., DMR 1-107 de la tabla 1) (p. ej., DMR 1-449 de la tabla 10) proporcionada en la presente descripción y enumerada en la tabla 1 o 10, la tecnología también proporciona paneles de marcadores que comprenden al menos un marcador, región de un marcador o base de un marcador que comprende una DMR con utilidad para la detección de cánceres, en particular colorrectal, cáncer de páncreas y otros cánceres de la porción alta y baja del tubo digestivo.

Algunas realizaciones de la tecnología se basan en el análisis del estado de metilación de CpG de al menos un marcador, región de un marcador o base de un marcador que comprende una DMR.

En algunas realizaciones, la presente tecnología proporciona el uso de la técnica de bisulfito en combinación con uno o más ensayos de metilación para determinar el estado de metilación de las secuencias de dinucleótidos de CpG dentro de al menos un marcador que comprende una DMR (por ejemplo, como se proporciona en la tabla 1 (por ejemplo, DMR 1-107)) (p. ej., como se indica en la tabla 10 (p. ej., d Mr 1-449)). Los dinucleótidos de CpG genómicos pueden estar metilados o no metilados (conocidos como alternativa como hiper e hipometilados, respectivamente).

Sin embargo, los métodos de la presente invención son adecuados para el análisis de muestras biológicas de naturaleza heterogénea, por ejemplo, una baja concentración de células tumorales, o materiales biológicos de las mismas, dentro de un fondo de una muestra remota (por ejemplo, sangre, efluentes de órganos o heces). Por consiguiente, cuando se analiza el estado de metilación de una posición de CpG dentro de dicha muestra, se puede usar un ensayo cuantitativo para determinar el nivel (por ejemplo, porcentaje, fracción, relación, proporción o grado) de metilación en una posición de CpG particular.

Según la tecnología actual, la determinación del estado de metilación de secuencias de dinucleótidos de CpG en marcadores que comprenden una DMR tiene utilidad tanto en el diagnóstico como en la caracterización de cánceres como el cáncer en la porción alta del tubo digestivo (p. ej., cáncer de esófago, páncreas, estómago) o cáncer en la porción baja del tubo digestivo (por ejemplo, adenoma, cáncer colorrectal).

Combinaciones de marcadores

En algunos aspectos de la divulgación, la tecnología se relaciona con la evaluación del estado de metilación de combinaciones de marcadores que comprenden una DMR de la tabla 1 (p. ej., 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 27, 29, 30) o la tabla 10 (por ejemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 27, 29, 30), o más marcadores que comprenden una DMR. Según la invención, la tecnología se relaciona con la evaluación del estado de metilación de DMR 64 y DMR 418 o 419. En algunas realizaciones, evaluar el estado de metilación de más de un marcador aumenta la especificidad y/o la sensibilidad de una pantalla o diagnóstico para identificar una neoplasia en un sujeto, por ejemplo, un cáncer en la porción alta del tubo digestivo (por ejemplo, esófago, páncreas, estómago) o un cáncer en la porción baja del tubo digestivo (p. ej., adenoma, colorrectal). En algunas realizaciones, un marcador o una combinación de marcadores discrimina entre tipos y/o ubicaciones de una neoplasia. Por ejemplo, las combinaciones de marcadores discriminan neoplasia esofágica, neoplasia estomacal, neoplasia pancreática, neoplasia colorrectal y adenomas entre sí, de otras neoplasias y/o de tejido normal (por ejemplo, no canceroso, no precanceroso).

Diversos tipos de cáncer se predicen mediante diversas combinaciones de marcadores, por ejemplo, identificados mediante técnicas estadísticas relacionadas con la especificidad y la sensibilidad de la predicción. La tecnología proporciona métodos para identificar combinaciones predictivas y combinaciones predictivas validadas para algunos tipos de cáncer.

En algunas realizaciones, las combinaciones de marcadores (p. ej., que comprenden una DMR) predicen el sitio de una neoplasia. Por ejemplo, durante el desarrollo de la tecnología descrita en la presente descripción, se realizaron análisis estadísticos para validar la sensibilidad y especificidad de las combinaciones de marcadores. Por ejemplo, los pares de marcadores predijeron con precisión el sitio del tumor en >90 % de las muestras, los 17 pares de marcadores principales predijeron con precisión el sitio del tumor en >80 % de las muestras y los 49 pares de marcadores principales predijeron con precisión el sitio del tumor en el 70 % de las muestras.

Métodos para analizar el estado de metilación

El método utilizado con mayor frecuencia para analizar un ácido nucleico en busca de 5-metilcitosina se basa en el método del bisulfito descrito por Frommer y col. para la detección de 5-metilcitosinas en el ADN (Frommer y col. (1992) Proc. Natl. Acad. Sci. USA 89: 1827-31) o variaciones del mismo. El método del bisulfito para cartografiar las 5-metilcitosinas se basa en la observación de que la citosina, pero no la 5-metilcitosina, reacciona con el ion sulfito de hidrógeno (también conocido como bisulfito). La reacción generalmente se realiza según las siguientes etapas: en primer lugar, la citosina reacciona con el sulfito de hidrógeno para formar una citosina sulfonada. A continuación, la desaminación espontánea del intermedio de reacción sulfonado da como resultado un uracilo sulfonado. Finalmente, el uracilo sulfonado se desulfona en condiciones alcalinas para formar uracilo. La detección es posible porque el uracilo forma pares de bases con la adenina (por lo que se comporta como la timina), mientras que la 5-metilcitosina se empareja con la guanina (por lo que se comporta como la citosina). Esto hace posible la discriminación de citosinas metiladas de citosinas no metiladas, por ejemplo, secuenciación genómica de bisulfito (Grigg G y Clark S, Bioessays (1994) 16: 431-36; Grigg G, DNA Seq. (1996) 6: 189-98) o PCR específica de metilación (MSP) como se describe, por ejemplo, en la Patente de EE. UU. N.° 5.786.146.

Algunas tecnologías convencionales están relacionadas con métodos que consisten en encerrar el ADN a analizar en una matriz de agarosa, impidiendo así la difusión y renaturalización del ADN (el bisulfito solo reacciona con el ADN monocatenario), y reemplazando las etapas de precipitación y purificación por una diálisis rápida (Olek A y col. (1996) “A modified and improved method for bisulfite based cytosine methylation analysis” Nucleic Acids Res. 24: 5064-6). Por lo tanto, es posible analizar el estado de metilación de las células individuales, lo que ilustra la utilidad y la sensibilidad del método. Se proporciona una descripción general de los métodos convencionales para detectar la 5-metilcitosina en Rein, T., y col. (1998) Nucleic Acids Res. 26: 2255.

La técnica del bisulfito típicamente implica la amplificación de fragmentos cortos y específicos de un ácido nucleico conocido después de un tratamiento con bisulfito y posteriormente analizar el producto mediante secuenciación (Olek y Walter (1997) Nat. Genet. 17: 275-6) o una reacción de extensión del cebador (Gonzalgo y Jones (1997) Nucleic Acids Res. 25: 2529-31; documento WO 95/00669; Patente de EE. UU. N.° 6.251.594) para analizar posiciones individuales de citosina. Algunos métodos utilizan la digestión enzimática (Xiong y Laird (1997) Nucleic Acids Res. 25: 2532-4). La detección por hibridación también se ha descrito en la técnica (Olek y col, documento WO 99/28498). Además, se ha descrito el uso de la técnica de bisulfito para la detección de metilación con respecto a genes individuales (Grigg y Clark (1994) Bioessays 16: 431-6; Zeschnigk y col. (1997) Hum Mol Genet. 6: 387-95; Feil y col. (1994) Nucleic Acids Res. 22: 695; Martin y col. (1995) Gene 157: 261-4; documento WO 9746705; documento WO 9515373).

Se conocen en la técnica varios procedimientos de ensayo de metilación y se pueden usar junto con el tratamiento con bisulfito según la presente tecnología. Estos ensayos permiten la determinación del estado de metilación de uno o una pluralidad de dinucleótidos de CpG (por ejemplo, islas de CpG) dentro de una secuencia de ácido nucleico. Dichos ensayos implican, entre otras técnicas, secuenciación de ácido nucleico tratado con bisulfito, PCR (para amplificación específica de secuencia), análisis de transferencia de Southern y uso de enzimas de restricción sensibles a la metilación.

Por ejemplo, la secuenciación genómica se ha simplificado para el análisis de patrones de metilación y distribuciones de 5-metilcitosina mediante el uso de tratamiento con bisulfito (Frommer y col. (1992) Proc. Natl. Acad. Sci. USA 89: 1827-1831). Además, la digestión con enzimas de restricción de productos de PCR amplificados a partir de ADN convertido con bisulfito encuentra uso para evaluar el estado de metilación, por ejemplo, como se describe en Sadri y Hornsby (1997) Nucl. Acids Res. 24: 5058-5059 o como se incorpora en el método conocido como COBRA (análisis combinado de restricción de bisulfito) (Xiong y Laird (1997) Nucleic Acids Res. 25: 2532-2534).

COBRA™ es un ensayo de metilación cuantitativo útil para determinar los niveles de metilación del ADN en locus específicos en pequeñas cantidades de ADN genómico (Xiong y Laird, Nucleic Acids Res. 25:2532-2534, 1997). Brevemente, la digestión con enzimas de restricción se usa para revelar diferencias de secuencia dependientes de la metilación en productos de PCR de ADN tratado con bisulfito de sodio. Las diferencias de secuencia dependientes de la metilación se introducen primero en el ADN genómico mediante un tratamiento estándar con bisulfito según el procedimiento descrito por Frommer y col. (Proc. Natl. Acad. Sci. USA 89:1827-1831, 1992). A continuación, se realiza la amplificación por PCR del ADN convertido con bisulfito usando cebadores específicos para las islas de CpG de interés, seguida de digestión con endonucleasas de restricción, electroforesis en gel y detección usando sondas de hibridación marcadas y específicas. Los niveles de metilación en la muestra de ADN original están representados por las cantidades relativas de producto de PCR digerido y no digerido de forma cuantitativa lineal en un amplio espectro de niveles de metilación del ADN. Además, esta técnica se puede aplicar de forma fiable al ADN obtenido a partir de muestras de tejido embebido en parafina microdiseccionado.

Los reactivos típicos (p. ej., como se pueden encontrar en un kit basado en COBRA™ típico) para el análisis COBRA™ pueden incluir, pero sin limitación: cebadores de PCR para locus específicos (por ejemplo, genes específicos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla de CpG, etc.); enzima de restricción y tampón adecuado; oligonucleótido de hibridación génica; oligonucleótido de hibridación de control; kit de marcaje de cinasa para sonda de oligonucleótidos; y nucleótidos marcados. Además, los reactivos de conversión de bisulfito pueden incluir: tampón de desnaturalización de ADN; tampón de sulfonación; reactivos o kits de recuperación de ^aDⁿ(p. ej., precipitación, ultrafiltración, columna de afinidad); tampón de desulfonación; y componentes de recuperación de ADN.

Preferiblemente, los ensayos como “MethyLight™” (una técnica de PCR en tiempo real basada en fluorescencia) (Eads y col, Cancer Res. 59:2302-2306, 1999), las reacciones Sra-SNuPE™ (extensión del cebador de nucleótido único sensible a la metilación) (Gonzalgo y Jones, Nucleic Acids Res. 25:2529-2531, 1997), PCR específica de metilación (“MSP”; Herman y col., Proc. Natl. Acad. Sci. USA 93:9821-9826, 1996; Patente de EE. UU. N.° 5.786.146), y amplificación de islas de CpG metiladas (“MCA”; Toyota y col., Cancer Res. 59:2307-12, 1999) se utilizan solos o en combinación con uno o más de estos métodos.

La técnica de ensayo “HeavyMethyl™” es un método cuantitativo para evaluar las diferencias de metilación según la amplificación específica de metilación del ADN tratado con bisulfito. Las sondas de bloqueo específicas de metilación (“bloqueadores”) que cubren las posiciones de CpG entre los cebadores de amplificación o están cubiertas por ellos permiten la amplificación selectiva específica de la metilación de una muestra de ácido nucleico.

La expresión ensayo “HeavyMethyl™ MethyLight™” se refiere a un ensayo HeavyMethyl™ MethyLight™, que es una variación del ensayo MethyLight™, en donde el ensayo MethyLight™ se combina con sondas de bloqueo específicas de metilación que cubren las posiciones de CpG entre los cebadores de amplificación. El ensayo HeavyMethyl™ también puede utilizarse combinado con cebadores de amplificación específicos de metilación.

Los reactivos típicos (p. ej., como se pueden encontrar en un kit basado en MethyLight™ típico) para el análisis HeavyMethyl™ pueden incluir, pero sin limitación: cebadores de PCR para locus específicos (por ejemplo, genes específicos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla de CpG o secuencia de ADN tratada con bisulfito o isla de CpG, etc.); oligonucleótidos bloqueantes; tampones de PCR optimizados y desoxinucleótidos; y Taq polimerasa.

La MSP (PCR específica de mutilación) permite evaluar el estado de mutilación de prácticamente cualquier grupo de sitios de CpG dentro de una isla de CpG, independientemente del uso de enzimas de restricción sensibles a la metilación (Herman y col. Proc. Natl. Acad. Sci. USA 93:9821-9826, 1996; Patente de EE. UU. N.° 5.786.146). Brevemente, el ADN se modifica con bisulfito de sodio, que convierte las citosinas no metiladas, pero no a las metiladas, en uracilo, y los productos se amplifican posteriormente con cebadores específicos para ADN metilado frente a no metilado. MSP requiere solo pequeñas cantidades de ADN, es sensible al 0,1 % de alelos metilados de un locus de isla de CpG determinado y se puede realizar en ADN extraído de muestras embebidas en parafina. Los reactivos típicos (p. ej., como se pueden encontrar en un kit típico basado en MSP) para el análisis de MSP pueden incluir, entre otros: cebadores de PCR metilados y no metilados para locus específicos (por ejemplo, genes específicos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla de CpG, etc.); tampones de PCR y desoxinucleótidos optimizados, y sondas específicas.

El ensayo MethyLight™ es un ensayo de metilación cuantitativo de alto rendimiento que utiliza PCR en tiempo real basada en fluorescencia (p. ej., TaqMan®) que no requiere manipulaciones adicionales tras la etapa de PCR (Eads y col, Cancer Res. 59:2302-2306, 1999). Brevemente, el proceso de MethyLight™ comienza con una muestra mixta de ADN genómico que se convierte, en una reacción de bisulfito de sodio, en un grupo mixto de diferencias de secuencia dependientes de la metilación según los procedimientos estándar (el proceso de bisulfito convierte los restos de citosina no metilados en uracilo). A continuación, se realiza una PCR basada en fluorescencia en una reacción “sesgada”, por ejemplo, con cebadores de PCR que se solapan con dinucleótidos de CpG conocidos. La discriminación de secuencias se produce tanto a nivel del proceso de amplificación como a nivel del proceso de detección de fluorescencia.

El ensayo MetyLight™ se usa como una prueba cuantitativa para los patrones de metilación en un ácido nucleico, por ejemplo, una muestra de ADN genómico, en donde la discriminación de secuencias se produce al nivel de la hibridación de la sonda. En una versión cuantitativa, la reacción de PCR proporciona una amplificación específica de metilación en presencia de una sonda fluorescente que se superpone a un supuesto sitio de metilación particular. Una reacción en la que ni los cebadores ni la sonda se superponen a ningún dinucleótido de CpG proporciona un control no sesgado de la cantidad de ADN de entrada. Como alternativa, se logra una prueba cualitativa para la metilación genómica sondando el grupo de PCR sesgado con oligonucleótidos de control que no cubren los sitios de metilación conocidos (p. ej., una versión basada en fluorescencia de las técnicas HeavyMethyl™ y MSP) o con oligonucleótidos que cubren posibles sitios de metilación.

El proceso de MetyLight™ se utiliza con cualquier sonda adecuada (por ejemplo, una sonda “TaqMan®”, una sonda Lightcycler®, etc.) Por ejemplo, en algunas aplicaciones, el ADN genómico bicatenario se trata con bisulfito de sodio y se somete a uno de dos conjuntos de reacciones de PCR usando sondas TaqMan®, por ejemplo, con cebadores MSP y/u oligonucleótidos bloqueadores de HeavyMethyl y una sonda TaqMan®. La sonda TaqMan® tiene doble marcaje con moléculas fluorescentes “indicadoras” e “inactivadoras” y está diseñada para ser específica para una región con un contenido de GC relativamente alto, de modo que se funde a una temperatura aproximadamente 10 °C más alta en el ciclo de PCR que los cebadores directos o inversos. Esto permite que la sonda TaqMan® permanezca completamente hibridada durante la etapa de hibridación/extensión de la PCR. A medida que la polimerasa Taq sintetiza enzimáticamente una nueva hebra durante la PCR, eventualmente llegará a la sonda TaqMan® hibridada. La actividad de la endonucleasa 5' a 3' de la polimerasa Taq desplazará la sonda TaqMan® al digerirla para liberar la molécula indicadora fluorescente para la detección cuantitativa de su señal ahora sin inactivar utilizando un sistema de detección fluorescente en tiempo real.

Los reactivos típicos (p. ej., como se pueden encontrar en un kit basado en MethyLight™ típico) para el análisis MethyLight™ pueden incluir, pero sin limitación: cebadores de PCR para locus específicos (por ejemplo, genes específicos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla de CpG, etc.); sondas TaqMan® o LigthCycler®; tampones de PCR optimizados y desoxinucleótidos; y Taq polimerasa.

El ensayo QM™ (metilación cuantitativa) es una prueba cuantitativa alternativa para patrones de metilación en muestras de ADN genómico, en donde la discriminación de secuencias se produce a nivel de hibridación de sonda. En esta versión cuantitativa, la reacción de PCR proporciona una amplificación sin sesgo en presencia de una sonda fluorescente que se superpone a un supuesto sitio de metilación particular. Una reacción en la que ni los cebadores ni la sonda se superponen a ningún dinucleótido de CpG proporciona un control no sesgado de la cantidad de ADN de entrada. Como alternativa, se logra una prueba cualitativa para la metilación genómica sondando el grupo de PCR sesgado con oligonucleótidos de control que no cubren los sitios de metilación conocidos (una versión basada en fluorescencia de las técnicas HeavyMethyl™ y MSP) o con oligonucleótidos que cubren posibles sitios de metilación.

El proceso QM™ se puede utilizar con cualquier sonda adecuada, por ejemplo, sondas “TaqMan®”, sondas LightCycler®, en el proceso de amplificación. Por ejemplo, el ADN genómico bicatenario se trata con bisulfito de sodio y se somete a cebadores no sesgados y a la sonda TaqMan®. La sonda TaqMan® tiene doble marcaje con moléculas fluorescentes “indicadoras” e “ inactivadoras” y está diseñada para ser específica para una región con un contenido de GC relativamente alto, de modo que se funde, a una temperatura aproximadamente 10 °C más alta en el ciclo de PCR que los cebadores directos o inversos. Esto permite que la sonda TaqMan® permanezca completamente hibridada durante la etapa de hibridación/extensión de la PCR. A medida que la polimerasa Taq sintetiza enzimáticamente una nueva hebra durante la PCR, eventualmente llegará a la sonda TaqMan® hibridada. La actividad de la endonucleasa 5' a 3' de la polimerasa Taq desplazará la sonda TaqMan® al digerirla para liberar la molécula indicadora fluorescente para la detección cuantitativa de su señal ahora sin inactivar utilizando un sistema de detección fluorescente en tiempo real. Los reactivos típicos (p. ej., como se pueden encontrar en un kit basado en QM™ típico) para el análisis q M™ pueden incluir, pero sin limitación: cebadores de PCR para locus específicos (por ejemplo, genes específicos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla de CpG, etc.); sondas TaqMan® o LigthCycler®; tampones de PCR optimizados y desoxinucleótidos; y Taq polimerasa.

La técnica Ms-SNuPE™ es un método cuantitativo para evaluar las diferencias de metilación en sitios de CpG específicos basados en el tratamiento con bisulfito del ADN, seguido de la extensión del cebador de un solo nucleótido (Gonzalgo y Jones, Nucleic Acids Res. 25:2529-2531, 1997). Brevemente, el ADN genómico se hace reaccionar con bisulfito de sodio para convertir la citosina no metilada en uracilo mientras se deja la 5-metilcitosina sin cambios. A continuación, se realiza la amplificación de la secuencia diana deseada utilizando cebadores de PCR específicos para el ADN convertido con bisulfito, y el producto resultante se aísla y se utiliza como plantilla para el análisis de metilación en el sitio de CpG de interés. Se pueden analizar pequeñas cantidades de ADN (p. ej., secciones de anatomopatología diseccionadas) y evita la utilización de enzimas de restricción para determinar el estado de metilación en los sitios de CpG.

Los reactivos típicos (p. ej., como se pueden encontrar en un kit basado en Ms-SNuPE™ típico) para el análisis Ms-SNuPE™ pueden incluir, pero sin limitación: cebadores de PCR para locus específicos (por ejemplo, genes específicos, marcadores, DMR, regiones de genes, regiones de marcadores, secuencia de ADN tratada con bisulfito, isla de CpG, etc.); tampones de PCR optimizados y desoxinucleótidos; kit de extracción de gel; cebadores de control positivo; cebadores Ms-SNuPE™ para locus específicos; tampón de reacción (para la reacción de Ms-SNuPE); y nucleótidos marcados. Además, los reactivos de conversión de bisulfito pueden incluir: tampón de desnaturalización de ADN; tampón de sulfonación; reactivos o un kit de recuperación de ADN (p. ej., precipitación, ultrafiltración, columna de afinidad); tampón de desulfonación; y componentes de recuperación de ^aDⁿ.

La secuenciación con bisulfito de representación reducida (RRBS) comienza con el tratamiento con bisulfito del ácido nucleico para convertir todas las citosinas no metiladas en uracilo, seguido de la digestión con enzimas de restricción (p. ej., una enzima que reconoce un sitio que incluye una secuencia CG como Msμl) y la secuenciación completa de los fragmentos después del acoplamiento a un ligando adaptador. La elección de la enzima de restricción enriquece los fragmentos para las regiones densas de CpG, lo que reduce el número de secuencias redundantes que pueden asignarse a múltiples posiciones de genes durante el análisis. Como tal, la RRBS reduce la complejidad de la muestra de ácido nucleico mediante la selección de un subconjunto (p. ej., mediante selección de tamaño mediante electroforesis en gel preparativa) de fragmentos de restricción para la secuenciación. A diferencia de la secuenciación con bisulfito del genoma completo, cada fragmento producido por la digestión con enzimas de restricción contiene información de metilación del ADN para al menos un dinucleótido de CpG. Como tal, la RRBS enriquece la muestra en promotores, islas de CpG y otras características genómicas con una alta frecuencia de sitios de corte de enzimas de restricción en estas regiones y, por lo tanto, proporciona un ensayo para evaluar el estado de metilación de uno o más locus genómicos.

Un protocolo típico de RRBS comprende las etapas de digerir una muestra de ácido nucleico con una enzima de restricción como Msμl, rellenar salientes y añadir las colas de A, ligar adaptadores, conversión de bisulfito y PCR. Véase, p. ej., y col. (2005) “Genome-scale DNA methylation mapping of clinical samples at single-nucleotide resolution” Nat Methods 7: 133-6; Meissner y col. (2005) “Reduced representation bisulfite sequencing for comparative highresolution DNA methylation analysis” Nucleic Acids Res. 33: 5868-77.

En algunas realizaciones, se usa un ensayo de amplificación de señal y diana en tiempo real específico de alelo cuantitativo (QuARTS) para evaluar el estado de metilación. Tres reacciones ocurren secuencialmente en cada ensayo QuARTS, incluida la amplificación (reacción 1) y la escisión de la sonda diana (reacción 2) en la reacción primaria; y escisión de FRET y generación de señal fluorescente (reacción 3) en la reacción secundaria. Cuando el ácido nucleico diana se amplifica con cebadores específicos, una sonda de detección específica con una secuencia de solapa se une débilmente al amplicón. La presencia del oligonucleótido invasivo específico en el sitio de unión diana hace que la escisión libere la secuencia del flap cortando entre la sonda de detección y la secuencia del flap. La secuencia del flap es complementaria a una parte sin horquilla de un casete de FRET correspondiente. En consecuencia, la secuencia del flap funciona como un oligonucleótido invasivo en el casete de FRET y efectúa una escisión entre el fluoróforo del casete de FRET y un inactivador, que produce una señal fluorescente. La reacción de escisión puede cortar múltiples sondas por diana y, por lo tanto, liberar múltiples fluoróforos por flap, lo que proporciona una amplificación exponencial de la señal. QuARTS puede detectar múltiples objetivos en un solo pocillo de reacción mediante el uso de casetes de FRET con diferentes colorantes. Véase, por ejemplo, Zou y col. (2010) “Sensitive quantification of methylated markers with a novel methylation specific technology” Clin Chem 56: A199; Solicitudes de Patente de EE. UU. con N.° de serie 12/946.737, 12/946.745, 12/946.752 y 61/548.639.

La expresión “reactivo de bisulfito” se refiere a un reactivo que comprende bisulfito, disulfito, sulfito de hidrógeno o combinaciones de los mismos, útiles como se describe en la presente descripción para distinguir entre secuencias de dinucleótidos de CpG metilados y no metilados. Los métodos de dicho tratamiento son conocidos en la técnica (por ejemplo, el documento PCT/EP2004/011715). Se prefiere que el tratamiento con bisulfito se lleve a cabo en presencia de disolventes desnaturalizantes tales como, entre otros, n-alquilenglicol o éter dimetílico de dietilenglicol (DME), o en presencia de dioxano o derivados de dioxano. En algunas realizaciones, los disolventes desnaturalizantes se utilizan en concentraciones entre el 1 % y el 35 % (v/v). En algunas realizaciones, la reacción de bisulfito se lleva a cabo en presencia de depuradores tales como, entre otros, derivados de cromano, por ejemplo, ácido 6-hidroxi-2,5,7,8,-tetrametilcromano 2-carboxílico o ácido trihidroxibenzona y derivados del mismo, por ejemplo, ácido gálico (véase: documento PCT/EP2004/011715). La conversión de bisulfito se lleva a cabo preferiblemente a una temperatura de reacción entre 30 °C y 70 °C, por lo que la temperatura se aumenta a más de 85 °C durante breves períodos de tiempo durante la reacción (véase: documento PCT/EP2004/011715). El ADN tratado con bisulfito se purifica preferiblemente antes de la cuantificación. Esto puede llevarse a cabo por cualquier medio conocido en la técnica, como, entre otros, ultrafiltración, por ejemplo, por medio de columnas Microcon™ (fabricadas por Millipore™). La purificación se lleva a cabo según un protocolo modificado del fabricante (véase, por ejemplo, el documento PCT/EP2004/011715).

En algunas realizaciones, los fragmentos del ADN tratado se amplifican utilizando conjuntos de oligonucleótidos cebadores según la presente invención (p. ej., véase la tabla 2) y una enzima de amplificación. La amplificación de varios segmentos de ADN puede realizarse simultáneamente en un mismo recipiente de reacción. Típicamente, la amplificación se lleva a cabo mediante una reacción en cadena de la polimerasa (PCR). Los amplicones tienen normalmente una longitud de 100 a 2000 pares de bases.

En otra realización del método, se puede detectar el estado de metilación de las posiciones de CpG dentro o cerca de un marcador que comprende una DMR (por ejemplo, las DMR 1-107 como se proporciona en la tabla 1) (por ejemplo, las DMR 1-449 como se proporciona en la tabla 10) mediante el uso de oligonucleótidos cebadores específicos de metilación. Esta técnica (m Sp ) ha sido descrita en la Patente de EE. UU. N.° 6.265.171 de Herman. El uso de cebadores específicos del estado de metilación para la amplificación de ADN tratado con bisulfito permite la diferenciación entre ácidos nucleicos metilados y no metilados. Los pares de cebadores de MSP contienen al menos un cebador que se hibrida con un dinucleótido de CpG tratado con bisulfito. Por tanto, la secuencia de dichos cebadores comprende al menos un dinucleótido de CpG. Los cebadores de MSP específicos para el ADN no metilado contienen una “T” en la posición de la posición de C en el CpG.

Los fragmentos obtenidos mediante la amplificación pueden llevar un marcador directa o indirectamente detectable. En algunas realizaciones, los marcadores son marcadores fluorescentes, radionúclidos o fragmentos de moléculas separables que tienen una masa típica que puede detectarse en un espectrómetro de masas. Cuando dichos marcadores son marcadores de masa, algunas realizaciones prevén que los amplicones marcados tengan una única carga neta positiva o negativa, lo que permite una mejor detectabilidad en el espectrómetro de masas. La detección puede llevarse a cabo y visualizarse por medio de, por ejemplo, espectrometría de masas de ionización/desorción láser asistida por matriz (MALDI) o usando espectrometría de masas de electropulverización (ESI).

Los métodos para aislar ADN adecuados para estas tecnologías de ensayo son conocidos en la técnica. En particular, algunas realizaciones comprenden el aislamiento de ácidos nucleicos como se describe en la Solicitud de Patente de EE. UU. con N.° de serie 13/470.251 (“ Isolation of Nucleic Acids”).

Métodos

En algunas realizaciones, se proporcionan métodos tecnológicos que comprenden las siguientes etapas:

1) poner en contacto un ácido nucleico (p. ej., ADN genómico, p. ej., aislado de fluidos corporales como una muestra de heces o tejido pancreático) obtenido del sujeto con al menos un reactivo o serie de reactivos que distingue entre dinucleótidos de CpG metilados y no metilados dentro de al menos un marcador que comprende una DMR (por ejemplo, las DMR 1-107, por ejemplo, como se proporciona en la tabla 1) (por ejemplo, las DMR 1 449, por ejemplo, como se proporciona en la tabla 10) y

2) detectar una neoplasia o un trastorno proliferativo (p. ej., con una sensibilidad mayor o igual al 80 % y una especificidad mayor o igual al 80 %).

1) poner en contacto un ácido nucleico (p. ej., ADN genómico, p. ej., aislado de fluidos corporales como una muestra de heces o tejido pancreático) obtenido del sujeto con al menos un reactivo o serie de reactivos que distingue entre dinucleótidos de CpG metilados y no metilados dentro de al menos un marcador seleccionado de una región cromosómica que tiene una anotación seleccionada entre el grupo que consiste en ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12 133, CLEC11A, ELMO1, EOMES, CLEC 11, SHH, GJC1, IHIF1, IKZF1, KCNK12, KCNN₂, PCBP3, PRKCB, RSPO₃, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1 y ZNF71, y

2) detectar el cáncer de páncreas (p. ej., con una sensibilidad mayor o igual al 80 % y una especificidad mayor o igual al 80 %).

1) poner en contacto un ácido nucleico (por ejemplo, ADN genómico, por ejemplo, aislado de fluidos corporales como una muestra de heces o tejido esofágico) obtenido del sujeto con al menos un reactivo o serie de reactivos que distingue entre dinucleótidos de CpG metilados y no metilados dentro de al menos un marcador seleccionado de una región cromosómica que tiene una anotación seleccionada entre el grupo que consiste en NDRG4, SFRP1, BMP3, HPP1 y APC, y

2) detectar el esófago de Barrett (p. ej., con una sensibilidad mayor o igual al 80 % y una especificidad mayor o igual al 80 %).

1) poner en contacto un ácido nucleico (p. ej., ADN genómico, p. ej., aislado de fluidos corporales como una muestra de heces o tejido pancreático) obtenido del sujeto con al menos un reactivo o serie de reactivos que distingue entre dinucleótidos de CpG metilados y no metilados dentro de al menos un marcador seleccionado de una región cromosómica que tiene una anotación seleccionada entre el grupo que consiste en ADCY1, PRKCB, KCNK12, C13ORF18, IKZF1, TWIST1, ELMO, 55957, CD1D, CLEC11A, KCNN2, BMP3 y NDRG4, y

1) poner en contacto un ácido nucleico (por ejemplo, ADN genómico, por ejemplo, aislado de una muestra de heces) obtenido del sujeto con al menos un reactivo o serie de reactivos que distingue entre dinucleótidos de CpG metilados y no metilados dentro de una región cromosómica que tiene un CD1D, y

Preferiblemente, la sensibilidad es de aproximadamente el 70 % a aproximadamente el 100 %, o de aproximadamente el 80 % a aproximadamente el 90 %, o de aproximadamente el 80 % a aproximadamente el 85 %. Preferiblemente, la especificidad es de aproximadamente el 70 % a aproximadamente el 100 %, o de aproximadamente el 80 % a aproximadamente el 90 %, o de aproximadamente el 80 % a aproximadamente el 85 %.

El ADN genómico puede aislarse por cualquier medio, incluido el uso de kits comercialmente disponibles. Brevemente, en donde el ADN de interés está encapsulado en una membrana celular, la muestra biológica debe romperse y lisarse por medios enzimáticos, químicos o mecánicos. A continuación, la solución de ADN puede eliminarse de proteínas y otros contaminantes, por ejemplo, mediante digestión con proteinasa K. A continuación, el ADN genómico se recupera de la solución. Esto puede llevarse a cabo por medio de diversos métodos que incluyen la precipitación salina, la extracción orgánica o la unión del ADN a un soporte en fase sólida. La elección del método se verá afectada por varios factores, incluidos el tiempo, el coste y la cantidad requerida de ADN. Todos los tipos de muestras clínicas que comprenden materia neoplásica o materia preneoplásica son adecuados para su uso en el presente método, por ejemplo, líneas celulares, portaobjetos de histología, biopsias, tejido embebido en parafina, fluidos corporales, heces, efluentes colónicos, orina, plasma sanguíneo, suero sanguíneo, sangre completa, células sanguíneas aisladas, células aisladas de la sangre y combinaciones de los mismos.

La tecnología no está limitada en los métodos utilizados para preparar las muestras y proporcionar un ácido nucleico para la prueba. Por ejemplo, en algunas realizaciones, se aísla un ADN de una muestra de heces o de una muestra de sangre o de plasma utilizando la captura directa de genes, por ejemplo, como se detalla en la Solicitud de Patente de EE. UU. con N.° de serie 61/485386 o mediante un método relacionado.

Posteriormente, la muestra de ADN genómico se trata con al menos un reactivo, o una serie de reactivos, que distingue entre dinucleótidos de CpG metilados y no metilados dentro de al menos un marcador que comprende una DMR (por ejemplo, las DMR 1-107, por ejemplo, como se proporciona en la tabla 1) (por ejemplo, las DMR 1-449, por ejemplo, como se proporciona en la tabla 10).

En algunas realizaciones, el reactivo convierte bases de citosina que no están metiladas en la posición 5' en uracilo, timina u otra base que es diferente a la citosina en términos de comportamiento de hibridación. Sin embargo, en algunas realizaciones, el reactivo puede ser una enzima de restricción sensible a la metilación.

En algunas realizaciones, la muestra de ADN genómico se trata de tal manera que las bases de citosina que no están metiladas en la posición 5' se convierten en uracilo, timina u otra base que es diferente a la citosina en términos de comportamiento de hibridación. En algunas realizaciones, este tratamiento se lleva a cabo con bisulfato (sulfito de hidrógeno, disulfito) seguido de hidrólisis alcalina.

A continuación, el ácido nucleico tratado se analiza para determinar el estado de metilación de las secuencias del gen diana (al menos un gen, una secuencia genómica o un nucleótido de un marcador que comprende una DMR, por ejemplo, al menos una DMR seleccionada entre las DMR 1-107, por ejemplo, como se proporciona en la tabla 1) (al menos un gen, secuencia genómica o nucleótido de un marcador que comprende una DMR, por ejemplo, al menos una DMR seleccionada entre las DMR 1-449, por ejemplo, como se proporciona en la tabla 10). El método de análisis puede seleccionarse entre los conocidos en la técnica, incluidos los enumerados en la presente descripción, por ejemplo, QuARTS y MSP como se describe en la presente descripción.

La metilación aberrante, más específicamente la hipermetilación de un marcador que comprende una DMR (por ejemplo, las DMR 1-107, por ejemplo, como se indica en la tabla 1) (por ejemplo, las DMR 1-449, por ejemplo, como se proporciona en la tabla 10) está asociada con un cáncer y, en algunas realizaciones, predice el sitio del tumor.

La tecnología se relaciona con el análisis de cualquier muestra asociada con un cáncer del sistema gastrointestinal. Por ejemplo, en algunas realizaciones la muestra comprende un tejido y/o fluido biológico obtenido de un paciente. En algunas realizaciones, el detergente comprende SDS. En algunas realizaciones, la muestra comprende sangre, suero, plasma, secreciones gástricas, jugo pancreático, una muestra de biopsia gastrointestinal, células microdiseccionadas de una biopsia gastrointestinal, células gastrointestinales desprendidas en la luz gastrointestinal y/o células gastrointestinales recuperadas de heces. En algunas realizaciones, el sujeto es un ser humano. Estas muestras pueden proceder de la porción alta del tubo digestivo, la porción baja del tubo digestivo o comprender células, tejidos y/o secreciones tanto de la parte alta como de la parte baja del tubo digestivo. La muestra puede incluir células, secreciones o tejidos del hígado, conductos biliares, páncreas, estómago, colon, recto, esófago, intestino delgado, apéndice, duodeno, pólipos, vesícula biliar, ano y/o peritoneo. En algunas realizaciones, la muestra comprende fluido celular, ascitis, orina, heces, fluido pancreático, fluido obtenido durante una endoscopia, sangre, moco o saliva. En algunas realizaciones, la muestra es una muestra de heces.

Dichas muestras se pueden obtener por cualquier número de medios conocidos en la técnica, como será evidente para el experto en la materia. Por ejemplo, las muestras de orina y heces se obtienen fácilmente, mientras que las muestras de sangre, ascitis, suero o líquido pancreático se pueden obtener por vía parenteral utilizando, por ejemplo, una aguja y una jeringa. Las muestras libres de células o sustancialmente libres de células se pueden obtener sometiendo la muestra a diversas técnicas conocidas por los expertos en la técnica que incluyen, pero sin limitación, centrifugación y filtración. Aunque generalmente se prefiere que no se utilicen técnicas invasivas para obtener la muestra, aún puede ser preferible obtener muestras como homogeneizados de tejido, secciones de tejido y muestras de biopsia

En algunas realizaciones, la tecnología se refiere a un método para tratar a un paciente (por ejemplo, un paciente con cáncer gastrointestinal, con cáncer gastrointestinal en estadio temprano o que puede desarrollar cáncer gastrointestinal), comprendiendo el método determinar el estado de metilación de una o más DMR como se proporcionan en la presente descripción y administrar un tratamiento al paciente basado en los resultados de la determinación del estado de metilación. El tratamiento puede ser la administración de un compuesto farmacéutico, una vacuna, realizar una cirugía, obtener imágenes del paciente, realizar otra prueba. Preferiblemente, dicho uso es en un método de detección clínica, un método de evaluación de pronóstico, un método de seguimiento de los resultados del tratamiento, un método para identificar a los pacientes con mayor probabilidad de responder a un tratamiento terapéutico particular, un método de obtención de imágenes de un paciente o sujeto y un método para el cribado y desarrollo de fármacos.

En algunas realizaciones de la tecnología, se proporciona un método para diagnosticar un cáncer gastrointestinal en un sujeto. Los términos “diagnóstico” y “diagnóstico” tal como se usan en la presente descripción se refieren a métodos mediante los cuales el experto en la materia puede estimar e incluso determinar si un sujeto sufre o no una determinada enfermedad o afección o puede desarrollar una determinada enfermedad o afección en el futuro. El experto en la materia a menudo realiza un diagnóstico basándose en uno o más indicadores de diagnóstico, como por ejemplo un biomarcador (por ejemplo, una DMR como se describe en la presente descripción), cuyo estado de metilación es indicativo de la presencia, gravedad o ausencia de la afección.

Junto con el diagnóstico, el pronóstico clínico del cáncer se relaciona con la determinación de la agresividad del cáncer y la probabilidad de recurrencia del tumor para planificar la terapia más eficaz. Si se puede hacer un pronóstico más preciso o incluso se puede evaluar un riesgo potencial de desarrollar el cáncer, se puede elegir la terapia adecuada y, en algunos casos, una terapia menos agresiva para el paciente. La evaluación (p. ej., determinar el estado de metilación) de los biomarcadores del cáncer es útil para separar sujetos con buen pronóstico y/o bajo riesgo de desarrollar cáncer que no necesitarán terapia o una terapia limitada de aquellos con mayor probabilidad de desarrollar cáncer o sufrir una recurrencia del cáncer que podrían beneficiarse de tratamientos más intensivos.

Como tal, “hacer un diagnóstico” o “diagnosticar”, tal como se usa en la presente descripción, incluye además determinar un riesgo de desarrollar cáncer o determinar un pronóstico, lo que puede permitir predecir un resultado clínico (con o sin tratamiento médico), seleccionar un tratamiento adecuado (o si el tratamiento sería efectivo), o supervisar un tratamiento actual y posiblemente cambiar el tratamiento, en función de la medida de los biomarcadores de diagnóstico (p. ej., DMR) descritos en la presente descripción. Además, en algunas realizaciones del objeto de la presente invención, se pueden realizar múltiples determinaciones de los biomarcadores a lo largo del tiempo para facilitar el diagnóstico y/o el pronóstico. Se puede usar un cambio temporal en el biomarcador para predecir un resultado clínico, supervisar la progresión del cáncer gastrointestinal y/o supervisar la eficacia de las terapias apropiadas dirigidas contra el cáncer. En una realización de este tipo, por ejemplo, se podría esperar ver un cambio en el estado de metilación de uno o más biomarcadores (p. ej., DMR) descritos en la presente descripción (y potencialmente uno o más biomarcadores adicionales, si se controlan) en una muestra biológica a lo largo del tiempo durante el curso de una terapia eficaz.

El objeto actualmente divulgado proporciona además en algunas realizaciones un método para determinar si iniciar o continuar la profilaxis o el tratamiento de un cáncer en un sujeto. En algunas realizaciones, el método comprende proporcionar una serie de muestras biológicas durante un periodo de tiempo del sujeto; analizar la serie de muestras biológicas para determinar un estado de metilación de al menos un biomarcador descrito en la presente descripción en cada una de las muestras biológicas; y comparar cualquier cambio medible en los estados de metilación de uno o más de los biomarcadores en cada una de las muestras biológicas. Cualquier cambio en los estados de metilación de los biomarcadores durante el periodo de tiempo se puede usar para predecir el riesgo de desarrollar cáncer, predecir el resultado clínico, determinar si se debe iniciar o continuar la profilaxis o la terapia del cáncer y si una terapia actual está tratando el cáncer de manera eficaz. Por ejemplo, se puede seleccionar un primer punto de tiempo antes del inicio de un tratamiento y se puede seleccionar un segundo punto de tiempo en algún momento después del inicio del tratamiento. Los estados de metilación se pueden medir en cada una de las muestras tomadas de diferentes puntos de tiempo y se pueden observar las diferencias cualitativas y/o cuantitativas. Un cambio en los estados de metilación de los niveles de biomarcadores de las diferentes muestras se puede correlacionar con el riesgo de cáncer gastrointestinal, el pronóstico, la determinación de la eficacia del tratamiento y/o la progresión del cáncer en el sujeto.

En aspectos preferidos, los métodos y composiciones de la divulgación son para el tratamiento o diagnóstico de enfermedades en una etapa temprana, por ejemplo, antes de que aparezcan los síntomas de la enfermedad. En algunos aspectos, los métodos y composiciones de la divulgación son para el tratamiento o diagnóstico de enfermedades en una etapa clínica.

Como se indica, en algunas realizaciones, se pueden realizar múltiples determinaciones de uno o más biomarcadores de diagnóstico o pronóstico, y se puede usar un cambio temporal en el marcador para determinar un diagnóstico o pronóstico. Por ejemplo, se puede determinar un marcador de diagnóstico en un momento inicial y de nuevo en un segundo momento. En dichas realizaciones, un aumento en el marcador desde el tiempo inicial hasta el segundo tiempo puede ser un diagnóstico de un tipo o gravedad particular de cáncer, o un pronóstico dado. Asimismo, una disminución en el marcador desde el tiempo inicial hasta el segundo tiempo puede ser indicativo de un tipo o gravedad particular de cáncer, o de un pronóstico determinado. Además, el grado de cambio de uno o más marcadores puede estar relacionado con la gravedad del cáncer y futuros acontecimientos adversos. El experto en la materia comprenderá que, si bien en ciertas realizaciones se pueden realizar mediciones comparativas del mismo biomarcador en múltiples puntos de tiempo, también se puede medir un biomarcador dado en un punto de tiempo y un segundo biomarcador en un segundo punto de tiempo, y una comparación de estos marcadores puede proporcionar información de diagnóstico.

Como se usa en la presente descripción, la expresión “determinar el pronóstico” se refiere a métodos mediante los cuales el experto en la materia puede predecir el curso o el resultado de una afección en un sujeto. El término “pronóstico” no se refiere a la capacidad de predecir el curso o el resultado de una afección con un 100 % de precisión, o incluso que un curso o resultado determinado sea previsiblemente más o menos probable en función del estado de metilación de un biomarcador (p. ej., una DMR). En su lugar, el experto en la materia entenderá que el término “pronóstico” se refiere a una mayor probabilidad de que ocurra un cierto curso o resultado; es decir, que es más probable que ocurra un curso o resultado en un sujeto que muestra una afección dada, en comparación con aquellos individuos que no presentan la afección. Por ejemplo, en individuos que no presentan la afección (p. ej., que tienen un estado de metilación normal de una o más d Mr ), la posibilidad de un resultado determinado (p. ej., que padecen un cáncer gastrointestinal) puede ser muy baja.

En algunas realizaciones, un análisis estadístico asocia un indicador de pronóstico con una predisposición a un resultado adverso. Por ejemplo, en algunas realizaciones, un estado de metilación diferente al de una muestra de control normal obtenida de un paciente que no tiene cáncer puede indicar que es más probable que un sujeto sufra cáncer que sujetos con un nivel que es más similar al estado de metilación en la muestra de control, determinado por un nivel de significación estadística. Además, un cambio en el estado de metilación desde un nivel inicial (por ejemplo, “normal”) puede reflejar el pronóstico del sujeto, y el grado de cambio en el estado de metilación puede estar relacionado con la gravedad de los acontecimientos adversos. La significancia estadística a menudo se determina comparando dos o más poblaciones y determinando un intervalo de confianza y/o un valor de p. Véase, por ejemplo, Dowdy y Wearden, Statistics for Research, John Wiley & Sons, Nueva York, 1983. Los intervalos de confianza ilustrativos de la presente materia son 90 %, 95 %, 97,5 %, 98 %, 99 %, 99,5 %, 99,9 % y 99,99 %, mientras que valores de p ilustrativos son 0,1, 0,05, 0,025, 0,02, 0,01, 0,005, 0,001 y 0,0001.

En otras realizaciones, se puede establecer un grado umbral de cambio en el estado de metilación de un biomarcador de pronóstico o diagnóstico divulgado en la presente descripción (por ejemplo, una DMR), y simplemente se compara el grado de cambio en el estado de metilación del biomarcador en una muestra biológica con el grado umbral de cambio en el estado de mutilación. Un cambio de umbral preferido en el estado de mutilación para los biomarcadores proporcionados en la presente descripción es de aproximadamente el 5 %, aproximadamente el 10 %, aproximadamente el 15 %, aproximadamente el 20 %, aproximadamente el 25 %, aproximadamente el 30 %, aproximadamente el 50 %, aproximadamente el 75 %, aproximadamente el 100 % y aproximadamente el 150 %. En otras realizaciones más, se puede establecer un “nomograma”, mediante el cual un estado de metilación de un indicador de pronóstico o diagnóstico (biomarcador o combinación de biomarcadores) está directamente relacionado con una disposición asociada hacia un resultado dado. El experto en la materia está familiarizado con el uso de dichos nomogramas para relacionar dos valores numéricos con el entendimiento de que la incertidumbre en esta medición es la misma que la incertidumbre en la concentración del marcador porque se hace referencia a mediciones de muestras individuales, no a promedios de población.

En algunas realizaciones, una muestra de control se analiza simultáneamente con la muestra biológica, de manera que los resultados obtenidos de la muestra biológica pueden compararse con los resultados obtenidos de la muestra de control. Además, se contempla que se puedan proporcionar curvas patrón con las que se puedan comparar los resultados del ensayo para la muestra biológica. Estas curvas patrón presentan los estados de metilación de un biomarcador en función de las unidades de ensayo, por ejemplo, la intensidad de la señal fluorescente, si se utiliza un marcador fluorescente. Usando muestras tomadas de múltiples donantes, se pueden proporcionar curvas patrón para controlar los estados de metilación de uno o más biomarcadores en tejido normal, así como para los niveles “en riesgo” de uno o más biomarcadores en tejido tomado de donantes con metaplasia o de donantes con un cáncer gastrointestinal. En ciertas realizaciones del método, se identifica que un sujeto tiene metaplasia al identificar un estado de metilación aberrante de una o más DMR proporcionadas en la presente descripción en una muestra biológica obtenida del sujeto. En otras realizaciones del método, la detección de un estado de metilación aberrante de uno o más de tales biomarcadores en una muestra biológica obtenida del sujeto da como resultado que se identifique que el sujeto tiene cáncer.

El análisis de marcadores se puede realizar por separado o simultáneamente con marcadores adicionales dentro de una muestra de prueba. Por ejemplo, se pueden combinar varios marcadores en una prueba para el procesamiento eficiente de múltiples muestras y para proporcionar potencialmente una mayor precisión de diagnóstico y/o pronóstico. Además, un experto en la técnica reconocería el valor de probar múltiples muestras (por ejemplo, en puntos de tiempo sucesivos) del mismo sujeto. Dicha prueba de muestras en serie puede permitir la identificación de cambios en los estados de metilación del marcador a lo largo del tiempo. Los cambios en el estado de metilación, así como la ausencia de cambios en el estado de metilación, pueden brindar información útil sobre el estado de la enfermedad que incluye, entre otros, identificar el tiempo aproximado desde el inicio del evento, la presencia y la cantidad de tejido salvable, la idoneidad de las terapias farmacológicas, la eficacia de varias terapias y la identificación del resultado del sujeto, incluido el riesgo de eventos futuros.

El análisis de biomarcadores se puede llevar a cabo en una variedad de formatos físicos. Por ejemplo, se puede utilizar el uso de placas de microtitulación o la automatización para facilitar el procesamiento de un gran número de muestras de prueba. Como alternativa, se podrían desarrollar formatos de muestra única para facilitar el tratamiento y diagnóstico inmediatos de manera oportuna, por ejemplo, en transporte ambulatorio o salas de urgencias.

En algunas realizaciones, se diagnostica que el sujeto tiene un cáncer gastrointestinal si, en comparación con un estado de metilación de control, existe una diferencia medible en el estado de metilación de al menos un biomarcador en la muestra. Por el contrario, cuando no se identifica ningún cambio en el estado de metilación en la muestra biológica, se puede identificar que el sujeto no tiene cáncer gastrointestinal, que no tiene riesgo de cáncer o que tiene un riesgo bajo de cáncer. A este respecto, los sujetos que tienen cáncer o riesgo del mismo pueden diferenciarse de sujetos que tienen cáncer o riesgo de cáncer bajo o sustancialmente nulo. Aquellos sujetos que tengan un riesgo de desarrollar un cáncer gastrointestinal pueden someterse a un programa de detección más intensivo y/o regular, incluida la vigilancia endoscópica. Por otro lado, aquellos sujetos que tienen un riesgo bajo o sustancialmente nulo pueden evitar someterse a una endoscopia, hasta que un examen futuro, por ejemplo, un examen realizado según la tecnología actual, indique que ha aparecido en estos sujetos un riesgo de cáncer gastrointestinal.

Como se mencionó anteriormente, dependiendo de la realización del método de la presente tecnología, detectar un cambio en el estado de metilación de uno o más biomarcadores puede ser una determinación cualitativa o puede ser una determinación cuantitativa. Como tal, el paso de diagnosticar a un sujeto que tiene, o corre el riesgo de desarrollar, un cáncer gastrointestinal indica que se realizan ciertas mediciones de umbral, por ejemplo, el estado de metilación de uno o más biomarcadores en la muestra biológica varía con respecto a un estado de metilación de control predeterminado. En algunas realizaciones del método, el estado de metilación de control es cualquier estado de metilación detectable del biomarcador. En otras realizaciones del método en las que se analiza una muestra de control simultáneamente con la muestra biológica, el estado de metilación predeterminado es el estado de metilación en la muestra de control. En otras realizaciones del método, el estado de metilación predeterminado se basa y/o se identifica mediante una curva patrón. En otras realizaciones del método, el estado de metilación predeterminado es un estado o rango de estado específico. Como tal, se puede elegir el estado de metilación predeterminado, dentro de límites aceptables que serán evidentes para los expertos en la técnica, basándose en parte en la realización del método que se practica y la especificidad deseada, etc.

Además, con respecto a los métodos de diagnóstico, un sujeto preferido es un sujeto vertebrado. Un vertebrado preferido es uno de sangre caliente; un vertebrado de sangre caliente preferido es un mamífero. Un mamífero preferido es más preferiblemente un ser humano. Como se usa en la presente descripción, el término “sujeto” incluye tanto sujetos humanos como animales. Por lo tanto, en la presente descripción se proporcionan usos terapéuticos veterinarios. Como tal, la presente tecnología permite el diagnóstico de mamíferos como los humanos, así como de aquellos mamíferos de importancia por estar en peligro de extinción, como los tigres siberianos; de importancia económica, como animales criados en granjas para el consumo humano; y/o animales de importancia social para los seres humanos, como animales que se mantienen como mascotas o en zoológicos. Algunos ejemplos de dichos animales incluyen, pero no se limitan a: carnívoros tales como gatos y perros; cerdos, incluidos cerdos y jabalíes; rumiantes y/o ungulados, tales como vacas, bueyes, ovejas, jirafas, ciervos, cabras, bisontes y camellos; y caballos. Por lo tanto, también se proporciona el diagnóstico y tratamiento de ganado, incluidos, entre otros, cerdos domesticados, rumiantes, ungulados, caballos (incluidos caballos de carreras) y similares. El objeto de la presente invención incluye además un sistema para diagnosticar un cáncer gastrointestinal en un sujeto. El sistema se puede proporcionar, por ejemplo, como un kit comercial que se puede utilizar para detectar un riesgo de cáncer gastrointestinal o diagnosticar un cáncer gastrointestinal en un sujeto del que se ha recogido una muestra biológica. Un sistema ilustrativo proporcionado según la presente tecnología incluye evaluar el estado de metilación de una DMR, como se proporciona en la tabla 1.

Ejemplos

Ejemplo 1: identificación de marcadores mediante RRBS

En conjunto, los cánceres gastrointestinales representan más muertes que los de cualquier otro sistema de órganos, y la incidencia agregada del cáncer en la porción alta del tubo digestivo y la del cáncer colorrectal (CCR) son comparables. Para maximizar la eficiencia de la detección y el diagnóstico, se necesitan marcadores moleculares para el cáncer gastrointestinal que sean específicos del sitio cuando se analicen en medios distantes, como sangre o heces. Si bien son ampliamente informativos, los marcadores de ácido nucleico aberrantemente metilados a menudo son comunes para los cánceres de la porción alta del tubo digestivo y el CCR.

Durante el desarrollo de la tecnología proporcionada en la presente descripción, se recopilaron datos de un estudio de casos y controles para demostrar que una estrategia de búsqueda en todo el genoma identifica marcadores candidatos nuevos e informativos. Los experimentos preliminares demostraron que el análisis de heces de un marcador genético metilado (BMP3) detecta el cáncer de páncreas. Posteriormente, se demostró que un análisis combinado de BMP3 metilado y KRAS mutante aumentó la detección frente a cualquiera de los dos marcadores de manera individual. Sin embargo, los marcadores discriminantes en el tejido resultaron ser malos marcadores en las heces debido a un alto fondo de metilación, por ejemplo, como se detectó en las muestras de control.

Población de estudio, adquisición de especímenes y muestras

La población de interés fueron pacientes con cáncer de páncreas atendidos en la Clínica Mayo. La población accesible incluye aquellos que se han sometido a una pancreatectomía distal, una pancreaticoduodenectomía o una colectomía con una muestra de resección archivada y un diagnóstico anatomopatológico confirmado. El ADN epitelial del colon se extrajo previamente de especímenes microdiseccionados por el laboratorio de procesamiento de acceso de bioespecímenes (BAP) utilizando un protocolo de fenol-cloroformo. El personal de Pancras SPORE utilizó datos de las variables coincidentes de estas muestras para seleccionar muestras de registro de tejidos. Estos fueron revisados por un patólogo experto para confirmar el estado de casos y controles y excluir neoplasias de casos que surgieron de IPMN, que pueden tener una biología subyacente diferente. El personal de SPOR^eorganizó la microdisección del laboratorio BAP y la extracción de ADN de las muestras de casos y controles del páncreas y proporcionó 500 ng de ADN al personal de laboratorio con enmascaramiento respecto del estado de los casos y los controles. Las muestras de ácido nucleico de archivo incluyeron 18 adenocarcinomas pancreáticos, 18 páncreas normales y 18 epitelios colónicos normales emparejados por sexo, edad y condición de tabaquismo.

Los tipos de muestra fueron:

1) Tejidos de cáncer de páncreas del registro Pancreas SPORE de la Clínica Mayo, limitados al estadio I y II de la AJCC;

2) páncreas de control sin cáncer de páncreas;

3) epitelio colónico de control archivado sin cáncer de páncreas; y

4) neoplasia colónica de la que se extrajo ADN y se almacenó en el laboratorio de BAP. Los casos y controles se emparejaron por sexo, edad (en incrementos de 5 años) y condición de fumador (actual o anterior frente a nunca).

Variables principales

La variable principal fue el porcentaje de metilación de cada amplicón de 101 pares de bases de las regiones de HCP. El porcentaje de metilación en las muestras de casos se comparó con las muestras de control después de RRBS.

Métodos

Las bibliotecas se prepararon según métodos informados anteriormente (véase, por ejemplo, Gu y col. (2011) “Prepararon of reduced representation bisulfite sequencing libraries for genome-scale DNA methylation profiling” Nature Protocols 6: 468-81) fragmentando el ADN genómico (300 ng) por digestión con 10 unidades de mspl, una enzima de restricción específica de metilación que reconoce motivos que contienen CpG. Este tratamiento enriquece las muestras en contenido de CpG y elimina áreas redundantes del genoma. Los fragmentos digeridos se repararon en los extremos y se formaron colas en A con 5 unidades del fragmento Klenow (3'-5' exo) y se ligaron durante la noche a adaptadores de Illumina que contenían una de las cuatro secuencias de código de barras para vincular cada fragmento con su ID de muestra. La selección de tamaño de fragmentos de 160-340 pb (que tenían insertos de 40 220 pb) se realizó utilizando microesferas SPRI/tampón (AMPure XP, Beckman Coulter). Los puntos de corte del tampón fueron de 0,7x a 1,1x del volumen de muestra de microesferas/tampón. Las muestras se eluyeron en un volumen de 22 μl (tampón EB, Qiagen). Se usó qPCR para medir la eficiencia de la ligadura y la calidad de los fragmentos en una pequeña alícuota de muestra. A continuación, las muestras se sometieron a dos rondas de conversión de bisulfito usando un protocolo EpiTect modificado (Qiagen). La qPCR y la PCR convencional (Pfu Turbo Cx hotstart, Agilent), seguidas de la evaluación Bioanalyzer 2100 (Agilent) en alícuotas de muestras convertidas, determinaron el número óptimo de ciclos de PCR antes de la amplificación de la biblioteca final. La PCR final se realizó en un volumen de 50 μl (5 μl de tampón PCR 10X; 1,25 μl de cada dNTP a 10 mM; 5 μl de un cóctel de cebadores a aproximadamente 5 μM, 15 μl de cadena molde (muestra), 1 μl de PfuTurbo Cx hotstart y 22,75 μl de agua. El ciclo térmico comenzó con incubaciones iniciales a 95 °C durante 5 minutos y a 98 °C durante 30 segundos, seguidas de 16 ciclos de 98 °C durante 10 segundos, 65 °C durante 30 segundos y 72 °C durante 30 segundos. Después del ciclado, las muestras se incubaron a 72 °C durante 5 minutos y se mantuvieron a 4 °C hasta su posterior procesamiento y análisis. Las muestras se combinaron en cantidades equimolares en bibliotecas de 4 unidades de plexado según un esquema de aleatorización y se probaron con el bioanalizador para verificar el tamaño final. Las muestras también se analizaron con qPCR utilizando estándares phiX y cebadores específicos del adaptador.

Para la secuenciación, las muestras se cargaron en carriles de celdas de flujo según una asignación aleatoria de carriles con carriles adicionales reservados para controles de ensayo internos. La secuenciación se realizó por NGS Core en el Medical Genome Facility de la Clínica Mayo en un instrumento Illumina HiSeq 2000. Las lecturas fueron unidireccionales durante 101 ciclos. Cada carril de celda de flujo generó entre 100 y 120 millones de lecturas, suficiente para una mediana de cobertura de 30x a 50x de profundidad de secuenciación (según el número de lecturas por CpG) para secuencias alineadas. Se utilizó el software de flujo de trabajo de Illumina estándar para analizar las lecturas en combinación con RRBSMAP (Xi y col. (2012) “RRBSMAP: a fast, accurate and user-friendly alignment tool for reduced representation bisulfite sequencing” Bioinformatics 28: 430-432) y un flujo de trabajo interno (SAAP-RRBS) desarrollado por el personal de Mayo Biomedical and Statistics (Sun y col. (2012) “SAAP-RRBS: streamlined analysis and annotation pipeline for reduced representation bisulfite sequencing” Bioinformatics 28: 2180-1). Los análisis bioinformáticos consistieron en 1) evaluación y limpieza de la lectura de secuencias, 2) alineación con el genoma de referencia, 3) extracción del estado de metilación y 4) notificación y anotación de CpG.

Consideraciones estadísticas

La comparación principal evaluó las diferencias de metilación entre casos y controles pancreáticos en cada CpG y/o ventana de CpG en mosaico. La comparación secundaria evaluó las diferencias de metilación entre casos y controles de colon. Se analizó la metilación diferencial de los marcadores del siguiente modo:

1. Evaluar las distribuciones del porcentaje de metilación para cada marcador y descartar los marcadores que estaban metilados en más del 1 % en el 10 % de los controles;

2. Probar la distribución de metilación de los marcadores restantes entre casos y controles utilizando la prueba de suma de rangos de Wilcoxon y clasificando los marcadores por valores de p; y

3. Uso de valores de Q para estimar tasas de falso descubrimiento (FDR) (Benjamini y col. (1995) “Multiple Testing” Journal of the Royal Statistical Society. Series 8 (Methodological) 57: 289-300; Storey y col. (2003) “Statistical significance for genomewide studies” Proc Natl Acad Sci U S A 100: 9440-5). En el nivel de descubrimiento, un FDR de hasta el 25 % es aceptable.

Análisis de los datos

Se desarrolló un flujo de trabajo de análisis de datos en el paquete de software de análisis estadístico R (“R: A Language and Environment for Statistical Computing” (2012), R Foundation for Statistical Computing). El flujo de trabajo comprendía las siguientes etapas: 12

1. Leer los 6.101.049 sitios de CpG

2. Identificar para el análisis adicional solo los sitios de CpG donde la profundidad de cobertura del grupo total es de 200 lecturas o más. Este límite se basó en una evaluación de potencia para detectar una diferencia de metilación de entre el 20 % y el 30 % entre dos grupos porque cualquier valor inferior a este intervalo tiene pocas posibilidades de significación. La profundidad de cobertura del grupo mide el número de lecturas para todos los sujetos en un grupo (por ejemplo, si hay 18 sujetos por grupo y cada sujeto tiene 12 lecturas, la profundidad de cobertura del grupo es 12 * 18 = 216).

3. Estimar la asociación del subtipo de la enfermedad con el % de mutilación utilizando el factor de inflación de la varianza de la regresión de Poisson; los sitios de CpG más discriminados se determinaron comparando el ajuste del modelo X2 con el percentil 95 de todos los modelos ajustados. Excluir todos los sitios de CpG donde la varianza del porcentaje de metilación entre los grupos es 0 debido a que estos sitios son sitios de CpG no informativos.

Aplicar los filtros de 2 y 3, obteniéndose un total de 1.217.523 sitios de CpG.

4. Realizar una regresión logística sobre el % de metilación (basado en los recuentos reales) utilizando grupos definidos como Colon normal, Páncreas normal y Páncreas canceroso. Dado que la variabilidad en el % de metilación entre sujetos es mayor que lo permitido por la suposición binomial, se utilizó un modelo de regresión logística sobredisperso para explicar el aumento de la varianza. Este parámetro de dispersión se estimó utilizando el x-cuadrado de Pearson del ajuste.

5. A partir de estos ajustes de modelo, calcular una estadística F general para la comparación de grupos basada en el cambio en la desviación entre los modelos con y sin cada grupo como regresor. Esta desviación fue escalada por el parámetro de dispersión estimado.

6. Crear las islas de CpG en cada cromosoma en función de la distancia entre las ubicaciones de los sitios de CpG. Aproximadamente, cuando la distancia entre dos ubicaciones de CpG supera los 100 pb, cada ubicación se define como una isla independiente. Algunas islas eran singletons y se excluyeron.

7. A partir de la definición de isla anterior, se calcula el estadístico F promedio. Cuando el estadístico F supera el 95 % (es decir, el 5 % superior) de todos los sitios de CpG para el cromosoma en particular, se genera un sumario de cifras.

El análisis adicional comprendió los siguientes filtros de selección:

1. Valor de corte p de ANOVA <0,01

2. Razones de % de metilación de cáncer de páncreas frente a páncreas normal y colon normal >10

3. % de metilación de normales <2 %

4. Número de CpG contiguos que cumplen los criterios >3

La ventana de metilación se evaluó para incluir CpG contiguos adicionales que exhiben una metilación significativa. A continuación, los candidatos se ordenaron por nombre de gen para las regiones anotadas y por ubicación cromosómica para las regiones no anotadas.

Resultados

Se cartografiaron aproximadamente 6 millones de CpG con una cobertura >10*. Más de 500 islas de CpG cumplieron con los criterios de importancia para la metilación diferencial. Después de aplicar los criterios de filtro anteriores, se identificaron 107 regiones metiladas diferencialmente (DMR) (tabla 1).

Tabla 1: DMR

(continuación)

(continuación)

(continuación)

En la tabla 1, las bases están numeradas según el ensamblaje del genoma humano GRCh37/hg19 de febrero de 2009 (véase, por ejemplo, Rosenbloom y col. (2012) “ENCOD^ewhole-genome data in the UCSC Genome Browser: update 2012” Nucleic Acids Research 40: D912-D917). Los nombres de marcador BHLHE23 y LOC63930 se refieren al mismo marcador.

En estos candidatos, las firmas de metilación van desde 3 CpG vecinos hasta 52 CpG. Algunos marcadores exhiben metilación en ambas hebras; otros están semimetilados. Dado que las hebras no son complementarias después de la conversión con bisulfito, las regiones directa e inversa se contaron por separado. Si bien la tabla 1 indica la cadena en la que se encuentra el marcador, la tecnología no se limita a detectar la metilación solo en la cadena indicada. La tecnología abarca la medición de la metilación en cadenas directas o inversas y/o en cadenas directas e inversas; y/o detectar un cambio en el estado de metilación en las cadenas directa o inversa y/o en las cadenas directa e inversa.

Los niveles de metilación de los cánceres de páncreas rara vez excedieron el 25 % en los CpG filtrados, lo que sugirió que los tejidos cancerosos pueden tener altos niveles de células normales contaminantes y/o estroma. Para probar esto, se secuenció cada uno de los cánceres en busca de mutaciones de KRAS para verificar las frecuencias alélicas de las muestras positivas. Para el 50 % que albergaba un cambio de base de KRAS heterocigoto, la frecuencia del alelo mutante fue al menos 4 veces menor que el alelo de tipo silvestre correspondiente, lo que respalda la contaminación por células normales y/o el estroma.

Se encontró que 7 de los 107 marcadores están en regiones no anotadas y se encuentran en regiones genómicas sin elementos codificantes de proteínas. Un marcador es adyacente a una secuencia reguladora de ARNnc (AK055957). De los 99 marcadores candidatos restantes, aproximadamente 30 se han descrito como asociados con el cáncer, algunos de los cuales se clasifican como supresores de tumores. Algunos ejemplos:

ADCY1 Regulado a la baja en el osteosarcoma

ELMO1 Promueve la invasión del glioma

HOXA2 Hipermetilado en el colangiocarcinoma

RSPO₃Regulador de la señalización de Wnt

SUSD5 Media las metástasis óseas en el cáncer de pulmón

KCNK12 Hipermetilado en el cáncer de colon

CLEC11A Factor de crecimiento de células madre en la leucemia

USP3 Requerido para la progresión a la fase S

Los otros 69 marcadores candidatos tienen una asociación débil previamente identificada con el cáncer (p. ej., mutaciones y/o alteraciones del número de copias observadas en los cribados de todo el genoma) o no tienen asociaciones con el cáncer previamente identificadas.

Ejemplo 2: Validación de marcadores

Para validar las DMR como marcadores de cáncer, se realizaron dos estudios de validación basados en PCR en conjuntos de muestras ampliados. El primer estudio utilizó muestras de grupos de pacientes similares a los utilizados en el ejemplo 1 (p. ej., cáncer de páncreas, páncreas normal, colon normal) y agregó muestras que comprendían ADN derivado de la capa leucocitaria de pacientes normales que no tenían antecedentes de cáncer. El segundo estudio usó una selección de cánceres de todo el tubo digestivo.

Para el primer estudio de validación, se analizó una combinación de muestras de RRBS previamente analizadas y muestras almacenadas más nuevas para verificar la precisión técnica y confirmar la reproducibilidad biológica, respectivamente. Se diseñaron cebadores de PCR específicos de metilación (MSP) para cada una de las regiones marcadoras, excluyendo solo las cadenas complementarias en casos de metilación no específica de hebra. El software informático (Methprimer) ayudó al diseño semimanual de los cebadores de MSP por parte de personal experimentado; los ensayos se probaron y optimizaron mediante qPCR con colorantes SYBR Green en diluciones de controles de ADN genómico universalmente metilados y no metilados. Las secuencias del cebador MSP, cada una de las cuales incluye de 2 a 4 CpG, se diseñaron para proporcionar un medio rápido para evaluar la metilación en las muestras y se sesgaron para maximizar la eficiencia de la amplificación. Las secuencias de cebadores y los parámetros físicos se proporcionan en la tabla 2a y la tabla 2b:

Tabla 2a: Cebadores de MSP

(continuación)

(continuación)

(continuación)

(continuación)

(continuación)

En la tabla 2a, Ta es la temperatura de hibridación optimizada y Tm es la temperatura de fusión en °C en NaCl 50 mM. Los cebadores celf2f y celf2r; LOC63930 (bhlhe23)f y LOC63930 (bhlhe23)r; PRKCBf y PRKCBr; y TOX2f y TOX2r se utilizan en una reacción en 2 etapas.

Especímenes

Se utilizaron muestras de ADN archivadas de pacientes de la Clínica Mayo para ambas validaciones. Los casos y controles se enmascararon y emparejaron por edad y sexo. El primer conjunto de muestras incluía ADN de 38 adenocarcinomas pancreáticos y controles (20 epitelios de colon normales, 15 páncreas normales y 10 capas leucocitarias normales). El segundo conjunto de muestras incluía ADN de 38 neoplasias colorrectales (20 adenocarcinomas colorrectales y 18 adenomas >1 cm), 19 adenocarcinomas esofágicos, 10 cánceres gástricos (de estómago) y 10 colangiocarcinomas.

Métodos

El ADN archivado se volvió a purificar utilizando microesferas SPRI (AMPure XP-Beckman Coulter) y se cuantificó por absorbancia. A continuación, se trataron 1-2 μg de ADN de muestra con bisulfito de sodio y se purificaron utilizando el protocolo EpiTect (Qiagen). El material eluido (10-20 ng) se amplificó en un instrumento Roche 480 LightCycler utilizando bloques de 384 pocillos. Cada placa acomodaba 4 marcadores (y patrones y controles), utilizando así un total de 23 placas. Los 88 ensayos de MSP tenían diferentes perfiles de amplificación óptimos y se agruparon en consecuencia. Las temperaturas de hibridación específicas se proporcionan en la tabla 2. Las reacciones de 20 μl se realizaron utilizando LightCycler 480 SYBR I Master mix (Roche) y 0,5 pmol de cebador durante 50 ciclos y se analizaron, en general, mediante el método de la 2a derivada incluido con el software LightCycler. Los datos sin procesar, expresados en número de copias genómicas, se normalizaron a la cantidad de ADN de entrada y se tabularon. El análisis a nivel de tejido comprendió realizar PCA (complementado con validación cruzada de múltiplo de k), regresión de red elástica y construcción de diagramas de cajas de marcadores de red elástica distintos de cero. De esta manera, los marcadores se clasificaron colectivamente. De estos candidatos, debido a la importancia de minimizar la metilación de fondo celular normal para los ensayos basados en heces y sangre, la clasificación se ponderó hacia aquellos marcadores que exhibieron el diferencial factor de cambio más alto entre casos y controles.

Resultados

Entre los 107 marcadores de ADN metilado con discriminación comprobada para cánceres gastrointestinales, la validación de MSP se realizó en 88 de los cuales se identificaron subconjuntos para mostrar datos de sumario más detallados.

Detección de cáncer de páncreas

Un subconjunto de los marcadores de metilación fue particularmente discriminatorio para el cáncer de páncreas: ABCB1, ADCY1, BHLHE23 (LOC63930), c13orf18, CACNA1C, chr12 133, CLEC11A, ELMO1, EOMES, GJC1, IHIF1, IKZF1, KCNK12, KCNN2, PCBP3, PRKCB, RSPO3, SCARF2, SLC38A3, ST8SIA1, TWIST1, VWC2, WT1 y ZNF71 (véase la tabla 1). Los valores de ABC individuales (cáncer de páncreas frente a páncreas o colon normales) para estos marcadores fueron superiores a 0,87, lo que indica una sensibilidad y especificidad clínicas superiores.

Inicialmente, los dos mejores marcadores independientes parecían ser CLEC11A y c13orf18, que tenían una sensibilidad del 95 % y el 82 % para el cáncer de páncreas, respectivamente, con una especificidad del 95 %. Experimentos adicionales diseñaron cebadores adicionales para apuntar a los CpG más específicos dentro de las DMR especificadas de marcadores seleccionados. Estos cebadores adicionales mejoraron aún más la discriminación. Por ejemplo, el diseño de una nueva MSP para el marcador PRKCB (sensibilidad inicial del 68 %) aumentó drásticamente la discriminación del cáncer de páncreas y logró una sensibilidad del 100 % con una especificidad del 100 %. Además, la mediana de la relación señal-ruido de metilación para este marcador, comparando el cáncer con el tejido normal, fue superior a 8000. Esto proporciona una métrica crítica para la detección de marcadores de cáncer en muestras con altos niveles de heterogeneidad celular normal. Tener perfiles de metilación a nivel de base de las DMR de los datos de RRBS filtrados permite la construcción de ensayos de detección altamente sensibles y específicos. Estos resultados obtenidos de los diseños de MSP mejorados demuestran que se pueden obtener especificaciones de rendimiento similares de los otros 106 DMR con mejoras de diseño, validación y formatos de prueba adicionales.

Tabla 2b: Cebadores de MSP

(continuación)

En la tabla 2b, Ta es la temperatura de hibridación optimizada y Tm es la temperatura de fusión en °C en NaCl 50 mM. Detección de otras neoplasias gastrointestinales

A continuación, se evaluaron los marcadores en el 2° conjunto de muestras, que incluía otros cánceres y precánceres gastrointestinales como se indicó anteriormente. Los métodos, incluidas las condiciones de reacción y la plataforma, fueron idénticos a la primera validación descrita anteriormente. Los datos se normalizaron a la cantidad de ADN de entrada, lo que permitió comparar el número de copias entre las dos validaciones. El análisis consistió en PCA y validación cruzada de múltiplo de k, como antes.

Algunas secuencias de metilación que se identificaron exhibieron grados extraordinarios de discriminación, incluso como marcadores independientes. Por ejemplo, IKZF1 tenía una sensibilidad del 95 % para el adenoma y del 80 % para el CRC, prácticamente sin metilación de fondo en muestras normales. Las relaciones S/N superaron los 10.000, un grado de discriminación que rara vez se ve con cualquier clase de marcadores. El ensayo de chr12.133, específico para un tramo de ADN metilado completamente sin anotar ni describir, también fue experto para detectar todos los cánceres por igual. Varios marcadores (cd1d, chr12.133, clec11a, elmo1, vwc2, zuf71) lograron individualmente una discriminación perfecta para el cáncer gástrico, al igual que twist1 para el cáncer colorrectal (tabla 6).

Predicción del sitio del tumor

Los datos recopilados durante el desarrollo de las realizaciones de la tecnología demuestran que los estados de mutilación de marcadores de ADN particulares predicen con precisión el sitio de la neoplasia. En este análisis, se utilizó un modelo de regresión de partición recursiva en un análisis de árbol de decisión basado en combinaciones de marcadores con desempeño complementario para generar una clasificación robusta del sitio.

En particular, se realizaron análisis estadísticos para validar la sensibilidad y especificidad de las combinaciones de marcadores. Por ejemplo, usando un modelo de “bosque aleatorio” (véase, por ejemplo, Breiman (2001) “Random Forests” Machine Learning 45: 5-32), los modelos de árbol se construyeron utilizando la regresión de árbol de partición recursiva, por ejemplo, como se implementa en el paquete rPart en el software estadístico R. La regresión de árbol de partición recursiva es una técnica de regresión que intenta minimizar una función de pérdida y, por lo tanto, maximizar el contenido de información para problemas de clasificación. El árbol se construye mediante el siguiente proceso: primero se encuentra la única variable que mejor divide los datos en dos grupos. Los datos se separan y luego este proceso se aplica por separado a cada subgrupo, y así sucesivamente hasta que los subgrupos alcancen un tamaño mínimo o hasta que no se pueda realizar ninguna mejora. La segunda etapa del procedimiento consiste en utilizar la validación cruzada para recortar el árbol completo. Se calcula una estimación de riesgo con validación cruzada para un conjunto anidado de subárboles y se produce un modelo final a partir del subárbol con la estimación de riesgo más baja. Véase, por ejemplo, Therneau (2012) “An Introduction to Recursive Partitioning Using RPART Routines”, disponible en The Comprehensive R Archive Network; Breiman y col. (1983) “Classification and Regression Trees” Wadsworth, Belmont, CA; Clark y col. (1992) “Tree-based models” in J.M. Chambers y T.J. Hastie, eds., Statistical Models in S, capítulo 9. Wadsworth and Brooks/Cole, Pacific Grove, CA; Therneau (1983) “A short introduction to recursive partitioning” Orion Technical Report 21, Stanford University, Department of Statistics; Therneau y col. (1997) “An introduction to recursive partitioning using the rpart routines” Divsion of Biostatistics 61, Mayo Clinic.

Como se usa en este análisis, la clasificación es lesión en la porción alta del tubo digestivo frente a lesión en la parte baja del tubo digestivo frente a muestras normales. En cada nodo de la regresión, se consideran todas las variables a introducir, pero solo se introduce la variable con la mayor disminución en el riesgo del resultado previsto. Se añaden nodos posteriores al árbol hasta que no hay cambio del riesgo. Para evitar el sobreajuste, se utilizó la regresión de bosque aleatorio. En esta estrategia, se generaron 500 árboles de predicción mediante el muestreo con reemplazo y la selección aleatoria de variables. Para determinar la importancia de la i-ésima variable, la i-ésima variable se deja de lado y se comparan las tasas de error correspondientes para el ajuste completo (incluidos todos los datos) frente al ajuste reducido (todos los datos excepto la i-ésima variable) usando las 500 predicciones.

Se construyó un bosque de 500 árboles para probar el poder predictivo de los marcadores candidatos para discriminar entre tejido normal, lesiones en la parte alta del tubo digestivo y lesiones en la parte baja del tubo digestivo. Este procedimiento se realiza a un nivel muy alto de robustez. Primero, para cada creación de árbol, se toma una muestra de arranque del conjunto de datos para crear un conjunto de entrenamiento y todas las observaciones no seleccionadas se utilizan como conjunto de validación. En cada rama del árbol, se usa y evalúa un subconjunto aleatorio de marcadores para determinar el mejor marcador para usar en ese nivel particular del árbol. En consecuencia, todos los marcadores tienen la misma posibilidad de ser seleccionados. La técnica proporciona una validación y una evaluación rigurosas de la importancia relativa de cada marcador. A cada uno de los 500 árboles se le permite “votar” a qué clase pertenece una muestra en particular y gana la mayoría de votos. La tasa de clasificación errónea estimada se estima a partir de todas las muestras no utilizadas para un árbol en particular.

Para probar la importancia relativa de un marcador dado, se usa nuevamente el conjunto de validación. Aquí, una vez que se ajusta un árbol, los datos de validación se transmiten al árbol y se anota la tasa de clasificación correcta. A continuación, los valores del marcador se permutan aleatoriamente dentro del m-ésimo marcador, se pasan por el árbol y se vuelve a anotar la clasificación correcta. Si un marcador tiene una gran importancia, los datos reales proporcionan una mejor clasificación que los datos permutados aleatoriamente. La clasificación errónea por los datos permutados se conoce como disminución media de la precisión. Si un marcador no es importante, los datos reales proporcionarán una clasificación similar a la de los datos permutados aleatoriamente. La figura 1 es una gráfica de la importancia del marcador medida por la disminución media de la precisión. Las líneas verticales están en 2,5 % y 5 %. Estos datos indican que, por ejemplo, para clec11a, la disminución media estimada de la precisión es de aproximadamente un 12 %, lo que indica que cuando se permutan aleatoriamente los resultados de este marcador, la precisión general de la predicción disminuye un 12 %. La figura 1 enumera los marcadores en orden de importancia.

La tasa de clasificación errónea general estimada de los 500 árboles en el bosque fue de 0,0989. Los resultados del proceso de votación en los 500 árboles del bosque se resumen en la tabla 3 y se amplían por subtipo en la tabla 4. En las tablas, el tipo de muestra de tejido se enumera en la primera columna (p. ej., no canceroso (“Normal”), cáncer en la porción alta del tubo digestivo (“Alta”) o cáncer en la porción baja del tubo digestivo (“Baja”) en la tabla 3; adenoma (“Ad”), colon normal (“Colo Normal”), cáncer colorrectal (“CRC”), cáncer de esófago (“Eso C”), cáncer de páncreas (“Pan C”), páncreas normal (“Pan Normal”), y cáncer de estómago (“Estómago C”) en la tabla 4). Se proporciona una clasificación cuantitativa de la muestra por el análisis como un número en las columnas 1, 2 o 3, para la clasificación como cáncer en la porción alta del tubo digestivo (columna 1), cáncer en la porción baja del tubo digestivo (columna 2) o tejido normal (columna 3), respectivamente. Los números proporcionan una medida que indica la tasa de éxito del clasificador (por ejemplo, la cantidad de veces que el clasificador clasificó el tipo de muestra en la primera columna como el tipo indicado en la primera fila).

Tabla 3

Tabla 4

Un análisis adicional demostró que una combinación de dos marcadores predijo con precisión el sitio del tumor en >90 % de las muestras, las 17 mejores combinaciones de dos marcadores predijeron con precisión el sitio del tumor en >80 % de las muestras y las 49 combinaciones principales predijeron con precisión el sitio del tumor en el 70 % de las muestras. Esta observación de que múltiples combinaciones de marcadores de metilación del ADN predicen con precisión el sitio del tumor demuestra la solidez de la tecnología.

Utilizando los dos marcadores superiores en el árbol de decisión de partición recursiva, todos los tejidos normales se clasificaron correctamente como normales, todos los cánceres gástricos se clasificaron correctamente como en la porción alta del tubo digestivo, casi todos los cánceres de esófago y páncreas se clasificaron correctamente como en la porción alta del tubo digestivo y casi todos los cánceres colorrectales y los precánceres (adenomas) se clasificaron correctamente como en la porción baja del tubo digestivo. Durante el desarrollo de las realizaciones de la tecnología proporcionada en la presente descripción, los análisis estadísticos se centraron en un conjunto de marcadores específicos que consisten en c lec lla , c13orf18, kcnn2, abcbl, slc38a3, cdlc, ikzfl, adcyl, chrl2133, rspo3 y tw istl. En particular, los análisis estadísticos descritos anteriormente estaban dirigidos a identificar conjuntos de marcadores (p. ej., que tienen dos o más marcadores) que proporcionan un mayor poder para identificar el cáncer y/o discriminar entre cánceres. La tabla 5 resume la precisión de cada conjunto de marcadores por pares, a saber, c lec lla , c13orf18, kcnn2, abcbl, slc38a3, cdlc, ikzfl, adcyl, chr12133, rspo3 y tw istl. Según este análisis, el par de marcadores que consiste en c le c lla y twistl es el más informativo, pero varias otras combinaciones tienen una precisión similar.

Tabla 5: Precisión para la predicción del sitio usando varias combinaciones de marcadores

(continuación)

Ejemplo 3: Análisis de la ABC de marcadores individuales

El análisis estadístico incluyó análisis de componentes principales para identificar combinaciones lineales no correlacionadas de los marcadores cuya varianza explica el mayor porcentaje de variabilidad observada en los datos originales. El análisis determinó las ponderaciones relativas de cada marcador para discriminar entre grupos de tratamiento. Como resultado de este análisis, se determinaron los valores finales de ABC para un subconjunto de marcadores que miden el poder de cada marcador para discriminar un cáncer específico (esófago, estómago, páncreas, colorrectal y adenoma) de 1) los otros tipos de cáncer y de 2) muestras normales (p. ej., que no comprendan tejido canceroso o que no provengan de un paciente con cáncer o que pueda desarrollar cáncer). Estos datos se muestran en la figura 6.

Tabla 6: Valores de ABC para un subconjunto de marcadores

(continuación)

Ejemplo 4: Esófago de Barrett y cáncer de esófago

El desarrollo de cáncer de esófago está estrechamente relacionado con la metaplasia epitelial de Barrett y el adenocarcinoma de páncreas surge de metaplasias individuales de células mucosas. Véase, por ejemplo, Biankin y col. (2003) “Molecular pathogenesis of precursor lesions of pancreatic ductal adenocarcinoma” Pathology 35:14-24; Cameron y col. (1995) “Adenocarcinoma of the esophagogastric junction and Barrett's esophagus” Gastroenterology 109: 1541-1546.

Para frenar significativamente la creciente incidencia de adenocarcinoma esofágico, se necesitan métodos eficaces para detectar en la población el precursor crítico del esófago de Barrett (EB). Se han propuesto herramientas mínimamente invasivas o no invasivas para la detección del EB, pero se han visto obstaculizadas por la falta de marcadores específicos y de sensibilidad óptima. Los marcadores de cribado deseados discriminan el e B de la mucosa esofagogástrica normal. Ciertos genes metilados aberrantemente están asociados como marcadores candidatos para el EB (véase, por ejemplo, Gastroenterology 2011; 140: S-222).

Por consiguiente, durante el desarrollo de las realizaciones de la tecnología se realizaron experimentos para evaluar el valor de marcadores de ADN metilados seleccionados para discriminar el BE del esófago escamoso adyacente (EE) y cardias gástrico (CG) y del EE y el CG en controles sanos.

Los pacientes con y sin EB conocido fueron reclutados antes de la endoscopia rutinaria de la porción alta del tubo digestivo. Los casos de EB tenían >1 cm de longitud de la mucosa columnar circunferencial con metaplasia intestinal confirmada histológicamente; los controles no tenían EB según lo determinado endoscópicamente. Se obtuvieron biopsias en casos de EB, CG (1 cm por debajo de la línea Z) y EE (>2 cm por encima del EB), y en controles de CG (como para el EB) y EE (5 cm por encima de la línea Z), y se congelaron rápidamente. Las muestras de biopsia se procesaron como un lote y se analizaron con enmascaramiento. Después de la extracción de ADN y el tratamiento con bisulfito, se analizó la metilación en los genes diana mediante PCR específica de metilación para los marcadores APC, HPP1, SFRP1 y mediante ensayo QuARTS para los marcadores Bm P3 y NDRG4. La p-actina se cuantificó como marcador de control para el ADN humano total.

Entre 25 casos de EB y 22 controles, la mediana de edad fue de 67 (rango 39-83) y 50 (rango 20-78), respectivamente, y los hombres representaron el 72 % y el 46 % de los sujetos en los grupos EB y control, respectivamente. La mediana de longitud del EB fue de 6 cm (rango 2-14 cm). Excepto para APC, la mediana de los niveles de marcadores metilados fue significativa y sustancialmente (por ejemplo, 200-1100 veces) más alta en el EB que en el EE y el CG adyacentes o en relación con EE y CG normales. Las sensibilidades para BE en varias especificidades se muestran para cada marcador (tabla 7). Los marcadores metilados fueron significativamente más altos en el CG adyacente al E^bque en el CG de controles normales. La APC metilada fue mayor en el EB que en EE, pero no distinguió el EB del CG. En contraste con los marcadores metilados, las distribuciones de p-actina fueron similares en todos los grupos de tejidos. Los niveles de marcador aumentaron con la longitud del EB para NDRG4, SFRP1, BMP3 y HPP1 (p = 0,01, 0,01, 0,02 y 0,04, respectivamente). Los factores que no afectaron significativamente los niveles de los marcadores incluyeron la edad, el sexo, la inflamación y la presencia de displasia (ninguno (8), grado bajo (6), grado alto (11)).

Como tal, estos datos demuestran que los marcadores de ADN metilado seleccionados discriminan altamente el EB del CG y el EE, y proporcionan aplicaciones de detección útiles.

Tabla 7

Ejemplo 5: Marcadores de ADN metilado en jugo pancreático que discriminan el cáncer de páncreas de la pancreatitis crónica y los controles normales

El análisis del jugo pancreático se ha explorado como una estrategia mínimamente invasiva para la detección temprana del cáncer de páncreas (CP). Sin embargo, la citología y muchos marcadores moleculares en el jugo pancreático han demostrado ser insensibles o no lograron distinguir el CP de la pancreatitis crónica (véase, por ejemplo, J Clin Oncol 2005; 23: 4524). Se realizaron experimentos para verificar que el ensayo de genes aberrantemente metilados puede representar una estrategia más precisa para la detección del CP a partir del jugo pancreático (véase, por ejemplo, Cancer Res 2006; 66: 1208). En particular, se recolectaron datos para evaluar marcadores seleccionados de ADN metilado analizados a partir del jugo pancreático para discriminar casos de pacientes con CP de controles con pancreatitis crónica (PC) o un páncreas normal (PN).

Un panel de 110 pacientes (66 CP, 22 PC, 22 controles de PN) se sometieron a recolección de jugo pancreático estimulado con secretina durante una ecografía endoscópica. Los diagnósticos se confirmaron histológicamente para CP y radiográficamente para PC y PN. El jugo se congeló rápidamente y se almacenó a -80 °C. Los ensayos se realizaron con enmascaramiento en muestras descongeladas por lotes. Los marcadores de ADN metilado candidatos se seleccionaron mediante secuenciación del metiloma completo en un estudio de tejido separado. Después de extraer el ADN del jugo pancreático y tratarlo con bisulfito, se determinó la mutilación del gen mediante PCR específica de mutilación para CD1D, CLEC11A y KCNN₂, o mediante QuARTS para BMP3 y NDRG4. Las mutaciones de KRAS (7 en total) se analizaron mediante QuARTS (la presencia de cualquier mutación de KRAS se consideró positiva). QuARTS también analizó la p-actina, un marcador de ADN humano, para controlar la cantidad de ADN.

Respectivamente para CP, la PC y el PN, la mediana de edad fue de 67 (rango 43-90), 64 (rango 44-86) y 60 (rango 35-78); los hombres representaron el 56, 68 y 21 % de estos grupos, respectivamente. Todos los marcadores discriminaron el CP del PN pero en un grado variable. La ABC fue de 0,91 (IC del 95 %, 0,85-0,97), 0,85 (0,77-0,94), 0,85 (0,76-0,94), 0,78 (0,67-0,89), y 0,75 (0,64-0,87) para CD1D, NDRG4, CLEC11A, KCNN₂y BMP3 metilados, respectivamente, y de 0,75 (0,64-0,86) para KRAS mutante. La discriminación para CP mediante CD1D fue significativamente mayor que mediante K^rA ^s(p = 0,01), KCNN₂(p = 0,02) o BMP3 (p<0,01). Las tasas de positividad en CP y PC se muestran para cada marcador en los puntos de corte de especificidad normales del 95 y 100 % (tabla 8); la tasa de positividad en la PC (falsos positivos) fue más baja con CD1D y más alta con KRAS. Los niveles del marcador no se vieron afectados significativamente por el sitio de del CP (cabeza, cuerpo, cola) o el estadio (N0 frente a N1). Los niveles de p-actina fueron similares en todos los grupos de pacientes.

Estos datos muestran que los marcadores de ADN metilado discriminan el CP de la PC y el PN cuando se analizan a partir de jugo pancreático, por ejemplo, jugo pancreático estimulado con secretina. En particular, el CD1D metilado fue significativamente más sensible para el CP y mostró sustancialmente menos falsos positivos con PC que el KRAS mutante.

Tabla 8

Ejemplo 6: Panel de marcadores de ADN sensible para la detección de cáncer de páncreas mediante ensayo en jugo pancreático

El análisis del jugo pancreático representa una estrategia mínimamente invasiva para la detección del cáncer de páncreas (CP) y el precáncer. Se ha observado que marcadores específicos de ADN metilado en el jugo pancreático discriminan el Cp de la pancreatitis crónica (PC) y el páncreas normal (Gastroenterology 2013;144:S-90), pero los nuevos marcadores y combinaciones de marcadores siguen sin explorarse.

Se realizaron experimentos para evaluar el valor de marcadores de ADN metilado descubiertos recientemente y KRAS mutante analizado solo y combinado en jugo pancreático para discriminar el CP de la pancreatitis crónica (PC) y los controles de referencia (CON).

Se estudiaron 167 pacientes (85 CP, 30 PC, 23 neoplasia mucinosa intraductal premaligna (IPMN), 29 CON) que se habían sometido a recolección de jugo pancreático estimulado con secretina durante la EUS. Los diagnósticos se basaron histológicamente para CP, radiográficamente para la PC e histológica o radiográficamente para la IPMN. La especificidad se basó en CON, que incluía pacientes con factores de riesgo de CP, enzimas pancreáticas elevadas o síntomas GI pero páncreas radiográficamente normales. Las muestras de jugo archivadas a -80 °C se analizaron por lotes con enmascaramiento. En el ADN extraído de 200 μl de jugo pancreático, se determinó la metilación del gen después del tratamiento con bisulfito mediante amplificación cuantitativa de la señal y la diana en tiempo real específica del alelo (QuARTS) para el ensayo de ADCY1, CD1D, BMP3, PRKCB, KCNK12, C13ORF18, IKZF1, CLEC11A, TWIST1, NDRG4, ELMO y 55957. Las mutaciones de KRAS mutante (7 en total) y p-actina (un marcador para el ADN humano total) también se analizaron mediante QuARTS. A partir de datos cuantitativos, se siguió un algoritmo para lograr una discriminación óptima mediante un panel que combinaba todos los marcadores.

Respectivamente para CP, PC, IPMN y CON: la mediana de edad fue 67 (IQR 60-77), 66 (55-77), 66 (60-76) y 70 (62 77); los hombres comprendían el 52, 53, 49 y 72 %. En los puntos de corte de especificidad respectivos del 90 % y el 95 %: el panel de marcadores combinados logró las sensibilidades de CP más altas (88 % y 77 %); ADCY1, el marcador único más sensible, detectó un 84 % y un 71 %. Otros marcadores únicos detectaron CP pero en grados variables (tabla). La discriminación global por área bajo la curva ROC fue mayor por panel que por cualquier marcador individual (p<0,05), excepto ADCY1 (tabla). Con una especificidad del 90 %, el panel detectó el 44 % de todas las IPMN y el 75 % (3/4) del subconjunto con displasia de alto grado. Las tasas de positividad fueron sustancialmente más bajas en la PC que en el CP para todos los marcadores que se muestran en la tabla 7 (p<0,0001). Con una especificidad del 100 %, el panel fue positivo en el 58 % de CP, el 17 % de IPMN y el 13 % de P^c. En consecuencia, estos resultados demuestran que un panel de nuevos marcadores de ADN metilado y KRAS mutante analizados a partir de jugo pancreático logra una alta sensibilidad para el CP.

Tabla 7: Tasas de positividad de marcador en jugo pancreático de pacientes con cáncer de páncreas (CP), ______________ neoplasia mucinosa papilar intraductal (IPMN) y pancreatitis crónica (PC).______________

Ejemplo 7: Detección de cáncer de páncreas en una muestra de heces utilizando el marcador CD1D.

Se recolectaron muestras de heces de 45 personas con cáncer de páncreas y 45 personas que no tenían cáncer de páncreas y se analizaron para detectar la presencia del marcador CD1D. El cáncer de páncreas se detectó con éxito utilizando el marcador CD1D en las heces.

Ejemplo 8: Nuevos marcadores de metilación del ADN asociados con el cáncer de páncreas en estadio temprano.

Descripción general del estudio:

En estudios de tejido de casos y controles independientes, se realizaron experimentos para identificar marcadores de metilación novedosos y altamente discriminantes para cáncer de páncreas utilizando RRBS para la fase de descubrimiento y PCR específica de metilación (MSP) para la fase de validación.

Población de estudio:

Después de la aprobación de la Junta de Revisión Institucional de la Clínica Mayo, se identificaron muestras de tejido de los registros de cáncer existentes. La población accesible incluyó a aquellos que se sometieron a pancreatectomía distal, pancreaticoduodenectomía, colectomía o biopsia de colon con una muestra archivada congelada. Todos los tejidos fueron revisados por un anatomopatólogo gastrointestinal experto para confirmar la clasificación correcta. Las muestras de casos de cáncer de páncreas incluyeron tejidos de adenocarcinoma ductal pancreático limitados a la enfermedad en estadio temprano (AJCC estadio I y II) (Edge SBB, D.R.; Compton, C.C.; Fritz, A.G.; Greene, F.L.; Trotti, A. (Eds.), editor. AJCC Cancer Staging Manual. 7a ed: Springer, Nueva York; 2010). Se excluyeron las neoplasias derivadas de lesiones de IPMN. Se estudiaron dos grupos de control. El primero, denominado “páncreas normal”, incluía los márgenes de resección histológicamente normales de bajo riesgo (cistoadenoma seroso) o neoplasias pancreáticas focales (tumores neuroendocrinos). El segundo grupo de control incluía tejidos epiteliales colónicos de pacientes que se confirmó que estaban libres de cáncer de páncreas o de neoplasia colónica. Los casos y ambos controles se emparejaron por sexo edad (en incrementos de 5 años) y condición de fumador (actual o anterior frente a nunca). En un laboratorio central, se microdiseccionaron tejidos de casos y controles y se extrajo el ADN utilizando una técnica de fenol-cloroformo, lo que arrojó al menos 500 ng de ADN. La identificación de casos, la comparación y la extracción de ADN fueron realizadas por personal independiente para mantener el enmascaramiento del personal de laboratorio sobre el estado de casos y controles.

Secuenciación con bisulfito de representación reducida:

Preparación de la biblioteca (Gu H, Bock C, Mikkelsen TS, Jager N, Smith ZD, Tomazou E, y col. Genome-scale DNA methylation mapping of clinical samples at single-nucleotide resolution. Nat Methods. 2010;7:133-6): El ADN genómico (300 ng) se fragmentó mediante digestión con 10 unidades de Msμl, una enzima de restricción específica de metilación que reconoce motivos que contienen CpG. Esto enriquece las muestras en contenido de CpG y elimina áreas redundantes del genoma. Los fragmentos digeridos se repararon en los extremos y se formaron colas en A con 5 unidades de fragmento Klenow (3'-5' exo-) y se ligaron durante la noche a adaptadores TruSeq metilados (Illumina, San Diego, CA) que contenían una de las cuatro secuencias de código de barras (para vincular cada fragmento a su ID de muestra). La selección de tamaño de fragmentos de 160-340 pb (insertos de 40-220 pb) se realizó usando microesferas/tampón Agencourt AMPure XP SPRI (Beckman Coulter, Brea CA). Los puntos de corte del tampón fueron de 0,7X a 1,1X de volúmenes de muestra de microesferas/tampón. El volumen de elución final fue de 22 ul (tampón EB - Qiagen, Germantown MD). Se usó qPCR para medir la eficiencia de la ligadura y la calidad de los fragmentos en una pequeña alícuota de muestra. A continuación, las muestras se sometieron a conversión de bisulfito (dos veces) utilizando un protocolo EpiTect modificado (Qiagen). La qPCR y la PCR convencional (PfuTurbo Cx hotstart - Agilent, Santa Clara CA) seguidas de la evaluación Bioanalyzer 2100 (Agilent) en alícuotas de muestras convertidas determinaron el número óptimo de ciclos de PCR antes de la amplificación de la biblioteca final. Condiciones para la PCR final: 50 ul de rxn: 5 ul de tampón 10X, 1,25 ul de cada dNTP 10 mM, 5 ul de cóctel de cebadores (~5 uM), 15 ul de cadena molde (muestra), 1 ul de PfuTurbo Cx hotstart, 22,75 de agua. 95 C-5 min; 98 C-30 s; 16 ciclos de 98 C-10 s, 65 C-30 s, 72 C-30 s; 72 C-5 min; 4 C Las muestras se combinaron (equimolarmente) en bibliotecas de 4 unidades de plexado según el esquema de aleatorización y se analizaron con el bioanalizador para verificar el tamaño final y con qPCR usando patrones phiX y cebadores específicos de adaptador.

Secuenciación y bioinformática:

Las muestras se cargaron en carriles de celdas de flujo según una asignación aleatoria de carriles con carriles adicionales reservados para controles de ensayo internos. La secuenciación se realizó por el Next Generation Sequencing Core en el Medical Genome Facility de la Clínica Mayo en un instrumento Illumina HiSeq 2000. Las lecturas fueron unidireccionales durante 101 ciclos. Cada carril de celda de flujo generó 100-120 millones de lecturas, suficiente para una mediana de cobertura de 30 a 50 veces la profundidad de secuenciación (número de lecturas por CpG) para secuencias alineadas. Se usó el software de flujo de trabajo de Illumina estándar para realizar las llamadas de bases y la generación de lecturas de secuencias en formato fastq. Como se describió anteriormente (Sun Z, Baheti S, Middha S, Kanwar R, Zhang Y, Li X, y col. SAAP-RRBS: streamlined analysis and annotation pipeline for reduced representation bisulfite sequencing. Bioinformatics. 2012;28:2180-1), SAAP-RRBS, un flujo de trabajo de anotación y análisis optimizado para la secuenciación de bisulfito de representación reducida, se utilizó para la alineación de secuencias y la extracción de metilación.

Estudios de validación por PCR específica de metilación:

Descripción general: Se realizaron dos estudios de validación basados en MSP en conjuntos de muestras ampliados para confirmar la precisión y la reproducibilidad de los candidatos metilados diferencialmente observados. El primero, un estudio de validación interna, se llevó a cabo en muestras sin enmascaramiento y no emparejadas usando réplicas biológicas y técnicas de cáncer pancreático y colon normal y réplicas técnicas de páncreas normal. Esta etapa se realizó para garantizar que los sitios de metilación diferencial identificados por la filtración de datos de RRBS, donde el % de metilación era la unidad de análisis, se reflejarían en MSP, donde la unidad de análisis es el número absoluto de copias genómicas de la secuencia diana, corregido por la concentración de ADN de entrada para cada muestra. El segundo, un experimento de validación externa, utilizó MSP para probar los mejores candidatos en muestras de cáncer de páncreas independientes, páncreas benigno y de colon asignadas al azar, emparejadas, con enmascaramiento.

Diseño de cebadores: Los cebadores para cada marcador se diseñaron para que se dirigiesen a las secuencias metiladas modificadas con bisulfito de cada gen diana (IDT, Coralville IA) y una región sin sitios de citosina-fosfatoguanina en el gen de p-actina, como referencia de tratamiento con bisulfito y entrada de ADN. El diseño se realizó mediante el software Methprimer (Universidad de California, San Francisco CA) o mediante métodos semimanuales (por H.Z y W.R.T). A continuación, los ensayos se probaron y optimizaron mediante qPCR con colorantes SYBR Green (Life Technologies, Grand Island, NY) en diluciones de controles de ADN genómico universalmente metilados y no metilados.

PCR específica de metilación: Las reacciones de MSP se realizaron en ADN extraído de tejido como se describió anteriormente (Kisiel JB, Yab TC, Taylor WR, Chari ST, Petersen GM, Mahoney DW, y col. Stool DNA testing for the detection of pancreatic cancer: assessment of methylation marker candidates. Cancer. 2012;118:2623-31). Brevemente, el ADN se trató con bisulfito utilizando el kit de metilación de ADN EZ (Zymo Research, Orange, CA) y se eluyó en tampón. Se usó un μl de ADN tratado con bisulfito como molde para la cuantificación de la metilación con una PCR en tiempo real basada en fluorescencia, realizada con la mezcla maestra SYBR Green (Roche, Mannheim, Alemania). Las reacciones se realizaron en Roche 480 LightCycler (Indianápolis, IN), donde se usó ADN metilado universal CpGenome tratado con bisulfito (Millipore, Billerica, MA) como control positivo y se diluyó en serie para crear curvas patrón para todas las placas. Las secuencias de oligonucleótidos y las temperaturas de hibridación están disponibles previa petición.

Análisis estadístico

RRBS: La principal comparación de interés fue la diferencia de mutilación entre los casos y los controles pancreáticos en cada CpG cartografiada. Las islas de CpG se definen bioquímicamente por una relación de CpG observada a esperada superior a 0,6 (Gardiner-Garden M, Frommer M. CpG islands in vertebrate genomes. Journal of molecular biology 1987;196:261-82). Sin embargo, para este modelo, se crearon unidades de mosaico de análisis de CpG de “región metilada diferencialmente (DMR)” en función de la distancia entre las ubicaciones de los sitios de CpG para cada cromosoma. Como la distancia entre cualquier CpG excedía la ubicación anterior o siguiente en más de 100 pb, se creaba un nuevo identificador de isla. Se excluyeron las islas con un solo CpG. El resultado secundario fue la misma comparación entre casos y controles de colon. Los sitios de CpG individuales se consideraron para el análisis diferencial solo si la profundidad total de cobertura por grupo de enfermedad era >200 lecturas (lo que equivale aproximadamente a un promedio de 10 lecturas por sujeto) y la variación del % de metilación era mayor que cero (se excluyeron sitios de CpG no informativos con varianza 0). Los criterios para la profundidad de lectura se basaron en el poder estadístico deseado para detectar una diferencia del 10 % en la tasa de metilación entre dos grupos en los que el tamaño de la muestra de individuos para cada grupo era 18.

La significación estadística se determinó mediante regresión logística sobre el % de metilación por DMR (utilizando los recuentos reales) con los grupos definidos como cáncer de páncreas, páncreas normal y colon normal. Para tener en cuenta las diferentes profundidades de lectura entre sujetos individuales, se utilizó un modelo de regresión logística sobredisperso, donde el parámetro de dispersión se estimó utilizando la estadística de x-cuadrado de Pearson de los residuos del modelo ajustado. Para evaluar la metilación específica de la hebra, las regiones directa e inversa se analizaron por separado. A continuación, las DMR se clasificaron según su nivel de significación y se consideraron como una región marcadora viable si la tasa de metilación en los controles era <1 % pero >10 % en el cáncer de páncreas. Cada DMR significativa se consideró como un marcador candidato.

Para el estudio de validación interna, el resultado principal fue el área bajo la curva de características operativas del receptor (ABC) para cada marcador. Esto se calculó mediante regresión logística (JMP versión 9.0.1, SAS Institute, Cary NC) para modelar la fuerza del número de copias corregido por concentración de cada marcador con cáncer de páncreas en comparación con páncreas y colon normales. Los marcadores con los valores de ABC más altos y la proporción más amplia de la mediana del número de copias genómicas entre casos y controles fueron seleccionados para el estudio de validación externa. El resultado principal del experimento de validación externa fue la ABC de cada marcador representado frente a la intensidad de la señal de cada marcador, medida por el logaritmo de la proporción de la mediana del número de copias corregidas en los casos en comparación con los controles. Con dieciocho casos, hay una potencia >80 % para detectar un área bajo la curva de 0,85 o superior a partir de la hipótesis nula de 0,5 con un nivel de significación bilateral de 0,05. El criterio de valoración secundario fue la ABC de las combinaciones de dos marcadores, medida mediante regresión logística, en la que se requería que ambos marcadores se asociaran de forma independiente con los casos de cáncer de páncreas.

Descubrimiento de marcadores de RRBS

Se secuenciaron mediante RRBS de extractos de ADN asignados aleatoriamente, emparejados y con enmascaramiento de 18 tumores de cáncer pancreático, 18 tejidos de control pancreático benigno y 18 tejidos epiteliales colónicos normales. La mediana de edad fue de 61 años (rango intercuartílico 52-65), el 61 % eran mujeres y el 44 % eran fumadores actuales o anteriores. Se capturó un total de 6.101.049 sitios de CpG en cualquiera de las muestras con una cobertura de al menos 10X. Después de seleccionar solo los sitios de CpG donde se cumplían los criterios de varianza y cobertura de grupo, se consideraron un total de 1.217.523 sitios de CpG para el análisis. Aproximadamente 500 DMR cumplieron los criterios de importancia para la metilación diferencial. Entre estos, se identificaron 107 regiones candidatas con suficientes firmas de metilación para el diseño de cebadores de MSP. Las firmas de metilación oscilaron entre 3 CpG vecinos y 52 CpG. Los niveles de metilación de los cánceres de páncreas rara vez superaron el 25 % en los CpG filtrados, lo que refleja altos niveles de células estromales contaminantes. Esto se confirmó después de secuenciar cada uno de los cánceres para detectar mutaciones de KRAS para verificar las frecuencias alélicas de las muestras positivas; para el 50 % de los especímenes de cáncer de páncreas que albergaban un cambio de base heterocigoto de KRAS, la frecuencia del alelo mutante fue al menos 4 veces menor que el alelo de tipo silvestre correspondiente.

Validación interna

En función del número de CpG vecinos en cada firma de metilación del gen candidato, se diseñaron cebadores para 87 de los 107 marcadores candidatos. A continuación, se usó MSP para analizar los candidatos en muestras de ADN de 20 lesiones de cáncer de páncreas adicionales sin ocultación, 10 muestras epiteliales colónicas normales adicionales (réplicas biológicas) así como el resto de muestras de ADN de las 18 lesiones de cáncer de páncreas secuenciadas, 15 de los tejidos pancreáticos benignos secuenciados y 10 de las muestras de colon normales secuenciadas (réplicas técnicas). Con diseños de cebadores de primer pase, 74 de 87 marcadores se amplificaron con éxito. Con el rediseño, los 13 cebadores restantes se amplificaron con éxito y se analizaron en 12 muestras de cáncer de páncreas sin enmascaramiento y 10 muestras de colon normal. La p-actina se amplificó en todas las muestras. Con MSP de primer o segundo pase, 31 de 87 marcadores candidatos tenían una ABC >0,85. En función de la magnitud de la diferencia en la mediana del número de copias genómicas entre casos y controles para cada marcador candidato, se seleccionaron 23 para validación externa en muestras independientes. Estos fueron ABCB1, ADCY1, BMP3, C13ORF18, CACNA1C, CD1D, CHR12:133484978-133485738 (CHR12 133), CLEC 11A, ELMO1, FOXP2, GRIN2D, IKZF1, KCNK12, KCNN2, NDRG4, PRKCB, RSPO3, SCARF2, SHH, SLC38A3, TWIST1, VWC3 y WT1.

Validación externa

Las muestras de ADN asignadas aleatoriamente, emparejadas y con ocultación de 18 cánceres de páncreas, 18 páncreas benignos y 36 epitelios colónicos normales se analizaron mediante MSP en busca de los 23 principales candidatos. La mediana de edad de este subconjunto fue de 60 años (rango intercuartílico 54-64). La mayoría (55 %) de las muestras procedían de hombres y el 61 % eran fumadores actuales o anteriores. La fi-actina se amplificó en todas las muestras. 9 de 23 candidatos mostraron excelente asociación con el cáncer de páncreas. Los valores de ABC individuales para CACNA1C, CHR12.133, WT1, GRIN2D, ELMO1, TWIST1, C13ORF18, KCNN2, Y CLEC11A fueron 0,95, 0,95, 0,94, 0,94, 0,93, 0,92, 0,91, 0,90 y 0,90, respectivamente. Se vio buena asociación con otros 9 candidatos; los valores de ABC para PRKCB, CD1D, SLC38A3, ABCB1, KCNK12, VVVC2, RSPO3, SHH y ADCY1 fueron 0,89, 0,88, 0,86, 0,86, 0,86, 0,85, 0,85, 0,85 y 0,84 respectivamente.

La relación logarítmica de la mediana de los valores de casos y controles para cada marcador se representó frente a la ABC. Ocho marcadores, SHH, KCNK12, PRKCB, CLEC11, C13ORF18, TWIST1, ELMO1 y CHR12.133 tenían cada uno una ABC superior a 0,85 y mostraron un número de copias genómicas superior a 1,5 log (>30 veces) mayor entre los casos que entre los controles. KCNK12, PRKCB, ELMO1 y CHR12.133 mostraron una diferencia superior a 2 log (>100 veces).

Análisis de la complementariedad

Entre las 231 combinaciones posibles de 2 marcadores, ambos marcadores siguieron siendo muy significativos en 30 (13 %) modelos de asociación por pares con cáncer de páncreas. De ellas, 18 (8 %) mostraron una mejora de la ABC. Cabe destacar que entre varios marcadores complementarios, C13ORF18 mejoró la precisión de CACNA1C, WT1, GRIND2D, SLC38A3 y SCARF2 con una ABC de 0,99, 0,99, 0,97, 0,96 y 0,95, respectivamente, para cada combinación. Aunque la ABC para SHH como marcador individual fue de 0,85, mejoró el rendimiento de otros 6 marcadores cuando se emparejaron. Las ABC de CACNA1C, WT1, SLC38A3, ABCB1, VWC2 y RSPO3 mejoraron a 0,96, 0,95, 0,92, 0,98, 0,88 y 0,95, respectivamente, cuando se combinaron en modelos con SHH. De las 18 combinaciones de marcadores más sólidas, 9 combinaciones podrían probarse en comparaciones por pares del conjunto de datos de validación interna. De estas, 7 pares (78 %) permanecieron altamente significativos en ambos conjuntos de datos.

Ejemplo 9: Marcadores de ADN metilado altamente discriminantes para la detección del esófago de Barrett

Para frenar la creciente incidencia de adenocarcinoma esofágico, se necesitan métodos efectivos para detectar en la población el precursor crítico: el esófago de Barrett (EB). Se han propuesto herramientas mínimamente invasivas o no invasivas, pero se han visto obstaculizadas por la falta de marcadores específicos y de sensibilidad óptima. Se realizaron experimentos y se identificaron BMP3 y NDRG4 aberrantemente metilados como marcadores candidatos discriminantes para el EB.

Un objetivo de dichos experimentos fue evaluar prospectivamente la precisión de BMP3 y NDRG4 metilados para identificar el EB utilizando biopsias endoscópicas (Fase 1) y cepillados de todo el esófago y el cardias para simular dispositivos de muestreo no endoscópicos (Fase 2).

Los casos con EB y los controles sin él se reclutaron antes de la endoscopia. Los casos de EB tenían >1 cm de mucosa columnar circunferencial con metaplasia intestinal confirmada; los controles no tenían EB endoscópicamente. En la Fase 1 se obtuvieron biopsias en casos de EB, cardias gástrico ((CG); 1 cm por debajo de la línea Z) y epitelio escamoso ((EE); >2 cm por encima del EB) y en controles de CG (al igual que para el EB) y EE (5 cm por encima de la línea Z); después se congelaron rápidamente. Las muestras de biopsia se procesaron como un lote y se analizaron con enmascaramiento. En la Fase 2, las muestras se obtuvieron utilizando un cepillo de citología endoscópica de alta capacidad (Hobbs Medical, Stafford Springs CT); se cepillaron el cardias, el EB (en los casos) y la longitud esofágica completa para simular un dispositivo de muestreo de esponja tragado. Después de la extracción de ADN y el tratamiento con bisulfito, se analizó la metilación en los genes diana mediante amplificación de señal y diana en tiempo real cuantitativa específica de alelo. También se cuantificó la p-actina como marcador del ADN humano total.

Se estudiaron prospectivamente 100 sujetos. Fase 1: Entre 40 casos de EB y 40 controles: la mediana de edad fue de 65 (cuartiles 55-77) y 54 (37-69) y los hombres comprendían el 78 % y el 48 %, respectivamente. La mediana de longitud del EB fue de 6 cm (rango 3-10). La mediana de los niveles de marcadores metilados fue sustancialmente mayor (34-600 veces) en el EB que en el EE adyacente y el CG que en el EE y el GC normales (tabla). En contraste con los marcadores metilados, las distribuciones de S-actina fueron similares en todos los grupos de tejidos. Ambos niveles de marcadores aumentaron con la longitud del EB y la edad, p<0,001, mientras que solo NDRG4 aumentó significativamente con la presencia de displasia (ninguno (19), grado bajo (9), grado alto (11); p = 0,003). Los factores que no afectaron significativamente los niveles de los marcadores incluyeron el sexo y la inflamación. Fase 2: Entre 10 casos de EB y 10 controles, la mediana de edad fue de 64 (59-70) y 66 (49-71) y los hombres comprendían el 80 y el 30 %, respectivamente. La mediana de longitud del EB fue de 2 cm (rango 1-4). La discriminación del EB por marcadores fue extraordinaria con una ABC de 1,0 para NDRG4 y 0,99 para BMP3; los niveles fueron >100 veces más altos en los casos que en los controles (figura 2).

Estos experimentos demuestran que los marcadores de ADN metilados seleccionados discriminan altamente el EB del CG y EE normales, tanto en muestras de biopsia como cepilladas. La tabla 9 muestra las asociaciones de función y biología del cáncer de los marcadores de ADN metilado seleccionados.

Tabla 8: Niveles de marcadores (número de copias de marcadores ajustados respecto de beta actina) para biopsias de BMP3 NDRG4 de casos de EB cardias Barrett escamoso controles cardias escamoso.

T l . A i i n f n i n i l í l n r l rini l m r r n i

continuación

Lee WK, Chakraborty PK, Thevenod F. Pituitary homeobox 2 (PITX2) protects renal cáncer cell lines against doxorubicin toxicity by transcriptional activation of the multidrug transporter ABCB1. International journal of cancer Journal international du cancer. 2013;133:556-67.

Vincent A, Omura N, Hong SM, Jaffe A, Eshleman J, Goggins M. Genome-wide analysis of promoter methylation associated with gene expression profile in pancreatic adenocarcinoma. Clinical cancer research: an official journal of the American Association for Cancer Research. 2011;17:4341-54.

Yang N, Eijsink JJ, Lendvai A, Volders HH, Klip H, Buikema HJ, y col. Methylation markers for CCNA1 and C13ORF18 are strongly associated with high-grade cervical intraepithelial neoplasia and cervical cancer in cervical scrapings. Cancer epidemiology, biomarkers & prevention: a publication of the American Association for Cancer Research, cosponsored by the American Society of Preventive Oncology. 2009;18:3000-7.

Liu D, Song L, Brawley VS, Robison N, Wei J, Gao X, y col. Medulloblastoma expresses CD1d and can be targeted for immunotherapy with NKT cells. Clin Immunol. 2013;149:55-64. Li H, Yang L, Fu H, Yan J, Wang Y, Guo H, y col. Association between Galphai2 and ELMO1/Dock180 connects chemokine signalling with Rac activation and metastasis. Nat Commun. 2013;4:1706.

Stumm L, Burkhardt L, Steurer S, Simon R, Adam M, Becker A, y col. Strong expression of the neuronal transcription factor FOXP2 is linked to an increased risk of early PSA recurrence in ERG fusion-negative cancers. Journal of clinical pathology. 2013;66:563-8.

Campbell AJ, Lyne L, Brown PJ, Launchbury RJ, Bignone P, Chi J, y col. Aberrant expression of the neuronal transcription factor FOXP2 in neoplastic plasma cells. British journal of haematology. 2010;149:221-30.

Jiao X, Wood LD, Lindman M, Jones S, Buckhaults P, Polyak K, y col. Somatic mutations in the Notch, NF-κΒ, PIK3CA, and Hedgehog pathways in human breast cancers. Genes, chromosomes & cancer. 2012;51:480-9.

Asai D, Imamura T, Suenobu S, Saito A, Hasegawa D, Deguchi T, y col. IKZF1 deletion is associated with a poor outcome in pediatric B-cell precursor acute lymphoblastic leukemia in Japan. Cancer Med. 2013;2:412-9.

Kober P, Bujko M, Oledzki J, Tysarowski A, Siedlecki JA. Methyl-CpG binding column-based identification of nine genes hypermethylated in colorectal cancer. Molecular carcinogenesis. 2011;50:846-56.

Camoes MJ, Paulo P, Ribeiro FR, Barros-Silva JD, Almeida M, Costa VL, y col. Potential downstream target genes of aberrant ETS transcription factors are differentially affected in Ewing's sarcoma and prostate carcinoma. PLoS ONE.

2012;7:e49819.

Kisiel JB, Yab TC, Taylor WR, Chari ST, Petersen GM, Mahoney DW, y col. Stool DNA testing for the detection of pancreatic cancer: assessment of methylation marker candidates. Cancer. 2012;118:2623-31.

Ahlquist DA, Zou H, Domanico M, Mahoney DW, Yab TC, Taylor WR, y col. Next-Generation Stool DNA Test Accurately Detects Colorectal Cancer and Large Adenomas. Gastroenterology. 2012;142:248-56.

Surdez D, Benetkiewicz M, Perrin V, Han ZY, Pierron G, Ballet S, y col. Targeting the EWSR1-FLI1 oncogene-induced protein kinase PKC-beta abolishes ewing sarcoma growth. Cancer research. 2012;72:4494-503.

Seshagiri S, Stawiski EW, Durinck S, Modrusan Z, Storm EE, Conboy CB, y col. Recurrent R-spondin fusions in colon cancer. Nature. 2012;488:660-4.

Zhao J, Liang Q, Cheung KF, Kang W, Lung RW, Tong JH, y col. Genome-wide identification of Epstein-Barr virusdriven promoter methylation profiles of human genes in gastric cancer cells. Cancer. 2013;119:304-12.

Gurung B, Feng Z, Iwamoto DV, Thiel A, Jin G, Fan CM, y col. Menin epigenetically represses Hedgehog signaling in MEN1 tumor syndrome. Cancer research. 2013;73:2650-8.

Person RJ, Tokar EJ, Xu Y, Orihuela R, Ngalame NN, Waalkes MP. Chronic cadmium exposure in vitro induces cancer cell characteristics in human lung cells. Toxicol Appl Pharmacol. 2013.

Shin SH, Lee K, Kim BH, Cho NY, Jang JY, Kim YT, y col. Bile-based detection of extrahepatic cholangiocarcinoma with quantitative DNA methylation markers and its high sensitivity. The Journal of molecular diagnostics: JMD.

2012;14:256-63.

Jacobs DI, Mao Y, Fu A, Kelly WK, Zhu Y. Dysregulated methylation at imprinted genes in prostate tumor tissue detected by methylation microarray. BMC Urol. 2013;13:37.

Ejemplo 10: Un panel de marcadores de ADN y microARN en heces para la detección del cáncer de páncreas

Dada la extraordinaria letalidad del cáncer de páncreas (CP), se necesitan métodos prácticos no invasivos para la detección presintomática mediante cribado. Los microARN (miARN) tienen expresión alterada en el CP.

Se realizaron experimentos con el objetivo de explorar la viabilidad del análisis de miR-1290 en heces para la detección del CP.

Se analizaron muestras de heces de archivo de 58 casos de CP y 64 controles sanos emparejados por edad, género e historial de tabaquismo. La detección de miARN se realizó mediante una estrategia de reacción en cadena de la polimerasa de transcripción inversa cuantitativa de tallo-bucle (qRT-PCR). La cuantificación de miARN se basó en la medición de las copias absolutas por nanogramo de ARN extraído. Los marcadores de ADN (metilado BMP3, mutante KRAS y i3-actina) se sometieron a captura híbrida y se amplificaron como se describe (Cancer 2012, 118:2623). Se utilizó un modelo de regresión logística por etapas, limitado a 5 variables, para construir un panel de marcadores optimizado basado en miR-1290, marcadores de ADN y edad. Las áreas bajo la curva ROC (ABC) ajustadas por edad para cada uno de los modelos se compararon utilizando los métodos de DeLong y col. La asociación de miR-1290 con factores clínicos se evaluó mediante la prueba de suma de rangos de Wilcoxon.

Las distribuciones de miR-1290 fueron significativamente más altas en las heces de los casos de CP que en los controles (P = 0,0002). Los niveles de miR-1290 en heces no se vieron afectados por la edad, el sexo, el sitio del tumor o el estadio del tumor. La ABC de miR-1290 en heces fue de 0,74 (IC del 95 %: 0,65-0,82, figura 3) para la detección del CP en comparación con una ABC de 0,81 (0,73-0,89) por el panel de marcadores de ADN en heces. La adición de miR-1290 a los marcadores de ADN resultó incremental (P = 0,0007) con una ABC de 0,87 (0,81-0,94). Añadir miR-1290 al panel de ADN aumentó la sensibilidad de la prueba en todo el rango de especificidades, incluida la región crítica del 90-100 %. La sensibilidad para el CP del panel de marcadores combinado fue del 64 % (50 %-76 %) con una especificidad del 95 % (87 %-99 %), y del 79 % (67 %-89 %) con una especificidad del 85 % (74 %-92 %).

Estos experimentos identificaron miR-1290 en heces como marcador del CP.

Ejemplo 11: Identificación de marcadores mediante RRBS

Durante el desarrollo de la tecnología proporcionada en la presente descripción, se recopilaron datos de un estudio de casos y controles para demostrar que una estrategia de búsqueda en todo el genoma identifica marcadores nuevos e informativos,

Población de estudio, adquisición de especímenes y muestras

La población de interés fueron pacientes con cáncer de páncreas atendidos en la Clínica Mayo. La población accesible incluye aquellos que se han sometido a una pancreatectomía distal, una pancreaticoduodenectomía o una colectomía con una muestra de resección archivada y un diagnóstico anatomopatológico confirmado. El ADN epitelial del colon se extrajo previamente de especímenes microdiseccionados por el laboratorio de procesamiento de acceso de bioespecímenes (BAP) utilizando un protocolo de fenol-cloroformo. El personal de Pancras SPORE utilizó datos de las variables coincidentes de estas muestras para seleccionar muestras de registro de tejidos. Estos fueron revisados por un patólogo experto para confirmar el estado de casos y controles y excluir neoplasias de casos que surgieron de IPMN, que pueden tener una biología subyacente diferente. El personal de SPORe organizó la microdisección del laboratorio BAP y la extracción de ADN de las muestras de casos y controles del páncreas y proporcionó 500 ng de ADN al personal de laboratorio con enmascaramiento respecto del estado de los casos y los controles. Las muestras de ácido nucleico de archivo incluyeron 18 adenocarcinomas pancreáticos, 18 páncreas normales y 18 epitelios colónicos normales emparejados por sexo, edad y condición de tabaquismo.

Los tipos de muestra fueron:

2) páncreas de control sin cáncer de páncreas;

3) epitelio colónico de control archivado sin cáncer de páncreas; y

Métodos

Las bibliotecas se prepararon según métodos informados anteriormente (véase, por ejemplo, Gu y col. (2011) “Preparation of reduced representation bisulfite sequencing libraries for genome-scale DNA methylation profiling” Nature Protocols 6: 468-81) fragmentando el ADN genómico (300 ng) por digestión con 10 unidades de mspl, una enzima de restricción específica de metilación que reconoce motivos que contienen CpG. Este tratamiento enriquece las muestras en contenido de CpG y elimina áreas redundantes del genoma. Los fragmentos digeridos se repararon en los extremos y se formaron colas en A con 5 unidades del fragmento Klenow (3'-5' exo) y se ligaron durante la noche a adaptadores de Illumina que contenían una de las cuatro secuencias de código de barras para vincular cada fragmento con su ID de muestra. La selección de tamaño de fragmentos de 160-340 pb (que tenían insertos de 40 220 pb) se realizó utilizando microesferas SPRI/tampón (AMPure XP, Beckman Coulter). Los puntos de corte del tampón fueron de 0,7x a 1,1x del volumen de muestra de microesferas/tampón. Las muestras se eluyeron en un volumen de 22 μl (tampón EB, Qiagen). Se usó qPCR para medir la eficiencia de la ligadura y la calidad de los fragmentos en una pequeña alícuota de muestra. A continuación, las muestras se sometieron a dos rondas de conversión de bisulfito usando un protocolo EpiTect modificado (Qiagen). La qPCR y la PCR convencional (Pfu Turbo Cx hotstart, Agilent), seguidas de la evaluación Bioanalyzer 2100 (Agilent) en alícuotas de muestras convertidas, determinaron el número óptimo de ciclos de PCR antes de la amplificación de la biblioteca final. La PCR final se realizó en un volumen de 50 μl (5 μl de tampón PCR 10X; 1,25 μl de cada dNTP a 10 mM; 5 μl de un cóctel de cebadores a aproximadamente 5 μM, l5 μl de cadena molde (muestra), 1 μl de PfuTurbo Cx hotstart y 22,75 μl de agua. El ciclo térmico comenzó con incubaciones iniciales a 95 °C durante 5 minutos y a 98 °C durante 30 segundos, seguidas de 16 ciclos de 98 °C durante 10 segundos, 65 °C durante 30 segundos y 72 °C durante 30 segundos. Después del ciclado, las muestras se incubaron a 72 °C durante 5 minutos y se mantuvieron a 4 °C hasta su posterior procesamiento y análisis. Las muestras se combinaron en cantidades equimolares en bibliotecas de 4 unidades de plexado según un esquema de aleatorización y se probaron con el bioanalizador para verificar el tamaño final. Las muestras también se analizaron con qPCR utilizando estándares phiX y cebadores específicos del adaptador.

Consideraciones estadísticas:

La principal comparación de interés son las diferencias de metilación entre casos y controles de enfermedad en cada CpG y/o ventana de CpG en mosaico. El resultado secundario es la misma comparación entre los casos y la capa leucocitaria normal y los controles de colon. Se analizó la metilación diferencial de los marcadores del siguiente modo:

1. Evaluar las distribuciones del porcentaje de metilación para cada marcador y descartar marcadores con más de un 2,5 % de fondo metilado en controles de colon y la capa leucocitaria normal

2. Probar la distribución de la metilación de los marcadores restantes entre casos y controles usando la prueba de suma de rangos de Wilcoxon y clasificando los marcadores por valores de p.

3. Uso de valores de Q para estimar las Tasas de Falso Descubrimiento (FDR) (Benjamini y col. (1995) “Multiple Testing” Journal of the Royal Statistical Society. Series 8 (Methodological) 57: 289-300; Storey y col. (2003) “Statistical significance for genomewide studies” Proc Natl Acad Sci USA 100: 9440-5). En el nivel de descubrimiento, un FDR de hasta el 25 % es aceptable.

Análisis de los datos

Se desarrolló un flujo de trabajo de análisis de datos en el paquete de software de análisis estadístico R (“R: A Language and Environment for Statistical Computing” (2012), R Foundation for Statistical Computing). El flujo de trabajo comprendía las siguientes etapas:

1. Leer en todos los sitios de CpG

2. Considerar solo aquellos sitios de CpG donde la profundidad total de cobertura del grupo fue de 200 lecturas o más. Esto se basa en la evaluación de poder para detectar una diferencia entre el 20 % y el 30 % de metilación entre dos grupos cualesquiera; cualquier valor inferior tiene pocas probabilidades de ser significativo. Por tanto, si hay 18 sujetos por grupo y cada sujeto tiene 12 lecturas, la profundidad de cobertura del grupo es 12*18 = 216.

3. Excluir todos los sitios de CpG donde la variación del % de metilación entre los grupos fue 0 (sitios de CpG no informativos).

4. Realizar una regresión logística sobredispersa en el % de metilación (utilizando los recuentos reales) con los grupos definidos como Colon normal/capa leucocitaria, control específico de la enfermedad y cáncer específico de interés (casos) para determinar la significación estadística del % de metilación para los análisis primario y secundario. Se utilizó un modelo logístico sobredisperso ya que la variabilidad en el % de metilación entre sujetos es mayor de lo que permite la suposición binomial. Este parámetro de dispersión se estimó utilizando el x-cuadrado de Pearson del ajuste.

5. Valores de área bajo la curva de características operativas del receptor (ROC). El área bajo la curva ROC es una medida de precisión predictiva del % de metilación específico del sujeto y se estimó para el análisis primario (casos frente a control de la enfermedad) y el análisis secundario (casos frente a colon normal/capa leucocitaria), por separado.

6. De manera similar al n.° 5, también se estimó el múltiplo de cambio (FC, una medida de la separación entre casos y controles) para el análisis primario y secundario utilizando la relación del % de metilación medio entre los casos y el grupo de control correspondiente.

7. Se realizaron las etapas 4-6 anteriores en sitios de CpG individuales así como en regiones de CpG metilados. Estas regiones se definieron para cada cromosoma como un grupo de al menos 5 sitios de CpG dentro de una distancia de aproximadamente 100 pares de bases (pb) con un % medio de metilación <2,5 % en los controles normales de colon/capa leucocitaria.

8. Se identificaron regiones CpG prometedoras para la validación técnica y biológica por tener una diferencia de metilación estadísticamente significativa, un FC grande y una ABC elevada para los análisis primario o secundario.

Análisis Post-R:

1. Clasificar las CpG individuales y las regiones de CpG por valor de p, FC y ABC. Los valores de corte fueron <0,01, >20 y >0,85, respectivamente, aunque estos normalmente se ajustaron en función de la robustez de los datos. Por ejemplo, el tejido neoplásico altamente heterogéneo da como resultado valores de % de metilación más bajos, lo que a su vez afecta al filtrado. Las comparaciones primarias y secundarias se pueden clasificar juntas o por separado según los requisitos de especificidad de la aplicación. Se incluyen epitelios colónicos normales como control para descubrir marcadores adecuados para el ensayo de heces. Si se analiza el jugo pancreático, no es necesario el tejido colónico. Esto puede resultar en un conjunto completamente diferente de marcadores.

2. Regiones marcadoras clasificadas en función de los requisitos de la plataforma de ensayo. En la actualidad, la PCR específica de metilación (MSP), o las plataformas de amplificación similares en las que la discriminación se basa en la especificidad de la hibridación del cebador, es la plataforma de elección. Para esta metodología, es imperativo tener 2-5 CpG discriminados por oligo dentro de un tramo amplificable de ADN. Para los análisis de heces, este requisito es aún más estricto porque los amplicones deben ser cortos (<100 pb). La selección de marcadores, por lo tanto, debe realizarse sobre la base de tramos contiguos cortos de CpG altamente discriminantes. Si la plataforma evoluciona hacia una tecnología basada en secuencias, los requisitos de distribución de CpG dentro de una región pueden ser completamente diferentes.

Resultados

Se secuenciaron mediante RRBS extractos de ADN asignados aleatoriamente, emparejados y con enmascaramiento de 18 tumores de cáncer pancreático, 18 tejidos de control pancreático benigno y 18 tejidos epiteliales colónicos normales. La mediana de edad fue de 61 años (rango intercuartílico 52-65), el 61 % eran mujeres y el 44 % eran fumadores actuales o anteriores. Se cartografiaron aproximadamente 6 millones de CpG con una cobertura >10*. Más de 2000 regiones CpG cumplieron con los criterios de significación para la metilación diferencial. Después de aplicar los criterios de filtro anteriores, se identificaron 449 regiones metiladas diferencialmente (DMR) (tabla 10). La tabla 11 presenta las 449 regiones metiladas diferencialmente (DMR) identificadas clasificadas por área decreciente bajo la curva ROC (ABC).

En estos marcadores, las firmas de metilación van desde 3 CpG vecinos hasta 56 CpG. Los niveles de metilación de los cánceres de páncreas rara vez excedieron el 25 % en los CpG filtrados, lo que sugirió que los tejidos cancerosos pueden tener altos niveles de células normales contaminantes y/o estroma. Para probar esto, se secuenció cada uno de los cánceres en busca de mutaciones de KRAS para verificar las frecuencias alélicas de las muestras positivas. Para el 50 % que albergaba un cambio de base de KRAS heterocigoto, la frecuencia del alelo mutante fue al menos 4 veces menor que el alelo de tipo silvestre correspondiente, lo que respalda la contaminación por células normales y/o el estroma.

Se encontró que 58 de los 449 marcadores están en regiones no anotadas y se encuentran en regiones genómicas sin elementos codificantes de proteínas. De los 391 marcadores candidatos restantes, aproximadamente 225 se han descrito como asociados con el cáncer, algunos de los cuales se clasifican como supresores de tumores. Los otros 166 marcadores candidatos tienen una asociación débil previamente identificada con el cáncer (p. ej., mutaciones y/o alteraciones del número de copias observadas en los cribados de todo el genoma) o no tienen asociaciones con el cáncer previamente identificadas.

Tabla 10: DMR

(continuación)

(continuación)

(continuación)

(continuación)

(continuación)

(continuación)

(continuación)

(continuación)

(continuación)

(continuación)

449 chr7 6655380-6655652 ZNF853

En la tabla 10, las bases están numeradas según el ensamblaje del genoma humano GRCh37/hg19 de febrero de 2009 (véase, por ejemplo, Rosenbloom y col. (2012) “ENCODE whole-genome data in the UCSC Genome Browser: update 2012” Nucleic Acids Research 40: D912-D917). Los nombres de marcador BHLHE23 y LOC63930 se refieren al mismo marcador.

Tabla 11.

(continuación)

Á

(continuación)

(continuación)

(continuación)

Á

(continuación)

(continuación)

(continuación)

(continuación)

(continuación)

(continuación)

Claims

REIVINDICACIONES

1. Método de cribado de una neoplasia en una muestra obtenida de un sujeto, comprendiendo el método:

1) analizar un estado de metilación de TWIST1 y CLEC11A en una muestra obtenida de un sujeto; y

2) identificar que el sujeto tiene una neoplasia cuando el estado de metilación de TWIST1 y CLEC11A es diferente al estado de metilación del marcador sometido a ensayo en un sujeto que no tiene una neoplasia,

en donde CLEC11A comprende una base en la región metilada diferencialmente (DMR) 64,

en donde TWIST1 comprende una base en la DMR 418 o 419.

2. Método de la reivindicación 1, que comprende además localizar el sitio de la neoplasia en el sujeto, en donde el estado de metilación del marcador indica el sitio de la neoplasia en el sujeto.

3. Método de la reivindicación 1, en donde la neoplasia es precancerosa, una neoplasia gastrointestinal, una neoplasia pancreática, una neoplasia colorrectal, una neoplasia del conducto biliar, una neoplasia de estómago, una neoplasia de esófago o un adenoma.

4. Método de la reivindicación 1, en donde la neoplasia está presente en el área gastrointestinal alta del paciente o el área gastrointestinal baja del paciente.

5. Método de la reivindicación 1, en donde analizar el estado de metilación del marcador en la muestra comprende determinar el estado de metilación de una o más bases.

6. Método de la reivindicación 1, en donde el estado de metilación del marcador comprende una metilación aumentada o disminuida del marcador con respecto a un estado de metilación normal del marcador o un patrón de metilación diferente del marcador con respecto a un estado de metilación normal del marcador.

7. Método de la reivindicación 1, en donde la muestra es una muestra de heces, una muestra de tejido, una muestra de jugo pancreático, una muestra de fluido de quiste pancreático, una muestra de sangre o una muestra de orina.

8. Método de la reivindicación 1, en donde el análisis comprende el uso de la reacción en cadena de la polimerasa específica de metilación, la secuenciación de ácido nucleico, la espectrometría de masas, la nucleasa específica de metilación, la separación basada en masas o la captura de dianas.

9. Método de la reivindicación 7, en donde el tejido es tejido esofágico o tejido pancreático.