ES2527062T3 - Supervivencia y recurrencia del cáncer de próstata - Google Patents

Supervivencia y recurrencia del cáncer de próstata Download PDF

Info

Publication number
ES2527062T3
ES2527062T3 ES08730593.4T ES08730593T ES2527062T3 ES 2527062 T3 ES2527062 T3 ES 2527062T3 ES 08730593 T ES08730593 T ES 08730593T ES 2527062 T3 ES2527062 T3 ES 2527062T3
Authority
ES
Spain
Prior art keywords
prostate cancer
genes
risk
expression
recurrence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES08730593.4T
Other languages
English (en)
Inventor
Xiao-Jun Ma
Chin-Lee Wu
Mark G. Erlander
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
General Hospital Corp
Biotheranostics Inc
Original Assignee
General Hospital Corp
Biotheranostics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by General Hospital Corp, Biotheranostics Inc filed Critical General Hospital Corp
Application granted granted Critical
Publication of ES2527062T3 publication Critical patent/ES2527062T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Un método para determinar el riesgo de recurrencia del cáncer de próstata en un sujeto, comprendiendo dicho método el ensayo de una muestra que comprende células de cáncer de próstata de dicho sujeto de los niveles de expresión de seis o más genes seleccionados de entre los Genes Nos 1 a 362 de las Figuras 14 y 15, determinar, como un valor agregado, una suma de los niveles de expresión de dichos seis o más genes, y determinar el riesgo de recurrencia del cáncer de próstata en dicho sujeto basándose en dicho valor agregado, donde los niveles de expresión se correlacionan con un bajo riesgo de recurrencia del cáncer, o un alto riesgo de recurrencia del cáncer.

Description

Supervivencia y recurrencia del cáncer de próstata
5 Campo de la divulgación
La divulgación se refiere a la identificación de los perfiles o patrones de expresión genética (o de secuencia), con relevancia clínica en el cáncer de próstata. En particular, la divulgación se basa en la identificación de genes, o secuencias que se expresan, cuya expresión se correlaciona con la supervivencia del paciente, la recurrencia del cáncer de próstata, y/o la presencia de metástasis del cáncer de próstata. Los perfiles de expresión genética, si se plasman en expresión de ácidos nucleicos, expresión proteica, y otros formatos de expresión, se pueden utilizar para predecir la supervivencia de sujetos que padecen un cáncer de próstata. Los perfiles se pueden utilizar también en el estudio y/o el diagnóstico de las células y tejido de cáncer de próstata así como para el estudio y/o la determinación del pronóstico de un paciente. Cuando se utilizan para el diagnóstico y el pronóstico, los perfiles se
15 utilizan para determinar el tratamiento del cáncer de próstata basándose en la probabilidad de la esperanza de vida, la recurrencia del cáncer, y/o las metástasis del cáncer.
Antecedente de la divulgación
El cáncer de próstata es el cáncer diagnosticado más comúnmente en los EE. UU., con aproximadamente 240.000 nuevos pacientes diagnosticados y 40.000 muertes por cáncer cada año. El diagnóstico y manejo del cáncer de próstata es clínicamente difícil debido a la falta de conocimiento del cáncer a niveles molecular y genético y a una falta de comprensión de la progresión natural de la enfermedad.
25 La investigación del cáncer de próstata está limitada por fuentes inadecuadas de especímenes de tejido de cáncer de próstata disponibles para su uso en investigación, particularmente especímenes que estén bien caracterizados patológicamente, conservados apropiadamente para estudios de ARN y proteínas, y con la información clínica, patológica y del seguimiento.
Se han utilizado tratamientos quirúrgicos en el tratamiento de algunos casos de cáncer de próstata. Sin embargo, el tratamiento fallará en una parte de los pacientes. Esto se sabe por un fallo químico (elevación de PSA después del año de la cirugía) o por el desarrollo de metástasis (comúnmente en los ganglios linfáticos y hueso). La capacidad para identificar, o predecir, un paciente post-quirúrgico, así como la probabilidad de encontrar un fallo en el PSA, la recurrencia del cáncer de próstata, y/o el desarrollo de metástasis, proporcionará múltiples beneficios al paciente.
Breve sumario de la invención
La presente invención proporciona un método para determinar el riesgo de recurrencia del cáncer de próstata en un sujeto, comprendiendo dicho método el ensayo de los niveles de expresión en una muestra que comprende células del cáncer de dicho sujeto de seis o más genes que se seleccionan de entre los Genes Nos 1 a 362 de las Figuras 14 y 15, la determinación, como un valor agregado, una suma de los niveles de expresión de dichos seis o más genes, y la determinación el riesgo de recurrencia del cáncer de próstata en dicho sujeto basándose en dicho valor agregado, en el que los niveles de expresión se correlacionan con
45 un riesgo bajo de recurrencia del cáncer, o un riesgo alto de recurrencia del cáncer.
La presente invención también proporciona un método para determinar el riesgo de desarrollo de metástasis del cáncer prostático en un sujeto, comprendiendo dicho método el ensayo de los niveles de expresión en una muestra que comprende células de cáncer de próstata, de seis o más genes que se seleccionan de entre los Genes Nos 1 a 362 de las Figuras 14 y 15; la determinación, como un valor agregado, una suma de los niveles de expresión de dichos seis o más genes, y la determinación del riesgo de desarrollo de metástasis del cáncer prostático en dicho sujeto basándose en dicho valor agregado, en el que los niveles de expresión se correlacionan con un bajo riesgo de desarrollar metástasis del
55 cáncer de próstata, o un alto riesgo de desarrollar metástasis de cáncer de próstata.
Breve sumario de la divulgación
La divulgación, que engloba los métodos de la invención, también incluye la identificación y el uso de patrones (o perfiles o “firmas”) de expresión genética (o de secuencia) que sean clínicamente relevantes para el cáncer de próstata. Los perfiles de expresión genética, que se plasman en la expresión del ácido nucleico, expresión proteica, u otros formatos de expresión, se pueden utilizar para predecir la recurrencia del cáncer de próstata y/o la supervivencia de sujetos que padecen un cáncer de próstata. En realizaciones que implican el uso de prostatectomía, la divulgación incluye métodos para predecir la probabilidad de recurrencia del cáncer de próstata, la
65 metástasis del cáncer, y/o la recurrencia de los niveles elevados de PSA.
En un aspecto, la divulgación incluye métodos para identificar, y luego utilizar, perfiles de expresión genética (o de secuencia) que proporcionan información pronóstica relativa al cáncer de próstata. Los perfiles de expresión se correlacionan con (y por lo tanto son capaces de discriminar entre) pacientes con recurrencia del cáncer buena o mala, metástasis del cáncer, y/o resultados de supervivencia. En algunas realizaciones, la divulgación incluye un
5 método para identificar los perfiles de expresión relevantes para la recurrencia del cáncer y/o la metástasis en sujetos que padecen cáncer de próstata. En otras realizaciones, la divulgación incluye un método para comparar la expresión genética (o de secuencia) en una muestra de células de cáncer de próstata de un paciente respecto a un perfil de expresión identificado para determinar el resultado probable del paciente., tal como tras una prostatectomía. Estas realizaciones de la divulgación se puede utilizar ventajosamente para conseguir una necesidad diagnóstica no satisfecha como es la capacidad de predecir si un paciente se beneficiará probablemente de la cirugía para tratar el cáncer de próstata o si un paciente saldrá mejor con otro tipo de tratamiento o si necesitará un tratamiento adyuvante además de la cirugía.
Un ejemplo no limitante de un paciente que se beneficiará probablemente de la cirugía, tal como una prostatectomía
15 radical, es aquel al que se le predice, por el perfil de expresión de las células de cáncer de próstata del paciente como se desvela en el presente documento, que estará libre de recurrencia y/o metástasis del cáncer después de la cirugía. De una manera relacionada, un ejemplo no limitante de un paciente del que se espera que no se beneficiará de la cirugía es aquel al que se le predice, por el perfil de expresión de sus células de cáncer de próstata como se desvela en el presente documento, que desarrollará metástasis del cáncer después de la cirugía. A modo de ejemplo, la recurrencia del cáncer de próstata suele ser en la misma localización, mientras que la metástasis frecuentemente es en una localización o tejido diferente, tal como un ganglio linfático o hueso como ejemplos no limitantes.
En más realizaciones, el método es para identificar un paciente, a partir de una población de pacientes con células
25 de cáncer de próstata, o tras una prostatectomía, como perteneciente a una subpoblación de pacientes con una recurrencia del cáncer y/o resultado mejor (tal como un riesgo de recurrencia o metástasis menor), con respecto a otra subpoblación, o como perteneciente a una subpoblación con una recurrencia o resultado de supervivencia peor (tal como un riesgo elevado de recurrencia o metástasis), con respecto a otra subpoblación. El método es por lo tanto capaz de distinguir pacientes en al menos dos subpoblaciones o subtipos.
La divulgación incluye un medio no subjetivo para la identificación de pacientes con cáncer de próstata, opcionalmente después de una prostatectomía, como que tendrán probablemente una mejor o peor recurrencia del cáncer, metástasis del cáncer, y/o resultado de supervivencia, ensayando un patrón de expresión que se desvela en el presente documento. Así, donde se ha podido utilizar previamente una interpretación subjetiva (tal como la que se
35 basa en tinción inmunohistoquímica y análisis subjetivos) para determinar el pronóstico y/o el tratamiento de pacientes con cáncer de próstata, o pacientes tras la prostatectomía, esta divulgación presenta patrones de expresión objetivos, que se pueden utilizar solos o en combinación con otros criterios (subjetivos y/u objetivos) para proporcionar una evaluación más precisa de los resultados de los pacientes, incluyendo la supervivencia y la recurrencia o metástasis del cáncer. Los patrones de expresión de la divulgación incluye por lo tanto un medio para determinar el pronóstico del cáncer de próstata, o tras la prostatectomía.
Los patrones de expresión de la divulgación comprenden más de un gen, o secuencia expresada, capaz de discriminar entre los resultados del cáncer de próstata, o tras prostatectomía, con una precisión significativa. Los niveles de expresión del gen(es), o secuencia(s) que se expresan se identifican y correlacionan con resultados de
45 forma que el/los nivel(es) de expresión es/son relevantes para una determinación de los protocolos de tratamiento preferidos para un paciente. Por lo tanto, la divulgación incluye un método para determinar el resultado de un sujeto que padece cáncer de próstata, opcionalmente tras la prostatectomía, ensayando los niveles de expresión en una muestra que contiene células de cáncer de dicho sujeto que se correlacionan con los resultados de los pacientes como se desvela en el presente documento.
En otro aspecto, la divulgación incluye un método para determinar el riesgo de recurrencia y/o metástasis del cáncer de próstata en un sujeto. El método incluye ensayar los niveles de expresión de una muestra que comprende células de cáncer de próstata de dicho sujeto de dos o más genes que se seleccionan de los Genes Nos 1 a 362 de las Figuras 14 y 15 del presente documento, y comparar el nivel de expresión de cada uno de los genes 55 individualmente, o los niveles de expresión agregados in toto, con la media o los niveles de expresión medios de los mismos en una población de células de cáncer de próstata. Estas evaluaciones se pueden utilizar entonces para determinar el riesgo de recurrencia de cáncer de próstata y/o metástasis en el sujeto del que se obtuvo la muestra. Los niveles de expresión de los genes desvelados (o las secuencias expresadas) se correlacionan con un bajo riesgo de recurrencia y/o metástasis del cáncer, o un alto riesgo de recurrencia y/o metástasis del cáncer, basándose en la comparación de la media o el nivel de expresión medio de una población de células de cáncer de próstata. Expresado de otra manera, los genes individuales (o las secuencias expresadas) que se desvelan en el presente documento se expresan a niveles mayores o menores (en comparación con la media o el nivel medio de expresión en una población de células de cáncer de próstata) de forma que la desviación de la media o medio se correlaciona con un riesgo mayor o menor como se describe en el presente documento. Cada agregación de
65 desviaciones en dos o más genes (o secuencias expresadas) es un patrón de expresión o perfil de la divulgación.
En algunas realizaciones, se puede llevar a cabo el ensayo de los niveles de expresión por el uso de dos o más sondas de ácido nucleico que se seleccionan de entre las SEC ID Nos 1-362 como se desvela en el presente documento. Estas sondas se hibridan, bajo condiciones apropiadas, y detectan las secuencias expresadas como se desvela en el presente documento. En otras realizaciones, se pueden utilizar otras sondas que se hibridan a las
5 mismas secuencias que se expresan como las SEC ID Nos 1-362. Estas sondas adicionales se pueden preparar o seleccionar por análisis de las secuencias expresadas detectadas por las SEC ID Nos 1-362. En otros casos, la secuencia de sonda adicional puede ser total o parte de las secuencias identificadas como Genes Nos 1-362. En muchas realizaciones, una sonda se puede utilizar para detectar una región de secuencia amplificada a partir de una secuencia expresada (o gen) como se describe en el presente documento.
La detección o determinación de los niveles de expresión de dos o más secuencias (genes) se puede referir a como la detección o la determinación de un perfil o firma de expresión. Los patrones de expresión de la divulgación que comprenden dos o más de las secuencias desveladas se identifican y se utilizan como se describen en el presente documento. Para su identificación, se obtiene un gran muestreo de los niveles de expresión genética en una muestra
15 que contiene células de cáncer de próstata a través de la cuantificación de los niveles de expresión de mARN. En una realización, la divulgación incluye la detección de los niveles de expresión genética (o de secuencia) analizando la expresión global o casi global, de células únicas o poblaciones celulares homogéneas que se han extraído de, o de otra manera aisladas o purificadas de entre células contaminantes más allá de lo que es posible por una biopsia simple. Debido a que la expresión de muchos genes fluctúan entre las células de diferentes pacientes así como entre células de la muestra del mismo paciente, se utilizan datos múltiples de la expresión de secuencias genéticas individuales como datos de referencia para generar modelos que a su vez permiten la identificación de genes y secuencias individuales, cuya expresión se correlacionan con resultados de cáncer de próstata, o tras la prostatectomía.
25 Los niveles de expresión de varios genes en esos modelos se analizan después para identificar las secuencias de ácido nucleico, cuyas expresiones se correlacionan positiva o negativamente con un resultado de cáncer de próstata
o tras una prostatectomía. La presente divulgación incluye secuencias de ácido nucleico, que son un subgrupo de secuencias expresadas en una célula, que se han identificado como que se correlaciona con resultados como se describe en el presente documento. Un patrón o perfil de expresión de la divulgación incluye una combinación de estas secuencias (o genes) identificadas. El uso de muestras múltiples para la identificación de las secuencias expresadas aumenta la confianza con la que se considera que un gen se correlaciona con recurrencia, metástasis y/o resultado de supervivencia del cáncer de próstata. Sin suficiente confianza, sigue impredecible si un gen particular se correlaciona actualmente con un resultado y también es impredecible si la expresión de un gen se puede utilizar satisfactoriamente para identificar el resultado de un paciente o sujeto con cáncer de próstata, o tras la
35 prostatectomía. Una vez que se identifiquen, una o más secuencias de ácido nucleico que corresponden a los genes desvelados (o secuencias expresadas) se pueden seleccionar para evaluar un perfil de expresión a detectarse o evaluarse en cuanto a sus propiedades predictivas.
Se puede utilizar un perfil de niveles de expresión que se correlaciona altamente con un resultado con respecto a otro para ensayar una muestra que contienen una célula de cáncer de próstata de un sujeto o paciente para predecir el resultado del sujeto del que se obtuvo la muestra. Tal ensayo se puede utilizar como parte de un método para determinar el tratamiento terapéutico para dicho sujeto basándose en el resultado identificado.
Los genes correlacionados se pueden utilizar en parejas (con precisión significativa) o en cantidades mayores para
45 aumentar la capacidad para correlacionar precisamente un fenotipo de expresión molecular con un resultado de cáncer de próstata o tras la prostatectomía. Esta correlación proporciona una determinación molecular de los resultados de recurrencia de cáncer de próstata, metástasis del cáncer y/o supervivencia como se desvelan en el presente documento. Si estar ligados por teoría alguna, y ofrecido para mejorar la comprensión de la presente divulgación, la determinación molecular desvelada es más potente que otros indicadores moleculares relacionados con el cáncer de próstata, tales como la determinación de los niveles del antígeno sérico de próstata (PSA). Usos adicionales de los patrones y perfiles de expresión correlacionados son para clasificar células y tejidos; determinación de diagnóstico y pronóstico; y determinación y/o alteración de la terapia.
La capacidad para discriminar la confiere la identificación de la expresión de las secuencias genéticas individuales
55 como relevantes y no por la forma del ensayo utilizado para determinar el nivel actual de expresión. Un ensayo puede utilizar cualquier característica de identificación de un gen individual identificado como se desvela en el presente documento siempre que el ensayo refleje, cuantitativa o cualitativamente, la expresión de la secuencia genética en el “transcriptoma” (la parte transcrita de genes de un genoma) o el “proteoma” (parte traducida de los genes que se expresan en un genoma). Las características de identificación incluyen, pero no se limitan a estas, secuencias únicas de ácido nucleico que se utilizan para codificar (ADN), o expresan (ARN), dicho gen o epítopos específicos de, o actividades de, una proteína codificada por dicho gen. Todo lo que se necesita es la identidad de la secuencia del gen necesaria para discriminar entre los resultados del cáncer de próstata, o tras la prostatectomía y una muestra que contiene células apropiadas para su uso en un ensayo de expresión.
65 De manera similar, la naturaleza de la muestra que contiene las célula, no está limitada, y se pueden utilizar como tejido fresco, tejido fresco congelado, y tejido fijado, tal como los tejidos fijados en formalina embebidos en parafina
(FFPE) en los métodos desvelados. En algunas realizaciones, la muestra puede ser de una biopsia por aguja (central) u otra biopsia.
Para detectar un patrón o perfil de expresión identificado, la divulgación incluye detectar los patrones de expresión
5 genética (o de secuencia) reuniendo la expresión genética global o casi global de células únicas o poblaciones celulares homogéneas que se han extraído, o de otra manera aislado o purificado de células contaminantes más allá de una simple biopsia. Los niveles de expresión de los genes (secuencias) del perfil o patrón se detectan o se miden de otra manera. En otras realizaciones, un método solo puede detectar o medir los niveles de expresión de los genes (secuencias) del perfil sin evaluar o sin otra determinación de la expresión de la expresión de otros genes o secuencias.
En un aspecto adicional, el análisis de los niveles de expresión se puede llevar a cabo en combinación con, o en vez de, otras evaluaciones o indicadores de cáncer de próstata. En algunas realizaciones, las evaluaciones se hacen en combinación con un método que determina el grado de cáncer de próstata en una muestra que comprende células
15 de cáncer prostático de un sujeto. Una tercera posibilidad es la combinación con detección o determinación de los niveles de PSA en un sujeto, opcionalmente antes del procedimiento que se utiliza para aislar las células de cáncer de próstata. Por supuesto es posible una combinación de uno cualquiera, dos o de estos tres ejemplos representativos. Cuando se utiliza más de un tipo de evaluación, el resultado es un análisis multivariado. La divulgación incluye expresamente todas las combinaciones posibles de evaluación descritas en el presente documento como realizaciones multivariadas.
En general, se puede utilizar cualquier método aceptado para evaluar el grado y/o estadio de un cáncer de próstata que sea conocido por el experto en la técnica. En algunos casos, el método de determinación del grado de cáncer de próstata comprende la determinación de la puntuación de Gleason (o Grado Gleason). En otros casos, el método
25 de determinación del estadio de cáncer de próstata comprende una determinación de acuerdo con el sistema de estadificación del Comité Conjunto Americano del Cancer (AJCC) para evaluar el estadio del cáncer de próstata. Y como se describe en el presente documento, el análisis de los niveles de expresión genética (de secuencia) se puede llevar a cabo o lugar o de la puntuación de Gleason o de la determinación de estadio del tumor del AJCC.
En el caso de los niveles de PSA, su evaluación puede llevarse a cabo antes de la prostatectomía que se utiliza para proporcionar una muestra que comprende células de cáncer prostático para su uso en cualquiera de los métodos desvelados en el presente documento.
En un aspecto más, la divulgación incluye medios físicos y metodológicos para detectar la expresión de genes (o
35 secuencias) desveladas en el presente documento. Estos medios pueden dirigirse al ensayo de uno o más aspectos de las matrices de ADN subrayando la expresión del gen (o secuencia), del ARN que se utiliza como intermediario para expresar el gen (o secuencia), o del producto proteináceo expresado por el gen (o la secuencia).
Una ventaja que proporciona la divulgación es que las células contaminantes, no del cáncer de próstata (tales como los linfocitos y otras células del sistema inmunitario) se pueden eliminar o reducir su efecto en las mediciones de los patrones de expresión desvelados en el presente documento para predecir la recurrencia y/o los resultados de supervivencia de los pacientes. Tal contaminación está presente cuando se utiliza una biopsia que contiene muchos tipos celulares para generar los perfiles de expresión genética.
45 Aunque la presente divulgación se describe principalmente en el contexto del cáncer de próstata humano, puede practicarse en el contexto del cáncer de próstata de cualquier animal que se sepa que puede padecer potencialmente un cáncer de próstata. Ejemplos no limitantes de animales para la aplicación de la presente divulgación son mamíferos, particularmente aquellos importantes en aplicaciones agrícolas (tales como, pero sin limitarse a, vacas, ovejas, caballos, y otros “animales de granja”), modelos animales de cáncer de próstata, y animales de compañía (tales, pero sin limitarse a, perros y gatos).
Breve descripción de las figuras
La Figura 1 ilustra un esquema de análisis de datos representativo, basado en muestras de pacientes humanos 55 como se describe en el Ejemplo 1 y la Tabla 1 del presente documento.
La Figura 2 muestra el resultado de las iteraciones de la selección de 500 genes del algoritmo Random Forests™ como se describe en el presente documento.
La Figura 3A muestra una identificación representativa del cáncer de próstata en un portaobjetos que contiene un especimen de prostatectomía radical (tejido FFPE) con un área identificada de tejido cancerosos. La Figura 3B muestra el material de cáncer de próstata escindido (macro-diseccionado) tras la retirada del tejido no canceroso.
La Figura 4 muestra la correlación entre la firma de riesgo genético y el grado o puntuación de Gleason (<= 6,7 o 65 >= 8) de muestras de los grupos de entrenamiento y de ensayo.
La Figura 5 muestra la correlación entre la firma de riesgo genético y el estadio tumoral patológico AJCC (II o III) de muestras de los grupos de entrenamiento y de ensayo.
La Figura 6 muestra la correlación entre la firma de riesgo genético y el valor del PSA (antígeno sérico prostático) 5 pre-operatorio de muestras de los grupos de entrenamiento y de ensayo.
La Figura 7 muestra los resultados del análisis de Kaplan-Meier para los libres de fallo de PSA (aumento de los valores del PSA) tras la intervención quirúrgica para tratar el cáncer de próstata. Los resultados muestran la segregación en una subpoblación de “bajo” riesgo con recurrencia del cáncer y resultados de supervivencias mejores (menor incidencia de recurrencia y muerte debidas a la metástasis) y una subpoblación de “alto” riesgo con peores resultados (mayor incidencia de recurrencia y metástasis).
La Figura 8 muestra los resultados del análisis de Kaplan-Meier para los libres del fallo del PSA tras la intervención quirúrgica para tratar el cáncer de próstata en muestras de células con grados o puntuaciones de
15 Gleason de <= 6 y 7. Los resultados muestran la segregación en una subpoblación de “bajo” riesgo con recurrencia del cáncer y resultado de supervivencia mejores (menor incidencia de recurrencia y muerte debido a metástasis) y una subpoblación de “alto” riesgo con resultados peores de recurrencia del cáncer (mayor incidencia de recurrencia y metástasis). Se observan resultados similares si las muestras se separan entre las que tienen un grado o puntuación de Gleason de <= 6, puntuación de 7, o puntuación de >= 8.
La Figura 9 muestra las curvas de supervivencia basadas en el Grado de Gleason solo.
La Figura 10 muestra las curvas de supervivencia basadas en el Estadio del AJCC solo.
25 La Figura 11 muestra los resultados de la utilización de una Puntuación de Riesgo desvelada (basada en 62 genes representativos) para segregar 189 pacientes en subpoblación de “bajo” riesgo con mejor probabilidad de resultados de supervivencia (menor incidencia de muerte debido a la metástasis) y una subpoblación de “alto” riesgo con peores resultados (mayor incidencia de metástasis) durante 10 años.
La Figura 12 muestra un gráfico de la Puntuación de Riesgo de la Figura 11 frente a la probabilidad de metástasis en 10 años. Como se indica en el gráfico, una puntuación por encima de 0 en las células de cáncer de próstata de un sujeto indica un aumento del riesgo de metástasis que se producen en los 10 años siguientes a la intervención quirúrgica.
35 La Figura 13 resume y compara el uso del análisis univariado y multivariado para el fallo del PSA. El Estadio AJCC indicado es II frente a III. CI se refiere al intervalo de confianza.
La Figura 14 enumera las anotaciones e identifica la información de 337 genes para su uso como se describe en el presente documento. El Nº de Gen se puede utilizar como referencia cruzada de cada gen con la correspondiente SEC ID Nº de la sonda y su información de actuación de la Tabla 1 posterior. La frecuencia con la que se producen las moléculas identificadas entre los 500 grupos generados (como se describe en el Ejemplo 1) se indica en la columna “frecuencia”. Las columnas restantes contienen información identificativa de cada gen, tal como el número de registro del gen (columna “Clave de búsqueda”), número de registro de la correspondiente secuencia de la sonda de la Tabla 1 (columna “ID de sonda”), símbolo del nombre del gen (columna “Símbolo”), y
45 una breve descripción (última columna).
La Figura 15 enumera las anotaciones y la información de identificación para 25 genes adicionales como se describe en el presente documento. El Nº de Gen y la información de su actuación (valores z y p) se pueden utilizar como referencia cruzada de cada gen con la SEC ID Nº correspondiente de la sonda y su información de actuación de la Tabla 3 posterior. La información identificativa de cada gen incluye el número de registro del gen (columna “Clave de búsqueda”), el número de registro de la secuencia correspondiente de la sonda de la Tabla 3 (columna “ID de sonda”), símbolo del nombre del gen (columna “Símbolo”), y una breve descripción (última columna).
55 Descripción detallada de los modos de practicar la divulgación
Definiciones de los términos
Un “patrón” o “perfil” o “firma” de expresión genética se refiere a la expresión relativa de dos o más genes (secuencias expresadas) entre dos o más resultados de cáncer de próstata, o tras la prostatectomía, recurrencia del cáncer, metástasis o supervivencia cuya expresión se correlaciona con la capacidad de distinguir entre los resultados.
Un “gen” o “secuencia expresada” es un polinucleótido que codifica, y se expresa de una manera detectable, un
65 producto distintivo, si es de naturaleza ARN o proteináceo. Se aprecia que más de un polinucleótido puede codificar un producto distintivo. El término incluye alelos y polimorfismos de un gen o secuencia expresada que codifica el
mismo producto, o un análogo asociado funcionalmente (incluyendo la ganancia, pérdida, o modulación de la función) del mismo, basándose en la localización cromosómica y la capacidad de recombinarse durante la mitosis normal.
5 Los términos “correlacionar” o “correlación” o equivalentes de los mismos se refiere a una asociación entre la expresión de dos o más genes y el estado fisiológico de una célula prostática para la exclusión de uno o más estados que se identifican por los métodos que se describen en el presente documento. Un gen se puede expresar a niveles más altos o más bajos y estar aún correlacionados con uno o más resultados o estados de un cáncer de próstata o tras la prostatectomía. Una forma de expresar la correlación es con un valor z como se desvela en el presente documento para la expresión de varios genes (o secuencias expresadas). El valor z se puede apreciar como que indica la longitud, o el peso, de la asociación entre el nivel de expresión de un gen (o secuencia expresada) y un resultado particular, tal como recurrencia del cáncer, metástasis del cáncer, y/o supervivencia en el tiempo. El valor puede tener un signo positivo o negativo (+/-) con arbitrariedad, pero constantemente, indica la sobre o bajo expresión, respectivamente. Debido a que los signos son arbitrarios, su asignación puede revertirse
15 fácilmente (pero constantemente) sin un efecto perjudicial.
En algunas realizaciones, la fuerza (o peso) se multiplica por el nivel de expresión de un gen determinado (o secuencia expresada), tras la normalización de la misma (tal como respecto a la expresión de un gen de referencia que se expresa a niveles relativamente constantes) para proporcionar un valor o puntuación para la expresión de ese gen (o secuencia). En muchos casos los datos de expresión se normalizan, se centran en la media, y se transforman logarítmicamente como conoce un experto en la técnica antes de su uso posterior, tal como en un análisis de agrupamiento y discriminatorio. Cuando se utiliza uno o más niveles de expresión (como en el caso de un patrón o perfil de expresión genética), los valores o puntuaciones se pueden sumar y luego analizarse como un valor agregado para evaluar la correlación o llevar a cabo la clasificación basada en la correlación.
25 Un “polinucleótido” es una forma polimérica de nucleótidos de cualquier longitud, sean ribonucleótidos o desoxirribonucleótidos. Este término se refiere solamente a la estructura primaria de la molécula. Por lo tanto, este término incluye ADN y ARN monocatenarios y bicatenarios. También incluye tipos conocidos de modificaciones que incluyen marcas conocidas en la técnica, metilación, “caps”, sustitución de uno o más de los nucleótidos de origen natural con un análogo, y modificaciones internucleótido tales como enlaces sin carga (por ejemplo, fosforotioatos, fosforoditioatos, etc.), así como formas no modificadas del polinucleótido.
El término “amplificar” se utiliza en el sentido amplio para significar que la creación de un producto de amplificación se puede hacer enzimáticamente con ADN o ARN polimerasas. “Amplificación” como se utiliza en el presente
35 documento, se refiere en general al proceso de producción de múltiples copias de los deseados de una muestra. “Múltiples copias” significa al menos 2 copias. Una “copia” no necesariamente significa una complementariedad o identidad de secuencia perfecta de la secuencia matriz.
El término “correspondiente” puede referirse, si es apropiado, a una molécula de ácido nucleico que comparte una cantidad sustancial de identidad de secuencia con otra molécula de ácido nucleico. Una cantidad sustancial significa al menos un 95%, habitualmente al menos un 98% y más habitualmente al menos un 99%, y la identidad de secuencia se determina utilizando el algoritmo BLAST, como se describe en Altschul et al. (1990), J. Mol. Biol. 215:403-410 (utilizando el ajusto por defecto publicado, es decir los parámetros w = 4, t = 17). Los métodos para amplificar el ARNm se conoce en general en la técnica, e incluyen la PCR de transcripción inversa (RT-PCR) y los
45 descritos en la Solicitud de Patente de EE. UU. 10/062.857 (presentada el 25 de octubre de 2001), así como las Solicitudes Provisionales de Patente de EE. UU. 60/298.847 (presentada el 15 de junio de 2001) y 60/257.801 (presentada el 22 de diciembre de 2000).
Otro método que se puede utilizar es la PCR cuantitativa (o Q-PCR). De manera alternativa, el ARN puede marcarse directamente como el ADNc correspondiente por métodos conocidos en la técnica.
Una “micromatriz” es una matriz lineal o bidimensional de regiones distintivas, que tiene cada una un área definida, que se forma sobre la superficie de un soporte sólido tal como, pero sin limitarse a esto, membranas de cristal, plástico, o sintéticas. La densidad de las regiones distintivas en una micromatriz se determina por el número total de
55 polinucleótidos inmovilizados que se van a detectar en la superficie de una fase sólida única del soporte, tal como al menos aproximadamente 50/cm2, al menos aproximadamente 100/cm2, al menos aproximadamente 500/cm2, pero menos de aproximadamente 1.000/cm2 en algunas realizaciones. Las matrices pueden contener menos de aproximadamente 500, aproximadamente 1000, aproximadamente 1500, aproximadamente 2000, aproximadamente 2500, o aproximadamente 3000 polinucleótidos inmovilizados en total. Como se utiliza en el presente documento, una micromatriz ADN es una matriz de oligonucleótidos o polinucleótidos situada en un chip u otras superficies que se usa para hibridarse con polinucleótidos amplificados o clonados de una muestra. Como la posición de cada grupo particular de polinucleótidos de la matriz se conoce, se pueden determinar las identidades de polinucleótidos muestra basándose en su unión a una posición particular de la micromatriz.
65 Debido a que la divulgación se relaciona con la identificación de genes (o secuencias expresadas) que se están sobre o bajo expresados, una realización de la divulgación implica la determinación de la expresión por hibridación
de ARNm, o una versión amplificada o clonada del mismo (tal como ADN o ADNc), de una muestra celular respecto a un polinucleótido que es único para una secuencia genética particular. Los polinucleótidos de este tipo pueden contener al menos aproximadamente 20, al menos aproximadamente 22, al menos aproximadamente 24, al menos aproximadamente 26, al menos aproximadamente 28, al menos aproximadamente 30, al menos aproximadamente 5 32 pares de bases consecutivas de una secuencia genética que no se encuentran en otras secuencias genéticas. El término “aproximadamente” como se utiliza en la frase anterior se refiere a un aumento o descenso de 1 a partir del valor numérico establecido. Otras realizaciones pueden utilizar polinucleótidos de la menos o aproximadamente 50, al menos o aproximadamente 100, al menos o aproximadamente 150, al menos o aproximadamente 200, al menos o aproximadamente 250, al menos o aproximadamente 300, al menos o aproximadamente 350, o al menos o aproximadamente 400 pares de bases de una secuencia genética que no se encuentra en otras secuencias genéticas. El término “aproximadamente” como se utiliza en la frase anterior se refiere a un aumento o disminución del 10% a partir del valor numérico establecido. Tales polinucleótidos también se pueden referir a unas sondas de polinucleótidos que son capaces de hibridarse con secuencias de gene, o partes únicas de las mismas, descritas en el presente documento. En muchos casos, las condiciones de hibridación son condiciones de rigurosidad de
15 aproximadamente el 30% v/v a aproximadamente el 50% de formamida y desde aproximadamente 0,01 M a aproximadamente 0,15 M de sal para hibridación y desde aproximadamente 0,01 M a aproximadamente 0,15 M de sal para las condiciones de lavado con aproximadamente 55 a aproximadamente 65 ºC o mayores, o condiciones equivalentes a estas.
En otras realizaciones, se pueden utilizar otras sondas que se hibridan a las mismas secuencias expresadas como SEC ID Nos 1-362. Estas sondas adicionales se pueden preparar o seleccionar por el análisis de las secuencias expresadas detectadas por las SEC ID Nos 1-362. Tales sondas de polinucleótidos adicionales para su uso en la divulgación pueden tener una identidad de aproximadamente o un 95%, aproximadamente o un 96%, aproximadamente o un 97%, aproximadamente o un 98%,aproximadamente o un 99% con las secuencias genéticas
25 que se van a utilizar. La identidad se determina utilizando el algoritmo BLAST como se ha descrito anteriormente. Estas sondas adicionales también se pueden describir sobre la base de la capacidad de hibridarse a genes y secuencias expresadas de la divulgación bajo condiciones de rigurosidad como se han descrito anteriormente o condiciones equivalentes a estas.
En muchos casos, las secuencias son las de ARNm codificado por los genes, el correspondiente ADNc de tales AR, y/o versiones amplificadas de tales secuencias. En algunas realizaciones de la divulgación, las sondas de polinucleótidos están inmovilizadas en una matriz, otros dispositivos, o en manchas individuales que localizan las sondas. En muchas realizaciones, las sondas se dirigen a una región de un gen (o secuencia expresada) es decir, o contiene una parte de una región 3’ sin traducir. En algunos casos, la región está en aproximadamente 100, 200,
35 300, 400, 500, 600, 700, 800, o 900 o más nucleótidos de la señal de poliadenilación o cola poliadenilada de un ARNm.
De manera alternativa, y en otra realización de la divulgación, la expresión genética se puede determinar por el análisis de las proteínas expresadas en una muestra celular de interés por el uso de uno o más anticuerpos específicos de uno o más epítopos de productos genéticos individuales (proteínas) en dicha muestra celular. Tales anticuerpos se pueden marcar para permitir su detección fácilmente tras la unión con el producto genético.
El término “marca” se refiere a una composición capaz de producir una señal detectable indicativa de la presencia de la molécula marcada. Marcas adecuadas incluyen radioisótopos, nucleótidos cromóforos, enzimas, sustratos,
45 moléculas fluorescentes, restos quimioluminiscentes, partículas magnéticas, restos bioluminiscentes, y similares. Como tal, una marca es cualquier composición detectables por medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquímicos, eléctricos, ópticos o químicos.
El término “soporte” se refiere a soportes convencionales tales como perlas, partículas, varillas, fibras, filtros, membranas y soportes de silano o silicato tales como portaobjetos de cristal.
Como se utiliza en el presente documento, una “muestra de tejido prostático” o “muestra celular de cáncer de próstata” se refiere a una muestra de tejido prostático aislada de un individuo, tal como el afectado de cáncer de próstata. La muestra puede ser de material retirado por medio de una prostatectomía, tal como una prostatectomía
55 radical. De manera alternativa, se pueden obtener por otros medios, tales como una biopsia por aguja (central) u otras técnicas de biopsia, como las biopsias dirigidas lateralmente, la estrategia convencional de biopsia por sextante, diferentes combinaciones de biopsias de sextante y lateral como técnicas extendidas, biopsia de próstata guiada por ecografía transrectal, y otras conocidas por los expertos en la técnica, Tales muestras se aíslan primariamente (al contrario que las células cultivadas) y se pueden recolectar por cualquier método reconocido en la técnica. En algunas realizaciones, la “muestra” se puede recolectar por un método invasivo, incluyendo, pero sin limitarse a este, biopsia quirúrgica. Una muestra puede contener células del tumor de próstata que se aíslan por métodos conocidos u otros métodos apropiados que se consideran deseables por el experto. Los métodos de aislamiento incluyen, pero sin limitarse a estos, microdisección, microdisección por captura con láser (LCM), o microdisección con láser (LMD) antes de su uso de acuerdo con la divulgación.
65 “Expresión” y “expresión genética” incluye la transcripción y/o traducción de material de ácido nucleico.
Como se utiliza en el presente documento, la expresión “que comprende” y sus relacionadas se utilizan en su sentido inclusivo; es decir, equivalente a la expresión “que incluye” y sus relacionadas.
Condiciones que “permiten” que se produzca un acontecimiento o condición que sea “adecuado” para que ocurra un
5 acontecimiento, tal como la hibridación, extensión de cadena, y similares, o condiciones “adecuadas” son condiciones que no evitan que ocurran tales acontecimientos. Por lo tanto, estas condiciones permiten, potencian, facilitan o son conductivas al acontecimiento. Tales condiciones, conocidas en la técnica y descritas en el presente documento, dependen de, por ejemplo, la naturaleza de la secuencia de nucleótidos, temperatura, y condiciones tampón. Estas condiciones también depende del evento que se desea, tal como hibridación, escisión, extensión de cadena o transcripción.
“Mutación” de secuencia, como se utiliza en el presente documento, se refiere a cualquier alteración en la secuencia de un gen de interés desvelado en el presente documento, en comparación con una secuencia de referencia. Una mutación de secuencia incluye cambios den nucleótidos únicos, o alteraciones de más de un nucleótido en una
15 secuencia, debidos a mecanismos tal como sustitución, eliminación o inserción. El polimorfismo de un nucleótido simple (SNP) también es una mutación de secuencia como se utiliza en el presente documento. Debido a que la presente divulgación se basa en el nivel de expresión genética (o de secuencia), las mutaciones en regiones no codificantes, pero reguladoras, de genes que se desvelan en el presente documento también se pueden ensayar en la práctica de la divulgación.
“Detección” incluye cualquier medio de detectar, incluyendo la detección directa e indirecta de la expresión genética los cambios de la misma. Por ejemplo, se pueden observar productos “detectablemente menos” directa o indirectamente, y el término indica cualquier reducción (incluyendo la ausencia de señal detectable). De manera similar, un producto “detectablemente más” significa cualquier aumento, tanto si se observa directa como
25 indirectamente.
Prostatectomía se refiere a la extracción del tejido prostático por un médico experto, tal como un cirujano. Ejemplos no limitantes incluyen la prostatectomía radical, prostatectomía abierta (tradicional) (que implica una incisión a través del periné); prostatectomía laparoscópica; y prostatectomía robotizada (con preservación nerviosa).
Puntuación de Gleason se refiere a la graduación de una muestra de cáncer de próstata por un patólogo experto de acuerdo con el sistema de Gleason, que asigna una puntuación de Gleason utilizando números del 1 al 5 basándose en las similitudes de las células de una muestra de tejido tisular, con respecto a un tejido cancerosos o un tejido prostático normal. Los tejidos que se parecen más al tejido prostático normal tiene una puntuación o grado de 1
35 mientras que un tejido que carece de características normales y que tiene células que parecen diseminarse anárquicamente por la próstata tiene una puntuación o grado de 5. Las puntuaciones o grados de 2 a 4, inclusive, tienen características entre estas posibilidades. Pero debido a que los cánceres de próstata pueden tener áreas con puntuaciones o grados diferentes, se dan las puntuaciones o grados separados a las dos áreas que suponen la mayoría del tejido. Las dos puntuaciones o grados se suman para dar una puntuación de Gleason (o suma de Gleason) entre 2 y 10.
A menos de que se defina de otra manera todos los términos técnicos y científicos que se utilizan en el presente documento tienen el mismo significado que entiende comúnmente un experto habituado en la técnica a la que pertenece la presente divulgación.
General
La divulgación se basa en parte en el descubrimiento predictores basados en la expresión genética (o de secuencia) del fallo del antígeno sérico prostático (PSA) utilizando grupos de entrenamiento y de ensayo de muestras de cáncer de próstata de tejidos FFPE archivados desde 1993-1995. Las muestras tienen datos del seguimiento clínico a largo plazo de los pacientes, incluyendo aquellos sin evidencia de enfermedad (NED) durante al menos 10 años tras la cirugía y aquellos que desarrollaron una recurrencia posterior (tal como una metástasis a distancia), de los que se obtuvieron las muestras. Se identificaron 62, 92, 337 y 362 genes (o secuencias expresadas), de un grupo de inicio de aproximadamente 1536 genes con un alto grado de expresión dinámica (o variación en los niveles de expresión)
55 de diferentes tipos de cáncer, por medio del perfil de expresión basado en el ARN de las muestras. Los niveles de expresión de estos genes se correlacionan con el fallo del PSA y l9os resultados clínicos como se describen en el presente documento y por lo tanto se pueden utilizar como predictores como se describe en el presente documento. Se había comunicado que los genes que se identificaron participaban en funciones celulares incluyendo el ciclo celular, la coagulación de la sangre y la curación de heridas, regulación de la transcripción, y apoptosis.
La capacidad predictiva del patrón (perfil) de expresión genética desvelado se puede correlacionar con la puntuación de Gleason y el estadio tumoral del AJCC. También es consistente con los niveles preoperatorios de PSA. El perfil también tiene la capacidad de estratificar las muestras con las puntuaciones de Gleason de <= 6 y 7 en bajo y alto riesgo de fallo de PSA. En los análisis multivariados con factores pronósticos conocidos, el perfil era la única 65 predicción que permanecía estadísticamente significativa (p < 0,05). Por lo tanto, la detección del perfil en la biopsia,
o en el tejido extraído durante la prostatectomía, permitía distinguir entre cánceres indolentes y agresivos.
La divulgación incluye la identificación y el uso de los patrones (o perfiles o “firmas”) de expresión genética que discriminan entre (o se correlacionan con) los resultados de supervivencia y recurrencia en el cáncer de próstata de un sujeto. Tales patrones se pueden determinar por los métodos de la divulgación por medio del uso de varias células o muestras de tejido de referencia, tal como las que ha revisado un patólogo experto en la patología del 5 cáncer de próstata, que reflejan las células de cáncer de próstata en oposición a las normales u otras células no cancerosas. Los resultados que experimentan los sujetos cuyas muestras se pueden correlacionar con los datos de expresión para identificar patrones que se correlacionan con los resultados. Debido a que el perfil de expresión genética total se diferencia de persona a persona, cáncer a cáncer, y célula cancerosa a células cancerosa, las correlaciones entre ciertas células y genes expresados o bajo expresados se puede hacer como se desvela en el
10 presente documento para identificar genes que son capaces de discriminar entre resultados del cáncer de próstata.
Identificación y descripción de genes y secuencias
La divulgación se puede practicar con dos o más de cualquiera de los genes desvelados (secuencias expresadas)
15 que se han encontrado para expresarse diferencialmente con respecto al resultado del cáncer de próstata o tras la prostatectomía, tal como el aumento del PSA de > 0,2 ng (“fallo del PSA”). La identificación se hizo utilizando los perfiles de expresión de varias poblaciones celulares homogéneas de cáncer de próstata. El nivel de expresión de cada gen del perfil de expresión se puede correlacionar con un resultado en particular. De manera alternativa, los niveles de expresión de dos o más genes (secuencias expresadas) se pueden agrupar (combinar) y usar basándose
20 en las correlaciones con resultados particulares. Ejemplos no limitantes de resultados incluyen pero no se limitan a estos, metástasis distante, tal como a ganglios linfáticos o hueso, o necesidad de quimioterapia de seguimiento o radioterapia o crioterapia. En realizaciones adicionales, el perfil de expresión se puede utilizar para estratificar sujetos o pacientes en un pronóstico diferencial de “espera en observación” frente a “necesidad de más tratamiento” en donde el último incluye terapia neoadyuvante o adyuvante más allá de la cirugía para eliminar el cáncer/tumor de
25 próstata. Los métodos desvelados pueden por lo tanto utilizarse como parte del manejo del cáncer de próstata.
Los genes con correlaciones significativas con los resultados de supervivencia en el cáncer de próstata (o tras la prostatectomía), metástasis, o recurrencia se utilizan para discriminar entre resultados. De manera alternativa, los genes con correlaciones significativas se pueden utilizar en combinación con genes con correlaciones bajas para 30 formar un patrón o perfil de la divulgación sin pérdida significativa de capacidad de discriminar entre resultados. Tales combinaciones (o patrones de expresión) se pueden seleccionar y ensayar por medios apropiados reconocidos en la técnica, incluyendo, pero sin limitarse a, análisis de agrupamiento, máquinas de vectores de soporte, redes neurales u otro algoritmo conocido en la técnica. Los patrones o perfiles son capaces de predecir la clasificación de una muestra desconocida que se basa en la expresión de los genes utilizados para la discriminación
35 en los modelos. Se puede utilizar la validación cruzada “deja uno fuera” para ensayar la actuación de varias combinaciones y para ayudar a identificar los pesos (genes o secuencias expresadas) que son menos informativos o van en detrimento de la capacidad predictiva de una combinación. La validación cruzada también se puede utilizar para identificar genes o secuencias, cuya expresión aumenta la capacidad predictiva de los modelos.
40 Los genes desvelados (secuencias) que se expresan en correlación con resultados particulares del cáncer de próstata, o tras la prostatectomía, proporcionan la capacidad de enfocar el análisis de expresión genética a solo los genes que contribuyen a la capacidad para estratificar un sujeto entre diferentes resultados. La expresión de otros genes en una célula de cáncer de próstata sería incapaz relativamente de proporcionar información que concierne, y asistir así al pronóstico diferencial (o discriminación) del resultado de un cáncer de próstata.
45 Como apreciará un experto en la técnica, las combinaciones (perfiles o patrones de expresión) son altamente útiles incluso cuando se basan en un pequeño grupo de datos de expresión genética de referencia y pueden llegar a ser gradualmente precisos con la inclusión de más datos de referencia aunque el aumento gradual de la precisión probablemente disminuirá con cada dato adicional. La preparación de datos de referencia de la expresión genética
50 utilizando genes identificados y desvelados en el presente documento para discriminar entre diferentes resultados del cáncer de próstata o tras la prostatectomía, se hace de forma rutinaria y se puede realizar fácilmente por un experto para permitir la generación de modelos como se ha descrito anteriormente para predecir el estado de una muestra desconocida basándose en los niveles de expresión de estos genes.
55 La divulgación incluye las secuencias expresadas en la siguiente Tabla 1 y los genes expresados en la Figura 14.
Tabla 1
SEC ID Nº
Frec. Secuencia de la sonda z P Grupo de 62
1
500 GGCTGCTAGAAGGCGCATTCAATATCAGTACTGTTTAACGAGTGCG -3,00978 0,004298 sí
2
488 TGACTGGATGGACACATTGCTGTGGGTAGTCCCTCCTACTAGGA 3,250421 0,000878 sí
3
475 CCAACTATGAAAGGCCATAGAAACGTTTTAATTTTCAATGAAGTCACTGA 1,295466 0,199714 sí
4
386 ATATTTTGGTGTTTGGGAGGCATGCAGTCAATATTTTGTACAGTTAGT 2,775622 0,00728 sí
5
349 TGCATGGTTGGTCTGAAAATAGAGTTGGGCTTAATGTTGACTTCTATTAC 5,04529 6,51 E-06 sí
6
338 TCACATCAGTCTTCCGGAATCAAGATCAACATATCAGGTGGTCATT 3,405667 0,000631 sí
7
334 CCCCACCCCTATCGTGGTTATTGTGTTTTTGGACTGAATTTACTTG 4,583428 2,21 E-07 sí
8
297 CCGGATGGTGCTTCTAATTTTCTGCTAACCTGTACTGTGGTGTGTGTA 3,80189 0,000379 sí
9
291 CCTCCGAGCTGCTAGCTGACAAATACAATTCTGAAGGAATCCAAA 3,710157 0,00019 sí
10
287 GCCTGTATCCCGGTGGGAGTACTATGAGTCAGTGTACACAGAACG -3,6926 0,000507 sí
11
267 AAACCATCAGCCGGCCTTTTATATGGGTCTTCACTCTGACTAGAATT 3,57085 0,0014 sí
12
267 GACTGATGCCAGGACAACCTTTCTCCCAGATGTAAACAGAGAGACATG -4,19554 2,68E-05 sí
13
259 CACTGGACAGCGTTCGAGTGTGGGTTTTAACATCCCTGTGAGATT 2,634469 0,006429 sí
14
254 GATCTGGGGATCACGCCTTGCCCAAGTGTGAGATTACCTTTCT 2,052031 0,040119 sí
15
244 TTCAGGCTTAATGCTGCACCTAGATATAAATGCTAATGATACTTGGGTT 5,729346 2,33E-07 sí
16
232 GAGTCAGTGGATGGACAGGTGGTTTCTTCCCACAAGAGAGAAAT -3,406 0,001156 sí
17
227 TGGTAGGAGATACTAATTGGATTCGGAGATATTAATTGGATTTGGCCA -1,61758 0,110916 sí
18
211 CCTAAGGTGGTTGTGCTCGGAGGGTTTCTTGTTTCTTTTCCATTTT 1,001552 0,315659 sí
19
194 GCTCAATATTCCCAGAATAGTTTTCAATGTATTAATGAAGTGATTAATTGGCT 4,402902 4,56E-06 sí
20
169 TTGCTTTTTCTTCCTTTGQGATQTTGGAAGGTAGAGAAATATTTATAAA 3,113451 0,002649 sí
21
181 AGGCCTCATCCTCCACTGAAGAGTATGGATTGAAGGATTGTGAAC 4,029959 5,79E-05 sí
22
181 GCTGAAGGACCCTGAGGAGCTTCGCAACTACATGGAGAGGATC 2,98415 0,004216 sí
23
178 TGTTTCAAAACCACTTGCCATCCTGTTAGATTGCCAGTTCCTGG 1,89886 0,057651 sí
24
164 ATCAAGCAAGTTCCTGCTGCTGAAGGATAAGACACAGATGACCTG -0,84556 0,373466 sí
25
142 TAAGTCGGGTGGCAATTGTCAGGGTGTGGGAATTTCTTTTCCTAC 3,39272 0,000659 sí
26
140 AGTTCTGACCCAACCACAGAGGATGCTGACATCATTTGTATTATGTTC -2,26722 0,020347 sí
27
135 CCATGGCAGTGGGAAAAATGTAGGAGACTGTTTGGAAATTGATTTT -1,91339 0,060183 sí
28
118 AGGACCTGAAGGGTGACATCCAGGAGGGGCCTCTGAAATTTC 1,467298 0,152499 sí
29
117 GGACTCATCTTTCCCTCCTTGGTGATTCCGCAGTGAGAGAGT 2,349832 0,026905 sí
30
117 CTCCCTGAAAAACCATTCCTGCTGAAACTGCTGTAGAAATTGTGAAG 3,856822 3,49E-05 sí
31
114 CCCCTGAAAAGTGAGCAGCAACGTAAAAACGTATGTGAAGCCTCT 2,97408 0,002585
32
109 CACCTGCTCTAGGGACGATTCGTTTGAAAGAGAGTAAGATGCATTAA -3,92943 0,000275 sí
33
103 CCACCTGTTCTCAATTTGCAAGAATTAGAGGCGTATAGAGACAAATTG 1,583424 0,10573 sí
34
102 TGTTTGGTCGTAATGTCTGCATGATATTTGTGCACATTTATTAAGTATCG -3,38591 0,000419 sí
35
102 GGCTGGGTGTTTTCAAATGTCAGCTTAAAATTGGTAATTGAATGGAA -2,34381 0,021355 sí
36
99 GCAAGCATAAGGGAAAATGTCACGTAAACTAGATCAGGGAACAAAATC 1,603483 0,122455 sí
37
92 GCCAAGACCACCCAGGAAACCATCGACAAGACTGCTAACCAG -2,61622 0,013024 sí
38
81 TTTGCAAAGAATCCAGGACAAAAAGGATTAGATCTAGAAATGGCCATT -0,1063 0,915443
39
77 GGTGACTTTTGCAATTCAGGGAAGATTTGGGCATATTAAATGAAAGA -2,49834 0,012822 sí
40
74 ATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTGCT -0,69455 0,484731
41
71 TTGATTTGGGACTTGGGAGACCTCTCTTCTGTAAGCAACTCAATAAA 3,539216 0,00045 sí
42
67 AATCCTGTGGTGAATGGTGGTGTACTTTAAAGCTGTCACCATGTTA 1,171006 0,231962 sí
43
64 CTTGAGTCCCACCCAAAACCTCTAGTAGGGTTTTAATAACGCTCAC 3,521289 0,000326
44
64 TCTTTCAGAAGTGAAGAGGGGGCTAGAAGGACTCTGAGAAGTTGGTA 3,320872 0,001015 sí
45
60 GCAGAGAGTGCCGATCTTACTCAAGTACCTAGACTCAGATACAGAGAAGG 2,934405 0,002862 sí
46
60 CGGAACTCTTGTGCGTAAGGAAAAGTAAGGAAAACGATTCCTTCTAA 2,370805 0,019885 sí
47
59 AATGTGGGAAGGTGGGGGTTATGGAGGAGATAACTCAAAACTTCT 3,829441 0,00022 sí
48
59 CCCCATCTTGTGGTAACTTGCTGCTTCTGCAGTTCATATCCATATTT 1,175431 0,263596 sí
49
54 TTATCCATTCGTTGTGGACCCACAGATTGCATCTTTAAATTCATAAT 1,210782 0,239402
50
52 AGGTCCTCAGATGGGAATTGCACAGTAGGATGTGGAACCTGTTT -1,45819 0,141876 sí
51
51
TGTAACATTCCTGAAGCTGTTCCCACTCCCAGATGGTTTTATCAATA 1,852187 0,06511 sí
52
48 TTTTAACTTCTATATGGGACCCGAATTAGACACTGCTGAATCCTGTAC 3,449622 0,000296 sí
53
46 AGAAGAGCACAAAGCAAGGCCATTGCAACAGGCATTTAAAAATTATT -4,08976 7,22E-05
54
46 CTCAATGCATCCATCTTGGGCTGATCATGCCACAGATCTCATTC 3,285094 0,001303 sí
55
45 AATTCCTCGGGAAAGGTGAACCTGAACAACCCAAGTCTCTCTCT -4,17274 3,78E-05
56
45 GCTCTGTTACAGCTCTGACCACGAAAAACTGAAGCCTCAGTACTTG -3,86847 0,000157 sí
57
44 CCACTTGACAGTGGAGCAGAGGGGTTACCCAGATTTCAACCTCAT 1,389785 0,187738
58
44 TTCTGGGATTTCTCTAGAGGCTGGCAAGAACCAGTTGTTTTGTCTTG 0,716713 0,475575
59
42 TGAGCACCTTTTAAACCTGCTGCACAATAATTGAGGAAATAGACTCTTT 1,253049 0,204046
60
42 CGTGTCAACAATGGTAAAGGGGATGTATGGCATTGAGAATGAAGTC -4,22412 0,000197 sí
61
41 TCAAAGTTCCCCAAGAAGAACTGGAAAATGCCAGCCTAGTGTTTAC -1,17228 0,26041 sí
62
37 ATGTTCACCTGGCAATCAQCTGAGTTGAGACTTTGGAATAAGACACT 3,369271 0,000783
63
37 TTTAATTATGGTGAGCGTTTCCGTTTGGGTACAAGGAATATGAGAGAT -1,57416 0,125115
64
34 TGAGAGCATGCCAAAATTTGCTAAGTCTTACAAAGATCAAGGGCT 3,791155 0,000213 sí
65
33 TCCCTACCAAGTGAAAATTGATGTGTGTTAAGAGGGTACAGAATTATCAAC 2,285228 0,014636
66
33 GGTGATTTGCTGCTGGCTTTCTATCATTTTTATGTTTTAATGCAAAG -3,31128 0,001117 sí
67
33 GGCCAAGAATATTGCAAAATACATGAAGCTTCATGCACTTAAAGAAGTA -0,5838 0,561233
68
32 CTCCTCAGGACCCTCTGGGTCACACATCTTTAGGGTCAGTGAAC -3,24137 0,000608 sí
69
32 GGCAACAGGAAACAGGTTTTGCAAGTTGAAGGTTCACTCCCTATAT 3,728802 4,82E-05
70
30 TGAAAAAGTTATCTCTGGGTATTGCATAAAAGGCTTCATCTTATAAAGTGA -1,39464 0,192516
71
29 CCACGAGGATGGCCCACAAGCAGATCTACTACTCGGACAAGT 0,902775 0,379221
72
28 TCTGCTCTCCATCCAGAGCCTTCTAGGAGAACCCAACATTGATAGT 4,556078 1,33E-05
73
27 GTGAGGAGCGAAGAGCCCTCTGCTCTAGGATTTGGGTTGAAAAA 1,185538 0,24293
74
27 TGGCACTTTGTTTGTGTTGTTGGAAAAAGTCACATTGCCATTAAAC 0,806045 0,423301 sí
75
26 GGCTGGATCAAGGGCAAAAACTGGTCATTAAGTCATCTGACATTAA 2,219451 0,029617
76
26 GAGAGAAATTTTAGGTGGTTGAAATGATTAAATGGAAAGAGATTTATTTTCA -2,55709 0,010361
77
26 TCTTTGAGAAACAGCGTGGATTTTACTTATCTGTGTATTCACAGAGCTT 1,067981 0,294969 sí
78
25 ATAGAGCACCCAGCCCCACCCCTGTAAATGGAATTTACCAGATG 1,605946 0,10608 sí
79
24 TCACAGGATCCTGAGCTGCACTTACCTGTGAGAGTCTTCAAACTTT 0,054807 0,956306
80
24 GCTGAAGTGTTCATAAGATAACAATAGGCTTGAATCTCCAATTCAAATGAAT 0,213151 0,831225
81
24 TTGTGACATTGTGACAAGCTCCATGTCCTTTAAAATCAGTCACTCTG -5,23137 3,27E-07 sí
82
24 TGGAAACTCTTGGACCAAGATTAGGATTAATTTGTTTTTGAAGTTTTTTG 0,949064 0,344716
83
22 CATTCAATCCGGACCATTTTCTGGAGAATGGACAGTTTAAGAAAAGG 0,784157 0,439473
84
22 TGCTGAACTCACAGTTAGACAATCCATGGTTTAATGCACATGAAATTACC -0,14282 0,887169
85
22 ACGATAACCTGGCAGTGGAAGGAAAGAAGCATGGTCTACTTTAGGT -2,47268 0,010003
86
21 CTGCTTGATTTTTGCCTCTTCCAGTCTTCCTGACACTTTAATTACCA -4,14257 2,03E-05
87
21 TCAACATCACAATGGCAAAGAAGAAATATACTGTACAAAACTGCAGGAA -1,72036 0,093687
88
21 TTTGCATGTCCAAATTGCTTCCTTCTTTTTAGCAGAAAGGAGGAGT -1,91298 0,083553 sí
89
21 TCCAGGCATTTTAGAACTATGCAATTGTGATTTAAAATGCAACTTTGT -2,15046 0,037021
90
21 GAGACAGGGAAACACAAGGGGAGTAGAAGGCTTCAGTAGAAGATTTC 1,665338 0,12772
91
20 GTGGTCATCATCAAGGCATGCCAGGATACCTTCCTGGTGCTAT -1,18886 0,2414
92
20 CCTGGTAAGTATGCAGCACATTGCTTATATCCTGGGTATGCATTATTTT 3,422692 0,000874
93
20 TCAATGAGTAACAGGAAAATTTTAAAAATACAGATAGATATATGCTCTGCATG 3,192274 0,001222
94
20 TGCCCAGTTTGTTCAAGAAGCCACTTACAAGGAAGTAAGCAAAATG -0,54687 0,573053
95
19 GAAACGGGGCCATATAGTTTGGTTATGACATCAATATTTTACCTAGGTG 4,220137 3,53E-05
96
18 ATTTCCATGCCGTCTACAGGGATGACCTGAAGAAATTGCTAGAGAC -1,16115 0,230302
97
18 TGCATAATTCATTGTTGCCAAGGAATAAAGTGAAGAAACAGCACCTT -1,41926 0,138831
98
18 CTGCTCTTGTGCCCTTCTGAGCCCACAATAAAGGCTGAGCTCTTA 2,079621 0,016021
99
18 CCTCCGGAAGCTGTCGACTTCATGACAAGCATTTTGTGAACTAG 1,81169 0,070381 sí
100
18 CATAGCTCTTTGGCTCGTGAACGTAATTGTAAACTTTCAGGTATTTTTG 1,766145 0,074049
101
17 CCAGTTATGCAGCACCTGGCTAAGAATGTAGTCATGGTAAATCAAGG 3,991931 0,000108
102
17 GGCAGGCACTTTAATACCAAACTGTAACATGTCTCAACTGTATACAACTCA 1,692111 0,097387 sí
103
16 GCCACACTGAAAAGGAAAATGGGAATTTATAACCCAGTGAGTTCAGC 0,852486 0,40553
104
16 CTGGGCATACAACCCTCTGCTTTCACATCTCTGAGCTATATCCTCA -3,7346 0,000251
105
16 AGCAGACAAAAAAGGCACTTTTCAGAACATCAAATTCCTAATGAAGAAG -3,23615 0,002278 sí
106
15 TGCTTCATTGTGCCCTTTTTCTTATTGGTTTAGAACTCTTGATTTTG 3,311718 0,001031
107
15 GATGTGGCAGAATCCACACCAGCTTATCAACCAACACAGCTAATTT 1,389693 0,166098
108
15 GGGGGAGTAAAAAATTGAATTTTAACAAAAGATCTTAGGGGAATGTGATT -3,0524 0,002691
109
14 CCTTGATGCTGTCTGTACAGGGTTCATATTTTGTAGCGAAAGTCGTTT -2,22662 0,020629
110
14 CATCCAGGACACTGGGAGCACATAGAGATTCACCCATGTTTGTT 1,067035 0,287699
111
14 CGGAAGAACTGAGCACTCTGTTCTCCAAACCTATCAGAAATTTGTGG 3,742475 0,000285
112
13 ACCAGTAGGGGCTTATAATAAAGGACTGTAATCTTATTTAGGAAGTTGACTT -4,16547 2,91E-05
113
13 CACTTTCAGATAAGAGGTGTTTGCTGGGATGGAAGAAGTACCTGGC 1,85552 0,076369
114
13 GAAAGCCTTCCTCGGGTTCAAAGCTGGATTTTGAACTGAAGAAGAT 3,344591 0,000724
115
12 TGAAAATTGGTAGATCAGAGTTGAGCTGATTGGAGGACCAAATTAAAA -2,61178 0,007099
116
12 TTCCATTGTAATTGCTATCGCCATCACAGCTGAACTTGTTGAGAT 3,126618 0,001574
117
12 GACACAGATGACTCTTTGGTGTTGGTCTTTTTGTCTGCAGTGAATGTT 1,891374 0,056055
118
11 TCAAGAAAGGGATTCCGAGGCCAATAAGCCCTCCTTTCTCTTG -1,24114 0,198279
119
10 TCCAGATAACTTTCAGGCACTGCTGGAGTGTCGGATAAATTCTGGT 1,813774 0,066896
120
10 AATCCTCACATCGTGCCAAACTTAGTCTGGTTACTAAGCCTAAAAACA 2,403548 0,016851
121
10 ATTGAGGATTTGTGGGCAGCCAGAGGGAGTCTGACTGAAGTTTAC -2.29581 0.02535
122
9 TGCCAGAATCTAGTGGGATGGAAG 1 1 1 1 1 GCTACATGTTATCCACC -0.34425 0.731248
123
9 TTCCTTCATGTAACTTCCCTGAAAAATCTAAGTGTTTCATAAATTTGAGAG 2.695661 0.00798
124
9 CTCTGGTG1 1 1 1CGCCAGACAATAAACTTACACTGGAAGCTTTGAT -3.03684 0.002403
125
9 TTGAACACAGGCTTTGTCTGAATGATGTTCI 1 1 1ATCTCTTGAACACAA -3.59572 0.000682
126
9 GAAGCCAAAGTACCCGCACTGCGAGGAGAAGATGGTTATCATCAC 1.937332 0.052778
127
9 AGCTGGCGCCAGCTTCTTCTCCTGGATCCAGTAAGAGTTTCG -0.59083 0.544181
128
9 CCTGAAGGAAACCACTGGCTTGATATTTCTGTGACTCGTGTTGC -0.58376 0.559447
129
8 CCACCTTTCCTCCCAGCAAGCATCTGGCCAATCCTATTCTTC -2.29915 0.014561
130
8 GTGAGGTACAGGCGGAAGTTGGAATCAGG 1 1 1 1 AGGATTCTGTCTC 4.941946 1.60E-05
131
8 CTTGGCCTGAAGAGGTGCAGAAAATACAGACCAAAGTTGACCAG -1.962 0.049061
132
8 ACATAGTGACATGCACACGGGAAAGCCTTAAAAATATCCTTGATGTAC -3.61201 0.000318
133
8 TAATGCAAGCCCTGACTGGGTGGAAGCTGAAGTCTTGCTGTTTTA 2.396608 0.012653
134
8 TCCTTTTTTGGGGAAATCTGAGCCTAGCTCAGAAAAACATAAAGCAC -3.97531 0.00059
135
7 GGCCCTTCCTGATGATCATTGTCCCTACAGACACCCAGAACATCTT -2.36278 0.018244
136
7 GGAGCTGGGGAGCTGTGTTAAGTCAAAGTAGAAACCCTCCAGTGTT -4.42673 3.B6E-06
137
7 GCAGAAAAGAAGACGAGAATGCAACCATACCTAGATGGACTTTTCCAC 2.728168 0.006056
138
7 AACAAGTGGGA1 1 1 1 CTGGGCCAGCAAGTCTTCCAAACTGTATATG -0.21615 0.829698
139
7 GCTGTGTGGGTCACACAAGGTCTACATTACAAAAGACAGAATTCAGG -2.47087 0.013094
140
7 TGCACAGATCTGCTTGATCAATTCCCTTGAATAGGGAAGTAACATTTG 3.051955 0.001684
141
7 CCCTATGAGTGGAAGGGTCCAI 1 1 1GAAGTCAGTGGAGTAAGCTTTA -1.23786 0.21761
142
7 AGAGCTTCTGAGGCGCTGCTTTGTCAAAAGGAAGTCTCTAGGTTC 1.688918 0.097307
143
6 TGTGAAAACAAGCTTCAAAGCCATATGGACACTGTGACAATGACTA 3.369288 0.000926
144
6 GCATCTCCCTGACCTTCTCCAGGGACAGAAGCAGGAGTAAGTTTC -4.1766 1.77E-05
145
6 CGCCAGCTACAATCCCATGGTGCTCATTCAAAAGACCGACAC -1.32939 0.195817
146
6 GATCCGGGATGGGAGACCCCACTTTAGAAAGGGTCGTCACTC 2.803856 0.002763
147
6 TGGATTGAGAAAACCTATATCCATTCTTTATATCAATGTATAGTTTTAGTCTCCT 2.448797 0.019091
148
6 GGTGAATGCCCTCAACTTCTCAGTGAATTACAGTGAAGACTTTGTTGA 1.886404 0.063745
149
6 ATACGGCGAGGTAGAGTTGGCCATATTTCAGAGACTTAGATTGACGT 4.337458 1.70E-05
150
6 GCTCGTTTGGTGCACTCTCGTGGGAGACAATCAGAGAACAACATA 1.225008 0.19426
151
6 GCCTTTCCATCTGGCATTTCCCGCTCATTTATATGACTTGCTGAG 2.968053 0.002255
152
6 TCCGGTGACCAGGTGTCTACAAGGACAAGGTTCAGAAATTGTACAG 2,304752 0,025941
153
5 GCAGAGGTTCTTTTAAAGGGGCAGAAAAACTCTGGGAAATAAGAGAG -3,24369 0,000993
154
5 TTTTCCCCACCCGAGATGAAGGATACGCTGTATTTTTTGCCTAAT 2,24033 0,011993
155
5 ACTGCAGGATACACTCCCCTCCTGCTACCTAGGCAGGCGTGAG -0,88751 0,353721
156
5 GGTTTAACCCGAGTCACCCAGCTGGTCTCATACATAGACAGCACTT 2,232118 0,02553
157
5 GACACTTGTTTAGACGATTGGCCATTCTAAAGTTGGTGAGTTTGTCAA 1,647226 0,102927
158
5 TCACCAAAAGCTGTATGACTGGATGTTCTGGTTACCTGGTTTACAAAAT 2,938772 0,002383
159
5 CATAAGCTGGTATCAGTGGTTCGGGGGAAATAGTTCCATTCTATGACTC -3,01637 0,003841
160
5 TTGGCGATCATTTCCCAAGATTGGTTTCCCTTGAGTTTTTGTTAAA -4,22349 5,18E-05
161
5 CCTAGTTTGATGCCCTTATGTCCCGGAGGGGTTCACAAAGTGCT -0,55135 0,58089
162
5 TTTTCGAAGGATAATTTTGGAGGCNAGAAAAAATGGACGGGG -2,37921 0,016098
163
5 TGTTCGCGACTAGTTGGCTCTGAGATACTAATAGGTGTGTGAGGCTC -2,17442 0,018122
164
5 CACCTGGACCCCTGCATTGGAACTGGAGGCAGGGAACAT -2,2306 0,022824
165
5 TGGAAGGATGGAAGAAACGCCTGGAGAATATTTGGGATGAGACAC -1,79624 0,085727
166
5 GCATTACTTTGAATTTAATGTTGCGCTTGTGCACTGTGTTAATATTGTTT -2,46291 0,016207
167
5 GGTGATGGGGACCGTCTTTCTTTTACTGACACATGACCAATCATA -2,30099 0,020722
168
5 TGGGCAAAACCATTGAATTTCACATGGGTGGTAATATGGAGTTAAA -2,99545 0,002532
169
5 AACCAGCCTTCAGAGCGTTCTCTGTCCTGCTTCTAACGTCACTT 0,01601 0,987237
170
5 TGCCACATTTGACTGAATTGAGCTGTCATTTGTACATTTAAAGCAGC -0,67643 0,497085
171
4 TATATGGTTTCCAAAGGGTGCCCCTATGATCCATTGTCCCCACT -1,76935 0,075774
172
4 TTTAAGGACTGATCATTGGCTCTGAGGACACTTCAACTAGTTAGCCTTCT 0,11679 0,907115
173
4 CCCTCATCAAAGTCCTCGGTGTTTTTTAAATTATCAGAACTGCCC -2,8669 0,003674
174
4 CAAATGGTTACCTTGTTATTTAACCCATTTGTCTCTACTTTTCCCTGTACTT 3,411476 0,000689
175
4 GCCAGCTGCATGCAGGAGCGTGCCATCCAGACAGACTTC -2,24724 0,024396
176
4 CACTCCAGGCAGGTCTTGGGGCTCCTATGTAAGCTGTGTTAAGC -1,38308 0,168369
177
4 GGCTGGCAACTTAGAGGTGGGGAGCAGAGAATTCTCTTATCCAAC -2,0969 0,052047
178
4 GATTCATCCAGCCTTCCAGCTCTGTTATTTAAAGCAAGAACACTTCTG 4,423002 2,51 E-05
179
4 CCTAAAGCAAGCCTGAATTGGCTATGCAGTACATTGTATTCTGTTTG -4,28624 2,42E-05
180
4 CGGGCTTTTAGCAGCATGTACCCAAAGTGTTCTGATTCCTTCAACT -0,69941 0,485384
181
4 CTAAGGGATGGGGCAGTCTCTGCCCAAACATAAAGAGAACTCTGG 0,451498 0,654537
182
4 AAATCCAAACTCTCAATTACGCCATGGTAATTCAGTCACTAAAATATGT -3,42088 0,000689
183
4 GCAGGAACCGCGAGATGGTCTAGAGTCAGCTTACATCCCTGA -2,37983 0,026005
184
4 TGTTCCACTGAGCTCCTGTTGCTTACCATCAAGTCAACAGTTATCA 0,232032 0,818608
185
4 CTCAATGTAACCTCAGGGGCCAGTTTTAGCATTTGAAATGGTTCT -1,76115 0,095531
186
4 TCTGACCAGTTACAGCCCCAAAGATGCAGTGATAACTGTGATGTATG -1,37322 0,133757
187
4 GCATCCAGAACAGCCTGCTTGGACACAGCTCGGTGGAAGAT -2,12389 0,039832
188
3 TTACAAATGACTCAGCCCACGTGCCACTCAATACAAATGTTCTGCTAT 2,395553 0,016443
189
3 ACAGCCCTGCTCCCAAGTACAAATAGAGTGACCCGTAAAATCTAGG -3,50224 0,000637
190
3 CCAGATACTACTCGGCGCTGCGACACTACATCAACCTCATCACC -2,27536 0,031464
191
3 AATAAGCAGGATGTTGGCCACCAGGTGCCTTTCAAATTTAGAAA -1,68039 0,069608
192
3 GGAATTTGATTCTTCCAGAATGACCTTCTTATTTATGTAACTGGCTTTCA 3,817877 0,000172
193
3 CAAGGTGTAGCAAGTGTACCCACACAGATAGCATTCAACAAAAGCTG -2,7616 0,00587
194
3 CACAGAGTCTGAAAAGCGGGTCTCCGTCTACCAGAAGGTGACCTCC -0,46636 0,642653
195
3 TGAGGACTCAGAAGTTCAAGCTAAATATTGTTTACATTTTCTGGTACTCTG 2,004388 0,050059
196
3 TGGAATGGTGAAAGAGAGATGCCGTGTTTTGAAAGTAAGATGATGAAA 1,286332 0,218274
197
3 CAGGGGTTGAGAGCTTTCTGCCTTAGCCTACCATGTGAAACTCTA 0,396152 0,693055
198
3 CACAGATGAGAACCACGCCTAGCCAAMTCACTTTTCCTGTTTGC 0,932001 0,350214
199
3 AGGCATGGGAGTCATTGTCCACATCATCGAGAAGGACAAAATC 1,048222 0,289167
200
3 AACGGGATCCTCTGTGGTCGCGACACTGACCTAGACGGCTT 1,930889 0,05573
201
3 TGTGTGGCTTCCTGCAAGGTACCTTCATCTCTGAGTTACCTGACTC -2,12276 0,038612
202
3 GCTGTCCTCAAAGCATCCAGTGAACACTGGAAGAGGCTTCTAGAA 2,647942 0,012248
203
3 CCCTTTCTTTGATGGTGCTTGCAGGTTTTCTAGGTAGAAATTATTTCA 1,507454 0,122396
204
3 AAATGTACCAATCAGCATGCTGTGTCTAGCTCAAGAACTCAAGCTCC -0,57666 0,565438
205
3 CGTCACCCCAAAAAGTTCCCTCCATATCCCTTTGCAGTCAGTTC 0,760999 0,450353
206
3 CATGACCGCATGGTATACCTGGGCCTCTCAGACTACTTCTTCAACA -2,48108 0,008418
207
3 GCATTAGTATGACAGTAGGGGGGCTGTTAGAATTGCTGCTATACTGGT -1,3436 0,203689
208
3 CCAGGATAAAGCTTCCGGGAAAACAGCTATTATATCAGCTTTTCTGA 2,988968 0,005851
209
3 TTCCTGCTACACATGCCCTGAATGAATTGCTAAATTTCAAAGGAAAT 0,810494 0,410805
210
2 TGGCCTGTGGTTATCTTGGAAATTGGTGATTTATGCTAGAAAGCTTT -2,73832 0,007474
211
2 GGGAGAAAGCTAATGTTTTCCACAAGACTGAACAACGTGTATTTACACG -3,19477 0,000546
212
2 GTGCTGGGTGCATATCATCCAGGATAATATTCTGCCCAACTCCAT -1,23963 0,215301
213
2 CCCAGGATTATGTTTGTTGACCCATCTCTGACAGTTAGAGCCGATAT -1,35681 0,189959
214
2 GCTGGACAGGAGCACTTTATCTGAAGACAAACTCATTTAATCATCTTTG 1,270148 0,203802
215
2 AGTTGCAAAAATGGCTCCATCGGTAACTCAAGCTTCAGAATGTTATG 2,416151 0,015977
216
2 TCATCGGAGTAGATTCCGGGTGCCTTTACTCCACTGTGACCTCATA -1,28409 0,192946
217
2 GTGTGCTCAGGCAATTATTTTGCTAAGAATGTGAATTCAAGTGCAG 2,642687 0,006795
218
2 TGGGAAAGTATCAGGAGTGCCATGATTCCAATGTTTTCCTTCTTTTA 2,157816 0,025861
219
2 AGACGGCGCAGACATGTCAGAACAAAGTAAGGATCTGAGCGAC -3,49114 0,000292
220
2 CCAGCATTAAGTACTGTATATCGCCCTGTACTTGGATAGGCTGGCTAAC 0,144643 0,885072
221
2 AGGCAAGGAGGAGGGGAATTTTAAAACCATCTTATTTGAACTGAGAG 1,851673 0,064779
222
2 TGGTGCTCTATGCTCAATGATGGTCTTACACATTCCTCTAGGGAAAG 3,451224 0,001721
223
2 CCCTTTCTATTCTGAACAACTGTCTCCATTTTTCAAGTGTGAGAGATAAGG 2,35354 0,015021
224
2 CAGTCGAGACCCAGATCCACTGAACATCTGTGTCTTTATHTGCTG 1,792116 0,072731
225
2 GCAGACATCCTGTGAAGCAGGACCTGCTGAAGAGGAGACTTTCTAT 0,353515 0,72344
226
2 TGAGAAAGCTCAAGATTCCAAGGCCTATTCAAAAATCACTGAAGGAAA 2,674193 0,01623
227
2 CAATCCGAGTTCCCGGATGAGGGAACATTCTGCAGTATAAAGGG -1,59105 0,109934
228
2 CAGCACCAAGTCTACGGGTGCCAGATCAGTAGGGCCTGTGATT 2,448186 0,011472
229
2 AGCAACAGCAAATCACGACCACTGATAGATGTCTATTCTTGTTGGA 1,239036 0,208803
230
2 CTTGCCCATCTAGCACTTTGGAAATCAGTATTTAAATGCCAAATAATC 1,984819 0,047707
231
2 TTTTCAGGTTTATTCTTTTAGCAGGTGTAGTTAAACGACCTCCACTGAAC 0,755574 0,449369
232
2 TGCCAAAAATTAAAGTGCAATATTGTATATTTTTAAGAACAAATTTAAAATAGAA -0,31259 0,755488
233
2 TTCTGAGGAGGAGAGAGTGAGGGTTTTGCTATTGACTGACTTGAAC -0,56126 0,582467
234
2 CTGGGGGCGCAACCACCCCTTCCTTAGGTTGATGTGCTT -2,07743 0,039244
235
2 ACGCTGTGCGTTTGTCAGAATGAAGTATACAAGTCAATGTTTTTCCC -0,98359 0,325597
236
2 TGTTGAATACTTGGCCCCATGAGCCATGCCTTTCTGTATAGTACAC -1,61334 0,089292
237
2 GCTATACCTCATTCACAGCTCCTTGTGAGTGTGTGCACAGGAAATAAG 0,661879 0,50136
238
2 ACACTGTTGGACCTGACCCACACTGAATGTAGTCTTTCAGTACGAGA 1,423365 0,138012
239
1 TCCTGCAAGTAAGAATGTTTTCACACTGAGCTATTGATTTAACCAAGC 0,61193 0,55105
240
1 GGGAGGTCAGACACGCTTCATTATATCTCCGTCTCTTTTATGGTTT 0,118933 0,905287
241
1 TGGTTGTGCTTGCTTTCCTTTTTTAGAAAGTTCTAGAAAATAGGAAAACG -0,29803 0,763403
242
1 GCTCCGGCAGCACCTTTATCTATGGTTATGTGGATGCAGCATATAAG 0,36714 0,713965
243
1 AACCTCCCAGAGTTAGCCAGCCTTTCAGAGTTGAAGTCACAGCT 3,427416 0,000767
244
1 ATGTGCACCTTTGAGGCTACGGGCTTCTCCAAAGACTTAGGAATCT -2,69533 0,003868
245
1 ATGTGGCCATTACCGTCATTGGCCTGTGAAGCATTGGACATTTATA 1,572459 0,10227
246
1 GGCCTGTGAAAACAGAGGCTTTTGCATTGTCTCTTGACATCAGAAGT -1,55073 0,126022
247
1 AGCCAAGGCAGGGTGGACAGTGTGAGAGAGCTAGTGTAAGCTGT -4,58277 3,08E-05
248
1 ACATGGTTGTGCAGGGCCATGTGTGAAGACAGCATGAGTCTTA -1,37266 0,163501
249
1 TGATGTTGGTTGTAATGGTTGGGTTTAGGATGAACCATTTTAAGGAT -3,34973 0,000692
250
1 GTCCCAAAGGTGGAATACAACCAGAGGTCTCATCTCTGAACTTTCTT -0,7171 0,473628
251
1 GGCGTCTACAGAGACCAGCCATATGGCAGATACTGATTGTACTGTCT 3,48851 0,000532
252
1 TGTTTGCCTCAAACGCTGTGTTTAAACAACGTTAAACTCTTAGCCT 0,57799 0,564212
253
1 TGCCAAAAATAAACTCACATGAGCACATGACAGTCTGAGCTCTATAATCA 0,417675 0,679323
254
1 GTGCATGGACGACTGAACACAATCAACTGTGAGGAAGGAGATAAACT -0,49188 0,625569
255
1 CCTTGCCACGGTTCTAGAGCAGCGTAGACAGCTGGTAAACTGAAGA -1,4853 0,140016
256
1 CATCGAGAGCGCACACAAGACGCCACTGTAAAAGGATCACAGAT -2,23853 0,021028
257
1 GGAGTTCCAGGAGATTCAACCAGGATGTTTCTACACCTGTGGGTTA -2,6129 0,009463
258
1 CAGCCACCATCAAAGCCCATTCGTAGGAAATTCAGACCAGAAAAC -2,13238 0,039635
259
1 TTTGGAAGGCATTGAAGCTTGCACCTTTTCATGTACAGCATTAAAA 2,984702 0,00337
260
1 GACCAGGTCTATCAGCCCCTCCGAGATCGAGATGATGCTCAGTAC 0,012992 0,989634
261
1 ATCCAACACAGCCAGAACCCGCGATTCTACCACAAGTGACCATC -2,02092 0,048641
262
1 TTGCCTGGAGAAAGAGAAGAAAATATTTTTTAAAAAGCTAGTTTATTTAGC -0,31184 0,755184
263
1 TCACCCCTGACACAACATTTTCAGAATTCCAGACGATACTGTGATAA 0,561867 0,577848
264
1 ACGGAAACAGACCCCTGCTTTCGAATTTACATGTTCATGATGTGC -3,07043 0,001314
265
1 CTTCGCCCCTCCCTTGTTTTATATTTTATGAAGTTAGTGCGGG -0,71287 0,476918
266
1 ACCAACCAATACTCAGGAGAACCCTGCCTATGAGGAATATATAAGACCA -3,58227 0,000386
267
1 TGTTTGGAAAATCACATCATGCCTAGAATCTGAAATTGAATTAGCAA 1,822415 0,059401
268
1 GCCAAGAGAATGAGAGAAAGATGCTGCATTTTATAATCAAAGCCCAAAC 3,532588 0,000225
269
1 CGTTACAGTATTCTGATTATATTACTGACACAGTCMAATGATTAACTGTACAA 2,897694 0,007766
270
1 TTGTGCCTGTGTGTTACCATGCTAAGAATGTCTTTGTTTAAAGGGAA -1,30273 0,21043
271
1 GCAACAGCAAGCTGTAGAGCGGGCCAATGATAAATCACATTGAATC 2,236428 0,023294
272
1 AAGCCAAAGGAACTGGAGGCACTGATTTAATGAATTTCCTGAAGA 0,742825 0,459843
273
1 TTTCCTCTTGATGGGGAACTCCTGCTTCTCCTTGCCTCGAAAT -3,54509 0,000263
274
1 CCAGGTACAATGGCAGAGCCTTTCCATACCTGTACTCACAACTAGC -0,50817 0,617396
275
1 TGGTCTTCTTGCATCGATGATCCAACAGCAACACCATTTTTAAATTA 2,61129 0,008828
276
1 TGTCCCTTTGATACTTGTGCTCTGCTGAGAATGTACAGTTTGCATTAA 4,051892 5,82E-05
277
1 GAGAGGCAGCATTGCACAGTGAAAGAATTCTGGATATCTCAGGAG 0,118343 0,905829
278
1 TTGGATGAGATTAGGAGATCAGAGGCTGGACCTTCTCTTGATAATGC 3,212168 0,003088
279
1 AATTGTTGACATTCATGTCTCTGAGTTACAAAAGTGCTAATTCACTACATGT 1,92036 0,050161
280
1 GGGGAAATTCAAGCAGTGTTTCCTCAACCAGTCACATAGAACTCTG -0,78853 0,427972
281
1 CTGTCCAGCCGCATGGAGGGCATGATGGCTTCCTACAC 2,265809 0,038306
282
1 TGTCAATCTGTCCTCGGCTGCCCTTCTCATTTGTTGATGGGAC 2,656332 0,009243
283
1 GGAGACTTTCACAAGTGGTTTCCATGGAGATAGAATGAAGCATTCTGT 0,674533 0,493893
284
1 AGTAGTTTCTCCAAGTACTTTTGTGCTATCAATGAGTTCTTCTCAAAAAAT -2,07479 0,048611
285
1 TTTCTTTGCTAAGCCTTGCATGCAAAATTTGAAATTTTAACATTGGC 0,55078 0,582445
286
1 ACAAAACGAGTCCAGCGACGAGGAGAGCCTGAGAAAAGAGAGAG -1,49962 0,131713
287
1 AAATGAGGGCCCGTAACAGAACCAGTGTGTGTATAACGAAAACCAT -1,4828 0,140027
288
1 TCACCTCAGTCTCTAATTGGCTGTGAGTCAGTCTTTCATTTACATAGGGT 1,359493 0,181639
289
1 CGTCCAGCCAAGAGCTCTTCATCTGCTACAAGAACATTTGAATCTT -0,00765 0,993894
290
1 GATTGCAATGATGATGTCCAAGGTAAGCTATTAAAAGGCAGGTTACT 2,290805 0,021577
291
1 CTTGCCAGCAGCAATCATTTGGGGAAGAATCTACAGTTGCTGAT 1,790334 0,066752
292
1 TTCCTTTGGGAGAAACCTGTTCATTCCAATCTTCTAATTACAGTGGTT -2,87514 0,002884
293
1 CAGGACATCATGAGCAGGCAGCAGGGAGAGAGCAACCAAGAG 2,201609 0,048986
294
1 ACTCGGATTCTTTTGCATGATGGGGTAAAGCTTAGCAGAGAATCATG -4,84228 2,84E-06
295
1 GACGTGAAGTCTCGGGCAAAGCGTTATGAGAAGCTGGACTTCCT 1,175155 0,244078
296
1 CCTCTGTGTTCACTTCGCCTTGCTCTTGAAAGTGCAGTATTTTTCT 1,150612 0,26183
297
1 TCAGGTGTCATCACTGTTCAAAAGGTAAGCACATTTAGAATTTTGTTCTT 0,963905 0,33534
298
1 CCCTTACCCCTCTCTGGGCCCATGAATTCCTGGCTTGGTTTA -3,09019 0,003466
299
1 GGGAAAACATCCATGCTGGACTCCTGAAGAAGTTAAATGAACTGGA 0,235534 0,813451
300
1 CTCCACCAGAAGGGCACACTTTCATCTAATTTGGGGTATCACTGAG -1,26117 0,216194
301
1 TTCTCTCAAAATACTAAACAGAGGTGGTTTTATTGATAAGATTTTGGCTGT -0,63027 0,53117
302
1 GCATGCTGTTGTACATGATCCTGACAAGAAGAAAATGAAGCTCAAAGT 2,105255 0,032858
303
1 GTTCTCCCCTCTGGCCCCTGGAGAGAAGGGAGCATTCCTA 0,808842 0,416399
304
1 TCTTGGTGGGTCAAGACTTTCTGATAAATCAGTTAGCACCATGCAT -0,87476 0,375354
305
1 CTGGAATAATGGAAAGAAATGGGGGCTTTGGAGAACTAGGATGTTTC 3,031192 0,002176
306
1 GCCCACATGGATAGCACAGTTGTCAGACAAGATTCCTTCAGATTC -2,85804 0,004514
307 1 CGCCTTCCTCTTTTTAAGCTGTTTTATGAAAAAGACCTAGAAGTTCTTG 3,505339 0,000639 308 1 CTCCAAGCCGATCACCAAGAGTAAATCAGAAGCAAACCTCATC -3,8295 0,000169 309 1 AAAGTTGTGTAAGCGCCTGCGTTCTTCTGGGTTTGGCTAGATAG -0,09465 0,924545 310 1 ATGGACTGCTTTGCTGGATTGGCACTGAGCAACTTTAGGAAATGTC -1,62044 0,109697 311 1 TGATGAAATAACTTGGGGCGTTGAAGAGCTGTTTAATTTTAAATGCC 1,824359 0,047857 312 1 GCTCGCCCCTGTTTTTTGTAGAATGTCTTCATGCTTGACATACGTAC 1,700431 0,04944 313 1 CATAGGTGCCATCGTGGTTGAGACAAGTGCAAAAAATGCTATTAAT -0,74552 0,463916 314 1 TGTCTGTGTCAGACGTACAGCCAGACATGTTCTCTATTGGCATTTTT -1,1303 0,263264 315 1 CAGGCCTGGTGCTCAGTCGTACGACCTGTACCTCTCAACTTTTG 0,790296 0,40455 316 1 AACTCCTGCGATCAGCTTGTGACTTACAAACCTTGTTTAAAAGCTG 2,767204 0,006542 317 1 TCAGTGAGAGACTCCAGGACTTTGACAAAAGCAAGCATGTCATCTATG 2,720559 0,00547 318 1 AGCCACTTGCCCCAGTTCATAACCCCATTAGTGTCTAAGAAGATTTC -0,77976 0,423543 319 1 CACCAGGGACACATTTCTCTGTCTTTTTTGATCAGTGTCCTATACATC 0,388028 0,695317 320 1 GTCAGCTTGCCCAGGTTCAAACTGGAAGAGAGTTACACTCTCAACTC -3,24347 0,001134 321 1 TGATACCCACCGGGTCTGACATTCCAAGTAACCAGTATGTAACTGG 2,310635 0,02143 322 1 TTGTGCAGATAGTATTTCTGATTGATGTCATCTATCAAGAATTTCAAGAGATT -0,97212 0,33353 323 1 AAGACTGTCAGGAAGGGTCGGAGTCTGTAAAACCAGCATACAGTTT 2,012969 0,039001 324 1 AATGGGCATAAAGCTTCACACTAGTAACAAAAATGGCTTAACTTTATTACA -0,43582 0,664998 325 1 TCACATCAGGGCAAATGAAATATCCATCAACTCCAGCATTTATCATT 2,686802 0,005053 326 1 TGCCTTTTTGCCTTTGGTAACATAACTCTGGGAGTCTTGGTTTAT -2,86852 0,003159 327 1 CCACTGGTCATGCTGTGGAAAATTTAATGAGAAATCTGAATGCAGAT -2,15718 0,038994 328 1 CATTCCGCTCAAAGGTCACTGAGACTTTTGCCTCACCTAAAGAGA 1,771767 0,077694 329 1 TGAGGAAATCAAAGTGCTATTACGAAGTTCAAGATCAAAAAGGCTTATAA 1,823273 0,066945 330 1 GCTTTGGGGAGGACAAAACTTGTAAGTACAGTCAAGGACAAGACTTG 3,022171 0,002277 331 1 ACGTTCCAGGGCCCAAAGCCCAGCTCTTTGTTCAGTTGACTTA 3,641037 0,000299 332 1 TGGCCAAATTAGATGTGTGCTGAAGACAATCAGTCACTGGGTCTATA 0,779861 0,438386 333 1 TGGCTTGTCATTCTGTACACTGACCTTAGGCATGGAGAAAATTACTTG 1,77954 0,072713 334 1 TCATGAATTTTTTAATCCCATTGCAAACATTATTCCAAGAGATCCCAG 0,918826 0,36453 335 1 CCCCGTCTCCCTCCCAACTTATACGACCTGATTTCCTTAGGA -2,18861 0,026936 336 1 CCACACAGCCAAGCTGAGACTGTGGCAATGTGTTGAGTCATATACATT 1,12796 0,260712 337 1 ATTACCTCAGTCCCCGAGGACAGTTTTGAAGGACTTGTTCAGTTAC 1,485189 0,158865
Métodos de ensayo
5 Para determinar los niveles de expresión (aumentados o disminuidos) de genes (secuencias expresadas) en la práctica de la divulgación, se puede utilizar cualquier método conocido en la técnica. En algunas realizaciones, se utiliza la expresión basada en la detección de ARN que se hibrida con los genes (o secuencias de sonda) identificadas y desveladas en el presente documento. Esto se lleva a cabo fácilmente por cualquier método de detección de ARN o de amplificación + detección que se conozca o que se reconozca como equivalente en la
10 técnica tal como, pero sin limitarse a estos, PCR de transcripción inversa (RT-PCR), PCR en tiempo real, RT-PCR en tiempo real, los métodos desvelados en la Solicitud de Patente de EE. UU. 10/062.857 (presentada el 25 de octubre de 2001) así como en las Solicitudes Provisionales de Patente de EE. UU. 60/298.847 (presentada el 15 de junio de 2001) y 60/257.801 (presentada el 22 de diciembre de 2000), y métodos para detectar la presencia, o ausencia, de secuencias estabilizadoras o desestabilizadoras de ARN.
15 De manera alternativa, se puede utilizar la expresión basada en la detección del estado del ADN. La detección del ADN de un gen identificado como metilado o eliminado se puede utilizar para los genes que tienen una disminución de la expresión en correlación con un resultado particular del cáncer de próstata, o tras la prostatectomía. Esto se puede llevar a cabo fácilmente por métodos basados en PCR que se conocen en la técnica, incluyendo, pero sin
20 limitarse a, Q-PCR. Por el contrario, la detección del ADN de un gen identificado como amplificado se puede utilizar para los genes que tienen un aumento de la expresión en correlación con un resultado particular del cáncer de próstata, o tras la prostatectomía. Esto se puede llevar a cabo fácilmente por los métodos basados en la PCR, hibridación in situ fluorescente (FISH) e hibridación in situ cromosómica (CISH) que se conocen en la técnica.
25 También se puede utilizar la expresión basada en la detección de una presencia, aumento, o disminución de los niveles o la actividad de proteínas. La detección se puede llevar a cabo por cualquier método basado en inmunohistoquímica (IHC), basado en la sangre (especialmente para las proteínas segregadas), basado en anticuerpos (incluyendo autoanticuerpos contra la proteína), basado en células exfoliadas (del cáncer), basado en espectrometría de masas, y basado en imágenes (incluyendo el uso de ligandos marcados) que se conocen en la
técnica y se reconocen apropiados para la detección de la proteína. Los métodos basados en imágenes y en anticuerpos son útiles además para la localización de tumores tras la determinación de cáncer por el uso de células que se obtienen por un procedimiento no invasivo (tal como el lavado o aspiración con aguja), donde la fuente de células cancerosas no se conoce. Un anticuerpo o ligando marcado se puede utilizar para localizar el carcinoma(s)
5 en un paciente.
Una realización que utiliza ensayo basado en ácido nucleico para determinar la expresión lo hace por inmovilización de una o más secuencias de los genes identificados en el presente documento como un polinucleótido en un soporte sólido, incluyendo, pero sin limitarse a estos, un sustrato sólido como una matriz o en perlas o tecnología basada en perlas como se conoce en la técnica. En algunas realizaciones, el ensayo es el ensayo DASL (Hibridación, Selección, extensión y unión mediadas por ADNc) disponible en Illumina. De manera alternativa, también se pueden utilizar los ensayos de expresión basados en una solución que se conocen en la técnica.
Las sondas de polinucleótidos inmovilizados pueden ser únicos o de otra manera específicos de los genes
15 desvelados (o secuencias expresadas) tal que los polinucleótidos son capaces de hibridarse con un ADN o ARN correspondiente a los genes (o secuencias expresadas). Estos polinucleótidos pueden ser de la longitud completa de los genes (o secuencias expresadas) o ser sondas de longitud más corta (hasta un nucleótido más cortas que la secuencia de longitud completa conocida en la técnica por eliminación a partir del extremo 5’ o 3’ de la secuencia) que opcionalmente se interrumpen mínimamente (tal como por no coincidencias o por pares de bases insertadas no complementarias) de forma que la hibridación con su ADN o ARN similar correspondiente a los genes (o secuencias expresadas) no está afectada. En muchas realizaciones, una sonda de polinucleótidos contiene una secuencia del extremo 3’ de un gen desvelado o secuencia expresada. Las sondas de polinucleótidos que contienen mutaciones respecto a las secuencias de los genes desvelados se pueden utilizar también siempre que la presencia de mutaciones siga permitiendo la hibridación para producir una señal detectable.
25 Los polinucleótidos inmovilizados se pueden utilizar para determinar el estado de muestras de ácido nucleico preparadas a partir de muestras de células prostáticas para las que no se conoce el resultado del sujeto de la muestra (por ejemplo, el paciente del que se ha obtenido la muestra) o para la confirmación de un resultado que ya se ha asignado a la muestra del sujeto. Sin limitar la divulgación, tal célula puede ser de un paciente con cáncer de próstata, tal como el material extraído por prostatectomía. El polinucleótido(s) inmovilizado solo necesita ser suficiente para hibridarse específicamente con las moléculas de ácido nucleico correspondientes que se derivan de la muestra bajo condiciones adecuadas. Aunque la expresión de incluso un solo gen que se correlaciona puede ser capaz de proporcionar una precisión adecuada para discriminar entre dos resultados del cáncer de próstata, la divulgación incluye el uso de niveles de expresión de más de un gen o secuencia expresada.
35 Por lo tanto, la divulgación incluye el uso de seis o más, siete o más, ocho o más, nueve o más, diez o más, u once
o más genes o secuencia expresadas desvelados en el presente documento para discriminar entre resultados. Adicionalmente, se pueden ensayar los niveles de expresión de 12 o más, 14 o más, 16 o más, 18 o más, 20 o más, 22 o más, 24 o más, 26 o más, 28 o más, 30 o más, 32 o más, 34 o más, 36 o más, 38 o más, 40 o más, 45 o más, 50 o más, 55 o más, 60 o más, 62 o más, 65 o más, 70 o más, 75 o más, 80 o más, 90 o más, o 92 o más genes o secuencias expresadas y utilizarse en un método desvelado. El curso de realizaciones adicionales incluye la utilización de 100 o más, 150 o más, 200 o más, 250 o más, 300 o más, hasta los 337 de cada uno de la Tabla 1 y la Figura 14, o el total de 362 genes (o secuencias expresadas) que se desvelan en el presente documento.
45 En algunas realizaciones, se utilizan los genes (secuencias expresadas) del grupo de 62, o el grupo de 92. En otras realizaciones, los genes (o secuencias expresadas) que se utilizan son del grupo de 337 de la Tabla 1 y la Figura 14,
o son una combinación de genes de entre los de la Tabla 3 y la Figura 15. En muchos casos, la combinación o grupo de genes (o secuencias expresadas) que se utiliza incluyen del Gen Nº 1 (FEV) o una secuencia expresada que se hibrida con la SEC ID Nº 1. En más realizaciones, una combinación incluye uno o más genes o secuencias expresadas que se expresan con valor p de correlación < 0,0001.
De manera alternativa, una combinación incluye genes o secuencias expresadas con una alta frecuencia de presentación como se desvela en el presente documento. Ejemplos no limitantes de tales genes o secuencias expresadas con una frecuencia de más de 400, más de 350, más de 300, más de 250, más de 200, más de 150, o
55 más de 100 como se describe en el presente documento. Pero se pueden utilizar también el curso de combinaciones de uno o más genes (o secuencias) con una frecuencia más alta con uno o más genes (o secuencias) con una frecuencia más baja.
En realizaciones en las que se van a analizar solo dos o pocos genes, el ácido nucleico derivado de la muestra de células de cáncer de próstata se pueden preferentemente amplificar por el uso de cebadores apropiados (tal como los que se usan en la PCR) tal que solo los genes que se van a analizar se amplifican para reducir las señales de fondo contaminantes de otros genes o secuencias expresados en la muestra. El tamaño de un amplicón de PCR de la divulgación puede ser de cualquier tamaño, incluyendo al menos o aproximadamente 50, al menos o aproximadamente 100, al menos o aproximadamente 150, al menos o aproximadamente 200, al menos o
65 aproximadamente 250, al menos o aproximadamente 300, al menos o aproximadamente 350,al menos o aproximadamente 400 nucleótidos consecutivos, con la inclusión de la porción complementaria de los cebadores de
PCR que se utilizan. El curso de la PCR puede opcionalmente ser una PCR acoplada a transcripción inversa (o RT-PCR en el caso de material de inicio de ARN) o PCR cuantitativa, tal como PCR en tiempo real, o combinaciones de las mismas. Naturalmente, el ARN de las muestras descritas en el presente documento se pueden preparar y utilizar por medios fácilmente conocidos por un experto.
5 De manera alternativa, y cuando se van a analizar múltiples genes o cuando se utilizan muy pocas células (o una célula), el ácido nucleico de la muestra se puede amplificar globalmente antes de la hibridación con las sondas de polinucleótidos inmovilizados, tal como en una matriz o micromatriz. Naturalmente, se puede utilizar ARN, o el ADNc equivalente del mismo puede marcarse y usarse directamente, sin amplificarse, por métodos conocidos en la
10 técnica.
La divulgación proporciona un grupo de criterios más objetivos, en forma de perfiles de expresión de un grupo de genes distinto, para discriminar (o delimitar) entre resultados de cáncer de próstata, o tras la prostatectomía. En algunas realizaciones, los ensayos se utilizan para discriminar entre resultados mejores y peores en los 10, o
15 aproximadamente 10 años tras la intervención quirúrgica para eliminar los tumores de cáncer de próstata. También se pueden realizar las comparaciones que discriminan entre resultados tras aproximadamente 10, aproximadamente 20, aproximadamente 30, aproximadamente 40, aproximadamente 50, aproximadamente 60, aproximadamente 70, aproximadamente 80, aproximadamente 90, o aproximadamente 100 meses.
20 Aunque los resultados mejores o peores de recurrencia del cáncer, metástasis y/o supervivencia se pueden definir relativamente comparando unos con otros, se puede apreciar un resultado “mejor” como el que tiene mejor oportunidad que el 50% de recurrencia y/o que una oportunidad del 50% de supervivencia después de aproximadamente 60 meses tras la intervención quirúrgica para eliminar el tumor del cáncer de próstata. Un resultado “mejor” también puede ser mejor que aproximadamente el 60%, aproximadamente el 70%,
25 aproximadamente el 80% o aproximadamente el 90% de oportunidad que la recurrencia del cáncer y/o la supervivencia aproximadamente 60 meses tras la intervención quirúrgica. Un resultado “peor” se puede apreciar como un 50% o más oportunidad de recurrencia del cáncer y/o menos del 50% de oportunidad de supervivencia después de aproximadamente 60 meses tras la intervención quirúrgica para eliminar el tumor(es) del cáncer de próstata.
30 Los métodos desvelados también se pueden utilizar como material de tejido sólido. Por ejemplo, se puede recolectar una biopsia sólida para visualización para después por determinación de la expresión de dos o más genes o secuencias expresadas identificadas en el presente documento determinar el resultado del cáncer de próstata, o tras la prostatectomía. Uno de los medios es por el uso de hibridación in situ con sondas de identificación de
35 polinucleótidos o proteínas para ensayar la expresión de dicho gen(es).
En algunas realizaciones, la detección de la expresión genética de las muestras se puede hacer utilizando una micromatriz simple capaz de ensayar la expresión genética de algunos de todos los genes divulgados en el presente documento por conveniencia y precisión.
Realizaciones adicionales
Otros usos de la divulgación incluyen producir la capacidad de identificar las muestras de células de cáncer de próstata como que están correlacionados con un resultado particular de supervivencia del cáncer o recurrencia para
45 posterior investigación o estudio. Esto proporciona una ventaja particular en muchos contextos que requieren la identificación de células basados en un objetivo genético o criterios moleculares.
Los materiales para el uso en los métodos de la presente divulgación idealmente son adecuados para la preparación de kits producidos de acuerdo con los procedimientos bien conocidos. La divulgación proporciona por lo tanto kits 50 que comprenden agentes para la detección de la expresión de los genes desvelados y las secuencias para identificar los resultados de cáncer de próstata, o tras la prostatectomía. Tales kits comprenden opcionalmente el agente con la provisión de una descripción identificativa o etiqueta o instrucciones relativas a su uso en los métodos de la presente divulgación. Tal kit puede comprender envases, cada uno con uno o más de los distintos reactivos (típicamente en forma concentrada) que se utilizan en los métodos, incluyendo por ejemplo, micromatrices
55 prefabricadas, tampones, nucleótidos trifosfato adecuados (por ejemplo, dATP, dCTP, dGTP y dTTP; o rATP, rCTP, rGTP y UTP), transcriptasa inversa, ADN polimerasa, ARN polimerasa, y uno o más complejos de cebadores de la presente divulgación (por ejemplo, poli(T) de longitud apropiada o cebadores aleatorios unidos a un reactivo promotor con la ARN polimerasa). Se incluirá también típicamente un conjunto de instrucciones.
60 Los métodos proporcionados por la divulgación también se pueden automatizar en todo o en parte. Todos los aspectos de la divulgación se pueden practicar tal que consistan esencialmente en un subgrupo de los genes desvelados para la exclusión de material irrelevante para la identificación de los resultados de recurrencia del cáncer, metástasis, y/o supervivencia por medio de una muestra que contienen células.
Una vez que se ha proporcionado la divulgación en general, la misma se entenderá más fácilmente en referencia a los siguientes ejemplos que se proporcionan a modo de ilustración, y que no pretenden ser limitantes de la divulgación, a menos de que se especifique.
5 Ejemplos
Ejemplo I: Recolección de especímenes clínicos y parámetros clinicopatológicos.
Se utilizaron muestras de próstata con el PSA y otros datos del resultado de pacientes de prostatectomía radical en
10 1993-1995 para descubrir los grupos de genes (secuencias expresadas), cuyos niveles de expresión se correlacionan con el resultado clínico del cáncer de próstata, o tras prostatectomía. Se utilizaron otras muestras para ensayar o verificar la capacidad predictiva o pronóstica de los grupos de genes identificados.
Las características de los perfiles de los pacientes que corresponden a las muestras se muestran en la Tabla 2. 15
Tabla 2
Descripción del factor
Entrenamiento (n=124) Ensayo (n=67) Todos (n=191)
Edad Media Intervalo
61,8 45-77 62,7 50-78 62,1 45-78
Puntuación de Gleason <=6 7 >=8
42 (34%) 65 (52%) 17 (14%) 27 (40%) 32 (48%) 8 (12%) 69 (36%) 97 (51%) 25 (13%)
Estadio AJCC II III
95 (77%) 29 (23%) 49 (73%) 18 (27%) 144 (75%) 47 (25%)
Margen quirúrgico positivo negativo
51 (41%) 73 (59%) 26 (39%) 41 (61%) 77 (40%) 114 (60%)
Seguimiento BCF (años) Media Intervalo
6,9 0,2-11,5 7,7 1,6-11,4 7,2 0,2-11,5
Acontecimiento BCF No Sí
71 (57%) 53 (43%) 43 (64%) 24 (36%) 114 (60%) 77 (40%)
Seguimiento MFS (años) Media Intervalo Desconocido
9 0,2-13,3 1 8,7 0,3-12,7 1 8,9 0,2-13,3 2
Acontecimiento Metástasis No Sí Desconocido
112 (91%) 11 (9%) 1 62 (94%) 4 (6%) 1 174 (92%) 15 (8%) 2
PSA Pre-op Media Intervalo Desconocido
8,4 1,1-37,2 49 8,9 1,7-31,8 20 8,6 1,1-37,2 69
La metodología para utilizar las muestras del paciente para esta identificación se ilustra esquemáticamente en la
20 Figura 1. En resumen, se seleccionaron las muestras de 191 pacientes de un grupo inicial de 210. Se dividieron los 191 en un grupo de tratamiento (124 muestras) y un grupo de ensayo (67 muestras), en donde el primero se utilizó para identificar grupos de genes por medio del algoritmo de Random Forest™. Los resultados representativos con 500 ejecuciones (grupos de genes) que se obtuvieron por el uso del algoritmo se muestran en la Figura 2 como un gráfico del número de genes (secuencias expresadas) en un grupo frente al log de valores de P sin ajustar
25 (equivalente al ensayo del intervalo log). La Figura 2 muestra la actuación de estos 500 grupos, que contienen varios números de genes (secuencias expresadas) y su capacidad para clasificar muestras con precisión (y por tanto los pacientes) como de alto o bajo riesgo de recurrencia del cáncer y/o metástasis con significación como se indica por los valores de P sin ajustar. Los genes (secuencias expresadas) en los 500 grupos reflejan moléculas de ácido nucleico únicas (no duplicadas) que se resumen en la Tabla 1 anterior y en la Figura 14 del presente documento.
30 Se revisaron siete grupos de 34 genes generados por el algoritmo y se encontró que reflejaban 62 moléculas no duplicadas que se identifican en la Tabla 1 anterior (véase la columna “grupo de 62” en la misma, que se puede
referenciar con la Figura 14 por medio del Gen Nº de la tabla 14 (en comparación con la SEC ID Nº) y la frecuencia en que ocurría entre las 337 entradas. Los niveles de expresión de estos 62 genes (secuencias expresadas) se tratan en el presente documento como ejemplo no limitante, y representativo de grupos de genes, incluyendo los grupos adicionales que ese muestran en la Figura 2 y como se desvelan en el presente documento. Se utilizaron los
5 niveles de expresión de los 62 genes en las muestras de células de cáncer de próstata como índice de riesgo (predicción) del resultado ene l grupo de ensayo como se ilustra en la Figura 1.
Ejemplo II: Identificación de subtipos con diferentes resultados en el paciente.
Se utilizó una selección genética con un grupo de entrenamiento de124 muestras para identificar genes que predecían resultados. Véase la Figura 1 y la Tabla 2. Los genes identificados se utilizaron entonces para predecir los resultados en un grupo de ensayo de 67 muestras procesadas por aislamiento de las células cancerosa (véanse las Figuras 3A y 3B). Los resultados previstos se compararon con los resultados documentados de pacientes de los que se habían obtenido las muestras.
15 Como un ejemplo representativo, las sondas de oligonucleótido específicas del gen se inmovilizan, tal como sobre una micromatriz y luego se hibridan con una muestra de ARN marcada con Cy5 y ARN Cy3 de referencia en una reacción de co-hibridación a 65 ºC en 1x de tampón de hibridación. El marcador inmovilizado se lava a 37 ºC con 0,1 x SSC/0,005% Triton X-102. Se lleva a cabo un análisis por imagen utilizando un software de análisis por imagen. Las relaciones Cy5/Cy3 en bruto se normalizan utilizando una regresión no lineal dependiente de la intensidad.
Las relaciones Cy5/Cy3 normalizadas de todas las muestras son medias (o media) centradas para cada gen. El ensayo de identificación y permutación de la significación de la expresión genética diferencial se lleva a cabo utilizando un software adecuado, tal como el análisis de regresión de Cox y Random Forest™. La supervivencia libre
25 de enfermedad se calcula a partir de los datos de diagnóstico. Los acontecimientos se puntúan como la primera recurrencia o metástasis distantes. Las curvas de supervivencia se calcularon por estimaciones Kaplan-Meier y se compararon por ensayos de intervalos log.
Las Figuras 4-6 muestran la actuación de un Índice de Riesgo (o Puntuación de Riesgo) representativo utilizando el grupo de 62 genes desvelados como una combinación en comparación con factores conocidos utilizados para evaluar muestras y pacientes de cáncer de próstata. Los factores son el Grado de Gleason (o la puntuación de Gleason), el sistema de estadificación del AJCC para el cáncer de próstata, y niveles de PSA (antígeno sérico prostático) pre-operatorio (pre-intervención quirúrgica). Estas comparaciones muestran que un perfil de expresión genética de la divulgación se correlaciona con estos otros factores y por tanto se puede utilizar en combinación con
35 una cualquiera o más de estos factores o usarse para recapitular la información proporcionada por cada uno de estos factores.
Los niveles de expresión de los 62 genes (secuencias expresadas) también se encontró que eran capaces de segregar las 124 muestras del grupo de entrenamiento y las 67 muestras del grupo de ensayo en clasificaciones de riesgo “alto” y “bajo” (véase la Figura 7).
Ejemplo III: Identificación de los subtipos con diferentes grados de cáncer de próstata
En combinación con la Figura 7, la Figura 4 demuestra que una Puntuación de Riesgo (o Índice de Riesgo) en las
45 subclases “alta” y “baja”, basadas en los niveles de expresión del grupo de 62 genes representativos, se pueden utilizar para clasificar muestras (así como pacientes) de manera consistente con el Grado de Gleason, en donde a mayor grado mayor es la probabilidad de una Puntuación de Riesgo por encima de un valor de cero, y mayor riesgo de un resultado peor. El valor cero representa la media y/o el valor medio de la puntuación a través de todas las muestras de cáncer de próstata del grupo. La clasificación de “alto riesgo” se basa en una Puntuación de Riesgo por encima de cero, y la clasificación de “bajo riesgo” se basa en valores por debajo de cero. Como resultado, la Puntuación de Riesgo (o Índice de Riesgo) se puede utilizar para clasificar muestras, y por tanto pacientes, con un Grado de Gleason de  6 o 7 (o incluso  8) en grupos de “alto” y “bajo” riesgo como se describe en el presente documento. Véase la Figura 8.
55 Esto demuestra que la Puntuación de Riesgo (o Índice de Riesgo) se puede utilizar para clasificar muestras, y por tanto pacientes, independientemente del uso del Grado de Gleason. De manera alternativa, los dos análisis se pueden utilizar juntos, opcionalmente en serie, tal como la determinación del Grado de Gleason seguida de la determinación de la Puntuación de Riesgo en las muestras (y por tanto en pacientes) con un grado de  6 o 7 (o incluso  8). El uso combinado es particularmente ventajoso para “incluir” los sujetos con alto riesgo en un tratamiento clínico posterior o apropiado, tal como quimioterapia o radiación o crioterapia como conoce un médico experto y para “descartar” los sujetos de bajo riesgo de forma que no se sometan innecesariamente a tratamientos con efectos secundarios no deseables.
Ejemplo IV: Identificación de subtipos con diferentes estadios de cáncer de próstata 65
En combinación con la Figura 7, la Figura 5 demuestra que una Puntuación de Riesgo (o Índice de Riesgo) en las subclases “alta” y “baja”, que se basa en los niveles de expresión del grupo de 62 genes representativo, se puede utilizar para clasificar muestras (y por tanto pacientes) de manera consistente con el estadio de cáncer de próstata de la AJCC, en el que el estadio III es más probable que se correlacione con una puntuación de Riesgo por encima 5 de un valor de cero, y está presente un riesgo mayor de un peor resultado. El valor de cero representa de nuevo la media y/o el valor medio de la puntuación a través de todas las muestras de cáncer de próstata en el grupo. El grupo de “alto riesgo” se basa de nuevo en una Puntuación de Riesgo por encima de cero, y el grupo de “bajo riesgo” se basa en valores por debajo de cero. Como resultado la Puntuación de Riesgo (o Índice de Riesgo) se puede utilizar para clasificar muestras, y por tanto pacientes, con estadio II o III de la clasificación del AJCC en grupos de riesgo
10 “alto” y “bajo” como se describe en el presente documento.
Esto demuestra que la Puntuación de Riesgo (o Índice de Riesgo) se puede utilizar para clasificar muestras, y por tanto pacientes, independientemente del uso de la evaluación del estadio del AJCC. De manera alternativa, los dos análisis se pueden utilizar juntos, opcionalmente, en serie, tal como la determinación del estadio AJCC seguido por
15 la determinación de la Puntuación de Riesgo en muestras (y por tanto pacientes) con estadio II o III de cáncer de próstata. El uso combinado es particularmente ventajoso para “incluir” sujetos con bajo riesgo de forma que se les evite razonablemente tratamientos con efectos secundarios indeseables. El uso combinado puede también alterar la clasificación de un paciente o sujeto como adecuado para mantenerse “espera vigilada”.
20 Ejemplo V: Combinación con análisis de PSA pre-operatorio
Aunque el análisis del Grado de Gleason y el estadio AJCC necesitan ambos el uso de muestras de células del cáncer de próstata, las coherencias de la Figura 6 entre la Puntuación de Riesgo (o Índice de Riesgo) en las subclases “alta” y “baja”, que se basa en los niveles de expresión del grupo de 62 genes representativos, indica que
25 un valor de PSA pre-operatorio debería considerarse en combinación con una Puntuación de Riesgo como se describe en el presente documento. La combinación puede ser en serie, tal como una determinación del valor del PSA pre-operatorio seguida por la determinación de la Puntuación de Riesgo en muestras (y por tanto en pacientes) con valores de PSA de 30 o más, 25 o más, 20 o más, 15 o más, 10 o más, o 5 o más.
30 Se utilizó el análisis de regresión de Cox para identificar 92 genes (o secuencias expresadas) cuyos niveles de expresión son capaces de clasificar las muestras que contienen células de cáncer de próstata como se ha descrito anteriormente. Sesenta y siete (67) de estos 92 genes (o secuencias expresadas) son comunes a los 337 genes (o secuencias expresadas) de la Figura 14 y la Tabla 1 (véase la columna “Cox92” de la Figura 14 o la Tabla 1, que se puede referenciar de forma cruzada una con otra por el Gen Nº. (frente a SEC ID Nº) y la frecuencia. Los veinticinco
35 (25) genes (o secuencias expresadas) restantes fuera de las 92 se enumeran en la Figura 15 y la Tabla 3 posterior, que se pueden referenciar de manera cruzada una con otra por el Gen Nº (en comparación con SEC ID Nº) así como los valores z y p.

Claims (17)

  1. REIVINDICACIONES
    1. Un método para determinar el riesgo de recurrencia del cáncer de próstata en un sujeto, comprendiendo dicho método el ensayo de una muestra que comprende células de cáncer de próstata de dicho sujeto de los niveles de
    5 expresión de seis o más genes seleccionados de entre los Genes Nos 1 a 362 de las Figuras 14 y 15, determinar, como un valor agregado, una suma de los niveles de expresión de dichos seis o más genes, y determinar el riesgo de recurrencia del cáncer de próstata en dicho sujeto basándose en dicho valor agregado, donde los niveles de expresión se correlacionan con un bajo riesgo de recurrencia del cáncer, o un alto riesgo de recurrencia del cáncer.
  2. 2. El método de la reivindicación 1 donde dicho método además comprende la selección de un tratamiento para un sujeto con la recurrencia determinada del cáncer.
    15 3. El método de la reivindicación 1 o 2 donde dicho ensayo comprende la preparación del ARN de dicha muestra.
  3. 4.
    El método de la reivindicación 3 donde dicho ARN se utiliza para la PCR.
  4. 5.
    El método de la reivindicación 3 donde dicho ensayo comprende el uso de una matriz.
  5. 6.
    El método de la reivindicación 1 o 2 donde dicha muestra se disecciona del tejido extraído durante la prostatectomía.
  6. 7. El método de la reivindicación 4 donde dicha PCR es RT-PCR, opcionalmente RT-PCR en tiempo real. 25
  7. 8.
    El método de la reivindicación 1 o 2 o 3 o 4 o 5 o 6 o 7 donde dichos niveles de expresión se correlacionan con un valor de p < 0,0001.
  8. 9.
    El método de la reivindicación 1 o 2 o 3 o 4 o 5 o 6 o 7 donde dicha muestra comprende células de cáncer de próstata aisladas.
  9. 10.
    El método de la reivindicación 2 donde dicho tratamiento comprende quimioterapia o radioterapia.
  10. 11.
    El método de la reivindicación 1 que comprende además
    35 i) determinar el grado de cáncer de próstata en dicha muestra, ii) determinar el estadio de dicho cáncer de próstata en dicha muestra, o iii) ambos;
    donde i), ii) o ambos i) y ii) se realizan opcionalmente antes de determinar el riesgo de recurrencia del cáncer de próstata en dicho sujeto.
  11. 12. El método de la reivindicación 11 donde la determinación del grado del cáncer de próstata comprende la determinación de una Puntuación de Gleason o el estadio del AJCC o
    45 donde el método comprende la determinación del grado de cáncer de próstata por una puntuación de Gleason y se determina el estadio de cáncer de próstata de acuerdo con el estadio del AJCC para producir un análisis multivariado para determinar el riesgo de recurrencia del cáncer de próstata en dicho sujeto.
  12. 13.
    El método de la reivindicación 1 que comprende además la determinación de los niveles del antígeno sérico prostático (PSA) en dicho sujeto, opcionalmente antes de una prostatectomía que se utiliza para proporcionar dicha muestra que comprende células de cáncer de próstata.
  13. 14.
    El método de la reivindicación 1 donde se ensayan los niveles de expresión de 8 o más, 10 o más, 12 o más, 14
    o más, 16 o más, 18 o más, 20 o más, 22 o más, 24 o más, 26 o más, 28 o más, 30 o más, 32 o más, 34 o más, 36 o 55 más, 38 o más, 40 o más , 45 o más, 50 o más, 55 o más, 60 o más, 65 o más, 70 o más, o 92 o más genes.
  14. 15.
    El método de la reivindicación 1 donde dicho ensayo comprende la determinación del nivel de expresión del Gen Nº 1, opcionalmente por medio del uso de la SEC ID Nº 1 como una sonda.
  15. 16.
    Un método para determinar el riesgo de desarrollar metástasis del cáncer de próstata en un sujeto, comprendiendo dicho método el ensayo de una muestra que comprende células de cáncer de próstata de dicho sujeto por los niveles de expresión de seis o más genes seleccionados de los Genes Nos 1 a 362 de las Figuras 14 y
  16. 15. la determinación, como un valor agregado, de una suma de los niveles de expresión de dichos seis o más genes, y
    65 la determinación del riesgo de desarrollar metástasis del cáncer de próstata en dicho sujeto basándose en dicho valor agregado,
    donde los niveles de expresión se correlacionan con un riesgo bajo de desarrollo de metástasis del cáncer de próstata, o un riesgo alto de desarrollar metástasis de cáncer de próstata.
  17. 17. El método de cualquier reivindicación precedente, donde la muestra comprende células de cáncer de próstata es una biopsia por aguja u otra biopsia.
    Univariado
    Grupo de entrenamiento Grupo de ensayo
    Relación de riesgo
    IC 95% Valor de p Relación de riesgo IC 95% Valor de p
    Puntuación de riesgo (Bajo vs. Alto)
    8,3 3,9-17,7 <0,0001 6,3 2,5-16,0 0,0001
    Multivariado
    Puntuación de riesgo (Bajo vs. Alto)
    5,2 2,1-12,9 <0,0001 4,6 1,1-18,4 0,03
    Grado Gleason: GS 7 vs. 6
    1,7 0,59-4,89 0,32 2,1 0,50-8,62 0,32
    Grado Gleason: GS 8 vs.6
    1,7 0,49-6,14 0,4 5,4 0,73-39,8 0,098
    Estadio AJCC
    0,62 0,28-1,39 0,24 0,65 0,15-2,80 0,56
    PSA Pre-op
    1 0,97-1,08 0,32 1,1 1,0-1,14 0,05
ES08730593.4T 2007-02-23 2008-02-25 Supervivencia y recurrencia del cáncer de próstata Active ES2527062T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US89147707P 2007-02-23 2007-02-23
US891477P 2007-02-23
PCT/US2008/054820 WO2008103971A2 (en) 2007-02-23 2008-02-25 Prostate cancer survival and recurrence

Publications (1)

Publication Number Publication Date
ES2527062T3 true ES2527062T3 (es) 2015-01-20

Family

ID=39710787

Family Applications (1)

Application Number Title Priority Date Filing Date
ES08730593.4T Active ES2527062T3 (es) 2007-02-23 2008-02-25 Supervivencia y recurrencia del cáncer de próstata

Country Status (6)

Country Link
EP (2) EP2121988B1 (es)
JP (1) JP2010518868A (es)
CN (1) CN101720358A (es)
CA (2) CA2939539A1 (es)
ES (1) ES2527062T3 (es)
WO (1) WO2008103971A2 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0701662D0 (en) 2006-12-14 2007-03-07 Blatchford & Sons Ltd A lower limb prosthesis
US8628585B2 (en) 2007-12-14 2014-01-14 Blatchford Products Limited Lower limb prosthesis
WO2010034487A2 (en) * 2008-09-23 2010-04-01 Silence Therapeutics Ag Means for inhibiting the expression of orc-1
KR20110111462A (ko) * 2009-01-07 2011-10-11 미리어드 제네틱스, 인크. 암 바이오마커
US20120041274A1 (en) 2010-01-07 2012-02-16 Myriad Genetics, Incorporated Cancer biomarkers
EP3812469A1 (en) 2010-07-07 2021-04-28 Myriad Genetics, Inc. Gene signatures for cancer prognosis
US9605319B2 (en) 2010-08-30 2017-03-28 Myriad Genetics, Inc. Gene signatures for cancer diagnosis and prognosis
CN102968558B (zh) * 2012-11-14 2015-11-18 叶定伟 一种预测初诊前列腺癌骨转移风险的装置
WO2014078700A1 (en) 2012-11-16 2014-05-22 Myriad Genetics, Inc. Gene signatures for cancer prognosis
EP3143160B1 (en) 2014-05-13 2019-11-06 Myriad Genetics, Inc. Gene signatures for cancer prognosis
GB201616912D0 (en) 2016-10-05 2016-11-16 University Of East Anglia Classification of cancer

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6285701B1 (en) 1998-08-06 2001-09-04 Lambda Physik Ag Laser resonator for improving narrow band emission of an excimer laser
AU7333701A (en) * 2000-07-10 2002-01-21 Univ Texas Chromosome 3p21.3 genes are tumor suppressors
US7229774B2 (en) * 2001-08-02 2007-06-12 Regents Of The University Of Michigan Expression profile of prostate cancer
US6949342B2 (en) * 2001-12-21 2005-09-27 Whitehead Institute For Biomedical Research Prostate cancer diagnosis and outcome prediction by expression analysis
US7204987B2 (en) * 2003-06-11 2007-04-17 Ultra Biotech Limited Biological compositions and methods for treatment of prostate cancer
WO2007114896A2 (en) * 2006-03-31 2007-10-11 Ordway Research Institute Prognostic and diagnostic method for cancer therapy

Also Published As

Publication number Publication date
EP2754720A1 (en) 2014-07-16
CA2939539A1 (en) 2008-08-28
CN101720358A (zh) 2010-06-02
WO2008103971A9 (en) 2013-06-06
WO2008103971A2 (en) 2008-08-28
EP2121988A2 (en) 2009-11-25
JP2010518868A (ja) 2010-06-03
EP2121988A4 (en) 2010-06-09
CA2684897A1 (en) 2008-08-28
EP2121988B1 (en) 2014-12-17
WO2008103971A3 (en) 2009-12-10

Similar Documents

Publication Publication Date Title
ES2527062T3 (es) Supervivencia y recurrencia del cáncer de próstata
JP6908571B2 (ja) 前立腺癌の予後を定量化するための遺伝子発現プロフィールアルゴリズムおよび試験
CN102971435B (zh) 用于内分泌治疗下的乳腺癌复发预测的方法
US20110177971A1 (en) Method for diagnosing the stage of a thyroid tumor
JP2020150949A (ja) メラノーマ癌の予後予測
JP4435259B2 (ja) 微量胃癌細胞の検出法
JP2013516968A (ja) 診断用遺伝子発現プラットフォーム
ES2608322T3 (es) Procedimiento para predecir la respuesta a la quimioterapia en un paciente que padece o está en riesgo de desarrollar cáncer de mama recurrente
WO2014160645A2 (en) Neuroendocrine tumors
JP2011525106A (ja) 瀰漫性b大細胞型リンパ腫のマーカーおよびその使用方法
ES2893469T3 (es) Puntuaciones de riesgo basadas en la expresión de la variante 7 de la fosfodiesterasa 4D humana
CN110573629B (zh) 用于诊断早期胰腺癌的方法和试剂盒
US20180371553A1 (en) Methods and compositions for the analysis of cancer biomarkers
JP2012531925A (ja) チボザニブ応答予測
US20180051342A1 (en) Prostate cancer survival and recurrence
BR112020012280A2 (pt) composições e métodos para diagnosticar cânceres de pulmão usando perfis de expressão de gene
AU2018428853A1 (en) Methods and compositions for the analysis of cancer biomarkers
US20180073085A1 (en) Determining tumor origin
CN111315897B (zh) 用于黑素瘤检测的方法
WO2020194057A1 (en) Biomarkers for disease detection
JP4317854B2 (ja) 微量胃癌細胞の検出法
JP2014518086A (ja) 腫瘍起源の決定
US20220106646A1 (en) Determining tumor origin
EP2531856A2 (en) Methods and kits used in classifying adrenocortical carcinoma