ES2527062T3

ES2527062T3 - Supervivencia y recurrencia del cáncer de próstata

Info

Publication number: ES2527062T3
Application number: ES08730593.4T
Authority: ES
Inventors: Xiao-Jun Ma; Chin-Lee Wu; Mark G. Erlander
Original assignee: General Hospital Corp; Biotheranostics Inc
Current assignee: General Hospital Corp; Biotheranostics Inc
Priority date: 2007-02-23
Filing date: 2008-02-25
Publication date: 2015-01-20
Anticipated expiration: 2028-02-25
Also published as: EP2121988B1; WO2008103971A3; EP2121988A2; EP2121988A4; CN101720358A; CA2939539A1; EP2754720A1; JP2010518868A; CA2684897A1; WO2008103971A9; WO2008103971A2

Abstract

Un método para determinar el riesgo de recurrencia del cáncer de próstata en un sujeto, comprendiendo dicho método el ensayo de una muestra que comprende células de cáncer de próstata de dicho sujeto de los niveles de expresión de seis o más genes seleccionados de entre los Genes Nos 1 a 362 de las Figuras 14 y 15, determinar, como un valor agregado, una suma de los niveles de expresión de dichos seis o más genes, y determinar el riesgo de recurrencia del cáncer de próstata en dicho sujeto basándose en dicho valor agregado, donde los niveles de expresión se correlacionan con un bajo riesgo de recurrencia del cáncer, o un alto riesgo de recurrencia del cáncer.

Description

Supervivencia y recurrencia del cáncer de próstata

5 Campo de la divulgación

La divulgación se refiere a la identificación de los perfiles o patrones de expresión genética (o de secuencia), con relevancia clínica en el cáncer de próstata. En particular, la divulgación se basa en la identificación de genes, o secuencias que se expresan, cuya expresión se correlaciona con la supervivencia del paciente, la recurrencia del cáncer de próstata, y/o la presencia de metástasis del cáncer de próstata. Los perfiles de expresión genética, si se plasman en expresión de ácidos nucleicos, expresión proteica, y otros formatos de expresión, se pueden utilizar para predecir la supervivencia de sujetos que padecen un cáncer de próstata. Los perfiles se pueden utilizar también en el estudio y/o el diagnóstico de las células y tejido de cáncer de próstata así como para el estudio y/o la determinación del pronóstico de un paciente. Cuando se utilizan para el diagnóstico y el pronóstico, los perfiles se

15 utilizan para determinar el tratamiento del cáncer de próstata basándose en la probabilidad de la esperanza de vida, la recurrencia del cáncer, y/o las metástasis del cáncer.

Antecedente de la divulgación

El cáncer de próstata es el cáncer diagnosticado más comúnmente en los EE. UU., con aproximadamente 240.000 nuevos pacientes diagnosticados y 40.000 muertes por cáncer cada año. El diagnóstico y manejo del cáncer de próstata es clínicamente difícil debido a la falta de conocimiento del cáncer a niveles molecular y genético y a una falta de comprensión de la progresión natural de la enfermedad.

25 La investigación del cáncer de próstata está limitada por fuentes inadecuadas de especímenes de tejido de cáncer de próstata disponibles para su uso en investigación, particularmente especímenes que estén bien caracterizados patológicamente, conservados apropiadamente para estudios de ARN y proteínas, y con la información clínica, patológica y del seguimiento.

Se han utilizado tratamientos quirúrgicos en el tratamiento de algunos casos de cáncer de próstata. Sin embargo, el tratamiento fallará en una parte de los pacientes. Esto se sabe por un fallo químico (elevación de PSA después del año de la cirugía) o por el desarrollo de metástasis (comúnmente en los ganglios linfáticos y hueso). La capacidad para identificar, o predecir, un paciente post-quirúrgico, así como la probabilidad de encontrar un fallo en el PSA, la recurrencia del cáncer de próstata, y/o el desarrollo de metástasis, proporcionará múltiples beneficios al paciente.

Breve sumario de la invención

La presente invención proporciona un método para determinar el riesgo de recurrencia del cáncer de próstata en un sujeto, comprendiendo dicho método el ensayo de los niveles de expresión en una muestra que comprende células del cáncer de dicho sujeto de seis o más genes que se seleccionan de entre los Genes Nos 1 a 362 de las Figuras 14 y 15, la determinación, como un valor agregado, una suma de los niveles de expresión de dichos seis o más genes, y la determinación el riesgo de recurrencia del cáncer de próstata en dicho sujeto basándose en dicho valor agregado, en el que los niveles de expresión se correlacionan con

45 un riesgo bajo de recurrencia del cáncer, o un riesgo alto de recurrencia del cáncer.

La presente invención también proporciona un método para determinar el riesgo de desarrollo de metástasis del cáncer prostático en un sujeto, comprendiendo dicho método el ensayo de los niveles de expresión en una muestra que comprende células de cáncer de próstata, de seis o más genes que se seleccionan de entre los Genes Nos 1 a 362 de las Figuras 14 y 15; la determinación, como un valor agregado, una suma de los niveles de expresión de dichos seis o más genes, y la determinación del riesgo de desarrollo de metástasis del cáncer prostático en dicho sujeto basándose en dicho valor agregado, en el que los niveles de expresión se correlacionan con un bajo riesgo de desarrollar metástasis del

55 cáncer de próstata, o un alto riesgo de desarrollar metástasis de cáncer de próstata.

Breve sumario de la divulgación

La divulgación, que engloba los métodos de la invención, también incluye la identificación y el uso de patrones (o perfiles o “firmas”) de expresión genética (o de secuencia) que sean clínicamente relevantes para el cáncer de próstata. Los perfiles de expresión genética, que se plasman en la expresión del ácido nucleico, expresión proteica, u otros formatos de expresión, se pueden utilizar para predecir la recurrencia del cáncer de próstata y/o la supervivencia de sujetos que padecen un cáncer de próstata. En realizaciones que implican el uso de prostatectomía, la divulgación incluye métodos para predecir la probabilidad de recurrencia del cáncer de próstata, la

65 metástasis del cáncer, y/o la recurrencia de los niveles elevados de PSA.

En un aspecto, la divulgación incluye métodos para identificar, y luego utilizar, perfiles de expresión genética (o de secuencia) que proporcionan información pronóstica relativa al cáncer de próstata. Los perfiles de expresión se correlacionan con (y por lo tanto son capaces de discriminar entre) pacientes con recurrencia del cáncer buena o mala, metástasis del cáncer, y/o resultados de supervivencia. En algunas realizaciones, la divulgación incluye un

5 método para identificar los perfiles de expresión relevantes para la recurrencia del cáncer y/o la metástasis en sujetos que padecen cáncer de próstata. En otras realizaciones, la divulgación incluye un método para comparar la expresión genética (o de secuencia) en una muestra de células de cáncer de próstata de un paciente respecto a un perfil de expresión identificado para determinar el resultado probable del paciente., tal como tras una prostatectomía. Estas realizaciones de la divulgación se puede utilizar ventajosamente para conseguir una necesidad diagnóstica no satisfecha como es la capacidad de predecir si un paciente se beneficiará probablemente de la cirugía para tratar el cáncer de próstata o si un paciente saldrá mejor con otro tipo de tratamiento o si necesitará un tratamiento adyuvante además de la cirugía.

Un ejemplo no limitante de un paciente que se beneficiará probablemente de la cirugía, tal como una prostatectomía

15 radical, es aquel al que se le predice, por el perfil de expresión de las células de cáncer de próstata del paciente como se desvela en el presente documento, que estará libre de recurrencia y/o metástasis del cáncer después de la cirugía. De una manera relacionada, un ejemplo no limitante de un paciente del que se espera que no se beneficiará de la cirugía es aquel al que se le predice, por el perfil de expresión de sus células de cáncer de próstata como se desvela en el presente documento, que desarrollará metástasis del cáncer después de la cirugía. A modo de ejemplo, la recurrencia del cáncer de próstata suele ser en la misma localización, mientras que la metástasis frecuentemente es en una localización o tejido diferente, tal como un ganglio linfático o hueso como ejemplos no limitantes.

En más realizaciones, el método es para identificar un paciente, a partir de una población de pacientes con células

25 de cáncer de próstata, o tras una prostatectomía, como perteneciente a una subpoblación de pacientes con una recurrencia del cáncer y/o resultado mejor (tal como un riesgo de recurrencia o metástasis menor), con respecto a otra subpoblación, o como perteneciente a una subpoblación con una recurrencia o resultado de supervivencia peor (tal como un riesgo elevado de recurrencia o metástasis), con respecto a otra subpoblación. El método es por lo tanto capaz de distinguir pacientes en al menos dos subpoblaciones o subtipos.

La divulgación incluye un medio no subjetivo para la identificación de pacientes con cáncer de próstata, opcionalmente después de una prostatectomía, como que tendrán probablemente una mejor o peor recurrencia del cáncer, metástasis del cáncer, y/o resultado de supervivencia, ensayando un patrón de expresión que se desvela en el presente documento. Así, donde se ha podido utilizar previamente una interpretación subjetiva (tal como la que se

35 basa en tinción inmunohistoquímica y análisis subjetivos) para determinar el pronóstico y/o el tratamiento de pacientes con cáncer de próstata, o pacientes tras la prostatectomía, esta divulgación presenta patrones de expresión objetivos, que se pueden utilizar solos o en combinación con otros criterios (subjetivos y/u objetivos) para proporcionar una evaluación más precisa de los resultados de los pacientes, incluyendo la supervivencia y la recurrencia o metástasis del cáncer. Los patrones de expresión de la divulgación incluye por lo tanto un medio para determinar el pronóstico del cáncer de próstata, o tras la prostatectomía.

Los patrones de expresión de la divulgación comprenden más de un gen, o secuencia expresada, capaz de discriminar entre los resultados del cáncer de próstata, o tras prostatectomía, con una precisión significativa. Los niveles de expresión del gen(es), o secuencia(s) que se expresan se identifican y correlacionan con resultados de

45 forma que el/los nivel(es) de expresión es/son relevantes para una determinación de los protocolos de tratamiento preferidos para un paciente. Por lo tanto, la divulgación incluye un método para determinar el resultado de un sujeto que padece cáncer de próstata, opcionalmente tras la prostatectomía, ensayando los niveles de expresión en una muestra que contiene células de cáncer de dicho sujeto que se correlacionan con los resultados de los pacientes como se desvela en el presente documento.

En otro aspecto, la divulgación incluye un método para determinar el riesgo de recurrencia y/o metástasis del cáncer de próstata en un sujeto. El método incluye ensayar los niveles de expresión de una muestra que comprende células de cáncer de próstata de dicho sujeto de dos o más genes que se seleccionan de los Genes Nos 1 a 362 de las Figuras 14 y 15 del presente documento, y comparar el nivel de expresión de cada uno de los genes 55 individualmente, o los niveles de expresión agregados in toto, con la media o los niveles de expresión medios de los mismos en una población de células de cáncer de próstata. Estas evaluaciones se pueden utilizar entonces para determinar el riesgo de recurrencia de cáncer de próstata y/o metástasis en el sujeto del que se obtuvo la muestra. Los niveles de expresión de los genes desvelados (o las secuencias expresadas) se correlacionan con un bajo riesgo de recurrencia y/o metástasis del cáncer, o un alto riesgo de recurrencia y/o metástasis del cáncer, basándose en la comparación de la media o el nivel de expresión medio de una población de células de cáncer de próstata. Expresado de otra manera, los genes individuales (o las secuencias expresadas) que se desvelan en el presente documento se expresan a niveles mayores o menores (en comparación con la media o el nivel medio de expresión en una población de células de cáncer de próstata) de forma que la desviación de la media o medio se correlaciona con un riesgo mayor o menor como se describe en el presente documento. Cada agregación de

65 desviaciones en dos o más genes (o secuencias expresadas) es un patrón de expresión o perfil de la divulgación.

En algunas realizaciones, se puede llevar a cabo el ensayo de los niveles de expresión por el uso de dos o más sondas de ácido nucleico que se seleccionan de entre las SEC ID Nos 1-362 como se desvela en el presente documento. Estas sondas se hibridan, bajo condiciones apropiadas, y detectan las secuencias expresadas como se desvela en el presente documento. En otras realizaciones, se pueden utilizar otras sondas que se hibridan a las

5 mismas secuencias que se expresan como las SEC ID Nos 1-362. Estas sondas adicionales se pueden preparar o seleccionar por análisis de las secuencias expresadas detectadas por las SEC ID Nos 1-362. En otros casos, la secuencia de sonda adicional puede ser total o parte de las secuencias identificadas como Genes Nos 1-362. En muchas realizaciones, una sonda se puede utilizar para detectar una región de secuencia amplificada a partir de una secuencia expresada (o gen) como se describe en el presente documento.

La detección o determinación de los niveles de expresión de dos o más secuencias (genes) se puede referir a como la detección o la determinación de un perfil o firma de expresión. Los patrones de expresión de la divulgación que comprenden dos o más de las secuencias desveladas se identifican y se utilizan como se describen en el presente documento. Para su identificación, se obtiene un gran muestreo de los niveles de expresión genética en una muestra

15 que contiene células de cáncer de próstata a través de la cuantificación de los niveles de expresión de mARN. En una realización, la divulgación incluye la detección de los niveles de expresión genética (o de secuencia) analizando la expresión global o casi global, de células únicas o poblaciones celulares homogéneas que se han extraído de, o de otra manera aisladas o purificadas de entre células contaminantes más allá de lo que es posible por una biopsia simple. Debido a que la expresión de muchos genes fluctúan entre las células de diferentes pacientes así como entre células de la muestra del mismo paciente, se utilizan datos múltiples de la expresión de secuencias genéticas individuales como datos de referencia para generar modelos que a su vez permiten la identificación de genes y secuencias individuales, cuya expresión se correlacionan con resultados de cáncer de próstata, o tras la prostatectomía.

25 Los niveles de expresión de varios genes en esos modelos se analizan después para identificar las secuencias de ácido nucleico, cuyas expresiones se correlacionan positiva o negativamente con un resultado de cáncer de próstata

o tras una prostatectomía. La presente divulgación incluye secuencias de ácido nucleico, que son un subgrupo de secuencias expresadas en una célula, que se han identificado como que se correlaciona con resultados como se describe en el presente documento. Un patrón o perfil de expresión de la divulgación incluye una combinación de estas secuencias (o genes) identificadas. El uso de muestras múltiples para la identificación de las secuencias expresadas aumenta la confianza con la que se considera que un gen se correlaciona con recurrencia, metástasis y/o resultado de supervivencia del cáncer de próstata. Sin suficiente confianza, sigue impredecible si un gen particular se correlaciona actualmente con un resultado y también es impredecible si la expresión de un gen se puede utilizar satisfactoriamente para identificar el resultado de un paciente o sujeto con cáncer de próstata, o tras la

35 prostatectomía. Una vez que se identifiquen, una o más secuencias de ácido nucleico que corresponden a los genes desvelados (o secuencias expresadas) se pueden seleccionar para evaluar un perfil de expresión a detectarse o evaluarse en cuanto a sus propiedades predictivas.

Se puede utilizar un perfil de niveles de expresión que se correlaciona altamente con un resultado con respecto a otro para ensayar una muestra que contienen una célula de cáncer de próstata de un sujeto o paciente para predecir el resultado del sujeto del que se obtuvo la muestra. Tal ensayo se puede utilizar como parte de un método para determinar el tratamiento terapéutico para dicho sujeto basándose en el resultado identificado.

Los genes correlacionados se pueden utilizar en parejas (con precisión significativa) o en cantidades mayores para

45 aumentar la capacidad para correlacionar precisamente un fenotipo de expresión molecular con un resultado de cáncer de próstata o tras la prostatectomía. Esta correlación proporciona una determinación molecular de los resultados de recurrencia de cáncer de próstata, metástasis del cáncer y/o supervivencia como se desvelan en el presente documento. Si estar ligados por teoría alguna, y ofrecido para mejorar la comprensión de la presente divulgación, la determinación molecular desvelada es más potente que otros indicadores moleculares relacionados con el cáncer de próstata, tales como la determinación de los niveles del antígeno sérico de próstata (PSA). Usos adicionales de los patrones y perfiles de expresión correlacionados son para clasificar células y tejidos; determinación de diagnóstico y pronóstico; y determinación y/o alteración de la terapia.

La capacidad para discriminar la confiere la identificación de la expresión de las secuencias genéticas individuales

55 como relevantes y no por la forma del ensayo utilizado para determinar el nivel actual de expresión. Un ensayo puede utilizar cualquier característica de identificación de un gen individual identificado como se desvela en el presente documento siempre que el ensayo refleje, cuantitativa o cualitativamente, la expresión de la secuencia genética en el “transcriptoma” (la parte transcrita de genes de un genoma) o el “proteoma” (parte traducida de los genes que se expresan en un genoma). Las características de identificación incluyen, pero no se limitan a estas, secuencias únicas de ácido nucleico que se utilizan para codificar (ADN), o expresan (ARN), dicho gen o epítopos específicos de, o actividades de, una proteína codificada por dicho gen. Todo lo que se necesita es la identidad de la secuencia del gen necesaria para discriminar entre los resultados del cáncer de próstata, o tras la prostatectomía y una muestra que contiene células apropiadas para su uso en un ensayo de expresión.

65 De manera similar, la naturaleza de la muestra que contiene las célula, no está limitada, y se pueden utilizar como tejido fresco, tejido fresco congelado, y tejido fijado, tal como los tejidos fijados en formalina embebidos en parafina

(FFPE) en los métodos desvelados. En algunas realizaciones, la muestra puede ser de una biopsia por aguja (central) u otra biopsia.

Para detectar un patrón o perfil de expresión identificado, la divulgación incluye detectar los patrones de expresión

5 genética (o de secuencia) reuniendo la expresión genética global o casi global de células únicas o poblaciones celulares homogéneas que se han extraído, o de otra manera aislado o purificado de células contaminantes más allá de una simple biopsia. Los niveles de expresión de los genes (secuencias) del perfil o patrón se detectan o se miden de otra manera. En otras realizaciones, un método solo puede detectar o medir los niveles de expresión de los genes (secuencias) del perfil sin evaluar o sin otra determinación de la expresión de la expresión de otros genes o secuencias.

En un aspecto adicional, el análisis de los niveles de expresión se puede llevar a cabo en combinación con, o en vez de, otras evaluaciones o indicadores de cáncer de próstata. En algunas realizaciones, las evaluaciones se hacen en combinación con un método que determina el grado de cáncer de próstata en una muestra que comprende células

15 de cáncer prostático de un sujeto. Una tercera posibilidad es la combinación con detección o determinación de los niveles de PSA en un sujeto, opcionalmente antes del procedimiento que se utiliza para aislar las células de cáncer de próstata. Por supuesto es posible una combinación de uno cualquiera, dos o de estos tres ejemplos representativos. Cuando se utiliza más de un tipo de evaluación, el resultado es un análisis multivariado. La divulgación incluye expresamente todas las combinaciones posibles de evaluación descritas en el presente documento como realizaciones multivariadas.

En general, se puede utilizar cualquier método aceptado para evaluar el grado y/o estadio de un cáncer de próstata que sea conocido por el experto en la técnica. En algunos casos, el método de determinación del grado de cáncer de próstata comprende la determinación de la puntuación de Gleason (o Grado Gleason). En otros casos, el método

25 de determinación del estadio de cáncer de próstata comprende una determinación de acuerdo con el sistema de estadificación del Comité Conjunto Americano del Cancer (AJCC) para evaluar el estadio del cáncer de próstata. Y como se describe en el presente documento, el análisis de los niveles de expresión genética (de secuencia) se puede llevar a cabo o lugar o de la puntuación de Gleason o de la determinación de estadio del tumor del AJCC.

En el caso de los niveles de PSA, su evaluación puede llevarse a cabo antes de la prostatectomía que se utiliza para proporcionar una muestra que comprende células de cáncer prostático para su uso en cualquiera de los métodos desvelados en el presente documento.

En un aspecto más, la divulgación incluye medios físicos y metodológicos para detectar la expresión de genes (o

35 secuencias) desveladas en el presente documento. Estos medios pueden dirigirse al ensayo de uno o más aspectos de las matrices de ADN subrayando la expresión del gen (o secuencia), del ARN que se utiliza como intermediario para expresar el gen (o secuencia), o del producto proteináceo expresado por el gen (o la secuencia).

Una ventaja que proporciona la divulgación es que las células contaminantes, no del cáncer de próstata (tales como los linfocitos y otras células del sistema inmunitario) se pueden eliminar o reducir su efecto en las mediciones de los patrones de expresión desvelados en el presente documento para predecir la recurrencia y/o los resultados de supervivencia de los pacientes. Tal contaminación está presente cuando se utiliza una biopsia que contiene muchos tipos celulares para generar los perfiles de expresión genética.

45 Aunque la presente divulgación se describe principalmente en el contexto del cáncer de próstata humano, puede practicarse en el contexto del cáncer de próstata de cualquier animal que se sepa que puede padecer potencialmente un cáncer de próstata. Ejemplos no limitantes de animales para la aplicación de la presente divulgación son mamíferos, particularmente aquellos importantes en aplicaciones agrícolas (tales como, pero sin limitarse a, vacas, ovejas, caballos, y otros “animales de granja”), modelos animales de cáncer de próstata, y animales de compañía (tales, pero sin limitarse a, perros y gatos).

Breve descripción de las figuras

La Figura 1 ilustra un esquema de análisis de datos representativo, basado en muestras de pacientes humanos 55 como se describe en el Ejemplo 1 y la Tabla 1 del presente documento.

La Figura 2 muestra el resultado de las iteraciones de la selección de 500 genes del algoritmo Random Forests™ como se describe en el presente documento.

La Figura 3A muestra una identificación representativa del cáncer de próstata en un portaobjetos que contiene un especimen de prostatectomía radical (tejido FFPE) con un área identificada de tejido cancerosos. La Figura 3B muestra el material de cáncer de próstata escindido (macro-diseccionado) tras la retirada del tejido no canceroso.

La Figura 4 muestra la correlación entre la firma de riesgo genético y el grado o puntuación de Gleason (<= 6,7 o 65 >= 8) de muestras de los grupos de entrenamiento y de ensayo.

La Figura 5 muestra la correlación entre la firma de riesgo genético y el estadio tumoral patológico AJCC (II o III) de muestras de los grupos de entrenamiento y de ensayo.

La Figura 6 muestra la correlación entre la firma de riesgo genético y el valor del PSA (antígeno sérico prostático) 5 pre-operatorio de muestras de los grupos de entrenamiento y de ensayo.

La Figura 7 muestra los resultados del análisis de Kaplan-Meier para los libres de fallo de PSA (aumento de los valores del PSA) tras la intervención quirúrgica para tratar el cáncer de próstata. Los resultados muestran la segregación en una subpoblación de “bajo” riesgo con recurrencia del cáncer y resultados de supervivencias mejores (menor incidencia de recurrencia y muerte debidas a la metástasis) y una subpoblación de “alto” riesgo con peores resultados (mayor incidencia de recurrencia y metástasis).

La Figura 8 muestra los resultados del análisis de Kaplan-Meier para los libres del fallo del PSA tras la intervención quirúrgica para tratar el cáncer de próstata en muestras de células con grados o puntuaciones de

15 Gleason de <= 6 y 7. Los resultados muestran la segregación en una subpoblación de “bajo” riesgo con recurrencia del cáncer y resultado de supervivencia mejores (menor incidencia de recurrencia y muerte debido a metástasis) y una subpoblación de “alto” riesgo con resultados peores de recurrencia del cáncer (mayor incidencia de recurrencia y metástasis). Se observan resultados similares si las muestras se separan entre las que tienen un grado o puntuación de Gleason de <= 6, puntuación de 7, o puntuación de >= 8.

La Figura 9 muestra las curvas de supervivencia basadas en el Grado de Gleason solo.

La Figura 10 muestra las curvas de supervivencia basadas en el Estadio del AJCC solo.

25 La Figura 11 muestra los resultados de la utilización de una Puntuación de Riesgo desvelada (basada en 62 genes representativos) para segregar 189 pacientes en subpoblación de “bajo” riesgo con mejor probabilidad de resultados de supervivencia (menor incidencia de muerte debido a la metástasis) y una subpoblación de “alto” riesgo con peores resultados (mayor incidencia de metástasis) durante 10 años.

La Figura 12 muestra un gráfico de la Puntuación de Riesgo de la Figura 11 frente a la probabilidad de metástasis en 10 años. Como se indica en el gráfico, una puntuación por encima de 0 en las células de cáncer de próstata de un sujeto indica un aumento del riesgo de metástasis que se producen en los 10 años siguientes a la intervención quirúrgica.

35 La Figura 13 resume y compara el uso del análisis univariado y multivariado para el fallo del PSA. El Estadio AJCC indicado es II frente a III. CI se refiere al intervalo de confianza.

La Figura 14 enumera las anotaciones e identifica la información de 337 genes para su uso como se describe en el presente documento. El Nº de Gen se puede utilizar como referencia cruzada de cada gen con la correspondiente SEC ID Nº de la sonda y su información de actuación de la Tabla 1 posterior. La frecuencia con la que se producen las moléculas identificadas entre los 500 grupos generados (como se describe en el Ejemplo 1) se indica en la columna “frecuencia”. Las columnas restantes contienen información identificativa de cada gen, tal como el número de registro del gen (columna “Clave de búsqueda”), número de registro de la correspondiente secuencia de la sonda de la Tabla 1 (columna “ID de sonda”), símbolo del nombre del gen (columna “Símbolo”), y

45 una breve descripción (última columna).

La Figura 15 enumera las anotaciones y la información de identificación para 25 genes adicionales como se describe en el presente documento. El Nº de Gen y la información de su actuación (valores z y p) se pueden utilizar como referencia cruzada de cada gen con la SEC ID Nº correspondiente de la sonda y su información de actuación de la Tabla 3 posterior. La información identificativa de cada gen incluye el número de registro del gen (columna “Clave de búsqueda”), el número de registro de la secuencia correspondiente de la sonda de la Tabla 3 (columna “ID de sonda”), símbolo del nombre del gen (columna “Símbolo”), y una breve descripción (última columna).

55 Descripción detallada de los modos de practicar la divulgación

Definiciones de los términos

Un “patrón” o “perfil” o “firma” de expresión genética se refiere a la expresión relativa de dos o más genes (secuencias expresadas) entre dos o más resultados de cáncer de próstata, o tras la prostatectomía, recurrencia del cáncer, metástasis o supervivencia cuya expresión se correlaciona con la capacidad de distinguir entre los resultados.

Un “gen” o “secuencia expresada” es un polinucleótido que codifica, y se expresa de una manera detectable, un

65 producto distintivo, si es de naturaleza ARN o proteináceo. Se aprecia que más de un polinucleótido puede codificar un producto distintivo. El término incluye alelos y polimorfismos de un gen o secuencia expresada que codifica el

mismo producto, o un análogo asociado funcionalmente (incluyendo la ganancia, pérdida, o modulación de la función) del mismo, basándose en la localización cromosómica y la capacidad de recombinarse durante la mitosis normal.

5 Los términos “correlacionar” o “correlación” o equivalentes de los mismos se refiere a una asociación entre la expresión de dos o más genes y el estado fisiológico de una célula prostática para la exclusión de uno o más estados que se identifican por los métodos que se describen en el presente documento. Un gen se puede expresar a niveles más altos o más bajos y estar aún correlacionados con uno o más resultados o estados de un cáncer de próstata o tras la prostatectomía. Una forma de expresar la correlación es con un valor z como se desvela en el presente documento para la expresión de varios genes (o secuencias expresadas). El valor z se puede apreciar como que indica la longitud, o el peso, de la asociación entre el nivel de expresión de un gen (o secuencia expresada) y un resultado particular, tal como recurrencia del cáncer, metástasis del cáncer, y/o supervivencia en el tiempo. El valor puede tener un signo positivo o negativo (+/-) con arbitrariedad, pero constantemente, indica la sobre o bajo expresión, respectivamente. Debido a que los signos son arbitrarios, su asignación puede revertirse

15 fácilmente (pero constantemente) sin un efecto perjudicial.

En algunas realizaciones, la fuerza (o peso) se multiplica por el nivel de expresión de un gen determinado (o secuencia expresada), tras la normalización de la misma (tal como respecto a la expresión de un gen de referencia que se expresa a niveles relativamente constantes) para proporcionar un valor o puntuación para la expresión de ese gen (o secuencia). En muchos casos los datos de expresión se normalizan, se centran en la media, y se transforman logarítmicamente como conoce un experto en la técnica antes de su uso posterior, tal como en un análisis de agrupamiento y discriminatorio. Cuando se utiliza uno o más niveles de expresión (como en el caso de un patrón o perfil de expresión genética), los valores o puntuaciones se pueden sumar y luego analizarse como un valor agregado para evaluar la correlación o llevar a cabo la clasificación basada en la correlación.

25 Un “polinucleótido” es una forma polimérica de nucleótidos de cualquier longitud, sean ribonucleótidos o desoxirribonucleótidos. Este término se refiere solamente a la estructura primaria de la molécula. Por lo tanto, este término incluye ADN y ARN monocatenarios y bicatenarios. También incluye tipos conocidos de modificaciones que incluyen marcas conocidas en la técnica, metilación, “caps”, sustitución de uno o más de los nucleótidos de origen natural con un análogo, y modificaciones internucleótido tales como enlaces sin carga (por ejemplo, fosforotioatos, fosforoditioatos, etc.), así como formas no modificadas del polinucleótido.

El término “amplificar” se utiliza en el sentido amplio para significar que la creación de un producto de amplificación se puede hacer enzimáticamente con ADN o ARN polimerasas. “Amplificación” como se utiliza en el presente

35 documento, se refiere en general al proceso de producción de múltiples copias de los deseados de una muestra. “Múltiples copias” significa al menos 2 copias. Una “copia” no necesariamente significa una complementariedad o identidad de secuencia perfecta de la secuencia matriz.

El término “correspondiente” puede referirse, si es apropiado, a una molécula de ácido nucleico que comparte una cantidad sustancial de identidad de secuencia con otra molécula de ácido nucleico. Una cantidad sustancial significa al menos un 95%, habitualmente al menos un 98% y más habitualmente al menos un 99%, y la identidad de secuencia se determina utilizando el algoritmo BLAST, como se describe en Altschul et al. (1990), J. Mol. Biol. 215:403-410 (utilizando el ajusto por defecto publicado, es decir los parámetros w = 4, t = 17). Los métodos para amplificar el ARNm se conoce en general en la técnica, e incluyen la PCR de transcripción inversa (RT-PCR) y los

45 descritos en la Solicitud de Patente de EE. UU. 10/062.857 (presentada el 25 de octubre de 2001), así como las Solicitudes Provisionales de Patente de EE. UU. 60/298.847 (presentada el 15 de junio de 2001) y 60/257.801 (presentada el 22 de diciembre de 2000).

Otro método que se puede utilizar es la PCR cuantitativa (o Q-PCR). De manera alternativa, el ARN puede marcarse directamente como el ADNc correspondiente por métodos conocidos en la técnica.

Una “micromatriz” es una matriz lineal o bidimensional de regiones distintivas, que tiene cada una un área definida, que se forma sobre la superficie de un soporte sólido tal como, pero sin limitarse a esto, membranas de cristal, plástico, o sintéticas. La densidad de las regiones distintivas en una micromatriz se determina por el número total de

55 polinucleótidos inmovilizados que se van a detectar en la superficie de una fase sólida única del soporte, tal como al menos aproximadamente 50/cm2, al menos aproximadamente 100/cm2, al menos aproximadamente 500/cm2, pero menos de aproximadamente 1.000/cm2 en algunas realizaciones. Las matrices pueden contener menos de aproximadamente 500, aproximadamente 1000, aproximadamente 1500, aproximadamente 2000, aproximadamente 2500, o aproximadamente 3000 polinucleótidos inmovilizados en total. Como se utiliza en el presente documento, una micromatriz ADN es una matriz de oligonucleótidos o polinucleótidos situada en un chip u otras superficies que se usa para hibridarse con polinucleótidos amplificados o clonados de una muestra. Como la posición de cada grupo particular de polinucleótidos de la matriz se conoce, se pueden determinar las identidades de polinucleótidos muestra basándose en su unión a una posición particular de la micromatriz.

65 Debido a que la divulgación se relaciona con la identificación de genes (o secuencias expresadas) que se están sobre o bajo expresados, una realización de la divulgación implica la determinación de la expresión por hibridación

de ARNm, o una versión amplificada o clonada del mismo (tal como ADN o ADNc), de una muestra celular respecto a un polinucleótido que es único para una secuencia genética particular. Los polinucleótidos de este tipo pueden contener al menos aproximadamente 20, al menos aproximadamente 22, al menos aproximadamente 24, al menos aproximadamente 26, al menos aproximadamente 28, al menos aproximadamente 30, al menos aproximadamente 5 32 pares de bases consecutivas de una secuencia genética que no se encuentran en otras secuencias genéticas. El término “aproximadamente” como se utiliza en la frase anterior se refiere a un aumento o descenso de 1 a partir del valor numérico establecido. Otras realizaciones pueden utilizar polinucleótidos de la menos o aproximadamente 50, al menos o aproximadamente 100, al menos o aproximadamente 150, al menos o aproximadamente 200, al menos o aproximadamente 250, al menos o aproximadamente 300, al menos o aproximadamente 350, o al menos o aproximadamente 400 pares de bases de una secuencia genética que no se encuentra en otras secuencias genéticas. El término “aproximadamente” como se utiliza en la frase anterior se refiere a un aumento o disminución del 10% a partir del valor numérico establecido. Tales polinucleótidos también se pueden referir a unas sondas de polinucleótidos que son capaces de hibridarse con secuencias de gene, o partes únicas de las mismas, descritas en el presente documento. En muchos casos, las condiciones de hibridación son condiciones de rigurosidad de

15 aproximadamente el 30% v/v a aproximadamente el 50% de formamida y desde aproximadamente 0,01 M a aproximadamente 0,15 M de sal para hibridación y desde aproximadamente 0,01 M a aproximadamente 0,15 M de sal para las condiciones de lavado con aproximadamente 55 a aproximadamente 65 ºC o mayores, o condiciones equivalentes a estas.

En otras realizaciones, se pueden utilizar otras sondas que se hibridan a las mismas secuencias expresadas como SEC ID Nos 1-362. Estas sondas adicionales se pueden preparar o seleccionar por el análisis de las secuencias expresadas detectadas por las SEC ID Nos 1-362. Tales sondas de polinucleótidos adicionales para su uso en la divulgación pueden tener una identidad de aproximadamente o un 95%, aproximadamente o un 96%, aproximadamente o un 97%, aproximadamente o un 98%,aproximadamente o un 99% con las secuencias genéticas

25 que se van a utilizar. La identidad se determina utilizando el algoritmo BLAST como se ha descrito anteriormente. Estas sondas adicionales también se pueden describir sobre la base de la capacidad de hibridarse a genes y secuencias expresadas de la divulgación bajo condiciones de rigurosidad como se han descrito anteriormente o condiciones equivalentes a estas.

En muchos casos, las secuencias son las de ARNm codificado por los genes, el correspondiente ADNc de tales AR, y/o versiones amplificadas de tales secuencias. En algunas realizaciones de la divulgación, las sondas de polinucleótidos están inmovilizadas en una matriz, otros dispositivos, o en manchas individuales que localizan las sondas. En muchas realizaciones, las sondas se dirigen a una región de un gen (o secuencia expresada) es decir, o contiene una parte de una región 3’ sin traducir. En algunos casos, la región está en aproximadamente 100, 200,

35 300, 400, 500, 600, 700, 800, o 900 o más nucleótidos de la señal de poliadenilación o cola poliadenilada de un ARNm.

De manera alternativa, y en otra realización de la divulgación, la expresión genética se puede determinar por el análisis de las proteínas expresadas en una muestra celular de interés por el uso de uno o más anticuerpos específicos de uno o más epítopos de productos genéticos individuales (proteínas) en dicha muestra celular. Tales anticuerpos se pueden marcar para permitir su detección fácilmente tras la unión con el producto genético.

El término “marca” se refiere a una composición capaz de producir una señal detectable indicativa de la presencia de la molécula marcada. Marcas adecuadas incluyen radioisótopos, nucleótidos cromóforos, enzimas, sustratos,

45 moléculas fluorescentes, restos quimioluminiscentes, partículas magnéticas, restos bioluminiscentes, y similares. Como tal, una marca es cualquier composición detectables por medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquímicos, eléctricos, ópticos o químicos.

El término “soporte” se refiere a soportes convencionales tales como perlas, partículas, varillas, fibras, filtros, membranas y soportes de silano o silicato tales como portaobjetos de cristal.

Como se utiliza en el presente documento, una “muestra de tejido prostático” o “muestra celular de cáncer de próstata” se refiere a una muestra de tejido prostático aislada de un individuo, tal como el afectado de cáncer de próstata. La muestra puede ser de material retirado por medio de una prostatectomía, tal como una prostatectomía

55 radical. De manera alternativa, se pueden obtener por otros medios, tales como una biopsia por aguja (central) u otras técnicas de biopsia, como las biopsias dirigidas lateralmente, la estrategia convencional de biopsia por sextante, diferentes combinaciones de biopsias de sextante y lateral como técnicas extendidas, biopsia de próstata guiada por ecografía transrectal, y otras conocidas por los expertos en la técnica, Tales muestras se aíslan primariamente (al contrario que las células cultivadas) y se pueden recolectar por cualquier método reconocido en la técnica. En algunas realizaciones, la “muestra” se puede recolectar por un método invasivo, incluyendo, pero sin limitarse a este, biopsia quirúrgica. Una muestra puede contener células del tumor de próstata que se aíslan por métodos conocidos u otros métodos apropiados que se consideran deseables por el experto. Los métodos de aislamiento incluyen, pero sin limitarse a estos, microdisección, microdisección por captura con láser (LCM), o microdisección con láser (LMD) antes de su uso de acuerdo con la divulgación.

65 “Expresión” y “expresión genética” incluye la transcripción y/o traducción de material de ácido nucleico.

Como se utiliza en el presente documento, la expresión “que comprende” y sus relacionadas se utilizan en su sentido inclusivo; es decir, equivalente a la expresión “que incluye” y sus relacionadas.

Condiciones que “permiten” que se produzca un acontecimiento o condición que sea “adecuado” para que ocurra un

5 acontecimiento, tal como la hibridación, extensión de cadena, y similares, o condiciones “adecuadas” son condiciones que no evitan que ocurran tales acontecimientos. Por lo tanto, estas condiciones permiten, potencian, facilitan o son conductivas al acontecimiento. Tales condiciones, conocidas en la técnica y descritas en el presente documento, dependen de, por ejemplo, la naturaleza de la secuencia de nucleótidos, temperatura, y condiciones tampón. Estas condiciones también depende del evento que se desea, tal como hibridación, escisión, extensión de cadena o transcripción.

“Mutación” de secuencia, como se utiliza en el presente documento, se refiere a cualquier alteración en la secuencia de un gen de interés desvelado en el presente documento, en comparación con una secuencia de referencia. Una mutación de secuencia incluye cambios den nucleótidos únicos, o alteraciones de más de un nucleótido en una

15 secuencia, debidos a mecanismos tal como sustitución, eliminación o inserción. El polimorfismo de un nucleótido simple (SNP) también es una mutación de secuencia como se utiliza en el presente documento. Debido a que la presente divulgación se basa en el nivel de expresión genética (o de secuencia), las mutaciones en regiones no codificantes, pero reguladoras, de genes que se desvelan en el presente documento también se pueden ensayar en la práctica de la divulgación.

“Detección” incluye cualquier medio de detectar, incluyendo la detección directa e indirecta de la expresión genética los cambios de la misma. Por ejemplo, se pueden observar productos “detectablemente menos” directa o indirectamente, y el término indica cualquier reducción (incluyendo la ausencia de señal detectable). De manera similar, un producto “detectablemente más” significa cualquier aumento, tanto si se observa directa como

25 indirectamente.

Prostatectomía se refiere a la extracción del tejido prostático por un médico experto, tal como un cirujano. Ejemplos no limitantes incluyen la prostatectomía radical, prostatectomía abierta (tradicional) (que implica una incisión a través del periné); prostatectomía laparoscópica; y prostatectomía robotizada (con preservación nerviosa).

Puntuación de Gleason se refiere a la graduación de una muestra de cáncer de próstata por un patólogo experto de acuerdo con el sistema de Gleason, que asigna una puntuación de Gleason utilizando números del 1 al 5 basándose en las similitudes de las células de una muestra de tejido tisular, con respecto a un tejido cancerosos o un tejido prostático normal. Los tejidos que se parecen más al tejido prostático normal tiene una puntuación o grado de 1

35 mientras que un tejido que carece de características normales y que tiene células que parecen diseminarse anárquicamente por la próstata tiene una puntuación o grado de 5. Las puntuaciones o grados de 2 a 4, inclusive, tienen características entre estas posibilidades. Pero debido a que los cánceres de próstata pueden tener áreas con puntuaciones o grados diferentes, se dan las puntuaciones o grados separados a las dos áreas que suponen la mayoría del tejido. Las dos puntuaciones o grados se suman para dar una puntuación de Gleason (o suma de Gleason) entre 2 y 10.

A menos de que se defina de otra manera todos los términos técnicos y científicos que se utilizan en el presente documento tienen el mismo significado que entiende comúnmente un experto habituado en la técnica a la que pertenece la presente divulgación.

General

La divulgación se basa en parte en el descubrimiento predictores basados en la expresión genética (o de secuencia) del fallo del antígeno sérico prostático (PSA) utilizando grupos de entrenamiento y de ensayo de muestras de cáncer de próstata de tejidos FFPE archivados desde 1993-1995. Las muestras tienen datos del seguimiento clínico a largo plazo de los pacientes, incluyendo aquellos sin evidencia de enfermedad (NED) durante al menos 10 años tras la cirugía y aquellos que desarrollaron una recurrencia posterior (tal como una metástasis a distancia), de los que se obtuvieron las muestras. Se identificaron 62, 92, 337 y 362 genes (o secuencias expresadas), de un grupo de inicio de aproximadamente 1536 genes con un alto grado de expresión dinámica (o variación en los niveles de expresión)

55 de diferentes tipos de cáncer, por medio del perfil de expresión basado en el ARN de las muestras. Los niveles de expresión de estos genes se correlacionan con el fallo del PSA y l9os resultados clínicos como se describen en el presente documento y por lo tanto se pueden utilizar como predictores como se describe en el presente documento. Se había comunicado que los genes que se identificaron participaban en funciones celulares incluyendo el ciclo celular, la coagulación de la sangre y la curación de heridas, regulación de la transcripción, y apoptosis.

La capacidad predictiva del patrón (perfil) de expresión genética desvelado se puede correlacionar con la puntuación de Gleason y el estadio tumoral del AJCC. También es consistente con los niveles preoperatorios de PSA. El perfil también tiene la capacidad de estratificar las muestras con las puntuaciones de Gleason de <= 6 y 7 en bajo y alto riesgo de fallo de PSA. En los análisis multivariados con factores pronósticos conocidos, el perfil era la única 65 predicción que permanecía estadísticamente significativa (p < 0,05). Por lo tanto, la detección del perfil en la biopsia,

o en el tejido extraído durante la prostatectomía, permitía distinguir entre cánceres indolentes y agresivos.

La divulgación incluye la identificación y el uso de los patrones (o perfiles o “firmas”) de expresión genética que discriminan entre (o se correlacionan con) los resultados de supervivencia y recurrencia en el cáncer de próstata de un sujeto. Tales patrones se pueden determinar por los métodos de la divulgación por medio del uso de varias células o muestras de tejido de referencia, tal como las que ha revisado un patólogo experto en la patología del 5 cáncer de próstata, que reflejan las células de cáncer de próstata en oposición a las normales u otras células no cancerosas. Los resultados que experimentan los sujetos cuyas muestras se pueden correlacionar con los datos de expresión para identificar patrones que se correlacionan con los resultados. Debido a que el perfil de expresión genética total se diferencia de persona a persona, cáncer a cáncer, y célula cancerosa a células cancerosa, las correlaciones entre ciertas células y genes expresados o bajo expresados se puede hacer como se desvela en el

10 presente documento para identificar genes que son capaces de discriminar entre resultados del cáncer de próstata.

Identificación y descripción de genes y secuencias

La divulgación se puede practicar con dos o más de cualquiera de los genes desvelados (secuencias expresadas)

15 que se han encontrado para expresarse diferencialmente con respecto al resultado del cáncer de próstata o tras la prostatectomía, tal como el aumento del PSA de > 0,2 ng (“fallo del PSA”). La identificación se hizo utilizando los perfiles de expresión de varias poblaciones celulares homogéneas de cáncer de próstata. El nivel de expresión de cada gen del perfil de expresión se puede correlacionar con un resultado en particular. De manera alternativa, los niveles de expresión de dos o más genes (secuencias expresadas) se pueden agrupar (combinar) y usar basándose

20 en las correlaciones con resultados particulares. Ejemplos no limitantes de resultados incluyen pero no se limitan a estos, metástasis distante, tal como a ganglios linfáticos o hueso, o necesidad de quimioterapia de seguimiento o radioterapia o crioterapia. En realizaciones adicionales, el perfil de expresión se puede utilizar para estratificar sujetos o pacientes en un pronóstico diferencial de “espera en observación” frente a “necesidad de más tratamiento” en donde el último incluye terapia neoadyuvante o adyuvante más allá de la cirugía para eliminar el cáncer/tumor de

25 próstata. Los métodos desvelados pueden por lo tanto utilizarse como parte del manejo del cáncer de próstata.

Los genes con correlaciones significativas con los resultados de supervivencia en el cáncer de próstata (o tras la prostatectomía), metástasis, o recurrencia se utilizan para discriminar entre resultados. De manera alternativa, los genes con correlaciones significativas se pueden utilizar en combinación con genes con correlaciones bajas para 30 formar un patrón o perfil de la divulgación sin pérdida significativa de capacidad de discriminar entre resultados. Tales combinaciones (o patrones de expresión) se pueden seleccionar y ensayar por medios apropiados reconocidos en la técnica, incluyendo, pero sin limitarse a, análisis de agrupamiento, máquinas de vectores de soporte, redes neurales u otro algoritmo conocido en la técnica. Los patrones o perfiles son capaces de predecir la clasificación de una muestra desconocida que se basa en la expresión de los genes utilizados para la discriminación

35 en los modelos. Se puede utilizar la validación cruzada “deja uno fuera” para ensayar la actuación de varias combinaciones y para ayudar a identificar los pesos (genes o secuencias expresadas) que son menos informativos o van en detrimento de la capacidad predictiva de una combinación. La validación cruzada también se puede utilizar para identificar genes o secuencias, cuya expresión aumenta la capacidad predictiva de los modelos.

40 Los genes desvelados (secuencias) que se expresan en correlación con resultados particulares del cáncer de próstata, o tras la prostatectomía, proporcionan la capacidad de enfocar el análisis de expresión genética a solo los genes que contribuyen a la capacidad para estratificar un sujeto entre diferentes resultados. La expresión de otros genes en una célula de cáncer de próstata sería incapaz relativamente de proporcionar información que concierne, y asistir así al pronóstico diferencial (o discriminación) del resultado de un cáncer de próstata.

45 Como apreciará un experto en la técnica, las combinaciones (perfiles o patrones de expresión) son altamente útiles incluso cuando se basan en un pequeño grupo de datos de expresión genética de referencia y pueden llegar a ser gradualmente precisos con la inclusión de más datos de referencia aunque el aumento gradual de la precisión probablemente disminuirá con cada dato adicional. La preparación de datos de referencia de la expresión genética

50 utilizando genes identificados y desvelados en el presente documento para discriminar entre diferentes resultados del cáncer de próstata o tras la prostatectomía, se hace de forma rutinaria y se puede realizar fácilmente por un experto para permitir la generación de modelos como se ha descrito anteriormente para predecir el estado de una muestra desconocida basándose en los niveles de expresión de estos genes.

55 La divulgación incluye las secuencias expresadas en la siguiente Tabla 1 y los genes expresados en la Figura 14.

Tabla 1

SEC ID Nº: Frec. Secuencia de la sonda z P Grupo de 62

1: 500 GGCTGCTAGAAGGCGCATTCAATATCAGTACTGTTTAACGAGTGCG -3,00978 0,004298 sí

2: 488 TGACTGGATGGACACATTGCTGTGGGTAGTCCCTCCTACTAGGA 3,250421 0,000878 sí

3: 475 CCAACTATGAAAGGCCATAGAAACGTTTTAATTTTCAATGAAGTCACTGA 1,295466 0,199714 sí

4: 386 ATATTTTGGTGTTTGGGAGGCATGCAGTCAATATTTTGTACAGTTAGT 2,775622 0,00728 sí

5: 349 TGCATGGTTGGTCTGAAAATAGAGTTGGGCTTAATGTTGACTTCTATTAC 5,04529 6,51 E-06 sí

6: 338 TCACATCAGTCTTCCGGAATCAAGATCAACATATCAGGTGGTCATT 3,405667 0,000631 sí

7: 334 CCCCACCCCTATCGTGGTTATTGTGTTTTTGGACTGAATTTACTTG 4,583428 2,21 E-07 sí

8: 297 CCGGATGGTGCTTCTAATTTTCTGCTAACCTGTACTGTGGTGTGTGTA 3,80189 0,000379 sí

9: 291 CCTCCGAGCTGCTAGCTGACAAATACAATTCTGAAGGAATCCAAA 3,710157 0,00019 sí

10: 287 GCCTGTATCCCGGTGGGAGTACTATGAGTCAGTGTACACAGAACG -3,6926 0,000507 sí

11: 267 AAACCATCAGCCGGCCTTTTATATGGGTCTTCACTCTGACTAGAATT 3,57085 0,0014 sí

12: 267 GACTGATGCCAGGACAACCTTTCTCCCAGATGTAAACAGAGAGACATG -4,19554 2,68E-05 sí

13: 259 CACTGGACAGCGTTCGAGTGTGGGTTTTAACATCCCTGTGAGATT 2,634469 0,006429 sí

14: 254 GATCTGGGGATCACGCCTTGCCCAAGTGTGAGATTACCTTTCT 2,052031 0,040119 sí

15: 244 TTCAGGCTTAATGCTGCACCTAGATATAAATGCTAATGATACTTGGGTT 5,729346 2,33E-07 sí

16: 232 GAGTCAGTGGATGGACAGGTGGTTTCTTCCCACAAGAGAGAAAT -3,406 0,001156 sí

17: 227 TGGTAGGAGATACTAATTGGATTCGGAGATATTAATTGGATTTGGCCA -1,61758 0,110916 sí

18: 211 CCTAAGGTGGTTGTGCTCGGAGGGTTTCTTGTTTCTTTTCCATTTT 1,001552 0,315659 sí

19: 194 GCTCAATATTCCCAGAATAGTTTTCAATGTATTAATGAAGTGATTAATTGGCT 4,402902 4,56E-06 sí

20: 169 TTGCTTTTTCTTCCTTTGQGATQTTGGAAGGTAGAGAAATATTTATAAA 3,113451 0,002649 sí

21: 181 AGGCCTCATCCTCCACTGAAGAGTATGGATTGAAGGATTGTGAAC 4,029959 5,79E-05 sí

22: 181 GCTGAAGGACCCTGAGGAGCTTCGCAACTACATGGAGAGGATC 2,98415 0,004216 sí

23: 178 TGTTTCAAAACCACTTGCCATCCTGTTAGATTGCCAGTTCCTGG 1,89886 0,057651 sí

24: 164 ATCAAGCAAGTTCCTGCTGCTGAAGGATAAGACACAGATGACCTG -0,84556 0,373466 sí

25: 142 TAAGTCGGGTGGCAATTGTCAGGGTGTGGGAATTTCTTTTCCTAC 3,39272 0,000659 sí

26: 140 AGTTCTGACCCAACCACAGAGGATGCTGACATCATTTGTATTATGTTC -2,26722 0,020347 sí

27: 135 CCATGGCAGTGGGAAAAATGTAGGAGACTGTTTGGAAATTGATTTT -1,91339 0,060183 sí

28: 118 AGGACCTGAAGGGTGACATCCAGGAGGGGCCTCTGAAATTTC 1,467298 0,152499 sí

29: 117 GGACTCATCTTTCCCTCCTTGGTGATTCCGCAGTGAGAGAGT 2,349832 0,026905 sí

30: 117 CTCCCTGAAAAACCATTCCTGCTGAAACTGCTGTAGAAATTGTGAAG 3,856822 3,49E-05 sí

31: 114 CCCCTGAAAAGTGAGCAGCAACGTAAAAACGTATGTGAAGCCTCT 2,97408 0,002585

32: 109 CACCTGCTCTAGGGACGATTCGTTTGAAAGAGAGTAAGATGCATTAA -3,92943 0,000275 sí

33: 103 CCACCTGTTCTCAATTTGCAAGAATTAGAGGCGTATAGAGACAAATTG 1,583424 0,10573 sí

34: 102 TGTTTGGTCGTAATGTCTGCATGATATTTGTGCACATTTATTAAGTATCG -3,38591 0,000419 sí

35: 102 GGCTGGGTGTTTTCAAATGTCAGCTTAAAATTGGTAATTGAATGGAA -2,34381 0,021355 sí

36: 99 GCAAGCATAAGGGAAAATGTCACGTAAACTAGATCAGGGAACAAAATC 1,603483 0,122455 sí

37: 92 GCCAAGACCACCCAGGAAACCATCGACAAGACTGCTAACCAG -2,61622 0,013024 sí

38: 81 TTTGCAAAGAATCCAGGACAAAAAGGATTAGATCTAGAAATGGCCATT -0,1063 0,915443

39: 77 GGTGACTTTTGCAATTCAGGGAAGATTTGGGCATATTAAATGAAAGA -2,49834 0,012822 sí

40: 74 ATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTGCT -0,69455 0,484731

41: 71 TTGATTTGGGACTTGGGAGACCTCTCTTCTGTAAGCAACTCAATAAA 3,539216 0,00045 sí

42: 67 AATCCTGTGGTGAATGGTGGTGTACTTTAAAGCTGTCACCATGTTA 1,171006 0,231962 sí

43: 64 CTTGAGTCCCACCCAAAACCTCTAGTAGGGTTTTAATAACGCTCAC 3,521289 0,000326

44: 64 TCTTTCAGAAGTGAAGAGGGGGCTAGAAGGACTCTGAGAAGTTGGTA 3,320872 0,001015 sí

45: 60 GCAGAGAGTGCCGATCTTACTCAAGTACCTAGACTCAGATACAGAGAAGG 2,934405 0,002862 sí

46: 60 CGGAACTCTTGTGCGTAAGGAAAAGTAAGGAAAACGATTCCTTCTAA 2,370805 0,019885 sí

47: 59 AATGTGGGAAGGTGGGGGTTATGGAGGAGATAACTCAAAACTTCT 3,829441 0,00022 sí

48: 59 CCCCATCTTGTGGTAACTTGCTGCTTCTGCAGTTCATATCCATATTT 1,175431 0,263596 sí

49: 54 TTATCCATTCGTTGTGGACCCACAGATTGCATCTTTAAATTCATAAT 1,210782 0,239402

50: 52 AGGTCCTCAGATGGGAATTGCACAGTAGGATGTGGAACCTGTTT -1,45819 0,141876 sí

51
51: TGTAACATTCCTGAAGCTGTTCCCACTCCCAGATGGTTTTATCAATA 1,852187 0,06511 sí

52: 48 TTTTAACTTCTATATGGGACCCGAATTAGACACTGCTGAATCCTGTAC 3,449622 0,000296 sí

53: 46 AGAAGAGCACAAAGCAAGGCCATTGCAACAGGCATTTAAAAATTATT -4,08976 7,22E-05

54: 46 CTCAATGCATCCATCTTGGGCTGATCATGCCACAGATCTCATTC 3,285094 0,001303 sí

55: 45 AATTCCTCGGGAAAGGTGAACCTGAACAACCCAAGTCTCTCTCT -4,17274 3,78E-05

56: 45 GCTCTGTTACAGCTCTGACCACGAAAAACTGAAGCCTCAGTACTTG -3,86847 0,000157 sí

57: 44 CCACTTGACAGTGGAGCAGAGGGGTTACCCAGATTTCAACCTCAT 1,389785 0,187738

58: 44 TTCTGGGATTTCTCTAGAGGCTGGCAAGAACCAGTTGTTTTGTCTTG 0,716713 0,475575

59: 42 TGAGCACCTTTTAAACCTGCTGCACAATAATTGAGGAAATAGACTCTTT 1,253049 0,204046

60: 42 CGTGTCAACAATGGTAAAGGGGATGTATGGCATTGAGAATGAAGTC -4,22412 0,000197 sí

61: 41 TCAAAGTTCCCCAAGAAGAACTGGAAAATGCCAGCCTAGTGTTTAC -1,17228 0,26041 sí

62: 37 ATGTTCACCTGGCAATCAQCTGAGTTGAGACTTTGGAATAAGACACT 3,369271 0,000783

63: 37 TTTAATTATGGTGAGCGTTTCCGTTTGGGTACAAGGAATATGAGAGAT -1,57416 0,125115

64: 34 TGAGAGCATGCCAAAATTTGCTAAGTCTTACAAAGATCAAGGGCT 3,791155 0,000213 sí

65: 33 TCCCTACCAAGTGAAAATTGATGTGTGTTAAGAGGGTACAGAATTATCAAC 2,285228 0,014636

66: 33 GGTGATTTGCTGCTGGCTTTCTATCATTTTTATGTTTTAATGCAAAG -3,31128 0,001117 sí

67: 33 GGCCAAGAATATTGCAAAATACATGAAGCTTCATGCACTTAAAGAAGTA -0,5838 0,561233

68: 32 CTCCTCAGGACCCTCTGGGTCACACATCTTTAGGGTCAGTGAAC -3,24137 0,000608 sí

69: 32 GGCAACAGGAAACAGGTTTTGCAAGTTGAAGGTTCACTCCCTATAT 3,728802 4,82E-05

70: 30 TGAAAAAGTTATCTCTGGGTATTGCATAAAAGGCTTCATCTTATAAAGTGA -1,39464 0,192516

71: 29 CCACGAGGATGGCCCACAAGCAGATCTACTACTCGGACAAGT 0,902775 0,379221

72: 28 TCTGCTCTCCATCCAGAGCCTTCTAGGAGAACCCAACATTGATAGT 4,556078 1,33E-05

73: 27 GTGAGGAGCGAAGAGCCCTCTGCTCTAGGATTTGGGTTGAAAAA 1,185538 0,24293

74: 27 TGGCACTTTGTTTGTGTTGTTGGAAAAAGTCACATTGCCATTAAAC 0,806045 0,423301 sí

75: 26 GGCTGGATCAAGGGCAAAAACTGGTCATTAAGTCATCTGACATTAA 2,219451 0,029617

76: 26 GAGAGAAATTTTAGGTGGTTGAAATGATTAAATGGAAAGAGATTTATTTTCA -2,55709 0,010361

77: 26 TCTTTGAGAAACAGCGTGGATTTTACTTATCTGTGTATTCACAGAGCTT 1,067981 0,294969 sí

78: 25 ATAGAGCACCCAGCCCCACCCCTGTAAATGGAATTTACCAGATG 1,605946 0,10608 sí

79: 24 TCACAGGATCCTGAGCTGCACTTACCTGTGAGAGTCTTCAAACTTT 0,054807 0,956306

80: 24 GCTGAAGTGTTCATAAGATAACAATAGGCTTGAATCTCCAATTCAAATGAAT 0,213151 0,831225

81: 24 TTGTGACATTGTGACAAGCTCCATGTCCTTTAAAATCAGTCACTCTG -5,23137 3,27E-07 sí

82: 24 TGGAAACTCTTGGACCAAGATTAGGATTAATTTGTTTTTGAAGTTTTTTG 0,949064 0,344716

83: 22 CATTCAATCCGGACCATTTTCTGGAGAATGGACAGTTTAAGAAAAGG 0,784157 0,439473

84: 22 TGCTGAACTCACAGTTAGACAATCCATGGTTTAATGCACATGAAATTACC -0,14282 0,887169

85: 22 ACGATAACCTGGCAGTGGAAGGAAAGAAGCATGGTCTACTTTAGGT -2,47268 0,010003

86: 21 CTGCTTGATTTTTGCCTCTTCCAGTCTTCCTGACACTTTAATTACCA -4,14257 2,03E-05

87: 21 TCAACATCACAATGGCAAAGAAGAAATATACTGTACAAAACTGCAGGAA -1,72036 0,093687

88: 21 TTTGCATGTCCAAATTGCTTCCTTCTTTTTAGCAGAAAGGAGGAGT -1,91298 0,083553 sí

89: 21 TCCAGGCATTTTAGAACTATGCAATTGTGATTTAAAATGCAACTTTGT -2,15046 0,037021

90: 21 GAGACAGGGAAACACAAGGGGAGTAGAAGGCTTCAGTAGAAGATTTC 1,665338 0,12772

91: 20 GTGGTCATCATCAAGGCATGCCAGGATACCTTCCTGGTGCTAT -1,18886 0,2414

92: 20 CCTGGTAAGTATGCAGCACATTGCTTATATCCTGGGTATGCATTATTTT 3,422692 0,000874

93: 20 TCAATGAGTAACAGGAAAATTTTAAAAATACAGATAGATATATGCTCTGCATG 3,192274 0,001222

94: 20 TGCCCAGTTTGTTCAAGAAGCCACTTACAAGGAAGTAAGCAAAATG -0,54687 0,573053

95: 19 GAAACGGGGCCATATAGTTTGGTTATGACATCAATATTTTACCTAGGTG 4,220137 3,53E-05

96: 18 ATTTCCATGCCGTCTACAGGGATGACCTGAAGAAATTGCTAGAGAC -1,16115 0,230302

97: 18 TGCATAATTCATTGTTGCCAAGGAATAAAGTGAAGAAACAGCACCTT -1,41926 0,138831

98: 18 CTGCTCTTGTGCCCTTCTGAGCCCACAATAAAGGCTGAGCTCTTA 2,079621 0,016021

99: 18 CCTCCGGAAGCTGTCGACTTCATGACAAGCATTTTGTGAACTAG 1,81169 0,070381 sí

100: 18 CATAGCTCTTTGGCTCGTGAACGTAATTGTAAACTTTCAGGTATTTTTG 1,766145 0,074049

101: 17 CCAGTTATGCAGCACCTGGCTAAGAATGTAGTCATGGTAAATCAAGG 3,991931 0,000108

102: 17 GGCAGGCACTTTAATACCAAACTGTAACATGTCTCAACTGTATACAACTCA 1,692111 0,097387 sí

103: 16 GCCACACTGAAAAGGAAAATGGGAATTTATAACCCAGTGAGTTCAGC 0,852486 0,40553

104: 16 CTGGGCATACAACCCTCTGCTTTCACATCTCTGAGCTATATCCTCA -3,7346 0,000251

105: 16 AGCAGACAAAAAAGGCACTTTTCAGAACATCAAATTCCTAATGAAGAAG -3,23615 0,002278 sí

106: 15 TGCTTCATTGTGCCCTTTTTCTTATTGGTTTAGAACTCTTGATTTTG 3,311718 0,001031

107: 15 GATGTGGCAGAATCCACACCAGCTTATCAACCAACACAGCTAATTT 1,389693 0,166098

108: 15 GGGGGAGTAAAAAATTGAATTTTAACAAAAGATCTTAGGGGAATGTGATT -3,0524 0,002691

109: 14 CCTTGATGCTGTCTGTACAGGGTTCATATTTTGTAGCGAAAGTCGTTT -2,22662 0,020629

110: 14 CATCCAGGACACTGGGAGCACATAGAGATTCACCCATGTTTGTT 1,067035 0,287699

111: 14 CGGAAGAACTGAGCACTCTGTTCTCCAAACCTATCAGAAATTTGTGG 3,742475 0,000285

112: 13 ACCAGTAGGGGCTTATAATAAAGGACTGTAATCTTATTTAGGAAGTTGACTT -4,16547 2,91E-05

113: 13 CACTTTCAGATAAGAGGTGTTTGCTGGGATGGAAGAAGTACCTGGC 1,85552 0,076369

114: 13 GAAAGCCTTCCTCGGGTTCAAAGCTGGATTTTGAACTGAAGAAGAT 3,344591 0,000724

115: 12 TGAAAATTGGTAGATCAGAGTTGAGCTGATTGGAGGACCAAATTAAAA -2,61178 0,007099

116: 12 TTCCATTGTAATTGCTATCGCCATCACAGCTGAACTTGTTGAGAT 3,126618 0,001574

117: 12 GACACAGATGACTCTTTGGTGTTGGTCTTTTTGTCTGCAGTGAATGTT 1,891374 0,056055

118: 11 TCAAGAAAGGGATTCCGAGGCCAATAAGCCCTCCTTTCTCTTG -1,24114 0,198279

119: 10 TCCAGATAACTTTCAGGCACTGCTGGAGTGTCGGATAAATTCTGGT 1,813774 0,066896

120: 10 AATCCTCACATCGTGCCAAACTTAGTCTGGTTACTAAGCCTAAAAACA 2,403548 0,016851

121: 10 ATTGAGGATTTGTGGGCAGCCAGAGGGAGTCTGACTGAAGTTTAC -2.29581 0.02535

122: 9 TGCCAGAATCTAGTGGGATGGAAG 1 1 1 1 1 GCTACATGTTATCCACC -0.34425 0.731248

123: 9 TTCCTTCATGTAACTTCCCTGAAAAATCTAAGTGTTTCATAAATTTGAGAG 2.695661 0.00798

124: 9 CTCTGGTG1 1 1 1CGCCAGACAATAAACTTACACTGGAAGCTTTGAT -3.03684 0.002403

125: 9 TTGAACACAGGCTTTGTCTGAATGATGTTCI 1 1 1ATCTCTTGAACACAA -3.59572 0.000682

126: 9 GAAGCCAAAGTACCCGCACTGCGAGGAGAAGATGGTTATCATCAC 1.937332 0.052778

127: 9 AGCTGGCGCCAGCTTCTTCTCCTGGATCCAGTAAGAGTTTCG -0.59083 0.544181

128: 9 CCTGAAGGAAACCACTGGCTTGATATTTCTGTGACTCGTGTTGC -0.58376 0.559447

129: 8 CCACCTTTCCTCCCAGCAAGCATCTGGCCAATCCTATTCTTC -2.29915 0.014561

130: 8 GTGAGGTACAGGCGGAAGTTGGAATCAGG 1 1 1 1 AGGATTCTGTCTC 4.941946 1.60E-05

131: 8 CTTGGCCTGAAGAGGTGCAGAAAATACAGACCAAAGTTGACCAG -1.962 0.049061

132: 8 ACATAGTGACATGCACACGGGAAAGCCTTAAAAATATCCTTGATGTAC -3.61201 0.000318

133: 8 TAATGCAAGCCCTGACTGGGTGGAAGCTGAAGTCTTGCTGTTTTA 2.396608 0.012653

134: 8 TCCTTTTTTGGGGAAATCTGAGCCTAGCTCAGAAAAACATAAAGCAC -3.97531 0.00059

135: 7 GGCCCTTCCTGATGATCATTGTCCCTACAGACACCCAGAACATCTT -2.36278 0.018244

136: 7 GGAGCTGGGGAGCTGTGTTAAGTCAAAGTAGAAACCCTCCAGTGTT -4.42673 3.B6E-06

137: 7 GCAGAAAAGAAGACGAGAATGCAACCATACCTAGATGGACTTTTCCAC 2.728168 0.006056

138: 7 AACAAGTGGGA1 1 1 1 CTGGGCCAGCAAGTCTTCCAAACTGTATATG -0.21615 0.829698

139: 7 GCTGTGTGGGTCACACAAGGTCTACATTACAAAAGACAGAATTCAGG -2.47087 0.013094

140: 7 TGCACAGATCTGCTTGATCAATTCCCTTGAATAGGGAAGTAACATTTG 3.051955 0.001684

141: 7 CCCTATGAGTGGAAGGGTCCAI 1 1 1GAAGTCAGTGGAGTAAGCTTTA -1.23786 0.21761

142: 7 AGAGCTTCTGAGGCGCTGCTTTGTCAAAAGGAAGTCTCTAGGTTC 1.688918 0.097307

143: 6 TGTGAAAACAAGCTTCAAAGCCATATGGACACTGTGACAATGACTA 3.369288 0.000926

144: 6 GCATCTCCCTGACCTTCTCCAGGGACAGAAGCAGGAGTAAGTTTC -4.1766 1.77E-05

145: 6 CGCCAGCTACAATCCCATGGTGCTCATTCAAAAGACCGACAC -1.32939 0.195817

146: 6 GATCCGGGATGGGAGACCCCACTTTAGAAAGGGTCGTCACTC 2.803856 0.002763

147: 6 TGGATTGAGAAAACCTATATCCATTCTTTATATCAATGTATAGTTTTAGTCTCCT 2.448797 0.019091

148: 6 GGTGAATGCCCTCAACTTCTCAGTGAATTACAGTGAAGACTTTGTTGA 1.886404 0.063745

149: 6 ATACGGCGAGGTAGAGTTGGCCATATTTCAGAGACTTAGATTGACGT 4.337458 1.70E-05

150: 6 GCTCGTTTGGTGCACTCTCGTGGGAGACAATCAGAGAACAACATA 1.225008 0.19426

151: 6 GCCTTTCCATCTGGCATTTCCCGCTCATTTATATGACTTGCTGAG 2.968053 0.002255

152: 6 TCCGGTGACCAGGTGTCTACAAGGACAAGGTTCAGAAATTGTACAG 2,304752 0,025941

153: 5 GCAGAGGTTCTTTTAAAGGGGCAGAAAAACTCTGGGAAATAAGAGAG -3,24369 0,000993

154: 5 TTTTCCCCACCCGAGATGAAGGATACGCTGTATTTTTTGCCTAAT 2,24033 0,011993

155: 5 ACTGCAGGATACACTCCCCTCCTGCTACCTAGGCAGGCGTGAG -0,88751 0,353721

156: 5 GGTTTAACCCGAGTCACCCAGCTGGTCTCATACATAGACAGCACTT 2,232118 0,02553

157: 5 GACACTTGTTTAGACGATTGGCCATTCTAAAGTTGGTGAGTTTGTCAA 1,647226 0,102927

158: 5 TCACCAAAAGCTGTATGACTGGATGTTCTGGTTACCTGGTTTACAAAAT 2,938772 0,002383

159: 5 CATAAGCTGGTATCAGTGGTTCGGGGGAAATAGTTCCATTCTATGACTC -3,01637 0,003841

160: 5 TTGGCGATCATTTCCCAAGATTGGTTTCCCTTGAGTTTTTGTTAAA -4,22349 5,18E-05

161: 5 CCTAGTTTGATGCCCTTATGTCCCGGAGGGGTTCACAAAGTGCT -0,55135 0,58089

162: 5 TTTTCGAAGGATAATTTTGGAGGCNAGAAAAAATGGACGGGG -2,37921 0,016098

163: 5 TGTTCGCGACTAGTTGGCTCTGAGATACTAATAGGTGTGTGAGGCTC -2,17442 0,018122

164: 5 CACCTGGACCCCTGCATTGGAACTGGAGGCAGGGAACAT -2,2306 0,022824

165: 5 TGGAAGGATGGAAGAAACGCCTGGAGAATATTTGGGATGAGACAC -1,79624 0,085727

166: 5 GCATTACTTTGAATTTAATGTTGCGCTTGTGCACTGTGTTAATATTGTTT -2,46291 0,016207

167: 5 GGTGATGGGGACCGTCTTTCTTTTACTGACACATGACCAATCATA -2,30099 0,020722

168: 5 TGGGCAAAACCATTGAATTTCACATGGGTGGTAATATGGAGTTAAA -2,99545 0,002532

169: 5 AACCAGCCTTCAGAGCGTTCTCTGTCCTGCTTCTAACGTCACTT 0,01601 0,987237

170: 5 TGCCACATTTGACTGAATTGAGCTGTCATTTGTACATTTAAAGCAGC -0,67643 0,497085

171: 4 TATATGGTTTCCAAAGGGTGCCCCTATGATCCATTGTCCCCACT -1,76935 0,075774

172: 4 TTTAAGGACTGATCATTGGCTCTGAGGACACTTCAACTAGTTAGCCTTCT 0,11679 0,907115

173: 4 CCCTCATCAAAGTCCTCGGTGTTTTTTAAATTATCAGAACTGCCC -2,8669 0,003674

174: 4 CAAATGGTTACCTTGTTATTTAACCCATTTGTCTCTACTTTTCCCTGTACTT 3,411476 0,000689

175: 4 GCCAGCTGCATGCAGGAGCGTGCCATCCAGACAGACTTC -2,24724 0,024396

176: 4 CACTCCAGGCAGGTCTTGGGGCTCCTATGTAAGCTGTGTTAAGC -1,38308 0,168369

177: 4 GGCTGGCAACTTAGAGGTGGGGAGCAGAGAATTCTCTTATCCAAC -2,0969 0,052047

178: 4 GATTCATCCAGCCTTCCAGCTCTGTTATTTAAAGCAAGAACACTTCTG 4,423002 2,51 E-05

179: 4 CCTAAAGCAAGCCTGAATTGGCTATGCAGTACATTGTATTCTGTTTG -4,28624 2,42E-05

180: 4 CGGGCTTTTAGCAGCATGTACCCAAAGTGTTCTGATTCCTTCAACT -0,69941 0,485384

181: 4 CTAAGGGATGGGGCAGTCTCTGCCCAAACATAAAGAGAACTCTGG 0,451498 0,654537

182: 4 AAATCCAAACTCTCAATTACGCCATGGTAATTCAGTCACTAAAATATGT -3,42088 0,000689

183: 4 GCAGGAACCGCGAGATGGTCTAGAGTCAGCTTACATCCCTGA -2,37983 0,026005

184: 4 TGTTCCACTGAGCTCCTGTTGCTTACCATCAAGTCAACAGTTATCA 0,232032 0,818608

185: 4 CTCAATGTAACCTCAGGGGCCAGTTTTAGCATTTGAAATGGTTCT -1,76115 0,095531

186: 4 TCTGACCAGTTACAGCCCCAAAGATGCAGTGATAACTGTGATGTATG -1,37322 0,133757

187: 4 GCATCCAGAACAGCCTGCTTGGACACAGCTCGGTGGAAGAT -2,12389 0,039832

188: 3 TTACAAATGACTCAGCCCACGTGCCACTCAATACAAATGTTCTGCTAT 2,395553 0,016443

189: 3 ACAGCCCTGCTCCCAAGTACAAATAGAGTGACCCGTAAAATCTAGG -3,50224 0,000637

190: 3 CCAGATACTACTCGGCGCTGCGACACTACATCAACCTCATCACC -2,27536 0,031464

191: 3 AATAAGCAGGATGTTGGCCACCAGGTGCCTTTCAAATTTAGAAA -1,68039 0,069608

192: 3 GGAATTTGATTCTTCCAGAATGACCTTCTTATTTATGTAACTGGCTTTCA 3,817877 0,000172

193: 3 CAAGGTGTAGCAAGTGTACCCACACAGATAGCATTCAACAAAAGCTG -2,7616 0,00587

194: 3 CACAGAGTCTGAAAAGCGGGTCTCCGTCTACCAGAAGGTGACCTCC -0,46636 0,642653

195: 3 TGAGGACTCAGAAGTTCAAGCTAAATATTGTTTACATTTTCTGGTACTCTG 2,004388 0,050059

196: 3 TGGAATGGTGAAAGAGAGATGCCGTGTTTTGAAAGTAAGATGATGAAA 1,286332 0,218274

197: 3 CAGGGGTTGAGAGCTTTCTGCCTTAGCCTACCATGTGAAACTCTA 0,396152 0,693055

198: 3 CACAGATGAGAACCACGCCTAGCCAAMTCACTTTTCCTGTTTGC 0,932001 0,350214

199: 3 AGGCATGGGAGTCATTGTCCACATCATCGAGAAGGACAAAATC 1,048222 0,289167

200: 3 AACGGGATCCTCTGTGGTCGCGACACTGACCTAGACGGCTT 1,930889 0,05573

201: 3 TGTGTGGCTTCCTGCAAGGTACCTTCATCTCTGAGTTACCTGACTC -2,12276 0,038612

202: 3 GCTGTCCTCAAAGCATCCAGTGAACACTGGAAGAGGCTTCTAGAA 2,647942 0,012248

203: 3 CCCTTTCTTTGATGGTGCTTGCAGGTTTTCTAGGTAGAAATTATTTCA 1,507454 0,122396

204: 3 AAATGTACCAATCAGCATGCTGTGTCTAGCTCAAGAACTCAAGCTCC -0,57666 0,565438

205: 3 CGTCACCCCAAAAAGTTCCCTCCATATCCCTTTGCAGTCAGTTC 0,760999 0,450353

206: 3 CATGACCGCATGGTATACCTGGGCCTCTCAGACTACTTCTTCAACA -2,48108 0,008418

207: 3 GCATTAGTATGACAGTAGGGGGGCTGTTAGAATTGCTGCTATACTGGT -1,3436 0,203689

208: 3 CCAGGATAAAGCTTCCGGGAAAACAGCTATTATATCAGCTTTTCTGA 2,988968 0,005851

209: 3 TTCCTGCTACACATGCCCTGAATGAATTGCTAAATTTCAAAGGAAAT 0,810494 0,410805

210: 2 TGGCCTGTGGTTATCTTGGAAATTGGTGATTTATGCTAGAAAGCTTT -2,73832 0,007474

211: 2 GGGAGAAAGCTAATGTTTTCCACAAGACTGAACAACGTGTATTTACACG -3,19477 0,000546

212: 2 GTGCTGGGTGCATATCATCCAGGATAATATTCTGCCCAACTCCAT -1,23963 0,215301

213: 2 CCCAGGATTATGTTTGTTGACCCATCTCTGACAGTTAGAGCCGATAT -1,35681 0,189959

214: 2 GCTGGACAGGAGCACTTTATCTGAAGACAAACTCATTTAATCATCTTTG 1,270148 0,203802

215: 2 AGTTGCAAAAATGGCTCCATCGGTAACTCAAGCTTCAGAATGTTATG 2,416151 0,015977

216: 2 TCATCGGAGTAGATTCCGGGTGCCTTTACTCCACTGTGACCTCATA -1,28409 0,192946

217: 2 GTGTGCTCAGGCAATTATTTTGCTAAGAATGTGAATTCAAGTGCAG 2,642687 0,006795

218: 2 TGGGAAAGTATCAGGAGTGCCATGATTCCAATGTTTTCCTTCTTTTA 2,157816 0,025861

219: 2 AGACGGCGCAGACATGTCAGAACAAAGTAAGGATCTGAGCGAC -3,49114 0,000292

220: 2 CCAGCATTAAGTACTGTATATCGCCCTGTACTTGGATAGGCTGGCTAAC 0,144643 0,885072

221: 2 AGGCAAGGAGGAGGGGAATTTTAAAACCATCTTATTTGAACTGAGAG 1,851673 0,064779

222: 2 TGGTGCTCTATGCTCAATGATGGTCTTACACATTCCTCTAGGGAAAG 3,451224 0,001721

223: 2 CCCTTTCTATTCTGAACAACTGTCTCCATTTTTCAAGTGTGAGAGATAAGG 2,35354 0,015021

224: 2 CAGTCGAGACCCAGATCCACTGAACATCTGTGTCTTTATHTGCTG 1,792116 0,072731

225: 2 GCAGACATCCTGTGAAGCAGGACCTGCTGAAGAGGAGACTTTCTAT 0,353515 0,72344

226: 2 TGAGAAAGCTCAAGATTCCAAGGCCTATTCAAAAATCACTGAAGGAAA 2,674193 0,01623

227: 2 CAATCCGAGTTCCCGGATGAGGGAACATTCTGCAGTATAAAGGG -1,59105 0,109934

228: 2 CAGCACCAAGTCTACGGGTGCCAGATCAGTAGGGCCTGTGATT 2,448186 0,011472

229: 2 AGCAACAGCAAATCACGACCACTGATAGATGTCTATTCTTGTTGGA 1,239036 0,208803

230: 2 CTTGCCCATCTAGCACTTTGGAAATCAGTATTTAAATGCCAAATAATC 1,984819 0,047707

231: 2 TTTTCAGGTTTATTCTTTTAGCAGGTGTAGTTAAACGACCTCCACTGAAC 0,755574 0,449369

232: 2 TGCCAAAAATTAAAGTGCAATATTGTATATTTTTAAGAACAAATTTAAAATAGAA -0,31259 0,755488

233: 2 TTCTGAGGAGGAGAGAGTGAGGGTTTTGCTATTGACTGACTTGAAC -0,56126 0,582467

234: 2 CTGGGGGCGCAACCACCCCTTCCTTAGGTTGATGTGCTT -2,07743 0,039244

235: 2 ACGCTGTGCGTTTGTCAGAATGAAGTATACAAGTCAATGTTTTTCCC -0,98359 0,325597

236: 2 TGTTGAATACTTGGCCCCATGAGCCATGCCTTTCTGTATAGTACAC -1,61334 0,089292

237: 2 GCTATACCTCATTCACAGCTCCTTGTGAGTGTGTGCACAGGAAATAAG 0,661879 0,50136

238: 2 ACACTGTTGGACCTGACCCACACTGAATGTAGTCTTTCAGTACGAGA 1,423365 0,138012

239: 1 TCCTGCAAGTAAGAATGTTTTCACACTGAGCTATTGATTTAACCAAGC 0,61193 0,55105

240: 1 GGGAGGTCAGACACGCTTCATTATATCTCCGTCTCTTTTATGGTTT 0,118933 0,905287

241: 1 TGGTTGTGCTTGCTTTCCTTTTTTAGAAAGTTCTAGAAAATAGGAAAACG -0,29803 0,763403

242: 1 GCTCCGGCAGCACCTTTATCTATGGTTATGTGGATGCAGCATATAAG 0,36714 0,713965

243: 1 AACCTCCCAGAGTTAGCCAGCCTTTCAGAGTTGAAGTCACAGCT 3,427416 0,000767

244: 1 ATGTGCACCTTTGAGGCTACGGGCTTCTCCAAAGACTTAGGAATCT -2,69533 0,003868

245: 1 ATGTGGCCATTACCGTCATTGGCCTGTGAAGCATTGGACATTTATA 1,572459 0,10227

246: 1 GGCCTGTGAAAACAGAGGCTTTTGCATTGTCTCTTGACATCAGAAGT -1,55073 0,126022

247: 1 AGCCAAGGCAGGGTGGACAGTGTGAGAGAGCTAGTGTAAGCTGT -4,58277 3,08E-05

248: 1 ACATGGTTGTGCAGGGCCATGTGTGAAGACAGCATGAGTCTTA -1,37266 0,163501

249: 1 TGATGTTGGTTGTAATGGTTGGGTTTAGGATGAACCATTTTAAGGAT -3,34973 0,000692

250: 1 GTCCCAAAGGTGGAATACAACCAGAGGTCTCATCTCTGAACTTTCTT -0,7171 0,473628

251: 1 GGCGTCTACAGAGACCAGCCATATGGCAGATACTGATTGTACTGTCT 3,48851 0,000532

252: 1 TGTTTGCCTCAAACGCTGTGTTTAAACAACGTTAAACTCTTAGCCT 0,57799 0,564212

253: 1 TGCCAAAAATAAACTCACATGAGCACATGACAGTCTGAGCTCTATAATCA 0,417675 0,679323

254: 1 GTGCATGGACGACTGAACACAATCAACTGTGAGGAAGGAGATAAACT -0,49188 0,625569

255: 1 CCTTGCCACGGTTCTAGAGCAGCGTAGACAGCTGGTAAACTGAAGA -1,4853 0,140016

256: 1 CATCGAGAGCGCACACAAGACGCCACTGTAAAAGGATCACAGAT -2,23853 0,021028

257: 1 GGAGTTCCAGGAGATTCAACCAGGATGTTTCTACACCTGTGGGTTA -2,6129 0,009463

258: 1 CAGCCACCATCAAAGCCCATTCGTAGGAAATTCAGACCAGAAAAC -2,13238 0,039635

259: 1 TTTGGAAGGCATTGAAGCTTGCACCTTTTCATGTACAGCATTAAAA 2,984702 0,00337

260: 1 GACCAGGTCTATCAGCCCCTCCGAGATCGAGATGATGCTCAGTAC 0,012992 0,989634

261: 1 ATCCAACACAGCCAGAACCCGCGATTCTACCACAAGTGACCATC -2,02092 0,048641

262: 1 TTGCCTGGAGAAAGAGAAGAAAATATTTTTTAAAAAGCTAGTTTATTTAGC -0,31184 0,755184

263: 1 TCACCCCTGACACAACATTTTCAGAATTCCAGACGATACTGTGATAA 0,561867 0,577848

264: 1 ACGGAAACAGACCCCTGCTTTCGAATTTACATGTTCATGATGTGC -3,07043 0,001314

265: 1 CTTCGCCCCTCCCTTGTTTTATATTTTATGAAGTTAGTGCGGG -0,71287 0,476918

266: 1 ACCAACCAATACTCAGGAGAACCCTGCCTATGAGGAATATATAAGACCA -3,58227 0,000386

267: 1 TGTTTGGAAAATCACATCATGCCTAGAATCTGAAATTGAATTAGCAA 1,822415 0,059401

268: 1 GCCAAGAGAATGAGAGAAAGATGCTGCATTTTATAATCAAAGCCCAAAC 3,532588 0,000225

269: 1 CGTTACAGTATTCTGATTATATTACTGACACAGTCMAATGATTAACTGTACAA 2,897694 0,007766

270: 1 TTGTGCCTGTGTGTTACCATGCTAAGAATGTCTTTGTTTAAAGGGAA -1,30273 0,21043

271: 1 GCAACAGCAAGCTGTAGAGCGGGCCAATGATAAATCACATTGAATC 2,236428 0,023294

272: 1 AAGCCAAAGGAACTGGAGGCACTGATTTAATGAATTTCCTGAAGA 0,742825 0,459843

273: 1 TTTCCTCTTGATGGGGAACTCCTGCTTCTCCTTGCCTCGAAAT -3,54509 0,000263

274: 1 CCAGGTACAATGGCAGAGCCTTTCCATACCTGTACTCACAACTAGC -0,50817 0,617396

275: 1 TGGTCTTCTTGCATCGATGATCCAACAGCAACACCATTTTTAAATTA 2,61129 0,008828

276: 1 TGTCCCTTTGATACTTGTGCTCTGCTGAGAATGTACAGTTTGCATTAA 4,051892 5,82E-05

277: 1 GAGAGGCAGCATTGCACAGTGAAAGAATTCTGGATATCTCAGGAG 0,118343 0,905829

278: 1 TTGGATGAGATTAGGAGATCAGAGGCTGGACCTTCTCTTGATAATGC 3,212168 0,003088

279: 1 AATTGTTGACATTCATGTCTCTGAGTTACAAAAGTGCTAATTCACTACATGT 1,92036 0,050161

280: 1 GGGGAAATTCAAGCAGTGTTTCCTCAACCAGTCACATAGAACTCTG -0,78853 0,427972

281: 1 CTGTCCAGCCGCATGGAGGGCATGATGGCTTCCTACAC 2,265809 0,038306

282: 1 TGTCAATCTGTCCTCGGCTGCCCTTCTCATTTGTTGATGGGAC 2,656332 0,009243

283: 1 GGAGACTTTCACAAGTGGTTTCCATGGAGATAGAATGAAGCATTCTGT 0,674533 0,493893

284: 1 AGTAGTTTCTCCAAGTACTTTTGTGCTATCAATGAGTTCTTCTCAAAAAAT -2,07479 0,048611

285: 1 TTTCTTTGCTAAGCCTTGCATGCAAAATTTGAAATTTTAACATTGGC 0,55078 0,582445

286: 1 ACAAAACGAGTCCAGCGACGAGGAGAGCCTGAGAAAAGAGAGAG -1,49962 0,131713

287: 1 AAATGAGGGCCCGTAACAGAACCAGTGTGTGTATAACGAAAACCAT -1,4828 0,140027

288: 1 TCACCTCAGTCTCTAATTGGCTGTGAGTCAGTCTTTCATTTACATAGGGT 1,359493 0,181639

289: 1 CGTCCAGCCAAGAGCTCTTCATCTGCTACAAGAACATTTGAATCTT -0,00765 0,993894

290: 1 GATTGCAATGATGATGTCCAAGGTAAGCTATTAAAAGGCAGGTTACT 2,290805 0,021577

291: 1 CTTGCCAGCAGCAATCATTTGGGGAAGAATCTACAGTTGCTGAT 1,790334 0,066752

292: 1 TTCCTTTGGGAGAAACCTGTTCATTCCAATCTTCTAATTACAGTGGTT -2,87514 0,002884

293: 1 CAGGACATCATGAGCAGGCAGCAGGGAGAGAGCAACCAAGAG 2,201609 0,048986

294: 1 ACTCGGATTCTTTTGCATGATGGGGTAAAGCTTAGCAGAGAATCATG -4,84228 2,84E-06

295: 1 GACGTGAAGTCTCGGGCAAAGCGTTATGAGAAGCTGGACTTCCT 1,175155 0,244078

296: 1 CCTCTGTGTTCACTTCGCCTTGCTCTTGAAAGTGCAGTATTTTTCT 1,150612 0,26183

297: 1 TCAGGTGTCATCACTGTTCAAAAGGTAAGCACATTTAGAATTTTGTTCTT 0,963905 0,33534

298: 1 CCCTTACCCCTCTCTGGGCCCATGAATTCCTGGCTTGGTTTA -3,09019 0,003466

299: 1 GGGAAAACATCCATGCTGGACTCCTGAAGAAGTTAAATGAACTGGA 0,235534 0,813451

300: 1 CTCCACCAGAAGGGCACACTTTCATCTAATTTGGGGTATCACTGAG -1,26117 0,216194

301: 1 TTCTCTCAAAATACTAAACAGAGGTGGTTTTATTGATAAGATTTTGGCTGT -0,63027 0,53117

302: 1 GCATGCTGTTGTACATGATCCTGACAAGAAGAAAATGAAGCTCAAAGT 2,105255 0,032858

303: 1 GTTCTCCCCTCTGGCCCCTGGAGAGAAGGGAGCATTCCTA 0,808842 0,416399

304: 1 TCTTGGTGGGTCAAGACTTTCTGATAAATCAGTTAGCACCATGCAT -0,87476 0,375354

305: 1 CTGGAATAATGGAAAGAAATGGGGGCTTTGGAGAACTAGGATGTTTC 3,031192 0,002176

306: 1 GCCCACATGGATAGCACAGTTGTCAGACAAGATTCCTTCAGATTC -2,85804 0,004514

307 1 CGCCTTCCTCTTTTTAAGCTGTTTTATGAAAAAGACCTAGAAGTTCTTG 3,505339 0,000639 308 1 CTCCAAGCCGATCACCAAGAGTAAATCAGAAGCAAACCTCATC -3,8295 0,000169 309 1 AAAGTTGTGTAAGCGCCTGCGTTCTTCTGGGTTTGGCTAGATAG -0,09465 0,924545 310 1 ATGGACTGCTTTGCTGGATTGGCACTGAGCAACTTTAGGAAATGTC -1,62044 0,109697 311 1 TGATGAAATAACTTGGGGCGTTGAAGAGCTGTTTAATTTTAAATGCC 1,824359 0,047857 312 1 GCTCGCCCCTGTTTTTTGTAGAATGTCTTCATGCTTGACATACGTAC 1,700431 0,04944 313 1 CATAGGTGCCATCGTGGTTGAGACAAGTGCAAAAAATGCTATTAAT -0,74552 0,463916 314 1 TGTCTGTGTCAGACGTACAGCCAGACATGTTCTCTATTGGCATTTTT -1,1303 0,263264 315 1 CAGGCCTGGTGCTCAGTCGTACGACCTGTACCTCTCAACTTTTG 0,790296 0,40455 316 1 AACTCCTGCGATCAGCTTGTGACTTACAAACCTTGTTTAAAAGCTG 2,767204 0,006542 317 1 TCAGTGAGAGACTCCAGGACTTTGACAAAAGCAAGCATGTCATCTATG 2,720559 0,00547 318 1 AGCCACTTGCCCCAGTTCATAACCCCATTAGTGTCTAAGAAGATTTC -0,77976 0,423543 319 1 CACCAGGGACACATTTCTCTGTCTTTTTTGATCAGTGTCCTATACATC 0,388028 0,695317 320 1 GTCAGCTTGCCCAGGTTCAAACTGGAAGAGAGTTACACTCTCAACTC -3,24347 0,001134 321 1 TGATACCCACCGGGTCTGACATTCCAAGTAACCAGTATGTAACTGG 2,310635 0,02143 322 1 TTGTGCAGATAGTATTTCTGATTGATGTCATCTATCAAGAATTTCAAGAGATT -0,97212 0,33353 323 1 AAGACTGTCAGGAAGGGTCGGAGTCTGTAAAACCAGCATACAGTTT 2,012969 0,039001 324 1 AATGGGCATAAAGCTTCACACTAGTAACAAAAATGGCTTAACTTTATTACA -0,43582 0,664998 325 1 TCACATCAGGGCAAATGAAATATCCATCAACTCCAGCATTTATCATT 2,686802 0,005053 326 1 TGCCTTTTTGCCTTTGGTAACATAACTCTGGGAGTCTTGGTTTAT -2,86852 0,003159 327 1 CCACTGGTCATGCTGTGGAAAATTTAATGAGAAATCTGAATGCAGAT -2,15718 0,038994 328 1 CATTCCGCTCAAAGGTCACTGAGACTTTTGCCTCACCTAAAGAGA 1,771767 0,077694 329 1 TGAGGAAATCAAAGTGCTATTACGAAGTTCAAGATCAAAAAGGCTTATAA 1,823273 0,066945 330 1 GCTTTGGGGAGGACAAAACTTGTAAGTACAGTCAAGGACAAGACTTG 3,022171 0,002277 331 1 ACGTTCCAGGGCCCAAAGCCCAGCTCTTTGTTCAGTTGACTTA 3,641037 0,000299 332 1 TGGCCAAATTAGATGTGTGCTGAAGACAATCAGTCACTGGGTCTATA 0,779861 0,438386 333 1 TGGCTTGTCATTCTGTACACTGACCTTAGGCATGGAGAAAATTACTTG 1,77954 0,072713 334 1 TCATGAATTTTTTAATCCCATTGCAAACATTATTCCAAGAGATCCCAG 0,918826 0,36453 335 1 CCCCGTCTCCCTCCCAACTTATACGACCTGATTTCCTTAGGA -2,18861 0,026936 336 1 CCACACAGCCAAGCTGAGACTGTGGCAATGTGTTGAGTCATATACATT 1,12796 0,260712 337 1 ATTACCTCAGTCCCCGAGGACAGTTTTGAAGGACTTGTTCAGTTAC 1,485189 0,158865

Métodos de ensayo

5 Para determinar los niveles de expresión (aumentados o disminuidos) de genes (secuencias expresadas) en la práctica de la divulgación, se puede utilizar cualquier método conocido en la técnica. En algunas realizaciones, se utiliza la expresión basada en la detección de ARN que se hibrida con los genes (o secuencias de sonda) identificadas y desveladas en el presente documento. Esto se lleva a cabo fácilmente por cualquier método de detección de ARN o de amplificación + detección que se conozca o que se reconozca como equivalente en la

10 técnica tal como, pero sin limitarse a estos, PCR de transcripción inversa (RT-PCR), PCR en tiempo real, RT-PCR en tiempo real, los métodos desvelados en la Solicitud de Patente de EE. UU. 10/062.857 (presentada el 25 de octubre de 2001) así como en las Solicitudes Provisionales de Patente de EE. UU. 60/298.847 (presentada el 15 de junio de 2001) y 60/257.801 (presentada el 22 de diciembre de 2000), y métodos para detectar la presencia, o ausencia, de secuencias estabilizadoras o desestabilizadoras de ARN.

15 De manera alternativa, se puede utilizar la expresión basada en la detección del estado del ADN. La detección del ADN de un gen identificado como metilado o eliminado se puede utilizar para los genes que tienen una disminución de la expresión en correlación con un resultado particular del cáncer de próstata, o tras la prostatectomía. Esto se puede llevar a cabo fácilmente por métodos basados en PCR que se conocen en la técnica, incluyendo, pero sin

20 limitarse a, Q-PCR. Por el contrario, la detección del ADN de un gen identificado como amplificado se puede utilizar para los genes que tienen un aumento de la expresión en correlación con un resultado particular del cáncer de próstata, o tras la prostatectomía. Esto se puede llevar a cabo fácilmente por los métodos basados en la PCR, hibridación in situ fluorescente (FISH) e hibridación in situ cromosómica (CISH) que se conocen en la técnica.

25 También se puede utilizar la expresión basada en la detección de una presencia, aumento, o disminución de los niveles o la actividad de proteínas. La detección se puede llevar a cabo por cualquier método basado en inmunohistoquímica (IHC), basado en la sangre (especialmente para las proteínas segregadas), basado en anticuerpos (incluyendo autoanticuerpos contra la proteína), basado en células exfoliadas (del cáncer), basado en espectrometría de masas, y basado en imágenes (incluyendo el uso de ligandos marcados) que se conocen en la

técnica y se reconocen apropiados para la detección de la proteína. Los métodos basados en imágenes y en anticuerpos son útiles además para la localización de tumores tras la determinación de cáncer por el uso de células que se obtienen por un procedimiento no invasivo (tal como el lavado o aspiración con aguja), donde la fuente de células cancerosas no se conoce. Un anticuerpo o ligando marcado se puede utilizar para localizar el carcinoma(s)

5 en un paciente.

Una realización que utiliza ensayo basado en ácido nucleico para determinar la expresión lo hace por inmovilización de una o más secuencias de los genes identificados en el presente documento como un polinucleótido en un soporte sólido, incluyendo, pero sin limitarse a estos, un sustrato sólido como una matriz o en perlas o tecnología basada en perlas como se conoce en la técnica. En algunas realizaciones, el ensayo es el ensayo DASL (Hibridación, Selección, extensión y unión mediadas por ADNc) disponible en Illumina. De manera alternativa, también se pueden utilizar los ensayos de expresión basados en una solución que se conocen en la técnica.

Las sondas de polinucleótidos inmovilizados pueden ser únicos o de otra manera específicos de los genes

15 desvelados (o secuencias expresadas) tal que los polinucleótidos son capaces de hibridarse con un ADN o ARN correspondiente a los genes (o secuencias expresadas). Estos polinucleótidos pueden ser de la longitud completa de los genes (o secuencias expresadas) o ser sondas de longitud más corta (hasta un nucleótido más cortas que la secuencia de longitud completa conocida en la técnica por eliminación a partir del extremo 5’ o 3’ de la secuencia) que opcionalmente se interrumpen mínimamente (tal como por no coincidencias o por pares de bases insertadas no complementarias) de forma que la hibridación con su ADN o ARN similar correspondiente a los genes (o secuencias expresadas) no está afectada. En muchas realizaciones, una sonda de polinucleótidos contiene una secuencia del extremo 3’ de un gen desvelado o secuencia expresada. Las sondas de polinucleótidos que contienen mutaciones respecto a las secuencias de los genes desvelados se pueden utilizar también siempre que la presencia de mutaciones siga permitiendo la hibridación para producir una señal detectable.

25 Los polinucleótidos inmovilizados se pueden utilizar para determinar el estado de muestras de ácido nucleico preparadas a partir de muestras de células prostáticas para las que no se conoce el resultado del sujeto de la muestra (por ejemplo, el paciente del que se ha obtenido la muestra) o para la confirmación de un resultado que ya se ha asignado a la muestra del sujeto. Sin limitar la divulgación, tal célula puede ser de un paciente con cáncer de próstata, tal como el material extraído por prostatectomía. El polinucleótido(s) inmovilizado solo necesita ser suficiente para hibridarse específicamente con las moléculas de ácido nucleico correspondientes que se derivan de la muestra bajo condiciones adecuadas. Aunque la expresión de incluso un solo gen que se correlaciona puede ser capaz de proporcionar una precisión adecuada para discriminar entre dos resultados del cáncer de próstata, la divulgación incluye el uso de niveles de expresión de más de un gen o secuencia expresada.

35 Por lo tanto, la divulgación incluye el uso de seis o más, siete o más, ocho o más, nueve o más, diez o más, u once

o más genes o secuencia expresadas desvelados en el presente documento para discriminar entre resultados. Adicionalmente, se pueden ensayar los niveles de expresión de 12 o más, 14 o más, 16 o más, 18 o más, 20 o más, 22 o más, 24 o más, 26 o más, 28 o más, 30 o más, 32 o más, 34 o más, 36 o más, 38 o más, 40 o más, 45 o más, 50 o más, 55 o más, 60 o más, 62 o más, 65 o más, 70 o más, 75 o más, 80 o más, 90 o más, o 92 o más genes o secuencias expresadas y utilizarse en un método desvelado. El curso de realizaciones adicionales incluye la utilización de 100 o más, 150 o más, 200 o más, 250 o más, 300 o más, hasta los 337 de cada uno de la Tabla 1 y la Figura 14, o el total de 362 genes (o secuencias expresadas) que se desvelan en el presente documento.

45 En algunas realizaciones, se utilizan los genes (secuencias expresadas) del grupo de 62, o el grupo de 92. En otras realizaciones, los genes (o secuencias expresadas) que se utilizan son del grupo de 337 de la Tabla 1 y la Figura 14,

o son una combinación de genes de entre los de la Tabla 3 y la Figura 15. En muchos casos, la combinación o grupo de genes (o secuencias expresadas) que se utiliza incluyen del Gen Nº 1 (FEV) o una secuencia expresada que se hibrida con la SEC ID Nº 1. En más realizaciones, una combinación incluye uno o más genes o secuencias expresadas que se expresan con valor p de correlación < 0,0001.

De manera alternativa, una combinación incluye genes o secuencias expresadas con una alta frecuencia de presentación como se desvela en el presente documento. Ejemplos no limitantes de tales genes o secuencias expresadas con una frecuencia de más de 400, más de 350, más de 300, más de 250, más de 200, más de 150, o

55 más de 100 como se describe en el presente documento. Pero se pueden utilizar también el curso de combinaciones de uno o más genes (o secuencias) con una frecuencia más alta con uno o más genes (o secuencias) con una frecuencia más baja.

En realizaciones en las que se van a analizar solo dos o pocos genes, el ácido nucleico derivado de la muestra de células de cáncer de próstata se pueden preferentemente amplificar por el uso de cebadores apropiados (tal como los que se usan en la PCR) tal que solo los genes que se van a analizar se amplifican para reducir las señales de fondo contaminantes de otros genes o secuencias expresados en la muestra. El tamaño de un amplicón de PCR de la divulgación puede ser de cualquier tamaño, incluyendo al menos o aproximadamente 50, al menos o aproximadamente 100, al menos o aproximadamente 150, al menos o aproximadamente 200, al menos o

65 aproximadamente 250, al menos o aproximadamente 300, al menos o aproximadamente 350,al menos o aproximadamente 400 nucleótidos consecutivos, con la inclusión de la porción complementaria de los cebadores de

PCR que se utilizan. El curso de la PCR puede opcionalmente ser una PCR acoplada a transcripción inversa (o RT-PCR en el caso de material de inicio de ARN) o PCR cuantitativa, tal como PCR en tiempo real, o combinaciones de las mismas. Naturalmente, el ARN de las muestras descritas en el presente documento se pueden preparar y utilizar por medios fácilmente conocidos por un experto.

5 De manera alternativa, y cuando se van a analizar múltiples genes o cuando se utilizan muy pocas células (o una célula), el ácido nucleico de la muestra se puede amplificar globalmente antes de la hibridación con las sondas de polinucleótidos inmovilizados, tal como en una matriz o micromatriz. Naturalmente, se puede utilizar ARN, o el ADNc equivalente del mismo puede marcarse y usarse directamente, sin amplificarse, por métodos conocidos en la

10 técnica.

La divulgación proporciona un grupo de criterios más objetivos, en forma de perfiles de expresión de un grupo de genes distinto, para discriminar (o delimitar) entre resultados de cáncer de próstata, o tras la prostatectomía. En algunas realizaciones, los ensayos se utilizan para discriminar entre resultados mejores y peores en los 10, o

15 aproximadamente 10 años tras la intervención quirúrgica para eliminar los tumores de cáncer de próstata. También se pueden realizar las comparaciones que discriminan entre resultados tras aproximadamente 10, aproximadamente 20, aproximadamente 30, aproximadamente 40, aproximadamente 50, aproximadamente 60, aproximadamente 70, aproximadamente 80, aproximadamente 90, o aproximadamente 100 meses.

20 Aunque los resultados mejores o peores de recurrencia del cáncer, metástasis y/o supervivencia se pueden definir relativamente comparando unos con otros, se puede apreciar un resultado “mejor” como el que tiene mejor oportunidad que el 50% de recurrencia y/o que una oportunidad del 50% de supervivencia después de aproximadamente 60 meses tras la intervención quirúrgica para eliminar el tumor del cáncer de próstata. Un resultado “mejor” también puede ser mejor que aproximadamente el 60%, aproximadamente el 70%,

25 aproximadamente el 80% o aproximadamente el 90% de oportunidad que la recurrencia del cáncer y/o la supervivencia aproximadamente 60 meses tras la intervención quirúrgica. Un resultado “peor” se puede apreciar como un 50% o más oportunidad de recurrencia del cáncer y/o menos del 50% de oportunidad de supervivencia después de aproximadamente 60 meses tras la intervención quirúrgica para eliminar el tumor(es) del cáncer de próstata.

30 Los métodos desvelados también se pueden utilizar como material de tejido sólido. Por ejemplo, se puede recolectar una biopsia sólida para visualización para después por determinación de la expresión de dos o más genes o secuencias expresadas identificadas en el presente documento determinar el resultado del cáncer de próstata, o tras la prostatectomía. Uno de los medios es por el uso de hibridación in situ con sondas de identificación de

35 polinucleótidos o proteínas para ensayar la expresión de dicho gen(es).

En algunas realizaciones, la detección de la expresión genética de las muestras se puede hacer utilizando una micromatriz simple capaz de ensayar la expresión genética de algunos de todos los genes divulgados en el presente documento por conveniencia y precisión.

Realizaciones adicionales

Otros usos de la divulgación incluyen producir la capacidad de identificar las muestras de células de cáncer de próstata como que están correlacionados con un resultado particular de supervivencia del cáncer o recurrencia para

45 posterior investigación o estudio. Esto proporciona una ventaja particular en muchos contextos que requieren la identificación de células basados en un objetivo genético o criterios moleculares.

Los materiales para el uso en los métodos de la presente divulgación idealmente son adecuados para la preparación de kits producidos de acuerdo con los procedimientos bien conocidos. La divulgación proporciona por lo tanto kits 50 que comprenden agentes para la detección de la expresión de los genes desvelados y las secuencias para identificar los resultados de cáncer de próstata, o tras la prostatectomía. Tales kits comprenden opcionalmente el agente con la provisión de una descripción identificativa o etiqueta o instrucciones relativas a su uso en los métodos de la presente divulgación. Tal kit puede comprender envases, cada uno con uno o más de los distintos reactivos (típicamente en forma concentrada) que se utilizan en los métodos, incluyendo por ejemplo, micromatrices

55 prefabricadas, tampones, nucleótidos trifosfato adecuados (por ejemplo, dATP, dCTP, dGTP y dTTP; o rATP, rCTP, rGTP y UTP), transcriptasa inversa, ADN polimerasa, ARN polimerasa, y uno o más complejos de cebadores de la presente divulgación (por ejemplo, poli(T) de longitud apropiada o cebadores aleatorios unidos a un reactivo promotor con la ARN polimerasa). Se incluirá también típicamente un conjunto de instrucciones.

60 Los métodos proporcionados por la divulgación también se pueden automatizar en todo o en parte. Todos los aspectos de la divulgación se pueden practicar tal que consistan esencialmente en un subgrupo de los genes desvelados para la exclusión de material irrelevante para la identificación de los resultados de recurrencia del cáncer, metástasis, y/o supervivencia por medio de una muestra que contienen células.

Una vez que se ha proporcionado la divulgación en general, la misma se entenderá más fácilmente en referencia a los siguientes ejemplos que se proporcionan a modo de ilustración, y que no pretenden ser limitantes de la divulgación, a menos de que se especifique.

5 Ejemplos

Ejemplo I: Recolección de especímenes clínicos y parámetros clinicopatológicos.

Se utilizaron muestras de próstata con el PSA y otros datos del resultado de pacientes de prostatectomía radical en

10 1993-1995 para descubrir los grupos de genes (secuencias expresadas), cuyos niveles de expresión se correlacionan con el resultado clínico del cáncer de próstata, o tras prostatectomía. Se utilizaron otras muestras para ensayar o verificar la capacidad predictiva o pronóstica de los grupos de genes identificados.

Las características de los perfiles de los pacientes que corresponden a las muestras se muestran en la Tabla 2. 15

Tabla 2

Descripción del factor: Entrenamiento (n=124) Ensayo (n=67) Todos (n=191)

Edad Media Intervalo: 61,8 45-77 62,7 50-78 62,1 45-78

Puntuación de Gleason <=6 7 >=8: 42 (34%) 65 (52%) 17 (14%) 27 (40%) 32 (48%) 8 (12%) 69 (36%) 97 (51%) 25 (13%)

Estadio AJCC II III: 95 (77%) 29 (23%) 49 (73%) 18 (27%) 144 (75%) 47 (25%)

Margen quirúrgico positivo negativo: 51 (41%) 73 (59%) 26 (39%) 41 (61%) 77 (40%) 114 (60%)

Seguimiento BCF (años) Media Intervalo: 6,9 0,2-11,5 7,7 1,6-11,4 7,2 0,2-11,5

Acontecimiento BCF No Sí: 71 (57%) 53 (43%) 43 (64%) 24 (36%) 114 (60%) 77 (40%)

Seguimiento MFS (años) Media Intervalo Desconocido: 9 0,2-13,3 1 8,7 0,3-12,7 1 8,9 0,2-13,3 2

Acontecimiento Metástasis No Sí Desconocido: 112 (91%) 11 (9%) 1 62 (94%) 4 (6%) 1 174 (92%) 15 (8%) 2

PSA Pre-op Media Intervalo Desconocido: 8,4 1,1-37,2 49 8,9 1,7-31,8 20 8,6 1,1-37,2 69

La metodología para utilizar las muestras del paciente para esta identificación se ilustra esquemáticamente en la

20 Figura 1. En resumen, se seleccionaron las muestras de 191 pacientes de un grupo inicial de 210. Se dividieron los 191 en un grupo de tratamiento (124 muestras) y un grupo de ensayo (67 muestras), en donde el primero se utilizó para identificar grupos de genes por medio del algoritmo de Random Forest™. Los resultados representativos con 500 ejecuciones (grupos de genes) que se obtuvieron por el uso del algoritmo se muestran en la Figura 2 como un gráfico del número de genes (secuencias expresadas) en un grupo frente al log de valores de P sin ajustar

25 (equivalente al ensayo del intervalo log). La Figura 2 muestra la actuación de estos 500 grupos, que contienen varios números de genes (secuencias expresadas) y su capacidad para clasificar muestras con precisión (y por tanto los pacientes) como de alto o bajo riesgo de recurrencia del cáncer y/o metástasis con significación como se indica por los valores de P sin ajustar. Los genes (secuencias expresadas) en los 500 grupos reflejan moléculas de ácido nucleico únicas (no duplicadas) que se resumen en la Tabla 1 anterior y en la Figura 14 del presente documento.

30 Se revisaron siete grupos de 34 genes generados por el algoritmo y se encontró que reflejaban 62 moléculas no duplicadas que se identifican en la Tabla 1 anterior (véase la columna “grupo de 62” en la misma, que se puede

referenciar con la Figura 14 por medio del Gen Nº de la tabla 14 (en comparación con la SEC ID Nº) y la frecuencia en que ocurría entre las 337 entradas. Los niveles de expresión de estos 62 genes (secuencias expresadas) se tratan en el presente documento como ejemplo no limitante, y representativo de grupos de genes, incluyendo los grupos adicionales que ese muestran en la Figura 2 y como se desvelan en el presente documento. Se utilizaron los

5 niveles de expresión de los 62 genes en las muestras de células de cáncer de próstata como índice de riesgo (predicción) del resultado ene l grupo de ensayo como se ilustra en la Figura 1.

Ejemplo II: Identificación de subtipos con diferentes resultados en el paciente.

Se utilizó una selección genética con un grupo de entrenamiento de124 muestras para identificar genes que predecían resultados. Véase la Figura 1 y la Tabla 2. Los genes identificados se utilizaron entonces para predecir los resultados en un grupo de ensayo de 67 muestras procesadas por aislamiento de las células cancerosa (véanse las Figuras 3A y 3B). Los resultados previstos se compararon con los resultados documentados de pacientes de los que se habían obtenido las muestras.

15 Como un ejemplo representativo, las sondas de oligonucleótido específicas del gen se inmovilizan, tal como sobre una micromatriz y luego se hibridan con una muestra de ARN marcada con Cy5 y ARN Cy3 de referencia en una reacción de co-hibridación a 65 ºC en 1x de tampón de hibridación. El marcador inmovilizado se lava a 37 ºC con 0,1 x SSC/0,005% Triton X-102. Se lleva a cabo un análisis por imagen utilizando un software de análisis por imagen. Las relaciones Cy5/Cy3 en bruto se normalizan utilizando una regresión no lineal dependiente de la intensidad.

Las relaciones Cy5/Cy3 normalizadas de todas las muestras son medias (o media) centradas para cada gen. El ensayo de identificación y permutación de la significación de la expresión genética diferencial se lleva a cabo utilizando un software adecuado, tal como el análisis de regresión de Cox y Random Forest™. La supervivencia libre

25 de enfermedad se calcula a partir de los datos de diagnóstico. Los acontecimientos se puntúan como la primera recurrencia o metástasis distantes. Las curvas de supervivencia se calcularon por estimaciones Kaplan-Meier y se compararon por ensayos de intervalos log.

Las Figuras 4-6 muestran la actuación de un Índice de Riesgo (o Puntuación de Riesgo) representativo utilizando el grupo de 62 genes desvelados como una combinación en comparación con factores conocidos utilizados para evaluar muestras y pacientes de cáncer de próstata. Los factores son el Grado de Gleason (o la puntuación de Gleason), el sistema de estadificación del AJCC para el cáncer de próstata, y niveles de PSA (antígeno sérico prostático) pre-operatorio (pre-intervención quirúrgica). Estas comparaciones muestran que un perfil de expresión genética de la divulgación se correlaciona con estos otros factores y por tanto se puede utilizar en combinación con

35 una cualquiera o más de estos factores o usarse para recapitular la información proporcionada por cada uno de estos factores.

Los niveles de expresión de los 62 genes (secuencias expresadas) también se encontró que eran capaces de segregar las 124 muestras del grupo de entrenamiento y las 67 muestras del grupo de ensayo en clasificaciones de riesgo “alto” y “bajo” (véase la Figura 7).

Ejemplo III: Identificación de los subtipos con diferentes grados de cáncer de próstata

En combinación con la Figura 7, la Figura 4 demuestra que una Puntuación de Riesgo (o Índice de Riesgo) en las

45 subclases “alta” y “baja”, basadas en los niveles de expresión del grupo de 62 genes representativos, se pueden utilizar para clasificar muestras (así como pacientes) de manera consistente con el Grado de Gleason, en donde a mayor grado mayor es la probabilidad de una Puntuación de Riesgo por encima de un valor de cero, y mayor riesgo de un resultado peor. El valor cero representa la media y/o el valor medio de la puntuación a través de todas las muestras de cáncer de próstata del grupo. La clasificación de “alto riesgo” se basa en una Puntuación de Riesgo por encima de cero, y la clasificación de “bajo riesgo” se basa en valores por debajo de cero. Como resultado, la Puntuación de Riesgo (o Índice de Riesgo) se puede utilizar para clasificar muestras, y por tanto pacientes, con un Grado de Gleason de  6 o 7 (o incluso  8) en grupos de “alto” y “bajo” riesgo como se describe en el presente documento. Véase la Figura 8.

55 Esto demuestra que la Puntuación de Riesgo (o Índice de Riesgo) se puede utilizar para clasificar muestras, y por tanto pacientes, independientemente del uso del Grado de Gleason. De manera alternativa, los dos análisis se pueden utilizar juntos, opcionalmente en serie, tal como la determinación del Grado de Gleason seguida de la determinación de la Puntuación de Riesgo en las muestras (y por tanto en pacientes) con un grado de  6 o 7 (o incluso  8). El uso combinado es particularmente ventajoso para “incluir” los sujetos con alto riesgo en un tratamiento clínico posterior o apropiado, tal como quimioterapia o radiación o crioterapia como conoce un médico experto y para “descartar” los sujetos de bajo riesgo de forma que no se sometan innecesariamente a tratamientos con efectos secundarios no deseables.

Ejemplo IV: Identificación de subtipos con diferentes estadios de cáncer de próstata 65

En combinación con la Figura 7, la Figura 5 demuestra que una Puntuación de Riesgo (o Índice de Riesgo) en las subclases “alta” y “baja”, que se basa en los niveles de expresión del grupo de 62 genes representativo, se puede utilizar para clasificar muestras (y por tanto pacientes) de manera consistente con el estadio de cáncer de próstata de la AJCC, en el que el estadio III es más probable que se correlacione con una puntuación de Riesgo por encima 5 de un valor de cero, y está presente un riesgo mayor de un peor resultado. El valor de cero representa de nuevo la media y/o el valor medio de la puntuación a través de todas las muestras de cáncer de próstata en el grupo. El grupo de “alto riesgo” se basa de nuevo en una Puntuación de Riesgo por encima de cero, y el grupo de “bajo riesgo” se basa en valores por debajo de cero. Como resultado la Puntuación de Riesgo (o Índice de Riesgo) se puede utilizar para clasificar muestras, y por tanto pacientes, con estadio II o III de la clasificación del AJCC en grupos de riesgo

10 “alto” y “bajo” como se describe en el presente documento.

Esto demuestra que la Puntuación de Riesgo (o Índice de Riesgo) se puede utilizar para clasificar muestras, y por tanto pacientes, independientemente del uso de la evaluación del estadio del AJCC. De manera alternativa, los dos análisis se pueden utilizar juntos, opcionalmente, en serie, tal como la determinación del estadio AJCC seguido por

15 la determinación de la Puntuación de Riesgo en muestras (y por tanto pacientes) con estadio II o III de cáncer de próstata. El uso combinado es particularmente ventajoso para “incluir” sujetos con bajo riesgo de forma que se les evite razonablemente tratamientos con efectos secundarios indeseables. El uso combinado puede también alterar la clasificación de un paciente o sujeto como adecuado para mantenerse “espera vigilada”.

20 Ejemplo V: Combinación con análisis de PSA pre-operatorio

Aunque el análisis del Grado de Gleason y el estadio AJCC necesitan ambos el uso de muestras de células del cáncer de próstata, las coherencias de la Figura 6 entre la Puntuación de Riesgo (o Índice de Riesgo) en las subclases “alta” y “baja”, que se basa en los niveles de expresión del grupo de 62 genes representativos, indica que

25 un valor de PSA pre-operatorio debería considerarse en combinación con una Puntuación de Riesgo como se describe en el presente documento. La combinación puede ser en serie, tal como una determinación del valor del PSA pre-operatorio seguida por la determinación de la Puntuación de Riesgo en muestras (y por tanto en pacientes) con valores de PSA de 30 o más, 25 o más, 20 o más, 15 o más, 10 o más, o 5 o más.

30 Se utilizó el análisis de regresión de Cox para identificar 92 genes (o secuencias expresadas) cuyos niveles de expresión son capaces de clasificar las muestras que contienen células de cáncer de próstata como se ha descrito anteriormente. Sesenta y siete (67) de estos 92 genes (o secuencias expresadas) son comunes a los 337 genes (o secuencias expresadas) de la Figura 14 y la Tabla 1 (véase la columna “Cox92” de la Figura 14 o la Tabla 1, que se puede referenciar de forma cruzada una con otra por el Gen Nº. (frente a SEC ID Nº) y la frecuencia. Los veinticinco

35 (25) genes (o secuencias expresadas) restantes fuera de las 92 se enumeran en la Figura 15 y la Tabla 3 posterior, que se pueden referenciar de manera cruzada una con otra por el Gen Nº (en comparación con SEC ID Nº) así como los valores z y p.

Claims

REIVINDICACIONES

1. Un método para determinar el riesgo de recurrencia del cáncer de próstata en un sujeto, comprendiendo dicho método el ensayo de una muestra que comprende células de cáncer de próstata de dicho sujeto de los niveles de

5 expresión de seis o más genes seleccionados de entre los Genes Nos 1 a 362 de las Figuras 14 y 15, determinar, como un valor agregado, una suma de los niveles de expresión de dichos seis o más genes, y determinar el riesgo de recurrencia del cáncer de próstata en dicho sujeto basándose en dicho valor agregado, donde los niveles de expresión se correlacionan con un bajo riesgo de recurrencia del cáncer, o un alto riesgo de recurrencia del cáncer.
2. El método de la reivindicación 1 donde dicho método además comprende la selección de un tratamiento para un sujeto con la recurrencia determinada del cáncer.

15 3. El método de la reivindicación 1 o 2 donde dicho ensayo comprende la preparación del ARN de dicha muestra.
4.

El método de la reivindicación 3 donde dicho ARN se utiliza para la PCR.
5.

El método de la reivindicación 3 donde dicho ensayo comprende el uso de una matriz.
6.

El método de la reivindicación 1 o 2 donde dicha muestra se disecciona del tejido extraído durante la prostatectomía.
7. El método de la reivindicación 4 donde dicha PCR es RT-PCR, opcionalmente RT-PCR en tiempo real. 25
8.

El método de la reivindicación 1 o 2 o 3 o 4 o 5 o 6 o 7 donde dichos niveles de expresión se correlacionan con un valor de p < 0,0001.
9.

El método de la reivindicación 1 o 2 o 3 o 4 o 5 o 6 o 7 donde dicha muestra comprende células de cáncer de próstata aisladas.
10.

El método de la reivindicación 2 donde dicho tratamiento comprende quimioterapia o radioterapia.
11.

El método de la reivindicación 1 que comprende además

35 i) determinar el grado de cáncer de próstata en dicha muestra, ii) determinar el estadio de dicho cáncer de próstata en dicha muestra, o iii) ambos;

donde i), ii) o ambos i) y ii) se realizan opcionalmente antes de determinar el riesgo de recurrencia del cáncer de próstata en dicho sujeto.
12. El método de la reivindicación 11 donde la determinación del grado del cáncer de próstata comprende la determinación de una Puntuación de Gleason o el estadio del AJCC o

45 donde el método comprende la determinación del grado de cáncer de próstata por una puntuación de Gleason y se determina el estadio de cáncer de próstata de acuerdo con el estadio del AJCC para producir un análisis multivariado para determinar el riesgo de recurrencia del cáncer de próstata en dicho sujeto.
13.

El método de la reivindicación 1 que comprende además la determinación de los niveles del antígeno sérico prostático (PSA) en dicho sujeto, opcionalmente antes de una prostatectomía que se utiliza para proporcionar dicha muestra que comprende células de cáncer de próstata.
14.

El método de la reivindicación 1 donde se ensayan los niveles de expresión de 8 o más, 10 o más, 12 o más, 14

o más, 16 o más, 18 o más, 20 o más, 22 o más, 24 o más, 26 o más, 28 o más, 30 o más, 32 o más, 34 o más, 36 o 55 más, 38 o más, 40 o más , 45 o más, 50 o más, 55 o más, 60 o más, 65 o más, 70 o más, o 92 o más genes.
15.

El método de la reivindicación 1 donde dicho ensayo comprende la determinación del nivel de expresión del Gen Nº 1, opcionalmente por medio del uso de la SEC ID Nº 1 como una sonda.
16.

Un método para determinar el riesgo de desarrollar metástasis del cáncer de próstata en un sujeto, comprendiendo dicho método el ensayo de una muestra que comprende células de cáncer de próstata de dicho sujeto por los niveles de expresión de seis o más genes seleccionados de los Genes Nos 1 a 362 de las Figuras 14 y
15. la determinación, como un valor agregado, de una suma de los niveles de expresión de dichos seis o más genes, y

65 la determinación del riesgo de desarrollar metástasis del cáncer de próstata en dicho sujeto basándose en dicho valor agregado,

donde los niveles de expresión se correlacionan con un riesgo bajo de desarrollo de metástasis del cáncer de próstata, o un riesgo alto de desarrollar metástasis de cáncer de próstata.
17. El método de cualquier reivindicación precedente, donde la muestra comprende células de cáncer de próstata es una biopsia por aguja u otra biopsia.

Univariado

Grupo de entrenamiento Grupo de ensayo

Relación de riesgo

IC 95% Valor de p Relación de riesgo IC 95% Valor de p

Puntuación de riesgo (Bajo vs. Alto)

8,3 3,9-17,7 <0,0001 6,3 2,5-16,0 0,0001

Multivariado

Puntuación de riesgo (Bajo vs. Alto)

5,2 2,1-12,9 <0,0001 4,6 1,1-18,4 0,03

Grado Gleason: GS 7 vs. 6

1,7 0,59-4,89 0,32 2,1 0,50-8,62 0,32

Grado Gleason: GS 8 vs.6

1,7 0,49-6,14 0,4 5,4 0,73-39,8 0,098

Estadio AJCC

0,62 0,28-1,39 0,24 0,65 0,15-2,80 0,56

PSA Pre-op

1 0,97-1,08 0,32 1,1 1,0-1,14 0,05