ES2609412T3

ES2609412T3 - Sistema para detectar células anómalas empleando un análisis multidimensional

Info

Publication number: ES2609412T3
Application number: ES06735440.7T
Authority: ES
Inventors: Michael R. Loken; Sanjaya N. Joshi
Original assignee: Hematologics Inc
Current assignee: Hematologics Inc
Priority date: 2005-02-18
Filing date: 2006-02-17
Publication date: 2017-04-20
Anticipated expiration: 2026-02-17
Also published as: EP1859377B1; WO2006089190A2; US9880155B2; US20140221247A1; EP1859377A2; US8630833B2; US12046331B2; US20060263833A1; WO2006089190A3; US20250157584A1; US20180106787A1

Abstract

Un sistema de diagnóstico que comprende un medio para llevar a cabo un método de caracterización de un conjunto de ensayo de células biológicas, que comprende: a) cartografiar cada célula en el conjunto de ensayo de células biológicas a un punto correspondiente en un espacio n-dimensional, en el que n 5 >= 3 empleando un protocolo definido en el que al menos algunas de las n-dimensiones son datos de intensidad fluorescente de las células, y los puntos correspondientes forman un conjunto de ensayo de puntos; b) comparar el conjunto de ensayo de puntos con un conjunto definido de agrupaciones de células biológicas normales, es decir, un conjunto definido de agrupaciones normales, en el espacio n-dimensional, en el que cada agrupación en el conjunto definido de agrupaciones normales se corresponde con un nivel de maduración dentro de un linaje celular, y en el que, para el conjunto de agrupaciones normales, se define una línea centroide de referencia y un radio, y la línea centroide de referencia y el radio forman diversas conformaciones de agrupaciones, en el que la línea centroide de referencia para el conjunto de agrupaciones se basa en un conjunto de puntos de referencia, y en el que el radio es una función de una posición en la línea centroide de referencia, en el que la línea centroide de referencia y el radio se ajustan de una manera iterativa empleando al menos un análisis estadístico y la entrada de un usuario, en el que el ajuste incluye determinar una distancia desde un punto centroide identificado de cada agrupación y un punto más cercano en la línea centroide de referencia; c) determinar, para cada punto del conjunto de ensayo de puntos, basándose en la línea centroide de referencia y el radio determinados, si se encuentra fuera del conjunto definido de agrupaciones normales basándose en la comparación; y d) caracterizar el conjunto de ensayo de células biológicas basándose al menos en parte en una determinación de una cantidad de células anómalas en el conjunto de ensayo de células biológicas basándose en la determinación de la etapa c).

Description

5

10

15

20

25

30

35

40

45

50

DESCRIPCION

Sistema para detectar celulas anomalas empleando un analisis multidimensional Antecedentes de la invencion

Campo de la invencion

Esta invencion se dirige a un analisis multidimensional de caractensticas celulares medidas y, en particular, a un sistema, un metodo y un artmulo para detectar celulas anomalas en un conjunto de ensayo de celulas empleando un analisis multidimensional de caractensticas celulares medidas empleando la citometna de flujo.

Descripcion de la tecnica relacionada

Un metodo para caracterizar poblaciones de celulas heterogeneas es mediante la citometna de flujo, originariamente desarrollada por Herzenberg y colaboradores (Science, 1969, 166(906):747-749; J. Histochem. Cytochem., 1976. 24(1):284-291; Clin. Chem., 1973, 19(8):813-816; Ann. N.Y. Acad. of Sci., 1975, 254:163-171). Empleando esta tecnologfa, las celulas se marcan con anticuerpos conjugados a tintes. La citometna de flujo puede detectar habitualmente 3, 4 o mas marcadores inmunofluorescentes simultaneamente de una manera cuantitativa. Mediante la combinacion de multiples marcadores inmunofluorescentes con las propiedades de dispersion de luz de las celulas es posible distinguir no solo entre celulas de diferentes linajes, sino tambien entre celulas en diversos estadios de maduracion dentro de esos linajes. Esto se determina basandose en los patrones de expresion de antigenos exclusivo de la superficie celular (vease, por ejemplo, Loken M.R., et al., en Flow Cytometry in Hematology, Laerum O.D., Bjerksnes R. eds., Academic Press, Nueva York, pp. 31-42, 1992; Civin C.l., et al., en "Concise Reviews in Clinical and Experimental Hematology", Martin J. Murphy ed., AlphaMed Press, Dayton, OH, 1992, pp. 149-159). Las poblaciones identificadas mediante el citometro de flujo despues pueden aislarse empleando los componentes electronicos disponibles en el instrumento.

La citometna de flujo de multiples parametros se emplea en la actualidad para detectar una diversidad de leucemias. Sin embargo, las tecnicas actuales requieren que un profesional, concretamente alguien versado en la citometna de flujo y la hematopatologfa, tal como un medico, realice el analisis de los datos, que es un proceso muy largo. Es necesario un largo proceso de aprendizaje para educar al profesional para que distinga entre poblaciones celulares normales y anomalas. Ademas, cuando se emplea la citometna de flujo para controlar la respuesta de un paciente a una terapia, las tecnicas convencionales requieren el uso de paneles espedficos de paciente para detectar la enfermedad residual.

Por consiguiente, en la tecnica es necesaria una tecnologfa para mejorar la precision de la deteccion y para simplificar el analisis de los datos. La presente invencion puede satisfacer estas y otras necesidades.

Breve sumario de la invencion

Las realizaciones de la presente invencion son:

1. Un sistema de diagnostico que comprende un medio para llevar a cabo un metodo de caracterizacion de un conjunto de ensayo de celulas biologicas que comprende:

a) cartografiar cada celula en el conjunto de ensayo de celulas biologicas a un punto correspondiente en un espacio n-dimensional, en el que n > 3 empleando un protocolo definido en el que al menos algunas de las n-dimensiones son datos de intensidad fluorescente de las celulas, y los puntos correspondientes forman un conjunto de ensayo de puntos;

b) comparar el conjunto de ensayo de puntos con un conjunto definido de agrupaciones de celulas biologicas normales, es decir, un conjunto definido de agrupaciones normales, en el espacio n-dimensional, en el que cada agrupacion en el conjunto definido de agrupaciones normales se corresponde con un nivel de maduracion dentro de un linaje celular, y en el que, para el conjunto de agrupaciones normales, se define una lmea centroide de referencia y un radio, y la lmea centroide de referencia y el radio forman diversas conformaciones de agrupaciones, en el que la lmea centroide de referencia para el conjunto de agrupaciones se basa en un conjunto de puntos de referencia, y en el que el radio es una funcion de una posicion en la lmea centroide de referencia, en el que la lmea centroide de referencia y el radio se ajustan de una manera iterativa empleando al menos un analisis estadfstico y la entrada de un usuario, en el que el ajuste incluye determinar una distancia desde un punto centroide identificado de cada agrupacion y un punto mas cercano en la lmea centroide de referencia;

c) determinar, para cada punto del conjunto de ensayo de puntos, basandose en la lmea centroide de referencia y el radio determinados, si se encuentra fuera del conjunto definido de agrupaciones normales basandose en la comparacion; y

d) caracterizar el conjunto de ensayo de celulas biologicas basandose al menos en parte en una determinacion de una cantidad de celulas anomalas en el conjunto de ensayo de celulas biologicas basandose en la determinacion de la etapa c).

5

10

15

20

25

30

35

40

45

50

2. El sistema de diagnostico de la realizacion 1, en el que la lmea centroide de referencia para el conjunto de agrupaciones se basa en un conjunto de puntos de referencia y en los puntos centroides de las agrupaciones en el conjunto de agrupaciones normales.

3. El sistema de diagnostico de la realizacion 1, que es para diagnosticar el cancer y comprende, ademas de las etapas de la realizacion 1, las siguientes etapas:

exponer cada celula en un conjunto normal de celulas biologicas a una pluralidad de cuatro o mas reactivos empleado un primer protocolo;

medir una correspondiente pluralidad de intensidades de fluorescencia de cada celula en el conjunto normal de celulas biologicas empleando un segundo protocolo;

cartografiar cada celula en el conjunto normal de celulas biologicas a un punto correspondiente en un espacio n- dimensional, basandose al menos en parte en la pluralidad de intensidades de fluorescencia medidas en la celula en el conjunto normal de celulas biologicas, en el que los puntos correspondientes forman un conjunto normal de puntos, en el que la definicion de la lmea centroide de referencia y el radio para el conjunto de agrupaciones normales se basa en el cartografiado del conjunto normal de puntos en el espacio n-dimensional;

exponer cada celula en el conjunto de ensayo de celulas biologicas a la pluralidad de reactivos empleando el primer protocolo;

medir una correspondiente pluralidad de intensidades de fluorescencia de cada celula en el conjunto de ensayo de celulas biologicas empleando el segundo protocolo;

cartografiar cada celula en el conjunto de ensayo de celulas biologicas a un punto correspondiente en un espacio n- dimensional, basandose al menos en parte en la pluralidad de intensidades de fluorescencia medidas en la celula en el conjunto de ensayo de celulas biologicas, en el que los puntos correspondientes forman un conjunto de ensayo de puntos;

comparar el conjunto de ensayo de puntos con el conjunto de agrupaciones normales; y caracterizar y diagnosticar el conjunto de ensayo de celulas biologicas basandose en la comparacion.

4. El sistema de diagnostico de la realizacion 1, que comprende ademas la etapa de:

cartografiar cada celula en el conjunto normal de celulas biologicas a un punto correspondiente en un espacio n- dimensional utilizando el protocolo definido, en el que los puntos correspondientes forman un conjunto normal de puntos, en el que la definicion de la lmea centroide de referencia y el radio para el conjunto de agrupaciones normales en el espacio n-dimensional se basa en el cartografiado del conjunto normal de puntos en el espacio n- dimensional.

5. El sistema de diagnostico de la realizacion 1, que comprende ademas las etapas de:

representar el conjunto de ensayo en un diagrama de coordenadas cartesianas que comprende un primer eje que se corresponde con una maduracion de la celula dentro de un linaje celular, y un segundo eje que se corresponde con una frecuencia de aparicion; y

representar, en el diagrama de coordenadas cartesianas, el conjunto de agrupaciones normales en el espacio n- dimensional.

6. El sistema de diagnostico de cualquiera de las realizaciones anteriores para diagnosticar el cancer, en el que al menos una agrupacion en el conjunto de agrupaciones es un hiperelipsoide.

En una realizacion, un conjunto normal de celulas se caracteriza empleando la citometna de flujo. Se define un centroide y un radio para un conjunto de agrupaciones en un espacio n-dimensional que se corresponden con una maduracion normal para un linaje celular en el conjunto normal de celulas. Un conjunto de ensayo de celulas se caracteriza empleando la citometna de flujo, y la caracterizacion se compara con el conjunto de agrupaciones. Esta estrategia facilita la deteccion de niveles bajos de celulas tumorales basandose en sus diferencias fenotfpicas con respecto a sus homologos normales, segun se evalua mediante un analisis de los datos complejos procedentes de poblaciones normales y anomalas.

En un aspecto, el sistema de diagnostico comprende un medio para llevar a cabo un metodo que comprende exponer una celula a una pluralidad de cualquier numero de reactivos. Algunos instrumentos son capaces de producir nueve o mas colores. El uso de mas reactivos y colores facilita la caracterizacion de las celulas.

En otro aspecto, una realizacion de un sistema de diagnostico comprende: un controlador; una memoria; una interfase de datos; una interfase de control; y un motor grafico, en el que el sistema de diagnostico esta configurado para comparar un conjunto de ensayo de datos con un conjunto de agrupaciones normales en un espacio n-

5

10

15

20

25

30

35

40

45

dimensional definido por un centroide y un radio, y en el que una agrupacion en el conjunto de agrupaciones normales se corresponde con un nivel de maduracion normal dentro de un linaje celular.

En otro aspecto, una realizacion de un sistema para diagnosticar un conjunto de ensayo de celulas comprende: un medio para definir un conjunto de agrupaciones normales que se corresponden con un linaje celular normal; y un medio para comparar el conjunto de ensayo de celulas con el conjunto de agrupaciones normales.

Estos y otros aspectos de la presente invencion seran evidentes tras remitirse a la siguiente descripcion detallada y dibujos adjuntos.

Breve descripcion de los dibujos

La figura 1 es un diagrama de bloques funcional de un sistema que ejecuta una realizacion de un metodo para diagnosticar un conjunto de ensayo de celulas.

La figura 2 es un diagrama esquematico de una estructura de datos adecuada para almacenar datos relacionados con un conjunto de celulas biologicas.

La figura 3 es un diagrama esquematico de una estructura de datos adecuada para almacenar informacion relacionada con el procesamiento de los datos contenidos en la estructura de datos ilustrada en la figura 2.

Las figuras 4A a 9A y 4B a 9B son ilustraciones de los datos multidimensionales proyectados en presentaciones bidimensionales generadas por un sistema, tal como el sistema ilustrado en la figura 1.

Las figuras 10A y 10B son ilustraciones de los datos multidimensionales proyectados en presentaciones tridimensionales generadas por un sistema, tal como el sistema ilustrado en la figura 1.

Las figuras 11A y 11B ilustran un menu de una interfase grafica del usuario generada por un sistema, tal como el sistema ilustrado en la figura 1.

Las figuras 12A a 17A y 12B a 17B son ilustraciones de los datos multidimensionales proyectados en presentaciones pseudo-bidimensionales generadas por un sistema, tal como el sistema ilustrado en la figura 1.

Las figuras 18A a 18C son diagramas de flujo que ilustran la operacion de un sistema para definir un centroide y un radio normal para un conjunto de agrupaciones normales que se corresponden con un linaje celular normal.

La figura 19 es un diagrama de flujo que ilustra la operacion de un sistema para definir una lmea centroide para un conjunto de agrupaciones normales que se corresponden con un linaje celular normal.

Las figuras 20A y 20B son ilustraciones de los datos multidimensionales proyectados en presentaciones pseudo- tridimensionales generadas por un sistema, tal como el sistema ilustrado en la figura 1.

La figura 21 es un diagrama de flujo que ilustra la operacion de un sistema para definir una lmea centroide y un radio normal para un conjunto de agrupaciones normales que se corresponden con un linaje celular normal.

La figura 22 es un diagrama de flujo que ilustra la operacion de un sistema para determinar que puntos en el conjunto de ensayo de datos estan contenidos dentro de un conjunto de agrupaciones normales en un espacio n- dimensional.

Las figuras 23A y 23B son ilustraciones de los datos multidimensionales proyectados en presentaciones tridimensionales generadas por un sistema, tal como el sistema ilustrado en la figura 1.

La figura 24 es un diagrama de flujo que ilustra la operacion de un sistema para comparar un conjunto de ensayo de datos con puntos centroides definidos para un conjunto de agrupaciones normales.

La figura 25 es un diagrama esquematico de una estructura de datos adecuada para almacenar informacion para definir un centroide y un radio para un conjunto de agrupaciones normales en un espacio n-dimensional.

La figura 26 es una ilustracion de los datos multidimensionales proyectados en una presentacion bidimensional generada por un sistema, tal como el sistema ilustrado en la figura 1.

Descripcion detallada de la invencion

Los productos genicos pueden identificarse sobre la superficie celular o en el citoplasma de celulas empleando anticuerpos monoclonales espedficos. Puede emplearse la citometna de flujo para detectar multiples marcadores inmunofluorescentes simultaneamente de una manera cuantitativa. La tecnica de la tincion inmunofluorescente es muy conocida y puede realizarse segun cualquiera de una diversidad de protocolos, tales como los descritos en Current Protocols in Cytometry (John Wiley & Sons, NY, NY, eds. J. Paul Robinson, et al.). En general, una muestra biologica, tal como sangre periferica, medula osea, tejido de nodulo linfatico, sangre de cordon umbilical, tejido de timo, tejido de un sitio de infeccion, tejido de bazo, tejido tumoral y similares, se recoge de un sujeto y las celulas se

5

10

15

20

25

30

35

40

45

50

55

60

afslan de ella empleando tecnicas conocidas en la tecnica. En una realizacion, la muestra se recoge de un sujeto y los eritrocitos maduros se lisan empleando un tampon, tal como NH4Cl tamponado. El resto de los leucocitos se lavan y despues se incuban con anticuerpos (por ejemplo, anticuerpos monoclonales) conjugados con cualquiera de una diversidad de tintes (fluoroforos) conocidos en la tecnica (vease, por ejemplo, http colon barra doble www punto glenspectra punto co dot uk/glen/filters/fffluorpn punto htm o http colon barra doble cellscience punto bio-rad punto com/fluorescence/fluorophoradata punto htm). Los tintes representativos en este contexto incluyen, pero no se limitan a FITC (isotiocianato de fluorescema), R-ficoeritrina (PE), aloficocianina (APC), Cy7®, y rojo de Texas.

Una amplia diversidad de anticuerpos conocidos en la tecnica y anticuerpos espedficos generados empleando tecnicas muy conocidas en la tecnica son utiles en el contexto de las realizaciones descritas en la presente. En general, los anticuerpos para su uso en los metodos descritos en la presente son espedficos para un marcador celular de interes, tal como cualquiera de los marcadores de la superficie celular CD (vease, por ejemplo, el mdice de CD en http colon barra doble www punto ncbi punto nlm punto nih punto gov/PROW/guide/45277084 punto html; o Current Protocols in Immunology, John Wiley & Sons, NY, NY), citoquinas, protemas de adhesion, marcadores de la superficie celular del desarrollo, antigenos tumorales u otras protemas expresada por una poblacion celular de interes. Un anticuerpo espedfico para casi cualquier protema expresada por una celula es util en el contexto de la presente descripcion. Los anticuerpos ilustrativos incluyen, pero no se limitan a anticuerpos que se unen espedficamente a CD3, CD33, CD34, CD8, CD4, CD56, CD19, CD14, CD15, CD16, CD13, CD38, CD71, CD11b, HLA-DR, glicoforina, CD45, CD20, CD5, CD7, CD2, CD10 y TdT.

Despues de un periodo de incubacion con un anticuerpo conjugado con un tinte, generalmente durante aproximadamente 20 minutos en la oscuridad (los tiempos de incubacion y las condiciones pueden variar segun los protocolos concretos), los leucocitos se lavan con disolucion salina tamponada y se resuspenden en disolucion salina tamponada que contiene una protema para su introduccion en un citometro de flujo.

El citometro de flujo analiza la poblacion celular heterogenea celula a celula y puede clasificar las celulas basandose en la union del anticuerpo monoclonal inmunofluorescentes y las propiedades de dispersion de luz de cada celula (vease, por ejemplo, Immunol. Today, 2000, 21(8):383-390). La deteccion de la fluorescencia se realiza empleando tubos fotomultiplicadores; el numero de detectores (canales) determina el numero de parametros opticos que el instrumento puede examinar simultaneamente, mientras que los filtros de paso en banda aseguran que solo se recogen las longitudes de onda previstas. Asf, la citometna de flujo puede detectar habitualmente multiples marcadores inmunofluorescentes simultaneamente de una manera cuantitativa y puede medir otros parametros, tales como la dispersion de luz directa (que es una indicacion del tamano de la celula) y la dispersion de luz de angulo derecho (que es una indicacion de la granularidad de la celula). Por consiguiente, puede diferenciarse una amplia diversidad de poblaciones celulares y clasificarse empleando la inmunofluorescencia y la citometna de flujo.

Por ejemplo, combinando 4 colores de inmunofluorescencia con los parametros ffsicos de dispersion de luz directa (medicion del tamano de la celula) y dispersion de luz de angulo derecho (medicion de la granularidad de la celula), puede generarse un espacio de datos de seis dimensiones, en el que las poblaciones celulares espedficas que se encuentran en la sangre o la medula osea normales estan restringidas a pequenas porciones del espacio de datos. Tal como reconoceran los expertos en la tecnica despues de estudiar la memoria descriptiva, tambien pueden utilizarse mas o menos de 4 colores de marcadores inmunofluorescentes. La excitacion de los fluoroforos no se limita a la luz en el espectro visible; varios tintes, tales como la serie Indo (para medir el calcio intracelular) y la serie Hoechst (para analisis del ciclo celular) se excitan en la gama del ultravioleta. Asf, algunos de los instrumentos disponibles en la tecnica en la actualidad estan configurados con fuentes emisoras de ultravioleta, tal como Becton Dickinson LSR II de 10 colores y 4 laseres. Ademas, mediante el empleo de un clasificador celular activado por fluorescencia disponible en el mercado, tal como FACSVANTAGE™ (Becton Dickinson, San Jose, CA), el clasificador EPICS® ALTRA ™ (Beckman Coulter, Fullerton, CA) o el clasificador MOFLO® (DakoCytomation, Inc., Carpinteria, CA), las poblaciones celulares tambien pueden clasificarse en fracciones purificadas.

La expresion genica observada durante el desarrollo de las celulas sangumeas desde las celulas pluripotenciales hematopoyeticas hasta las celulas maduras que se encuentran en la sangre es un proceso muy regulado. Vease Civin C.l., Loken M.R., Cell Surface Antigens on Human Marrow Cells: Dissection of Hematopoietic Development Using Monoclonal Antibodies and Multiparameter Flow Cytometry, Int'l J. Cell Cloning, 5:1-16 (1987). Asf, de modo espedfico, esta expresion muy controlada de los genes se produce no solo dentro de diferentes linajes de celulas sangumeas, sino tambien durante diferentes estadios de maduracion dentro de esos linajes. Vease Loken, M.R., Terstappen L.W.M.M., Civin C.l., Fackler, M.J., Flow Cytometry Characterization of Erythroid, Lymphoid and Monomyeloid Lineages in Normal Human Bone Marrow, Flow Cytometry in Hematology, Laerum O.D., Bjerksnes R., eds., Academic Press, Nueva York, pp. 31-42 (1992). No solo estos productos genicos aparecen y/o desaparecen en estadios concretos de la maduracion, sino que la cantidad de estas glicoprotema se regula dentro de unos lfmites muy estrechos en celulas normales. Se ha demostrado que estas relaciones antigenicas se establecen en un estadio temprano del desarrollo fetal y que son constantes a lo largo de la vida adulta en celulas sangumeas que estan sufriendo un constante recambio y reposicion. Vease LeBein T.W., Wormann B., Villablanca J.G., Law C.L., Shah V.O., Loken M.R., Multiparameter Flow Cytometric Analysis of Human Fetal Bone Marrow B Cells, Leukemia, 4:354358 (1990). Estos patrones y relaciones de expresion genica durante la maduracion de las celulas normales se mantienen despues de una quimioterapia o incluso tras un transplante de medula osea. Vease Wells D.A., Sale

G.E., Shulman H.E., Myerson D., Bryant E., Gooley T., Loken M.R., Multidimensional Flow Cytometry of Marrow Can

5

10

15

20

25

30

35

40

45

50

55

Differentiate Leukemic Lymphoblasts From Normal Lymphoblasts and Myeloblasts Following Chemotherapy and/or Bone Marrow Transplant, Am. J. Clin. Path., 110:84-94 (1998). Por tanto, existe una regulacion fuertemente coordinada de multiples genes durante el desarrollo normal de las celulas sangumeas, tanto en terminos de temporizacion de la expresion, como en la regulacion de las cantidades de productos genicos expresados sobre las superficies celulares.

Una comparacion de la expresion normal de antfgenos con los procesos neoplasicos indica que la regulacion de la expresion genica esta alterada en celulas neoplasicas. Esta alteracion produce una relaciones antigenicas diferentes de las observadas durante la maduracion normal de las celulas. Vease Hurwitz, C.A., Loken M.R., Graham M.L., Karp J.E., Borowitz M.J., Pullen D.J., Civin C.l., Asynchronous Antigen Expression in B Lineage Acute Lymphoblastic Leukemia, Blood, 72:299-307 (1998). Estos no son antfgenos nuevos, sino que son los productos genicos normalmente expresados que han perdido la regulacion coordinada que se encuentra en las celulas normales. Tanto la leucemia linfoblastica aguda ("ALL") como la leucemia mieloblastica aguda ("AML") expresan antfgenos de forma anomala. Vease Terstappen L.W.M.M., Loken M.R., Myeloid Cell Differentiation in Normal Bone Marrow and Acute Myeloid Leukemia Assessed by Multi-Dimensional Flow Cytometry, Anal. Cell Path., 2:229-240 (1990).

Los tipos de anomalfas incluyen:

(1) Infidelidad de linaje, definida como la expresion de antfgenos que no pertenecen al linaje;

(2) Asincroma antigenica, por ejemplo, la expresion sobre celulas maduras de antfgenos que normalmente aparecen en celulas inmaduras;

(3) Ausencia antigenica; y

(4) Anomalfas cuantitativas.

Vease Terstappen L.W.M.M., Konemann S., Safford M., Loken M.R., Zurlutter K., Buchner Th., Hiddemann W., Wormann B., Flow Cytometric Characterization of Acute Myeloid Leukemia, Part II, Phenotypic Heterogeneity at Diagnosis, Leukemia, 6:70-80 (1991).

No solo son los fenotipos de las celulas leucemicas diferentes de las normales, sino tambien las relaciones entre los antfgenos son diferentes de un caso a otro, lo cual sugiere que cada transformacion leucemica provoca una perdida de la regulacion genica coordinada, que resulta en un patron fenotfpico exclusivo para cada leucemia. En 120 casos pediatricos de ALL y 86 casos de aMl en adultos, cada fenotipo detallado fue diferente del normal y diferente del resto de casos. Vease ld.; Hurwitz, supra. As^ la transformacion neoplasica afecta a la secuencia de ADN primaria (genotipo) y la regulacion de los genes normales, de modo que son expresados de modo inapropiado en el momento equivocado durante el desarrollo, son expresados en las cantidades equivocados y/o son expresados en un contexto con otros genes que no se observa en celulas normales (fenotipo). La perdida de la regulacion genica coordinada parece ser una caractenstica de la transformacion neoplasica que produce fenotipos anomalos, en los que cada clon leucemico es diferente del normal y es diferente de otras leucemias del mismo tipo.

Debe advertirse que las realizaciones no se limitan al analisis de las celulas leucemicas (por ejemplo, leucemias linfocfticas agudas y cronicas (ALL, CLL) y leucemia mielogena aguda y cronica (AML, CML)) y otras celulas neoplasicas hematopoyeticas y linfoides. Las realizaciones pueden aplicarse al analisis de cualquiera de una diversidad de malignidades, por ejemplo, linfoma, mieloma o premalignidades, tales como mielodisplasia y otros trastornos, que incluyen cualquiera de una diversidad de trastornos hematopoyeticos.

La citometna de flujo puede adoptarse para emplear esta diferencia fenotfpica desde la situacion normal para ayudar en el diagnostico de la leucemia, asf como para controlar la respuesta a la terapia. La citometna de flujo se ha empleado en hematopatologfa para fenotipificar los tumores, por ejemplo, para diferenciar la AML de la ALL. Sin embargo, las estrategias convencionales requieren que las celulas de interes formen una porcion predominante de las celulas totales examinadas y que el proceso de enfermedad esperado sea conocido antes de realizar el analisis, tal como cuando un examen morfologico identifica una poblacion de celulas leucemicas de un subtipo incierto. El enfoque en las celulas neoplasicas puede extenderse a la deteccion de una enfermedad residual. Sin embargo, las tecnicas de deteccion de enfermedades residuales convencionales que emplean la citometna de flujo requieren un panel de reactivos espedficos de paciente para identificar el fenotipo espedfico observado en el diagnostico. Vease Reading C.l., Estey E.H., Huh Y.O., Claxton D.F., Sanchez G., Terstappen L.W., O'Brien M.C., Baron S., Deisseroth A.B., Expression of Unusual lmmunophenotype Combinations in Acute Myelogenous Leukemia, Blood, 81:3083-3090 (1993). Estos paneles espedficos de paciente se han empleado para detectar ALL y AML residual hasta unos niveles de 0,03-0,05%. Vease Coustan-Smith E., Sancho J., Hancock M.L., Boyett J.M., Behm F.G., Raimondi S.C., Sandlund J.T., Rivera G.K., Rubnitz J.E., Ribeiro R.C., Pui C.H., Campana D., Clinical Importance of Minimal Residual Disease in Childhood Acute Lymphoplastic Leukemia, Blood, 96:2691-2696 (2001); San Miguel J.F., Vidriales M.B., Lopez-Berges C., Dfaz-Mediavilla J., Gutierrez N., Canizo C., Ramos F., Calmunitia M.J., Perez J., Gonzalez M., Orfao A., Early Immunophenotypical Evaluation of Minimal Residual Disease in Acute Myeloid Leukemia Identifies Different Patient Risk Groups and may Contribute to Postinduction Treatment Stratification, Blood, 98:1746-1751 (2002).

5

10

15

20

25

30

35

40

45

50

55

Sin embargo, la deteccion convencional de enfermedades residuales que emplean paneles de reactivos espedficos de paciente tiene las siguientes limitaciones:

1. Es necesario un especimen de diagnostico con un fenotipo aberrante para construir un panel. En 25% de los casos no puede identificarse un fenotipo aberrante. Vease Vidriales, supra.

2. El tiempo de procesamiento es sustancial, porque un tecnico debe examinar los analisis previos para el paciente concreto para determinar la combinacion de reactivos que se vaya a utilizar en cada caso.

3. El fenotipo de una poblacion de celulas leucemicas que sea diferente del fenotipo originariamente diagnosticado puede no ser detectado. Por ejemplo, el fenotipo puede cambiar desde el momento del diagnostico al de la recafda como resultado de una evolucion clonal o un brote de un subclon resistente a la quimioterapia minoritario. Vease San Miguel, supra.

4. Pueden pasarse por algo anomalfas inesperadas o no previstas, tales como una mielodisplasia secundaria o anomalfas en otros linajes.

La evaluacion de la enfermedad residual empleando paneles espedficos de paciente pueden tener una actuacion satisfactoria en un entorno controlado, tal como un estudio de investigacion en el que se puede acceder a todos los espedmenes secuenciales y exista una alta conformidad para obtener espedmenes en momentos espedficos en la terapia. Sin embargo, en la practica clmica, un laboratorio de citometna de flujo puede recibir el encargo de realizar un analisis de enfermedad residual, pero no fue en ese laboratorio en el que realizo el diagnostico inicial. A menudo no esta disponible un inmunofenotipo detallado o este esta incompleto.

La deteccion de la enfermedad residual tambien puede realizarse empleando paneles estandarizados y emplear las diferencias con respecto a la normalidad como el marcador espedfico de tumor. La expresion genica coordinada es tan precisa que una divergencia de media decada en la expresion del antfgeno es suficiente para la discriminacion entre celulas normales y neoplasicas aberrantes. En esta estrategia, se emplean paneles de reactivos espedficos para cada linaje sospechoso, por ejemplo, linaje B de ALL; linaje T de ALL; AML; linaje B de linfoma no hodgkiniano ("B-NHL"); y linaje T de NHL ("T-NHl"), asf como MDS y mieloma. Las poblaciones tumorales pueden ser identificadas identificando, en primer lugar, patrones esperados de celulas normales, y despues centrandose en las celulas que no se corresponden con los patrones esperados de celulas normales. Esta estrategia para detectar la enfermedad residual ha sido empleada por the Fred Hutchinson CancerResearch Center durante varios anos y ha tenido exito en la prediccion de resultados en neoplasmas hematopoyeticos. Por ejemplo:

1. En transplantes de celulas pluripotenciales hematopoyeticas para ALL, se ha demostrado que la citometna de flujo es mas sensible y mas espedfica que la morfologfa, la citogenetica o las dos tecnologfas combinadas para predecir la recafda para 120 pacientes. Vease Wells, D.A., supra.

2. En la AML pediatrica, la deteccion mediante citometna de flujo de la enfermedad residual fue el mejor predictor del resultado en 252 pacientes estudiados. Sievers, E. L., Lange, B. J., Alonzo, T. A., Gerbing, R. B., Bernstein, I. D., Smith, F. O., Arceci, R. J., Woods, W.G., Loken, M. R., Immunophenotypic evidence of leukemia after induction therapy predicts relapse: results from a prospective Children's Cancer Group study of 252 patients with acute myeloid leukemia, Blood, 101: 3398-3406 (2003). Los pacientes con un tumor detectable en cualquier momento durante la terapia presentaban una probabilidad 4 veces mayor de recafda y una probabilidad 3 veces mayor de morir que los pacientes en los que no se detecto ningun tumor.

3. En transplantes de celulas pluripotenciales hematopoyeticas, la citometna de flujo fue capaz de distinguir entre blastos en regeneracion y el tumor recurrente basandose en la expresion de antfgenos aberrantes. Vease Shulman

H., Wells D., Gooley T., Myerson D., Bryant E., Loken M., The biologic significance of rare peripheral blasts after hematopoietic cell transplant is predicted by multidimensional flow cytometry, Am. J. Clin. Path., 112:513-523 (1999). Los pacientes pueden mostrar 20% de blastos normales en la sangre o puede presentar hasta 50% de blastos en regeneracion en la medula osea sin deteccion de celulas neoplasicas.

La deteccion de fenotipos anomalos de pequenas poblaciones de celulas en la sangre o la medula osea extiende la utilidad de la citometna de flujo a otras aplicaciones mas alla de simplemente la fenotipificacion de leucemias. La citometna de flujo se ha empleado para demostrar que una proporcion significativa (10%) de pacientes con un diagnostico de mielodisplasia han recibido un diagnostico equivocado y tienen anomalfas linfoides y no mieloides. Vease Wells D.A., Hall M.C., Shulman H.E., Loken M.R., Occult B cell malignancies can be detected by three-color flow cytometry in patients with cytopenias, Leukemia, 12:2015-2023 (1998). La citometna de flujo tambien ha permitido el desarrollo de un sistema de puntuacion para estratificar pacientes con mielodisplasia basandose en el grado de anomalfas detectado entre las celulas mieloides en maduracion. Vease Wells, D., Benesch, M., Loken, M., Vallejo, C., Myerson, D., Leisenring, W., Deeg, H., Myeloid and monocytic dyspoiesis as determined by flow cytometric scoring in myelodysplastic syndrome correlates with the IPSS and with outcome after hematopoietic stem cell transplantation, Blood, 102: 394-403 (2003). Los pacientes con celulas mieloides que muestran mas aberraciones en la expresion genica, segun se evidencia por medio de un inmunofenotipo anomalo, tienen una mayor tasa de recafda y muerte tras un transplante con celulas pluripotenciales cuando se comparan con pacientes con menos anomalfas detectables. Tambien existe una alta correlacion con el sistema de puntuacion de prognostico

5

10

15

20

25

30

35

40

45

50

55

internacional (International Prognostic Scoring System, IPSS). Ademas, una puntuacion alta de citometna de flujo divide el grupo intermedio I de pacientes en el sistema IPSS en grupos estadfsticamente significativos basandose en la recafda tras un transplante de celulas pluripotenciales.

Existen varias ventajas en la deteccion de tumores basadas en la diferencia con respecto a la situacion normal.

1. La tecnica no requiere un especimen de diagnostico para la creacion de un panel espedfico.

2. La estrategia permite el procesamiento rapido de espedmenes en un laboratorio de alto volumen de trabajo, ya que se emplean paneles identicos para pacientes diferentes.

3. Los resultados no se ven afectados por un cambio en el fenotipo despues de la terapia.

4. La correcta seleccion del panel estandarizado permite la deteccion de descubrimientos inesperados o no previstos que son el resultado de anomalfas hematologicas.

La distincion convencional entre poblaciones de celulas normales y aberrantes tiene limitaciones significativas. El analisis de los datos debe ser realizado, de modo convencional, por un profesional (un medico versado en la citometna de flujo y en hematopatologfa) y no por un tecnico, puesto que diversas situaciones clmicas pueden indicar si las anomalfas observadas son normales o anomalas. Es necesario un largo proceso de aprendizaje para formar al profesional para que distinga entre poblaciones celulares normales y anomalas. Un hematopatologo bien formado puede tardar de 6 meses a un ano en aprender las tecnicas. En la actualidad, la evaluacion de una situacion normal frente a otra anomala por parte de un profesional se basa en la experiencia, con todas las dificultades inherentes de un analisis subjetivo, similares a la formacion en la microscopfa de diagnostico. Es diffcil extender el analisis a otros sitios y mantener la misma sensibilidad y especificidad. En los casos diffciles, dos o mas profesionales deben llegar a un consenso para el diagnostico final.

Por ejemplo, Weir, et al. describen un "molde" normal que resulta de un analisis de citometna de flujo de cuatro colores de precursores de celulas B normales con el que pueden compararse muestras de tumor. Vease Weir, E. G., et al., Leukemia (1999), 13:558-567. Sin embargo, a diferencia de la presente invencion, este molde es un conjunto espedfico y fijado de regiones geometricas trazadas alrededor de los acontecimientos de la grafica de puntos presentada, que despues se emplean como los lfmites de la normalidad. Tal como indican Weir, et al., los acontecimientos aislados de naturaleza incierta presentes en muestras normales que se encuentran fuera de los lfmites de la normalidad definidos por el molde son un problema grave que aun ha de ser resuelto con su metodo, en particular en el entorno de la deteccion de enfermedad residual minima. Ademas, al igual que otros metodos de la tecnica anterior, es necesario un analisis por un individuo muy formado para comparar las muestras de los pacientes con el molde.

Ademas, las poblaciones identificadas mediante multiples anticuerpos monoclonales en la medula osea normal no son nubes esfericas diferenciadas en el espacio multidimensional. Por el contrario, los datos pueden describirse como una serie de tubos o serpientes que cambian de tamano y posicion a medida que los linajes de celulas se trasladan de las formas inmaduras a las formas maduras, desplazandose desde la cabeza a la cola en el espacio de datos multidimensional. Asf, los programas de analisis de agrupaciones que tratan a los datos como nubes esfericas producen resultados con las limitaciones indicadas anteriormente.

Por contraste, las realizaciones descritas a continuacion en la presente implican un metodo para determinar, entre otras cosas, una lmea centroide y un radio de una o mas agrupaciones de acontecimientos que se corresponden con un linaje de maduracion de celulas normal. De esta manera, puede emplearse un analisis estadfstico para determinar si un acontecimiento representa un acontecimiento anomalo (es decir, un cancer).

La medula osea normal esta compuesta de multiples linajes, cada uno de ellos sometido a una maduracion continua y constante. Mediante la evaluacion en primer lugar de las celulas normales, puede definirse una medicion estadfstica de lo que constituye lo normal y de lo que constituye una anomalfa. Esta definicion entonces se convierte en el patron para el analisis. La automatizacion de la identificacion de las celulas que estan dentro de las posiciones esperadas y definidas de la normalidad facilitana la ensenanza a nuevos profesionales y tecnicos de lo que se considera fenotfpicamente anomalo. Tambien permitina la estandarizacion del analisis en multiples sitios que proporcionana una coherencia entre los analistas para identificar a las poblaciones anomalas.

La automatizacion de la identificacion de las celulas anomalas tambien permite una mayor sensibilidad. La evaluacion manual actual se realiza empleando tres anticuerpos en combinacion con la dispersion de luz directa y de angulo derecho que recoge 10.000 acontecimientos para cada tubo. Un panel consiste en entre siete y catorce tubos diferentes, cada uno con una combinacion diferente de anticuerpos. Empleando este sistema actual, los tumores pueden detectarse con una especificidad que se acerca al 100%. Vease Am. J. Clin. Path., 110:84-94, supra; Blood, 98:1746-1751, supra; Blood, 101:3398-3406, supra. Es posible que un unico profesional analice e indique entre 2030 de estos casos en un unico dfa. El aumento de la sensibilidad es una limitacion de las estrategias convencionales, porque el profesional debe dedicar mas tiempo a analizar cada caso. La automatizacion de la identificacion de las celulas anomalas permitina unos conjuntos de datos mas grandes (para contar mas celulas) y la aplicacion de mas anticuerpos sin aumentar el tiempo que debe dedicar el analista a cada especimen.

5

10

15

20

25

30

35

40

45

50

55

El analisis estadfstico puede emplearse para identificar cambios mas sutiles en las anomaUas hematopoyeticas. Esto es especialmente importante para el analisis del smdrome mielodisplasico ("MDS"), en el que las anomalfas se observan en las celulas mas maduras y no unicamente en los blastos inmaduros. El analisis estadfstico identificara bultos en los tubos o desplazamientos en la lmea centroide que puedan indicar la regulacion anomala de las celulas. Tambien puede definir puntos reguladores y tasas de avance a traves del proceso del desarrollo, permitiendo una mejor comprension de la perdida de la regulacion de genes coordinada observada durante la transformacion neoplasica.

La figura 1 es un diagrama de bloques funcional de un sistema 100 que ejecuta una realizacion de un sistema para detectar celulas anomalas empleando un analisis multidimensional. El sistema 100 comprende un sistema de medicion 102 y un sistema de diagnostico 104.

El sistema de medicion 102 mide las caractensticas de las celulas en una muestra de celulas y, tal como se ilustra, comprende un citometro de flujo 106 y un programa de formateado de datos 108. Puede emplearse mas de un citometro de flujo 106, aunque normalmente las mediciones para una muestra concreta se realizaran con un instrumento. Por ejemplo, tal como se analiza con mas detalle a continuacion, las mediciones para un conjunto normal de celulas pueden tomarse con un citometro de flujo, mientras que las mediciones procedentes de un conjunto de ensayo de celulas pueden tomarse con otro citometro de flujo. Pueden emplearse otros dispositivos de medicion en el sistema de medicion 102, tales como un microscopio (es decir, un microscopio de alta capacidad de procesamiento).

El sistema de medicion 102 puede contener un programa de formateado de datos separado 108 para dar formato a los datos recogidos por el sistema de medicion 102. Como alternativa, el programa de formateado de datos 108 puede ser parte de otro componente del sistema 100, tal como el citometro de flujo 106 o el sistema de diagnostico 104. El programa de formateado de datos 108 puede, por ejemplo, dar formato a los datos recogidos por el citometro de flujo 106 en un formato Flow Cytometry Standard FCS 2.0 u otro formato de archivo de datos. El sistema de medicion 102 puede comprender otros componentes, tales como controladores, memorias y/o circuitena y hardware.

El sistema de diagnostico 104 analiza los datos recibidos del sistema de medicion 102, tal como se analiza con mas detalle a continuacion. En la realizacion ilustrada en la figura 1, el sistema de diagnostico 104 comprende un controlador 110, una memoria 112, un analizador 114, una interfase de control de entrada/salida 116, una interfase de datos de entrada/salida 118, un motor grafico 120, un motor estadfstico 122, un sistema de presentacion 124, una impresora 126 y una via de transmision del sistema de diagnostico 130. La via de transmision del sistema de diagnostico 130 puede incluir una via de control de potencia, una via de transmision de control, y una via de transmision de senal de estado ademas de una via de transmision de datos. Sin embargo, para anadir claridad, las diversas vfas de transmision del sistema de diagnostico se ilustran en la figura 1 como la via de transmision del sistema de diagnostico 130.

El sistema de diagnostico 104 puede estar en un emplazamiento ffsicamente remoto del sistema de medicion 102. El sistema de medicion 102 puede estar acoplado al sistema de diagnostico 104 a traves de una o mas conexiones de comunicacion, tales como la internet, una extranet y/o una intranet u otras redes locales o de area amplia. De modo similar, los componentes del sistema de diagnostico 104 pueden estar en un emplazamiento ffsicamente remoto entre sf y pueden acoplarse juntos a traves de conexiones de comunicacion, tales como la internet, una extranet y/o una intranet u otras redes locales o de area amplia. Puede haber uno o mas sistemas de diagnostico y cada uno puede acoplarse a uno o mas sistemas de medicion.

El sistema de diagnostico 104 puede ejecutarse en una diversidad de formas, que incluye en forma de subsistemas separados. El sistema de diagnostico 104 puede ejecutarse como un procesador de senales digitales (DSP), un circuito integrado espedfico de aplicacion (ASIC) o similares, o como una serie de instrucciones almacenadas en una memoria, tal como la memoria 112 y ejecutadas por un controlador, tal como el controlador 110. Asf, las modificaciones de software en el hardware existente pueden permitir la ejecucion del sistema de diagnostico 104. Se identifican diversos subsistemas, tales como el analizador 114 y la interfase de control de entrada/salida 116, como bloques separados en el diagrama de bloques funcional de la figura 1 porque realizan funciones espedficas que se describiran con mas detalle a continuacion. Estos subsistemas pueden no ser unidades discretas sino que pueden ser funciones de una rutina de software que quizas, aunque no necesariamente, puedan ser elementos rescatables y, por tanto, identificables. Puede emplearse cualquier software o combinaciones de software adecuados para ejecutar el sistema de diagnostico 104 que incluye, por ejemplo, WinList y/o Java ejecutado con un Java Run Time Environment o un 3-D Java Run Time Environment.

Aunque la realizacion ilustrada indica un unico controlador 110, otras realizaciones pueden comprender multiples controladores. La memoria 112 puede comprender, por ejemplo, registros, memoria de solo lectura ("ROM"), memoria de acceso aleatorio ("RAM"), memoria flash y/o memoria de solo lectura programable y borrable electricamente ("EEPROM"), y puede proporcionar instrucciones y datos para su uso por parte del sistema de diagnostico 104.

En la presente se describe una realizacion de la invencion con respecto a un estudio que se realizo con el linaje B linfoide. Cuando resulte apropiado se incorporan las referencias a la figura 1 en la descripcion del estudio. Las

5

10

15

20

25

30

35

40

45

50

55

realizaciones descritas en la presente pueden aplicarse para estudiar, caracterizar y diagnosticar otros linajes normales y enfermos, tales como el linaje eritroide, T linfoide y otros, que incluyen aquellos con multiples linajes, tales como los linajes mieloides (vease Shulman H., 1999, supra; Wells D.A., 1998, supra; y Loken M.R. y Wells D.A., Normal Antigen Expression in Hematopoiesis: Basis for Interpreting Leukemia Phenotypes, en Immunophenotyping, eds. Carleton Stewart y Janel K.A. Nicholson, 2000, Wiley-Liss, Inc.).

El linaje de linfocitos B es un unico linaje y esta bien definido en 4 estadios de desarrollo dentro de la medula osea con multiples diferencias antigenicas entre estadios que han sido bien caracterizadas. El linaje B entero se identifica por la expresion de un unico antigeno, CD19, que permite la deteccion de los 4 estadios de las celulas del linaje B. Las celulas del linaje B mas temprano (estadio I) se identifican mediante la expresion de CD34, unos niveles altos de CD10 y unos niveles bajos de CD45. Durante el estadio II se pierde CD34, la intensidad de CD10 se reduce en un factor de 2, la intensidad de CD45 aumenta y CD20 comienza a ser expresado. Cuando CD20 alcanza un maximo, ya no se produce un mayor aumento en CD45 con la perdida de CD10 que indica el estadio III. El estadio final (IV) del desarrollo de celulas B linfoides se caracteriza por la ausencia de CD10, la expresion de CD22 y unos niveles altos de CD45.

Tal como entenderan los expertos en la tecnica, otros linajes celulares que pueden caracterizarse empleando los metodos descritos en la presente pueden comprender multiples linajes o linajes ramificados, y los linajes pueden definirse en un numero variable de estadios de desarrollo. Por ejemplo, el linaje mieloide incluye, entre otros, el linaje eritroide y el linaje de granulocitos-monocitos. El linaje de granulocitos-monocitos se ramifica en los linajes de monocitos y neutrofilos.

Los neutrofilos pueden dividirse en cinco estadios identificables. Los mieloblastos del estadio I identificados por la expresion de CD34 tambien muestran HLA-DR, CD13, y CD33 a altos niveles, pero no expresan CD11b, cD15, y cD16. Estos mieloblastos son de un tamano intermedio segun la dispersion de luz directa, pero tienen un SSC bajo. El avance hasta el estadio II viene indicado por la perdida de cD34 y HLA-DR, la adquisicion de unos niveles elevados de CD15, un aumento notable en la expresion de SSC, sin la expresion de CD11 b (vease Loken M.R. y Wells D.A., 2000, supra). Al estadio II le acompana una ligera disminucion en CD33. El estadio III del desarrollo de los neutrofilos esta marcado por la adquisicion de niveles intermedios de CD11 b, la perdida de CD13, y una disminucion en SSC relacionada con la aparicion de granulos secundarios. El estadio IV se advierte por el aumento correlacionado en CD13 y CD16 con otra ligera disminucion en la expresion de CD33. El estadio V se corresponde con los neutrofilos maduros que se encuentran en la sangre periferica. Estas celulas tienen la maxima cantidad de CD16, CD13, y CD45 con un aumento en la densidad.

El linaje de los monocitos presenta tres estadios detectables basandose en la expresion de antfgenos de la superficie celular. El desarrollo monodtico presenta dos estadios de maduracion despues del estadio de mieloblasto (indistinguible del estadio I del desarrollo de los neutrofilos). Estas celulas conservan el HLA-DR a lo largo de su desarrollo, por contraste con los neutrofilos que pierden rapidamente este antfgeno en el estadio de promielocito. La maduracion de los monocitos (estado II) se identifica primero por la aparicion rapida de CD11b mientras que se mantienen unos niveles intermedios de CD45. El estadio II del desarrollo de los monocitos viene acompanado de aumentos en la expresion de CD13 y CD33, con una expresion baja de CD15. El estadio III del desarrollo se define por un aumento coordinado en CD45 y CD14 (vease Loken M.R. y Wells D.A., 2000, supra).

Las celulas eritroides solo presentan dos estadios (vease Loken M., 1992, supra). El compromiso con este linaje se identifica por la perdida de CD45 y el aumento en CD71, estadio I. La expresion de la glicoforina y la aparicion de la hemoglobina marcan el segundo estadio. Las etapas finales de maduracion de las celulas eritroides pueden observarse por la perdida del nucleo, una disminucion en CD71, y la posterior perdida de ARN en los reticulocitos (vease Loken, M.R., Shah V.O., Dattilio K.L., Civin C.l. (1987), Flow cytometric analysis of human bone marrow. I. Normal erythroid development, Blood, 69:255-263).

Tal como se describe en Loken M.R. y Wells D.A., 2000, supra, las celulas T linfoides pueden dividirse en cuatro estadios de desarrollo en el timo mediante el patron de actividad de 10 antfgenos (CD1a, CD2, CD3, CD4, CD5, CD7, CD8, CD10, CD34, y CD45). Tres estadios estan claramente definidos por multiples diferencias antigenicas, mientras que el cuarto puede distinguirse por el tamano.

Asf, tal como entenderan los expertos en la tecnica tras leer la presente descripcion, los metodos descritos en la

presente que emplean el linaje B linfoide como ejemplo pueden utilizarse para caracterizar, en un espacio n-

dimensional, otros linajes celulares tales como los descritos en la presente y los conocidos en la tecnica.

En la realizacion de la invencion descrita en la presente con respecto al linaje B linfoide, se identifican los cuatro estadios del desarrollo de celulas B empleando dos tubos de reactivos con cuatro colores:

Tubo 1: CD20 FITC, CD10 PE, CD45 PerCP y CD19 APC.

Tubo 2: CD22 FITC, CD34 PE, CD45 PerCP y CD19 APC.

La redundancia de los marcadores (CD19 y CD45) en ambos tubos permite la comparacion de los datos entre los diferentes tubos. En el estudio, los conjuntos de datos se recogieron con 200.000 acontecimientos en un citometro

5

10

15

20

25

30

35

40

45

50

55

60

de flujo FACS Calibur (Becton Dickinson, San Jose, CA). Los procedimientos para la preparacion de las muestras fueron los convencionales y siguieron un protocolo fijado. Vease Am. J. Clin. Path., 110:84-94, supra. Se recogieron datos en modo de lista de dos pacientes fenotipicamente normales en el formato FCS para el analisis. Las agrupaciones identificadas por alguien versado en la citometna de flujo y en hemopatologfa, tal como un medico, se compararon con las agrupaciones identificadas mediante el sistema de diagnostico 104 empleando algoritmos de agrupacion. Los centros visuales de las agrupaciones identificados por el profesional se compararon con los generados por el sistema de diagnostico 104. El proceso es iterativo, ya que el usuario revisa las agrupaciones identificadas basandose en los resultados de los algoritmos de agrupacion y ejecuta otros algoritmos de agrupacion empleando las definiciones de agrupacion revisadas.

Se realizo un analisis de cuatro colores de un conjunto de celulas B linfoides de medula osea normal en el tubo 1. Los espedmenes se recogieron para obtener 200.000 acontecimientos para el analisis. Las celulas se colocaron en un tubo y se tineron con los reactivos CD20-fluorescema (FITC), CD10 ficoeritrina (PE), CD45 protema de clorofila peridinina (PerCP), y CD19 aloficocianina (APC). Las caractensticas de las celulas expuestas se midieron empleando una citometna de flujo (vease el citometro de flujo 106 de la figura 1). Un sistema, tal como el sistema 100 ilustrado en la figura 1, mide y analiza la muestra empleando una combinacion de los datos recibidos de las mediciones y la entrada de un usuario, tal como un profesional o un tecnico, tal como se analiza con mas detalle a continuacion.

Puede emplearse la especificacion Flow Cytometry Standard FCS 2.0 disponible al publico para almacenar las caractensticas medidas de las celulas en las muestras. Pueden emplearse otros formatos de datos y estructuras de datos, por ejemplo, puede emplearse un formato FCS 1.0 o FCS 3.0. Un ejemplo de una estructura de datos 200 para almacenar un conjunto de datos se ilustra en la figura 2. Haciendo referencia a las figuras 1 y 2, el analizador 114 analiza la seccion de cabecera 202, la seccion de texto 204, la seccion de datos 206 y la seccion de analisis 208 y recoge la informacion, que incluye un nombre de parametro, un numero total de puntos de datos y los detalles del tipo de datos. La seccion de cabecera 202 describe la localizacion de las otras secciones en la estructura de datos 200. La seccion de cabecera 202 contiene informacion de desplazamiento de los puntos de inicio y de fin para las secciones de texto 204, de datos 206 y de analisis 208. La seccion de texto 204 contiene una serie de parejas de valores de palabras clave codificadas por ASCII que describen diversos aspectos de la estructura de datos 200. Por ejemplo, $TOT/5000/ es una pareja de valor de palabra clave que indica que el numero total de acontecimientos en el archivo es de 5000, y $PAR indica el numero total de parametros. Las seccion de datos 206 contiene los datos brutos. Estos datos se encuentran normalmente en uno de tres modos (lista, correlacionados o no correlacionados) descritos en la seccion de texto 204, mediante, por ejemplo, un valor de palabra clave $MODE. Los datos pueden estar escritos en la seccion de datos 206, por ejemplo, en uno de cuatro formatos (binario, punto de flotacion, punto de flotacion de doble precision o ASCII) descritos por un valor de palabra clave $DATATYPE. Una forma habitual de almacenamiento de datos es el almacenamiento en modo de lista en la forma de numeros enteros binarios ($DATATYPE/l/ $MODE/L/). El conjunto $PnB de palabras clave puede especificar la anchura de bits para el almacenamiento de cada parametro. El conjunto PnR de palabras clave puede especificar el intervalo de numero de canales para cada parametro. Por ejemplo, $PnB/16/ $PnR/1024/, en el que n es un numero entero, puede especificar un campo de 16 bits para el parametro n y un intervalo para los valores del parametro n de 0 a 1023, que se corresponden con 10 bits. La seccion de analisis 208 es un segmento opcional que, cuando esta presente, puede contener los resultados del procesamiento de datos. El analisis tambien puede realizarse fuera de lmea, despues de que los datos hayan sido recogidos y almacenados en una estructura de datos, tal como la estructura de datos 200. En el estudio de ensayo no se utilizo una seccion de analisis 208. Sin embargo, puede emplearse una seccion de analisis 208 para almacenar la informacion que define una lmea centroide y un radio para un conjunto de datos.

Los desplazamientos de los datos del formato FCS 2.0 si indican en un archivo de propiedades. Un ejemplo de archivo de propiedades 300 se ilustra en la figura 3. El archivo de propiedades contiene una seccion de encabezado 302, que contiene informacion acerca de como leer el archivo de propiedades 300, una seccion de formato 304, que contiene informacion acerca del formato de la estructura de datos 200, y una seccion de filtro 306, que contiene informacion que el analizador 114 puede utilizar para filtrar los datos almacenados en la estructura de datos 200. El analizador 114 emplea la informacion extrafda del archivo de propiedades 300 para analizar la estructura de datos cargada 200. El archivo de propiedades 300 puede modificarse con facilidad para permitir el uso de diversos formatos de archivos de datos, tales como los diversos formatos de Flow Cytometry Standard.

El sistema 100 puede emplear una intensidad de fluorescencia que se corresponde con CD19 como puerta inicial. Asf, no es necesario analizar las 200.000 celulas en una lista de acontecimientos de 200.000 celulas, sino que puee evaluarse solo las celulas positivas a CD19 (que incluyen todas las celulas del linaje B). Esto potencia la estadfstica aumentando el numero de celulas del linaje B que se van a analizar sin aumentar el tiempo de calculo requerido para distinguir las celulas B linfoides de la mayona de las otras celulas en la medula osea. Sin esta puerta para las celulas de interes, puede ser necesario un tiempo de calculo de 6-8 horas para identificar las agrupaciones en la lista de acontecimientos de 200.000 celulas. La proporcion de celulas B linfoides inmaduras (estadios I-III) constituye un promedio menor que 2% de todas las celulas nucleadas en la medula osea normal. Vease Loken, M.R., Shah, V.O., Dattilo, K.L., Civin, C.L., Flow Cytometry Analysis of Human Bone Marrow: II. Normal B Lymphoid Development, Blood, 70:1316 (1987). Por tanto, aumentando los recuentos totales hasta 200.000 y estableciendo una puerta para las celulas positivas a CD19, relativamente poco frecuentes, las celulas de interes se analizan y al mismo tiempo se mantiene el conjunto de datos completo y se evitan accidentes introducidos por el establecimiento de una puerta

5

10

15

20

25

30

35

40

45

50

55

60

electronica para CD19 durante la recogida de datos. Sin embargo, en realizaciones alternativas, sf puede emplearse el establecimiento de una puerta electronica para CD19 durante la recogida de datos.

Las poblaciones de interes de un ejemplo de conjunto de datos normales recogidos como se describio anteriormente con respecto al tubo 1 se ilustran en las figuras 4A a 9A como una serie de presentaciones de analisis de cuatro colores que se generaron empleando WinList. Las poblaciones de interes tambien pueden representarse de otras formas, tales como una correspondiente presentacion de analisis de cuatro tonos, que se ilustra en las figuras 4B a 9B. Las figuras 4A a 9A y 4B a 9B se indican en la presente de forma colectiva como las figuras 4 a 9.

Las agrupaciones de acontecimientos se identifican inicialmente en multiples proyecciones de presentaciones 2 por 2 de los 6 datos dimensionales (4 colores y 2 parametros de dispersion de luz). Las presentaciones pueden ser, por ejemplo, representaciones de los datos en un sistema de coordenadas cartesianas. Las proyecciones de las presentacioens pueden ser generadas por el motor grafico 120 ilustrado en la figura 1. Un usuario, tal como alguien versado en la citometna de flujo y en hematopatologfa, identifica una region ML en una proyeccion de una presentacion 2 por 2 en un sistema de coordenadas con un eje horizontal que se corresponde con una dispersion de luz directa, y un eje vertical que se corresponde con una dispersion de luz lateral, tal como se ilustra en la figura 4. La region ML se corresponde con las celulas nucleadas. El usuario identifica las regiones de linfoides, monocitos, mieloides y blastos en una proyeccion de una presentacion 2 por 2 en un sistema de coordenadas con un eje horizontal que se corresponde con una dispersion de luz lateral, y un eje vertical que se corresponde con un nivel de intensidad de fluorescencia para CD45, segun se ilustra en la figura 5. El usuario identifica las celulas B linfoides en una proyeccion de una presentacion 2 por 2 en un sistema de coordenadas con un eje horizontal que se corresponde con una dispersion de luz lateral, y un eje vertical que se corresponde con un nivel de intensidad de fluorescencia para CD19, segun se ilustra en la figura 6.

El usuario identifica una agrupacion del estadio I, una agrupacion del estadio II y una agrupacion del estadio III/IV en una proyeccion de una presentacion 2 por 2 en un sistema de coordenadas con un eje horizontal que se corresponde con un nivel de intensidad de fluorescencia para CD19, y un eje vertical que se corresponde con un nivel de intensidad de fluorescencia para CD45, segun se ilustra en la figura 7. Los estadios se corresponden con los niveles de maduracion para las celulas B linfoides. El usuario identifica una agrupacion del estadio I, una agrupacion del estadio II, una agrupacion del estadio III y una agrupacion del estadio IV en una proyeccion de una presentacion 2 por 2 en un sistema de coordenadas con un eje horizontal que se corresponde con un nivel de intensidad de fluorescencia para CD10, y un eje vertical que se corresponde con un nivel de intensidad de fluorescencia para CD45, segun se ilustra en la figura 8. El usuario identifica una agrupacion del estadio I, una agrupacion del estadio II, una agrupacion del estadio III y una agrupacion del estadio IV en una proyeccion de una presentacion 2 por 2 en un sistema de coordenadas con un eje horizontal que se corresponde con un nivel de intensidad de fluorescencia para CD20, y un eje vertical que se corresponde con un nivel de intensidad de fluorescencia para CD10, segun se ilustra en la figura 9.

Basandose en la evaluacion por parte del usuario de las figuras 4-9, las celulas accedidas se asignan a una agrupacion inicial. Esto produce un conjuntos de datos normales de siete dimensiones, y estas dimensiones se corresponden con: una dispersion de luz directa; una dispersion de luz lateral; un nivel de intensidad de fluorescencia de CD19; un nivel de intensidad de fluorescencia de CD45; un nivel de intensidad de fluorescencia de CD20; un nivel de intensidad de fluorescencia de CD10; y una agrupacion, que se corresponde con un estadio de maduracion dentro de la poblacion de celulas B. Se asigna un color a cada identificacion de la agrupacion y los datos se cartograffan en un espacio de seis dimensiones. Los datos son mostrados por un sistema de diagnostico, tal como el sistema de diagnostico 104 ilustrado en la figura 1, en una presentacion pseudo-tridimensional rotable con un codigo de colores basado en la identificacion de agrupaciones.

El sistema de diagnostico 104 cartograffa el conjunto de datos normales en un sistema de coordenadas de tres ejes, tal como un sistema de coordenadas cartesianas, y muestra los datos para que el usuario pueda visualizarlos. Cada eje se corresponde con una de las dimensiones del conjunto de datos, cuyo color indica la agrupacion a la cual se ha asignado una celula concreta. El conjunto de datos tambien puede representarse en una presentacion tabular o en una presentacion combinada. Las figuras 10A y 10B (de modo colectivo figura 10) ilustran ejemplos de presentaciones 400 que combinan una representacion de una presentacion pseudo-tridimensional 402 con una representacion tabular 404. La figura 10A es una presentacion de colores y la figura 10B es una correspondiente presentacion de tonos.

La representacion grafica 402 comprende un eje x 406 que se corresponde con una intensidad de fluorescencia para CD20, un eje y 408 que se corresponde con una intensidad de fluorescencia para CD10, y un eje z 410 que se corresponde con una intensidad de fluorescencia para CD45. A los datos en una primera agrupacion 412 se les asigna el color rojo y se corresponden con un nivel de maduracion del estadio I. A los datos en una segunda agrupacion 414 se les asigna el color verde y se corresponden con un nivel de maduracion del estadio II. A los datos en una tercer agrupacion 416 se les asigna el color azul y se corresponden con un nivel de maduracion del estadio III. A los datos en una cuarta agrupacion 418 se les asigna el color amarillo y se corresponden con un nivel de maduracion del estadio IV.

La representacion tabular 404 comprende una primera columna 420 que indica el numero de la agrupacion, una

5

10

15

20

25

30

35

40

45

segunda columna 422 que indica el numero de puntos en la agrupacion, una tercera columna 424 que indica el color o el tono asignado a la agrupacion, una cuarta columna 426 que indica el radio de la agrupacion, una sexta columna 428 que indica el porcentaje de puntos o acontecimientos anomalos en el conjunto total de puntos o acontecimientos, y una septima columna 430 que indica si una distancia logantmica entre el punto centroide para una agrupacion y un punto centroide estadfstico para la agrupacion es mayor que un valor umbral. La presentacion 400, tal como se ilustra, puede ser una presentacion por ordenador interactiva. El usuario puede actualizar la informacion empleada para generar la presentacion 400 empleando los campos de entrada de datos 432, 434. Tal como se ilustra, el valor umbral se fija a 2,5 en el campo 434.

El sistema de diagnostico 104 permite al usuario la seleccion de los tres ejes en los que cartografiar los datos empleando un menu de una interfase del usuario grafica (GUI). Las figuras 11A y 11B ilustran un ejemplo de menu 436 que puede ser empleado por un sistema de diagnostico, tal como el sistema de diagnostico 104 ilustrado en la figura 1. El sistema de diagnostico 104 tambien permite al usuario la seleccion de otros ajustes a traves de menus. Por ejemplo, pueden incluirse selecciones de menus para: seleccionar entre diferentes parametros de filtracion almacenados, editar los parametros de filtracion almacenados, y especificar nuevos parametros de filtracion. Por ejemplo, los datos de alta resolucion pueden filtrarse para excluir los datos con un parametro de dispersion lateral que se corresponde con mas de 102, y un parametro de CD19 que se corresponde con menos de 10 al 1,6989701. Las selecciones de menus tambien permiten la seleccion de un plano en el sistema de coordenadas sobre el cual realizar la filtracion. Pueden emplearse multiples criterios de filtracion, y el criterio de filtracion puede ser mayor o menor que los umbrales especificados. El sistema de menus tambien permite la seleccion de una agrupacion espedfica sobre la cual aplicar diversos criterios de filtracion. Esto permite al usuario visualizar diversas presentaciones pseudo-tridimensionales del conjunto de datos normales para ayudar al usuario a seleccionar los datos iniciales para su uso por el sistema de diagnostico 104 para definir una lmea centroide y un radio para el conjunto de datos normales. El sistema de diagnostico 104 tambien permite la seleccion de menus de un metodo de desviacion estandar o valor fijado y la rotacion de una imagen mostrada. El sistema de diagnostico 104 tambien puede mostrar los lfmites de las agrupaciones para un conjunto de datos basandose en un centroide y un radio seleccionados.

El conjunto de datos normales tambien puede comprender archivos de datos distintos que se corresponden con muestras distintas. Por ejemplo, el usuario puede examinar y manipular un conjunto de datos que comprende celulas extrafdas de un unico individuo y de un unico tubo, o el usuario puede combinar muestras extrafdas de una pluralidad de individuos y/o tubos en un unico conjunto de datos normales. Si una muestra extrafda de un individuo se considera anomala, la muestra puede excluirse del conjunto normal de datos.

Haciendo referencia al estudio, en el ejemplo del conjunto de datos de celulas B linfoides para el tubo 1, el valor n es igual a seis. Cada punto n dimensional se cartograffa en el espacio n-dimensional, que puede ser representado en una matriz de flotacion por medio de n+1 parametros de flotacion. La tabla 1 ilustra la matriz de flotacion para un ejemplo de un conjunto de datos de celulas B linfoides de seis dimensiones, en la que P1PR1 es el valor del primer parametro para el primer punto, P2PR1 es el valor del primer parametro para el segundo punto, ... PnPR1 es el valor del primer parametro para el n° punto, etc., anadiendose un septimo parametro para la agrupacion a la cual se ha asignado el punto, PnC#. La matriz de flotacion puede generalizarse para cualquier numero de dimensiones. El sistema de diagnostico 104 realiza uno o mas algoritmos de agrupacion sobre el conjunto normal de datos en el espacio n-dimensional, refinando la asignacion de los puntos a una agrupacion.

Tabla 1 - Matriz de flotacion para un conjunto de datos de seis dimensiones

P1PR1: P1PR2 P1PR3 P1PR4 P1PR5 P1PR6 P1C#

P2PR1: P2PR2 P2PR3 P2PR4 P2PR5 P2PR6 P2C#

P3PR1: P3PR2 P3PR3 P3PR4 P3PR5 P3PR6 P3C#

PnPR1: PnPR2 PnPR3 PnPR4 PnPR5 PnPR6 PnC#

El sistema de diagnostico 104 permite al usuario agrupar los datos empleando un algoritmo de agrupacion seleccionado. Por ejemplo, el usuario puede especificar un numero de agrupaciones, k, y emplear un algoritmo de k- means para agrupar los datos. Por ejemplo, el sistema de diagnostico 104 puede dividir los datos en k agrupaciones y asignar un centro a cada agrupacion. El centro puede asignarse aleatoriamente a uno de los puntos o introducirse basandose en observaciones del usuario. La distancia entre dos puntos en el espacio n-dimensional puede definirse como sigue:

5

10

15

20

25

30

35

40

45

50

D(Pi, P2) = SQRT[(K1(P1PR1-P2PRi))2 + (K2(PiPR2-P2PR2))2 +

+ (K3(PiPR3-P2PR3))2 + ... + (Kn(PiPRn-P2PRn))2] Ecuacion 1

en la que D(Pi, P2) es la distancia entre dos puntos en el espacio n-dimensional, y P1PR1 es el valor del primer parametro para el primer punto, P2PR1 es el valor del primer parametro para el segundo punto, ... PnPRi es el valor del primer parametro para el n° punto, etc., y Ki, K2, K3, ... Kn son las constantes de ponderacion. En el estudio, las constantes de ponderacion se fijan a igual a uno. En otras palabras, no se empleo ponderacion en el estudio. Los centros pueden actualizarse iterativamente hasta que se cumpla un criterio de convergencia. En cada iteracion, cada punto de datos se asigna a su centro mas cercano, y los centros se recalculan empleando el promedio de los valores del parametro de todos los puntos que pertenecen a una agrupacion. Los criterios de convergencia tfpicos empleados en el estudio fueron la no reasignacion (o una reasignacion minima) de puntos a nuevos centros de agrupaciones. Vease Forgy, E., Cluster Analysis of Multivariate Data: Efficiency vs. Interpretability of Classifications, Biometrics, 21:768 (1965), para un analisis de las agrupaciones de k-means.

Otro ejemplo de algoritmo de agrupacion es un algoritmo de agrupacion DBSCAN. Se define un radio de vecindad, Eps, y un umbral del numero de puntos en la vecindad, minPts, y el sistema de diagnostico 104 emplea un algoritmo de agrupacion DBSCAN. El radio de vecindad y el umbral del numero de puntos son definidos por el usuario. La agrupacion basada en la densidad se basa en el hecho de que las agrupaciones tienen mas densidad que sus alrededores. DBSCAN encuentra agrupaciones densas automaticamente para un umbral de densidad dado. Vease Ester, M., Kriegel, H., Sander, J., Xu, X., A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise, en Proceedings of 2d International Conference on KDD (1996), para un analisis de la agrupacion DBSCAN. Por definicion, el umbral de densidad viene especificado por dos parametros: el radio de vecindad (Eps) y el umbral del numero de puntos en e-vecindades (minPts). Un punto 'p' es directamente alcanzable por densidad desde un punto 'q', si 'p' esta en la e-vecindad de 'q'. Un punto 'p' es alcanzable por densidad desde 'q' si existe una cadena de puntos 'pi', en el que i = 1... n y 'Pi+1' es directamente alcanzable por densidad desde 'pi', 'q' es 'p1 y 'p' es 'pi+1'. Un punto 'p' esta conectado por densidad con otro punto 'q' si existe un punto 'o', de modo que ambos 'p' y 'q' son alcanzables por densidad desde 'o'. En el estudio, el sistema de diagnostico 104 comienza introduciendo un punto en un almacenamiento temporal (lista tempStore, por ejemplo) y descubriendo su e- vecindad. Si la e-vecindad de un punto de datos contiene menos de 'minPts' puntos, entonces se marca como ruido y se introduce otro punto en tempStore. Por lo demas, todos los puntos de e-vecindarios se introducen en tempStore. El proceso completo se repite hasta que se consideran todos los puntos. En resumen, los grupos de agrupacion DBSCAN conectan por densidad los puntos como una agrupacion densa y eliminan los puntos que no estan conectados por densidad como ruido.

El sistema de diagnostico 104 tambien puede emplear, por ejemplo, la agrupacion por puentes para agrupar los datos. La agrupacion por puentes combina la agrupacion de k-means con la agrupacion DBSCAN. Vease Dash, M., Liu, H., Xu, X., '1 + 1>2': Merging Distance and Density Based Clustering, Proceedings of the IEEE 7th International Conference on Database Systems for Advanced Applications (DASFAA '01), 18-21 de abril, 2001, Hong Kong, China, para un analisis de la agrupacion por puentes. Primero se realizo k-means, seguido de una agrupacion basada en la densidad en cada agrupacion de k-means y, al final, las agrupaciones de k-means se refinaron eliminando el ruido que se encuentra en la agrupacion basada en la densidad. Para una fusion eficaz, cada punto de datos presenta las siguientes tres columnas para almacenar los resultados de la agrupacion: <k-means_ID>, <DBSCAN ID> y <core/e-core/non/core>, en donde:

K-means-ID es la agrupacion asignada a cada punto cuando se aplica k-means sobre los puntos de datos;

DBSCAN_ID es la agrupacion asignada a cada punto cuando se aplica DBSCAN sobre cada agrupacion de k- means; y

los valores core/e-core/non-core se asignan basandose en las siguientes definiciones:

Definicion 1 (CoreDistance): Para cada agrupacion, CoreDistance es la mitad de la distancia entre su centro y el centro de la agrupacion mas cercana.

Definicion 2 (CorePoint): No esta mas alejado del centro de su agrupacion que 'CoreDistance - e'. La region central ("Core") de una agrupacion es aquella en la que, en su interior, cada punto de datos es central.

Definicion 3 (+e CorePoint): Su distancia desde el centro de la agrupacion esta entre 'CoreDistance' y 'CoreDistance + e'.

Definicion 4 (-e CorePoint): Su distancia desde el centro de la agrupacion esta entre 'CoreDistance' y 'CoreDistance - e'. Por conveniencia, cuando se consideran los puntos centrales +e and -e, juntos se indican como e-central. La region e-central es aquella en la cada punto es e-central.

Definicion 5 (punto no central): No es un punto central ni un punto e-central. Una region no central es aquella en que cada punto es no central.

5

10

15

20

25

30

35

40

45

50

55

60

El sistema de diagnostico 104 tambien puede emplear una agrupacion por ondmula. Las transformadas de ondmulas son una forma especial de las transformadas de Fourier. Vease Press, W.H., Flannery, B.P., Teukiosky, S.A., Numerical Recipes, en C: The Art of Scientific Computing, Ch. 13.10, Cambridge University Press (1992). Esta tecnicas esta muy establecida en el procesamiento de imagenes y la areas de busqueda de datos para el reconocimiento de patrones y lfmites. Vease Sheikholeslami, G., Chatterjee, S., Zhang, A., WaveCluster: A MultiResolution Clustering Approach for Very Large Spatial Databases, Proceedings of the 24th VLDB Conference, Nueva York, EEUU, 1998. Por ejemplo, puede emplearse la filtracion de ondfculas de Daubechies convencional y la transformada de ondfculas discretas n-dimensional ("N-Dimensional Discrete Wavelet Transform", NDDFT).

De una manera similar, se identifican las mismas poblaciones (estadios) en un segundo conjunto de datos normales en el segundo tubo (CD22, CD34, CD45, CD19), tal como se ilustra en color en las figuras 12A a 17A y en tonos en las figuras 12B a 17B (denominadas de modo colectivo en la presente como las figuras 12 a 17). El usuario identifica una region ML en una proyeccion de una presentacion 2 por 2 en un sistema de coordenadas con un eje horizontal que se corresponde con una dispersion de luz directa, y un eje vertical que se corresponde con una dispersion de luz lateral, tal como se ilustra en la figura 12. La region ML se corresponde con las celulas nucleadas. El usuario identifica las celulas B linfoides en una proyeccion de una presentacion 2 por 2 en un sistema de coordenadas con un eje horizontal que se corresponde con una dispersion de luz lateral, y un eje vertical que se corresponde con un nivel de intensidad de fluorescencia para CD19, segun se ilustra en la figura 13.

El usuario identifica una agrupacion del estadio I, una agrupacion del estadio II y una agrupacion del estadio III/IV en una proyeccion de una presentacion 2 por 2 en un sistema de coordenadas con un eje horizontal que se corresponde con un nivel de intensidad de fluorescencia para CD19, y un eje vertical que se corresponde con un nivel de intensidad de fluorescencia para CD45, segun se ilustra en la figura 14. Los estadios se corresponden con los niveles de maduracion para las celulas B linfoides. El usuario identifica una agrupacion del estadio I, una agrupacion del estadio II/III y una agrupacion del estadio IV en una proyeccion de una presentacion 2 por 2 en un sistema de coordenadas con un eje horizontal que se corresponde con un nivel de intensidad de fluorescencia para CD22, y un eje vertical que se corresponde con un nivel de intensidad de fluorescencia para CD34, segun se ilustra en la figura 15. El usuario identifica una agrupacion del estadio I, una agrupacion del estadio II/III y una agrupacion del estadio IV en una proyeccion de una presentacion 2 por 2 en un sistema de coordenadas con un eje horizontal que se corresponde con un nivel de intensidad de fluorescencia para CD34, y un eje vertical que se corresponde con un nivel de intensidad de fluorescencia para CD45, segun se ilustra en la figura 16. El usuario identifica una agrupacion del estadio I, una agrupacion del estadio II/III y una agrupacion del estadio IV en una proyeccion de una presentacion 2 por 2 en un sistema de coordenadas con un eje horizontal que se corresponde con un nivel de intensidad de fluorescencia para CD22, y un eje vertical que se corresponde con un nivel de intensidad de fluorescencia para CD45, segun se ilustra en la figura 17. Los resultados del tubo 1 y del tubo 2 se combinan para producir un unico conjunto de datos normales, segun se describe con mas detalle a continuacion.

Tras haber identificado las agrupaciones y ser refinadas por el usuario selectivamente empleando el software de agrupacion, se define una lmea centroide y un radio para las agrupaciones normales, en las que cada agrupacion se corresponden con un nivel de maduracion dentro de un linaje celular. Las figuras 18A a 18C ilustran una realizacion de una subrutina 500 que puede emplearse para definir una poblacion normal de celulas, analizada con respecto al sistema 100 ilustrado en la figura 1 y las celulas B linfoides recogidas en los tubos 1 y 2, segun se analizo anteriormente. El proceso completo para definir una poblacion normal de celulas debe considerarse como un proceso iterativo. Otros linajes celulares, tales como un linaje mieloide, pueden comprender multiples linajes o linajes ramificados. En estos casos, pueden definirse las multiples lmeas centroides o una lmea centroide definida puede tener ramificaciones.

La subrutina 500 comienza en 502 y avanza hasta 504. En 504, el sistema 100 filtra un conjunto de datos recogidos midiendo las caractensticas de las celulas en el tubo 1 estableciendo una puerta para las celulas positivas a CD19, creando un primer conjunto de datos normales, y despues avanza hasta 506. En 506, el sistema 100 filtra un conjunto de datos recogidos midiendo las caractensticas de las celulas en el tubo 2 estableciendo una puerta para las celulas positivas a CD19, creando un segundo conjunto de datos normales, y despues avanza hasta 508.

En 508, el sistema 100 distingue entre las celulas maduras e inmaduras en el primer conjunto de datos. Esto puede realizarse, por ejemplo, representando graficamente las intensidades de fluorescencia para CD45 frente a las intensidades de fluorescencia para CD19 y agrupando el primer conjunto de datos basandose en las entradas del usuario junto con las tecnicas de agrupacion automaticas. El sistema avanza hasta 510, en donde determina si debe revisar la distincion entre las celulas maduras e inmaduras en el primer conjunto de datos. Esta decision puede basarse en los resultados de las tecnicas de agrupacion automaticas, el analisis estadfstico de los datos y/o presentaciones del conjunto de datos generadas basandose en la distincion, y puede ser automatica y/o basarse en entradas del usuario. Si el sistema 100 determina que la distincion debe revisarse, el sistema 100 vuelve a 508. Si el sistema 100 determina que la distincion no debe revisarse, el sistema avanza hasta 512.

En 512, el sistema 100 identifica las agrupaciones que representan los estadios I, II, III y IV en el primer conjunto de datos. Esto puede realizarse, por ejemplo, representando graficamente las intensidades de fluorescencia para CD45 frente a las intensidades de fluorescencia para CD10 y CD20 y agrupando los datos basandose en las entradas del usuario junto con las tecnicas de agrupacion automaticas. El sistema 100 avanza hasta 514, en donde determina si

5

10

15

20

25

30

35

40

45

50

55

60

debe revisar la identificacion de las agrupaciones en el primer conjunto de datos. Esta decision puede basarse en los resultados de las tecnicas de agrupacion automaticas, el analisis estad^stico de los datos y/o presentaciones del conjunto de datos generadas basandose en la identificacion, y puede ser automatica y/o basarse en entradas del usuario. Si el sistema 100 determina que la identificacion debe revisarse, el sistema 100 vuelve a 512. Si el sistema 100 determina que la identificacion debe aceptarse, el sistema avanza hasta 516.

En 516, el sistema 100 identifica una agrupacion que representa el estadio I en el segundo conjunto de datos. Esto puede realizarse, por ejemplo, representando graficamente las intensidades de fluorescencia para CD34 frente a las intensidades de fluorescencia para CD45 y agrupando los datos basandose en las entradas del usuario junto con las tecnicas de agrupacion automaticas. El sistema avanza hasta 518, en donde determina si debe revisar la identificacion de la agrupacion del estadio I en el segundo conjunto de datos. Esta decision puede basarse en los resultados de las tecnicas de agrupacion automaticas, el analisis estadfstico de los datos y/o presentaciones del conjunto de datos generadas basandose en la identificacion, y puede ser automatica y/o basarse en entradas del usuario. Si el sistema 100 determina que la identificacion debe revisarse, el sistema 100 vuelve a 516. Si el sistema 100 determina que la identificacion debe aceptarse, el sistema avanza hasta 520.

En 520, el sistema 100 identifica una agrupacion que representa el estadio IV en el segundo conjunto de datos. Esto puede realizarse, por ejemplo, representando graficamente las intensidades de fluorescencia para CD22 frente a las intensidades de fluorescencia para CD34 y agrupando los datos basandose en las entradas del usuario junto con las tecnicas de agrupacion automaticas. El sistema avanza hasta 522, en donde determina si debe revisar la identificacion de la agrupacion del estadio IV en el segundo conjunto de datos. Esta decision puede basarse en los resultados de las tecnicas de agrupacion automaticas, el analisis estadfstico de los datos y/o presentaciones del conjunto de datos generadas basandose en la identificacion, y puede ser automatica y/o basarse en entradas del usuario. Si el sistema 100 determina que la identificacion debe revisarse, el sistema 100 vuelve a 520. Si el sistema 100 determina que la identificacion debe aceptarse, el sistema avanza hasta 524.

En 524, el sistema 100 identifica una agrupacion que representa los estadios II y III en el segundo conjunto de datos. Esto puede realizarse, por ejemplo, representando graficamente las intensidades de fluorescencia para CD34 frente a las intensidades de fluorescencia para CD45 basandose en las entradas del usuario junto con las tecnicas de agrupacion automaticas. El sistema avanza hasta 526, en donde determina si debe revisar la identificacion de la agrupacion del estadio II/III en el segundo conjunto de datos. Esta decision puede basarse en los resultados de las tecnicas de agrupacion automaticas, el analisis estadfstico de los datos y/o presentaciones del conjunto de datos generadas basandose en la identificacion, y puede ser automatica y/o basarse en entradas del usuario. Si el sistema 100 determina que la identificacion debe revisarse, el sistema 100 vuelve a 524. Si el sistema 100 determina que la identificacion debe aceptarse, el sistema avanza hasta 528.

En 528, el sistema 100 define una lmea centroide para cada agrupacion identificada en los actos 512, 516, 520 y 524. Una lmea centroide para una agrupacion puede ser fractal y puede determinarse basandose en las entradas del usuario junto con las tecnicas de agrupacion automaticas. Una lmea centroide para una agrupacion puede definirse, por ejemplo, combinando la media geometrica en un espacio n-dimensional, siendo determinado el punto centroide por los algoritmos de agrupacion. El sistema avanza hasta 530, en donde determina si debe revisar las lmeas centroides definidas para las agrupaciones identificadas. Esta decision puede basarse en los resultados de las tecnicas de agrupacion automaticas, el analisis estadfstico de los datos y/o presentaciones del conjunto de datos generadas basandose en la identificacion, y puede ser automatica y/o basarse en entradas del usuario. Si el sistema 100 determina que la identificacion debe revisarse, el sistema 100 vuelve a 528. Si el sistema 100 determina que la identificacion debe aceptarse, el sistema avanza hasta 532.

En 532, el sistema 100 define una lmea centroide normal que se corresponde con un linaje de maduracion normal basandose en los conjuntos de datos combinados. Esto puede realizarse, por ejemplo, uniendo las lmeas centroides definidas de las agrupaciones identificadas empleando una curvatura geometrica. El sistema 100 tambien puede combinar las entradas del usuario con las tecnicas de agrupacion automaticas para definir la lmea centroide normal. La distancia a lo largo de esta lmea centroide, comparada con el inicio y el fin, es una medicion de la maduracion de esas celulas para un linaje dado, segun se evalua mediante la combinacion espedfica de reactivos monoclonales. Debe advertirse que pueden utilizarse diferentes combinaciones de anticuerpos para expandir ciertas partes de los procesos de maduracion, mientras que otras combinaciones se centran en otros estadios de maduracion u otros linajes.

El sistema avanza hasta 534, en donde determina si debe revisar la definicion de la lmea centroide normal. Esta decision puede basarse en los resultados de las tecnicas de agrupacion automaticas, el analisis estadfstico de los datos y/o presentaciones del conjunto de datos generadas basandose en la identificacion, y puede ser automatica y/o basarse en entradas del usuario. Si el sistema 100 determina que la definicion debe revisarse, el sistema 100 vuelve a 532. Si el sistema 100 determina que la definicion debe aceptarse, el sistema avanza hasta 536.

En 536, el sistema 100 define un lfmite, o un radio normal, alrededor de la lmea centroide normal definida. El radio normal, o lfmite, puede ser un radio fijado o puede variar. Por ejemplo, puede ser una distancia fijada, tal como 10, o puede ser una funcion de una posicion sobre la lmea centroide normal definida o en el espacio n-dimensional. Puede emplearse una definicion para una primera porcion de la lmea centroide normal definida, y puede emplearse una

5

10

15

20

25

30

35

40

45

segunda definicion para otras porciones de la lmea centroide normal definida. El radio normal puede determinarse empleando algoritmos estadfsticos, tales como las tecnicas de agrupacion de ondmulas y/o las tecnicas de envuelta de lfmite de k-means (empleando la densidad de las agrupaciones) y/o puede basarse en entradas del usuario. Tambien pueden emplearse algoritmos de nivelacion para definir patrones tridimensionales espedficos y compararse con las observaciones para un numero de archivos estadfsticamente determinados.

El sistema 100 avanza hasta 538, en donde determina si debe revisar el radio normal definido. Esta decision puede basarse en los resultados de las tecnicas de agrupacion automaticas, el analisis estadfstico de los datos y/o presentaciones del conjunto de datos generadas basandose en la identificacion, y puede ser automatica y/o basarse en entradas del usuario. Si el sistema 100 determina que la definicion debe revisarse, el sistema 100 vuelve a 536. Si el sistema 100 determina que la definicion debe aceptarse, el sistema avanza hasta 540, en donde la subrutina 500 se detiene.

En algunas realizaciones, un sistema 100 puede realizar otros actos que no se muestran en las figuras 18A a 18C, puede no realizar todos los actos mostrados en las figuras 18A a 18C, o puede realizar los actos de las figuras 18A a 18C en un orden diferente. Por ejemplo, la subrutina puede hacerse mas iterativa. Por ejemplo, la subrutina 500 puede modificarse de modo que el sistema 100 determine, despues del acto 538, si debe revisar la lmea centroide normal definida y, si es asf, volver a 532. La subrutina 500 tambien puede llamar a otras subrutinas para realizar diversas funciones, tales como la subrutina 600 descrita a continuacion con respecto a la figura 19. La subrutina 500 tambien puede devolver el valor de cualquier variable deseada, tales como los datos introducidos por un usuario.

La figura 19 es un diagrama de flujo para un ejemplo de subrutina 600 que puede ser empleada por un sistema de diagnostico, tal como el sistema de diagnostico 104 ilustrado en la figura 1, para definir una lmea centroide normal para un conjunto de agrupaciones. Las figuras 20A y 20B (de modo colectivo figura 20) ilustran representaciones graficas de los datos, una lmea centroide de referencia 702 y una lmea centroide normal 704 calculada a partir del estudio.

La subrutina 600 comienza en 602 y avanza hasta 604. En 604, el sistema de diagnostico 104 identifica un conjunto de puntos de referencia. Por ejemplo, el sistema de diagnostico 104 puede identificar diez puntos de referencia seleccionados por un usuario despues de visualizar diversas representaciones del conjunto de datos. Como alternativa, el sistema de diagnostico 104 puede identificar una serie de puntos seleccionados estadfsticamente o puede combinar las entradas de un usuario con el analisis estadfstico. En el estudio, el usuario selecciona diez puntos de referencia despues de visualizar diversas representaciones de los datos.

El sistema de diagnostico 104 avanza hasta 606, en donde define una lmea centroide de referencia basandose en el conjunto identificado de puntos de referencia. La figura 20 ilustra un ejemplo de una lmea centroide de referencia 702 definida basandose en los diez puntos de referencia identificados por el usuario en el estudio.

El sistema de diagnostico 104 avanza hasta 608, en donde determina el numero de agrupaciones en las que agrupar los datos. Por ejemplo, en el estudio, el sistema de diagnostico 104 agrupa los datos en cuatro agrupaciones basandose en las entradas del usuario. Como alternativa, el numero de agrupaciones puede determinarse estadfsticamente (empleando, por ejemplo, la agrupacion con DBSCAN) o empleando las entradas de un usuario en combinacion con el analisis estadfstico.

El sistema de diagnostico 104 avanza hasta 610, en donde identifica los puntos centroides para el correspondiente numero de agrupaciones. Esto puede realizarse asignando cada punto a una agrupacion basandose en las entradas del usuario o en algoritmos estadfsticos o una combinacion de ambos. Vease el analisis anterior de los algoritmos de agrupacion. Los respectivos valores de parametro para todos los puntos asignados a una agrupacion se suman, y despues el resultado se divide entre el numero de puntos en la agrupacion para obtener el valor de parametro para el punto centroide. Por ejemplo, si el sistema de diagnostico 104 determina, en el acto 608, que debe agrupar los datos en cuatro agrupaciones, el sistema de diagnostico 104 identificara cuatro puntos centroides, y cada punto se corresponded con una agrupacion. La tabla 2, indicada a continuacion, ilustra un ejemplo de calculo de un punto centroide para una agrupacion que contiene 5 puntos de datos en un espacio tridimensional.

Tabla 2 - Ejemplo de calculo de puntos centroides

: Parametro X Parametro Y Parametro Z

Punto 1: 25 30 400

Punto 2: 30 35 390

Punto 3: 25 35 395

Punto 4: 25 37 390

Punto 5: 20 33 392

5

10

15

20

25

30

35

40

45

50

55

El numero de puntos, el numero de dimensiones y los valores de parametro para la tabla 2 se seleccionaron para facilitar el ejemplo.

El sistema de diagnostico 104 avanza hasta 612, en donde determina un correspondiente punto mas cercano en la lmea centroide de referencia para cada punto centroide identificado.

El sistema de diagnostico 104 avanza hasta 614, en donde calcula la diferencia entre cada punto centroide y el punto mas cercano en la lmea centroide de referencia. En el estudio, esto se realizo empleando la formula de la distancia cuadrada analizada anteriormente, sin ponderacion. Vease la ecuacion 1.

El sistema de diagnostico avanza hasta 616, en donde ajusta los puntos de referencia basandose en los puntos centroides y los puntos de referencia mas cercanos. En el estudio, esto se realizo sumando la diferencia entre el punto centroide y el punto mas cercano de una agrupacion a los puntos de referencia en esa agrupacion.

El sistema de diagnostico avanza hasta 618, en donde redefine la lmea centroide de referencia usando los puntos de referencia ajustados y los puntos centroides para cada agrupacion. En el estudio, esto se realizo conectando las lmeas centroides para cada agrupacion empleando una curvatura geometrica. Un ejemplo de una lmea centroide de referencia redefinida se ilustra en la figura 20 como la lmea 704. La lmea centroide de referencia puede refinarse aun mas empleando un analisis estadfstico. Por ejemplo, los puntos estadfsticamente insignificantes o los puntos fuera de un radio definido pueden ser eliminados del conjunto de datos. Los calculos realizados por el sistema de diagnostico 104 empleando la subrutina 600 pueden almacenarse para un uso posterior. Por ejemplo, en la agrupacion de los datos durante el estudio, el sistema de diagnostico 104 determina la distancia cuadrada entre los puntos centroides y los puntos de referencia. Estos datos se almacenaron para su uso para calcular los valores de desviacion estandar.

El sistema de diagnostico 104 avanza hasta 620, en donde devuelve la lmea centroide redefinida y el valor de cualquiera de las variables deseada, tales como las entradas de usuario. El sistema de diagnostico avanza hasta 622, en donde se detiene.

En algunas realizaciones, un sistema 100 puede realizar otros actos que no se muestran en la figura 19, puede no realizar todos los actos mostrados en la figura 19, o puede realizar los actos de la figura 19 en un orden diferente. Por ejemplo, la subrutina puede hacerse mas iterativa. Por ejemplo, la subrutina 600 puede modificarse de modo que el sistema 100 determina, despues del acto 616, si debe modificar el numero de agrupaciones y, si es asf, volver al acto 608. La subrutina 600 tambien puede llamar a otras subrutinas para realizar diversas funciones.

La figura 21 es un diagrama de flujo que ilustra un ejemplo de subrutina 800 que puede ser empleada por un sistema de diagnostico, tal como el sistema de diagnostico 104 ilustrado en la figura 1, para definir una lmea centroide normal y un radio normal para un conjunto de agrupaciones.

La subrutina 800 comienza en 802 y avanza hasta 804. En 804, el sistema de diagnostico 104 identifica un conjunto de puntos de referencia. Por ejemplo, el sistema de diagnostico 104 puede identificar diez puntos de referencia seleccionados por un usuario despues de visualizar diversas representaciones del conjunto de datos. Como alternativa, el sistema de diagnostico 104 puede identificar una serie de puntos de referencia seleccionados estadfsticamente o identificar los puntos de referencia basandose en el analisis estadfstico combinado con las entradas de un usuario. En el estudio, un usuario selecciona los puntos de referencia despues de visualizar diversas representaciones graficas de los datos.

El sistema de diagnostico 104 avanza hasta 806, en donde define una lmea centroide de referencia basandose en el conjunto identificado de puntos de referencia. La figura 20 ilustra un ejemplo de una lmea centroide de referencia 702 definida basandose en los diez puntos identificados por el usuario en el estudio.

El sistema de diagnostico 104 avanza hasta 808, en donde determina el numero de agrupaciones en las que agrupar los datos. Por ejemplo, en el estudio, el sistema de diagnostico 104 agrupa los datos en cuatro agrupaciones basandose en las entradas del usuario.

El sistema de diagnostico 104 avanza hasta 810, en donde identifica los puntos centroides para el correspondiente numero de agrupaciones. Esto puede realizarse asignando cada punto a una agrupacion basandose en las entradas del usuario o en algoritmos estadfsticos o, como en el estudio, en una combinacion de ambos. Vease el analisis anterior de los algoritmos de agrupacion. Los respectivos valores de parametro para todos los puntos asignados a una agrupacion se suman, y despues el resultado se divide entre el numero de puntos en la agrupacion para obtener el valor de parametro para el punto centroide. Por ejemplo, si el sistema de diagnostico 104 determina, en el acto 808, que debe agrupar los datos en cuatro agrupaciones, el sistema de diagnostico 104 identificara cuatro puntos centroides, y cada punto se corresponded con una agrupacion.

El sistema de diagnostico 104 avanza hasta 812, en donde determina un correspondiente punto mas cercano en la lmea centroide de referencia para cada punto centroide identificado.

5

10

15

20

25

30

35

40

45

50

55

El sistema de diagnostico 104 avanza hasta 814, en donde calcula la diferencia entre cada punto centroide y el punto mas cercano en la lmea centroide de referencia. En el estudio, esto se realizo empleando la formula de la distancia cuadrada analizada anteriormente, sin ponderacion. Vease la ecuacion 1.

El sistema de diagnostico 104 avanza hasta 816, en donde ajusta los puntos de referencia basandose en los puntos centroides y los puntos de referencia mas cercanos empleando las entradas del usuario, el analisis estadfstico o una combinacion de ambos. En el estudio, la diferencia entre el punto centroide y el punto mas cercano de una agrupacion se sumaron a los puntos de referencia en esa agrupacion.

El sistema de diagnostico 104 avanza hasta 818, en donde redefine la lmea centroide de referencia usando los puntos de referencia ajustados y los puntos centroides para cada agrupacion. En el estudio, esto se realizo conectando las lmeas centroides para cada agrupacion empleando una curvatura geometrica. Un ejemplo de una lmea centroide de referencia redefinida se ilustra en la figura 20 como la lmea 704.

El sistema de diagnostico 104 avanza hasta 820, en donde define un radio para el conjunto de agrupaciones. Tal como se indico anteriormente, el radio puede ser una funcion de la posicion sobre la lmea centroide de referencia o en el espacio n-dimensional. La lmea centroide de referencia y el radio pueden formar diversas conformaciones de agrupaciones. Por ejemplo, la lmea centroide de referencia y el radio pueden definir agrupaciones esfericas, hiperesferas o hiperelipsoides. Las agrupaciones pueden tomar la forma de salchichas o barbas o diversas otras formas. En el estudio, el usuario introduce un radio para cada agrupacion en el conjunto de agrupaciones normales, y el radio es una distancia desde el punto mas cercano sobre la lmea centroide de referencia.

El sistema de diagnostico 104 avanza hasta 822, en donde determina si se cumple un criterio de error. Por ejemplo, el sistema de diagnostico 104 puede determinar si un numero estadfsticamente insignificante de puntos estan fuera de las agrupaciones definidas por la lmea centroide de referencia y el radio. Si el criterio de error se cumple, el sistema de diagnostico 104 avanza hasta 824, en donde la subrutina devuelve la lmea centroide definida y el radio para el conjunto de datos, asf como cualquier otra variable deseada. Si el criterio de error no se cumple, el sistema de diagnostico 104 avanza hasta 826, en donde ajusta el conjunto de datos. Por ejemplo, el sistema de diagnostico 104 puede determinar que los puntos estadfsticamente insignificantes en el conjunto de datos deben descartarse. El sistema de diagnostico 104 vuelve a 810 para volver a procesar el conjunto de datos ajustado.

En algunas realizaciones de un sistema 100, este puede realizar otros actos no mostrados en la figura 21, puede no realizar todos los actos mostrados en la figura 21, o puede realizar los actos de la figura 21 en un orden diferente. Por ejemplo, la subrutina puede hacerse mas iterativa. La subrutina 800 tambien puede llamar a otras subrutinas para realizar diversas funciones. Por ejemplo, la subrutina 800 puede llamar a un subrutina para determinar si las agrupaciones identificadas deben volver a agruparse, tal como la subrutina 900 ilustrada en la figura 22.

La figura 22 es un diagrama de flujo que ilustra un ejemplo de subrutina 900 que puede ser empleada por un sistema de diagnostico, tal como el sistema de diagnostico 104 ilustrado en la figura 1, para determinar si los puntos en un conjunto de datos estan contenidos dentro de un conjunto de agrupaciones definidas por una lmea centroide y un radio. Esta informacion puede ser utilizada por el sistema de diagnostico 104 para, por ejemplo, determinar si un conjunto definido de agrupaciones normales debe redefinirse porque demasiadas celulas se han clasificado como anomalas, o para detectar celulas anomalas en un conjunto de celulas de ensayo.

La subrutina comienza en 902 y avanza hasta 904. En 904, el sistema de diagnostico 104 recupera el conjunto de datos y avanza hasta 906. En 906, el sistema de diagnostico 104 fija un campo de datos asociado con cada punto del conjunto de datos para indicar que la subrutina aun no ha clasificado el punto, y avanza hasta 908.

En 908, el sistema de diagnostico 104 recupera los puntos asociados con una agrupacion seleccionada del conjunto de datos y avanza hasta 910. En 910, el sistema de diagnostico 104 determina si un punto no clasificado asociado con la agrupacion seleccionada esta dentro de la lmea centroide y el radio para la agrupacion seleccionada. Esto puede realizarse, por ejemplo, calculando la distancia entre el punto no clasificado y el punto mas cercano sobre la lmea centroide para la agrupacion, clasificando el punto como normal si la distancia es menor que el radio de la agrupacion en el punto mas cercano sobre la lmea centroide, y clasificando el punto como anomalo si la distancia no es menor que el radio de la agrupacion en el punto mas cercano sobre la lmea centroide.

Si el sistema de diagnostico 104 determina, en 910, que el punto esta dentro de la agrupacion seleccionada, el sistema de diagnostico 104 avanza hasta 912, en donde clasifica la celula como normal e indica que la celula ha sido clasificada. Si el sistema de diagnostico 104 determina, en 910, que el punto no esta dentro de la agrupacion seleccionada, el sistema de diagnostico 104 avanza hasta 914, en donde clasifica la celula como anomala e indica que la celula ha sido clasificada. Puede emplearse el mismo campo de datos para indicar si una celula no ha sido clasificada, si se clasificado como normal o si se ha clasificado como anomala. Como alternativa, pueden emplearse dos o mas campos de datos para indicar, respectivamente, si una celula ha sido clasificada y, si es asf, si la celula es normal o anomala.

El sistema de diagnostico 104 avanza de 912 o 914 hasta 916, en donde determina si todas las celulas asociadas con la agrupacion seleccionada han sido clasificadas. Si la respuesta en 916 es NO, el sistema de diagnostico 104 vuelve a 910. Si la respuesta en 916 es SI, el sistema de diagnostico 104 avanza hasta 918. En 918, el sistema de

5

10

15

20

25

30

35

40

45

50

55

60

diagnostico 104 determina si todas las agrupaciones en el conjunto de agrupaciones han sido procesadas. Si la respuesta en 918 es NO, el sistema de diagnostico 104 vuelve a 908. Si la respuesta en 918 es Sf, el sistema de diagnostico 104 avanza hasta 920, en donde la subrutina 900 se detiene.

En algunas realizaciones de un sistema 100, este puede realizar otros actos no mostrados en la figura 22, puede no realizar todos los actos mostrados en la figura 22, o puede realizar los actos de la figura 22 en un orden diferente. Por ejemplo, la subrutina 900 puede modificarse para que procese un conjunto de datos de modo secuencial, en lugar de procesar los datos agrupacion a agrupacion y sin fijar un indicador para saber si un punto de datos ha sido clasificado. La subrutina 900 tambien puede llamar a otras subrutinas, por ejemplo, la subrutina 900 puede llamar a un subrutina para calcular la distancia entre un punto y el punto mas cercano en una lmea centroide.

Los datos generados por el sistema 100, que incluyen los datos generados para definir un linaje celular normal y los datos procedentes de conjuntos de celulas de ensayo, pueden representarse en diversos formatos y emplearse para diversos objetivos. Por ejemplo, tal como se analizo anteriormente, los datos pueden presentarse como multiples proyecciones de 2 por 2 de los datos multidimensionales en un sistema de coordenadas cartesianas o como proyecciones pseudo-tridimensionales de los datos multidimensionales en un sistema de coordenadas cartesianas. Veanse las figuras 4-10 y 12-17, y 20, analizadas anteriormente. Pueden utilizarse colores o tonos para mostrar mas dimensiones. Estos metodos para mostrar los datos son particularmente utiles para el usuario para definir y redefinir un centroide y un radio normales para un linaje de maduracion dado.

Los datos tambien pueden presentarse como una grafica bidimensional de frecuencia celular continua a lo largo de una lmea centroide definida. La posicion a lo largo de la lmea centroide se corresponde con una medida del tiempo dentro del proceso de maduracion. Asf, puede generarse un histograma que muestre la distribucion de grupo de las celulas a lo largo del proceso de maduracion. Las figuras 23A y 23B (de modo colectivo figura 23) ilustran graficas de la frecuencia celular continua muestreada a lo largo de una lmea centroide normal definida para un linaje de celulas B linfoides. Un eje horizontal 1 se corresponde con la posicion a lo largo de la lmea centroide definida. Se identifican cuatro agrupaciones 2, 3, 4, 5, que se corresponden con estadios de maduracion, a lo largo del eje horizontal 1. Un eje vertical 6 se corresponde con el numero de puntos en el conjunto de datos en diversos puntos de muestras a lo largo de la lmea centroide. En la figura 23, se seleccionaron 108 puntos de muestras para la lmea centroide como sigue. Se identificaron diez puntos de referencia a lo largo de la lmea centroide. Se calcularon los puntos medios a lo largo de la lmea centroide para los diez puntos de referencia, que produjeron 19 puntos. Despues se calcularon seis puntos medios para los 19 puntos, que produjeron 108 puntos. Tambien se muestra el porcentaje del total de puntos de datos muestreados para cada agrupacion.

Pueden utilizarse mas espedmenes para definir el centroide normal y el radio. Por ejemplo, el proceso de paneles de cuatro colores y dos tubos descrito anteriormente puede utilizarse para tenir un numero mayor de espedmenes de medula osea que muestren una expresion normal del antfgeno. Estos espedmenes pueden seleccionarse del circuito de produccion habitual y pueden incluir espedmenes de donantes de medula osea, pacientes sin neoplasmas hematologicos, y pacientes que han recibido un transplante con 100% de quimerismo del donante que fueron trasplantados debido a enfermedades que no son ALL. Los espedmenes pueden incluir espedmenes pediatricos y de adulto. Estos otros espedmenes pueden ser aleatorios, o pueden seleccionarse con respecto a criterios deseados, tales como sexo, edad o grupo minoritario. Se espera que la seleccion por sexo, edad o grupo minoritario no produzca diferencias significativas en el centroide y el radio normales definidos para el linaje de maduracion de celulas B linfoides.

El conjunto de datos expandido puede utilizarse para evaluar la variabilidad de las posiciones de la agrupacion para los individuos de los que se recogieron espedmenes, asf como las diferencias en la composicion que se preven en un analisis habitual de espedmenes. El conjunto de datos tambien puede incluir y/o compararse con los datos de pacientes con espedmenes de medula osea anomalas que no son resultado de un proceso clonal o neoplasico, tales como espedmenes procedentes de pacientes en un momento cercano al transplante de celulas pluripotenciales que contienen solo las celulas mas inmaduras o pacientes tratados con rituxano (anti-CD20). En estos pacientes, el desarrollo de celulas B linfoides en la medula osea se ve truncado en el comienzo del estadio II, siendo eliminadas por el farmaco las celulas que expresan CD20. El conjunto de datos tambien puede compararse con espedmenes de sangre periferica que contienen solo celulas de estadio IV.

La figura 24 es un diagrama de flujo para un ejemplo de subrutina 1000 que puede ser empleada por un sistema de diagnostico, tal como el sistema de diagnostico 104 ilustrado en la figura 1, para comparar un conjunto de datos de ensayo con un conjunto normal de agrupaciones definidas por los puntos centroides. Esta informacion puede ser utilizada por el sistema de diagnostico para determinar, por ejemplo, si un conjunto normal de agrupaciones debe redefinirse.

La subrutina comienza en 1002 y avanza hasta 1004. En 1004, el sistema de diagnostico 104 recupera el conjunto de datos y avanza hasta 1006. En 1006, el sistema de diagnostico 104 asigna los puntos en el conjunto de datos de ensayo a agrupaciones, tal como se analizo anteriormente, y avanza hasta 1008. En 1008, el sistema de diagnostico 104 determina un punto centroide para cada agrupacion en el conjunto de datos de ensayo, tal como se analizo anteriormente. Por ejemplo, el sistema de diagnostico puede determinar los valores de parametro para el punto centroide de una agrupacion sumando los correspondientes valores de parametro para cada punto en la agrupacion

5

10

15

20

25

30

35

40

45

50

55

y dividiendo el resultado entre el numero de puntos en la agrupacion. Como alternativa, el sistema de diagnostico puede emplear un punto centroide estadfsticamente ajustado para el conjunto de datos de ensayo. El sistema de diagnostico 104 avanza desde 1008 hasta 1010.

En 1010, el sistema de diagnostico 104 determina los correspondientes puntos centroides estadfsticos para cada agrupacion basandose en conjuntos de datos previamente analizados. Por ejemplo, pueden determinarse los valores de parametro para un punto centroide estadfstico sumando los correspondientes valores de parametro para puntos centroides definidos para un conjunto de conjuntos de datos previamente analizados y dividiendo el resultado entre el numero de conjuntos de datos. El sistema de diagnostico 104 avanza desde 1010 hasta 1012.

En 1012, el sistema de diagnostico 104 determina si se cumple un criterio de error para una agrupacion en el conjunto de datos de ensayo. Por ejemplo, el sistema de diagnostico 104 puede comparar el logaritmo de la distancia entre el punto centroide de la agrupacion y el correspondiente punto centroide estadfstico con un valor umbral, tal como 2,5. Si el logaritmo de la distancia es mayor que el valor umbral, el sistema de diagnostico 104 puede determinar que no se ha cumplido el criterio de error. Pueden emplearse otros criterios de error.

Si el sistema de diagnostico 104 determina, en 1012, que el criterio de error para una agrupacion en el conjunto de datos de ensayo no se cumple, el sistema de diagnostico 104 avanza hasta 1014, en donde se fija una indicacion de un error para la agrupacion en el conjunto de datos de ensayo. Si el sistema de diagnostico 104 determina, en 1012, que el criterio de error para una agrupacion en el conjunto de datos de ensayo se cumple, el sistema de diagnostico 104 avanza hasta 1016, en donde se fija una indicacion de no error para la agrupacion en el conjunto de datos de ensayo.

El sistema de diagnostico 104 avanza desde 1014 o 1016 hasta 1018, en donde determina si todas las agrupaciones en el conjunto de datos de ensayo han sido evaluadas. Si el sistema de diagnostico 104 determina, en 1018, que no todas las agrupaciones han sido procesadas, entonces el sistema de diagnostico 104 vuelve a 1012. Si el sistema de diagnostico 104 determina, en 1018, que todas las agrupaciones han sido evaluadas, el sistema de diagnostico 104 avanza hasta 1020, en donde la subrutina 1000 se detiene.

En algunas realizaciones de un sistema 100, este puede realizar otros actos no mostrados en la figura 24, puede no realizar todos los actos mostrados en la figura 24, o puede realizar los actos de la figura 24 en un orden diferente. Por ejemplo, la subrutina 1000 puede modificarse para comparar secuencialmente todos los conjuntos de datos en un conjunto normal de conjuntos de datos para determinar cuales conjuntos de datos deben retirarse del conjunto normal de conjuntos de datos.

Tras haber definido los lfmites de la agrupacion (centroide normal y radio) para un linaje de maduracion normal, una muestra de ensayo puede analizarse sometiendola a la exposicion de los mismos reactivos y protocolos de medicion empleados con los conjuntos de datos utilizados para definir el linaje de maduracion normal. Los resultados para la muestra de datos de ensayo entonces pueden compararse con el linaje de maduracion normal definido, permitiendo que la muestra de ensayo sea caracterizada y diagnosticada. Solo es necesario proporcionar a un sistema, tal como el sistema 100 ilustrado en la figura 1, la definicion de los lfmites de agrupaciones normales para diagnosticar una muestra de ensayo. Como alternativa, al sistema 100 se le puede proporcionar el conjunto de datos normales definidos y la lmea centroide y el radio definidos, o al sistema 100 se le puede proporcionar el conjunto de datos normales definidos y puede determinar la definicion de los lfmites de las agrupaciones normales.

La figura 25 ilustra una estructura de datos 1100 adecuada para proporcionar las definiciones para los lfmites normales definidos para un linaje celular. La estructura de datos 1100 y las correspondientes instrucciones pueden ser almacenadas en un medio de lectura por ordenador, tal como una memoria, que puede incluir la memoria 112 ilustrada en la figura 1, o memorias portatiles, tales como CD ROM, disquetes y/o memorias flash, y/o pueden transmitirse como un senal en un medio de transmision de senales, tales como un medio cableado o sin cables. La estructura de datos 1100 tiene una seccion de cabecera 1102 que describe las localizaciones de las otras secciones de la estructura de datos 1100. Una seccion de texto 1104 contiene informacion que describe diversos aspectos de la estructura de datos 1100, tales como el numero de agrupaciones y la forma en que se definen la lmea centroide y el radio. Por ejemplo, la lmea centroide puede definirse proporcionando parametros para la insercion en una ecuacion o proporcionando puntos de referencia que se van a conectar entre sf, o una de sus combinaciones. De modo similar, el radio puede definirse proporcionando parametros para la insercion en una ecuacion o valores de radio fijados para una agrupacion, o una de sus combinaciones. Por ejemplo, el radio puede tener un valor fijado dentro de una agrupacion y puede ser una funcion de la posicion dentro de una segunda agrupacion. Una seccion de datos de centroide 1106 de la estructura de datos 1100 contiene informacion que define la lmea centroide, y una seccion de datos de radio 1108 contiene informacion que define el radio. Si se desea, puede proporcionarse un conjunto de datos normales para definir la lmea centroide y el radio normales, como un campo de datos adicional en la estructura de datos 1100 o en una estructura de datos separada, tal como la estructura de datos 200 ilustrada en la figura 2.

Las agrupaciones individuales tambien pueden dividirse en subagrupaciones, que pueden ser definidas y analizadas empleando procesos similares a los analizados anteriormente. Por ejemplo, la subrutina 800 ilustrada en la figura 21 puede modificarse para definir una lmea o punto centroide y un radio para una subagrupacion, y la subrutina 900

5

10

15

20

25

30

35

40

45

50

55

60

ilustrada en la figura 22 puede modificarse para determinar si un conjunto de celulas de ensayo contiene una subagrupacion que se corresponde con una subagrupacion definida. Se espera que la agrupacion con DBSCAN sea particularmente util para identificar subagrupaciones que se corresponden con un nivel de submaduracion dentro de una agrupacion que se corresponde con un nivel de maduracion dentro de un linaje celular.

Un sistema 100 puede utilizarse para diagnosticar un conjunto de datos de ensayo comparando el conjunto de datos de ensayo con la lmea centroide y el radio normales definidos para el linaje celular. El conjuntos de datos de ensayo completo puede compararse con el normal definido y mostrarse por medio de un sistema de diagnostico, tal como el sistema de diagnostico 100 en la figura 1, sobre un medio o dispositivo de presentacion adecuado, tal como un barrido de monitor, una presentacion de matriz activa o pasiva, o sobre un medio pasivo, tal como papel o papel vitela. Como alternativa, los datos de los acontecimientos en el conjunto de datos de ensayo dentro de posiciones "normales", espedficamente linfoblastos de linaje B, pueden restarse del conjunto de datos de ensayo, dejando un conjunto de datos "anomalo" que se corresponde con poblaciones residuales de celulas "anomalas" potenciales (linfoblastos leucemicos). El resto de los acontecimientos anomalos despues puede analizarse y mostrarse por medio de un sistema de diagnostico, tal como el sistema de diagnostico 104 en la figura 1, y el usuario. El resto de los acontecimientos anomalos puede definir un subconjunto anomalo del conjunto de datos de ensayo. Las tecnicas de agrupacion, tales como las analizadas anteriormente, pueden emplearse para identificar agrupaciones con el subconjunto anomalo del conjunto de datos de ensayo, y puede emplearse un analisis estadfstico para determinar si cualquiera de las agrupaciones identificadas dentro del subconjunto anomalo es significativa.

El sistema 100 puede ensayarse antes de ser empleado para diagnosticar canceres. Por ejemplo, una serie de espedmenes procedentes de paciente con ALL manifiesta puede tenirse y los datos pueden recogerse para la comparacion con los espedmenes normales. Se espera que estos espedmenes presenten celulas normales identificables que el sistema 100 pueda identificar, asf como celulas leucemicas positivas a CD19 que no se encuentren dentro de los lfmites definidos por la lmea centroide y el radio normales. Debe advertirse que todas las celulas leucemicas ALL del linaje B expresan CD19 y, por tanto, se incluiran dentro de la estrategia de establecimiento de una puerta original.

El ensayo del sistema 100 puede incluir mezclar diferentes proporciones de datos de todos los pacientes con ALL con espedmenes normales para imitar la deteccion de la enfermedad residual. Por ejemplo, el sistema 100 puede procesar 25 espedmenes normales y generar una lmea centroide y un radio definidos para un linaje de maduracion normal, que el sistema 100 puede almacenar en la memoria 112 como objetos digitales. Esta informacion puede autoconectarse con los algoritmos estadfsticos en el archivo de datos que contiene una agrupacion de celulas aberrantes. Los acontecimientos celulares confinados a la region de las agrupaciones normales pueden eliminarse y el resto de los acontecimiento representaran una agrupacion "anomala". El numero y la localizacion de las celulas tumorales previstas en la mezcla pueden compararse con las que ya se han identificado. Esto puede realizarse antes y despues de haber restado las celulas "normales" del conjunto de datos de ensayo.

Pueden emplearse algoritmos de nivelacion, que incluyen algoritmos de promediado y de filtracion, para nivelar la representacion de los datos. Por ejemplo, puede promediarse una porcion de una agrupacion. Por ejemplo, puede saberse que el nivel de maduracion promedio para una porcion de una agrupacion concreta es un indicador significativo de que la muestra es normal, pero que las varianzas individuales en esa porcion de la agrupacion no son significativas.

Los datos para dos conjuntos de datos pueden presentarse simultaneamente de esta manera. Por ejemplo, los datos de una muestra de ensayo pueden superponerse a los datos empleados para definir la lmea centroide normal. Puede emplearse un primer color u otro indicador para ilustrar la distribucion normal, y puede empelarse un segundo color u otro indicador para ilustrar la distribucion del especimen de ensayo.

Pueden emplearse presentaciones de los datos mas simplificadas y compararse para el impacto visual y la facilidad de interpretar el desarrollo normal y/o anomalo. Por ejemplo, las proporciones de celulas en cada uno de los cuatro estadios del linaje de celulas B linfoides puede representarse graficamente para representar las agrupaciones identificables en el espacio de datos. Los acontecimientos totales en cada una de las cuatro agrupaciones pueden presentarse para que representen la maduracion de las celulas dentro de la medula osea normal y/o para una muestra de ensayo frente a una representacion normal. Los parametros de las celulas anomalas que pueden representarse incluyen: numero de acontecimiento anomalos, distancia desde las normales, dispersion dentro de la poblacion anomala, y marcadores celulares que distinguen las celulas aberrantes de las normales.

La figura 26 ilustra un ejemplo de una representacion simplificada de datos obtenidos de una muestra de ensayo superpuesta a una representacion de un conjunto de datos normales definidos. Un eje horizontal 1 se corresponde con una indicacion de un nivel de maduracion de un linaje celular e indica cuatro estadios 2, 3, 4, 5, que se corresponden con agrupaciones de nivel de maduracion dentro del linaje celular. Un eje vertical 6 se corresponde con una indicacion de un numero de celulas a diversos niveles de maduracion. La indicacion puede ser, por ejemplo, un porcentaje del numero total de celulas dentro de un estadio o un indicador logantmico. Una banda 7 ilustra un intervalo normal definido para una muestra. La banda 7 puede corresponder, por ejemplo, a una desviacion estandar para un conjunto normal de celulas, o puede corresponderse con una lmea centroide y un radio definidos para un conjunto de celulas normal. Una lmea discontinua 8 ilustra los resultados para una muestra de ensayo.

5

10

15

20

25

30

35

40

Puede emplearse un proceso de control de calidad. Por ejemplo, pueden emplearse preparaciones de esferas para evaluar la actuacion del instrumento, tales como esferas Rainbow (RCP y RFP, Spherotech, Libertyville, IL) que son microesferas de plastico con un tinte embebido en el interior de la partfcula que asegura la estabilidad de la fluorescencia. Las esferas RFP solo presentan un unico pico en cada uno de los cuatro canales de fluorescencia y se emplean como patron primario. Las esferas RCP, una mezcla de esferas de seis intensidades observadas en todos los canales, actuan como patron secundario y proporcionan datos con respecto a la linealidad de cada uno de los detectores de fluorescencia. Se establece la compensacion espectral de emision de fluorescencia y se controla mediante la tincion de sangre normal con un anticuerpo anti-CD4 conjugado con cada uno de los cromoforos empleados (FITC, PE, PerCP, y APC). Las celulas tenidas con estos anticuerpos por separado se analizan para asegurar que se detecta la fluorescencia del cromoforo esperado solo en el canal de fluorescencia apropiado (24). Cada lote de reactivo empleado en la evaluacion de las celulas se titula antes de introducirse en el recuento. Se selecciona la titulacion del anticuerpo que produzca la fluorescencia maxima y se comprueba la especificidad del reactivo para cada nuevo lote de anticuerpos.

Empleando estos procedimientos de control de calidad, dos citometros de flujo generaron experimentalmente resultados identicos para el mismo especimen. En un estudio de sangre de adulto normal empleando estos procedimientos de control de calidad, se descubrio que la intensidad de CD4 sobre los linfocitos casi no vana para los 21 individuos ensayados en los dos instrumentos, recogida a lo largo de un periodo de ocho meses. El promedio de intensidad de fluorescencia de CD4 para estos 21 individuos fue de 1596 +/-116 desviacion estandar en unidades de fluorescencia, que produce una CV de 7%. Estos resultados demuestran que, en un espacio de datos con un intervalo dinamico de cuatro decadas, la variacion biologica de un individuo a otro para este antfgeno es fundamentalmente cero. La cantidad de CD4 expresado sobre los linfocitos es, en sf misma, un patron biologico. La cuantificacion de la posicion de la lmea centroide position (medida en celulas de medula osea inmaduras) puede compararse con la variabilidad de los antfgenos expresados sobre celulas de sangre maduras normales, lo cual proporcionara una base para comprender la variacion biologica entre individuos con respecto a la intensidad de expresion del antfgeno durante la maduracion de las celulas sangumeas, no solo en celulas maduras.

La tolerancia de un sistema, tal como el sistema 100 ilustrado en la figura 1, puede determinarse cambiando el valor diana para las esferas de control de calidad fluorescentes de patron primario en una cantidad conocida (factores de 2, y 4). En otras palabras, un sistema puede desafinarse por medio de cantidades conocidas. Cada canal puede ensayarse por separado y los canales pueden ensayarse juntos, despues de establecer la compensacion apropiada. Por ejemplo, pueden recogerse celulas de la medula osea tenidas con las combinaciones de cuatro colores para cada escenario y los datos pueden analizarse empleando el sistema que se va a ensayar. Esto evalua hasta donde puede alejarse de la conformacion optima del patron un sistema y seguir realizando la identificacion correcta de las celulas en los estadios del desarrollo por parte del sistema. Esta actuacion despues define la tolerancia requerida para un programa de control de la calidad basandose en la capacidad del sistema para identificar las poblaciones celulares apropiadas.

Tal como reconoceran los expertos en la tecnica, los anteriores metodos pueden emplearse en una serie de entornos que incluyen, pero no se limitan al diagnostico y el control de la enfermedad y del tratamiento.

Los anteriores ejemplos se ofrecen como ilustracion y no como limitacion. Por consiguiente, la invencion no esta limitada, excepto por las reivindicaciones adjuntas.

Claims

5

10

15

20

25

30

35

40

45

50

REIVINDICACIONES

1. - Un sistema de diagnostico que comprende un medio para llevar a cabo un metodo de caracterizacion de un conjunto de ensayo de celulas biologicas, que comprende:

a) cartografiar cada celula en el conjunto de ensayo de celulas biologicas a un punto correspondiente en un espacio n-dimensional, en el que n > 3 empleando un protocolo definido en el que al menos algunas de las n-dimensiones son datos de intensidad fluorescente de las celulas, y los puntos correspondientes forman un conjunto de ensayo de puntos;

b) comparar el conjunto de ensayo de puntos con un conjunto definido de agrupaciones de celulas biologicas normales, es decir, un conjunto definido de agrupaciones normales, en el espacio n-dimensional, en el que cada agrupacion en el conjunto definido de agrupaciones normales se corresponde con un nivel de maduracion dentro de un linaje celular, y en el que, para el conjunto de agrupaciones normales, se define una lmea centroide de referencia y un radio, y la lmea centroide de referencia y el radio forman diversas conformaciones de agrupaciones, en el que la lmea centroide de referencia para el conjunto de agrupaciones se basa en un conjunto de puntos de referencia, y en el que el radio es una funcion de una posicion en la lmea centroide de referencia, en el que la lmea centroide de referencia y el radio se ajustan de una manera iterativa empleando al menos un analisis estadfstico y la entrada de un usuario, en el que el ajuste incluye determinar una distancia desde un punto centroide identificado de cada agrupacion y un punto mas cercano en la lmea centroide de referencia;

c) determinar, para cada punto del conjunto de ensayo de puntos, basandose en la lmea centroide de referencia y el radio determinados, si se encuentra fuera del conjunto definido de agrupaciones normales basandose en la comparacion; y

d) caracterizar el conjunto de ensayo de celulas biologicas basandose al menos en parte en una determinacion de una cantidad de celulas anomalas en el conjunto de ensayo de celulas biologicas basandose en la determinacion de la etapa c).
2. - El sistema de diagnostico de la reivindicacion 1, en el que la lmea centroide de referencia para el conjunto de agrupaciones se basa en un conjunto de puntos de referencia y en los puntos centroides de las agrupaciones en el conjunto de agrupaciones normales.
3. - El sistema de diagnostico de la reivindicacion 1, que es para diagnosticar el cancer y comprende, ademas de las etapas de la reivindicacion 1, las siguientes etapas:

exponer cada celula en un conjunto normal de celulas biologicas a una pluralidad de cuatro o mas reactivos empleado un primer protocolo;

medir una correspondiente pluralidad de intensidades de fluorescencia de cada celula en el conjunto normal de celulas biologicas empleando un segundo protocolo;

cartografiar cada celula en el conjunto normal de celulas biologicas a un punto correspondiente en un espacio n- dimensional, basandose al menos en parte en la pluralidad de intensidades de fluorescencia medidas en la celula en el conjunto normal de celulas biologicas, en el que los puntos correspondientes forman un conjunto normal de puntos, en el que la definicion de la lmea centroide de referencia y el radio para el conjunto de agrupaciones normales se basa en el cartografiado del conjunto normal de puntos en el espacio n-dimensional;

exponer cada celula en el conjunto de ensayo de celulas biologicas a la pluralidad de reactivos empleando el primer protocolo;

medir una correspondiente pluralidad de intensidades de fluorescencia de cada celula en el conjunto de ensayo de celulas biologicas empleando el segundo protocolo;

cartografiar cada celula en el conjunto de ensayo de celulas biologicas a un punto correspondiente en un espacio n- dimensional, basandose al menos en parte en la pluralidad de intensidades de fluorescencia medidas en la celula en el conjunto de ensayo de celulas biologicas, en el que los puntos correspondientes forman un conjunto de ensayo de puntos;

comparar el conjunto de ensayo de puntos con el conjunto de agrupaciones normales; y caracterizar y diagnosticar el conjunto de ensayo de celulas biologicas basandose en la comparacion.
4. - El sistema de diagnostico de la reivindicacion 1, que comprende ademas las etapas de:

cartografiar cada celula en el conjunto normal de celulas biologicas a un punto correspondiente en un espacio n- dimensional utilizando el protocolo definido, en el que los puntos correspondientes forman un conjunto normal de puntos, en el que la definicion de la lmea centroide de referencia y el radio para el conjunto de agrupaciones normales en el espacio n-dimensional se basa en el cartografiado del conjunto normal de puntos en el espacio n-

dimensional.
5. - El sistema de diagnostico de la reivindicacion 1, que comprende ademas las etapas de:

representar el conjunto de ensayo en un diagrama de coordenadas cartesianas que comprende un primer eje que se corresponde con una maduracion de la celula dentro de un linaje celular, y un segundo eje que se corresponde con 5 una frecuencia de aparicion; y

representar, en el diagrama de coordenadas cartesianas, el conjunto de agrupaciones normales en el espacio n- dimensional.
6. - El sistema de diagnostico de cualquiera de las reivindicaciones anteriores para diagnosticar el cancer, en el que al menos una agrupacion en el conjunto de agrupaciones es un hiperelipsoide.

10