ES2283590T3 - Procedimiento para extraer caracteristicas de textura a partir de una imagen multicanal. - Google Patents

Procedimiento para extraer caracteristicas de textura a partir de una imagen multicanal. Download PDF

Info

Publication number
ES2283590T3
ES2283590T3 ES02762474T ES02762474T ES2283590T3 ES 2283590 T3 ES2283590 T3 ES 2283590T3 ES 02762474 T ES02762474 T ES 02762474T ES 02762474 T ES02762474 T ES 02762474T ES 2283590 T3 ES2283590 T3 ES 2283590T3
Authority
ES
Spain
Prior art keywords
image
binary
texture
channels
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES02762474T
Other languages
English (en)
Inventor
Heiko Kuziela
Matthias Grobe
Klaus Spinnler
Christian Muenzenmayer
Thomas Wittenberg
Robert Schmidt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Foerderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2283590T3 publication Critical patent/ES2283590T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/143Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30161Wood; Lumber

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Image Generation (AREA)

Abstract

Procedimiento para extraer características de textura a partir de una imagen (108), que comprende una pluralidad de puntos (x1/y1, x2/y2) de imagen, con las etapas siguientes: (a) para cada uno de la pluralidad de puntos (x1/y1, x2/y2) de imagen, comparar la intensidad de píxel del punto de imagen con un valor umbral, para generar una máscara (234, 236, 238; 252, 254) binaria, que para cada punto (x1/y1, x2/y2) de imagen presenta un primer valor binario, cuando la intensidad de píxel supera el valor umbral, o una segundo valor binario, cuando la intensidad de píxel no supera el valor umbral; caracterizado porque la imagen (108) es una imagen multicanal y la etapa (a) se repite para cada uno de los canales, para generar una máscara binaria para cada uno de los canales; y porque el procedimiento presenta además las etapas siguientes. (b) para cada uno de la pluralidad de puntos (x1/y1, x2/y2) de imagen de al menos dos canales diferentes, enlazar los valores binarios de manera lógica para el punto de imagen en la máscara binaria asociada con el primer canal con el valor binario para el punto de imagen en la máscara binaria asociada con el segundo canal, para obtener una imagen binaria entre planos; y (c) determinar una o varias características de textura a partir de la imagen binaria entre planos.

Description

Procedimiento para extraer características de textura a partir de una imagen multicanal.
La presente invención se refiere a un procedimiento para extraer características de textura a partir de una imagen multicanal, y en este caso especialmente a un procedimiento para extraer características de textura de color para la segmentación y clasificación automática.
En el procesamiento de imágenes médico e industrial se utilizan en los últimos tiempos cada vez más cámaras a color para la generación/toma de las imágenes que van a examinarse.
Aplicaciones médicas típicas de tales cámaras a color son, por ejemplo, la clasificación y segmentación de melanomas de la piel, la clasificación de células cancerosas y displásticas, por ejemplo de células del cuello uterino o del esputo, en la microscopia, o la diferenciación de mucosas o tejido sano, displástico o enfermo en exámenes endoscópicos de la cavidad bucal, tráquea, laringe, esófago, estómago e intestino. Ejemplos de una utilización industrial de tales cámaras son la clasificación y evaluación de troncos de madera por medio de su corteza o superficie de corte, el reconocimiento y separación automática de clases de desperdicios sobre una banda transportadora o el apoyo en la cartografía mediante tomas por satélite.
Tales imágenes a color obtenidas con cámaras a color pueden servir en los diferentes campos de aplicación mencionados como base para una clasificación así como para una segmentación de los contenidos de la imagen. En función del caso de aplicación y las condiciones marginales específicas se produce o bien una observación de la totalidad de la imagen o bien sólo de uno o más fragmentos de imagen, la denominada región de interés (ROI, Region Of Interest). Clasificación significa en este contexto la asociación de uno o varios objetos representados en la imagen con una clase específica. Por el contrario, por segmentación se entiende en este contexto la determinación de tales objetos mediante la integración práctica de puntos de imagen individuales para dar unidades (de objeto) mayores, es decir, una clasificación o asociación de puntos de imagen para dar las denominadas clases de objetos.
Como base para una clasificación de píxeles u objetos de este tipo sirven por norma general las denominadas características, que pueden calcularse a partir de intensidades de valor cromático o de valor de gris de puntos de imagen o grupos reducidos de puntos de imagen. El cálculo de tales características a partir de imágenes de valor de gris se basa a este respecto en una integración acertada de los valores de gris de los puntos de imagen del fragmento de imagen observado. Ejemplos de tales características sencillas son por ejemplo estadísticas de primer orden, como frecuencias de valores de gris (histogramas), valores medios y varianzas de los valores de gris observados en un fragmento de imagen de este tipo. Las características más complejas, con las que también pueden describirse y analizarse por ejemplo las denominadas texturas o superficies texturizadas, se basan por el contrario por ejemplo en estadísticas de orden superior, las denominadas características de Gabor o de Fourier, codificaciones de la longitud, características geométricas-estadísticas y similares. Ejemplos de tales estadísticas de orden superior para la descripción de superficies texturizadas se describen por ejemplo por R. M. Haralick, entre otros, en "Texture Features for Image Classification", IEEE Transactions on Systems, Man, and Cybernetics, vol. SMC-3, nº. 6, páginas 610-621, noviembre de 1973, por M. Unser en "Sum and Difference Histograms for Texture Analysis", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 8, nº 1 páginas 118-125, 1986 y por Y. Q. Chen, entre otros, en "Statistical Geometrical Features for Texture Classification", Pattern Recognition, vol. 28, nº 4, páginas 537-552, septiembre 1995.
La desventaja de estos enfoques conocidos se basa en que están limitados a la evaluación de intensidades, que se obtuvieron a partir de una toma de la imagen con un canal, y por tanto sólo permiten la determinación de características de textura en imágenes de este tipo. Sobre la base de las características de textura registradas de este modo puede realizarse entonces una clasificación de la forma habitual.
Sin embargo, al contrario que las imágenes de valor de gris, se observó que las imágenes a color y especialmente la información con respecto a la distribución estadística de los colores representan una herramienta de clasificación muy potente y útil, de modo que el aprovechamiento de la información de color, contenida en una imagen a color es deseable.
En el estado de la técnica se conocen diferentes enfoques, por medio de los cuales los enfoques anteriormente mencionados para la extracción de características de textura a partir de imágenes de valor de gris se transfieren a imágenes multicanal, por ejemplo imágenes espectrales con dos o más planos. Estos enfoques funcionan de tal manera que las etapas de análisis conocidas a partir de los enfoques con respecto al examen de imágenes de valor de gris se aplican por separado sobre cada uno de los canales de la imagen, es decir, sobre cada plano de imagen, y finalmente las características de textura resultantes se integran en una característica de textura total.
Este enfoque es desventajoso porque, en ese caso, se considera cada plano de imagen individualmente, de modo que de ningún modo se recurre a la información contenida en la distribución real de los colores de un punto de color a través de los planos para el análisis de características de textura, sino que únicamente se realiza, mediante una integración final de las características de textura generadas por separado, una combinación de la información de punto de imagen contenida en todos los canales de color. Así no se produce en este caso ningún enlace real de la información asociada con cada uno de los puntos de imagen en los diferentes planos, de modo que este enfoque en comparación con el "enfoque de valor de gris" habitual sólo conlleva mejoras insignificantes, pero que no justifican el elevado coste.
Partiendo de este estado de la técnica, la presente invención se basa en el objetivo de crear un procedimiento mejorado pata extraer características de textura a partir de una imagen multicanal, que considera la información de un punto de imagen contenida en cada canal de la imagen.
Este objetivo se resuelve con un procedimiento según la reivindicación 1.
La presente invención crea un procedimiento para extraer características de textura a partir de una imagen multicanal que comprende una pluralidad de puntos de imagen, con las etapas siguientes:
para cada uno de la pluralidad de puntos de imagen:
enlazar información de punto de imagen a partir de al menos dos canales de la imagen; y
determinar una o varias características de textura a partir de la información de punto de imagen enlazada de la imagen o de una ventana de imagen.
La presente invención se basa por tanto en imágenes que se tomaron con más de una banda espectral, por ejemplo, en imágenes espectrales con, por norma general, tres espectros (por ejemplo RVA), y enseña un enfoque que permite extraer, a partir de las imágenes espectrales registradas entre sí, características de textura, a las que se recurre para una segmentación de imagen y clasificación de objetos posterior.
El procedimiento según la invención está diseñado para, según un ejemplo de realización preferido, basándose en una toma de una imagen multicanal o una secuencia de imágenes, calcular características numéricas (índices) de la imagen total o subregiones formadas de manera arbitraria. La secuencia de imágenes o la imagen puede haberse generado mediante una toma de n canales, n \geq 2. El cálculo de las características numéricas para cada una de las regiones se produce incluyendo todos o una parte de los canales de la imagen, pudiendo contener cada uno de los canales datos de color o información de color o también otros datos/información multiespectral, como por ejemplo información con respecto a rayos IR, rayos UV, rayos X. Entonces puede recurrirse a las características así generadas con un clasificador cualquiera (por ejemplo, k-NN, polinomio y otros) para la clasificación o segmentación de la imagen o de la sección de imagen.
Según un ejemplo de realización preferido de la presente invención se repite la etapa del enlace, hasta que para todas las combinaciones de los diferentes canales de la imagen existe información de imagen enlazada. Basándose en las características de textura determinadas se genera un vector de características de textura total para la imagen multicanal o el fragmento de imagen multicanal, en el que están depositadas las características de textura individuales determinadas.
En un ejemplo de realización, en el que los canales de la imagen contienen información de color, estos canales pueden presentar información con respecto al color de la imagen, la luminancia y la crominancia de la imagen o la tonalidad, la saturación y el valor de la imagen.
De manera preferible, la etapa del enlace de la información de imagen comprende el enlace de información de punto de imagen de un punto de imagen de un primer canal de la imagen y de un punto de imagen de un segundo canal de la imagen, pudiendo estar el punto de imagen del segundo canal desplazado con respecto al punto de imagen del primer canal.
La información de punto de imagen es preferiblemente intensidades de píxel de los puntos de imagen asociados, es decir, las intensidades en los píxeles asociados en el canal correspondiente de la imagen.
Según un primer ejemplo de realización preferido de la presente invención pueden generarse en un fragmento de imagen histogramas de la suma y/o histogramas de la diferencia de las intensidades de píxel a partir de al menos dos canales, generándose características de textura basándose en los histogramas generados.
Según un segundo ejemplo de realización preferido, se generan para el enlace una o más máscaras binarias por canal, comparándose las intensidades de píxel en puntos de imagen asociados con un valor umbral. Preferiblemente, se genera una máscara binaria para cada uno de los canales de la imagen. De manera adicionalmente preferible, la generación de la máscara binaria comprende el enlace lógico de las intensidades de píxel a partir de al menos dos canales diferentes.
Con respecto a las imágenes o ventanas de imagen (fragmentos de imagen) observadas se hace referencia a que estos fragmentos de imagen observados pueden tener una forma arbitraria. La forma del fragmento de imagen observado puede estar adaptada especialmente a la forma del objeto, para el que van a determinarse características de textura. En el examen de núcleos celulares, la forma del fragmento de imagen observado puede seleccionarse de tal modo que sólo comprenda el núcleo celular de interés.
A continuación se explican con más detalle ejemplos de realización preferidos de la presente invención mediante los dibujos adjuntos. Muestran:
la figura 1, un diagrama de bloques de un procedimiento de clasificación y segmentación, que utiliza el algoritmo de textura según la invención;
la figura 2, un fragmento de imagen observado con una forma arbitraria o una imagen total observada (intensidad), en la que se basa la determinación de los histogramas;
la figura 3, una tabla con las características de histograma de la suma y de la diferencia según Unser, que se generan basándose en la imagen mostrada en la figura 2 y en la información de imagen contenida en la misma;
la figura 4, tres planos de un fragmento de imagen o de una imagen, que se obtienen mediante una toma en color, y en los que según un primer ejemplo de realización de la presente invención se basa la determinación de los histogramas;
la figura 5, una tabla en la que, para algunos valores cromáticos triviales, la conversión está integrada en L*u*v*;
la figura 6, el plano H y el plano V, en los que se calculan los histogramas de la suma y de la diferencia según una implementación alternativa del primer ejemplo de realización;
la figura 7, la generación de una pila de máscaras binarias a partir de una imagen de valor de gris para la generación de características de nivel de grises geométricas estadísticas;
la figura 8, una tabla con valores típicos para un valor \alpha_{0} umbral inicial, de la magnitud \Delta\alpha del nivel y del número de intensidades así como del número de las imágenes G binarias que pueden generarse con ello;
la figura 9, una tabla de las características estadísticas según Chen, que se derivan basándose en las propiedades geométricas a partir de la pila binaria representada en la figura 7;
la figura 10, la generación de pilas binarias combinadas a partir de n=3 planos de una imagen, para generar características entre planos geométricas estadísticas según un segundo ejemplo de realización de la presente invención;
la figura 11, la generación de pilas binarias combinadas para el cálculo de características geométricas estadísticas a partir de una imagen HSV según una implementación alternativa del segundo ejemplo de realización, obteniéndose la representación H’V, sometiendo una tonalidad con respecto a la saturación a una operación de valor umbral;
la figura 12, una tabla de un conjunto de prueba de BarkTex (BKV), siendo las clases de texturas seis tipos diferentes de árboles, de los que se tomaron 68 muestras;
la figura 13, una tabla de un conjunto de prueba de madera, en la que se muestran clases defectuosas junto con el número de ejemplares;
la figura 14, una tabla con los mejores resultados de la clasificación que se obtienen basándose en la extracción de características entre planos según el primer ejemplo de realización;
la figura 15, una tabla con los mejores resultados de la clasificación que se obtienen basándose en la extracción de características de distancia Euclídea según el primer ejemplo de realización;
la figura 16, una tabla con los mejores resultados de la clasificación que se obtienen basándose en la extracción de características H’V no lineales según el primer ejemplo de realización utilizando diferencias entre planos (arriba) en el plano V y medidas de diferencia trigonométricas en el plano H (abajo);
la figura 17, una tabla con los mejores resultados de la clasificación que se obtienen basándose en la extracción de características ampliada a color según el primer ejemplo de realización, siendo las medidas \Deltar de mejora relativas a las mejores tasas de escala de grises;
la figura 18, una tabla con los mejores resultados de la clasificación que se obtienen basándose en la extracción de características de SGF entre planos según el segundo ejemplo de realización, que se aplican en el espacio de color RVA; y
la figura 19, una tabla con los mejores resultados de la clasificación que se obtienen basándose en la extracción de características de SGF de H’V no lineales según el segundo ejemplo de realización.
La figura 1 muestra un diagrama de bloques de un procedimiento de clasificación y segmentación, que utiliza el algoritmo de reconocimiento de texturas según la invención. Tal como puede observarse en la figura 1, el procedimiento comprende un primer nivel I, el nivel de aprendizaje, y un segundo nivel II, el nivel de clasificación y segmentación. En el primer nivel I se establecen en primer lugar parámetros de características conocidos (véase el bloque 100). Estos parámetros de características son condiciones marginales para el cálculo de características de textura. En el bloque 102 se registran los datos de aprendizaje, proporcionando imágenes o fragmentos de imagen conocidos con texturas conocidas (clasificadas), es decir, muestras ya clasificadas. La imagen ya clasificada proporcionada en el bloque 102 se proporciona al algoritmo de textura de color según la invención en el bloque 104 junto con los parámetros de características conocidos, con lo que se generan las características numéricas (vector de características) para la textura conocida, contenida en la imagen 102, que luego se depositan para esta textura en la base 106 de datos de características de aprendizaje.
En el segundo nivel II se introduce una imagen 108 o un fragmento de imagen desconocida en el procedimiento, y se aplica el algoritmo de textura de color según la invención en el bloque 110 sobre la imagen 108 desconocida, obteniendo el algoritmo de textura de color los parámetros de características existentes de la base 100 de datos. Basándose en el examen de la imagen 108 desconocida por medio del procedimiento según la invención y basándose en los parámetros de características proporcionados se genera un vector de características que contiene las diferentes características halladas mediante el algoritmo de textura de color en la imagen 108 desconocida. Este vector de características se dirige a una clasificación en el bloque 112, en el que basándose en información de la base 106 de datos se realiza la clasificación del vector de características, para así realizar o bien una clasificación 114 de toda la imagen 108 o bien una segmentación 116 mediante la clasificación de puntos de imagen individuales de la imagen 108 o del fragmento de imagen.
Los algoritmos de textura de color mencionados en los bloques 104 y 110 se basan en el procedimiento según la invención, según el cual, para una imagen multicanal, tal como por ejemplo una imagen espectral, para cada uno de los puntos de imagen se enlaza información de punto de imagen a partir de al menos dos canales de color de la imagen, para a partir de ello determinar una o varias características de textura. Estas características de textura se integran a continuación en el vector de características y se dirigen a la clasificación.
Mediante los dibujos siguientes se realiza ahora una descripción de ejemplos de realización preferidos del procedimiento según la invención, que se implementa en los algoritmos 104, 110.
Primer ejemplo de realización
A continuación se describe con más detalle en primer lugar un primer ejemplo de realización de la presente invención, en el que la clasificación se basa en características que se obtienen basándose en histogramas de la suma y/o histogramas de la diferencia de las intensidades de píxel en puntos de imagen asociados en al menos dos canales / de al menos dos planos. Sin embargo, en primer lugar se explica el enfoque conocido para imágenes de intensidad, que se explica con más detalle por M. Unser en "Sum and Difference Histograms for Texture Analysis", IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 8, nº 1 páginas 118-125, 1986.
Las estadísticas de orden superior ya explicadas con brevedad anteriormente utilizan dos histogramas unidimensionales (histograma de la suma y de la diferencia). A este respecto, se trata de histogramas que cuentan la frecuencia de sumas y diferencias de las intensidades I(x_{1}, y_{1}) e I(x_{2}, y_{2}) de píxel con un determinado desplazamiento (d_{x}, d_{y}). Estos se definen como sigue:
1
con:
i = 0,..., 2(G-1),
j = -G+1,..., G-1
G = nivel de intensidad máximo por canal de imagen, por ejemplo 256 intensidades,
I = intensidad,
x_{i} y_{i} = coordenadas de un punto observado en la imagen,
D = fragmento de imagen,
h_{S} = histograma de la suma, y
h_{D} = histograma de la diferencia.
Estos valores medidos presentan el número de pares de píxeles en un fragmento D de imagen (ROI = región de interés), que presentan una suma con el valor i o una diferencia con el valor j. Ambos histogramas presentan 2G-1 entradas (bins, intervalos) que corresponden a las 511 entradas, cuando se suponen imágenes con G = 256 intensidades (por ejemplo niveles de grises). La cuantificación hasta N entradas puede realizarse con respecto a los histogramas también mediante redondeo utilizando la ecuación siguiente:
2
\vskip1.000000\baselineskip
con:
N = número total de los valores medidos, y
D_{max} = valor máximo de la suma o de la diferencia.
La independencia de las entradas h_{S}(i) y H_{D}(j) de histograma se consigue mediante normalización con el número total de valores N medidos del fragmento de imagen observado:
\vskip1.000000\baselineskip
3
con:
P_{S} = histograma de la suma normalizado, y
P_{D} = histograma de la diferencia normalizado.
El vector (d_{x}, d_{y}) de desplazamiento puede representarse mediante d = radio y \theta = ángulo (véase la figura 2). La figura 2 muestra un fragmento de imagen observado o una imagen D total observada (valor de gris), en la que se muestran tanto los puntos x_{1}/y_{1}, x_{2}/y_{2} de imagen observados (par de píxeles) como un vector 200 que une los puntos de imagen. Con los histogramas de la suma y de la diferencia se estiman estadísticas de segundo orden de los pares (d, \theta) desplazados. En general es suficiente utilizar para el ángulo \theta valores = 0, \pi/4, \pi/2,3 \pi/4 para un radio d determinado y calcular las características para cada uno de los histogramas por separado. Para introducir un grado determinado de una invarianza por rotación, es posible acumular histogramas por las cuatros direcciones y luego calcular las características.
Basándose en los histogramas descritos anteriormente se determinan 15 características, que se muestran en la tabla de la figura 3. Estas características describen las propiedades de una textura utilizando por ejemplo momentos y medidas entrópicas. El valor medio de la diferencia y la varianza (c_{4}, c_{5}) caracterizan la diferencia de intensidad media entre píxeles contiguos y cómo de uniforme es esta diferencia. Por ello, un valor grande de c_{4} es una indicación de una imagen con un contraste elevado y muchas aristas. De manera análoga, se aplican el valor medio y la varianza al histograma (c_{0}, c_{1}) de la suma, aunque sin una interpretación visual evidente. Los vértices concentrados en los histogramas se evalúan a través de las medidas (c_{2}, c_{6}) de energía, que darán valores grandes para zonas homogéneas en los histogramas de la diferencia con un vértice en d = 0. Con las entropías (c_{3}, c_{7}) y la característica (c_{14}) derivada se utilizan medidas teóricas de información, con lo que se valora, cómo de determinista es el aspecto de una textura. Claramente intuitiva es la característica (c_{10}) de contraste, que pondera la aparición de diferencias de intensidad elevadas de manera desproporcionada. Estas características también se denominan características básicas.
Según el primer ejemplo de realización de la presente invención se evitan las desventajas descritas anteriormente de la utilización del "enfoque de valor de gris" que acaba de describirse para la clasificación, histogramas de la suma y/o histogramas de la diferencia, porque este enfoque se amplía a la observación de varios planos. Para cubrir también dependencias estadísticas entre los planos, se determinan las características de textura basándose en las características descritas anteriormente con respecto a diferentes planos (entre planos). Esto se denomina a continuación también el procedimiento entre planos.
Mediante la figura 4 se describen estos histogramas de la suma y de la diferencia ampliados al espectro y al plano. En la figura 4 se muestran tres planos 202, 204, 206 (por ejemplo R, V, A), que se obtienen mediante una toma a color de la imagen o del fragmento de imagen. En cada uno de los planos 202, 204, 206 (también denominados canales) se muestran píxeles individuales, de manera similar a la figura 2, y se representan mediante sus coordenadas x,y. Mediante las flechas 208, 210, 212 se indica el procesamiento de solapamiento entre planos. En el ejemplo de realización representado existe un enlace de un punto x_{1}/y_{1} de imagen en el primer plano 202 con un punto x_{2}/y_{2} de imagen en el segundo plano 204 (véase la flecha 208), que puede estar desplazado (d) del punto x_{1}/y_{1} de imagen en el primer plano 202, y con un punto x_{2}/y_{2} de imagen en el tercer plano 206 (véase la flecha 210), que puede estar desplazado del punto x_{1}/y_{1} de imagen en el primer plano 202 (con la misma magnitud d). Además existe un enlace de un punto x_{1}/y_{1} de imagen en el segundo plano 204 con un punto x_{2}/y_{2} de imagen desplazado con respecto al mismo en el tercer plano 206 (véase la flecha 212). El desplazamiento se establece mediante el parámetro d.
Los histogramas de la suma y de la diferencia entre planos se definen tal como sigue:
\vskip1.000000\baselineskip
4
con:
p, q = plano, canal con p \neq q,
i = 0,..., 2(G-1),
j = -G+1,..., G-1,
G = valor cromático máximo
I(p) = intensidad de un punto de imagen en el plano p en la posición x_{i}/y_{i},
I(q) = intensidad de un punto de imagen en el plano q en la posición x_{i}/y_{i},
x,y = coordenadas de un punto observado en la imagen,
D = fragmento de imagen,
h_{S} = histograma de la suma ampliado, y
h_{D} = histograma de la diferencia ampliado.
Debido a la propiedad asociativa de la suma y la resta, en el ejemplo de una imagen de tres canales (canales 1, 2 y 3) sólo son necesarios tres pares
- h_{S}^{(12)}, h_{D}^{(12)}
- h_{S}^{(13)}, h_{D}^{(13)}
- h_{S}^{(23)}, h_{D}^{(23)}
en una toma en tres canales espectrales. Para el procedimiento entre planos con tres planos, el vector de características es tres veces más largo que en el enfoque original, anteriormente descrito. Se indica que para características entre planos también puede haberse elegido un desplazamiento de d = 0 con una dirección \theta indefinida. En este caso se explica la correlación directa entre los puntos de imagen entre los canales en cada posición x_{1}/y_{1} de píxel. El desplazamiento d y la dirección \theta son, para este ejemplo de realización, las condiciones marginales mencionadas anteriormente (véase el bloque 100 en la figura 1).
Además de generar los histogramas mediante las características descritas anteriormente, lo que representa la posibilidad primaria para ampliar las características, pueden introducirse también características de color específicas nuevas. A partir de la tabla 3 puede deducirse que las características c_{12}, c_{13} y c_{14} se derivan a partir de los dos histogramas (histograma de la suma y de la diferencia). En vez de aplicar sólo el conjunto básico de características \{c_{i}\} en los histogramas de cada plano por separado, pueden construirse ahora características nuevas. Éstas están definidas por la combinación de características derivadas a partir de histogramas de planos diferentes, que dan lo siguiente:
5
\vskip1.000000\baselineskip
Ahora hay disponibles características nuevas en la imagen multiespectral, que pueden calcularse para cada dirección \theta. Cuando no se utiliza ninguna acumulación de los histogramas, esto lleva a 36 denominadas características de histograma cruzado.
Un segundo grupo de características nuevas se basa en la correlación cruzada entre los histogramas de los diferentes planos. Las características de rendimiento cruzado se definen tal como sigue:
6
\vskip1.000000\baselineskip
cuando p \neq q.
Más concretamente, se trata en este caso de seis características para cada una de las cuatro direcciones \theta, cuando se aplican a una imagen RVA, lo que en total lleva a 24 características. Evidentemente podrían definirse más características, y estas características pueden aplicarse al procedimiento entre planos y los procedimientos descritos a continuación.
Un ejemplo de realización adicional para introducir información espectral en la extracción de características es la utilización de una medida de distancia en el espacio de color. La medida L2 (distancia Euclídea) se utiliza para calcular una medida escalar a partir de los valores espectrales de un par de píxeles. En una imagen multiespectral con los planos I^{(p)} de color la norma L2 de un vector de color se define como sigue:
7
Por tanto, se utiliza la norma del vector de la suma en la definición de los histogramas de la suma con:
8
\vskip1.000000\baselineskip
con:
i = 0,...,2(G-1)\surd3
Debido a los diferentes valores de extremo de la norma de un vector de suma y uno de diferencia la longitud de los histogramas es distinta. Independientemente de ello, la diferencia sólo adoptará valores positivos, cuando se utilice simplemente la norma del vector de diferencia, que se define como
9
\newpage
Por tanto se utiliza la dirección del vector de diferencia mediante la modificación del signo, cuando la mayoría de los elementos de vector es negativa. Omitiendo la indexación de coordenadas esto puede formularse en el espacio RVA como
\vskip1.000000\baselineskip
10
\vskip1.000000\baselineskip
cuando d^{(p)} = I^{(p)}(x_{1}, y_{1}) - I^{(p)}(x_{2}, y_{2}) son las diferencias de plano escalar. Por tanto los histogramas de la diferencia pueden definirse utilizando la norma L2 tal como sigue:
\vskip1.000000\baselineskip
11
\vskip1.000000\baselineskip
cuando j = -(G-1)- \surd3,..., (G-1)- \surd3. Para una imagen con tres canales de 8 bits estos corresponde a histogramas de 883 entradas. Dado que la norma L2 lleva en la mayor parte de los casos a números fraccionados, éstos se asocian simplemente con una entrada de número entero (bin, intervalo) mediante redondeo.
Con la percepción de espacios de color uniformes de manera reconocible se conoce para su propiedad, que los espaciamientos en el espacio de color están relacionados estrechamente con la percepción humana. Motivado por el hecho, de que la distancia Euclídea en el espacio L*u*v* corresponde al espaciamiento perceptible del ser humano convencional, esta medida de espaciamiento se aplica a la representación L*u*v* para un cálculo de las características.
El espacio L*u*v* se normalizó en 1976 por la CIE y se deriva del espacio XYZ con un punto (X_{n}, Y_{n}, Z_{n}) de referencia blanco, que es el vector (1, 1, 1) RVA normalizado transformado. Para la descripción adicional se supone la definición siguiente:
\vskip1.000000\baselineskip
12
\vskip1.000000\baselineskip
La componente L* de luminosidad se indica tal como sigue:
\vskip1.000000\baselineskip
13
\vskip1.000000\baselineskip
Para calcular las componentes u* y v* de crominancia son necesarios algunas magnitudes intermedias. Si u’_{n}, v’_{n} sólo dependen del punto blanco de referencia, es válido:
\vskip1.000000\baselineskip
14
15
\vskip1.000000\baselineskip
El carácter no lineal en una medida considerable del espacio L*u*v* puede visualizarse mediante la conversión de los colores del cubo RVA discreto y mediante la aplicación de los resultados. Para algunos valores cromáticos triviales la conversión en L*u*v* se resume en la tabla en la figura 5. Los valores en negrita muestran los valores mínimos o máximos en el espacio L*u*v*. El color negro con una intensidad cero en todos los canales es una singularidad, que lleva a las componentes u*v* no definidas.
En estos valores de extremo la distancia de color Euclídea lleva a los valores máximos siguientes de la distancia o de la suma:
\vskip1.000000\baselineskip
16
\vskip1.000000\baselineskip
con 1 \in {L*u*v*}.
Por tanto, es válido el histograma de la suma en el intervalo [0; 485] y el histograma de la diferencia en [-368; 368] mediante el redondeo de los valores máximos al siguiente número total superior. Una longitud común de histogramas de la suma y de la diferencia se obtiene en la implementación mediante la extensión del histograma de la suma hasta [0, 736].
En lugar del espacio de color RVA correlacionado y simétrico en una medida considerable el modelo de color HSV (HSV = tonalidad, saturación, valor) también puede utilizarse en la clasificación de la textura.
El valor H de tonalidad es una medida angular alrededor del eje V en un sistema de coordenadas cilíndrico, pudiendo estar representado este modelo mediante un cono hexagonal. La representación de rojo, que comienza con un ángulo de 0, está seleccionada según diferentes definiciones en la bibliografía de una manera más o menos arbitraria. El valor V mide la luminosidad y S la saturación de color o la pureza de la tonalidad. Los valores de gris, para los que es válido R = G = B, son singularidades en el espacio HSV y por tanto pueden encontrarse en el eje V, si S = 0 y H no está definido. Una singularidad adicional es V = 0, lo que es negro puro. Para la presente descripción se utiliza una conversión utilizando los r, g, b \in [0; 1] normalizados:
17
La figura 6 muestra los dos planos o canales 214 216 que existen en este principio, el plano H y el plano V con los puntos x_{1}/y_{1}, x_{2}/y_{2}.
Para valores de saturación reducidos la tonalidad reacciona con una sensibilidad elevada a un ruido de detector en la imagen. Por tanto, para la clasificación de la textura sólo se utiliza la información del canal H, si se supera un valor S_{min} umbral de saturación determinado. Por el contrario el conjunto H se establece en un valor arbitrario, aunque constante, por ejemplo
18
La transferencia de los histogramas de la suma y de la diferencia al espacio HSV puede ser difícil, dado que el canal H es una representación angular. Los valores de la tonalidad varían entre 0 y 2\pi, que es la misma tonalidad. Esta dificultad se soluciona, cuando las definiciones anteriores se utilizan para los histogramas de la suma y de la diferencia. Por tanto se utiliza una medida de distancia, que es máxima para \Deltah = \pi:
19
Para la suma puede superarse el intervalo de [0; 2\pi], aunque se utiliza una medida, que es máxima para H_{1} + H_{2} mod 2\pi = \pi. Ha de tenerse en cuenta, que la operación de módulo está implícita en el cálculo del seno:
20
Para crear histogramas discretos estas definiciones se ajustan a escala en al mismo intervalo que en el caso del nivel de grises, que asciende a [-255; 255] o [0; 510]:
\vskip1.000000\baselineskip
21
Las características se definen entonces a partir de los histogramas de la suma y de la diferencia en el plano H’ y V tal como sigue:
22
Segundo ejemplo de realización
A continuación se describirá más detalladamente un segundo ejemplo de realización de la presente invención, en el que la clasificación se basa en una máscara binaria, que se obtiene mediante la comparación de las intensidades de píxel con puntos de imagen asociados en diferentes planos con un valor umbral. En primer lugar se explica de nuevo un enfoque conocido para imágenes de nivel de grises.
Una clase geométrica de algoritmos de textura se basa en el denominado enfoque de solución SGF (SGF = Statistical Geometrical Feature, características geométricas estadísticas) que se describe con más detalle por Y. Q. Chen, entre otros en "Statistical Geometrical Features for Texture Classification", Pattern Recognition, vol. 28, nº 4, páginas 537-552, septiembre de 1995. Según este enfoque se calculan 16 características estadísticas basándose en las propiedades geométricas de intervalos de puntos de imagen relacionados entre sí en una serie de imágenes binarias. Estas imágenes binarias se generan mediante una operación de valor umbral con respecto a la imagen de intensidades. Se utilizan propiedades geométricas, como el número de intervalos relacionados y su irregularidad junto con sus estadísticas (desviación media, desviación estándar), que describen la pila de imágenes binarias.
La figura 7 muestra una imagen 218 de nivel de grises, a partir de la que se genera una pila binaria con tres máscaras 220, 222, 224 binarias mediante la operación de valor umbral. A partir de las máscaras 220, 222, 224 binarias se determina el vector 226 de características para la clasificación siguiente. Tras la binarización con valores umbral diferentes se calculan características geométricas estadísticas a partir de la pila de imágenes binaria.
Para una imagen I(x,y) con G niveles de grises puede obtenerse una imagen I_{B}_{\alpha}(x,y) binaria mediante operaciones de valor umbral con un valor umbral \alpha \in [1; G-1], lo que lleva a
23
La pila de todas las G-1 imágenes I_{B}_{\alpha}(x,y) binarias posibles con \alpha = 1, ..., G-1 es igual a la imagen original sin pérdida de información porque
24
Esto se debe a que para un píxel con I(x,y) = k exactamente k imágenes binarias con \alpha \leq k presentarán un valor de 1 en esta posición. Una pérdida de cálculo de características de información no constituye sin embargo ningún motivo de preocupación, dado que se mantiene la información discriminante entre diferentes clases de texturas. Por tanto, también puede utilizarse un conjunto reducido de niveles de binarización, que se parametriza mediante un umbral \alpha_{0} inicial y una magnitud \Delta\alpha del nivel. La serie de imágenes de valor umbral se obtiene por
25
con i = 0,..., L_{intervalos}-1. El umbral \alpha_{0} inicial y la magnitud \Delta\alpha del nivel son para este ejemplo de realización las condiciones marginales anteriormente mencionadas (véase el bloque 100 de la figura 1).
Valores típicos para estos parámetros así como el número de máscaras binarias que puede generarse con ellos se muestran en la tabla de la figura 8. El número de imágenes L_{intervalos} binarias, que teniendo en cuenta el comportamiento de clasificación debería ser lo más pequeño posible en contraposición a la complejidad del tiempo de propagación, se determina por
26
Dentro de una imagen binaria cualquiera, se extraen intervalos relacionados, que utilizan vecindades de cuatro, a partir de los píxeles de valor uno o de valor cero. Utilizando estos intervalos el número de intervalos (NOC) relacionados de los píxeles de valor k con k \in (0, 1) se denomina con NOC_{k}(\alpha). El número total de píxeles de valor k dentro de un intervalo R_{i} se denomina como NOP_{k}(i, \alpha) = |R_{i}|. Adicionalmente la irregularidad (IRGL) de cada intervalo R_{i} se define tal como sigue:
27
en la que
28
son los centros de gravedad del intervalo correspondiente. Ahora se calcula para cada umbral \alpha la irregularidad media ponderada de intervalos dentro de la imagen I_{B}_{\alpha}(x, y) binaria correspondiente tal como sigue:
29
determinándose la ponderación mediante el número de píxeles NOP_{k}(i, \alpha) dentro de un intervalo R_{i} cualquiera. A partir de las cuatro funciones NOC_{0}(\alpha), IRGL_{0}(\alpha) y IRGL_{1}(\alpha) se obtienen cuatro medidas estadísticas, que se reproducen en la tabla de la figura 9, siendo g (\alpha) una de las cuatro funciones de \alpha. Esto lleva a una cantidad total de 16 características, que son representativas de diferentes texturas. Las características, que se derivan a partir de las funciones NOC_{0}(\alpha) y NOC_{1}(\alpha), que son los números de intervalos relacionados por nivel de binarización, describen el grosor de partícula de una textura. Los valores medios grandes de estos parámetros pueden interpretarse como un gran número de intervalos, que representan una estructura fina. La desviación estándar por NOC describe la varianza para diferentes umbrales y por tanto, cómo de intensas son las diferencias de niveles de grises contiguos.
Además las medidas de irregularidad permiten una caracterización del aspecto de la textura con respecto a estructuras compactas pequeñas tales como grava o estructuras largas como por ejemplo superficies de grabado en madera.
Según el segundo ejemplo de realización de la presente invención se evitan las desventajas del enfoque recién descrito para la determinación de las características necesarias para una clasificación, porque este enfoque se amplía a la observación de varios planos. De manera similar al enfoque entre planos anteriormente descrito, que se utiliza para las características de histograma de la suma e histograma de la diferencia, puede utilizarse una operación binaria entre las representaciones intermedias (planos), para registrar las dependencias entre planos. Las tres operaciones booleanas básicas Y, O y XOR se presentan como solución.
La figura 10 muestra, cómo por ejemplo a partir de tres planos (por ejemplo RVA) de una imagen se generan pilas binarias combinadas, para generar características entre planos geométricas estadísticas. En la figura 10 se muestran tres planos 228, 230, 232, que se obtienen con una toma de características de la imagen. Para cada uno de los planos se genera una pila 234, 236, 238 binaria con una pluralidad de máscaras binarias, enlazando las intensidades a partir de los planos individuales mediante operaciones booleanas, tal como se muestra en la figura 10 con 240, 242, 244. Más concretamente, tras la operación de valor umbral se aplica una operación booleana entre los diferentes planos 228, 230, 232 y las pilas 234, 236, 238 binarias resultantes (pilas de imágenes) se utilizan para el cálculo de características.
Para una imagen I(x,y) a color con índices de canal p \neq q, pueden obtenerse imágenes I^{(pq)}_{B}_{\alpha}(x,y) entre planos binarias mediante
30
siendo \odot una de las operaciones booleanas Y, O y XOR y p,q \in {R,G,B}. En el espacio de imagen con tres canales esto lleva a tres pilas o máscaras I^{(pq)}_{B}_{\alpha} binarias para un cálculo de características. A partir de aquí se obtienen los vectores 246, 248, 250 de características, que se encadenan, lo que da lugar a 48 características.
Las imágenes I^{(pq)}_{B}_{\alpha} intermedias no tienen que calcularse de manera explícita. Por tanto en este caso para cada operación \odot booleana se indican formulaciones alternativas. Por motivos de brevedad se omite una indexación (x,y) de las coordenadas. El enlace Y puede implementarse mediante una operación de mínimo y una comparación posterior, si
31
Puede estar prevista una formulación similar utilizando la operación de máximo para el enlace O:
32
Sólo el enlace XOR requiere como caso especial dos operaciones de comparación y por tanto se formula tal como sigue:
33
Según una operación de mínimo el enlace Y produce intervalos de valor uno más pequeños que el enlace O, que utiliza el valor máximo de dos intensidades de canal. Si sólo uno de los colores básicos (RVA) es dominante o débil, se obtienen por tanto a partir de la operación de valor umbral intervalos homogéneos mayores. El enlace XOR más complejo conserva no obstante estructuras con colores básicos dominantes, aunque suprime intervalos con valores cromáticos similares o mezclados.
De manera similar al primer ejemplo de realización pueden generarse también en este caso las características en el espacio HSV. Para el SGF también debe utilizarse el espacio HSV sometido a una operación de valor umbral. Se hace referencia a que esto no lleva a ninguna operación de valor de umbral doble, dado que el canal H de tonalidad se somete a una operación de valor umbral con respecto al valor S de saturación correspondiente de un píxel determinado. Para formar la pila binaria en el espacio H’V cada canal se procesa individualmente.
Cada pila binaria se trata por separado y las características se calculan independientemente, lo que da lugar a un vector de 32 entradas. En la figura 11 se muestran el plano H 252 y el plano V 254, que se generan por la toma de la imagen. A partir de los planos 252, 254 se forman mediante una operación de valor umbral las pilas 256 y 258 binarias con una pluralidad de máscaras binarias. A partir de las pilas 256 y 258 binarias se generan los vectores 260 y 262 de características.
\global\parskip0.900000\baselineskip
Sin embargo, dado que el canal H’ de tonalidad sometido a una operación de valor umbral es una representación circular, los colores similares podrían finalizar tras la binarización en entradas diferentes. Por tanto se realiza una transformación trigonométrica, que se define como
34
lo que da lugar a una función monótona con respecto al espaciamiento del punto de referencia en H = 0. A este respecto, un factor de escalonamiento H’_{0} = 255 ayuda a conseguir valores similares como para los niveles de grises. Esta medida soluciona el problema de colores similares en entradas diferentes.
Ejemplos
Se clasificaron cuatro conjuntos diferentes de imagen a color utilizando los planteamientos según la invención. Se seleccionaron dos conjuntos (VisTex, BarkTex), porque ya están descritos y evaluados en la bibliografía de procesamiento de imágenes, los otros dos conjuntos se seleccionaron debido a su relevancia práctica en aplicaciones médicas (células del cuello uterino) e industriales (defectos de la madera).
La base de datos (VisTex) de textura de visión del Instituto de Tecnología de Massachussets (MIT) es una colección de imágenes de textura, que sirven como referencia para algoritmos de procesamiento de imágenes. La base de datos contiene más de 100 imágenes de referencia individuales e imágenes naturales con varias texturas. El tamaño de la región (ROI) observada ascendió a 64 x 64 píxeles, mientras que el tamaño de la imagen original con colores RVA de 24 bits era de 512 x 512 píxeles.
La base de datos BarkTex contiene imágenes de cortezas de seis clases de árboles diferentes, que se reproducen en la tabla de la figura 12, en la que se indican las denominaciones alemanas y latinas. El tamaño de imagen original ascendió con colores RVA de 24 bits a 256 x 384 píxeles. Las influencias externas tales como el moho u hongos, riego, condición del suelo y edad del árbol llevan a un problema de clasificación difícil.
Para un examen citológico se utilizaron fragmentos de imágenes de muestra de núcleos celulares de un cuello uterino a partir de dos muestras diferentes con núcleos celulares sanos y malformados. El tamaño de la región (ROI) observada ascendió a 32 x 32 píxeles, mientras que el tamaño de imagen original con colores RVA de 24 bits ascendió a 1000 x 700 píxeles.
Para muestras de madera se utilizaron imágenes, cuyo tamaño de imagen original con colores RVA de 24 bits ascendió a 128 x 128 píxeles. Las clases de texturas están descritas en la tabla de la figura 13. El análisis de imagen digital puede utilizarse para el examen de la superficie de bloques de madera en aserraderos. Las imágenes de tablones de madera de pino sencillos se tomaron utilizando una cámara de exploración por líneas CCD de 24 bits, que estaba sujeta sobre la banda transportadora.
Para las imágenes de ejemplo se determinaron las características de textura basándose en los enfoques según la invención anteriormente descritos. Basándose en las características de textura generadas se realizó a continuación una clasificación de las imágenes, comparándose los resultados de la clasificación con los resultados, que se consiguieron mediante una clasificación, que se realizó para las mismas imágenes utilizando características, que se generaron según enfoques de valor de gris convencionales.
Para la ampliación del color según el primer ejemplo de realización se generaron para la clasificación características, que se calcularon en el espacio RVA, basándose en la medida de la distancia de color y en el espacio HSV utilizando los histogramas de la suma y de la diferencia allí generados.
Para imágenes multiespectrales (procedimiento entre planos) se generaron las características entre planos con un ajuste adicional de un desplazamiento a cero de d = 0, estando la dirección \theta sin definir. Los resultados se muestran en la tabla reproducida en la figura 14. En comparación con los enfoques de escala de grises habituales se muestra una mejora con respecto a la medida \Deltar de mejora absoluta. La única excepción la forman los núcleos celulares del cuello uterino con un empeoramiento de la tasa de reconocimiento. El motivo se encuentra en que estas imágenes en su aspecto son bastante grises en el caso de ruidos de cámara intensos. Mediante el uso del valor medio ponderado para una representación gris se compensa parcialmente el ruido y se estabiliza la clasificación, de modo que para estas imágenes también se obtienen mejores resultados que en el enfoque de valor de gris.
La medida de distancia de color, que se aplicó en los histogramas de la suma y de la diferencia, es la norma L2 o la distancia Euclídea. En este caso se requiere otra longitud de histograma de 883 debido a los diferentes valores de extremo. Al contrario que los procedimientos entre planos no aumenta el número de características, porque todos los planos se tratan simultáneamente. Las tasas de reconocimiento se muestran en la tabla de la figura 15. En comparación con la referencia de nivel de grises correspondiente (véase la mejora \Deltar) no se obtiene fundamentalmente ninguna modificación. Resultados similares se obtienen mediante la aplicación de las características de la distancia Euclídea en la representación L*u*v* de las imágenes. En ese caso se utilizó una longitud de histograma de 737.
\global\parskip1.000000\baselineskip
En la ampliación no lineal en el espacio HSV se aplica antes del cálculo de las características una operación de valor umbral en el canal H de tonalidad con respecto a la saturación S. La clasificación dejar-un-valor-fuera (leaving one out) se aplicó a las imágenes sometidas a una operación de valor umbral con seis valores umbral diferentes S_{min} \in {0, 25, 50, 100, 150, 200}. Los mejores resultados para las características entre planos en la imagen H’V resultante se resumen en la tabla de la figura 16 en la sección superior. Motivado por la naturaleza circular de la tonalidad H, se introdujo una medida de distancia trigonométrica. A este respecto se calculan características en el plano V y H’ por separado y los resultados se muestran en la sección inferior de la tabla de la figura 15.
Resumiendo ha de indicarse, que las características H’V entre planos y no lineales con un valor umbral S_{min} = 50 presentan un comportamiento fundamentalmente mejor que las características originales en las imágenes de escala de grises. Los mejores resultados se resumen en la tabla de la figura 17.
Para la ampliación de color según el segundo ejemplo de realización se generaron igualmente para la clasificación características, que se calcularon en el espacio RVA, basándose en la medida de distancia de color y en el espacio HSV utilizando las máscaras binarias generadas en el mismo.
En la ampliación en los espacios de color lineales se derivan las características SGF entre planos a partir de operaciones booleanas entre las pilas de imágenes binarias de planos separados y se aplican al espacio RVA simétrico. Tal como puede deducirse a partir de la tabla mostrada en la figura 18, se obtienen a este respecto mejoras claras con respecto a enfoques de valor de gris comparables.
En la ampliación no lineal en el espacio RVA las características H’V no lineales utilizan los planos de tonalidad y de valor independientemente entre sí. H’ se obtiene a partir de la operación de valor umbral de la tonalidad H con respecto a la saturación S, que en este caso se realiza para seis valores umbral S_{min} \in {0, 25, 50, 100, 150, 200} diferentes. Los resultados se reproducen en la tabla de la figura 19.
Aunque el procedimiento según la invención se haya descrito mediante ejemplos de realización, en los que se empleó una imagen a color o un fragmento de imagen a color como imagen de tres canales, la presente invención no está limitada a ello. La secuencia de imágenes o la imagen puede haberse generado mediante una toma de n canales, n \geq 2. El cálculo de las características numéricas para cada una de las regiones se realiza incluyendo todos o una parte de los canales de la imagen, pudiendo contener cada uno de los canales en lugar de datos de color también otros datos/información multiespectral, como por ejemplo información basada en rayos IR, rayos UV, rayos X, etc.
De este modo puede reconocerse a partir de los resultados anteriormente mencionados, que el uso de características de textura en una clasificación, que se obtuvo mediante el procedimiento según la invención, debido al enlace de la información disponible a partir de cada uno de los canales de imagen, proporciona sin excepción mejores resultados de clasificación, que los enfoques de valor de gris habituales.
A pesar de que en la descripción anterior de los ejemplos de realización preferidos se utilizaron fragmentos de imagen rectangulares, para determinar la característica de textura, la presente invención no está limitada a ello. Más bien el procedimiento según la invención puede aplicarse a fragmentos de forma arbitraria. La forma de los fragmentos puede estar adaptada por ejemplo a la forma de un objeto en la imagen, cuyas características de textura han de determinarse, lo que tiene la ventaja, de que sólo deben procesarse los puntos de imagen asociados al objeto. El fragmento de imagen puede estar adaptado por ejemplo a la forma de un núcleo celular o melanoma de piel que haya que examinarse.
En la descripción anterior de los ejemplos de realización preferidos se describió la conversión de los datos RVA en el espacio HSV o en el espacio de color L*u*v*. En lugar de estas conversiones descritas, los datos RVA pueden transferirse también a otros espacios de color conocidos.

Claims (7)

1. Procedimiento para extraer características de textura a partir de una imagen (108), que comprende una pluralidad de puntos (x_{1}/y_{1}, x_{2}/y_{2}) de imagen, con las etapas siguientes:
(a) para cada uno de la pluralidad de puntos (x_{1}/y_{1}, x_{2}/y_{2}) de imagen, comparar la intensidad de píxel del punto de imagen con un valor umbral, para generar una máscara (234, 236, 238; 252, 254) binaria, que para cada punto (x_{1}/y_{1}, x_{2}/y_{2}) de imagen presenta un primer valor binario, cuando la intensidad de píxel supera el valor umbral, o una segundo valor binario, cuando la intensidad de píxel no supera el valor umbral;
caracterizado porque la imagen (108) es una imagen multicanal y la etapa (a) se repite para cada uno de los canales, para generar una máscara binaria para cada uno de los canales; y
porque el procedimiento presenta además las etapas siguientes.
(b) para cada uno de la pluralidad de puntos (x_{1}/y_{1}, x_{2}/y_{2}) de imagen de al menos dos canales diferentes, enlazar los valores binarios de manera lógica para el punto de imagen en la máscara binaria asociada con el primer canal con el valor binario para el punto de imagen en la máscara binaria asociada con el segundo canal, para obtener una imagen binaria entre planos; y
(c) determinar una o varias características de textura a partir de la imagen binaria entre planos.
2. Procedimiento según la reivindicación 1, en el que se repite la etapa (b), hasta que para todas las combinaciones de diferentes canales (202, 204, 206; 214, 216; 228, 230, 232; 252, 254) de la imagen (108) existen imágenes binarias entre planos.
3. Procedimiento según la reivindicación 1 ó 2, en el que las características de textura determinadas se integran en una o varias características (246, 248, 250; 260, 262) de textura total de la imagen (108) multicanal.
4. Procedimiento según la reivindicación 3, en el que la integración de las características de textura comprende generar un vector de textura para la imagen (108) multicanal, en el que están depositadas las características de textura determinadas.
5. Procedimiento según una de las reivindicaciones 1 a 4, en el que la imagen (108) se genera mediante una toma multicanal, conteniendo los canales (202, 204, 206; 214, 216; 228, 230, 232; 252, 254) de la imagen (108) diferente información (RVA, L*u*v*, HSV) de color u otra información multiespectral, basándose la demás información multiespectral en tomas mediante rayos IR, rayos UV o rayos X.
6. Procedimiento según la reivindicación 5, en el que, cuando los canales (202, 204, 206; 214, 216; 228, 230, 232; 252, 254) de la imagen (108) contienen información de color, a los canales está asociada información con respecto al color (RVA) de la imagen (108), con respecto a la luminancia y la crominancia (L*u*v*) de la imagen (108) o con respecto a la tonalidad de la imagen, la saturación de la imagen y del valor (HSV) de la imagen (108).
7. Procedimiento según una de las reivindicaciones 1 a 6, en el que la imagen (108), a partir de la que van a extraerse las características de textura, es un fragmento formado de manera arbitraria de una imagen total.
ES02762474T 2002-08-29 2002-09-11 Procedimiento para extraer caracteristicas de textura a partir de una imagen multicanal. Expired - Lifetime ES2283590T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10239801A DE10239801A1 (de) 2002-08-29 2002-08-29 Verfahren zum Extrahieren von Texturmerkmalen aus einem mehrkanaligen Bild
DE10239801 2002-08-29

Publications (1)

Publication Number Publication Date
ES2283590T3 true ES2283590T3 (es) 2007-11-01

Family

ID=31724167

Family Applications (1)

Application Number Title Priority Date Filing Date
ES02762474T Expired - Lifetime ES2283590T3 (es) 2002-08-29 2002-09-11 Procedimiento para extraer caracteristicas de textura a partir de una imagen multicanal.

Country Status (6)

Country Link
US (1) US7130465B2 (es)
EP (1) EP1532583B1 (es)
AT (1) ATE358303T1 (es)
DE (2) DE10239801A1 (es)
ES (1) ES2283590T3 (es)
WO (1) WO2004021280A2 (es)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10239801A1 (de) * 2002-08-29 2004-03-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Extrahieren von Texturmerkmalen aus einem mehrkanaligen Bild
DE10353785B4 (de) * 2003-11-18 2006-05-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zur Erfassung von verschiedenen Zelltypen von Zellen in einer biologischen Probe
US8176414B1 (en) * 2005-09-30 2012-05-08 Google Inc. Document division method and system
KR20080064155A (ko) 2005-10-14 2008-07-08 어플라이드 리써치 어쏘시에이츠 뉴질랜드 리미티드 표면 특징을 모니터링하는 방법 및 장치
US7876970B2 (en) * 2006-01-13 2011-01-25 Qualcomm Incorporated Method and apparatus for white balancing digital images
WO2007096168A2 (en) * 2006-02-22 2007-08-30 Sony Deutschland Gmbh Method for discriminating textures regions and homogeneous or flat regions in an image and methods for estimating noise in an image sequence
US20080005684A1 (en) * 2006-06-29 2008-01-03 Xerox Corporation Graphical user interface, system and method for independent control of different image types
FR2917830B1 (fr) * 2007-06-20 2009-10-02 Oreal Procede et systeme d'evaluation de la brillance percue par un observateur humain d'un film de produit cosmetique.
US8179363B2 (en) * 2007-12-26 2012-05-15 Sharp Laboratories Of America, Inc. Methods and systems for display source light management with histogram manipulation
US8059891B2 (en) * 2007-12-30 2011-11-15 Intel Corporation Markov stationary color descriptor
US9083519B2 (en) * 2008-02-29 2015-07-14 Sharp Laboratories Of America, Inc. Systems and methods for adaptively selecting a decoding scheme to decode embedded information
US8064692B2 (en) * 2008-12-24 2011-11-22 Weyerhaeuser Nr Company Automatic age classification of forest land
DE102009023722A1 (de) * 2009-06-03 2010-12-09 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur Ermittlung und Bewertung des Tragbilds von Zahnrädern
JP5246078B2 (ja) * 2009-07-10 2013-07-24 株式会社ニコン 被写体位置特定用プログラム、およびカメラ
DE102009044962A1 (de) 2009-09-24 2011-04-07 W.O.M. World Of Medicine Ag Dermatoskop und Elevationsmessgerät
CN101937567B (zh) * 2010-09-28 2012-01-18 中国科学院软件研究所 一种简捷的主纹理提取方法
JP5765026B2 (ja) * 2011-04-06 2015-08-19 富士ゼロックス株式会社 画像処理装置及びプログラム
US9179844B2 (en) 2011-11-28 2015-11-10 Aranz Healthcare Limited Handheld skin measuring or monitoring device
US10089754B2 (en) * 2013-03-04 2018-10-02 Saturn Licensing Llc Unevenness inspection system, unevenness inspection method, and unevenness inspection program
DE102014106224A1 (de) 2014-05-05 2015-11-05 Carl Zeiss Microscopy Gmbh Verfahren zum Segmentieren eines Farbbildes sowie digitales Mikroskop
WO2015199067A1 (ja) * 2014-06-24 2015-12-30 株式会社ニコン 画像解析装置、撮像システム、手術支援システム、画像解析方法、及び画像解析プログラム
CN104751446A (zh) * 2015-01-06 2015-07-01 金陵科技学院 一种基于数字图案特征的扎染工艺预测方法
EP3347857A1 (en) * 2015-09-10 2018-07-18 Koninklijke Philips N.V. Automatic image feature removal
US10013527B2 (en) 2016-05-02 2018-07-03 Aranz Healthcare Limited Automatically assessing an anatomical surface feature and securely managing information related to the same
US11116407B2 (en) 2016-11-17 2021-09-14 Aranz Healthcare Limited Anatomical surface assessment methods, devices and systems
EP4183328A1 (en) 2017-04-04 2023-05-24 Aranz Healthcare Limited Anatomical surface assessment methods, devices and systems
EP3723471A4 (en) * 2017-12-15 2021-08-25 Vineland Research and Innovation Centre PROCESSES AND SYSTEMS ASSOCIATED WITH DETERMINING THE MATURITY OF A MUSHROOM
US12039726B2 (en) 2019-05-20 2024-07-16 Aranz Healthcare Limited Automated or partially automated anatomical surface assessment methods, devices and systems
US11769241B1 (en) * 2019-07-30 2023-09-26 Digimarc Corporation Information-client server built on a rapid material identification platform

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04273587A (ja) 1991-02-28 1992-09-29 N T T Data Tsushin Kk 物体検出装置
US6453069B1 (en) * 1996-11-20 2002-09-17 Canon Kabushiki Kaisha Method of extracting image from input image using reference image
US6081612A (en) 1997-02-28 2000-06-27 Electro Optical Sciences Inc. Systems and methods for the multispectral imaging and characterization of skin tissue
US6469710B1 (en) * 1998-09-25 2002-10-22 Microsoft Corporation Inverse texture mapping using weighted pyramid blending
US7062084B2 (en) 2000-12-01 2006-06-13 Sharp Laboratories Of America, Inc. Method for image description using color and local spatial information
FR2825814B1 (fr) * 2001-06-07 2003-09-19 Commissariat Energie Atomique Procede de creation automatique d'une base de donnees images interrogeable par son contenu semantique
DE10239801A1 (de) * 2002-08-29 2004-03-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Extrahieren von Texturmerkmalen aus einem mehrkanaligen Bild
EP1398733A1 (en) * 2002-09-12 2004-03-17 GRETAG IMAGING Trading AG Texture-based colour correction

Also Published As

Publication number Publication date
WO2004021280A2 (de) 2004-03-11
US7130465B2 (en) 2006-10-31
WO2004021280A3 (de) 2004-06-24
DE50209846D1 (de) 2007-05-10
EP1532583B1 (de) 2007-03-28
DE10239801A1 (de) 2004-03-18
US20050196037A1 (en) 2005-09-08
EP1532583A2 (de) 2005-05-25
ATE358303T1 (de) 2007-04-15

Similar Documents

Publication Publication Date Title
ES2283590T3 (es) Procedimiento para extraer caracteristicas de textura a partir de una imagen multicanal.
Roy et al. A study about color normalization methods for histopathology images
Ali et al. Towards the automatic detection of skin lesion shape asymmetry, color variegation and diameter in dermoscopic images
Lu et al. Spectral-spatial classification using tensor modeling for cancer detection with hyperspectral imaging
Casanova et al. Texture analysis using fractal descriptors estimated by the mutual interference of color channels
US20090010545A1 (en) System and method for identifying feature of interest in hyperspectral data
Piqueras et al. Combining multiset resolution and segmentation for hyperspectral image analysis of biological tissues
CN108388874A (zh) 基于图像识别与级联分类器的对虾形态参数自动测量方法
JPS63118889A (ja) 画像を用いた変化検出方法
Cao et al. Multi-focus image fusion by nonsubsampled shearlet transform
Zhang et al. Computerized facial diagnosis using both color and texture features
Cai et al. Handheld four-dimensional optical sensor
CN103235929A (zh) 基于手背静脉图像的身份识别方法和装置
CN114216867A (zh) 高光谱图像采集识别装置及方法
Yang et al. Texton and sparse representation based texture classification of lung parenchyma in CT images
Drew et al. On illumination invariance in color object recognition
CN111192314A (zh) 一种确定gdv能量图像中手指的内外轮廓比率的方法及系统
JP2013041563A (ja) 画像の類似性評価装置及びその評価方法
CN120299035A (zh) 一种显微高光谱病理图像的精准标注方法
CN116448682B (zh) 基于高光谱成像的龟甲年限鉴别方法、鉴别模型
Palm et al. Color texture analysis of moving vocal cords using approaches from statistics and signal theory
CN115760934A (zh) 一种眼鼻三角区的自动标定方法
Akila et al. Detection of melanoma skin cancer using segmentation and classification algorithms
Obert et al. Color Saturation: Upper and lower percentage histogram manipulation
Liu et al. Biological indexes based reflectional asymmetry for classifying cutaneous lesions