ES2283590T3 - Procedimiento para extraer caracteristicas de textura a partir de una imagen multicanal. - Google Patents
Procedimiento para extraer caracteristicas de textura a partir de una imagen multicanal. Download PDFInfo
- Publication number
- ES2283590T3 ES2283590T3 ES02762474T ES02762474T ES2283590T3 ES 2283590 T3 ES2283590 T3 ES 2283590T3 ES 02762474 T ES02762474 T ES 02762474T ES 02762474 T ES02762474 T ES 02762474T ES 2283590 T3 ES2283590 T3 ES 2283590T3
- Authority
- ES
- Spain
- Prior art keywords
- image
- binary
- texture
- channels
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/143—Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/90—Determination of colour characteristics
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30161—Wood; Lumber
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Image Generation (AREA)
Abstract
Procedimiento para extraer características de textura a partir de una imagen (108), que comprende una pluralidad de puntos (x1/y1, x2/y2) de imagen, con las etapas siguientes: (a) para cada uno de la pluralidad de puntos (x1/y1, x2/y2) de imagen, comparar la intensidad de píxel del punto de imagen con un valor umbral, para generar una máscara (234, 236, 238; 252, 254) binaria, que para cada punto (x1/y1, x2/y2) de imagen presenta un primer valor binario, cuando la intensidad de píxel supera el valor umbral, o una segundo valor binario, cuando la intensidad de píxel no supera el valor umbral; caracterizado porque la imagen (108) es una imagen multicanal y la etapa (a) se repite para cada uno de los canales, para generar una máscara binaria para cada uno de los canales; y porque el procedimiento presenta además las etapas siguientes. (b) para cada uno de la pluralidad de puntos (x1/y1, x2/y2) de imagen de al menos dos canales diferentes, enlazar los valores binarios de manera lógica para el punto de imagen en la máscara binaria asociada con el primer canal con el valor binario para el punto de imagen en la máscara binaria asociada con el segundo canal, para obtener una imagen binaria entre planos; y (c) determinar una o varias características de textura a partir de la imagen binaria entre planos.
Description
Procedimiento para extraer características de
textura a partir de una imagen multicanal.
La presente invención se refiere a un
procedimiento para extraer características de textura a partir de
una imagen multicanal, y en este caso especialmente a un
procedimiento para extraer características de textura de color para
la segmentación y clasificación automática.
En el procesamiento de imágenes médico e
industrial se utilizan en los últimos tiempos cada vez más cámaras
a color para la generación/toma de las imágenes que van a
examinarse.
Aplicaciones médicas típicas de tales cámaras a
color son, por ejemplo, la clasificación y segmentación de
melanomas de la piel, la clasificación de células cancerosas y
displásticas, por ejemplo de células del cuello uterino o del
esputo, en la microscopia, o la diferenciación de mucosas o tejido
sano, displástico o enfermo en exámenes endoscópicos de la cavidad
bucal, tráquea, laringe, esófago, estómago e intestino. Ejemplos de
una utilización industrial de tales cámaras son la clasificación y
evaluación de troncos de madera por medio de su corteza o
superficie de corte, el reconocimiento y separación automática de
clases de desperdicios sobre una banda transportadora o el apoyo en
la cartografía mediante tomas por satélite.
Tales imágenes a color obtenidas con cámaras a
color pueden servir en los diferentes campos de aplicación
mencionados como base para una clasificación así como para una
segmentación de los contenidos de la imagen. En función del caso de
aplicación y las condiciones marginales específicas se produce o
bien una observación de la totalidad de la imagen o bien sólo de
uno o más fragmentos de imagen, la denominada región de interés
(ROI, Region Of Interest). Clasificación significa en este
contexto la asociación de uno o varios objetos representados en la
imagen con una clase específica. Por el contrario, por segmentación
se entiende en este contexto la determinación de tales objetos
mediante la integración práctica de puntos de imagen individuales
para dar unidades (de objeto) mayores, es decir, una clasificación o
asociación de puntos de imagen para dar las denominadas clases de
objetos.
Como base para una clasificación de píxeles u
objetos de este tipo sirven por norma general las denominadas
características, que pueden calcularse a partir de intensidades de
valor cromático o de valor de gris de puntos de imagen o grupos
reducidos de puntos de imagen. El cálculo de tales características a
partir de imágenes de valor de gris se basa a este respecto en una
integración acertada de los valores de gris de los puntos de imagen
del fragmento de imagen observado. Ejemplos de tales características
sencillas son por ejemplo estadísticas de primer orden, como
frecuencias de valores de gris (histogramas), valores medios y
varianzas de los valores de gris observados en un fragmento de
imagen de este tipo. Las características más complejas, con las que
también pueden describirse y analizarse por ejemplo las denominadas
texturas o superficies texturizadas, se basan por el contrario por
ejemplo en estadísticas de orden superior, las denominadas
características de Gabor o de Fourier, codificaciones de la
longitud, características geométricas-estadísticas y
similares. Ejemplos de tales estadísticas de orden superior para la
descripción de superficies texturizadas se describen por ejemplo
por R. M. Haralick, entre otros, en "Texture Features for Image
Classification", IEEE Transactions on Systems, Man, and
Cybernetics, vol. SMC-3, nº. 6, páginas
610-621, noviembre de 1973, por M. Unser en "Sum
and Difference Histograms for Texture Analysis", IEEE
Transactions on Pattern Analysis and Machine Intelligence, vol. 8,
nº 1 páginas 118-125, 1986 y por Y. Q. Chen, entre
otros, en "Statistical Geometrical Features for Texture
Classification", Pattern Recognition, vol. 28, nº 4, páginas
537-552, septiembre 1995.
La desventaja de estos enfoques conocidos se
basa en que están limitados a la evaluación de intensidades, que se
obtuvieron a partir de una toma de la imagen con un canal, y por
tanto sólo permiten la determinación de características de textura
en imágenes de este tipo. Sobre la base de las características de
textura registradas de este modo puede realizarse entonces una
clasificación de la forma habitual.
Sin embargo, al contrario que las imágenes de
valor de gris, se observó que las imágenes a color y especialmente
la información con respecto a la distribución estadística de los
colores representan una herramienta de clasificación muy potente y
útil, de modo que el aprovechamiento de la información de color,
contenida en una imagen a color es deseable.
En el estado de la técnica se conocen diferentes
enfoques, por medio de los cuales los enfoques anteriormente
mencionados para la extracción de características de textura a
partir de imágenes de valor de gris se transfieren a imágenes
multicanal, por ejemplo imágenes espectrales con dos o más planos.
Estos enfoques funcionan de tal manera que las etapas de análisis
conocidas a partir de los enfoques con respecto al examen de
imágenes de valor de gris se aplican por separado sobre cada uno de
los canales de la imagen, es decir, sobre cada plano de imagen, y
finalmente las características de textura resultantes se integran en
una característica de textura total.
Este enfoque es desventajoso porque, en ese
caso, se considera cada plano de imagen individualmente, de modo
que de ningún modo se recurre a la información contenida en la
distribución real de los colores de un punto de color a través de
los planos para el análisis de características de textura, sino que
únicamente se realiza, mediante una integración final de las
características de textura generadas por separado, una combinación
de la información de punto de imagen contenida en todos los canales
de color. Así no se produce en este caso ningún enlace real de la
información asociada con cada uno de los puntos de imagen en los
diferentes planos, de modo que este enfoque en comparación con el
"enfoque de valor de gris" habitual sólo conlleva mejoras
insignificantes, pero que no justifican el elevado coste.
Partiendo de este estado de la técnica, la
presente invención se basa en el objetivo de crear un procedimiento
mejorado pata extraer características de textura a partir de una
imagen multicanal, que considera la información de un punto de
imagen contenida en cada canal de la imagen.
Este objetivo se resuelve con un procedimiento
según la reivindicación 1.
La presente invención crea un procedimiento para
extraer características de textura a partir de una imagen
multicanal que comprende una pluralidad de puntos de imagen, con las
etapas siguientes:
para cada uno de la pluralidad de puntos de
imagen:
- enlazar información de punto de imagen a partir de al menos dos canales de la imagen; y
- determinar una o varias características de textura a partir de la información de punto de imagen enlazada de la imagen o de una ventana de imagen.
La presente invención se basa por tanto en
imágenes que se tomaron con más de una banda espectral, por ejemplo,
en imágenes espectrales con, por norma general, tres espectros (por
ejemplo RVA), y enseña un enfoque que permite extraer, a partir de
las imágenes espectrales registradas entre sí, características de
textura, a las que se recurre para una segmentación de imagen y
clasificación de objetos posterior.
El procedimiento según la invención está
diseñado para, según un ejemplo de realización preferido, basándose
en una toma de una imagen multicanal o una secuencia de imágenes,
calcular características numéricas (índices) de la imagen total o
subregiones formadas de manera arbitraria. La secuencia de imágenes
o la imagen puede haberse generado mediante una toma de n canales,
n \geq 2. El cálculo de las características numéricas para cada
una de las regiones se produce incluyendo todos o una parte de los
canales de la imagen, pudiendo contener cada uno de los canales
datos de color o información de color o también otros
datos/información multiespectral, como por ejemplo información con
respecto a rayos IR, rayos UV, rayos X. Entonces puede recurrirse a
las características así generadas con un clasificador cualquiera
(por ejemplo, k-NN, polinomio y otros) para la
clasificación o segmentación de la imagen o de la sección de
imagen.
Según un ejemplo de realización preferido de la
presente invención se repite la etapa del enlace, hasta que para
todas las combinaciones de los diferentes canales de la imagen
existe información de imagen enlazada. Basándose en las
características de textura determinadas se genera un vector de
características de textura total para la imagen multicanal o el
fragmento de imagen multicanal, en el que están depositadas las
características de textura individuales determinadas.
En un ejemplo de realización, en el que los
canales de la imagen contienen información de color, estos canales
pueden presentar información con respecto al color de la imagen, la
luminancia y la crominancia de la imagen o la tonalidad, la
saturación y el valor de la imagen.
De manera preferible, la etapa del enlace de la
información de imagen comprende el enlace de información de punto
de imagen de un punto de imagen de un primer canal de la imagen y de
un punto de imagen de un segundo canal de la imagen, pudiendo estar
el punto de imagen del segundo canal desplazado con respecto al
punto de imagen del primer canal.
La información de punto de imagen es
preferiblemente intensidades de píxel de los puntos de imagen
asociados, es decir, las intensidades en los píxeles asociados en
el canal correspondiente de la imagen.
Según un primer ejemplo de realización preferido
de la presente invención pueden generarse en un fragmento de imagen
histogramas de la suma y/o histogramas de la diferencia de las
intensidades de píxel a partir de al menos dos canales, generándose
características de textura basándose en los histogramas
generados.
Según un segundo ejemplo de realización
preferido, se generan para el enlace una o más máscaras binarias por
canal, comparándose las intensidades de píxel en puntos de imagen
asociados con un valor umbral. Preferiblemente, se genera una
máscara binaria para cada uno de los canales de la imagen. De manera
adicionalmente preferible, la generación de la máscara binaria
comprende el enlace lógico de las intensidades de píxel a partir de
al menos dos canales diferentes.
Con respecto a las imágenes o ventanas de imagen
(fragmentos de imagen) observadas se hace referencia a que estos
fragmentos de imagen observados pueden tener una forma arbitraria.
La forma del fragmento de imagen observado puede estar adaptada
especialmente a la forma del objeto, para el que van a determinarse
características de textura. En el examen de núcleos celulares, la
forma del fragmento de imagen observado puede seleccionarse de tal
modo que sólo comprenda el núcleo celular de interés.
A continuación se explican con más detalle
ejemplos de realización preferidos de la presente invención mediante
los dibujos adjuntos. Muestran:
la figura 1, un diagrama de bloques de un
procedimiento de clasificación y segmentación, que utiliza el
algoritmo de textura según la invención;
la figura 2, un fragmento de imagen observado
con una forma arbitraria o una imagen total observada (intensidad),
en la que se basa la determinación de los histogramas;
la figura 3, una tabla con las características
de histograma de la suma y de la diferencia según Unser, que se
generan basándose en la imagen mostrada en la figura 2 y en la
información de imagen contenida en la misma;
la figura 4, tres planos de un fragmento de
imagen o de una imagen, que se obtienen mediante una toma en color,
y en los que según un primer ejemplo de realización de la presente
invención se basa la determinación de los histogramas;
la figura 5, una tabla en la que, para algunos
valores cromáticos triviales, la conversión está integrada en
L*u*v*;
la figura 6, el plano H y el plano V, en los que
se calculan los histogramas de la suma y de la diferencia según una
implementación alternativa del primer ejemplo de realización;
la figura 7, la generación de una pila de
máscaras binarias a partir de una imagen de valor de gris para la
generación de características de nivel de grises geométricas
estadísticas;
la figura 8, una tabla con valores típicos para
un valor \alpha_{0} umbral inicial, de la magnitud
\Delta\alpha del nivel y del número de intensidades así como
del número de las imágenes G binarias que pueden generarse con
ello;
la figura 9, una tabla de las características
estadísticas según Chen, que se derivan basándose en las propiedades
geométricas a partir de la pila binaria representada en la figura
7;
la figura 10, la generación de pilas binarias
combinadas a partir de n=3 planos de una imagen, para generar
características entre planos geométricas estadísticas según un
segundo ejemplo de realización de la presente invención;
la figura 11, la generación de pilas binarias
combinadas para el cálculo de características geométricas
estadísticas a partir de una imagen HSV según una implementación
alternativa del segundo ejemplo de realización, obteniéndose la
representación H’V, sometiendo una tonalidad con respecto a la
saturación a una operación de valor umbral;
la figura 12, una tabla de un conjunto de prueba
de BarkTex (BKV), siendo las clases de texturas seis tipos
diferentes de árboles, de los que se tomaron 68 muestras;
la figura 13, una tabla de un conjunto de prueba
de madera, en la que se muestran clases defectuosas junto con el
número de ejemplares;
la figura 14, una tabla con los mejores
resultados de la clasificación que se obtienen basándose en la
extracción de características entre planos según el primer ejemplo
de realización;
la figura 15, una tabla con los mejores
resultados de la clasificación que se obtienen basándose en la
extracción de características de distancia Euclídea según el primer
ejemplo de realización;
la figura 16, una tabla con los mejores
resultados de la clasificación que se obtienen basándose en la
extracción de características H’V no lineales según el primer
ejemplo de realización utilizando diferencias entre planos (arriba)
en el plano V y medidas de diferencia trigonométricas en el plano H
(abajo);
la figura 17, una tabla con los mejores
resultados de la clasificación que se obtienen basándose en la
extracción de características ampliada a color según el primer
ejemplo de realización, siendo las medidas \Deltar de mejora
relativas a las mejores tasas de escala de grises;
la figura 18, una tabla con los mejores
resultados de la clasificación que se obtienen basándose en la
extracción de características de SGF entre planos según el segundo
ejemplo de realización, que se aplican en el espacio de color RVA;
y
la figura 19, una tabla con los mejores
resultados de la clasificación que se obtienen basándose en la
extracción de características de SGF de H’V no lineales según el
segundo ejemplo de realización.
La figura 1 muestra un diagrama de bloques de un
procedimiento de clasificación y segmentación, que utiliza el
algoritmo de reconocimiento de texturas según la invención. Tal como
puede observarse en la figura 1, el procedimiento comprende un
primer nivel I, el nivel de aprendizaje, y un segundo nivel II, el
nivel de clasificación y segmentación. En el primer nivel I se
establecen en primer lugar parámetros de características conocidos
(véase el bloque 100). Estos parámetros de características son
condiciones marginales para el cálculo de características de
textura. En el bloque 102 se registran los datos de aprendizaje,
proporcionando imágenes o fragmentos de imagen conocidos con
texturas conocidas (clasificadas), es decir, muestras ya
clasificadas. La imagen ya clasificada proporcionada en el bloque
102 se proporciona al algoritmo de textura de color según la
invención en el bloque 104 junto con los parámetros de
características conocidos, con lo que se generan las características
numéricas (vector de características) para la textura conocida,
contenida en la imagen 102, que luego se depositan para esta
textura en la base 106 de datos de características de
aprendizaje.
En el segundo nivel II se introduce una imagen
108 o un fragmento de imagen desconocida en el procedimiento, y se
aplica el algoritmo de textura de color según la invención en el
bloque 110 sobre la imagen 108 desconocida, obteniendo el algoritmo
de textura de color los parámetros de características existentes de
la base 100 de datos. Basándose en el examen de la imagen 108
desconocida por medio del procedimiento según la invención y
basándose en los parámetros de características proporcionados se
genera un vector de características que contiene las diferentes
características halladas mediante el algoritmo de textura de color
en la imagen 108 desconocida. Este vector de características se
dirige a una clasificación en el bloque 112, en el que basándose en
información de la base 106 de datos se realiza la clasificación del
vector de características, para así realizar o bien una
clasificación 114 de toda la imagen 108 o bien una segmentación 116
mediante la clasificación de puntos de imagen individuales de la
imagen 108 o del fragmento de imagen.
Los algoritmos de textura de color mencionados
en los bloques 104 y 110 se basan en el procedimiento según la
invención, según el cual, para una imagen multicanal, tal como por
ejemplo una imagen espectral, para cada uno de los puntos de imagen
se enlaza información de punto de imagen a partir de al menos dos
canales de color de la imagen, para a partir de ello determinar una
o varias características de textura. Estas características de
textura se integran a continuación en el vector de características y
se dirigen a la clasificación.
Mediante los dibujos siguientes se realiza ahora
una descripción de ejemplos de realización preferidos del
procedimiento según la invención, que se implementa en los
algoritmos 104, 110.
Primer ejemplo de
realización
A continuación se describe con más detalle en
primer lugar un primer ejemplo de realización de la presente
invención, en el que la clasificación se basa en características que
se obtienen basándose en histogramas de la suma y/o histogramas de
la diferencia de las intensidades de píxel en puntos de imagen
asociados en al menos dos canales / de al menos dos planos. Sin
embargo, en primer lugar se explica el enfoque conocido para
imágenes de intensidad, que se explica con más detalle por M. Unser
en "Sum and Difference Histograms for Texture Analysis", IEEE
Transactions on Pattern Analysis and Machine Intelligence, vol. 8,
nº 1 páginas 118-125, 1986.
Las estadísticas de orden superior ya explicadas
con brevedad anteriormente utilizan dos histogramas unidimensionales
(histograma de la suma y de la diferencia). A este respecto, se
trata de histogramas que cuentan la frecuencia de sumas y
diferencias de las intensidades I(x_{1}, y_{1}) e
I(x_{2}, y_{2}) de píxel con un determinado
desplazamiento (d_{x}, d_{y}). Estos se definen como sigue:
con:
i = 0,..., 2(G-1),
j = -G+1,..., G-1
G = nivel de intensidad máximo por canal de
imagen, por ejemplo 256 intensidades,
I = intensidad,
x_{i} y_{i} = coordenadas de un punto
observado en la imagen,
D = fragmento de imagen,
h_{S} = histograma de la suma, y
h_{D} = histograma de la diferencia.
Estos valores medidos presentan el número de
pares de píxeles en un fragmento D de imagen (ROI = región de
interés), que presentan una suma con el valor i o una diferencia con
el valor j. Ambos histogramas presentan 2G-1
entradas (bins, intervalos) que corresponden a las 511
entradas, cuando se suponen imágenes con G = 256 intensidades (por
ejemplo niveles de grises). La cuantificación hasta N entradas puede
realizarse con respecto a los histogramas también mediante redondeo
utilizando la ecuación siguiente:
\vskip1.000000\baselineskip
con:
N = número total de los valores medidos, y
D_{max} = valor máximo de la suma o de la
diferencia.
La independencia de las entradas
h_{S}(i) y H_{D}(j) de histograma se consigue
mediante normalización con el número total de valores N medidos del
fragmento de imagen observado:
\vskip1.000000\baselineskip
con:
P_{S} = histograma de la suma normalizado,
y
P_{D} = histograma de la diferencia
normalizado.
El vector (d_{x}, d_{y}) de desplazamiento
puede representarse mediante d = radio y \theta = ángulo (véase
la figura 2). La figura 2 muestra un fragmento de imagen observado o
una imagen D total observada (valor de gris), en la que se muestran
tanto los puntos x_{1}/y_{1}, x_{2}/y_{2} de imagen
observados (par de píxeles) como un vector 200 que une los puntos
de imagen. Con los histogramas de la suma y de la diferencia se
estiman estadísticas de segundo orden de los pares (d, \theta)
desplazados. En general es suficiente utilizar para el ángulo
\theta valores = 0, \pi/4, \pi/2,3 \pi/4 para un radio d
determinado y calcular las características para cada uno de los
histogramas por separado. Para introducir un grado determinado de
una invarianza por rotación, es posible acumular histogramas por las
cuatros direcciones y luego calcular las características.
Basándose en los histogramas descritos
anteriormente se determinan 15 características, que se muestran en
la tabla de la figura 3. Estas características describen las
propiedades de una textura utilizando por ejemplo momentos y
medidas entrópicas. El valor medio de la diferencia y la varianza
(c_{4}, c_{5}) caracterizan la diferencia de intensidad media
entre píxeles contiguos y cómo de uniforme es esta diferencia. Por
ello, un valor grande de c_{4} es una indicación de una imagen
con un contraste elevado y muchas aristas. De manera análoga, se
aplican el valor medio y la varianza al histograma (c_{0},
c_{1}) de la suma, aunque sin una interpretación visual evidente.
Los vértices concentrados en los histogramas se evalúan a través de
las medidas (c_{2}, c_{6}) de energía, que darán valores
grandes para zonas homogéneas en los histogramas de la diferencia
con un vértice en d = 0. Con las entropías (c_{3}, c_{7}) y la
característica (c_{14}) derivada se utilizan medidas teóricas de
información, con lo que se valora, cómo de determinista es el
aspecto de una textura. Claramente intuitiva es la característica
(c_{10}) de contraste, que pondera la aparición de diferencias de
intensidad elevadas de manera desproporcionada. Estas
características también se denominan características básicas.
Según el primer ejemplo de realización de la
presente invención se evitan las desventajas descritas anteriormente
de la utilización del "enfoque de valor de gris" que acaba de
describirse para la clasificación, histogramas de la suma y/o
histogramas de la diferencia, porque este enfoque se amplía a la
observación de varios planos. Para cubrir también dependencias
estadísticas entre los planos, se determinan las características de
textura basándose en las características descritas anteriormente
con respecto a diferentes planos (entre planos). Esto se denomina a
continuación también el procedimiento entre planos.
Mediante la figura 4 se describen estos
histogramas de la suma y de la diferencia ampliados al espectro y
al plano. En la figura 4 se muestran tres planos 202, 204, 206 (por
ejemplo R, V, A), que se obtienen mediante una toma a color de la
imagen o del fragmento de imagen. En cada uno de los planos 202,
204, 206 (también denominados canales) se muestran píxeles
individuales, de manera similar a la figura 2, y se representan
mediante sus coordenadas x,y. Mediante las flechas 208, 210, 212 se
indica el procesamiento de solapamiento entre planos. En el ejemplo
de realización representado existe un enlace de un punto
x_{1}/y_{1} de imagen en el primer plano 202 con un punto
x_{2}/y_{2} de imagen en el segundo plano 204 (véase la flecha
208), que puede estar desplazado (d) del punto x_{1}/y_{1} de
imagen en el primer plano 202, y con un punto x_{2}/y_{2} de
imagen en el tercer plano 206 (véase la flecha 210), que puede estar
desplazado del punto x_{1}/y_{1} de imagen en el primer plano
202 (con la misma magnitud d). Además existe un enlace de un punto
x_{1}/y_{1} de imagen en el segundo plano 204 con un punto
x_{2}/y_{2} de imagen desplazado con respecto al mismo en el
tercer plano 206 (véase la flecha 212). El desplazamiento se
establece mediante el parámetro d.
Los histogramas de la suma y de la diferencia
entre planos se definen tal como sigue:
\vskip1.000000\baselineskip
con:
p, q = plano, canal con p \neq q,
i = 0,..., 2(G-1),
j = -G+1,..., G-1,
G = valor cromático máximo
I(p) = intensidad de un punto de imagen
en el plano p en la posición x_{i}/y_{i},
I(q) = intensidad de un punto de imagen
en el plano q en la posición x_{i}/y_{i},
x,y = coordenadas de un punto observado en la
imagen,
D = fragmento de imagen,
h_{S} = histograma de la suma ampliado, y
h_{D} = histograma de la diferencia
ampliado.
Debido a la propiedad asociativa de la suma y la
resta, en el ejemplo de una imagen de tres canales (canales 1, 2 y
3) sólo son necesarios tres pares
- h_{S}^{(12)}, h_{D}^{(12)}
- h_{S}^{(13)}, h_{D}^{(13)}
- h_{S}^{(23)}, h_{D}^{(23)}
en una toma en tres canales
espectrales. Para el procedimiento entre planos con tres planos, el
vector de características es tres veces más largo que en el enfoque
original, anteriormente descrito. Se indica que para
características entre planos también puede haberse elegido un
desplazamiento de d = 0 con una dirección \theta indefinida. En
este caso se explica la correlación directa entre los puntos de
imagen entre los canales en cada posición x_{1}/y_{1} de píxel.
El desplazamiento d y la dirección \theta son, para este ejemplo
de realización, las condiciones marginales mencionadas anteriormente
(véase el bloque 100 en la figura
1).
Además de generar los histogramas mediante las
características descritas anteriormente, lo que representa la
posibilidad primaria para ampliar las características, pueden
introducirse también características de color específicas nuevas. A
partir de la tabla 3 puede deducirse que las características
c_{12}, c_{13} y c_{14} se derivan a partir de los dos
histogramas (histograma de la suma y de la diferencia). En vez de
aplicar sólo el conjunto básico de características \{c_{i}\} en
los histogramas de cada plano por separado, pueden construirse
ahora características nuevas. Éstas están definidas por la
combinación de características derivadas a partir de histogramas de
planos diferentes, que dan lo siguiente:
\vskip1.000000\baselineskip
Ahora hay disponibles características nuevas en
la imagen multiespectral, que pueden calcularse para cada dirección
\theta. Cuando no se utiliza ninguna acumulación de los
histogramas, esto lleva a 36 denominadas características de
histograma cruzado.
Un segundo grupo de características nuevas se
basa en la correlación cruzada entre los histogramas de los
diferentes planos. Las características de rendimiento cruzado se
definen tal como sigue:
\vskip1.000000\baselineskip
cuando p \neq
q.
Más concretamente, se trata en este caso de seis
características para cada una de las cuatro direcciones \theta,
cuando se aplican a una imagen RVA, lo que en total lleva a 24
características. Evidentemente podrían definirse más
características, y estas características pueden aplicarse al
procedimiento entre planos y los procedimientos descritos a
continuación.
Un ejemplo de realización adicional para
introducir información espectral en la extracción de características
es la utilización de una medida de distancia en el espacio de
color. La medida L2 (distancia Euclídea) se utiliza para calcular
una medida escalar a partir de los valores espectrales de un par de
píxeles. En una imagen multiespectral con los planos I^{(p)} de
color la norma L2 de un vector de color se define como sigue:
Por tanto, se utiliza la norma del vector de la
suma en la definición de los histogramas de la suma con:
\vskip1.000000\baselineskip
con:
i =
0,...,2(G-1)\surd3
Debido a los diferentes valores de extremo de la
norma de un vector de suma y uno de diferencia la longitud de los
histogramas es distinta. Independientemente de ello, la diferencia
sólo adoptará valores positivos, cuando se utilice simplemente la
norma del vector de diferencia, que se define como
\newpage
Por tanto se utiliza la dirección del vector de
diferencia mediante la modificación del signo, cuando la mayoría de
los elementos de vector es negativa. Omitiendo la indexación de
coordenadas esto puede formularse en el espacio RVA como
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
cuando d^{(p)} =
I^{(p)}(x_{1}, y_{1}) - I^{(p)}(x_{2},
y_{2}) son las diferencias de plano escalar. Por tanto los
histogramas de la diferencia pueden definirse utilizando la norma L2
tal como
sigue:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
cuando j = -(G-1)-
\surd3,..., (G-1)- \surd3. Para una imagen con
tres canales de 8 bits estos corresponde a histogramas de 883
entradas. Dado que la norma L2 lleva en la mayor parte de los casos
a números fraccionados, éstos se asocian simplemente con una
entrada de número entero (bin, intervalo) mediante
redondeo.
Con la percepción de espacios de color uniformes
de manera reconocible se conoce para su propiedad, que los
espaciamientos en el espacio de color están relacionados
estrechamente con la percepción humana. Motivado por el hecho, de
que la distancia Euclídea en el espacio L*u*v* corresponde al
espaciamiento perceptible del ser humano convencional, esta medida
de espaciamiento se aplica a la representación L*u*v* para un
cálculo de las características.
El espacio L*u*v* se normalizó en 1976 por la
CIE y se deriva del espacio XYZ con un punto (X_{n}, Y_{n},
Z_{n}) de referencia blanco, que es el vector (1, 1, 1) RVA
normalizado transformado. Para la descripción adicional se supone
la definición siguiente:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
La componente L* de luminosidad se indica tal
como sigue:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
Para calcular las componentes u* y v* de
crominancia son necesarios algunas magnitudes intermedias. Si
u’_{n}, v’_{n} sólo dependen del punto blanco de referencia, es
válido:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
El carácter no lineal en una medida considerable
del espacio L*u*v* puede visualizarse mediante la conversión de los
colores del cubo RVA discreto y mediante la aplicación de los
resultados. Para algunos valores cromáticos triviales la conversión
en L*u*v* se resume en la tabla en la figura 5. Los valores en
negrita muestran los valores mínimos o máximos en el espacio
L*u*v*. El color negro con una intensidad cero en todos los canales
es una singularidad, que lleva a las componentes u*v* no
definidas.
En estos valores de extremo la distancia de
color Euclídea lleva a los valores máximos siguientes de la
distancia o de la suma:
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
con 1 \in
{L*u*v*}.
Por tanto, es válido el histograma de la suma en
el intervalo [0; 485] y el histograma de la diferencia en [-368;
368] mediante el redondeo de los valores máximos al siguiente número
total superior. Una longitud común de histogramas de la suma y de
la diferencia se obtiene en la implementación mediante la extensión
del histograma de la suma hasta [0, 736].
En lugar del espacio de color RVA correlacionado
y simétrico en una medida considerable el modelo de color HSV (HSV
= tonalidad, saturación, valor) también puede utilizarse en la
clasificación de la textura.
El valor H de tonalidad es una medida angular
alrededor del eje V en un sistema de coordenadas cilíndrico,
pudiendo estar representado este modelo mediante un cono hexagonal.
La representación de rojo, que comienza con un ángulo de 0, está
seleccionada según diferentes definiciones en la bibliografía de una
manera más o menos arbitraria. El valor V mide la luminosidad y S
la saturación de color o la pureza de la tonalidad. Los valores de
gris, para los que es válido R = G = B, son singularidades en el
espacio HSV y por tanto pueden encontrarse en el eje V, si S = 0 y
H no está definido. Una singularidad adicional es V = 0, lo que es
negro puro. Para la presente descripción se utiliza una conversión
utilizando los r, g, b \in [0; 1] normalizados:
La figura 6 muestra los dos planos o canales 214
216 que existen en este principio, el plano H y el plano V con los
puntos x_{1}/y_{1}, x_{2}/y_{2}.
Para valores de saturación reducidos la
tonalidad reacciona con una sensibilidad elevada a un ruido de
detector en la imagen. Por tanto, para la clasificación de la
textura sólo se utiliza la información del canal H, si se supera un
valor S_{min} umbral de saturación determinado. Por el contrario
el conjunto H se establece en un valor arbitrario, aunque
constante, por ejemplo
La transferencia de los histogramas de la suma y
de la diferencia al espacio HSV puede ser difícil, dado que el
canal H es una representación angular. Los valores de la tonalidad
varían entre 0 y 2\pi, que es la misma tonalidad. Esta dificultad
se soluciona, cuando las definiciones anteriores se utilizan para
los histogramas de la suma y de la diferencia. Por tanto se utiliza
una medida de distancia, que es máxima para \Deltah = \pi:
Para la suma puede superarse el intervalo de [0;
2\pi], aunque se utiliza una medida, que es máxima para H_{1} +
H_{2} mod 2\pi = \pi. Ha de tenerse en cuenta, que la
operación de módulo está implícita en el cálculo del seno:
Para crear histogramas discretos estas
definiciones se ajustan a escala en al mismo intervalo que en el
caso del nivel de grises, que asciende a [-255; 255] o [0;
510]:
\vskip1.000000\baselineskip
Las características se definen entonces a partir
de los histogramas de la suma y de la diferencia en el plano H’ y V
tal como sigue:
Segundo ejemplo de
realización
A continuación se describirá más detalladamente
un segundo ejemplo de realización de la presente invención, en el
que la clasificación se basa en una máscara binaria, que se obtiene
mediante la comparación de las intensidades de píxel con puntos de
imagen asociados en diferentes planos con un valor umbral. En primer
lugar se explica de nuevo un enfoque conocido para imágenes de
nivel de grises.
Una clase geométrica de algoritmos de textura se
basa en el denominado enfoque de solución SGF (SGF = Statistical
Geometrical Feature, características geométricas estadísticas)
que se describe con más detalle por Y. Q. Chen, entre otros en
"Statistical Geometrical Features for Texture Classification",
Pattern Recognition, vol. 28, nº 4, páginas
537-552, septiembre de 1995. Según este enfoque se
calculan 16 características estadísticas basándose en las
propiedades geométricas de intervalos de puntos de imagen
relacionados entre sí en una serie de imágenes binarias. Estas
imágenes binarias se generan mediante una operación de valor umbral
con respecto a la imagen de intensidades. Se utilizan propiedades
geométricas, como el número de intervalos relacionados y su
irregularidad junto con sus estadísticas (desviación media,
desviación estándar), que describen la pila de imágenes
binarias.
La figura 7 muestra una imagen 218 de nivel de
grises, a partir de la que se genera una pila binaria con tres
máscaras 220, 222, 224 binarias mediante la operación de valor
umbral. A partir de las máscaras 220, 222, 224 binarias se
determina el vector 226 de características para la clasificación
siguiente. Tras la binarización con valores umbral diferentes se
calculan características geométricas estadísticas a partir de la
pila de imágenes binaria.
Para una imagen I(x,y) con G niveles de
grises puede obtenerse una imagen I_{B}_{\alpha}(x,y)
binaria mediante operaciones de valor umbral con un valor umbral
\alpha \in [1; G-1], lo que lleva a
La pila de todas las G-1
imágenes I_{B}_{\alpha}(x,y) binarias posibles con
\alpha = 1, ..., G-1 es igual a la imagen
original sin pérdida de información porque
Esto se debe a que para un píxel con
I(x,y) = k exactamente k imágenes binarias con \alpha
\leq k presentarán un valor de 1 en esta posición. Una pérdida de
cálculo de características de información no constituye sin embargo
ningún motivo de preocupación, dado que se mantiene la información
discriminante entre diferentes clases de texturas. Por tanto,
también puede utilizarse un conjunto reducido de niveles de
binarización, que se parametriza mediante un umbral \alpha_{0}
inicial y una magnitud \Delta\alpha del nivel. La serie de
imágenes de valor umbral se obtiene por
con i = 0,...,
L_{intervalos}-1. El umbral \alpha_{0} inicial
y la magnitud \Delta\alpha del nivel son para este ejemplo de
realización las condiciones marginales anteriormente mencionadas
(véase el bloque 100 de la figura
1).
Valores típicos para estos parámetros así como
el número de máscaras binarias que puede generarse con ellos se
muestran en la tabla de la figura 8. El número de imágenes
L_{intervalos} binarias, que teniendo en cuenta el comportamiento
de clasificación debería ser lo más pequeño posible en
contraposición a la complejidad del tiempo de propagación, se
determina por
Dentro de una imagen binaria cualquiera, se
extraen intervalos relacionados, que utilizan vecindades de cuatro,
a partir de los píxeles de valor uno o de valor cero. Utilizando
estos intervalos el número de intervalos (NOC) relacionados de los
píxeles de valor k con k \in (0, 1) se denomina con
NOC_{k}(\alpha). El número total de píxeles de valor k
dentro de un intervalo R_{i} se denomina como NOP_{k}(i,
\alpha) = |R_{i}|. Adicionalmente la irregularidad (IRGL)
de cada intervalo R_{i} se define tal como sigue:
en la
que
son los centros de gravedad del
intervalo correspondiente. Ahora se calcula para cada umbral
\alpha la irregularidad media ponderada de intervalos dentro de
la imagen I_{B}_{\alpha}(x, y) binaria correspondiente
tal como
sigue:
determinándose la ponderación
mediante el número de píxeles NOP_{k}(i, \alpha) dentro
de un intervalo R_{i} cualquiera. A partir de las cuatro
funciones NOC_{0}(\alpha), IRGL_{0}(\alpha) y
IRGL_{1}(\alpha) se obtienen cuatro medidas
estadísticas, que se reproducen en la tabla de la figura 9, siendo g
(\alpha) una de las cuatro funciones de \alpha. Esto lleva a
una cantidad total de 16 características, que son representativas
de diferentes texturas. Las características, que se derivan a partir
de las funciones NOC_{0}(\alpha) y
NOC_{1}(\alpha), que son los números de intervalos
relacionados por nivel de binarización, describen el grosor de
partícula de una textura. Los valores medios grandes de estos
parámetros pueden interpretarse como un gran número de intervalos,
que representan una estructura fina. La desviación estándar por NOC
describe la varianza para diferentes umbrales y por tanto, cómo de
intensas son las diferencias de niveles de grises
contiguos.
Además las medidas de irregularidad permiten una
caracterización del aspecto de la textura con respecto a
estructuras compactas pequeñas tales como grava o estructuras largas
como por ejemplo superficies de grabado en madera.
Según el segundo ejemplo de realización de la
presente invención se evitan las desventajas del enfoque recién
descrito para la determinación de las características necesarias
para una clasificación, porque este enfoque se amplía a la
observación de varios planos. De manera similar al enfoque entre
planos anteriormente descrito, que se utiliza para las
características de histograma de la suma e histograma de la
diferencia, puede utilizarse una operación binaria entre las
representaciones intermedias (planos), para registrar las
dependencias entre planos. Las tres operaciones booleanas básicas
Y, O y XOR se presentan como solución.
La figura 10 muestra, cómo por ejemplo a partir
de tres planos (por ejemplo RVA) de una imagen se generan pilas
binarias combinadas, para generar características entre planos
geométricas estadísticas. En la figura 10 se muestran tres planos
228, 230, 232, que se obtienen con una toma de características de la
imagen. Para cada uno de los planos se genera una pila 234, 236,
238 binaria con una pluralidad de máscaras binarias, enlazando las
intensidades a partir de los planos individuales mediante
operaciones booleanas, tal como se muestra en la figura 10 con 240,
242, 244. Más concretamente, tras la operación de valor umbral se
aplica una operación booleana entre los diferentes planos 228, 230,
232 y las pilas 234, 236, 238 binarias resultantes (pilas de
imágenes) se utilizan para el cálculo de características.
Para una imagen I(x,y) a color con
índices de canal p \neq q, pueden obtenerse imágenes
I^{(pq)}_{B}_{\alpha}(x,y) entre planos binarias
mediante
siendo \odot una de las
operaciones booleanas Y, O y XOR y p,q \in {R,G,B}. En el espacio
de imagen con tres canales esto lleva a tres pilas o máscaras
I^{(pq)}_{B}_{\alpha} binarias para un cálculo de
características. A partir de aquí se obtienen los vectores 246, 248,
250 de características, que se encadenan, lo que da lugar a 48
características.
Las imágenes I^{(pq)}_{B}_{\alpha}
intermedias no tienen que calcularse de manera explícita. Por tanto
en este caso para cada operación \odot booleana se indican
formulaciones alternativas. Por motivos de brevedad se omite una
indexación (x,y) de las coordenadas. El enlace Y puede implementarse
mediante una operación de mínimo y una comparación posterior,
si
Puede estar prevista una formulación similar
utilizando la operación de máximo para el enlace O:
Sólo el enlace XOR requiere como caso especial
dos operaciones de comparación y por tanto se formula tal como
sigue:
Según una operación de mínimo el enlace Y
produce intervalos de valor uno más pequeños que el enlace O, que
utiliza el valor máximo de dos intensidades de canal. Si sólo uno de
los colores básicos (RVA) es dominante o débil, se obtienen por
tanto a partir de la operación de valor umbral intervalos homogéneos
mayores. El enlace XOR más complejo conserva no obstante
estructuras con colores básicos dominantes, aunque suprime
intervalos con valores cromáticos similares o mezclados.
De manera similar al primer ejemplo de
realización pueden generarse también en este caso las
características en el espacio HSV. Para el SGF también debe
utilizarse el espacio HSV sometido a una operación de valor umbral.
Se hace referencia a que esto no lleva a ninguna operación de valor
de umbral doble, dado que el canal H de tonalidad se somete a una
operación de valor umbral con respecto al valor S de saturación
correspondiente de un píxel determinado. Para formar la pila
binaria en el espacio H’V cada canal se procesa individualmente.
Cada pila binaria se trata por separado y las
características se calculan independientemente, lo que da lugar a
un vector de 32 entradas. En la figura 11 se muestran el plano H 252
y el plano V 254, que se generan por la toma de la imagen. A partir
de los planos 252, 254 se forman mediante una operación de valor
umbral las pilas 256 y 258 binarias con una pluralidad de máscaras
binarias. A partir de las pilas 256 y 258 binarias se generan los
vectores 260 y 262 de características.
\global\parskip0.900000\baselineskip
Sin embargo, dado que el canal H’ de tonalidad
sometido a una operación de valor umbral es una representación
circular, los colores similares podrían finalizar tras la
binarización en entradas diferentes. Por tanto se realiza una
transformación trigonométrica, que se define como
lo que da lugar a una función
monótona con respecto al espaciamiento del punto de referencia en H
= 0. A este respecto, un factor de escalonamiento H’_{0} = 255
ayuda a conseguir valores similares como para los niveles de
grises. Esta medida soluciona el problema de colores similares en
entradas
diferentes.
Se clasificaron cuatro conjuntos diferentes de
imagen a color utilizando los planteamientos según la invención. Se
seleccionaron dos conjuntos (VisTex, BarkTex), porque ya están
descritos y evaluados en la bibliografía de procesamiento de
imágenes, los otros dos conjuntos se seleccionaron debido a su
relevancia práctica en aplicaciones médicas (células del cuello
uterino) e industriales (defectos de la madera).
La base de datos (VisTex) de textura de visión
del Instituto de Tecnología de Massachussets (MIT) es una colección
de imágenes de textura, que sirven como referencia para algoritmos
de procesamiento de imágenes. La base de datos contiene más de 100
imágenes de referencia individuales e imágenes naturales con varias
texturas. El tamaño de la región (ROI) observada ascendió a 64 x 64
píxeles, mientras que el tamaño de la imagen original con colores
RVA de 24 bits era de 512 x 512 píxeles.
La base de datos BarkTex contiene imágenes de
cortezas de seis clases de árboles diferentes, que se reproducen en
la tabla de la figura 12, en la que se indican las denominaciones
alemanas y latinas. El tamaño de imagen original ascendió con
colores RVA de 24 bits a 256 x 384 píxeles. Las influencias externas
tales como el moho u hongos, riego, condición del suelo y edad del
árbol llevan a un problema de clasificación difícil.
Para un examen citológico se utilizaron
fragmentos de imágenes de muestra de núcleos celulares de un cuello
uterino a partir de dos muestras diferentes con núcleos celulares
sanos y malformados. El tamaño de la región (ROI) observada
ascendió a 32 x 32 píxeles, mientras que el tamaño de imagen
original con colores RVA de 24 bits ascendió a 1000 x 700
píxeles.
Para muestras de madera se utilizaron imágenes,
cuyo tamaño de imagen original con colores RVA de 24 bits ascendió
a 128 x 128 píxeles. Las clases de texturas están descritas en la
tabla de la figura 13. El análisis de imagen digital puede
utilizarse para el examen de la superficie de bloques de madera en
aserraderos. Las imágenes de tablones de madera de pino sencillos
se tomaron utilizando una cámara de exploración por líneas CCD de
24 bits, que estaba sujeta sobre la banda transportadora.
Para las imágenes de ejemplo se determinaron las
características de textura basándose en los enfoques según la
invención anteriormente descritos. Basándose en las características
de textura generadas se realizó a continuación una clasificación de
las imágenes, comparándose los resultados de la clasificación con
los resultados, que se consiguieron mediante una clasificación, que
se realizó para las mismas imágenes utilizando características, que
se generaron según enfoques de valor de gris convencionales.
Para la ampliación del color según el primer
ejemplo de realización se generaron para la clasificación
características, que se calcularon en el espacio RVA, basándose en
la medida de la distancia de color y en el espacio HSV utilizando
los histogramas de la suma y de la diferencia allí generados.
Para imágenes multiespectrales (procedimiento
entre planos) se generaron las características entre planos con un
ajuste adicional de un desplazamiento a cero de d = 0, estando la
dirección \theta sin definir. Los resultados se muestran en la
tabla reproducida en la figura 14. En comparación con los enfoques
de escala de grises habituales se muestra una mejora con respecto a
la medida \Deltar de mejora absoluta. La única excepción la
forman los núcleos celulares del cuello uterino con un empeoramiento
de la tasa de reconocimiento. El motivo se encuentra en que estas
imágenes en su aspecto son bastante grises en el caso de ruidos de
cámara intensos. Mediante el uso del valor medio ponderado para una
representación gris se compensa parcialmente el ruido y se
estabiliza la clasificación, de modo que para estas imágenes también
se obtienen mejores resultados que en el enfoque de valor de
gris.
La medida de distancia de color, que se aplicó
en los histogramas de la suma y de la diferencia, es la norma L2 o
la distancia Euclídea. En este caso se requiere otra longitud de
histograma de 883 debido a los diferentes valores de extremo. Al
contrario que los procedimientos entre planos no aumenta el número
de características, porque todos los planos se tratan
simultáneamente. Las tasas de reconocimiento se muestran en la tabla
de la figura 15. En comparación con la referencia de nivel de
grises correspondiente (véase la mejora \Deltar) no se obtiene
fundamentalmente ninguna modificación. Resultados similares se
obtienen mediante la aplicación de las características de la
distancia Euclídea en la representación L*u*v* de las imágenes. En
ese caso se utilizó una longitud de histograma de 737.
\global\parskip1.000000\baselineskip
En la ampliación no lineal en el espacio HSV se
aplica antes del cálculo de las características una operación de
valor umbral en el canal H de tonalidad con respecto a la saturación
S. La clasificación
dejar-un-valor-fuera
(leaving one out) se aplicó a las imágenes sometidas a una
operación de valor umbral con seis valores umbral diferentes
S_{min} \in {0, 25, 50, 100, 150, 200}. Los mejores resultados
para las características entre planos en la imagen H’V resultante
se resumen en la tabla de la figura 16 en la sección superior.
Motivado por la naturaleza circular de la tonalidad H, se introdujo
una medida de distancia trigonométrica. A este respecto se calculan
características en el plano V y H’ por separado y los resultados se
muestran en la sección inferior de la tabla de la figura 15.
Resumiendo ha de indicarse, que las
características H’V entre planos y no lineales con un valor umbral
S_{min} = 50 presentan un comportamiento fundamentalmente mejor
que las características originales en las imágenes de escala de
grises. Los mejores resultados se resumen en la tabla de la figura
17.
Para la ampliación de color según el segundo
ejemplo de realización se generaron igualmente para la clasificación
características, que se calcularon en el espacio RVA, basándose en
la medida de distancia de color y en el espacio HSV utilizando las
máscaras binarias generadas en el mismo.
En la ampliación en los espacios de color
lineales se derivan las características SGF entre planos a partir
de operaciones booleanas entre las pilas de imágenes binarias de
planos separados y se aplican al espacio RVA simétrico. Tal como
puede deducirse a partir de la tabla mostrada en la figura 18, se
obtienen a este respecto mejoras claras con respecto a enfoques de
valor de gris comparables.
En la ampliación no lineal en el espacio RVA las
características H’V no lineales utilizan los planos de tonalidad y
de valor independientemente entre sí. H’ se obtiene a partir de la
operación de valor umbral de la tonalidad H con respecto a la
saturación S, que en este caso se realiza para seis valores umbral
S_{min} \in {0, 25, 50, 100, 150, 200} diferentes. Los
resultados se reproducen en la tabla de la figura 19.
Aunque el procedimiento según la invención se
haya descrito mediante ejemplos de realización, en los que se
empleó una imagen a color o un fragmento de imagen a color como
imagen de tres canales, la presente invención no está limitada a
ello. La secuencia de imágenes o la imagen puede haberse generado
mediante una toma de n canales, n \geq 2. El cálculo de las
características numéricas para cada una de las regiones se realiza
incluyendo todos o una parte de los canales de la imagen, pudiendo
contener cada uno de los canales en lugar de datos de color también
otros datos/información multiespectral, como por ejemplo información
basada en rayos IR, rayos UV, rayos X, etc.
De este modo puede reconocerse a partir de los
resultados anteriormente mencionados, que el uso de características
de textura en una clasificación, que se obtuvo mediante el
procedimiento según la invención, debido al enlace de la
información disponible a partir de cada uno de los canales de
imagen, proporciona sin excepción mejores resultados de
clasificación, que los enfoques de valor de gris habituales.
A pesar de que en la descripción anterior de los
ejemplos de realización preferidos se utilizaron fragmentos de
imagen rectangulares, para determinar la característica de textura,
la presente invención no está limitada a ello. Más bien el
procedimiento según la invención puede aplicarse a fragmentos de
forma arbitraria. La forma de los fragmentos puede estar adaptada
por ejemplo a la forma de un objeto en la imagen, cuyas
características de textura han de determinarse, lo que tiene la
ventaja, de que sólo deben procesarse los puntos de imagen
asociados al objeto. El fragmento de imagen puede estar adaptado por
ejemplo a la forma de un núcleo celular o melanoma de piel que haya
que examinarse.
En la descripción anterior de los ejemplos de
realización preferidos se describió la conversión de los datos RVA
en el espacio HSV o en el espacio de color L*u*v*. En lugar de estas
conversiones descritas, los datos RVA pueden transferirse también a
otros espacios de color conocidos.
Claims (7)
1. Procedimiento para extraer
características de textura a partir de una imagen (108), que
comprende una pluralidad de puntos (x_{1}/y_{1},
x_{2}/y_{2}) de imagen, con las etapas siguientes:
(a) para cada uno de la pluralidad de puntos
(x_{1}/y_{1}, x_{2}/y_{2}) de imagen, comparar la intensidad
de píxel del punto de imagen con un valor umbral, para generar una
máscara (234, 236, 238; 252, 254) binaria, que para cada punto
(x_{1}/y_{1}, x_{2}/y_{2}) de imagen presenta un primer
valor binario, cuando la intensidad de píxel supera el valor
umbral, o una segundo valor binario, cuando la intensidad de píxel
no supera el valor umbral;
caracterizado porque la imagen (108) es
una imagen multicanal y la etapa (a) se repite para cada uno de los
canales, para generar una máscara binaria para cada uno de los
canales; y
porque el procedimiento presenta además las
etapas siguientes.
(b) para cada uno de la pluralidad de puntos
(x_{1}/y_{1}, x_{2}/y_{2}) de imagen de al menos dos
canales diferentes, enlazar los valores binarios de manera lógica
para el punto de imagen en la máscara binaria asociada con el
primer canal con el valor binario para el punto de imagen en la
máscara binaria asociada con el segundo canal, para obtener una
imagen binaria entre planos; y
(c) determinar una o varias características de
textura a partir de la imagen binaria entre planos.
2. Procedimiento según la reivindicación 1, en
el que se repite la etapa (b), hasta que para todas las
combinaciones de diferentes canales (202, 204, 206; 214, 216; 228,
230, 232; 252, 254) de la imagen (108) existen imágenes binarias
entre planos.
3. Procedimiento según la reivindicación 1 ó 2,
en el que las características de textura determinadas se integran
en una o varias características (246, 248, 250; 260, 262) de textura
total de la imagen (108) multicanal.
4. Procedimiento según la reivindicación 3, en
el que la integración de las características de textura comprende
generar un vector de textura para la imagen (108) multicanal, en el
que están depositadas las características de textura
determinadas.
5. Procedimiento según una de las
reivindicaciones 1 a 4, en el que la imagen (108) se genera mediante
una toma multicanal, conteniendo los canales (202, 204, 206; 214,
216; 228, 230, 232; 252, 254) de la imagen (108) diferente
información (RVA, L*u*v*, HSV) de color u otra información
multiespectral, basándose la demás información multiespectral en
tomas mediante rayos IR, rayos UV o rayos X.
6. Procedimiento según la reivindicación 5, en
el que, cuando los canales (202, 204, 206; 214, 216; 228, 230, 232;
252, 254) de la imagen (108) contienen información de color, a los
canales está asociada información con respecto al color (RVA) de la
imagen (108), con respecto a la luminancia y la crominancia (L*u*v*)
de la imagen (108) o con respecto a la tonalidad de la imagen, la
saturación de la imagen y del valor (HSV) de la imagen (108).
7. Procedimiento según una de las
reivindicaciones 1 a 6, en el que la imagen (108), a partir de la
que van a extraerse las características de textura, es un fragmento
formado de manera arbitraria de una imagen total.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE10239801A DE10239801A1 (de) | 2002-08-29 | 2002-08-29 | Verfahren zum Extrahieren von Texturmerkmalen aus einem mehrkanaligen Bild |
| DE10239801 | 2002-08-29 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2283590T3 true ES2283590T3 (es) | 2007-11-01 |
Family
ID=31724167
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES02762474T Expired - Lifetime ES2283590T3 (es) | 2002-08-29 | 2002-09-11 | Procedimiento para extraer caracteristicas de textura a partir de una imagen multicanal. |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US7130465B2 (es) |
| EP (1) | EP1532583B1 (es) |
| AT (1) | ATE358303T1 (es) |
| DE (2) | DE10239801A1 (es) |
| ES (1) | ES2283590T3 (es) |
| WO (1) | WO2004021280A2 (es) |
Families Citing this family (29)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE10239801A1 (de) * | 2002-08-29 | 2004-03-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Extrahieren von Texturmerkmalen aus einem mehrkanaligen Bild |
| DE10353785B4 (de) * | 2003-11-18 | 2006-05-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zur Erfassung von verschiedenen Zelltypen von Zellen in einer biologischen Probe |
| US8176414B1 (en) * | 2005-09-30 | 2012-05-08 | Google Inc. | Document division method and system |
| KR20080064155A (ko) | 2005-10-14 | 2008-07-08 | 어플라이드 리써치 어쏘시에이츠 뉴질랜드 리미티드 | 표면 특징을 모니터링하는 방법 및 장치 |
| US7876970B2 (en) * | 2006-01-13 | 2011-01-25 | Qualcomm Incorporated | Method and apparatus for white balancing digital images |
| WO2007096168A2 (en) * | 2006-02-22 | 2007-08-30 | Sony Deutschland Gmbh | Method for discriminating textures regions and homogeneous or flat regions in an image and methods for estimating noise in an image sequence |
| US20080005684A1 (en) * | 2006-06-29 | 2008-01-03 | Xerox Corporation | Graphical user interface, system and method for independent control of different image types |
| FR2917830B1 (fr) * | 2007-06-20 | 2009-10-02 | Oreal | Procede et systeme d'evaluation de la brillance percue par un observateur humain d'un film de produit cosmetique. |
| US8179363B2 (en) * | 2007-12-26 | 2012-05-15 | Sharp Laboratories Of America, Inc. | Methods and systems for display source light management with histogram manipulation |
| US8059891B2 (en) * | 2007-12-30 | 2011-11-15 | Intel Corporation | Markov stationary color descriptor |
| US9083519B2 (en) * | 2008-02-29 | 2015-07-14 | Sharp Laboratories Of America, Inc. | Systems and methods for adaptively selecting a decoding scheme to decode embedded information |
| US8064692B2 (en) * | 2008-12-24 | 2011-11-22 | Weyerhaeuser Nr Company | Automatic age classification of forest land |
| DE102009023722A1 (de) * | 2009-06-03 | 2010-12-09 | Bayerische Motoren Werke Aktiengesellschaft | Verfahren zur Ermittlung und Bewertung des Tragbilds von Zahnrädern |
| JP5246078B2 (ja) * | 2009-07-10 | 2013-07-24 | 株式会社ニコン | 被写体位置特定用プログラム、およびカメラ |
| DE102009044962A1 (de) | 2009-09-24 | 2011-04-07 | W.O.M. World Of Medicine Ag | Dermatoskop und Elevationsmessgerät |
| CN101937567B (zh) * | 2010-09-28 | 2012-01-18 | 中国科学院软件研究所 | 一种简捷的主纹理提取方法 |
| JP5765026B2 (ja) * | 2011-04-06 | 2015-08-19 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
| US9179844B2 (en) | 2011-11-28 | 2015-11-10 | Aranz Healthcare Limited | Handheld skin measuring or monitoring device |
| US10089754B2 (en) * | 2013-03-04 | 2018-10-02 | Saturn Licensing Llc | Unevenness inspection system, unevenness inspection method, and unevenness inspection program |
| DE102014106224A1 (de) | 2014-05-05 | 2015-11-05 | Carl Zeiss Microscopy Gmbh | Verfahren zum Segmentieren eines Farbbildes sowie digitales Mikroskop |
| WO2015199067A1 (ja) * | 2014-06-24 | 2015-12-30 | 株式会社ニコン | 画像解析装置、撮像システム、手術支援システム、画像解析方法、及び画像解析プログラム |
| CN104751446A (zh) * | 2015-01-06 | 2015-07-01 | 金陵科技学院 | 一种基于数字图案特征的扎染工艺预测方法 |
| EP3347857A1 (en) * | 2015-09-10 | 2018-07-18 | Koninklijke Philips N.V. | Automatic image feature removal |
| US10013527B2 (en) | 2016-05-02 | 2018-07-03 | Aranz Healthcare Limited | Automatically assessing an anatomical surface feature and securely managing information related to the same |
| US11116407B2 (en) | 2016-11-17 | 2021-09-14 | Aranz Healthcare Limited | Anatomical surface assessment methods, devices and systems |
| EP4183328A1 (en) | 2017-04-04 | 2023-05-24 | Aranz Healthcare Limited | Anatomical surface assessment methods, devices and systems |
| EP3723471A4 (en) * | 2017-12-15 | 2021-08-25 | Vineland Research and Innovation Centre | PROCESSES AND SYSTEMS ASSOCIATED WITH DETERMINING THE MATURITY OF A MUSHROOM |
| US12039726B2 (en) | 2019-05-20 | 2024-07-16 | Aranz Healthcare Limited | Automated or partially automated anatomical surface assessment methods, devices and systems |
| US11769241B1 (en) * | 2019-07-30 | 2023-09-26 | Digimarc Corporation | Information-client server built on a rapid material identification platform |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04273587A (ja) | 1991-02-28 | 1992-09-29 | N T T Data Tsushin Kk | 物体検出装置 |
| US6453069B1 (en) * | 1996-11-20 | 2002-09-17 | Canon Kabushiki Kaisha | Method of extracting image from input image using reference image |
| US6081612A (en) | 1997-02-28 | 2000-06-27 | Electro Optical Sciences Inc. | Systems and methods for the multispectral imaging and characterization of skin tissue |
| US6469710B1 (en) * | 1998-09-25 | 2002-10-22 | Microsoft Corporation | Inverse texture mapping using weighted pyramid blending |
| US7062084B2 (en) | 2000-12-01 | 2006-06-13 | Sharp Laboratories Of America, Inc. | Method for image description using color and local spatial information |
| FR2825814B1 (fr) * | 2001-06-07 | 2003-09-19 | Commissariat Energie Atomique | Procede de creation automatique d'une base de donnees images interrogeable par son contenu semantique |
| DE10239801A1 (de) * | 2002-08-29 | 2004-03-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Extrahieren von Texturmerkmalen aus einem mehrkanaligen Bild |
| EP1398733A1 (en) * | 2002-09-12 | 2004-03-17 | GRETAG IMAGING Trading AG | Texture-based colour correction |
-
2002
- 2002-08-29 DE DE10239801A patent/DE10239801A1/de not_active Ceased
- 2002-09-11 DE DE50209846T patent/DE50209846D1/de not_active Expired - Lifetime
- 2002-09-11 AT AT02762474T patent/ATE358303T1/de not_active IP Right Cessation
- 2002-09-11 ES ES02762474T patent/ES2283590T3/es not_active Expired - Lifetime
- 2002-09-11 WO PCT/EP2002/010193 patent/WO2004021280A2/de not_active Ceased
- 2002-09-11 EP EP02762474A patent/EP1532583B1/de not_active Expired - Lifetime
-
2005
- 2005-02-08 US US11/055,665 patent/US7130465B2/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| WO2004021280A2 (de) | 2004-03-11 |
| US7130465B2 (en) | 2006-10-31 |
| WO2004021280A3 (de) | 2004-06-24 |
| DE50209846D1 (de) | 2007-05-10 |
| EP1532583B1 (de) | 2007-03-28 |
| DE10239801A1 (de) | 2004-03-18 |
| US20050196037A1 (en) | 2005-09-08 |
| EP1532583A2 (de) | 2005-05-25 |
| ATE358303T1 (de) | 2007-04-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2283590T3 (es) | Procedimiento para extraer caracteristicas de textura a partir de una imagen multicanal. | |
| Roy et al. | A study about color normalization methods for histopathology images | |
| Ali et al. | Towards the automatic detection of skin lesion shape asymmetry, color variegation and diameter in dermoscopic images | |
| Lu et al. | Spectral-spatial classification using tensor modeling for cancer detection with hyperspectral imaging | |
| Casanova et al. | Texture analysis using fractal descriptors estimated by the mutual interference of color channels | |
| US20090010545A1 (en) | System and method for identifying feature of interest in hyperspectral data | |
| Piqueras et al. | Combining multiset resolution and segmentation for hyperspectral image analysis of biological tissues | |
| CN108388874A (zh) | 基于图像识别与级联分类器的对虾形态参数自动测量方法 | |
| JPS63118889A (ja) | 画像を用いた変化検出方法 | |
| Cao et al. | Multi-focus image fusion by nonsubsampled shearlet transform | |
| Zhang et al. | Computerized facial diagnosis using both color and texture features | |
| Cai et al. | Handheld four-dimensional optical sensor | |
| CN103235929A (zh) | 基于手背静脉图像的身份识别方法和装置 | |
| CN114216867A (zh) | 高光谱图像采集识别装置及方法 | |
| Yang et al. | Texton and sparse representation based texture classification of lung parenchyma in CT images | |
| Drew et al. | On illumination invariance in color object recognition | |
| CN111192314A (zh) | 一种确定gdv能量图像中手指的内外轮廓比率的方法及系统 | |
| JP2013041563A (ja) | 画像の類似性評価装置及びその評価方法 | |
| CN120299035A (zh) | 一种显微高光谱病理图像的精准标注方法 | |
| CN116448682B (zh) | 基于高光谱成像的龟甲年限鉴别方法、鉴别模型 | |
| Palm et al. | Color texture analysis of moving vocal cords using approaches from statistics and signal theory | |
| CN115760934A (zh) | 一种眼鼻三角区的自动标定方法 | |
| Akila et al. | Detection of melanoma skin cancer using segmentation and classification algorithms | |
| Obert et al. | Color Saturation: Upper and lower percentage histogram manipulation | |
| Liu et al. | Biological indexes based reflectional asymmetry for classifying cutaneous lesions |