ES2753373T3 - Procesamiento de aplicación de visión informática - Google Patents
Procesamiento de aplicación de visión informática Download PDFInfo
- Publication number
- ES2753373T3 ES2753373T3 ES14737434T ES14737434T ES2753373T3 ES 2753373 T3 ES2753373 T3 ES 2753373T3 ES 14737434 T ES14737434 T ES 14737434T ES 14737434 T ES14737434 T ES 14737434T ES 2753373 T3 ES2753373 T3 ES 2753373T3
- Authority
- ES
- Spain
- Prior art keywords
- image
- data
- frame
- processing
- sensor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3215—Monitoring of peripheral devices
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/325—Power saving in peripheral device
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/96—Management of image or video recognition tasks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/167—Detection; Localisation; Normalisation using comparisons between temporally consecutive images
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/667—Camera operation mode switching, e.g. between still and video, sport and normal or high- and low-resolution modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/95—Computational photography systems, e.g. light-field imaging systems
- H04N23/951—Computational photography systems, e.g. light-field imaging systems by using two or more images to influence resolution, frame rate or aspect ratio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computing Systems (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Image Analysis (AREA)
- Studio Devices (AREA)
- Power Sources (AREA)
- Image Processing (AREA)
Abstract
Un procedimiento que comprende: generar, en un circuito de detección de cambio (414, 514, 614, 814) incluido en una primera ruta de procesamiento (408, 508, 608, 808), una señal de control en base a una cantidad de cambio entre los primeros datos del sensor (112) y los segundos datos del sensor (114) que satisface un umbral, los primeros datos del sensor (112) correspondientes a un primer conjunto de valores de píxel asociados a una primera imagen (102) captada por un primer sensor (402, 502, 602, 842) y los segundos datos del sensor (114) correspondientes a un segundo conjunto de valores de píxel asociados a una segunda imagen (104) captada por el primer sensor (402, 502, 602, 842); el procedimiento caracterizado por proporcionar los segundos datos del sensor (114) a una segunda ruta de procesamiento (410, 510, 610, 810) para el procesamiento específico de la aplicación de visión informática en base a la señal de control (416, 516, 844), la segunda ruta de procesamiento (410, 510, 610, 810) diferente de la primera ruta de procesamiento (408, 508, 606, 808), en el que la potencia informática para la primera ruta de procesamiento (408, 508, 608, 808) es menor que la potencia informática para la segunda ruta de procesamiento (410, 510, 610, 810).
Description
DESCRIPCIÓN
Procesamiento de aplicación de visión informática
REIVINDICACIÓN DE PRIORIDAD
[0001] La presente solicitud reivindica prioridad de la solicitud de patente provisional de EE. UU. n.° 61/835.400, titulada "IMAGE-STATISTIC PROCESSING TO REDUCE COMPUTER VISION POWER USAGE [PROCESAMIENTO ESTADÍSTICO DE IMAGEN PARA REDUCIR EL USO DE POTENCIA DE VISIÓN INFORMÁTICA]", presentada el 14 de junio de 2013, la solicitud de patente provisional de EE. UU. n.° 61/871.678, titulada "SYSTEM AND METHOD TO IDENTIFY A CONTEXT OF AN IMAGE [SISTEMA Y PROCEDIMIENTO PARA IDENTIFICAR UN CONTEXTO DE UNA IMAGEN]", presentada el 29 de agosto de 2013, y la solicitud de patente no provisional de EE. UU. n.° 14/303.490, titulada "COMPUTER VISION APPLICATION PROCESSING [PROCESAMIENTO DE SOLICITUD DE VISIÓN INFORMÁTICA]", presentada el 12 de junio de 2014.
CAMPO
[0002] La presente divulgación se refiere en general al procesamiento de aplicación de visión informática.
DESCRIPCIÓN DE LA TÉCNICA RELACIONADA
[0003] Los avances en la tecnología han dado como resultado dispositivos informáticos más pequeños y más potentes. Por ejemplo, existe actualmente una variedad de dispositivos informáticos personales portátiles, que incluyen dispositivos informáticos inalámbricos, tales como teléfonos inalámbricos portátiles, asistentes digitales personales (PDA) y dispositivos de radiolocalización que son pequeños, ligeros y fáciles de transportar por los usuarios. Más específicamente, los teléfonos inalámbricos portátiles, tales como los teléfonos móviles y los teléfonos de protocolo de Internet (IP), pueden comunicar paquetes de voz y datos a través de redes inalámbricas. Además, muchos de dichos teléfonos inalámbricos incluyen otros tipos de dispositivos que están incorporados en los mismos. Por ejemplo, un teléfono inalámbrico también puede incluir una cámara fotográfica digital, una cámara de vídeo digital, un grabador digital y un reproductor de ficheros de audio. También, dichos teléfonos inalámbricos pueden procesar instrucciones ejecutables, incluyendo aplicaciones de software, tales como una aplicación de navegador de web, que se puede usar para acceder a Internet. Como tales, estos teléfonos inalámbricos pueden incluir capacidades informáticas significativas.
[0004] Los dispositivos electrónicos inalámbricos (por ejemplo, un teléfono inalámbrico) pueden tener un sensor de imagen que capta imágenes a una frecuencia de muestreo de datos dada. El sensor de imagen puede captar imágenes en respuesta a disparadores internos o externos. Un ejemplo de un disparador externo es la proximidad de un usuario al dispositivo de comunicación. Para ilustrar, un dispositivo electrónico inalámbrico puede disparar el sensor de imagen en respuesta a la detección de un sonido asociado al usuario. Un ejemplo de un disparador interno es la disponibilidad de recursos del dispositivo electrónico inalámbrico. Para ilustrar, el dispositivo electrónico inalámbrico puede disparar el sensor de imagen en respuesta a la determinación de que hay más de una cantidad umbral de potencia de batería disponible.
[0005] Adicionalmente, los dispositivos electrónicos inalámbricos pueden utilizar técnicas de visión informática para llevar a cabo una variedad de aplicaciones de visión informática. Por ejemplo, las técnicas de visión informática se pueden usar para aplicaciones de seguridad (por ejemplo, vigilancia, detección de intrusos, detección de objetos, reconocimiento facial, etc.), aplicaciones de uso ambiental (por ejemplo, control de iluminación), aplicaciones de detección y seguimiento de objetos, etc. Las técnicas de visión informática también se pueden usar para la detección de bordes, reconocimiento óptico de caracteres (OCR), detección facial, etc.
[0006] Las aplicaciones de visión informática pueden consumir una gran cantidad de potencia. Por ejemplo, las aplicaciones de visión informática pueden aplicar el procesamiento específico de la aplicación a cada trama en una secuencia de vídeo para determinar si hay un acontecimiento de alerta presente. Para ilustrar, si la aplicación de visión informática se diseña para detectar si un objeto está en un campo de visión (por ejemplo, el acontecimiento de alerta), cada trama se puede someter a un procesamiento específico de la aplicación para determinar si el objeto está en la trama. Realizar un procesamiento específico de la aplicación en cada trama puede consumir una gran cantidad de potencia.
[0007] Para algunas aplicaciones de visión informática, el dispositivo electrónico inalámbrico puede calcular descriptores visuales de las imágenes o tramas. Los descriptores visuales se pueden usar para el registro de vida, identificación/reconocimiento de gestos, inferencia interior-exterior y más. Calcular los descriptores visuales de todas las imágenes o tramas puede requerir muchos recursos y el dispositivo electrónico inalámbrico puede tener recursos limitados. Además, muchas imágenes captadas por la cámara pueden tener poco o ningún valor. Por ejemplo, las imágenes captadas periódicamente por la cámara pueden ser idénticas o casi idénticas.
[0008] La solicitud de patente de Estados Unidos con número de publicación US 2011/134251 A1 describe un procedimiento que reduce el consumo de potencia de una cámara que se usa para detectar el gesto de un usuario. Cuando la presencia de un usuario se detecta por un sensor de presencia, la cámara para la detección de gestos se enciende y se acciona en un modo de baja potencia a una velocidad de tramas baja. Cuando se detecta un gesto, la cámara se acciona en un modo de alta potencia a una velocidad de tramas mayor de modo que pueda detectar gestos más pequeños y más rápidos.
SUMARIO
[0009] El alcance de protección se define por las reivindicaciones independientes, a las que se hará referencia ahora. Los rasgos característicos opcionales se establecen en las reivindicaciones dependientes.
[0010] De acuerdo con un aspecto de la presente invención, se proporciona un procedimiento que incluye generar, en un circuito de detección de cambio incluido en una primera ruta de procesamiento, una señal de control en base a una cantidad de cambio entre los primeros datos del sensor y los segundos datos del sensor que satisface un umbral, los primeros datos del sensor correspondientes a un primer conjunto de valores de píxel asociados a una primera imagen captada por un primer sensor y los segundos datos del sensor correspondientes a un segundo conjunto de datos de píxel captados por el primer sensor; y proporcionar los segundos datos del sensor a una segunda ruta de procesamiento para el procesamiento específico de la aplicación de visión informática en base a la señal de control, la segunda ruta de procesamiento diferente de la primera ruta de procesamiento, en el que la potencia informática asociada a la primera ruta de procesamiento es menor que la potencia informática asociada a la segunda ruta de procesamiento.
[0011] De acuerdo con otro aspecto de la presente invención, se proporciona un aparato que incluye medios configurados para generar una señal de control en base a una cantidad de cambio entre los primeros datos del sensor y los segundos datos del sensor que satisface un umbral, los primeros datos del sensor correspondientes a un primer conjunto de valores de píxel asociados a una primera imagen captada por un primer sensor y los segundos datos del sensor correspondientes a un segundo conjunto de valores de píxel asociados a una segunda imagen captada por el primer sensor, en el que los medios configurados para generar la señal de control se incluyen en una primera ruta de procesamiento; y medios configurados para realizar el procesamiento específico de la aplicación de visión informática en los segundos datos del sensor en base a la señal de control, en el que los medios configurados para realizar el procesamiento específico de la aplicación de visión informática se incluyen en una segunda ruta de procesamiento diferente de la primera ruta de procesamiento, en el que la potencia informática asociada a la primera ruta de procesamiento es menor que la potencia informática asociada a la segunda ruta de procesamiento
[0012] De acuerdo con otro aspecto de la presente invención, se proporciona un medio legible por ordenador que incluye instrucciones que, cuando se ejecutan por un ordenador, hacen que el ordenador genere, en un circuito de detección de cambios incluido en una primera ruta de procesamiento, una señal de control basada en una cantidad de cambio entre los primeros datos del sensor y los segundos datos del sensor que satisface un umbral, los primeros datos del sensor correspondientes a un primer conjunto de valores de píxel asociados a una primera imagen captada por un primer sensor y los segundos datos del sensor correspondientes a un segundo conjunto de datos de píxel captados por el primer sensor; y proporcionar los segundos datos del sensor a una segunda ruta de procesamiento para el procesamiento específico de la aplicación de visión informática en base a la señal de control, la segunda ruta de procesamiento diferente de la primera ruta de procesamiento, en el que la potencia informática asociada a la primera ruta de procesamiento es menor que la potencia informática asociada a la segunda ruta de procesamiento.
[0013] Los procedimientos y sistemas se divulgan para reducir el uso de potencia de las aplicaciones de visión informática. Una secuencia de vídeo (por ejemplo, un conjunto de imágenes fijas secuenciadas en el tiempo) se puede captar por medio de una cámara y las tramas individuales de la secuencia de vídeo se pueden someter a procesamiento (por ejemplo, procesamiento de estadísticas). Por ejemplo, un generador de estadísticas puede determinar estadísticas de imagen para cada trama de la secuencia de vídeo. Las estadísticas de imagen pueden incluir un histograma de intensidad para cada trama, un histograma de color para cada trama, una suma de valores de píxel para píxeles particulares (por ejemplo, una fila particular de píxeles o una columna particular de píxeles) en cada trama, o una combinación de los mismos. Un circuito de detección de cambio puede determinar si una diferencia entre las primeras estadísticas de imagen de una primera trama y las segundas estadísticas de imagen de una segunda trama satisfacen un umbral. Si la diferencia no satisface el umbral, se puede omitir o ignorar el procesamiento específico de la aplicación de visión informática en la segunda trama para conservar potencia. Si la diferencia satisface el umbral, el circuito de detección de cambio puede proporcionar una señal de retroalimentación a un circuito de selección para activar (por ejemplo, accionar) una ruta de procesamiento de "alta potencia". Por ejemplo, la ruta de procesamiento de alta potencia puede incluir un procesador de aplicaciones (por ejemplo, un procesador usado para ejecutar aplicaciones de visión informática) para realizar el procesamiento específico de la aplicación de visión informática en la segunda trama. En algunos ejemplos, se pueden habilitar diferentes rutas de procesamiento, o porciones de las mismas, en diferentes tiempos en base a diferentes condiciones.
[0014] Como un ejemplo no limitante de procesamiento específico de la aplicación de visión informática, el procesador de aplicaciones puede extraer un rasgo característico (por ejemplo, un descriptor visual) o un conjunto de rasgos
característicos como sea necesario, en lugar de todos a la vez. Por ejemplo, el procesador de aplicaciones puede extraer un primer subconjunto de rasgos característicos (por ejemplo, descriptores visuales) de la segunda trama para identificar el contexto (por ejemplo, una ubicación) de la segunda trama. Por ejemplo, el procesador de aplicaciones puede extraer información de borde relacionada con la segunda trama. El procesador de aplicaciones puede determinar que el/los nivel(es) de confianza asociado(s) al primer subconjunto de rasgos característicos no satisface(n) un nivel de confianza umbral. En base a la determinación, el procesador de aplicaciones puede extraer más rasgos característicos (por ejemplo, un segundo subconjunto de rasgos característicos) de la segunda trama. Por ejemplo, el procesador de aplicaciones puede extraer información de borde de una copia de mayor resolución de la segunda trama. Como otro ejemplo, el procesador de aplicaciones puede extraer información de color de la segunda trama. El procesador de aplicaciones puede determinar que el/los nivel(es) de confianza asociado(s) a los rasgos característicos extraídos adicionales de la segunda trama satisface(n) el nivel de confianza umbral y puede usar los rasgos característicos extraídos adicionales para determinar el contexto de la trama.
[0015] El procesador de aplicaciones puede tener una jerarquía de recursos de procesamiento (por ejemplo, núcleos de procesamiento) para realizar un procesamiento específico de la aplicación de visión informática en la segunda trama. Por ejemplo, un primer recurso de procesamiento (por ejemplo, un recurso de procesamiento de "baja potencia") puede realizar el primer procesamiento específico de la aplicación de visión informática en la segunda trama. Si el primer recurso de procesamiento determina que la segunda trama requiere un procesamiento específico de la aplicación de visión informática adicional (por ejemplo, el segundo procesamiento específico de la aplicación de visión informática) fuera de las capacidades del primer recurso de procesamiento, el primer recurso de procesamiento puede solicitar que un segundo recurso de procesamiento (por ejemplo, un recurso de procesamiento de "alta potencia") realice el segundo procesamiento específico de la aplicación de visión informática en la segunda trama (por ejemplo, acciona el segundo recurso de procesamiento). En determinados modos de realización, el segundo recurso de procesamiento puede realizar el primer y segundo procesamiento específico de la aplicación de visión informática en la segunda trama de modo que el primer recurso de procesamiento se pueda desactivar (por ejemplo, entrar en un estado de "suspensión") para conservar potencia. En otros modos de realización, el segundo recurso de procesamiento puede "rehusar" realizar el segundo procesamiento específico de la aplicación de visión informática en la segunda trama, informar/programar al primer recurso de procesamiento para que realice el segundo procesamiento específico de la aplicación de visión informática, y entrar en un estado de suspensión para conservar potencia.
[0016] Una ventaja particular proporcionada por al menos uno de los modos de realización descritos es la reducción de una cantidad de potencia consumida por un procesador de aplicaciones usado para ejecutar aplicaciones de visión informática. Por ejemplo, el procesamiento específico de la aplicación de una trama particular se puede omitir en respuesta a una determinación de que la trama particular y una trama previa son sustancialmente similares (por ejemplo, en base a una comparación de estadísticas de imagen de las tramas). Omitir el procesamiento específico de la aplicación puede conservar la potencia de la batería.
[0017] Otra ventaja particular proporcionada por al menos uno de los modos de realización divulgados está habilitar la identificación de contextos de imagen. Por ejemplo, un contexto de una imagen se puede identificar extrayendo menos que la totalidad de los rasgos característicos de la imagen. Se puede lograr una reducción significativa en los costes computacionales y una reducción correspondiente del uso de potencia. Otros aspectos, ventajas y rasgos característicos de la presente divulgación resultarán evidentes después de revisar la solicitud completa, incluyendo las siguientes secciones: Breve descripción de los dibujos, Descripción detallada y Reivindicaciones.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
[0018]
La FIG. 1 es un diagrama de un modo de realización ilustrativo particular de tramas de imagen de una secuencia de vídeo y representaciones de píxeles correspondientes de las tramas de imagen;
la FIG. 2 es un diagrama de un modo de realización ilustrativo particular de representaciones de píxeles parciales de tramas de imagen de una secuencia de vídeo;
la FIG. 3 es un diagrama de bloques de un modo de realización ilustrativo particular de un sistema de procesamiento que se puede hacer funcionar para reducir el uso de potencia asociado a aplicaciones de visión informática en base a estadísticas de imagen;
la FIG. 4 es un diagrama de un modo de realización ilustrativo particular de un sistema de procesamiento que se puede hacer funcionar para reducir el uso de potencia asociado a aplicaciones de visión informática;
la FIG. 5 es un diagrama de otro modo de realización ilustrativo particular de un sistema de procesamiento que se puede hacer funcionar para reducir el uso de potencia asociado a aplicaciones de visión informática;
la FIG. 6 es un diagrama de otro modo de realización ilustrativo particular de un sistema de procesamiento que se puede hacer funcionar para reducir el uso de potencia asociado a aplicaciones de visión informática;
la FIG. 7 es un diagrama de la segunda ruta de procesamiento de la FIG. 6;
la FIG. 8 es un diagrama de otro modo de realización ilustrativo particular de un sistema de procesamiento operativo para reducir el uso de potencia asociado a aplicaciones de visión informática;
la FIG. 9 es un diagrama de otro modo de realización ilustrativo particular de un sistema de procesamiento que se puede hacer funcionar para reducir el uso de potencia asociado a aplicaciones de visión informática;
la FIG. 10 es un diagrama que ilustra el sistema de procesamiento de la FIG. 9 en modo de potencia parcial; la FIG. 11 es un diagrama que ilustra el sistema de procesamiento de la FIG. 9 en modo de potencia máxima; la FIG. 12 es un diagrama de bloques de un modo de realización ilustrativo particular de dispositivos móviles que pueden utilizar una cámara siempre encendida para identificar un contexto de una imagen;
la FIG. 13 es un diagrama de un diagrama de entrada/salida que ilustra cómo los modos de realización de dispositivos pueden utilizar un sensor y otra información en determinaciones contextuales, que pueden influir en la modulación de una frecuencia de muestreo de una cámara siempre encendida;
la FIG. 14 es un diagrama de bloques de un modo de realización ilustrativo particular de un sistema para identificar un contexto de una imagen;
la FIG. 15 ilustra los intervalos de cálculo asociados a la extracción de subconjuntos de rasgos característicos de imágenes;
la FIG. 16 es un diagrama de otro modo de realización particular de un sistema para identificar un contexto de una imagen;
la FIG. 17 es un diagrama de otro modo de realización particular de un sistema para identificar un contexto de una imagen;
la FIG. 18 es un diagrama de otro modo de realización particular de un sistema para identificar un contexto de una imagen;
la FIG. 19 es un diagrama de otro modo de realización particular de un sistema para identificar un contexto de una imagen;
la FIG. 20 es un diagrama de otro modo de realización particular de un sistema para identificar un contexto de una imagen;
la FIG. 21 es un diagrama de otro modo de realización particular de un sistema para identificar un contexto de una imagen;
la FIG. 22 es un diagrama de otro modo de realización particular de un sistema para identificar un contexto de una imagen;
la FIG. 23 es un diagrama de otro modo de realización particular de un sistema para identificar un contexto de una imagen y se puede acoplar al sistema de la FIG. 21;
la FIG. 24 es un diagrama de otro modo de realización particular de un sistema para identificar un contexto de una imagen y se puede acoplar al sistema de la FIG. 22, el sistema de la FIG. 23, o ambos;
la FIG. 25 es un diagrama de otro modo de realización particular de un sistema para identificar un contexto de una imagen y se puede acoplar al sistema de la FIG. 24;
la FIG. 26 es un diagrama de otro modo de realización particular de un sistema para identificar un contexto de una imagen y se puede acoplar al sistema de la FIG. 24, el sistema de la FIG. 25, o ambos;
la FIG. 27 es un diagrama de otro modo de realización particular de un sistema para identificar un contexto de una imagen y se puede acoplar al sistema de la FIG. 24, el sistema de la FIG. 26, o ambos;
la FIG. 28 es un gráfico de barras que ilustra un ejemplo de tiempos de ejecución asociados a la extracción de diversos subconjuntos de rasgos característicos de imágenes de prueba;
la FIG. 29 es un gráfico de barras que ilustra un ejemplo del uso de memoria asociado a la extracción de diversos subconjuntos de rasgos característicos de imágenes de prueba;
la FIG. 30 es un diagrama de flujo de un modo de realización particular de un procedimiento que reduce el uso de potencia asociado a aplicaciones de visión informática en base a estadísticas de imagen;
la FIG. 31 es un diagrama de flujo que ilustra un modo de realización particular de un procedimiento de identificación de un contexto de una imagen;
la FIG. 32 es un diagrama de flujo que ilustra otro modo de realización particular de un procedimiento de identificación de un contexto de una imagen;
la FIG. 33 es un diagrama de flujo que ilustra otro modo de realización particular de un procedimiento de identificación de un contexto de una imagen;
la FIG. 34 es un diagrama de flujo que ilustra otro modo de realización particular de un procedimiento de identificación de un contexto de una imagen;
la FIG. 35 es un diagrama de flujo de un modo de realización particular de un procedimiento de reducción del uso de potencia asociado a aplicaciones de visión informática;
la FIG. 36 es un diagrama de un modo de realización ilustrativo de un dispositivo móvil;
la FIG. 37 es un diagrama de bloques de un dispositivo inalámbrico que incluye componentes operativos para reducir el uso de potencia asociado a las aplicaciones de visión informática; y
la FIG. 38 es un diagrama de bloques de un modo de realización ilustrativo particular de un dispositivo que se puede hacer funcionar para identificar un contexto de una imagen.
DESCRIPCIÓN DETALLADA
[0019] En referencia a la FIG. 1, se muestra un modo de realización ilustrativo particular de tramas de imágenes de una secuencia de vídeo y representaciones de píxeles correspondientes de las tramas de imagen. Por ejemplo, la secuencia de vídeo puede incluir una primera trama 102 de datos de imagen, una segunda trama 104 de datos de imagen y una tercera trama 106 de datos de imagen. En un modo de realización particular, la primera trama 102, la segunda trama 104 y la tercera trama 106 pueden ser tramas de imagen consecutivas en la secuencia de vídeo.
[0020] La secuencia de vídeo puede estar sujeta a un procesamiento específico de la aplicación (por ejemplo, procesamiento de la aplicación de visión informática). Por ejemplo, en el modo de realización ilustrativo particular, la secuencia de vídeo puede estar sujeta a una aplicación de reconocimiento de mano (por ejemplo, sujeta a procesamiento que detecta si una mano está en un campo de visión). Sin embargo, en otros modos de realización, la secuencia de vídeo puede estar sujeta a otras aplicaciones de visión informática. Por ejemplo, la secuencia de vídeo puede estar sujeta a aplicaciones de seguridad (por ejemplo, vigilancia, detección de intrusos, detección de objetos, reconocimiento facial, etc.), aplicaciones de uso ambiental (por ejemplo, control de iluminación), aplicaciones de detección y seguimiento de objetos, etc.
[0021] En las tramas ilustradas en la FIG. 1, una mano no está presente (por ejemplo, visible) en el campo de visión de la primera trama 102, una porción de la mano es visible en el campo de visión de la segunda trama 104, y la mano es completamente visible en el campo de visión de la tercera trama 106. La primera trama 102 se puede caracterizar por píxeles en una primera representación de píxel 112, la segunda trama 104 se puede caracterizar por píxeles en una segunda representación de píxel 114, y la tercera trama 106 se puede caracterizar por píxeles en una tercera representación de píxel 116.
[0022] Un dispositivo de baja potencia (no mostrado en la FIG. 1) dentro de un sistema de procesamiento puede generar estadísticas de imagen para cada trama 102-106 en la secuencia de vídeo después de que se capta cada trama 102-106. Por ejemplo, el dispositivo de baja potencia puede generar estadísticas de imagen para cada trama 102-106 en base a las representaciones de píxeles correspondientes 112-116. Para tramas de imagen en escala de grises, cada píxel en las representaciones de píxeles 112-116 puede corresponder a un valor de intensidad entre cero (0) y doscientos cincuenta y cinco (255). Un valor de intensidad de cero puede corresponder a un píxel blanco y un valor de intensidad de doscientos cincuenta y cinco puede corresponder a un píxel negro. El dispositivo de baja potencia puede determinar el valor de intensidad para cada píxel en una trama particular 102-106 y generar un histograma de intensidad para la trama particular 102-106 en base a los recuentos para cada valor de intensidad. Por ejemplo, el dispositivo de baja potencia puede generar un primer histograma de intensidad para la primera trama 102, un segundo histograma de intensidad para la segunda trama 104 y un tercer histograma de intensidad para la tercera trama 106.
[0023] Para tramas de imagen multiespectrales, cada píxel en las representaciones de píxeles 112-116 puede corresponder a un valor de color particular. Los valores de color se pueden basar en una concentración de rojo (R), verde (G) y azul (B) en el píxel. El dispositivo de baja potencia puede determinar el valor de color para cada píxel en una trama particular 102-106 y generar un histograma de color para la trama particular 102-106 en base a los recuentos para cada valor de color. Por ejemplo, el dispositivo de baja potencia puede generar un primer histograma de color para la primera trama 102, un segundo histograma de color para la segunda trama 104 y un tercer histograma de color para la tercera trama 106.
[0024] Un dispositivo de alta potencia (no mostrado en la FIG. 1) dentro del sistema de procesamiento puede realizar un procesamiento específico de la aplicación en tramas particulares en la secuencia de vídeo. Por ejemplo, en el modo de realización ilustrativo particular, el procesamiento específico de la aplicación puede incluir determinar si un objeto particular (por ejemplo, una mano) está en la trama seleccionada. En otros modos de realización, el procesamiento específico de la aplicación puede incluir determinar si se desencadena un acontecimiento de alerta. Un acontecimiento de alerta puede corresponder a un cambio en la condición entre tramas. Como ejemplos ilustrativos, no limitantes, un acontecimiento de alerta puede corresponder a un paciente que se cae de la cama, una intrusión en el hogar, un automóvil que aparca en un camino de entrada, una persona que pasa por una puerta, etc. Generar estadísticas de imagen en el dispositivo de baja potencia puede consumir menos potencia que realizar el procesamiento específico de la aplicación en el dispositivo de alta potencia. Por ejemplo, generar las segundas estadísticas de imagen puede consumir menos potencia que realizar el procesamiento específico de la aplicación en la segunda trama 104.
[0025] Durante el funcionamiento, una cámara (por ejemplo, una cámara de vídeo) puede captar la primera trama 102 en un primer tiempo y el sistema de procesamiento puede realizar un procesamiento de imagen en la primera trama 102. Por ejemplo, el dispositivo de baja potencia puede generar las primeras estadísticas de imagen (por ejemplo, el primer histograma de intensidad y/o el primer histograma de color) para la primera trama 102, y el dispositivo de alta potencia puede realizar el procesamiento específico de la aplicación en la primera trama 102 para determinar si la mano es visible en la primera trama 102. Después de procesar la primera trama 102, la cámara puede captar la segunda trama 104 en un segundo tiempo. El dispositivo de baja potencia puede generar las segundas estadísticas de imagen para la segunda trama 104. Si el dispositivo de alta potencia determinó que la mano no era visible en la primera trama 102, un dispositivo de procesamiento de estadísticas 108 dentro del sistema de procesamiento puede comparar las segundas estadísticas de imagen con las primeras estadísticas de imagen para determinar si se realiza un procesamiento específico de la aplicación en la segunda trama 104 (por ejemplo, para determinar si la mano es visible en la segunda trama 104). En otro modo de realización particular, realizar un procesamiento específico de la aplicación puede incluir determinar si se ha desencadenado un acontecimiento de alerta. Por ejemplo, el acontecimiento de alerta puede corresponder a un cambio de condición entre la primera trama 102 y la segunda trama 104.
[0026] Por ejemplo, el dispositivo de procesamiento de estadísticas 108 puede recibir las primeras estadísticas de imagen y las segundas estadísticas de imagen (por ejemplo, las Nésimas estadísticas de imagen). El dispositivo de procesamiento de estadísticas 108 puede determinar si una primera cantidad de cambio entre las segundas estadísticas de imagen y las primeras estadísticas de imagen satisface un umbral. Si la cantidad de cambio no satisface el umbral, el sistema de procesamiento solo puede realizar un procesamiento parcial de la segunda trama 104 (por ejemplo, para generar las segundas estadísticas de imagen de la segunda trama 104) y puede omitir o prescindir del procesamiento específico de la aplicación de la segunda trama 104. Si la cantidad de cambio satisface el umbral, el sistema de procesamiento puede realizar un procesamiento más completo en la segunda trama 104 generando las segundas estadísticas de imagen, así como realizar el procesamiento específico de la aplicación en la segunda trama 104.
[0027] Para las imágenes en escala de grises, la primera cantidad de cambio puede satisfacer el umbral cuando una diferencia entre un primer recuento de píxeles para un valor de intensidad particular en el primer histograma de intensidad y un segundo recuento de píxeles para el valor de intensidad particular en el segundo histograma de intensidad es mayor que un valor particular. El umbral puede ser un umbral seleccionado por el usuario. Como ejemplo no limitante, la primera representación de píxel 112 y la segunda representación de píxel 114 pueden incluir cada una veinte millones (20.000.000) de píxeles (por ejemplo, la primera y la segunda tramas 102, 104 son imágenes de 20 megapíxeles). La primera representación de píxel 112 puede incluir once millones (11.000.000) de píxeles blancos (por ejemplo, once millones de píxeles que tienen un valor de intensidad de cero) y la segunda representación de píxel 114 puede incluir diez millones y medio (10.500.000) de píxeles blancos (por ejemplo, una diferencia de quinientos mil píxeles). Si el umbral es de cien mil píxeles, entonces la primera cantidad de cambio (por ejemplo, la diferencia) satisface el umbral y el sistema de procesamiento puede realizar el procesamiento específico de la aplicación en la segunda trama 104 para determinar si una mano es visible en la segunda trama 104. Si el umbral es de un millón de píxeles, entonces la primera cantidad de cambio no logra satisfacer el umbral y el sistema de procesamiento puede omitir el procesamiento específico de la aplicación en la segunda trama 104 para conservar potencia.
[0028] Para tramas de imagen multiespectrales, la primera cantidad de cambio puede satisfacer el umbral cuando una diferencia entre un primer recuento de píxeles para un valor de color particular en el primer histograma de color y un segundo recuento de píxeles para el color particular en el segundo histograma de color es mayor que un valor particular. Como ejemplo no limitante, la primera representación de píxel 112 y la segunda representación de píxel
114 pueden incluir cada una veinte millones de píxeles. La primera representación de píxel 112 puede incluir cinco millones de píxeles rojos y la segunda representación de píxel 114 puede incluir ocho millones de píxeles rojos (por ejemplo, una diferencia de tres millones de píxeles). Si el umbral es de dos millones de píxeles, entonces la primera cantidad de cambio (por ejemplo, la diferencia) satisface el umbral y el sistema de procesamiento puede realizar un procesamiento específico de la aplicación en la segunda trama 104 para determinar si una mano es visible en la segunda trama 104. Si el umbral es de cuatro millones de píxeles, entonces la primera cantidad de cambio no logra satisfacer el umbral y el sistema de procesamiento puede omitir el procesamiento específico de la aplicación en la segunda trama 104 para conservar potencia. Se puede usar un intervalo particular de valores para el umbral en base a una aplicación de visión informática particular. Por ejemplo, una aplicación de visión informática asociada a la detección de manos (o detección facial) se puede centrar en los colores asociados a los tonos de piel.
[0029] Después de procesar la segunda trama 104, el sistema de procesamiento puede procesar la tercera trama 106. Por ejemplo, el dispositivo de baja potencia puede generar las terceras estadísticas de imagen (por ejemplo, el tercer histograma de intensidad y/o el tercer histograma de color) para la tercera trama 106. Si se omitió el procesamiento específico de la aplicación en la segunda trama 104, el dispositivo de procesamiento de estadísticas 108 puede determinar si una segunda cantidad de cambio entre las terceras estadísticas de imagen y las segundas estadísticas de imagen satisface el umbral. Si la segunda cantidad de cambio satisface el umbral, entonces el dispositivo de alta potencia puede realizar un procesamiento específico de la aplicación en la tercera trama 106 para determinar si una mano es visible en la tercera trama 106. Si la segunda cantidad de cambio no satisface el umbral, entonces el dispositivo de alta potencia puede omitir el procesamiento específico de la aplicación en la tercera trama 106 para conservar energía.
[0030] En un modo de realización particular, el dispositivo de procesamiento de estadísticas 108 puede determinar si una tercera cantidad de cambio entre las terceras estadísticas de imagen y las primeras estadísticas de imagen satisface el umbral. El procesamiento específico de la aplicación se puede realizar en la tercera trama 106 si la tercera cantidad de cambio satisface el umbral y el procesamiento específico de la aplicación en la tercera trama 106 se puede omitir si la tercera cantidad de cambio no logra satisfacer el umbral. Realizar un procesamiento específico de la aplicación en base a la tercera cantidad de cambio puede reducir la probabilidad de perder un acontecimiento de alerta (por ejemplo, una mano visible) debido a cambios nominales que se producen entre tramas (por ejemplo, pequeños cambios en las estadísticas de la imagen) que finalmente dan lugar a grandes cambios. Además, el procesamiento completo de un número indeterminado de tramas se puede excluir (por ejemplo, omitirse) en base a una determinación de que el umbral no se satisface. En un modo de realización particular, las estadísticas de imagen se pueden actualizar periódicamente y el procesamiento completo se puede realizar en cualquier Nésima trama, incluso si el umbral no se satisface por la Nésima trama.
[0031] Omitir el procesamiento específico de la aplicación en una trama particular que tiene estadísticas de imagen similares a una trama previa puede conservar la potencia en dispositivos electrónicos. Por ejemplo, el procesamiento específico de la aplicación puede utilizar dispositivos de alta potencia dentro de un sistema de procesamiento. Al usar dispositivos de baja potencia, tales como el dispositivo de procesamiento de estadísticas 108, para generar y/o evaluar estadísticas de cada trama, se puede determinar que las tramas particulares son sustancialmente idénticas y que el procesamiento específico de la aplicación solo necesita realizarse en una de las tramas idénticas. Como resultado, la potencia se puede conservar prescindiendo del procesamiento específico de la aplicación en tramas idénticas.
[0032] En referencia a la FIG. 2, se muestra un modo de realización ilustrativo particular de representaciones de píxeles parciales de tramas de imagen de una secuencia de vídeo. Por ejemplo, la primera trama 102 de la FIG. 1 se puede caracterizar por una primera representación de píxel parcial 212 y la segunda trama 104 de la FIG. 1 se puede caracterizar por una segunda representación de píxel parcial 214.
[0033] La primera representación de píxel parcial 212 puede incluir una primera fila 202 de píxeles, una primera columna 204 de píxeles, o ambas. La primera fila 202 de píxeles y la primera columna 204 de píxeles pueden ser píxeles seleccionados que se incluyen en la primera representación de píxel 112 de la FIG. 1. La segunda representación de píxel parcial 214 puede incluir una segunda fila 222 de píxeles, una segunda columna 224 de píxeles, o ambas. La segunda fila 222 de píxeles y la segunda columna 224 de píxeles pueden ser píxeles seleccionados que están incluidos en la segunda representación de píxel 114 de la FIG. 1. En un modo de realización particular, la primera fila 202 de píxeles puede corresponder a píxeles que representan un área en la primera trama 102, y la segunda fila 222 de píxeles puede corresponder a píxeles que representan la misma área en la segunda trama 104. Adicionalmente, la primera columna 204 de píxeles puede corresponder a píxeles que representan un área en la primera trama 102, y la segunda columna 224 de píxeles puede corresponder a píxeles que representan la misma área en la segunda trama 104.
[0034] El dispositivo de baja potencia puede generar primeras estadísticas de imagen de la primera trama 102 en base a la primera fila 202 de píxeles, la primera columna 204 de píxeles, o una combinación de las mismas. Por ejemplo, las primeras estadísticas de imagen pueden corresponder a una primera suma (por ejemplo, sumadefilas[]) de los valores de píxel para la primera fila 202 de píxeles. De forma alternativa, o además, las primeras estadísticas de imagen pueden corresponder a una primera suma (por ejemplo, sumadecolumnas[]) de valores de píxeles para la primera columna 204 de píxeles. El dispositivo de alta potencia puede realizar un procesamiento específico de la
aplicación en la primera trama 102 para determinar si la mano es visible en la primera trama 102. En un modo de realización particular, las primeras estadísticas de imagen pueden corresponder a la suma de valores de píxel en dos o más filas de píxeles, la suma de dos o más columnas de píxeles o una suma de una o más filas de píxeles y una o más columnas de píxeles.
[0035] Después de procesar la primera trama 102, el dispositivo de baja potencia puede generar segundas estadísticas de imagen de la segunda trama 104 en base a la segunda fila 222 de píxeles, la segunda columna 224 de píxeles, o una combinación de las mismas. Por ejemplo, las segundas estadísticas de imagen pueden corresponder a una segunda suma de valores de píxeles para la segunda fila 222. De forma alternativa, o además, las segundas estadísticas de imagen pueden corresponder a una segunda suma de valores de píxel para la segunda columna 224 de píxeles. En un modo de realización particular, las segundas estadísticas de imagen pueden corresponder a la suma de valores de píxel en dos o más filas de píxeles, la suma de dos o más columnas de píxeles, o una suma de una o más filas de píxeles y una o más columnas de píxeles.
[0036] Si el dispositivo de alta potencia determina que la mano no era visible en la primera trama 102, el dispositivo de procesamiento de estadísticas 108 puede comparar las segundas estadísticas de imagen con las primeras estadísticas de imagen para determinar si se realiza el procesamiento específico de la aplicación en la segunda trama 104 (por ejemplo, para determinar si la mano es visible en la segunda trama 104). Por ejemplo, el dispositivo de procesamiento de estadísticas 108 puede determinar si una primera cantidad de cambio entre las segundas estadísticas de imagen y las primeras estadísticas de imagen satisface un umbral. Si la cantidad de cambio no satisface el umbral, el sistema de procesamiento solo puede realizar un procesamiento parcial de la segunda trama 104 (por ejemplo, para generar las segundas estadísticas de imagen de la segunda trama 104) y puede omitir o prescindir del procesamiento específico de la aplicación de la segunda trama 104. Si la cantidad de cambio satisface el umbral, el sistema de procesamiento puede realizar un procesamiento más completo en la segunda trama 104 generando las segundas estadísticas de imagen, así como realizar el procesamiento específico de la aplicación en la segunda trama 104.
[0037] La primera cantidad de cambio puede satisfacer el umbral cuando una diferencia entre la primera suma de valores de píxel y la segunda suma de valores de píxel es mayor que un valor particular. Por ejemplo, en el modo de realización ilustrativo, cuando las primeras estadísticas de imagen corresponden a la suma de los valores de píxeles en la primera columna 204 de píxeles y las segundas estadísticas de imagen corresponden a la suma de los valores de píxel en la segunda columna 224 de píxeles, la primera cantidad de cambio no puede lograr satisfacer el umbral. Cada píxel en la primera columna 204 de píxeles es un píxel blanco (por ejemplo, un píxel que tiene un valor de intensidad de cero). Como resultado, la suma de los valores de intensidad para la primera columna 204 de píxeles puede ser igual a cero. De forma similar, cada píxel en la segunda columna 224 de píxeles es un píxel blanco. Como resultado, la suma de los valores de intensidad para la segunda columna 224 puede ser igual a cero. Por tanto, en base a una comparación de la primera suma de valores de píxel y la segunda suma de valores de píxel, la primera cantidad de cambio puede no satisfacer el umbral. Como resultado, se puede omitir el procesamiento específico de la aplicación en la segunda trama 104.
[0038] Sin embargo, cuando las primeras estadísticas de imagen corresponden a la suma de los valores de píxeles en la primera fila 202 de píxeles y las segundas estadísticas de imagen corresponden a la suma de los valores de píxel en la segunda fila 222 de píxeles, la primera cantidad de cambio puede satisfacer el umbral. Cada píxel en la primera fila 202 de píxeles es un píxel blanco. Como resultado, la suma de los valores de intensidad de la primera fila 202 de píxeles puede ser igual a cero. Sin embargo, una serie de píxeles en la segunda fila 222 de píxeles tienen un valor de intensidad mayor (por ejemplo, un valor de intensidad más cercano a 255 en base a regiones más oscuras). Como resultado, la suma de los valores de intensidad de la segunda fila 222 de píxeles puede ser mayor que cero. Suponiendo que la diferencia entre la primera suma de valores de píxel y la segunda suma de valores de píxel satisface el umbral, el dispositivo de alta potencia puede realizar un procesamiento específico de la aplicación en la segunda trama 104.
[0039] La potencia se puede conservar seleccionando filas y/o columnas particulares en una trama y generando estadísticas de imagen en tramas en base a las filas y/o columnas seleccionadas a diferencia de generar estadísticas de imagen para una trama completa. Por ejemplo, el dispositivo de baja potencia puede utilizar menos potencia para generar estadísticas de imagen para la primera fila 202 de píxeles que para generar estadísticas de imagen para cada píxel en la primera trama 102.
[0040] En referencia a la FIG. 3, se muestra un modo de realización ilustrativo particular de un sistema de procesamiento 300 que se puede hacer funcionar para reducir el uso de potencia asociado a aplicaciones de visión informática en base a estadísticas de imagen. El sistema de procesamiento 300 incluye una cámara 302, un primer dispositivo de procesamiento 304, una memoria 306, el dispositivo de procesamiento de estadísticas 108 y un segundo dispositivo de procesamiento 310. El segundo dispositivo de procesamiento 310 puede ser un dispositivo de mayor uso de potencia que el primer dispositivo de procesamiento 304. En un modo de realización particular, el primer dispositivo de procesamiento 304 puede ser un generador de estadísticas y el segundo dispositivo de procesamiento 310 puede ser un procesador de aplicaciones. En un modo de realización particular, las funciones del dispositivo de
procesamiento de estadísticas 108 y el primer dispositivo de procesamiento 304 se pueden incluir en un único dispositivo de procesamiento de baja potencia, tal como un procesador de señales digitales (DSP).
[0041] La cámara 302 puede captar una pluralidad de tramas de imagen (por ejemplo, una secuencia de vídeo). Por ejemplo, la cámara 302 puede captar la primera trama 102 de la FIG. 1 en el primer tiempo, la segunda trama 104 en el segundo tiempo y la tercera trama 106 en el tercer tiempo. Después de que se capta una trama particular 102-106, la trama particular se proporciona al primer dispositivo de procesamiento 304.
[0042] El primer dispositivo de procesamiento 304 se puede configurar para generar estadísticas de imagen para cada trama 102-106 en la secuencia de vídeo a medida que se captan las tramas 102-106. Por ejemplo, el primer dispositivo de procesamiento 304 puede generar estadísticas de imagen para cada trama 102-106 en base a las representaciones de píxeles correspondientes 112-116 de la FIG. 1 o las representaciones de píxeles parciales 212, 214 de la FIG. 2. Después de que se generan las estadísticas de imagen, las estadísticas de imagen se proporcionan a la memoria 306 y al dispositivo de procesamiento de estadísticas 108. Las estadísticas de imagen también se pueden usar para identificar las características de cada trama 102-106, un tiempo de captación para cada trama 102-106, etc.
[0043] El dispositivo de procesamiento de estadísticas 108 se puede configurar para recibir estadísticas de imagen para una trama actual 102-106 (por ejemplo, una trama más reciente) desde el primer dispositivo de procesamiento 304. En un modo de realización particular, el dispositivo de procesamiento de estadísticas 108 es otro dispositivo de baja potencia. Por ejemplo, el dispositivo de procesamiento de estadísticas 108 puede consumir menos potencia que el segundo dispositivo de procesamiento 310. El dispositivo de procesamiento de estadísticas 108 se puede configurar para hacer que la trama actual 102-106 se proporcione al segundo dispositivo de procesamiento 310 para el procesamiento específico de la aplicación. Por ejemplo, el dispositivo de procesamiento de estadísticas 108 puede proporcionar la trama actual 102-106 al segundo dispositivo de procesamiento 310 en respuesta a una determinación de que no hay tramas previas.
[0044] Si se ha procesado una trama previa, el dispositivo de procesamiento de estadísticas 108 puede determinar si una cantidad de cambio entre las estadísticas de imagen de la trama actual y las estadísticas de imagen de la trama previa satisfacen un umbral. Por ejemplo, el dispositivo de procesamiento de estadísticas 108 puede recuperar las estadísticas de imagen para la trama previa de la memoria 306. Si la cantidad de cambio satisface el umbral, el dispositivo de procesamiento de estadísticas 108 puede proporcionar la trama actual al segundo dispositivo de procesamiento 310 para el procesamiento específico de la aplicación. De otro modo, el dispositivo de procesamiento de estadísticas 108 puede determinar conservar potencia y omitir el procesamiento específico de la aplicación en la trama actual.
[0045] El segundo dispositivo de procesamiento 310 se puede hacer funcionar para realizar aplicaciones y operaciones de visión informática en la trama actual. Por ejemplo, el segundo dispositivo de procesamiento 310 se puede configurar para realizar aplicaciones de seguridad (por ejemplo, vigilancia, detección de intrusos, detección de objetos, reconocimiento facial, etc.), aplicaciones de uso ambiental (por ejemplo, control de iluminación), aplicaciones de detección y seguimiento de objetos, etc. El segundo dispositivo de procesamiento 310 puede incluir una unidad de color 312, una unidad de iluminación 314, una unidad de extracción de rasgos característicos 316, una unidad de segmentación 318, una unidad de detección de postura 320, una unidad de seguimiento y predicción 322, una unidad de clasificación 324 o una combinación de las mismas. La unidad de color 312 puede potenciar el color, la exposición y el enfoque de la trama actual. La unidad de iluminación 314 puede potenciar la iluminación ambiental de la trama. La unidad de extracción de rasgos característicos 316 puede extraer rasgos característicos particulares de la trama actual. La unidad de segmentación 318 puede dividir la trama actual en múltiples segmentos (por ejemplo, múltiples conjuntos de píxeles). La unidad de detección de postura 320 puede detectar posturas de rasgos característicos particulares ubicadas en la trama actual. La unidad de seguimiento y predicción 322 puede determinar una posición relativa de los rasgos característicos en la trama actual y predecir dónde pueden estar los rasgos característicos en una trama siguiente. La unidad de clasificación 324 puede clasificar la trama actual y/o detectar un acontecimiento de alerta. El segundo dispositivo de procesamiento 310 puede incluir cualquier combinación de unidades de procesamiento para procesar aplicaciones de visión informática. Por ejemplo, el dispositivo de alta potencia puede incluir unidades adicionales o menos unidades.
[0046] Durante el funcionamiento, la cámara 302 puede captar la primera trama 102 en el primer tiempo, y el primer dispositivo de procesamiento 304 puede generar las primeras estadísticas de imagen para la primera trama 102. El primer dispositivo de procesamiento 304 puede proporcionar las primeras estadísticas de imagen a la memoria 306. Adicionalmente, el primer dispositivo de procesamiento 304 puede proporcionar la primera trama 102 y las primeras estadísticas de imagen al dispositivo de procesamiento de estadísticas 108. El dispositivo de procesamiento de estadísticas 108 puede sondear la memoria 306 para determinar si las estadísticas de imagen para otras tramas previas están almacenadas en la memoria 306 para su comparación. En respuesta a la determinación de que no están almacenadas estadísticas de imagen para tramas previas en la memoria 306 para su comparación, el dispositivo de procesamiento de estadísticas 108 puede hacer que la primera trama 102 se proporcione al segundo dispositivo de procesamiento 310, y el segundo dispositivo de procesamiento 310 puede realizar un procesamiento específico de la aplicación en la primera trama 102 para determinar si una mano es visible en la primera trama 102.
[0047] Después de captar la primera trama 102, la cámara 302 puede captar la segunda trama 104 en el segundo tiempo, y el primer dispositivo de procesamiento 304 puede generar las segundas estadísticas de imagen para la segunda trama 104. El primer dispositivo de procesamiento 304 puede proporcionar las segundas estadísticas de imagen a la memoria 306. Adicionalmente, el primer dispositivo de procesamiento 304 puede proporcionar la segunda trama 104 y las segundas estadísticas de imagen al dispositivo de procesamiento de estadísticas 108.
[0048] El dispositivo de procesamiento de estadísticas 108 puede sondear la memoria 306 y recuperar las primeras estadísticas de imagen. Después de recuperar las primeras estadísticas de imagen, el dispositivo de procesamiento de estadísticas 108 puede comparar las segundas estadísticas de imagen con las primeras estadísticas de imagen para determinar si se proporciona la segunda trama 104 al segundo dispositivo de procesamiento 310 para el procesamiento específico de la aplicación en la segunda trama 104. En el modo de realización ilustrativo, el procesamiento específico de la aplicación se puede usar para determinar si la mano es visible en la segunda trama 104. Por ejemplo, el dispositivo de procesamiento de estadísticas 108 puede determinar si una primera cantidad de cambio entre las segundas estadísticas de imagen y las primeras estadísticas de imagen satisface un umbral. Si la cantidad de cambio no satisface el umbral, el dispositivo de procesamiento de estadísticas 108 puede determinar conservar potencia y omitir el procesamiento específico de la aplicación de la segunda trama 104. Si la cantidad de cambio satisface el umbral, el dispositivo de procesamiento de estadísticas 108 puede proporcionar la segunda trama 104 al segundo dispositivo de procesamiento 310 para el procesamiento específico de la aplicación en la segunda trama 104.
[0049] Después de captar la segunda trama 104, la cámara 302 puede captar la tercera trama 106 en el tercer tiempo, y el primer dispositivo de procesamiento 304 puede generar las terceras estadísticas de imagen para la tercera trama 106. El primer dispositivo de procesamiento 304 puede proporcionar las terceras estadísticas de imagen a la memoria 306. Adicionalmente, el primer dispositivo de procesamiento 304 puede proporcionar la tercera trama 106 y las terceras estadísticas de imagen al dispositivo de procesamiento de estadísticas 108.
[0050] El dispositivo de procesamiento de estadísticas 108 puede sondear la memoria 306 y recuperar las primeras estadísticas de imagen, las segundas estadísticas de imagen, o una combinación de las mismas. Si el dispositivo de procesamiento de estadísticas 108 determinó omitir el procesamiento específico de la aplicación en la segunda trama 104, el dispositivo de procesamiento de estadísticas 108 puede comparar las terceras estadísticas de imagen con las segundas estadísticas de imagen para determinar si se realiza el procesamiento específico de la aplicación en la tercera trama 106. De forma alternativa, el dispositivo de procesamiento de estadísticas 108 puede comparar las terceras estadísticas de imagen con las primeras estadísticas de imagen o una combinación de las estadísticas de la primera y segunda imagen.
[0051] Omitir el procesamiento específico de la aplicación en una trama particular que tiene estadísticas de imagen similares a una trama previa puede conservar la potencia en dispositivos electrónicos. Por ejemplo, el procesamiento específico de la aplicación puede utilizar dispositivos de alta potencia (por ejemplo, un procesador de propósito general o un procesador de gráficos) dentro de un sistema de procesamiento, tales como dispositivos de aplicación de visión informática. Al usar dispositivos de baja potencia (por ejemplo, un procesador de señales digitales, un circuito integrado específico de la aplicación, una matriz de puertas programables in situ, etc.), tal como el dispositivo de procesamiento de estadísticas 108, para generar y/o evaluar las estadísticas de cada trama, se puede determinar que las tramas particulares son sustancialmente idénticas y que el procesamiento específico de la aplicación solo se necesita realizar en una de las tramas idénticas. Como resultado, la potencia se puede conservar prescindiendo del procesamiento específico de la aplicación en tramas idénticas o similares.
[0052] En referencia a la FIG. 4, se muestra un modo de realización ilustrativo particular de un sistema de procesamiento 400 que se puede hacer funcionar para reducir el uso de potencia asociado a aplicaciones de visión informática. El sistema de procesamiento 400 incluye un sensor 402, un circuito de detección de cambio 414, un procesador de aplicaciones 418 y una memoria 420. En un modo de realización particular, el circuito de detección de cambio 414 se puede incluir en una primera ruta de procesamiento 408 (por ejemplo, una ruta de procesamiento de baja potencia y/o ruta de procesamiento de baja velocidad de datos). El procesador de aplicaciones 418 y la memoria 420 se pueden incluir en una segunda ruta de procesamiento 410 (por ejemplo, una ruta de procesamiento de alta potencia y/o ruta de procesamiento de alta velocidad de datos).
[0053] El sensor 402 se puede configurar para captar datos del sensor 430 (por ejemplo, una pluralidad de tramas de imagen o una secuencia de vídeo). En un modo de realización particular, el sensor 402 puede corresponder a la cámara 302 de la FIG. 3. En otro modo de realización particular, el sensor 402 puede ser un sensor de luz ambiental, tal como un sensor de luz ambiental 840 como se describe con respecto a la FIG. 8 u otro tipo de sensor. Los datos del sensor 430 pueden incluir primeros datos del sensor (por ejemplo, la primera trama 102 de la FIG. 1), segundos datos del sensor (por ejemplo, la segunda trama 104 de la FIG. 1), terceros datos del sensor (por ejemplo, la tercera trama 106 de la FIG. 1), etc. Los datos del sensor 430 se pueden proporcionar al circuito de detección de cambio 414 de la primera ruta de procesamiento 408.
[0054] El circuito de detección de cambio 414 puede comparar la primera trama 102 de los datos del sensor 430 con la segunda trama 104 (u otra trama) de los datos del sensor 430 para detectar una cantidad de cambio entre las tramas
102, 104. Para sencillez de ilustración, el circuito de detección de cambio 414 se describirá comparando la primera trama 102 con la segunda trama 104. Sin embargo, debido a que se pueden producir cambios relativamente menores entre la primera trama 102 y la segunda trama 104, se apreciará que el circuito de detección de cambio 414 puede comparar la primera trama 102 con tramas más alejadas entre sí para detectar cambios entre las tramas.
[0055] El circuito de detección de cambio 414 puede incluir una memoria "integrada" para almacenar la primera trama 102. Cuando la segunda trama 104 (u otra trama) de los datos del sensor 430 se recibe desde el sensor 402, el circuito de detección de cambio 414 puede recuperar la primera trama 102 de la memoria integrada, comparar los tramas 102, 104 y generar un señal de control 416 en base a la comparación. Por ejemplo, el circuito de detección de cambio 414 puede determinar si se acciona el procesador de aplicaciones 418 en base a la comparación (por ejemplo, en base a similitudes entre la primera trama 102 y la segunda trama 104). En un modo de realización particular, el circuito de detección de cambio 414 puede comparar las primeras estadísticas de imagen de la primera trama 102 con las segundas estadísticas de imagen de la segunda trama 104 como se describe con respecto a las FIG. 1-3. Por ejemplo, el circuito de detección de cambio 414 puede corresponder al dispositivo de procesamiento de estadísticas 108 de las FIG. 1-3, y la memoria integrada puede corresponder a la memoria 306 de la FIG. 3.
[0056] La señal de control 416 se puede proporcionar al procesador de aplicaciones 418. La señal de control 416 puede indicar si se "acciona" el procesador de aplicaciones 418 para realizar un procesamiento específico de la aplicación (por ejemplo, un procesamiento específico de la aplicación de visión informática) en la segunda trama 104. Por ejemplo, si el circuito de detección de cambio 414 determina que la cantidad de cambio entre la primera trama 102 y la segunda trama 104 no satisface un umbral, la señal de control 416 puede mantener el procesador de aplicaciones 418 en un estado de "suspensión" para conservar potencia. Si el circuito de detección de cambio 414 determina que la cantidad de cambio entre la primera trama 102 y la segunda trama 104 satisface el umbral, la señal de control 416 puede accionar el procesador de aplicaciones 418 para realizar el procesamiento específico de la aplicación en la segunda trama 104. Por tanto, el circuito de detección de cambio 414 también puede proporcionar datos del sensor 430 (por ejemplo, la segunda trama 104) al procesador de aplicaciones 418 para el procesamiento específico de la aplicación de visión informática.
[0057] El procesador de aplicaciones 418 se puede configurar para realizar un procesamiento específico de la aplicación de visión informática en la segunda trama 104. Como un ejemplo no limitante, el procesador de aplicaciones 418 puede determinar si un objeto particular (por ejemplo, una mano) está en la segunda trama 104. Por tanto, el procesador de aplicaciones 418 puede realizar el procesamiento específico de la aplicación de visión informática de detección de objetos/reconocimiento de objetos. Otros ejemplos de procesamiento específico de la aplicación de visión informática pueden incluir aplicaciones de seguridad (por ejemplo, vigilancia, detección de intrusos, detección de objetos, reconocimiento facial, etc.), aplicaciones de uso ambiental (por ejemplo, control de iluminación), aplicaciones de detección y seguimiento de objetos, etc. Como se usa en el presente documento, "aplicación de visión informática" y/o "procesamiento específico de la aplicación de visión informática" puede corresponder a, o incluir, un número ilimitado de aplicaciones en base a datos de vídeo/imagen. Los ejemplos usados en el presente documento no pretenden ser limitantes.
[0058] En un modo de realización particular, el procesador de aplicaciones 418 puede realizar el procesamiento específico de la aplicación de visión informática como se describe con respecto a las FIG. 13-27. Por ejemplo, el procesador de aplicaciones 418 puede extraer un primer subconjunto de rasgos característicos de la segunda trama 104, extraer un segundo subconjunto de rasgos característicos de la segunda trama 104 en base al primer subconjunto de rasgos característicos que satisfacen un criterio de análisis, y generar datos de contexto que indican un contexto de la segunda trama 104 en base al menos en parte al segundo subconjunto de rasgos característicos.
[0059] El procesador de aplicaciones 418 también puede proporcionar los datos del sensor 430 (por ejemplo, las tramas que se someten al procesamiento específico de la aplicación de visión informática) a la memoria 420. Por tanto, el procesador de aplicaciones 418 (y los procesadores/recursos de procesamiento adicionales) pueden acceder a los datos del sensor 430 desde la memoria 420 durante el procesamiento específico de la aplicación de visión informática. En un modo de realización particular, la memoria 420 puede ser una memoria de doble velocidad de datos (DDR). Por ejemplo, la memoria 420 puede ser una memoria de acceso aleatorio dinámica síncrona DDR (DDR SDRAM).
[0060] El sistema de procesamiento 400 de la FIG.4 puede reducir el consumo de potencia omitiendo el procesamiento específico de la aplicación de visión informática en una trama particular que es similar a una trama previa. Por ejemplo, el circuito de detección de cambio 414 puede indicar (por medio de la señal de control 416) si se activa (por ejemplo, acciona) el procesador de aplicaciones 418 en base a una comparación entre una trama actual y una trama previa. Si el circuito de detección de cambio 414 determina que las diferencias entre la trama actual y la trama previa no satisfacen un umbral (por ejemplo, un umbral de cambio), el circuito de detección de cambio 414 puede determinar desactivar el procesador de aplicaciones 418 (por ejemplo, mantener el procesador de aplicaciones 418 en el estado de suspensión) para conservar potencia.
[0061] En referencia a la FIG. 5, se muestra un sistema de procesamiento 500 que se puede hacer funcionar para reducir el uso de potencia asociado a las aplicaciones de visión informática. El sistema de procesamiento 500 incluye
un sensor 502, un circuito de selección 506, una primera ruta de procesamiento 508 y una segunda ruta de procesamiento 510.
[0062] La primera ruta de procesamiento 508 puede incluir un analizador de señal 512 y un circuito de detección de cambio 514. La segunda ruta de procesamiento 510 puede incluir un procesador de aplicaciones 518 y una memoria 520. En un modo de realización particular, la primera ruta de procesamiento 508 puede ser una ruta de procesamiento de baja potencia y/o una ruta de procesamiento de baja velocidad de datos, y la segunda ruta de procesamiento 510 puede ser una ruta de procesamiento de alta potencia y/o una ruta de procesamiento de alta velocidad de datos. Por ejemplo, los componentes de la primera ruta de procesamiento 508 pueden consumir menos potencia que los componentes de la segunda ruta de procesamiento 510.
[0063] El sensor 502 se puede configurar para captar datos del sensor (por ejemplo, una pluralidad de tramas de imagen o una secuencia de vídeo). En un modo de realización particular, el sensor 502 puede corresponder a la cámara 302 de la FIG. 3 o el sensor 402 de la FIG. 4. Los datos del sensor pueden incluir primeros datos del sensor (por ejemplo, la primera trama 102 de la FIG. 1), segundos datos del sensor (por ejemplo, la segunda trama 104 de la FIG. 1), terceros datos del sensor (por ejemplo, la tercera trama 106 de la FIG. 1), etc. Los datos del sensor se pueden proporcionar al circuito de selección 506.
[0064] El circuito de selección 506 se configura para proporcionar tramas entrantes (por ejemplo, datos del sensor) para la primera ruta de procesamiento 508 y/o proporcionar las tramas entrantes a la segunda ruta de procesamiento 510 en base a una señal de control 516 (por ejemplo, una señal de realimentación). En un modo de realización particular, el circuito de selección 506 se puede implementar como un multiplexor sensible a la señal de control 516. El circuito de selección 506 puede proporcionar inicialmente datos del sensor 530 (por ejemplo, proporcionar tramas entrantes por medio de un canal de baja velocidad de datos) al analizador de señal 512 para su procesamiento. Para ilustrar, el circuito de selección 506 puede proporcionar la primera trama 102 al analizador de señal 512, y el circuito de selección 506 puede proporcionar la segunda trama 104 al analizador de señal 512.
[0065] Tras recibir la primera trama 102, el analizador de señal 512 puede analizar la primera trama 102 y proporcionar los primeros resultados de análisis 542 del análisis al circuito de detección de cambio 514. En un modo de realización particular, el analizador de señal 512 puede corresponder al primer dispositivo de procesamiento 304 de la FIG. 3 y funcionar de manera sustancialmente similar. El circuito de detección de cambio 514 puede incluir una memoria "integrada" para almacenar los primeros resultados de análisis 542. En un modo de realización particular, el circuito de detección de cambio 514 puede funcionar de manera sustancialmente similar al circuito de detección de cambio 414 de la FIG. 4. Tras recibir la segunda trama 104, el analizador de señal 512 puede analizar la segunda trama 104 y proporcionar los segundos resultados de análisis 542 del análisis al circuito de detección de cambio 514.
[0066] En un modo de realización particular, el procesador de aplicaciones 518 puede generar y proporcionar datos de configuración de análisis 534 al analizador de señal 512 y/o al circuito de detección de cambio 514. Los datos de configuración de análisis 534 pueden indicar un tipo particular de rasgos característicos que se van a analizar (por ejemplo, un tipo particular de estadísticas de imagen que se van a generar) por el analizador de señal 512 y/o el circuito de detección de cambio 514. El tipo particular de rasgos característicos que se va a analizar se puede basar en una aplicación de visión informática particular que se va a realizar por el procesador de aplicaciones 518. Como un ejemplo no limitante, si el procesador de aplicaciones 518 va a realizar una aplicación de visión informática de detección/reconocimiento de objetos para detectar una "mano" en una trama de imagen, el procesador de aplicaciones 518 puede proporcionar datos de configuración de análisis 534 de modo que el analizador de señal 512 genere datos de imagen para píxeles que tienen colores de "tono de piel".
[0067] El circuito de detección de cambio 51 se configura para determinar una cantidad de cambio entre la primera trama 102 y la segunda trama 104 (por ejemplo, una cantidad de cambio entre los primeros resultados de análisis 542 (o primeros datos del sensor) y los segundos resultados de análisis 542 (o segundos datos del sensor)). Cuando la cantidad de cambio no logra satisfacer un umbral (por ejemplo, un umbral de cambio), el circuito de detección de cambio 514 genera una señal de control 516 que tiene un primer valor. Cuando la cantidad de cambio satisface el umbral, el circuito de detección de cambio 514 genera una señal de control 516 que tiene un segundo valor. Como un ejemplo no limitante, la cantidad de cambio puede satisfacer el umbral cuando una diferencia entre un primer recuento de píxeles para un valor de color particular (por ejemplo, marrón) en un primer histograma de color (generado por el analizador de señal 512) y un segundo recuento de píxeles para el valor de color particular en un segundo histograma de color (generado por el analizador de señal 512) es mayor que un valor umbral.
[0068] Si la señal de control 516 tiene el primer valor (por ejemplo, que indica que la cantidad de cambio no logró satisfacer el umbral), el circuito de selección 506 puede proporcionar tramas adicionales (por ejemplo, datos del sensor 530) a la primera ruta de procesamiento 508 de modo que el analizador de señal 512 puede generar datos para las tramas adicionales y el circuito de detección de cambio 514 puede determinar si una cantidad de cambio asociado a las tramas adicionales satisface el umbral. Si la señal de control 516 tiene el segundo valor (por ejemplo, que indica que la cantidad de cambio satisface el umbral), el circuito de selección 506 proporciona datos del sensor 532 (por ejemplo, la segunda trama 104 y/o tramas posteriores 106) a la segunda ruta de procesamiento 510 para el procesamiento específico de la aplicación (por ejemplo, el procesamiento específico de la aplicación de visión
informática). Por ejemplo, el circuito de selección 506 puede proporcionar los datos del sensor 532 al procesador de aplicaciones 518 por medio de un canal de alta velocidad de datos.
[0069] El procesador de aplicaciones 518 se configura para realizar un procesamiento específico de la aplicación de visión informática en la segunda trama 104. Como un ejemplo no limitante, el procesador de aplicaciones 518 puede determinar si un objeto particular (por ejemplo, la mano) está en la segunda trama 104.
[0070] En un modo de realización particular, el procesador de aplicaciones 518 puede realizar el procesamiento específico de la aplicación de visión informática como se describe con respecto a las FIG. 13-27. Por ejemplo, el procesador de aplicaciones 518 puede extraer un primer subconjunto de rasgos característicos de la segunda trama 104, extraer un segundo subconjunto de rasgos característicos de la segunda trama 104 en base al primer subconjunto de rasgos característicos que satisfacen un criterio de análisis, y generar datos de contexto que indican un contexto de la segunda trama 104 en base al menos en parte al segundo subconjunto de rasgos característicos. En un modo de realización particular, los componentes de la primera ruta de procesamiento 508 (por ejemplo, el analizador de señal 512 y/o el circuito de detección de cambio 514) pueden proporcionar datos de retroalimentación de análisis 536 al procesador de aplicaciones 518. Los datos de retroalimentación de análisis 536 pueden incluir los resultados de análisis 542 de los datos del sensor 530, una indicación de un nivel de precisión de los resultados de análisis, el primer y segundo subconjunto de rasgos característicos, etc. Por ejemplo, el circuito de detección de cambio 514 puede extraer el primer y segundo subconjunto de rasgos característicos de la segunda trama 104 y proporcionar los rasgos característicos extraídos al procesador de aplicaciones 518 (por medio de los datos de retroalimentación de análisis 536) de modo que el procesador de aplicaciones 518 pueda generar los datos de contexto.
[0071] El procesador de aplicaciones 518 también puede proporcionar los datos del sensor 532 (por ejemplo, las tramas que se someten al procesamiento específico de la aplicación de visión informática) a la memoria 520. Por tanto, el procesador de aplicaciones 518 (y los procesadores/recursos de procesamiento adicionales) pueden acceder a los datos del sensor 532 desde la memoria 520 durante el procesamiento específico de la aplicación de visión informática. En un modo de realización particular, la memoria 520 puede ser una memoria DDR (por ejemplo, una DDR SDRAM).
[0072] El sistema de procesamiento 500 de la FIG. 5 puede reducir el consumo de potencia omitiendo el procesamiento específico de la aplicación de visión informática en una trama particular que es similar a una trama previa. Por ejemplo, el circuito de detección de cambio 514 puede indicar, por medio de la señal de control 516, si se activa (por ejemplo, acciona) el procesador de aplicaciones 518 en base a una comparación entre las estadísticas de imagen de una trama actual y las estadísticas de imagen de una trama previa. Si el circuito de detección de cambio 514 determina que las diferencias entre la trama actual y la trama previa no satisfacen un umbral (por ejemplo, un umbral de cambio), el circuito de detección de cambio 514 puede determinar desactivar el procesador de aplicaciones 518 (por ejemplo, mantener el procesador de aplicaciones 518 en el estado de suspensión) para conservar potencia.
[0073] Debido a que el procesador de aplicaciones 518 puede indicar (a los componentes de la primera ruta de procesamiento 508) el tipo de estadísticas que son "pertinentes" para la aplicación de visión informática por medio de los datos de configuración de análisis 534, se puede reducir un número de falsos positivos generados por el circuito de detección de cambio 514. Por ejemplo, el analizador de señal 512 y el circuito de detección de cambio 514 pueden determinar si se acciona el procesador de aplicaciones 518 en base a estadísticas de imagen adaptadas a una aplicación de visión informática particular a diferencia de hacer la determinación en base a "cualquier" cambio entre tramas. La reducción del número de falsos positivos (por ejemplo, reducir el número de veces que se activa la segunda ruta de procesamiento 510 en base a estadísticas de imagen que son irrelevantes para la aplicación de visión informática) también puede conservar potencia.
[0074] En referencia a la FIG. 6, se muestra otro modo de realización ilustrativo particular de un sistema de procesamiento 600 que se puede hacer funcionar para reducir el uso de potencia asociado a aplicaciones de visión informática. El sistema de procesamiento 600 incluye un sensor 602, un circuito de preprocesamiento 604, el circuito de selección 506, una primera ruta de procesamiento 608 y una segunda ruta de procesamiento 610.
[0075] La primera ruta de procesamiento 608 puede incluir el analizador de señal 512 y el circuito de detección de cambio 514. La segunda ruta de procesamiento 610 puede incluir el procesador de aplicaciones 518, la memoria 520 y uno o más procesadores adicionales 622. En un modo de realización particular, la primera ruta de procesamiento 608 puede ser una ruta de procesamiento de baja potencia, y la segunda ruta de procesamiento 610 puede ser una ruta de procesamiento de alta potencia. Por ejemplo, los componentes de la primera ruta de procesamiento 608 pueden consumir menos potencia que los componentes de la segunda ruta de procesamiento 610.
[0076] El sensor 602 se puede configurar para captar una pluralidad de tramas de imagen (por ejemplo, una secuencia de vídeo). En un modo de realización particular, el sensor 602 puede corresponder a la cámara 302 de la FIG. 3. La secuencia de vídeo captado por el sensor 602 se puede proporcionar al circuito de preprocesamiento 604. El circuito de preprocesamiento 604 se puede configurar para muestrear la secuencia de vídeo para generar un conjunto de tramas (por ejemplo, la primera trama 102 de la FIG. 1, la segunda trama 104 y la tercera trama 106) a partir de la secuencia de vídeo. Por ejemplo, el circuito de preprocesamiento 604 puede muestrear la secuencia de vídeo a una frecuencia de muestreo tal que la primera trama 102 se genera en el primer tiempo, la segunda trama 104 se genera
en el segundo tiempo y la tercera trama 106 se genera en el tercer tiempo. Cada trama 102-106 se puede proporcionar al circuito de selección 506.
[0077] El circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514 y el procesador de aplicaciones 518 pueden funcionar de manera similar a la descrita con respecto a la FIG. 5. El uno o más procesadores adicionales 622 pueden acceder a los datos del sensor 532 desde la memoria 520 para realizar un procesamiento adicional (por ejemplo, un procesamiento específico de la aplicación de visión informática adicional) en los datos del sensor 532, como se describe con respecto a la FIG. 7. En un modo de realización particular, al menos uno del uno o más procesadores adicionales 422 puede corresponder a, o incluir, un segundo procesador de aplicaciones o un procesador de señales digitales (DSP).
[0078] En referencia a la FIG. 7, se muestra un modo de realización ilustrativo particular de la segunda ruta de procesamiento 610. La segunda ruta de procesamiento 610 incluye un bus de datos 702, el procesador de aplicaciones 518, el uno o más procesadores adicionales 622 y un bus de control 710. El uno o más procesadores adicionales 622 pueden incluir un segundo procesador de aplicaciones 706 y un Mésimo procesador de aplicaciones 708. En un modo de realización particular, M puede ser cualquier valor entero que sea mayor que o igual a uno. Por ejemplo, si M es igual a cinco, entonces la segunda ruta de procesamiento 610 puede incluir cinco procesadores de aplicaciones.
[0079] Cada procesador de aplicaciones 518, 706, 708 puede corresponder a un núcleo de procesamiento, un subsistema de procesador de aplicaciones, un recurso de procesamiento, etc. Cada procesador de aplicaciones 518, 706, 708 puede consumir una cantidad diferente de potencia. Por ejemplo, el procesador de aplicaciones 518 puede consumir una primera cantidad de potencia, el segundo procesador de aplicaciones 706 puede consumir una segunda cantidad de potencia, y el Mésimo procesador de aplicaciones 708 puede consumir una Mésima cantidad de potencia. La primera cantidad de potencia puede ser menor que la segunda cantidad de potencia, y la segunda cantidad de potencia puede ser menor que la Mésima cantidad de potencia.
[0080] El circuito de selección 506 puede proporcionar los datos del sensor 532 (por ejemplo, la segunda trama 104) a la memoria 520 por medio del bus de datos 702. Cada procesador de aplicaciones 518, 706, 708 es posible que acceda a los datos del sensor 532 desde la memoria 520 por medio del bus de datos 702. Por ejemplo, cada procesador de aplicaciones 518, 706, 708 se puede acoplar al bus de datos 702 para recibir la segunda trama 104 (o versiones procesadas de la segunda trama 104) desde la memoria 520.
[0081] El procesador de aplicaciones 518 se puede configurar para realizar el primera procesamiento específico de la aplicación de visión informática en los datos del sensor 532. Como un ejemplo no limitante, el procesador de aplicaciones 518 se puede configurar para hacer un barrido de píxeles de la segunda trama 104 en busca de un color particular (por ejemplo, un color asociado a un tono de piel humano para detección/reconocimiento de manos). Mientras que el procesador de aplicaciones 518 está realizando el primer procesamiento específico de la aplicación de visión informática en la segunda trama 104, el segundo procesador de aplicaciones 706 y el Mésimo procesador de aplicaciones 708 pueden estar en un estado de "suspensión" para conservar potencia.
[0082] Si el procesador de aplicaciones 518 detecta un acontecimiento particular, el procesador de aplicaciones 518 puede solicitar que el segundo procesador de aplicaciones 706 realice un segundo procesamiento específico de la aplicación de visión informática en la segunda trama 104 (por ejemplo, solicita que el segundo procesador de aplicaciones 706 "se accione" desde el estado de suspensión). Como un ejemplo no limitante, si el procesador de aplicaciones 518 detecta determina que un píxel particular de la segunda trama 104 tiene el color particular, el procesador de aplicaciones 518 puede solicitar que el segundo procesador de aplicaciones 706 realice el segundo procesamiento específico de la aplicación de visión informática (por ejemplo, un procesamiento de detección de objetos, un procesamiento de reconocimiento de objetos o cualquier combinación de los mismos) en la segunda trama 104. El procesador de aplicaciones 518 se puede comunicar con el segundo procesador de aplicaciones 706 por medio del bus de control 710. Por ejemplo, el procesador de aplicaciones 518 puede enviar una instrucción al segundo procesador de aplicaciones 706 por medio del bus de control 710 para alertar al segundo procesador de aplicaciones 706 del acontecimiento particular.
[0083] El segundo procesador de aplicaciones 706 puede determinar si se realiza el segundo procesamiento específico de la aplicación de visión informática en los datos del sensor 532 (por ejemplo, la segunda trama 104). La determinación se puede basar en las capacidades de procesamiento del segundo procesador de aplicaciones 706, la pertinencia del acontecimiento particular, etc. Si el segundo procesador de aplicaciones 706 determina que se realice el segundo procesamiento específico de la aplicación de visión informática en la segunda trama 104, el segundo el procesador de aplicaciones 706 también puede determinar si se interrumpe el procesamiento específico de la aplicación de visión informática en la segunda trama 104 en el procesador de aplicaciones 518.
[0084] Por ejemplo, el segundo procesador de aplicaciones 706 es posible que realice el primer y segundo procesamiento específico de la aplicación de visión informática en la segunda trama 104. El procesamiento específico de la aplicación de visión informática en la segunda trama 104 se puede interrumpir en el procesador de aplicaciones 518 en base a la determinación en el segundo procesador de aplicaciones 706. En este modo de realización, el segundo procesador de aplicaciones 706 puede enviar una instrucción al procesador de aplicaciones 518 (por medio
del bus de control 710) para entrar en un estado de suspensión, y el segundo procesador de aplicaciones 706 puede realizar el primer procesamiento específico de la aplicación de visión informática en la segunda trama 104. Por ejemplo, si el segundo procesador de aplicaciones 706 puede realizar el primer procesamiento específico de la aplicación de visión informática en la segunda trama 104, el procesador de aplicaciones 518 se puede desactivar para conservar potencia.
[0085] Si el segundo procesador de aplicaciones 706 determina prescindir del segundo procesamiento específico de la aplicación de visión informática en la segunda trama 104, el segundo procesador de aplicaciones 706 puede enviar una indicación de una negativa a realizar el segundo procesamiento específico de la aplicación de visión informática. Por ejemplo, el segundo procesador de aplicaciones 706 puede enviar la indicación por medio del bus de control 710 al procesador de aplicaciones 518. En un modo de realización particular, el segundo procesador de aplicaciones 706 puede enviar una instrucción para hacer que el procesador de aplicaciones 518 se abstenga de solicitar al segundo procesador de aplicaciones 706 que realice el segundo procesamiento específico de la aplicación de visión informática en base al acontecimiento particular. Adicionalmente, el segundo procesador de aplicaciones 706 puede "programar" el procesador de aplicaciones 518 para solucionar el acontecimiento particular de modo que el procesador de aplicaciones 518 no accione el segundo procesador de aplicaciones 706 tras la producción del acontecimiento particular. Por tanto, el segundo procesador de aplicaciones 706 puede controlar el estado (por ejemplo, estado de suspensión o estado de activación) del procesador de aplicaciones 518, y el segundo procesador de aplicaciones 706 también puede programar el procesador de aplicaciones 518 para que funcione de una manera más eficaz.
[0086] El Mésimo procesador de aplicaciones 708 puede funcionar de manera sustancialmente similar con respecto al segundo procesador de aplicaciones 706 y el procesador de aplicaciones 518 como funciona el segundo procesador de aplicaciones 706 con respecto al procesador de aplicaciones 518. Por ejemplo, el Mésimo procesador de aplicaciones 708 se puede configurar para realizar el Mésimo procesamiento específico de la aplicación de visión informática en la segunda trama 104, el segundo procesamiento específico de la aplicación de visión informática, y el primer procesamiento específico de la aplicación de visión informática. De manera similar al segundo procesador de aplicaciones 706, el M-ésimo procesador de aplicaciones 708 puede rehusar realizar el Mésimo procesamiento específico de la aplicación de visión informática, controlar el estado de los otros procesadores de aplicaciones 518, 706, programar los otros procesadores de aplicaciones 518, 706 para que funcionen de manera más eficaz, etc.
[0087] La segunda ruta de procesamiento 610 puede reducir el consumo de potencia desactivando selectivamente uno o más procesadores de aplicaciones 518, 706, 708 para aumentar la eficacia de procesamiento. Por ejemplo, los procesadores de aplicaciones que son más complejos (por ejemplo, que pueden realizar más funciones de procesamiento específico de la aplicación de visión informática) y consumen más potencia pueden controlar el estado de los procesadores de aplicaciones que son menos complejos y consumen menos potencia. Por tanto, si un procesador de aplicaciones activo puede realizar las funciones de procesamiento específico de la aplicación de visión informática de un procesador de aplicaciones de menor potencia, el procesador de aplicaciones activo puede ordenar al procesador de aplicaciones de menor potencia que entre en un estado de suspensión para conservar potencia.
[0088] En referencia a la FIG. 8, se muestra otro modo de realización ilustrativo particular de un sistema de procesamiento 800 que se puede hacer funcionar para reducir el uso de potencia asociado a aplicaciones de visión informática. El sistema de procesamiento 800 incluye sensores 802, un controlador del sistema 806, una primera ruta de procesamiento 808 y una segunda ruta de procesamiento 810. En la FIG. 8, los sensores 802 incluyen un sensor de luz ambiental 840 y una cámara 842. En modos de realización alternativos, se pueden incluir diferentes números y/o tipos de sensores. La primera ruta de procesamiento 808 puede incluir el analizador de señal 512, un analizador de activación 814 y un analizador de desactivación 816. La segunda ruta de procesamiento 810 puede incluir un detector de objetos 850, un identificador de objetos 852, un clasificador de actividad 854 y una interfaz de usuario 856.
[0089] El sensor de luz ambiental 840 se puede configurar para detectar la luz y/o movimiento en un campo de visión. Por ejemplo, el sensor de luz ambiental 840 puede ser una cámara basada en un sistema microelectromecánico (MEMS) que es de baja potencia y baja resolución para determinar si hay luz o movimiento presente en el campo de visión. Si el sensor de luz ambiental 840 detecta movimiento y/o luz en el campo de visión, el sensor de luz ambiental 840 puede proporcionar un primer valor (por ejemplo, un valor lógico de alto voltaje) al controlador del sistema 806 como un estado del sensor 882. De forma alternativa, si el sensor de luz ambiental 840 no detecta movimiento y/o luz en el campo de visión, el sensor de luz ambiental 840 puede proporcionar un segundo valor (por ejemplo, un valor lógico de bajo voltaje) al controlador del sistema 806 como un estado del sensor 882.
[0090] En base al estado del sensor 882, el controlador del sistema 806 puede activar o desactivar selectivamente la cámara 842. Por ejemplo, el controlador del sistema 806 puede proporcionar datos de configuración del sensor 880 para activar la cámara 842 cuando el sensor de luz ambiental 840 detecta luz y/o movimiento en el campo de visión. Cuando se activa la cámara 842, la cámara 842 puede proporcionar datos de baja velocidad 834 (por ejemplo, los datos del sensor 530) al analizador de señal 512. De forma alternativa, el controlador del sistema 806 puede proporcionar datos de configuración del sensor 880 para desactivar la cámara 842 cuando el sensor de luz ambiental 840 no detecta luz y/o movimiento en el campo de visión. La desactivación de la cámara 842 cuando no se detecta luz y/o movimiento en el campo de visión puede conservar potencia. En un modo de realización particular, los datos
de configuración del sensor 880 también pueden indicar la porción (por ejemplo, la ubicación) en el campo de visión donde se detectó la luz y/o el movimiento.
[0091] Aunque los sensores 802 en la FIG. 8 representan el sensor de luz ambiental 840 y la cámara 842, en otros modos de realización, se puede usar una única cámara que se configura para funcionar en un primer modo (por ejemplo, un modo de baja potencia) y un segundo modo (por ejemplo, un modo de alta potencia). Por ejemplo, en el modo de bajo consumo, la cámara se puede configurar para detectar luz y/o movimiento en un campo de visión. Tras detectar la luz y/o el movimiento, la cámara puede entrar al modo de alta potencia y proporcionar datos de baja velocidad 834 (por ejemplo, los datos del sensor 530) al analizador de señal 512.
[0092] El analizador de señal 512 puede proporcionar los resultados de análisis 542 al analizador de activación 814 y al analizador de desactivación 816. En un modo de realización particular, el analizador de activación 814 y el analizador de desactivación 816 pueden corresponder al circuito de detección de cambio 414 de la FIG. 4 o al circuito de detección de cambio 514 de la FIG. 5. Por ejemplo, el analizador de activación 814 puede generar una señal de activación 844 en base a los resultados de análisis 542 (por ejemplo, si la cantidad de cambio entre los primeros datos del sensor y los segundos datos del sensor satisface un umbral de cambio). El controlador del sistema 806 puede proporcionar la señal de activación 844 a la segunda ruta de procesamiento 810 para activar (por ejemplo, accionar) componentes en la segunda ruta de procesamiento 810. De forma alternativa, el analizador de desactivación 816 puede generar una señal de desactivación 846 en base a los resultados de análisis 542 (por ejemplo, si la cantidad de cambio entre los primeros datos del sensor y los segundos datos del sensor no logra satisfacer el umbral). El controlador del sistema 806 puede proporcionar la señal de desactivación a la segunda ruta de procesamiento 810 para desactivar los componentes en la segunda ruta de procesamiento 810.
[0093] Si la segunda ruta de procesamiento 810 se activa, la cámara 842 puede proporcionar datos de alta velocidad 832 a los componentes en la segunda ruta de procesamiento 810 para el procesamiento específico de la aplicación de visión artificial. Por ejemplo, el detector de objetos 850 puede detectar objetos en una trama de los datos de alta velocidad 832, el identificador de objetos 852 puede identificar el objeto, el clasificador de actividad 854 puede clasificar el objeto identificado, etc. En un modo de realización particular, el detector de objetos 850 puede corresponder al procesador de aplicaciones 518 de la FIG. 7, el identificador de objetos 852 puede corresponder al segundo procesador de aplicaciones 706 de la FIG. 7, y el clasificador de actividad 854 puede corresponder al Mésimo procesador de aplicaciones 708 de la FIG. 7. Aunque la segunda ruta de procesamiento 810 en la FIG. 8 incluye el detector de objetos 850, el identificador de objetos 852 y el clasificador de actividad 854, en otros modos de realización, la segunda ruta de procesamiento 810 puede incluir componentes adicionales o diferentes. Por ejemplo, los componentes de la segunda ruta de procesamiento 810 se pueden basar en la aplicación de visión informática. La interfaz de usuario 856 se puede configurar para presentar salidas del detector de objetos 850, el identificador de objetos 852, el clasificador de actividad, o cualquier combinación de los mismos, a un usuario (por ejemplo, en un dispositivo de visualización).
[0094] En un modo de realización particular, la segunda ruta de procesamiento 810 puede proporcionar una indicación de estado 848 a la primera ruta de procesamiento 808 por medio del controlador del sistema 806. La indicación de estado 848 puede indicar a la primera ruta de procesamiento 808 si componentes particulares en la segunda ruta de procesamiento 810 están activos o inactivos.
[0095] En referencia a la FIG. 9, se muestra otro modo de realización ilustrativo particular de un sistema de procesamiento 900 que se puede hacer funcionar para reducir el uso de potencia asociado a aplicaciones de visión informática. El sistema de procesamiento 900 incluye el sensor 402, un subsistema Lite de interfaz de usuario de vídeo (VFE) 904, un subsistema de visión informática de baja potencia (LPCVSS) 906, un subsistema de aplicación de baja potencia (LPASS) 908, un subsistema de procesador de aplicaciones (APSS) 910, uno o más de otros procesadores 912 y un bus de datos 916. En un modo de realización particular, el LPASS 908 puede corresponder al procesador de aplicaciones 518 de la FIG. 7 y puede funcionar de manera sustancialmente similar, el APSS 910 puede corresponder al segundo procesador de aplicaciones 706 de la FIG. 7 y puede funcionar de manera sustancialmente similar, y el uno o más de otros procesadores 912 pueden corresponder al Mésimo procesador de aplicaciones 708 de la FIG. 7 y puede funcionar de manera sustancialmente similar.
[0096] El LPASS 908, el APSS 910 y el uno o más de otros procesadores 912 pueden corresponder cada uno a un núcleo de procesamiento, un subsistema de procesador de aplicaciones, un recurso de procesamiento, etc. El LPASS 908 puede consumir una primera cantidad de potencia, el APSS 910 puede consumir una segunda cantidad de potencia, y los procesadores adicionales 912 pueden consumir una tercera cantidad de potencia. La primera cantidad de potencia puede ser menor que la segunda cantidad de potencia, y la segunda cantidad de potencia puede ser menor que la tercera cantidad de potencia.
[0097] El sensor 402 puede proporcionar los datos del sensor 430 (por ejemplo, la primera trama 102, la segunda trama 104, la tercera trama 106, etc.) a la VFE-Lite 904. Tras recibir la primera trama 102, la VFE-Lite 904 puede analizar la primera trama 102 y proporcionar los primeros resultados de análisis 542 del análisis al LPCVSS 906. En un modo de realización particular, la VFE-Lite 904 puede corresponder al primer dispositivo de procesamiento 304 de la FIG. 3 o al analizador de señal 512 de la FIG. 5 y funcionar de manera sustancialmente similar. El LPCVSS 906 puede incluir una memoria "integrada" para almacenar los primeros resultados de análisis 542. En un modo de
realización particular, el LPCVSS 906 puede funcionar de manera sustancialmente similar al circuito de detección de cambio 414 de la FIG. 4 o al circuito de detección de cambio 514 de la FIG. 5. Tras recibir la segunda trama 104, la VFE-Lite 904 puede analizar la segunda trama 104 y proporcionar los segundos resultados de análisis 542 del análisis al LPCVSS 906.
[0098] Además, la VFE-Lite 904 puede proporcionar los datos del sensor 430 (por ejemplo, la segunda trama 104) a una DDR 914 por medio del bus de datos 916. Es posible que el LPCVSS 906, el LpAs S 908, el APSS 910 y los procesadores adicionales 912 accedan a los datos del sensor 430 desde la DDR 914 por medio del bus de datos 916. Por ejemplo, el LPCVSS 906, el LPASS 908, el APSS 910 y los procesadores adicionales 912 se pueden acoplar al bus de datos 916 para recibir la segunda trama 104 (o versiones procesadas de la segunda trama 104) desde la DDR 914.
[0099] El LPCVSS 906 se puede configurar para determinar una cantidad de cambio entre la primera trama 102 y la segunda trama 104 (por ejemplo, una cantidad de cambio entre los primeros resultados de análisis 542 (o primeros datos del sensor) y los segundos resultados de análisis 542 (o segundos datos del sensor)). Cuando la cantidad de cambio no logra satisfacer un umbral (por ejemplo, un umbral de cambio), el LPCVSS 906 puede generar una señal de control 920 que tiene un primer valor. Cuando la cantidad de cambio satisface el umbral, el LPCVSS 906 puede generar una señal de control 516 que tiene un segundo valor.
[0100] En el modo de realización ilustrado de la FIG. 9, la señal de control 920 tiene el primer valor que indica que la cantidad de cambio no logró satisfacer el umbral. Como resultado, el LPASS 908, el APSS 910 y el uno o más procesadores adicionales 912 están en estado de suspensión, como se indica por medio del patrón de sombreado. Por ejemplo, el LPCVSS 906 puede indicar al LPASS 908 (por medio de la señal de control 920) que permanezca en el estado de suspensión en base a la cantidad de cambio. Por tanto, en el modo de realización ilustrado de la FIG. 9, se puede conservar la potencia apagando el LPASS 908, el APSS 910 y el uno o más procesadores adicionales 912 porque se puede omitir el procesamiento específico de la aplicación de visión informática en la trama actual.
[0101] En el modo de realización ilustrado de la FIG. 10, el sistema de procesamiento 900 puede estar en un modo de potencia parcial. Para ilustrar, la señal de control 920 puede tener el segundo valor que indica que la cantidad de cambio satisface el umbral. Por ejemplo, el LPCVSS 906 puede detectar "actividad" (por ejemplo, un cambio entre la trama actual y la trama previa) y enviar una señal al LPASs 908 para que realice un procesamiento específico de la aplicación de visión informática en la trama actual. Cuando el LPASS 908 recibe la señal de control 920, el LPASS 908 se puede "accionar" y realizar el primer procesamiento específico de la aplicación de visión informática en los datos del sensor 430. Como ejemplo no limitante, el LPASS 908 se puede configurar para hacer un barrido de píxeles de la segunda trama 104 en busca de un color particular (por ejemplo, un color asociado a un tono de piel humano para detección/reconocimiento de manos). Como otro ejemplo no limitante, el LPASS 908 puede generar una "región de interés" (ROI) localizada para determinar si la actividad en la ROI satisface un umbral. Si la actividad en la ROI no satisface el umbral, el LPASS 908 puede "apagar" el APSS 910 y los otros procesadores 912 y puede "abandonar' la trama actual. Apagar el APSS 910 y los otros procesadores 912 puede reducir el consumo de potencia.
[0102] En el modo de realización ilustrado de la FIG. 11, el sistema de procesamiento 900 puede estar en un modo de potencia máxima. Por ejemplo, si la actividad en la ROI satisface el umbral, el LPASS 908 puede solicitar, por medio de una señal de control 922, que el APSS 910 realice un segundo procesamiento específico de la aplicación de visión informática en la segunda trama 104 (por ejemplo, solicite que el APSS 910 se "accione" del estado de suspensión). Como ejemplo no limitante, si el LPASS 908 detecta determina que un píxel particular de la segunda trama 104 tiene el color particular, el LPASS 908 puede solicitar que APSS 910 realice el segundo procesamiento específico de la aplicación de visión informática (por ejemplo, el procesamiento de detección de objetos, el procesamiento de reconocimiento de objetos, o cualquier combinación de los mismos) en la segunda trama 104. El LPASS 908 se puede comunicar con el APSS 910 por medio de controles IPC.
[0103] De forma similar, el APSS 910 puede solicitar, por medio de una señal de control 924, que los procesadores adicionales 912 realicen un tercer procesamiento específico de la aplicación de visión informática en la segunda trama 104 (por ejemplo, solicitar que los procesadores adicionales 912 se "accionen" del estado de suspensión). El APSS 910 se puede comunicar con los procesadores adicionales 912 por medio de controles IPC.
[0104] Por tanto, los modos de realización descritos con respecto a las FIGS. 9-11 pueden reducir el consumo de potencia desactivando selectivamente uno o más procesadores/subsistemas para aumentar la eficacia del procesamiento.
[0105] Un ejemplo de un sensor (por ejemplo, el sensor 402 de la FIG. 4) que puede proporcionar entrada a un procesador de la aplicación de visión informática incluye una cámara siempre encendida. La cámara siempre encendida se puede incluir y/o acoplar de forma comunicativa con cualquiera de una variedad de dispositivos móviles. La FIG. 12, por ejemplo, es una ilustración de modos de realización de dispositivos móviles 1200 que pueden utilizar una cámara siempre encendida. Los dispositivos móviles 1200 incluyen un teléfono móvil 1200-1, una tableta 1200-2 y un casco de realidad virtual (HMD) 1200-3. Aunque no se muestra en la FIG. 12, los dispositivos móviles 1200 pueden incluir asistentes digitales personales (PDA), ordenadores portátiles, reproductores multimedia personales,
dispositivos de juegos, cámaras, grabadoras de vídeo y similares. Los dispositivos móviles 1200 pueden incluir uno o más dispositivos portátiles (por ejemplo, cámaras de casco, cámaras deportivas, etc.), que se pueden distribuir por el cuerpo de un usuario. Múltiples dispositivos (por ejemplo, dispositivos portátiles) se pueden conectar de forma comunicativa y/o gestionar por un motor de determinación contextual, como se describe además en referencia a la FIG. 13.
[0106] Además, el estilo, tamaño, funcionalidad y/u otros rasgos característicos de un dispositivo móvil pueden variar entre diferentes dispositivos móviles del mismo tipo. Los dispositivos móviles 1200 pueden incluir una o más cámaras 1210 (por ejemplo, la cámara 302 de la FIG. 3, la cámara 842 de la FIG. 8) situadas en cualquiera de una variedad de ubicaciones en el dispositivo móvil 1200. El teléfono móvil 100-1, por ejemplo, puede incluir una cámara frontal 1210 1 y/o una cámara trasera 1210-2. La tableta 1200-2 puede incluir una cámara frontal 1210-3 y/o cámaras adicionales 1210-4 en otras superficies (por ejemplo, laterales y/o traseras), que pueden mirar hacia otras direcciones. E1HMD 100-3 puede tener una cámara hacia afuera 1210-5 ubicada entre las pantallas 1220 de1HMD 1200-3, como se muestra, y/o en otra ubicación del HMD 1200-3.
[0107] Cualquiera o todas las cámaras 1210 de un dispositivo móvil se pueden utilizar como una cámara siempre encendida, dependiendo de la funcionalidad deseada. Aunque algunos modos de realización pueden utilizar una cámara particular dedicada para una funcionalidad siempre encendida con rasgos característicos particulares que se adaptan a la funcionalidad siempre encendida (por ejemplo, un gran angular, ojo de pez, baja potencia, baja resolución, etc.), los modos de realización pueden utilizar adicionalmente o de forma alternativa cualquiera de una variedad de tipos de cámaras (por ejemplo, infrarroja, ultravioleta, espectrómetro, alta resolución, frontal, etc.) para una funcionalidad siempre encendida. Las modos de realización en los que un dispositivo móvil incluye una pluralidad de cámaras pueden posibilitar que un usuario seleccione una cámara para usar como una cámara siempre encendida y/o el dispositivo móvil puede alternar entre diferentes cámaras en determinadas situaciones.
[0108] Los modos de realización de un dispositivo móvil pueden variar de los dispositivos móviles 1200 mostrados en la FIG. 12. Por ejemplo, además o como alternativa a las cámaras integradas en un dispositivo móvil, un modo de realización particular puede incluir un dispositivo móvil físicamente separado de una cámara, pero acoplado de forma comunicativa con el mismo (por ejemplo, por medio de tecnologías inalámbricas o cableadas). Otros sensores también pueden estar físicamente separados de un dispositivo móvil, pero en comunicación con el mismo, de modo que las cámaras y/u otros sensores se pueden distribuir, por ejemplo, en varias ubicaciones en y/o alrededor del cuerpo de un usuario.
[0109] La FIG. 13 es un diagrama de entrada/salida que ilustra cómo los modos de realización de dispositivos pueden utilizar un sensor y otra información en determinaciones contextuales, que pueden influir en la modulación de una frecuencia de muestreo de una cámara siempre encendida. Estas determinaciones contextuales se pueden hacer mediante un motor de determinación contextual 1380 ejecutado, por ejemplo, por software y/o hardware de uno o más de los dispositivos móviles 1200. El motor de determinación contextual 1380 puede formar parte o integrarse en una aplicación de software y/o hardware más grande del uno o más de los dispositivos móviles 1200. Por ejemplo, uno o más componentes del motor de determinación contextual 1380 pueden formar parte de, o integrarse en, un procesador de aplicaciones él (por ejemplo, el segundo dispositivo de procesamiento 310 de la FIG. 3, el procesador de aplicaciones 418 de la FIG. 4, el procesador de aplicaciones 518 de las FIGS. 5-7, el uno o más procesadores 622, el segundo procesador de aplicaciones 706 y/o el Mésimo procesador de aplicaciones 708 de la FIG. 7), el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el analizador de activación 814, el analizador de desactivación 816, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el APSS 910, el uno o más de otros procesadores 912 de las FIGS. 9-11, un circuito de detección de cambio (por ejemplo, el circuito de detección de cambio 414 de la FIG. 4 y/o el circuito de detección de cambio 514 de la FIG. 5), el analizador de señal 512 de la FIG. 5, o una combinación de los mismos. El motor de determinación contextual 1380 puede recibir datos desde diversos componentes para realizar la determinación contextual, incluyendo el/los sensor(es) de luz 1310 (que pueden incluir, por ejemplo, el sensor de luz ambiental 840 de la FIG. 8, sensor(es) ultravioleta (UV), sensor(es) u V-A, sensor(es) UV-B, sensor(es) rojo-verde-azul (RGB) y similares), el/los micrófono(s) 1320, el/los detector(es) de movimiento/orientación 1330 (que pueden incluir, por ejemplo, uno o más giroscopios, magnetómetros (y/u otros tipos de brújulas), acelerómetro(s) y similares), la(s) cámara(s) 1210 (por ejemplo, la cámara 302 de la FIG. 3 y/o la cámara 842 de la Fig. 8), una interfaz de comunicación inalámbrica 1340 (que puede incluir, por ejemplo, un módem de segunda generación (2G), un módem de tercera generación (3G), un módem de cuarta generación (4G), una interfaz de fidelidad inalámbrica (Wifi), una interoperabilidad mundial para la interfaz de acceso de microondas (WiMax) y/u otra interfaz inalámbrica tal como una interfaz de Bluetooth® (marca registrada de Bluetooth SIG, Inc.) o una interfaz de baja energía (LE) de Bluetooth® (marca registrada de Bluetooth SIG, Inc.)), el/los receptor(es) de posicionamiento por satélite 1350 y/u otro(s) sensor(es) 1360 (por ejemplo, el sensor 402 de la FIG.
4, el sensor 502 de la FIG. 5, el sensor 602 de la FIG. 6, altímetro(s), sensor(es) de proximidad, sensor(es) de imágenes de compresión, sensor(es) de temperatura, sensor(es) de presión, sensor(es) táctil(es), sensor(es) de huellas digitales y similares).
[0110] En un modo de realización particular, el motor de determinación contextual 1380 puede recibir datos de mapa(s) 1370, modelo(s) de movimiento 1390 y/o datos de la aplicación 1395 (por ejemplo, datos de la aplicación de visión informática). Dependiendo de la funcionalidad deseada, uno o más de los componentes se pueden integrar en uno o
más de los dispositivos móviles 1200 y/o separarse del uno o más de los dispositivos móviles 1200 (comunicándose, por ejemplo, por medio de una conexión cableada y/o inalámbrica, como se describe previamente).
[0111] La una o más cámaras 1210 se pueden integrar en y/o acoplar de forma comunicativa con uno o más de los dispositivos móviles 1200. Además, cualquiera o todas las cámaras 1210 se pueden designar como una cámara siempre encendida. El motor de determinación contextual 1380 puede hacer esta designación. La frecuencia de muestreo de una cámara siempre encendida no solo se puede ver afectada por una determinación contextual del motor de determinación contextual 1380, sino que las imágenes de una cámara siempre encendida (y/u otra(s) cámara(s) 1210) se pueden procesar para realizar otras determinaciones contextuales.
[0112] Las determinaciones contextuales pueden dar como resultado la modulación de una frecuencia de muestreo de una cámara siempre encendida (que puede ser una frecuencia de muestreo inicial elegida por un valor por defecto de hardware de anclaje de aplicación de software). La frecuencia de muestreo se puede modular a cualquiera de una amplia variedad de frecuencias de muestreo. Por ejemplo, una frecuencia de muestreo inicial puede ser una muestra cada 4-5 segundos. Sin embargo, determinadas determinaciones contextuales pueden hacer que la frecuencia de muestreo aumente a 30 muestras por segundo (es decir, 30 tramas por segundo (FPS)) o más. Otras determinaciones pueden dar como resultado la reducción de la frecuencia de muestreo a, por ejemplo, una vez cada 5 minutos y/o suprimir las muestras por completo. Las determinaciones contextuales pueden dar como resultado frecuencias de muestreo desde cero (es decir, sin muestreo) hasta la frecuencia más alta posible bajo las restricciones de hardware y/o software de la cámara siempre encendida. Adicionalmente o de forma alternativa, como se describe con más detalle a continuación, los modos de realización pueden proporcionar el disparo selectivo de una cámara siempre encendida y/o la activación selectiva de determinados sensores (por ejemplo, cámaras, sensores de luz, detectores de movimiento, micrófonos, etc.) en un sistema multisensor en base a determinaciones contextuales.
[0113] El/los sensor(es) de luz 1310 puede incluir cualquiera de una variedad de sensores fotosensibles tales como sensor(es) de luz activa, sensor(es) RGB, sensor(es) ultra violeta (UV) y similares. Dicho(s) sensor(es) de luz 1310 típicamente consume(n) mucha menos potencia que una cámara siempre encendida y se puede(n) usar en la determinación del contexto de uno o más de los dispositivos móviles 1200. Por ejemplo, uno o más sensores de luz 1310 se pueden situar para determinar la intensidad de luz a la que está expuesta una cámara siempre encendida. Si la intensidad de luz detectada está por debajo de un determinado umbral, el motor de determinación contextual 1380 puede determinar que una cámara siempre encendida está en un bolsillo o bolso o en una habitación oscura, en cuyo caso se puede reducir o suspender una frecuencia de muestreo de la cámara siempre encendida.
[0114] Algunos modos de realización pueden tener múltiples cámaras 1210 que se pueden utilizar como una cámara siempre encendida. Donde las condiciones de iluminación pueden variar por la ubicación de la cámara, y uno o más sensores de luz 1310 se sitúan para corresponder con cada cámara, el motor de determinación contextual 1380 puede determinar cuál de las múltiples cámaras 1210 se va a utilizar como una cámara siempre encendida en base a los datos de intensidad de luz del/de los sensor(es) de luz 1310.
[0115] Adicionalmente o de forma alternativa, el motor de determinación contextual 1380 puede usar el/los detector(es) de movimiento/orientación 1330, el/los modelo(s) de movimiento 1390 y/o el/los sensor(es) de luz 1310 para determinar la posición de un dispositivo móvil y/o la posición de la cámara siempre encendida en relación con un usuario (tal como en un escritorio o en la mano, bolso, bolsillo de la camisa, bolsillo del pantalón, funda del usuario, etc.), y modular una frecuencia de muestreo de la cámara siempre encendida en consecuencia. Por ejemplo, si el dispositivo móvil se detecta en un bolsillo, bolso, cartera o funda y/o se expone a la luz por debajo de un determinado umbral, es probable que la visión de la cámara siempre encendida esté obstruida y la frecuencia de muestreo de la cámara siempre encendida se puede reducir. En un modo de realización particular, la frecuencia de muestreo de la cámara siempre encendida se puede reducir a cero, suspendiendo la captación de imágenes. En una situación en la que se usan las imágenes captadas de una cámara siempre encendida por una aplicación de registro de vida para recopilar automáticamente un registro de fotos de la vida de un usuario, esta funcionalidad podría dar como resultado evitar la captación innecesaria de imágenes y proporcionar ahorros de potencia significativos cuando las fotos proporcionan poca o ninguna información útil, tal como durante la noche, cuando la cámara siempre encendida está en un bolsillo, bolso, etc. El/los detector(es) de movimiento/orientación 1330 y/o el/los modelo(s) de movimiento 1390 también puede(n) posibilitar que el motor de determinación contextual 1380 determine un estado de un usuario que está transportando y/o está asociado a uno o más de los dispositivos móviles 1200. Los ejemplos incluyen caminar, correr, hacer ejercicio, en tránsito y otras de dichas actividades que pueden implicar movimiento y/u orientación detectables. Además, el estado de usuario puede afectar cómo se modula una cámara siempre encendida. Por ejemplo, una cámara siempre encendida se puede configurar para aumentar una frecuencia de muestreo donde el estado de usuario es indicativo de movimiento al aire libre (por ejemplo, donde es probable que el entorno de un usuario cambie con frecuencia). Por otra parte, un estado de usuario indicativo de un estado relativamente inactivo en interiores puede hacer que el motor de determinación contextual 1380 reduzca la frecuencia de muestreo de una cámara siempre encendida.
[0116] Un motor de determinación contextual 1380 también puede utilizar datos del/de los micrófono(s) 1320 para detectar determinada actividad y dirección de audio. Los datos del/de los micrófono(s) 1320 se pueden usar para determinar que se está llevando a cabo una actividad particular (por ejemplo, una reunión o conversación). Los datos
del/de los micrófono(s) 1320 se pueden usar para modular una frecuencia de muestreo de una cámara siempre encendida, aumentando la frecuencia de muestreo, por ejemplo, cuando se detecta sonido.
[0117] En un modo de realización particular, un dispositivo móvil puede utilizar cualquiera de las múltiples cámaras 1210 como una cámara siempre encendida. La direccionalidad de audio derivada de los datos del micrófono se puede usar para determinar de qué dirección proviene un sonido. Una cámara correspondiente que probablemente esté orientada en la dirección del sonido se puede designar entonces como la cámara siempre encendida para captar imágenes en base a la dirección de la actividad de audio. También es probable que las imágenes captadas por una cámara orientada en la dirección de la actividad de audio incluyan información visual con respecto a la identidad del hablante, las emociones del hablante, las expresiones del hablante, una escena visual correspondiente a la actividad de audio y similares. El/los micrófono(s) 1320 puede(n) incluir uno o más detectores de actividad de micrófono de baja potencia para determinar la direccionalidad del audio.
[0118] La direccionalidad del audio y la determinación del estado de usuario se pueden usar en una situación en la que uno o más de los dispositivos móviles 1200 con múltiples cámaras 1210 están ejecutando una aplicación de registro de vida. En un contexto de reunión, un usuario puede colocar uno o más de los dispositivos móviles 1200 en una mesa, momento en el cual el motor de determinación contextual 1380 puede usar el/los micrófono(s) 1320 y/u otros componentes para determinar un estado de usuario (por ejemplo, "en una reunión") y aprovechar la información de direccionalidad de audio del/de los micrófono(s) 1320 para determinar de qué cámara 1210 tomar muestras y/o cómo modular (por ejemplo, aumentar o disminuir) la frecuencia de muestreo de una cámara, en base al estado de usuario. Cuando un usuario está trabajando en su oficina, el motor de determinación contextual puede utilizar datos de audio (por ejemplo, usar la agrupación de entornos de audio y/u otras técnicas de análisis de audio) para determinar este estado de usuario (por ejemplo, "trabajando en la oficina"), y reducir la frecuencia de muestreo o apagar una cámara siempre encendida, en base al estado de usuario, hasta que se detecte un cambio en el ambiente de audio.
[0119] El motor de determinación contextual 1380 también puede usar datos del/de los detector(es) de movimiento/orientación 1330 para determinar información contextual, tal como una actividad en la que el usuario puede participar (por ejemplo, caminar, correr, en tránsito, etc.). Los datos del/de los detector(es) de movimiento/orientación 1330 se pueden comparar con el/los modelo(s) de movimiento 1390, que puede(n) modelar diferentes actividades y/u otros estados de un usuario, para hacer la determinación. Si, por ejemplo, el movimiento detectado está dentro de una semejanza umbral del movimiento modelado de una determinada actividad (es decir, el movimiento detectado es similar al movimiento modelado dentro de un umbral), el motor de determinación contextual 1380 puede determinar que el usuario está participando en esa actividad. En algunos modos de realización, los datos se pueden procesar mediante un clasificador, tal como un clasificador de movimiento absoluto o un clasificador de movimiento relativo o completo, o los datos se pueden procesar mediante un módulo o función de podómetro.
[0120] El motor de determinación contextual 1380 puede modular la frecuencia de muestreo de una cámara siempre encendida en base a la velocidad, el movimiento y/o el contexto determinado de un usuario (por ejemplo, un estado de usuario) y/o dispositivo móvil 1200. Por ejemplo, si el motor de determinación contextual 1380 determina que un usuario participa en determinadas actividades que implican una cantidad relativamente alta de movimiento, tal como correr o saltar, el motor de determinación contextual 1380 puede ajustar la frecuencia de muestreo de una cámara siempre encendida en consecuencia. Por ejemplo, en respuesta a la detección de movimientos del usuario, el motor de determinación contextual 1380 puede reducir o suspender el muestreo de la cámara siempre encendida.
[0121] De forma similar, el motor de determinación contextual 1380 puede determinar que un usuario está viajando a una determinada velocidad estimando la velocidad a partir del/de los detector(es) de movimiento/orientación 1330 y/o de la información de ubicación (que se puede determinar usando, por ejemplo, el/los receptor(es) de posicionamiento por satélite 1350, una interfaz de comunicación inalámbrica 1340 que puede proporcionar información de posicionamiento y/o velocidad, y similares). Si la velocidad está por encima de determinado umbral, el motor de determinación contextual 1380 puede reducir o suspender el muestreo de la cámara siempre encendida para reducir la probabilidad de captar imágenes borrosas. Adicionalmente o de forma alternativa, la velocidad se puede usar en una determinación de un estado de usuario, que luego se puede usar para determinar cómo se puede modular el muestreo de la cámara siempre encendida.
[0122] El motor de determinación contextual 1380 también puede usar información de orientación del/de los detector(es) de movimiento/orientación 1330 para determinar si se modula la frecuencia de muestreo de una cámara siempre encendida y/o se designa una cámara para la funcionalidad siempre encendida en base a orientación y/o movimiento detectados cuando se combina con uno o más de otros componentes. Por ejemplo, el motor de determinación contextual 1380 puede suprimir la captación de imágenes de una cámara siempre encendida si se determina que la imagen previa tomada por la cámara siempre encendida no es informativa para un determinado caso de uso (por ejemplo, apuntando hacia el cielo o el techo), y uno o más de los dispositivos móviles 1200 y/o la cámara siempre encendida ha estado en reposo absoluto desde el momento de captar la imagen previa. Los disparadores basados en geovallas y lugares de relevancia (POR) también se pueden usar en determinaciones contextuales que pueden afectar la frecuencia de muestreo de una cámara siempre encendida.
[0123] En referencia a la FIG. 14, se divulga un modo de realización ilustrativo particular de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 1400. El sistema 1400 puede incluir un dispositivo 1402. El dispositivo 1402 puede incluir un procesador 1410, un clasificador de contenido multimedia 1412 y una memoria 1408. El clasificador de contenido multimedia 1412 puede incluir un extractor de conjunto de rasgos característicos 1414, un agrupador de conjunto de rasgos característicos 1416, un clasificador de conjunto de rasgos característicos 1418, un detector de cambio de escena 1460, un detector de imágenes borrosas 1462, o cualquier combinación de los mismos. En un modo de realización particular, uno o más componentes del clasificador de contenido multimedia 1412 pueden formar parte o estar integrados en el primer dispositivo de procesamiento 304, el dispositivo de procesamiento de estadísticas 108, el segundo dispositivo de procesamiento 310 de la FIG. 3, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG. 4, el circuito de selección 506, el procesador de aplicaciones 518, el analizador de señal 512, el circuito de detección de cambio 514 de la FIG. 5, el uno o más procesadores adicionales 622 de la FIG. 6, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, la interfaz de usuario 856, el analizador de activación 814, el analizador de desactivación 816, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el APSS 910, el uno o más de otros procesadores 912 de la FIG. 9, el motor de determinación contextual 1380 de la FIG. 13, o una combinación de los mismos.
[0124] La memoria 1408 puede incluir los datos de umbral 1434, los criterios de selección 1438, el/los modelo(s) de clasificación 1428, la(s) preferencia(s) de usuario 1422, la(s) marca(s) de tiempo 1494, los datos de conjunto de rasgos característicos 1432, los datos de contexto 1490, los datos de contexto intermedio 1492, una solicitud 1444, o cualquier combinación de los mismos. En un modo de realización particular, al menos una porción de la memoria 1408 puede corresponder a la memoria 306 de la FIG. 3, la memoria 420 de la FIG. 4, la memoria 520 de la FIG. 5, la DDR 914 de la FIG. 9, o una combinación de las mismas. Como se usa en el presente documento, un "contexto" de una imagen puede incluir información inferida o determinada a partir de la imagen y/o el/los rasgo(s) característico(s) extraído(s) de la misma. Por ejemplo, un contexto de una imagen puede incluir una ubicación específica, una persona específica, un objeto específico, una actividad específica o cualquier combinación de los mismos. Para ilustrar, un contexto de una imagen de una persona particular que asiste a una reunión en una sala de conferencias particular puede incluir la persona en particular (por ejemplo, "John"), la actividad de asistir a la reunión (por ejemplo, "reunión de grupo a la que se asistió"), la sala de conferencias particular (por ejemplo, "Sala 2.134"), objetos en la sala de conferencias (por ejemplo, "pizarra") o cualquier combinación de los mismos.
[0125] Los datos de umbral de 1434 pueden incluir una o más duraciones umbral 1480, un nivel de confianza umbral 1482, un nivel de nitidez umbral 1484, una potencia de batería umbral 1486, un ancho de banda umbral 1488, o cualquier combinación de los mismos. Los criterios de selección 1438 pueden incluir un presupuesto de recursos 1420 (por ejemplo, un número umbral de núcleos de procesador homogéneos o heterogéneos que se van a activar), un caso de uso 1436, una región de interés 1478 o cualquier combinación de los mismos. En un modo de realización particular, el dispositivo 1402 puede recibir uno o más valores correspondientes a los datos de umbral 1434, los criterios de selección 1438, o ambos, por medio de la entrada de usuario 1430 de un usuario 1452. En un modo de realización particular, el clasificador de contenido multimedia 1412 puede generar uno o más valores correspondientes a los datos de umbral 1434 en base a los valores correspondientes asociados a una o más imágenes. Por ejemplo, el clasificador de contenido multimedia 1412 puede determinar el nivel de nitidez umbral 1484 en base a una nitidez promedio de un número de imágenes previamente procesadas y/o captadas.
[0126] El dispositivo 1402 se puede acoplar a, o estar en comunicación con, uno o más sensores de imagen y una pantalla 1406. El uno o más sensores de imagen pueden incluir un primer sensor de imagen 1404, un N-ésimo sensor de imagen 1440 o una combinación de sensores de imagen. En un modo de realización particular, el dispositivo 1402 puede ser un dispositivo móvil que se configura para captar una imagen por medio del primer sensor de imagen 1404, el N-ésimo sensor de imagen 1440, o de una combinación de sensores de imagen. En un modo de realización particular, el primer sensor de imagen 1404, el N-ésimo sensor de imagen 1440, o uno o más de otros sensores, se pueden integrar en una cámara del dispositivo móvil. El uno o más sensores de imagen pueden corresponder a la cámara 302 de la FIG. 3, el sensor 402 de la FIG. 4, el sensor 502 de la FIG. 5, el sensor 602 de la FIG. 6, los sensores 802 de la FIG. 8, las cámaras 1210 de la FIG. 12, el uno o más de otros sensores 1360, o una combinación de los mismos.
[0127] El dispositivo 1402 puede incluir menos o más componentes que los ilustrados en la FIG. 14. Por ejemplo, el dispositivo 1402 puede incluir más de un procesador, puede incluir más de una memoria o ambos. El dispositivo 1402 puede incluir un sistema informático distribuido o en red. En un modo de realización ilustrativo particular, el dispositivo 1402 puede incluir un dispositivo de comunicación móvil, un teléfono inteligente, un teléfono móvil, un ordenador portátil, un ordenador, una tableta, un asistente digital personal, un dispositivo de visualización, un televisor, una consola de juegos, un reproductor de música, una radio, un reproductor de vídeo digital, un reproductor de disco de vídeo digital (DVD), un sintonizador, una cámara, un dispositivo de navegación o cualquier combinación de los mismos. Dichos dispositivos pueden incluir una interfaz de usuario, por ejemplo, una pantalla táctil, capacidad de reconocimiento de voz u otras capacidades de interfaz de usuario.
[0128] Durante el funcionamiento, el dispositivo 1402 puede recibir datos sensoriales (por ejemplo, los primeros datos sensoriales 1470) desde un sensor de imagen (por ejemplo, el primer sensor de imagen 1404). Los primeros datos
sensoriales 1470 pueden estar relacionados con una imagen. Por ejemplo, el primer sensor de imagen 1404 puede captar la imagen y puede enviar los primeros datos sensoriales 1470 relacionados con la imagen al dispositivo 1402. El primer sensor de imagen 1404 puede generar los primeros datos sensoriales 1470 en base a diversos disparadores, como se describe adicionalmente con referencia a las FIGS. 19 y 27. Por ejemplo, el primer sensor de imagen 1404 puede captar periódicamente imágenes en un intervalo de muestreo de datos (por ejemplo, una vez cada minuto) y puede enviar periódicamente los datos sensoriales (por ejemplo, los primeros datos sensoriales 1470) relacionados con las imágenes al dispositivo 1402. El primer sensor de imagen 1404 puede captar las imágenes en base a una determinación de que se satisface una duración de captación de imagen umbral (por ejemplo, la(s) duración/duraciones umbral 1480). Por ejemplo, la duración de captación de imagen umbral puede indicar un intervalo de muestreo de datos particular (por ejemplo, 1 minuto) entre la captación de imágenes. La duración de captación de imagen umbral se puede satisfacer cuando transcurre el intervalo de muestreo de datos particular después de captar una imagen previa.
[0129] Como otro ejemplo, el primer sensor de imagen 1404 puede generar los primeros datos sensoriales 370 en base a una determinación de que un ancho de banda disponible en el dispositivo 1402 satisface un ancho de banda umbral (por ejemplo, el ancho de banda umbral 1488), que una potencia de batería disponible satisface una potencia de batería umbral (por ejemplo, la potencia de batería umbral 1486), o ambos. Como otro ejemplo, el primer sensor de imagen 1404 puede generar los primeros datos sensoriales 1470 en base a una preferencia del usuario (por ejemplo, la(s) preferencia(s) de usuario 1422), en base a la entrada del usuario (por ejemplo, la entrada de usuario 1430), o cualquier combinación de los mismos.
[0130] Como otro ejemplo, el primer sensor de imagen 1404 puede generar los primeros datos sensoriales 1470 en base a una solicitud de captación de imagen (por ejemplo, una primera solicitud de captación de imagen 1472) recibida desde el dispositivo 1402. Para ilustrar, en respuesta a la determinación de que uno o más de los diversos disparadores están activados, el clasificador de contenido multimedia 1412 puede enviar la primera solicitud de captación de imagen 1472 al primer sensor de imagen 1404. El clasificador de contenido multimedia 1412 puede recibir los primeros datos sensoriales 1470 desde el primer sensor de imagen 1404.
[0131] El extractor de conjunto de rasgos característicos 1414 puede extraer un primer subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442) de la imagen a partir de los primeros datos sensoriales 1470. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 puede calcular uno o más descriptores visuales de la imagen. En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede extraer el primer subconjunto de rasgos característicos de la imagen en base a la determinación de que se satisface un criterio de extracción. Por ejemplo, el criterio de extracción se puede satisfacer si los primeros datos sensoriales 1470 indican un cambio en la imagen en relación con una imagen previa. Para ilustrar, el criterio de extracción se puede satisfacer si una diferencia entre las primeras estadísticas de imagen correspondientes a los primeros datos sensoriales 1470 y las segundas estadísticas de imagen correspondientes a la imagen previa satisfacen un umbral de cambio, como se describe en el presente documento. Se apreciará que abstenerse de extraer el primer subconjunto de rasgos característicos en base a la determinación de que los primeros datos sensoriales 1470 no satisfacen el criterio de extracción puede conservar los recursos del dispositivo 1402. Por ejemplo, la imagen puede ser similar a la imagen previa y se puede descartar (por ejemplo, se puede excluir el procesamiento de la imagen) y los recursos del dispositivo 1402 se pueden usar para procesar una imagen siguiente. En un modo de realización particular, la memoria 1408 puede ser externa al clasificador de contenido multimedia 1412, la memoria 1408 puede almacenar los primeros datos sensoriales 1470, y extraer el primer subconjunto de rasgos característicos puede incluir acceder a la memoria 1408.
[0132] En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede seleccionar el primer subconjunto de rasgos característicos en base a un criterio de selección (por ejemplo, los criterios de selección 1438), como se describe adicionalmente con referencia a las FIGS. 18-21. Los criterios de selección 1438 pueden incluir un presupuesto de recursos (por ejemplo, el presupuesto de recursos 1420), un caso de uso (por ejemplo, el caso de uso 1436), una región de interés (por ejemplo, la región de interés 1478) o cualquier combinación de los mismos. En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede extraer menos que la totalidad de los rasgos característicos que puede extraer el extractor de conjunto de rasgos característicos 1414 a partir de los primeros datos sensoriales 1470. Cada rasgo característico extraído puede tener o estar asociado a un nivel de confianza correspondiente. De forma alternativa, o además, se puede determinar un nivel de confianza agregado (por ejemplo, promediando) a partir de múltiples rasgos característicos extraídos. Si el clasificador de contenido multimedia 1412 determina, en base a un criterio de análisis (por ejemplo, nivel(es) de confianza) asociado al primer subconjunto de rasgos característicos, que se van a extraer más rasgos característicos, el extractor de conjunto de rasgos característicos 1414 puede extraer posteriormente más rasgos característicos. Diversas condiciones pueden disparar la extracción de rasgos característicos adicionales. En un modo de realización, se extraen rasgos característicos adicionales si un nivel de confianza de cualquier rasgo característico extraído es menor que un nivel de confianza umbral. En otro modo de realización, se extraen rasgos característicos adicionales si el nivel de confianza agregado es menor que el nivel de confianza umbral. También se pueden usar otras condiciones en la determinación si se van a extraer rasgos característicos adicionales. Se apreciará que extraer inicialmente menos rasgos característicos puede conservar recursos del dispositivo 1402 porque el clasificador de contenido multimedia 1412 puede determinar que no se van a extraer más rasgos característicos.
[0133] En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede formar parte o estar integrado en el segundo dispositivo de procesamiento 310. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 puede extraer el primer subconjunto de rasgos característicos en base a un criterio de extracción que se satisface. El criterio de extracción se puede basar en los primeros datos sensoriales 1470. Por ejemplo, el primer dispositivo de procesamiento 304 de la FIG. 3 puede generar primeras estadísticas de imagen correspondientes a la primera trama 102 de la FIG. 1 y puede generar segundas estadísticas de imagen correspondientes a la segunda trama 104 de la FIG. 1. En este modo de realización, los primeros datos sensoriales 1470 pueden corresponder a la segunda trama 104.
[0134] Las primeras estadísticas de imagen y las segundas estadísticas de imagen se pueden generar en base al procesamiento específico de la aplicación. El procesamiento específico de la aplicación puede incluir determinar si los datos sensoriales (por ejemplo, los primeros datos sensoriales 1470 y/o los segundos datos sensoriales correspondientes a la primera trama 102) indican que un objeto particular (por ejemplo, una señal de alto de tráfico) está en una imagen correspondiente, indican que se desencadena un acontecimiento de alerta (por ejemplo, se detecta un gesto particular), indican que un objeto de un color particular está en la imagen, o una combinación de los mismos. El procesamiento específico de la aplicación puede incluir al menos uno de reconocimiento de actividades, reconocimiento de personas, reconocimiento de objetos, reconocimiento de ubicaciones o reconocimiento de gestos.
[0135] En un modo de realización particular, la memoria 1408 puede almacenar una asignación entre diversos tipos de procesamiento de la aplicación y tipos de estadísticas correspondientes. Por ejemplo, el tipo de procesamiento de la aplicación particular correspondiente a la detección del objeto particular (por ejemplo, la señal de alto de tráfico) puede asignar a un tipo de estadísticas particulares correspondientes a un histograma de color de un color particular (por ejemplo, rojo). El segundo dispositivo de procesamiento 310 puede proporcionar datos de configuración al primer dispositivo de procesamiento 304 que indica el tipo de estadística particular en base al tipo de procesamiento de aplicación particular y la asignación. El primer dispositivo de procesamiento 304 puede generar las primeras estadísticas de imagen y las segundas estadísticas de imagen correspondientes al tipo de estadística particular. Por ejemplo, las primeras estadísticas de imagen pueden incluir un primer recuento de píxeles del color particular (por ejemplo, rojo) en un primer histograma de color correspondiente a la segunda trama 104 y las segundas estadísticas de imagen pueden incluir un segundo recuento de píxeles del color particular (por ejemplo, rojo) en un segundo color correspondiente a la primera trama 102.
[0136] El dispositivo de procesamiento de estadísticas 108 de la FIG. 1 puede proporcionar los primeros datos sensoriales 1470 al segundo dispositivo de procesamiento 310 en respuesta a la determinación de que se satisface el criterio de extracción. Por ejemplo, el dispositivo de procesamiento de estadísticas 108 puede proporcionar los primeros datos sensoriales 1470 al segundo dispositivo de procesamiento 310 (por ejemplo, el extractor de conjunto de rasgos característicos 1414) en respuesta a la determinación de que una cantidad de cambio entre las primeras estadísticas de imagen (por ejemplo, el primer recuento de píxeles) y las segundas estadísticas de imagen (por ejemplo, el segundo recuento de píxeles) satisface un umbral de cambio. En un modo de realización particular, el criterio de extracción se puede satisfacer cuando los primeros datos sensoriales 1470 indican un cambio de escena. Por ejemplo, el dispositivo de procesamiento de estadísticas 108 puede incluir el detector de cambio de escena 1460. El dispositivo de procesamiento de estadísticas 108 puede determinar que el criterio de extracción se satisface en base al detector de cambio de escena 1460 que determina que los primeros datos sensoriales 1470 indican un cambio de escena, como se describe adicionalmente con referencia a la FIG. 22. En un modo de realización particular, el criterio de extracción se puede satisfacer cuando los primeros datos sensoriales 1470 indican que una nitidez de la imagen satisface un nivel de nitidez umbral (por ejemplo, el nivel de nitidez umbral 1484 de los datos de umbral 1434), como se describe adicionalmente con referencia a la FIG. 23. Por ejemplo, el dispositivo de procesamiento de estadísticas 108 puede incluir el detector de imagen borrosa 1462 configurado para determinar si la nitidez de la imagen satisface el nivel de nitidez umbral.
[0137] El dispositivo de procesamiento de estadísticas 108 se puede abstener de proporcionar los primeros datos sensoriales 1470 al extractor de conjunto de rasgos característicos 1414 en respuesta a la determinación de que la cantidad de cambio no satisface el umbral de cambio. El extractor de conjunto de rasgos característicos 1414 puede extraer el primer subconjunto de rasgos característicos en respuesta a la recepción de los primeros datos sensoriales 1470. Determinar si se satisface el criterio de extracción puede usar menos recursos del dispositivo 1402 que extraer el primer subconjunto de rasgos característicos. Se apreciará que determinar inicialmente si se satisface el criterio de extracción puede conservar recursos del dispositivo 1402 porque el dispositivo de procesamiento de estadísticas 108 puede determinar que la cantidad de cambio entre la primera trama 102 y la segunda trama 104 es insuficiente (por ejemplo, es menor que el umbral de cambio) para extraer rasgos característicos de la segunda trama 104.
[0138] En un modo de realización alternativo, el extractor de conjunto de rasgos característicos 1414 puede formar parte o estar integrado en el primer dispositivo de procesamiento 304 de la FIG. 3. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 en el primer dispositivo de procesamiento 304 puede extraer el primer subconjunto de rasgos característicos a partir de los primeros datos sensoriales 1470. El primer dispositivo de procesamiento 304 puede determinar las primeras estadísticas de imagen en base al primer subconjunto de rasgos característicos. El primer dispositivo de procesamiento 304 puede proporcionar las primeras estadísticas de imagen al dispositivo de
procesamiento de estadísticas 108 de la FIG. 1. El dispositivo de procesamiento de estadísticas 108 puede determinar si se satisface el criterio de extracción en base a las primeras estadísticas de imagen y a las segundas estadísticas de imagen de una segunda imagen, como se describe en el presente documento. El dispositivo de procesamiento de estadísticas 108 puede proporcionar los primeros datos sensoriales 1470 al segundo dispositivo de procesamiento 310 de la FIG. 3 en base a la determinación de que se cumple el criterio de extracción.
[0139] Aún en otro modo de realización, el extractor de conjunto de rasgos característicos 1414 en el primer dispositivo de procesamiento 304 puede extraer el primer subconjunto de rasgos característicos a partir de los primeros datos sensoriales 1470. El primer dispositivo de procesamiento 304 puede determinar un nivel de confianza asociado a la extracción del primer subconjunto de rasgos característicos y puede proporcionar el nivel de confianza al dispositivo de procesamiento de estadísticas 108 de la FIG. 1. El dispositivo de procesamiento de estadísticas 108 puede determinar si se satisface el criterio de extracción en base a determinar si el nivel de confianza satisface el nivel de confianza umbral 1482. El dispositivo de procesamiento de estadísticas 108 puede proporcionar los primeros datos sensoriales 1470, el primer subconjunto de rasgos característicos, o ambos, al agrupador de conjunto de rasgos característicos 1416 en base a la determinación de que el nivel de confianza satisface el nivel de confianza umbral 1482. El dispositivo de procesamiento de estadísticas 108 puede proporcionar de forma alternativa los primeros datos sensoriales 1470 al extractor de conjunto de rasgos característicos 1414 para extraer rasgos característicos adicionales en base a la determinación de que el nivel de confianza no logra satisfacer el nivel de confianza umbral 1482. En un modo de realización particular, el segundo dispositivo de procesamiento 310 de la FIG. 3 puede incluir el agrupador de conjunto de rasgos característicos 1416 y puede incluir el extractor de conjunto de rasgos característicos 1414. Por ejemplo, cada uno del primer dispositivo de procesamiento 304 y el segundo dispositivo de procesamiento 310 puede incluir una versión del extractor de conjunto de rasgos característicos 1414.
[0140] En un modo de realización particular, los rasgos característicos de la imagen pueden incluir un descriptor visual del grupo de expertos de imágenes en movimiento 7 (MPEG-7), un descriptor de árbol de búsqueda generalizada (GIST), un descriptor visual de histograma de transformación censal (CENTRIST), un descriptor de bolsa de palabras, un descriptor visual y localmente agregado, un descriptor de coincidencia de pirámide espacial o una combinación de los mismos. El descriptor visual MPEG-7 puede incluir uno o más de un descriptor de colores escalables (SCD), un descriptor de estructura de colores (CSD), un descriptor de grupo de tramas (GOF), un descriptor de grupo de imágenes (GOP), un descriptor de colores dominantes (DCD), un descriptor de disposición de colores (CLD), un descriptor de búsqueda de textura (TBD), un descriptor de textura homogénea (HTD), un descriptor de histograma de bordes (EHD), un descriptor de forma basado en contorno, un descriptor de forma basado en regiones, un descriptor de movimiento de cámara (CMD), un descriptor de trayectoria de movimiento (MTD), un descriptor de movimiento paramétrico (PMD) o un descriptor de actividad de movimiento (MAD). Uno o más de estos descriptores pueden extraer información de color, textura, movimiento, borde, forma y/o escena de la imagen captada. El extractor de conjunto de rasgos característicos puede determinar un nivel de confianza asociado a cada uno de los primeros subconjuntos de rasgos característicos. Por ejemplo, cada descriptor visual MPEG-7 puede tener un nivel de confianza asociado. El extractor de conjunto de rasgos característicos 1414 puede almacenar el primer subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 342) en la memoria 1408.
[0141] En un modo de realización particular, cuando el primer sensor de imagen 1404 capta continuamente imágenes en un intervalo de muestreo de datos dado (por ejemplo, una vez cada minuto), los datos sensoriales (por ejemplo, los primeros datos sensoriales 1470) pueden permanecer sustancialmente iguales durante muchas imágenes consecutivas. Por ejemplo, el dispositivo 1402 puede ser un dispositivo móvil del usuario 1452. El usuario 1452 puede colocar el dispositivo 1402 encima de un escritorio en el trabajo captando el primer sensor de imagen 1404 imágenes sustancialmente similares (por ejemplo, de un techo). En un ejemplo de este tipo, el agrupador de conjunto de rasgos característicos 1416 puede generar un primer subconjunto de rasgos característicos agrupados (por ejemplo, el/los subconjunto(s) de rasgos característicos agrupados 1476) combinando subconjuntos de rasgos característicos de imágenes captadas durante una duración particular. Por ejemplo, el agrupador de rasgos característicos 1416 puede generar el primer subconjunto de rasgos característicos agrupados (por ejemplo, el/los subconjunto(s) de rasgos característicos agrupados 1476) combinando el primer subconjunto de rasgos característicos relacionados con la imagen y otro subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442) relacionados con una segunda imagen en base a una primera marca de tiempo que está dentro de una duración de agrupación umbral (por ejemplo, la(s) duración/duraciones umbral 1480) de una segunda marca de tiempo. La primera marca de tiempo (por ejemplo, la(s) marca(s) de tiempo 1494) se puede asociar a la imagen y la segunda marca de tiempo (por ejemplo, la(s) marca(s) de tiempo 1494) se puede asociar a la segunda imagen. Por ejemplo, la primera marca de tiempo puede indicar cuándo el primer sensor de imagen 1404 captó la imagen o cuándo el dispositivo 1402 recibió los primeros datos sensoriales 1470. De forma similar, la segunda marca de tiempo puede indicar cuándo el primer sensor de imagen 1404 captó la segunda imagen o cuándo el dispositivo 1402 recibió datos sensoriales relacionados con la segunda imagen. El/los subconjunto(s) de rasgos característicos agrupados 1476 puede(n) representar, por tanto, rasgos característicos comunes agrupados temporalmente (por ejemplo, rasgos característicos del techo durante el tiempo que el usuario se sentó en su escritorio).
[0142] El agrupador de conjunto de rasgos característicos 1416 puede generar el primer subconjunto de rasgos característicos agrupados (por ejemplo, el/los subconjunto(s) de rasgos característicos agrupados 1476) combinando el primer subconjunto de rasgos característicos (por ejemplo, el descriptor de histograma de bordes, una
transformación censal o resultados de filtrado de Gabor) de la imagen y otro subconjunto de rasgos característicos (por ejemplo, un segundo descriptor de histograma de bordes, una transformación censal o resultados de filtrado de Gabor) de la segunda imagen en base a la primera marca de tiempo (por ejemplo, 10:00 a.m. del 10 de julio de 2013) y a la segunda marca de tiempo (por ejemplo, 10:03 a.m. del 10 de julio de 2013) que está dentro de la duración de agrupación umbral (por ejemplo, cinco minutos). El primer subconjunto de rasgos característicos agrupados puede incluir el primer subconjunto de rasgos característicos, el otro subconjunto de rasgos característicos o ambos. El primer subconjunto de rasgos característicos agrupados puede indicar una duración de tiempo correspondiente (por ejemplo, de 10:00 a.m. a 10:04 a.m. el 10 de julio de 2013). El análisis posterior del primer subconjunto de rasgos característicos agrupados puede usar menos recursos del dispositivo 302 en comparación con el análisis del primer subconjunto de rasgos característicos y el segundo subconjunto de rasgos característicos individualmente. El agrupador de conjunto de rasgos característicos 1416 puede almacenar el primer subconjunto de rasgos característicos agrupados (por ejemplo, el/los subconjunto(s) de rasgos característicos agrupados 1476) en la memoria 1408.
[0143] El clasificador de conjunto de rasgos característicos 1418 puede generar un primer subconjunto de rasgos característicos clasificados (por ejemplo, el/los subconjunto(s) de rasgos característicos clasificados 1474) clasificando el primer subconjunto de rasgos característicos agrupados (por ejemplo, el/los subconjunto(s) de rasgos característicos agrupados 1476) en base a un primer modelo de clasificación (por ejemplo, el/los modelo(s) de clasificación 1428). El primer modelo de clasificación puede indicar que el primer subconjunto de rasgos característicos agrupados corresponde a una ubicación específica, una persona específica, un objeto específico, una actividad específica o cualquier combinación de los mismos. El primer modelo de clasificación también puede indicar niveles de confianza asociados a la correspondencia. Como resultado, el clasificador de conjunto de rasgos característicos 1418 puede generar el primer subconjunto de rasgos característicos clasificados que indica que el primer subconjunto de rasgos característicos agrupados corresponde a la ubicación, la persona, el objeto, la actividad o cualquier combinación de los mismos. El primer subconjunto de rasgos característicos clasificados también puede indicar los niveles de confianza asociados. Por ejemplo, el primer subconjunto de rasgos característicos clasificados puede indicar que el primer subconjunto de rasgos característicos agrupados corresponde a un tipo particular de ubicación (por ejemplo, en interiores) con un nivel de confianza particular (por ejemplo, bajo). En un modo de realización particular, el primer subconjunto de rasgos característicos clasificados también puede indicar una duración de tiempo asociada. Por ejemplo, el primer subconjunto de rasgos característicos clasificados puede indicar una duración de tiempo (por ejemplo, de 10:00 a.m. - 10:04 a.m. el 10 de julio de 2013) asociada al primer subconjunto de rasgos característicos agrupados, la primera marca de tiempo, la segunda marca de tiempo o cualquier combinación de los mismos. Para ilustrar, el primer subconjunto de rasgos característicos clasificados puede indicar con un nivel de confianza "bajo" (por ejemplo, un nivel de confianza de un 20 % que es menor que un nivel de confianza umbral "bajo" de un 25 %) que el "contexto" está en interiores durante de 10:00 a.m. - 10:04 a.m. el 10 de julio de 2013. El clasificador de conjunto de rasgos característicos 1418 puede almacenar el primer subconjunto de rasgos característicos clasificados (por ejemplo, el/los subconjunto(s) de rasgos característicos clasificado(s) 1474) en la memoria 308.
[0144] El clasificador de contenido multimedia 1412 puede determinar si los niveles de confianza del primer subconjunto de rasgos característicos satisfacen un nivel de confianza umbral (por ejemplo, el nivel de confianza umbral 1482). En un modo de realización particular, el clasificador de contenido multimedia 1412 puede determinar que los niveles de confianza del primer subconjunto de rasgos característicos no satisfacen el nivel de confianza umbral 1482 en respuesta a la determinación de que los niveles de confianza de datos de contexto intermedios (por ejemplo, los datos de contexto intermedios 1492) no satisfacen el nivel de confianza umbral 1482. Los datos de contexto intermedio 1492 pueden corresponder a un contexto parcial de la imagen. Por ejemplo, los datos de contexto intermedios 1492 pueden corresponder al primer subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442), el primer subconjunto de rasgos característicos agrupados (por ejemplo, el/los subconjunto(s) de rasgos característicos agrupados 1476), o el primer subconjunto de rasgos característicos clasificados (por ejemplo, el/los subconjunto(s) de rasgos característicos clasificados 1474).
[0145] Por ejemplo, el primer subconjunto de rasgos característicos puede incluir un descriptor de histograma de bordes o una transformación censal de la imagen y los niveles de confianza asociados. El clasificador de contenido multimedia 1412 puede determinar que uno o más de los niveles de confianza asociados no satisfacen el nivel de confianza umbral 1482. Como resultado, el clasificador de contenido multimedia 1412 puede determinar que los niveles de confianza del primer subconjunto de rasgos característicos, y por lo tanto los datos de contexto intermedios 1492, no satisfacen el nivel de confianza umbral 1482.
[0146] Como otro ejemplo, el agrupador de conjunto de rasgos característicos 1416 puede determinar que los niveles de confianza asociados al primer subconjunto de rasgos característicos agrupados (por ejemplo, el/los subconjunto(s) de rasgos característicos agrupados 1476) no satisfacen el nivel de confianza umbral 1482. Para ilustrar, el agrupador de conjunto de rasgos característicos 1416 puede determinar un nivel de confianza particular (por ejemplo, bajo) para los rasgos característicos del primer subconjunto de rasgos característicos agrupados que están relacionados con una y no ambas de la imagen y la segunda imagen. Como otro ejemplo, el agrupador de conjunto de rasgos característicos 1416 puede determinar el nivel de confianza particular en base a una función (por ejemplo, promedio) de los niveles de confianza de los rasgos característicos asociados a la primera imagen y a la segunda imagen. Un rasgo característico particular del primer subconjunto de rasgos característicos puede tener un primer nivel de confianza (por ejemplo, bajo). El rasgo característico particular del otro subconjunto de rasgos característicos puede tener un segundo
nivel de confianza (por ejemplo, alto). El agrupador de conjunto de rasgos característicos 1416 puede determinar que el nivel de confianza particular es un promedio (por ejemplo, el medio) del primer nivel de confianza y el segundo nivel de confianza. El clasificador de contenido multimedia 1412 puede determinar que el nivel de confianza particular no satisface el nivel de confianza umbral 1482. Como resultado, el clasificador de contenido multimedia 1412 puede determinar que los niveles de confianza asociados al primer subconjunto de rasgos característicos agrupados y, por lo tanto, los datos de contexto intermedios 1492, no satisfacen el nivel de confianza umbral 1482.
[0147] Como otro ejemplo, el clasificador de contenido multimedia 1412 puede determinar que los niveles de confianza asociados al primer subconjunto de rasgos característicos clasificados (por ejemplo, el/los subconjunto(s) de rasgos característicos clasificados 1474) no satisfacen el nivel de confianza umbral 1482. Para ilustrar, el primer subconjunto de rasgos característicos clasificados puede indicar que el primer subconjunto de rasgos característicos agrupados corresponde al tipo particular de ubicación (por ejemplo, en interiores) con un nivel de confianza particular que no satisface el nivel de confianza umbral 1482. Como resultado, el clasificador de contenido multimedia 1412 puede determinar que los niveles de confianza asociados al primer subconjunto de rasgos característicos clasificados, y por lo tanto los datos de contexto intermedios 1492, no satisfacen el nivel de confianza umbral 1482.
[0148] En respuesta a la determinación de que los niveles de confianza de los datos de contexto intermedios 1492 no satisfacen el nivel de confianza umbral 1482, el extractor de conjunto de rasgos característicos 1414 puede extraer un segundo subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442). Por ejemplo, el extractor de conjunto de rasgos característicos 1414 puede extraer rasgos característicos adicionales (por ejemplo, el segundo subconjunto de rasgos característicos) en respuesta a la determinación de que el/los nivel(es) de confianza asociado(s) al primer subconjunto de rasgos característicos, el primer subconjunto de rasgos característicos agrupados o el primer subconjunto de rasgos característicos clasificados no satisfacen el nivel de confianza umbral 1482.
[0149] En un modo de realización particular, el segundo subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442) puede estar relacionado con la imagen y se puede extraer a partir de los primeros datos sensoriales 1470. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 puede usar la ecualización de histogramas para expandir un intervalo de nivel de grises de la imagen antes de volver a calcular el descriptor de histograma de bordes de la imagen. El descriptor de histograma de bordes recalculado (es decir, el segundo subconjunto de rasgos característicos) puede tener niveles de confianza asociados mayores que el descriptor de histograma de bordes calculado previamente. Como otro ejemplo, el extractor de conjunto de rasgos característicos 1414 puede extraer un segundo descriptor visual (es decir, el segundo subconjunto de rasgos característicos) de la imagen que no se extrajo previamente (por ejemplo, un descriptor de colores, un descriptor de textura, un descriptor GIST, un descriptor CENTRIST o cualquier combinación de los mismos). El segundo descriptor visual puede tener niveles de confianza asociados mayores que el descriptor visual previamente extraído.
[0150] En un modo de realización particular, el segundo subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442) puede estar relacionado con otra imagen. Por ejemplo, el clasificador de contenido multimedia 1412 puede enviar una solicitud (por ejemplo, una solicitud de captación de la segunda imagen 1426) para segundos datos sensoriales (por ejemplo, los segundos datos sensoriales 1424) a otro sensor de imagen (por ejemplo, el N-ésimo sensor de imagen 1440) en respuesta a la determinación de que los niveles de confianza del primer subconjunto de rasgos característicos no satisfacen el nivel de confianza umbral 1482. En respuesta a la solicitud de captación de la segunda imagen 1426, el N-ésimo sensor de imagen 1440 puede captar la otra imagen y puede enviar los segundos datos sensoriales 1424 relacionados con la otra imagen al dispositivo 1402.
[0151] En un modo de realización particular, la imagen puede corresponder a una primera configuración del primer sensor de imagen 1404 y la otra imagen puede corresponder a una segunda configuración del N-ésimo sensor de imagen 1440. La primera configuración puede incluir una configuración de zoom, una configuración de resolución, una configuración de ángulo, una ubicación o cualquier combinación de las mismas. La primera configuración puede ser distinta de la segunda configuración. Por ejemplo, la segunda configuración puede corresponder a un zoom mayor que la primera configuración, una resolución mayor que la primera configuración, un ángulo diferente a la primera configuración, una ubicación diferente a la de la primera configuración o cualquier combinación de los mismos. El uso del segundo subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442) puede aumentar uno o más niveles de confianza asociados al primer subconjunto de rasgos característicos agrupados, el primer subconjunto de rasgos característicos clasificados, o ambos.
[0152] En un modo de realización particular, el primer sensor de imagen 1404 se puede integrar en un primer dispositivo, el N-ésimo sensor de imagen 1440 se puede integrar en un segundo dispositivo, y el primer dispositivo puede ser distinto del segundo dispositivo. Por ejemplo, el primer sensor de imagen 1404 se puede integrar en una cámara y el N-ésimo sensor de imagen 1440 se puede integrar en otra cámara.
[0153] El extractor de conjunto de rasgos característicos 1414 puede extraer el segundo subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442) de los segundos datos sensoriales 1424. En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede extraer el segundo subconjunto de rasgos característicos en base a la determinación de que se satisface un criterio de
extracción. Por ejemplo, el clasificador de contenido multimedia 1412 (por ejemplo, el primer dispositivo de procesamiento 304 de la FIG. 3) puede determinar las primeras estadísticas de imagen en base a los primeros datos sensoriales 1470 y puede determinar las segundas estadísticas de imagen en base a los segundos datos sensoriales 1424. El clasificador de contenido multimedia 1412 (por ejemplo, el dispositivo de procesamiento de estadísticas 108 de la FIG. 1) puede proporcionar los segundos datos sensoriales 1424 al extractor de conjunto de rasgos característicos 1414 (por ejemplo, en el segundo dispositivo de procesamiento 310) para extraer el segundo subconjunto de rasgos característicos en base a la determinación de que una cantidad de cambio correspondiente a una diferencia entre las primeras estadísticas de imagen y las segundas estadísticas de imagen satisface un umbral de cambio. El clasificador de contenido multimedia 1412 (por ejemplo, el dispositivo de procesamiento de estadísticas 108 de la FIG. 1) puede descartar los segundos datos sensoriales 1424 (por ejemplo, abstenerse de proporcionar los segundos datos sensoriales 1424 al segundo dispositivo de procesamiento 310) en base a la determinación de que la cantidad de cambio no logra satisfacer el umbral de cambio.
[0154] En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede seleccionar el segundo subconjunto de rasgos característicos en base a los criterios de selección 1438, como se describe adicionalmente con referencia a las FIGS. 18-21. El extractor de conjunto de rasgos característicos 1414 puede almacenar el segundo subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442) en la memoria 1408. Extraer el primer subconjunto de rasgos característicos puede usar menos recursos (por ejemplo, memoria, potencia, ciclos de ejecución del procesador) del dispositivo 1402 que extraer el segundo subconjunto de rasgos característicos.
[0155] El agrupador de conjunto de rasgos característicos 1416 puede generar un segundo subconjunto de rasgos característicos agrupados (por ejemplo, el/los subconjunto(s) de rasgos característicos agrupados1476) agrupando el segundo subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442) en base a la primera marca de tiempo asociada a la imagen, la segunda marca de tiempo asociada a la segunda imagen, otra marca de tiempo asociada a la otra imagen, o cualquier combinación de las mismas. Por ejemplo, el segundo subconjunto de rasgos característicos agrupados puede incluir el primer subconjunto de rasgos característicos agrupados, el segundo subconjunto de rasgos característicos, otro subconjunto de rasgos característicos de la segunda imagen correspondientes al segundo subconjunto de rasgos característicos, o cualquier combinación de los mismos. En un modo de realización particular, el segundo subconjunto de rasgos característicos agrupados puede incluir una combinación del descriptor de histograma de bordes de la imagen y el segundo descriptor de histograma de bordes de la segunda imagen, una combinación de un descriptor de GIST de la primera imagen y un segundo descriptor de GIST de la segunda imagen, y una combinación de un descriptor CENTRIST de la primera imagen y un segundo descriptor CENTRIST de la segunda imagen.
[0156] El clasificador de conjunto de rasgos característicos 1418 puede generar datos de contexto (por ejemplo, los datos de contexto 1490) que indican un contexto de la imagen en base al menos en parte al segundo subconjunto de rasgos característicos. El contexto de la imagen puede incluir una ubicación, una persona, una actividad o cualquier combinación de las mismas. Por ejemplo, el clasificador de conjunto de rasgos característicos 1418 puede generar los datos de contexto 1490 clasificando el primer subconjunto de rasgos característicos agrupados, el segundo subconjunto de rasgos característicos agrupados, o ambos, en base a un segundo modelo de clasificación (por ejemplo, el/los modelo(s) de clasificación 1428. Por ejemplo, el segundo modelo de clasificación puede indicar que el primer subconjunto de rasgos característicos agrupados, el segundo subconjunto de rasgos característicos agrupados, o ambos, corresponden a una habitación particular de un edificio particular. El segundo modelo de clasificación puede indicar niveles de confianza asociados a la correspondencia. En base al segundo modelo de clasificación, el clasificador de conjunto de rasgos característicos 1418 puede generar los datos de contexto 1490 que indican que el contexto de la imagen corresponde a la habitación particular. Los datos de contexto 1490 pueden indicar los niveles de confianza asociados. Por ejemplo, los datos de contexto 1490 pueden indicar un nivel de confianza particular (por ejemplo, alto) asociado al contexto de la imagen correspondiente a la habitación particular. En un modo de realización particular, los datos de contexto 1490 también pueden indicar una duración de tiempo asociada. Por ejemplo, los datos de contexto 1490 pueden indicar que el dispositivo 1402 estaba en la habitación particular (por ejemplo, donde trabaja el usuario 1452) durante una duración de tiempo (por ejemplo, de 10:00 a.m. - 10:04 a.m. el 10 de julio de 2013). La duración de tiempo puede estar asociada a un subconjunto de rasgos característicos agrupados (por ejemplo, el primer subconjunto de rasgos característicos agrupados, el segundo subconjunto de rasgos característicos agrupados, o ambos), la primera marca de tiempo, la segunda marca de tiempo, la otra marca de tiempo o cualquier combinación de los mismos.
[0157] Por tanto, en el ejemplo anterior, mientras que el primer subconjunto de rasgos característicos clasificados indica un nivel de confianza "bajo" (por ejemplo, un 25 %) asociado al contexto "en interiores", los datos de contexto 1490 indican un nivel de confianza mayor (por ejemplo, un 85 %) de un contexto más refinado (por ejemplo, "en el trabajo"). Se apreciará que en determinados casos de uso, el nivel de confianza menor y el contexto menos refinado generado a partir del primer subconjunto de rasgos característicos pueden ser suficientes. En dichas situaciones, se pueden conservar los recursos emitiendo el contexto menos refinado y absteniéndose de extraer el segundo subconjunto de rasgos característicos. En situaciones donde el nivel de confianza menor y el contexto menos refinado son insuficientes, se pueden usar recursos adicionales para extraer el segundo subconjunto de rasgos característicos para generar el contexto más refinado que tiene el nivel de confianza mayor.
[0158] El clasificador de contenido multimedia 1412 puede emitir (o hacer accesible) los datos de contexto 1490 a una aplicación (por ejemplo, la aplicación 1444). En un modo de realización particular, la aplicación 1444 puede incluir un motor de extracción de contexto, un motor consciente del contexto, o ambos. La aplicación 1444 puede incluir una aplicación de visión informática. Por ejemplo, la aplicación 1444 puede incluir una aplicación de etiquetado de vida, una aplicación de macro geovallas, una aplicación de micro geovallas, una aplicación de detección de actividad de movimiento, una aplicación de detección de texto, una aplicación de detección de objetos, una aplicación de detección de gestos, o cualquier combinación de los mismos. Por ejemplo, el clasificador de contenido multimedia 1412 puede emitir los datos de contexto 1490 a la aplicación de etiquetado de vida. En base a los datos de contexto 1490, la aplicación de etiquetado de vida puede inferir que el usuario 1452 estuvo en la habitación particular (por ejemplo, en el trabajo) durante la duración de tiempo (por ejemplo, de 10:00 a.m. - 10:04 a.m. el 10 de julio de 2013).
[0159] En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede extraer el primer subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442) en respuesta a un detector de cambio de escena (por ejemplo, el detector de cambio de escena 1460) que detecta que los primeros datos sensoriales 1470 indican un cambio de escena, como se describe adicionalmente con referencia a la FIG. 22. Por ejemplo, es posible que los rasgos característicos de una imagen que representa la misma escena que una imagen analizada previamente no se extraigan, conservando de este modo los recursos del dispositivo 1402.
[0160] En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede extraer el primer subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442) en respuesta a un detector de imágenes borrosas (por ejemplo, el detector de imágenes borrosas 1462) que determina que los primeros datos sensoriales 1470 indican que una nitidez de la imagen satisface un nivel de nitidez umbral (por ejemplo, un nivel de nitidez umbral 1484 de los datos de umbral 1434), como se describe adicionalmente con referencia a la FIG. 23. Por ejemplo, es posible que los rasgos característicos de una imagen que está demasiado borrosa para satisfacer el nivel de nitidez umbral 1484 no sean útiles para identificar un contexto de la imagen y es posible que no se extraiga para su análisis, conservando de este modo los recursos del dispositivo 1402.
[0161] Por tanto, el sistema 1400 puede posibilitar la identificación del contexto de la imagen con un uso eficaz de los recursos del dispositivo 1402. Por ejemplo, se pueden extraer los rasgos característicos de una imagen cuando la imagen no corresponde a una imagen extraída previamente, una imagen borrosa o ambas. Además, se pueden extraer inicialmente los rasgos característicos parciales de la imagen con rasgos característicos adicionales extraídos si los rasgos característicos parciales no satisfacen un nivel de confianza umbral. El dispositivo 1402 se puede habilitar para analizar un mayor número de imágenes mientras se usan menos recursos.
[0162] En referencia a la FIG. 15, se divulga un modo de realización ilustrativo particular de intervalos de cálculo asociados a la extracción de subconjuntos de rasgos característicos de imágenes y se designa, en general, como 1500.
[0163] El dispositivo 1402 de la FIG. 14 puede recibir periódicamente datos sensoriales (por ejemplo, los primeros datos sensoriales 1470) desde un sensor de imagen (por ejemplo, el primer sensor de imagen 1404) en un intervalo de muestreo de datos (por ejemplo, un intervalo de muestreo de datos 1506). Un número particular (por ejemplo, N = dos) de rasgos característicos puede ser extraíble por el extractor de conjunto de rasgos característicos 1414 a partir de los datos sensoriales. Por ejemplo, el dispositivo 1402 puede recibir periódicamente los primeros datos sensoriales 1470 en un tiempo 1502 y en un tiempo 1504 (es decir, en el intervalo de muestreo de datos 1506). Como otro ejemplo, el dispositivo 1402 puede recibir los primeros datos sensoriales 1470 en un tiempo 1512, en un tiempo 1514 y en un tiempo 1516. En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede extraer todos (por ejemplo, N) los rasgos característicos durante cada intervalo de muestreo de datos.
[0164] En otro modo de realización particular, el número de rasgos característicos extraídos se puede basar en un criterio de extracción, un criterio de análisis (por ejemplo, niveles de confianza), o ambos, asociados a los datos sensoriales (por ejemplo, los rasgos característicos extraídos). Por ejemplo, el extractor de conjunto de rasgos característicos 1414 puede extraer un primer subconjunto de rasgos característicos y un segundo subconjunto de rasgos característicos en el tiempo 1512 en respuesta a los niveles de confianza asociados al primer subconjunto de rasgos característicos que no satisfacen un nivel de confianza umbral (por ejemplo, el nivel de confianza umbral 1482), como se describe adicionalmente en referencia a la FIG. 14. Por lo tanto, el extractor de conjunto de rasgos característicos 1414 puede extraer un primer número de (por ejemplo, dos) rasgos característicos en el tiempo 1512. En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede extraer el primer subconjunto de rasgos característicos y el segundo subconjunto de rasgos característicos en el tiempo 1512 en base al menos en parte a la determinación de que se satisface un criterio de extracción, como se describe con referencia a la FIG. 14.
[0165] Posteriormente, el dispositivo 1402 puede recibir los primeros datos sensoriales 1470 en el tiempo 1514. El extractor de conjunto de rasgos característicos 1414 puede extraer el primer subconjunto de rasgos característicos y puede no extraer el segundo subconjunto de rasgos característicos en el tiempo 1514 en respuesta a la determinación de que los niveles de confianza asociados al primer subconjunto de rasgos característicos satisfacen el nivel de
confianza umbral 1482, como se describe adicionalmente con referencia a la FIG. 14. Por lo tanto, el extractor de conjunto de rasgos característicos 1414 puede extraer menos (por ejemplo, un) rasgo(s) característico(s) en el tiempo 1514. En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede extraer el primer subconjunto de rasgos característicos en el tiempo 1514 en base al menos en parte a la determinación de que se satisface un criterio de extracción, como se describe con referencia a la FIG. 14.
[0166] El dispositivo 1402 puede recibir posteriormente los primeros datos sensoriales 1470 en el tiempo 1516. El extractor de conjunto de rasgos característicos 1414 puede extraer el primer subconjunto de rasgos característicos y el segundo subconjunto de rasgos característicos en el tiempo 1516 en respuesta a los niveles de confianza asociados al primer subconjunto de rasgos característicos que no satisfacen el nivel de confianza umbral 1482. Por lo tanto, el extractor de conjunto de rasgos característicos 1414 puede extraer más (por ejemplo, dos) rasgos característicos en el tiempo 1516 que en el tiempo 1514. En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede extraer el primer subconjunto de rasgos característicos y el segundo subconjunto de rasgos característicos en el tiempo 1516 en base al menos en parte a la determinación de que se satisface un criterio de extracción, como se describe con referencia a la FIG. 14.
[0167] Por tanto, como se muestra en la FIG. 15, el primer subconjunto de rasgos característicos se puede extraer en los tiempos 1512, 1514 y 1516 en un primer intervalo de cálculo 1508. El primer intervalo de cálculo 1508 puede ser aproximadamente igual al intervalo de muestreo de datos 1506. El segundo subconjunto de rasgos característicos se puede extraer en los tiempos 1512 y 1516 en un segundo intervalo de cálculo 1510. El segundo intervalo de cálculo 1510 puede ser mayor que el intervalo de muestreo de datos 1506.
[0168] Por tanto, el extractor de conjunto de rasgos característicos 1414 puede extraer menos rasgos característicos con mayor frecuencia y puede extraer más rasgos característicos con menos frecuencia y como sea necesario, conservando de este modo los recursos del dispositivo 1402.
[0169] En referencia a la FIG. 16, se divulga un modo de realización ilustrativo particular de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 1600. Una o más de las operaciones del sistema 1600 se pueden realizar por el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG. 4, el circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514, el procesador de aplicaciones 518 de la FIG. 5, el circuito de preprocesamiento 604, el uno o más procesadores adicionales 622, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708 de la FIG. 7, el analizador de activación 814, el analizador de desactivación 816, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el AP SS 910, el uno o más procesadores 912 de la FIG. 9, el motor de determinación contextual 1380 de la FIG. 13, el dispositivo 1402 de la FIG. 14, o una combinación de los mismos.
[0170] El sistema 1600 puede incluir la extracción del conjunto de rasgos característicos 1, en 1604. La operación 504 puede corresponder al extractor de conjunto de rasgos característicos 1414 de la FIG. 14 que extrae el primer subconjunto de rasgos característicos, como se describe adicionalmente con referencia a la FIG. 14. El sistema 1600 puede incluir la extracción del conjunto de rasgos característicos M, en 1624. La operación 1624 puede corresponder al extractor de conjunto de rasgos característicos 1414 de la FIG. 14 que extrae el segundo subconjunto de rasgos característicos, como se describe adicionalmente con referencia a la FIG. 14. El sistema 1600 puede incluir la agrupación del conjunto de rasgos característicos, en 1606. La operación 1606 puede corresponder a la operación del agrupador de conjunto de rasgos característicos 1416 de la FIG. 14. El sistema 1600 puede incluir la clasificación del conjunto de rasgos característicos, en 1608. La operación 1608 puede corresponder a la operación del clasificador de conjunto de rasgos característicos 1418 de la FIG. 14.
[0171] El sistema 1600 puede generar inferencias intermedias 1620. Las inferencias intermedias 1620 pueden corresponder al/a los subconjunto(s) de rasgos característicos clasificados 1474 de la FIG. 14. El sistema 1600 puede generar inferencias finales 1610. Las inferencias finales 1610 pueden corresponder a los datos de contexto 1490 de la FIG. 14.
[0172] En un modo de realización particular, cuáles y cuántos rasgos característicos se van a extraer puede depender de la capacidad del dispositivo. Por ejemplo, un dispositivo con una memoria que no satisfaga un primer umbral de memoria, una velocidad de procesador que no satisfaga un primer umbral de velocidad de procesador, o ambos, pueden corresponder a un dispositivo de bajo nivel. Un dispositivo con una memoria que satisfaga el primer umbral de memoria y no satisfaga un segundo umbral de memoria, una velocidad de procesador que satisfaga el primer umbral de velocidad de procesador y no satisfaga un segundo umbral de velocidad de procesador, o ambos, puede corresponder a un dispositivo de nivel medio. Un dispositivo que satisfaga ambos umbrales de memoria, una velocidad de procesador que satisfaga ambos umbrales de velocidad, puede corresponder a un dispositivo de alto nivel.
[0173] En un modo de realización particular, el sistema 1600 se puede abstener de determinar si se van a extraer más rasgos característicos para un dispositivo de bajo nivel. En este modo de realización, el primer subconjunto de rasgos característicos clasificados se puede tratar como inferencias finales 1610. Es posible que analizar más rasgos
característicos de los primeros datos sensoriales 1470 no sea práctico con las limitaciones de recursos (por ejemplo, memoria o velocidad de procesador) del dispositivo de bajo nivel. Por ejemplo, analizar los rasgos característicos adicionales de los primeros datos sensoriales 1470 usando el dispositivo de bajo nivel puede llevar más tiempo que una duración de análisis umbral.
[0174] El sistema 1600 puede determinar si se necesitan más rasgos característicos, en 1622. Por ejemplo, el sistema 1600 puede determinar si se va a extraer un segundo subconjunto de rasgos característicos en base a una capacidad (por ejemplo, velocidad de procesador, velocidad de memoria o ambas) del dispositivo 1402, un criterio de extracción, un criterio de análisis (por ejemplo, un nivel de confianza), o una combinación de los mismos. Por ejemplo, el sistema 1600 puede determinar si se van a extraer rasgos característicos adicionales (por ejemplo, un segundo subconjunto de rasgos característicos) para un dispositivo de nivel medio o un dispositivo de alto nivel en base a los niveles de confianza asociados al/a los subconjunto(s) de rasgos característicos clasificados 1474, como se describe adicionalmente con referencia a la FIG. 14.
[0175] En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede seleccionar un número particular de rasgos característicos que se van a incluir en el segundo subconjunto de rasgos característicos en base a una capacidad del dispositivo 1402. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 puede extraer menos rasgos característicos adicionales para un dispositivo de nivel medio que para un dispositivo de alto nivel.
[0176] Por tanto, se pueden extraer más rasgos característicos a partir de los datos sensoriales en un dispositivo de nivel superior que en un dispositivo de nivel inferior. Se pueden usar menos recursos del dispositivo de nivel inferior para generar datos de contexto de imagen, mientras que se pueden generar datos de contexto de imagen con niveles de confianza asociados mayores para el dispositivo de nivel superior.
[0177] En referencia a la FIG. 17, se divulga un modo de realización ilustrativo particular de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 1700. Una o más operaciones del sistema 1700 se pueden realizar por el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG. 4, el circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514, el procesador de aplicaciones 518 de la FIG. 5, el circuito de preprocesamiento 604, el uno o más procesadores adicionales 622, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708 de la FIG. 7, el analizador de activación 814, el analizador de desactivación 816, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el AP SS 910, el uno o más procesadores 912 de la FIG. 9, el motor de determinación contextual 1380 de la FIG. 13, el dispositivo 1402 de la FIG. 14, o una combinación de los mismos.
[0178] Los componentes del sistema 1700 pueden funcionar de manera similar a los componentes correspondientes del sistema 1600 de la FIG. 16. El sistema 1700 puede generar primeras inferencias intermedias 1702. Las primeras inferencias intermedias 1702 pueden corresponder al/a los subconjunto(s) de rasgos característicos agrupados 1476 de la FIG. 14. El sistema 1700 puede generar segundas inferencias intermedias 1704. Las segundas inferencias intermedias 1704 pueden corresponder al/a los subconjunto(s) de rasgos característicos clasificados 1474 de la FIG.
14.
[0179] El sistema 1700 puede realizar una o más extracciones de rasgos característicos (por ejemplo, extracción del conjunto de rasgos característicos 11604, extracción del conjunto de rasgos característicos 2 1722, extracción del conjunto de rasgos característicos N 1724, o cualquier combinación de las mismas). El sistema 1700 puede realizar la agrupación del conjunto de rasgos característicos 1606 y puede realizar la clasificación del conjunto de rasgos característicos 1608.
[0180] Posterior a realizar cada una de la una o más extracciones del conjunto de rasgos característicos (por ejemplo, extracción del conjunto de rasgos característicos 11604, extracción del conjunto de rasgos característicos 2 1622 o extracción del conjunto de rasgos característicos N 1624), la agrupación del conjunto de rasgos característicos 1606 y la clasificación del conjunto de rasgos característicos 1608, el sistema 1700 puede determinar si se necesitan más rasgos característicos, por ejemplo, en 1710, 1712, 1714 o 1622. Por ejemplo, el clasificador de contenido multimedia 1412 puede determinar si se van a extraer rasgos característicos adicionales en base a un criterio de análisis (por ejemplo, un nivel de confianza), un criterio de extracción, o ambos, como se describe adicionalmente con referencia a la FIG. 14.
[0181] Por tanto, el sistema 1700 puede posibilitar la identificación del contexto de la imagen. Se pueden extraer rasgos característicos adicionales en diversas fases del análisis (por ejemplo, después de extraer otros rasgos característicos, después de la agrupación o después de la clasificación) hasta que se logre un nivel de confianza umbral.
[0182] En referencia a la FIG. 18, se divulga un modo de realización ilustrativo particular de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 1800. Una o más operaciones del sistema 1800
se pueden realizar por el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG. 4, el circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514, el procesador de aplicaciones 518 de la FIG. 5, el circuito de preprocesamiento 604, el uno o más procesadores adicionales 622, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708 de la FIG. 7, el analizador de activación 814, el analizador de desactivación 816, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el AP SS 910, el uno o más procesadores 912 de la FIG. 9, el motor de determinación contextual 1380 de la FIG. 13, el dispositivo 1402 de la FIG. 14, o una combinación de los mismos.
[0183] Los componentes del sistema 1800 pueden funcionar de manera similar a los componentes correspondientes del sistema 1700 de la FIG. 17. El sistema 1800 puede seleccionar un subconjunto de rasgos característicos para extraer de datos sensoriales (por ejemplo, los primeros datos sensoriales 1470 de la FIG. 14) en base a un caso de uso 1436. El caso de uso 1436 puede incluir reconocimiento de actividades, reconocimiento de personas, reconocimiento de objetos, reconocimiento de ubicación, reconocimiento de gestos, reconocimiento de emociones, detección de mirada, comprobación de salud (por ejemplo, reconocimiento de condición física), o cualquier combinación de los mismos. En un modo de realización particular, el caso de uso 1436 puede corresponder al procesamiento específico de la aplicación. Por ejemplo, el primer dispositivo de procesamiento 304 de la FIG. 3 puede generar estadísticas de imagen, como se describe con referencia a la FIG. 14, en base al caso de uso 1436.
[0184] Un ejemplo de actividades que se pueden reconocer incluye ver televisión, jugar un juego, leer, escribir, mirar la pantalla, hacer una presentación, en una reunión, trabajar solo, conocer gente, comer, ir de compras, cocinar, desplazarse al trabajo, etc. Un ejemplo de personas que se pueden reconocer incluye un individuo particular (por ejemplo, "John Smith"), un tipo de persona (por ejemplo, un oficial de policía, un bombero, un piloto, una azafata o un médico), o cualquier combinación de los mismos.
[0185] Un ejemplo de objetos incluye un letrero de calle, una cara, una mano, un dedo, una huella digital, un juguete, una llave, un teléfono, un arma, un automóvil, una placa de matrícula, etc. Un ejemplo de ubicaciones que se pueden reconocer incluye un edificio particular (por ejemplo, el edificio del capitolio estatal de un estado particular), un tipo de edificio (por ejemplo, un museo, una escuela, un hospital o un patio de recreo), o cualquier combinación de los mismos. Un ejemplo de gestos que se pueden reconocer incluye mirar en una dirección particular, apuntar en una dirección particular, deslizar el dedo en una dirección particular, movimiento de la mano, movimiento de los ojos o cualquier combinación de los mismos.
[0186] En un modo de realización particular, un modelo de clasificación (por ejemplo, el/los modelo(s) de clasificación 1428) puede indicar que al menos un primer subconjunto de rasgos característicos se va a analizar para el caso de uso 1436. Por ejemplo, el caso de uso 1436 puede corresponder a determinar si el contexto de la imagen corresponde a un tipo particular de ubicación (por ejemplo, "en interiores"). El modelo de clasificación puede indicar que se puede analizar al menos un descriptor CENTRIST y un descriptor GIST para determinar si el contexto de una imagen corresponde a la ubicación particular. En base al caso de uso 1436 y al modelo de clasificación, el extractor de conjunto de rasgos característicos 1414 puede extraer el primer subconjunto de rasgos característicos (por ejemplo, los descriptores GIST y CENTRIST) de la imagen a partir de los primeros datos sensoriales 1470. En un modo de realización particular, el extractor de conjunto de rasgos característicos 1414 puede extraer el primer subconjunto de rasgos característicos en base a la determinación de que se satisface un criterio de extracción, como se describe con referencia a la FIG. 14.
[0187] En un modo de realización particular, el modelo de clasificación puede indicar que un segundo subconjunto de rasgos característicos se va a analizar para el mismo o diferente caso de uso 1436. Por ejemplo, el segundo subconjunto de rasgos característicos puede incluir un mapa de respuestas invariante de escala de un detector de objetos genéricos previamente entrenado, tal como un descriptor de banco de objetos. En un modo de realización particular, el modelo de clasificación puede indicar que el primer subconjunto de rasgos característicos es altamente recomendado y que el segundo subconjunto de rasgos característicos puede ser útil para analizar el caso de uso 1436. En este modo de realización, el extractor de conjunto de rasgos característicos 1414 puede extraer el segundo subconjunto de rasgos característicos en base a un criterio de análisis, un criterio de extracción, o ambos. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 puede extraer el segundo subconjunto de rasgos característicos en respuesta a la determinación de que se satisface un criterio de extracción, que el nivel de confianza asociado a la extracción del primer subconjunto de rasgos característicos no satisface un nivel de confianza umbral (por ejemplo, el nivel de confianza umbral 1482), o ambos, como se describe adicionalmente con referencia a la FIG. 14.
[0188] Por tanto, un subconjunto de rasgos característicos adecuadas para analizar un caso de uso particular se puede extraer a partir de los datos sensoriales. Como resultado, la eficacia con la que se identifica el contexto de la imagen puede aumentar. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 puede determinar que un conjunto de rasgos característicos particular es altamente recomendado para analizar un caso de uso particular. Extraer todos los rasgos característicos altamente recomendados durante una extracción inicial de rasgos característicos puede ser más eficaz que realizar la agrupación y clasificación después de extraer cada rasgo característico altamente recomendado y a continuación extraer un rasgo característico altamente recomendado
siguiente en base a los niveles de confianza asociados. Como otro ejemplo, el extractor de conjunto de rasgos característicos 1414 se puede abstener de extraer rasgos característicos adicionales que se sabe que son inútiles para analizar el caso de uso particular 1436, conservando de este modo los recursos del dispositivo 1402.
[0189] En referencia a la FIG. 19, se divulga un modo de realización ilustrativo particular de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 1900. Una o más operaciones del sistema 1600 se pueden realizar por el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310, la cámara 302 de la FIG. 3, el sensor 404, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG. 4, el sensor 502, el circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514, el procesador de aplicaciones 518 de la FIG.
5, el sensor 602, el circuito de preprocesamiento 604, el uno o más procesadores adicionales 622, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708 de la FIG. 7, la cámara 842, el sensor de luz ambiental 840, el analizador de activación 814, el analizador de desactivación 816, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el AP SS 910, el uno o más procesadores 912 de la FIG. 9, la una o más cámaras 1210 de la FIG. 12, el motor de determinación contextual 1380 de la FIG. 13, el dispositivo 1402 de la FIG. 14, uno o más sensores de imagen del dispositivo 1402 (por ejemplo, el primer sensor de imagen 1404 o el N-ésimo sensor de imagen 1440), o cualquier combinación de los mismos.
[0190] Los componentes del sistema 1900 pueden funcionar de manera similar a los componentes correspondientes del sistema 1800 de la FIG. 18. El sistema 1900 puede seleccionar un subconjunto de rasgos característicos para extraer de datos sensoriales (por ejemplo, los primeros datos sensoriales 1470 de la FIG. 14) en base a la información de recursos (por ejemplo, la información de recursos 1902). La información de recursos 1902 puede incluir información de disponibilidad de recursos, un presupuesto de recursos (por ejemplo, el presupuesto de recursos 1420 de la FIG.
14), o ambos.
[0191] El presupuesto de recursos 1420 puede incluir un presupuesto de memoria, un presupuesto de potencia, un número de instrucciones por presupuesto de período de tiempo (por ejemplo, por segundo), o cualquier combinación de los mismos. La información de disponibilidad de recursos 1802 puede incluir una disponibilidad de memoria, una disponibilidad de potencia, un número de instrucciones por disponibilidad de período de tiempo (por ejemplo, por segundo), o cualquier combinación de las mismas.
[0192] La información de disponibilidad de recursos 1802 puede diferir del presupuesto de recursos 1420 en que la información de disponibilidad de recursos 1802 puede indicar qué porción o cantidad de los recursos del dispositivo 1402 están disponibles para su uso (por ejemplo, por cualquier aplicación) y el presupuesto de recursos 1420 puede indicar qué porción o cantidad de los recursos del dispositivo 1402 se pueden usar por el clasificador de contenido multimedia 1412.
[0193] La información de disponibilidad de recursos 1802 puede indicar que un porcentaje particular (o una cantidad particular) de un recurso está disponible. En un modo de realización particular, es posible que el extractor de conjunto de rasgos característicos 1414 no extraiga ningún rasgo característico si la disponibilidad de recursos no satisface una disponibilidad de recursos umbral (por ejemplo, una potencia de batería umbral 1486, un ancho de banda umbral 1488, una memoria umbral, un número de instrucciones por segundo umbral, o cualquier combinación de los mismos).
[0194] En un modo de realización particular, el clasificador de contenido multimedia 1412 puede tener acceso a una estimación de utilización de recursos asociada a un análisis de un subconjunto de rasgos característicos particulares. En este modo de realización, el clasificador de contenido multimedia 1412 puede seleccionar un subconjunto de rasgos característicos particulares cuando la disponibilidad de recursos es mayor que la utilización de recursos estimada de análisis del subconjunto de rasgos característicos particulares.
[0195] En un modo de realización particular, el clasificador de contenido multimedia 1412 puede determinar si extraer un subconjunto de rasgos característicos (por ejemplo, el primer subconjunto de rasgos característicos, el segundo subconjunto de rasgos característicos, o ambos) a partir de los primeros datos sensoriales 1470 en base al presupuesto de recursos 1420. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 puede determinar que un porcentaje particular (o una cantidad particular) del presupuesto de recursos 1420 se está utilizando por el clasificador de contenido multimedia 1412. El extractor de conjunto de rasgos característicos 1414 puede extraer el subconjunto de rasgos característicos cuando menos del presupuesto de recursos 1420 total se está utilizando por el clasificador de contenido multimedia 1412.
[0196] En un modo de realización particular, el presupuesto de recursos 1420 puede corresponder a un criterio de extracción. Por ejemplo, el primer dispositivo de procesamiento 304 de la FIG. 3 puede recibir el presupuesto de recursos 1420 y puede generar las primeras estadísticas de imagen que indican el porcentaje particular (o la cantidad particular) del presupuesto de recursos 1420 que se está utilizando (por ejemplo, por el sistema 300). El dispositivo de procesamiento de estadísticas 108 puede proporcionar los primeros datos sensoriales 1470 al segundo dispositivo de procesamiento 310 en base a la determinación de que se está utilizando menos del presupuesto de recursos 1420 total.
[0197] En un modo de realización particular, el clasificador de contenido multimedia 1412 puede tener acceso a una estimación de una utilización de recursos asociada a un análisis (por ejemplo, extracción, agrupamiento o clasificación) de un subconjunto de rasgos característicos particulares. Por ejemplo, la utilización de recursos estimada se puede generar por el clasificador de contenido multimedia 1412 en base a un análisis previo del subconjunto de rasgos característicos particulares para otra imagen. En este modo de realización, el clasificador de contenido multimedia 1412 puede extraer el subconjunto particular de rasgos característicos cuando el presupuesto de recursos 1420 restante es mayor que la utilización de recursos estimada de análisis del subconjunto de rasgos característicos particulares. En un modo de realización particular, el primer dispositivo de procesamiento 304 puede generar primeras estadísticas de imagen que indican la utilización de recursos estimada y el dispositivo de procesamiento de estadísticas 108 puede proporcionar los primeros datos sensoriales 1470 al segundo dispositivo de procesamiento 310 en base a la determinación de que el presupuesto de recursos 1420 restante es más que la utilización de recursos estimada.
[0198] El presupuesto de recursos 1420 se puede basar en las preferencias de usuario (por ejemplo, la(s) preferencia(s) de usuario 1422). Por ejemplo, la(s) preferencia(s) de usuario 1422 puede(n) indicar que ninguna aplicación en segundo plano ocupará más de un porcentaje particular (por ejemplo, un 20 %) de recursos.
[0199] En un modo de realización particular, el sistema 1900 también puede generar datos sensoriales (por ejemplo, los primeros datos sensoriales 1470 de la FIG. 14) en base a la información de disponibilidad de recursos, el presupuesto de recursos 1420, o ambos. Por ejemplo, el clasificador de contenido multimedia 1412 puede enviar una solicitud (por ejemplo, la solicitud de captación de la primera imagen 1472) al primer sensor de imagen 1404 en respuesta a la determinación de que la información de disponibilidad de recursos 1802 indica que un recurso particular está disponible, que se está utilizando menos del presupuesto de recursos 1420 total por el clasificador de contenido multimedia 1412, o ambos.
[0200] Por tanto, el clasificador de contenido multimedia 1412 puede realizar una identificación de contexto de imagen en base a la disponibilidad de recursos actual o futura (por ejemplo, el presupuesto de recursos 1420, la información de disponibilidad de recursos, o ambos). Los datos sensoriales se pueden generar cuando hay suficientes recursos disponibles. Se pueden conservar los recursos del dispositivo 1402 por el primer sensor de imagen 1404 absteniéndose de generar los datos sensoriales para su análisis por el clasificador de contenido multimedia 1412 cuando no hay suficientes recursos disponibles. Se pueden usar menos recursos del dispositivo 1402 para la identificación del contexto de imagen cuando el presupuesto de recursos 1420 es más limitado, mientras que se pueden generar datos de contexto con niveles de confianza asociados mayores cuando el presupuesto de recursos 1420 es mayor. Además, se pueden usar menos recursos del dispositivo 1402 para la identificación del contexto de imagen cuando hay recursos limitados disponibles, mientras que se pueden generar datos de contexto con niveles de confianza asociados mayores cuando hay más recursos disponibles. Por ejemplo, si la información de disponibilidad de recursos 1802 indica que la potencia de batería restante del dispositivo 1402 no satisface la potencia de batería umbral 1486, el clasificador de contenido multimedia 1412 puede analizar menos imágenes (por ejemplo, puede aumentar un intervalo de muestreo de datos), puede extraer menos rasgos característicos a partir de los primeros datos sensoriales 1470, se puede abstener de extraer rasgos característicos a partir de los primeros datos sensoriales 1470, o una combinación de los mismos.
[0201] En referencia a la FIG. 20, se divulga un diagrama de otro modo de realización particular de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 2000. Una o más operaciones del sistema 2000 se pueden realizar por el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG. 4, el circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514, el procesador de aplicaciones 518 de la FIG. 5, el circuito de preprocesamiento 604, el uno o más procesadores adicionales 622, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708 de la FIG. 7, el analizador de activación 814, el analizador de desactivación 816, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el AP SS 910, el uno o más procesadores 912 de la FIG. 9, el motor de determinación contextual 1380 de la FIG. 13, el dispositivo 1402 de la FIG. 14, o una combinación de los mismos.
[0202] Los componentes del sistema 2000 pueden funcionar de manera similar a los componentes correspondientes del sistema 1800 de la FIG. 18. El sistema 2000 puede extraer o identificar una región de interés (por ejemplo, una región de interés 1478) durante la extracción del conjunto de rasgos característicos 11604. La región de interés 1478 puede corresponder a una porción particular de la imagen. La región de interés 1478 se puede determinar en base a un caso de uso (por ejemplo, el caso de uso 1436 de la FIG. 14), en base a las diferencias entre la imagen y una imagen anterior, o ambos. Por ejemplo, la región de interés 1478 puede corresponder a caras cuando el caso de uso 1436 incluye reconocimiento de personas y puede corresponder a objetos cuando el caso de uso 1436 incluye reconocimiento de actividades.
[0203] Como otro ejemplo, el caso de uso 1436 puede incluir la detección de objetos de un objeto particular (por ejemplo, una llave de automóvil). El usuario 1452 puede haber perdido la llave del automóvil y puede solicitar la visualización de una primera imagen que incluyó por última vez la llave del automóvil. En un modo de realización particular, el caso de uso 1436 puede corresponder al procesamiento específico de la aplicación. Un primer modelo de clasificación (por ejemplo, el/los modelo(s) de clasificación 1428 de la FIG. 14) puede indicar valores particulares de un subconjunto de rasgos característicos particulares correspondientes al caso de uso 1436. Para ilustrar, el primer modelo de clasificación puede indicar valores particulares de un descriptor de histograma de bordes correspondiente al objeto particular (por ejemplo, la llave del automóvil). El extractor de conjunto de rasgos característicos 1414 puede extraer el subconjunto de rasgos característicos particulares de la imagen a partir de datos sensoriales (por ejemplo, los primeros datos sensoriales 1470). El extractor de conjunto de rasgos característicos 1414 puede determinar que los valores del subconjunto de rasgos característicos particulares de una porción particular de la imagen corresponden a los valores particulares indicados por el primer modelo de clasificación. Una porción de los primeros datos sensoriales 1470 puede corresponder a la porción particular de la imagen. Para ilustrar, la porción particular de la imagen puede incluir el objeto particular (por ejemplo, la llave del automóvil) u otro objeto con una propiedad similar (por ejemplo, la forma). El extractor de conjunto de rasgos característicos 1414 puede generar la región de interés 1478 copiando la porción de los primeros datos sensoriales 1470 correspondientes a la porción particular de la imagen.
[0204] Como otro ejemplo, el extractor de conjunto de rasgos característicos 1414 puede comparar los primeros datos sensoriales 1470 correspondientes a la imagen con otros datos sensoriales correspondientes a una imagen anterior. Por ejemplo, la imagen y la imagen anterior se pueden haber captado durante una reunión. En base a la comparación, el extractor de conjunto de rasgos característicos 1414 puede determinar que una porción de los primeros datos sensoriales 1470 es distinta de los otros datos sensoriales. La porción de los primeros datos sensoriales 1470 puede corresponder a una porción particular de la imagen. Por ejemplo, la porción particular de la imagen puede corresponder a una persona que cambió de posición durante la reunión. El extractor de conjunto de rasgos característicos 1414 puede generar la región de interés 1478 copiando la porción de los primeros datos sensoriales 1470 correspondientes a la porción particular de la imagen.
[0205] El sistema 2000 puede realizar la extracción de rasgos característicos (por ejemplo, la extracción del conjunto de rasgos característicos 2, la extracción del conjunto de rasgos característicos N, o ambos), usando la región de interés 1478. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 puede extraer un primer subconjunto de rasgos característicos de la región de interés 1478, como se describe adicionalmente con referencia a la FIG. 14.
[0206] En un modo de realización particular, el primer dispositivo de procesamiento 304 de la FIG. 3 puede generar primeras estadísticas de imagen que indican la región de interés 1478 o que indican una ausencia de la región de interés 1478 en los primeros datos sensoriales 1470. El dispositivo de procesamiento de estadísticas 108 puede determinar que se satisface un criterio de extracción en base a la determinación de que las primeras estadísticas de imagen indican la región de interés 1478 y puede proporcionar la porción de los primeros datos sensoriales 1470 correspondientes a la región de interés 1478 al segundo dispositivo de procesamiento 310 en base a la determinación de que se satisface el criterio de extracción.
[0207] Por tanto, se pueden extraer, agrupar y clasificar subconjuntos de rasgos característicos de la región de interés 1478 de la imagen para identificar un contexto de la imagen. El análisis (por ejemplo, la extracción de rasgos característicos adicionales para) de la región de interés 1478, en comparación con la imagen completa, puede conservar los recursos del dispositivo 1402.
[0208] En referencia a la FIG. 21, se divulga un modo de realización ilustrativo particular de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 2100. Una o más operaciones del sistema 2100 se pueden realizar por el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG. 4, el circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514, el procesador de aplicaciones 518 de la FIG. 5, el circuito de preprocesamiento 604, el uno o más procesadores adicionales 622, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708 de la FIG. 7, el analizador de activación 814, el analizador de desactivación 816, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el AP SS 910, el uno o más procesadores 912 de la FIG. 9, el motor de determinación contextual 1380 de la FIG. 13, el dispositivo 1402 de la FIG. 14, o una combinación de los mismos.
[0209] Los componentes del sistema 2100 pueden funcionar de manera similar a los componentes correspondientes del sistema 2000 de la FIG. 20. El sistema 2100 puede realizar la agrupación de conjuntos de rasgos característicos 1606 combinando un primer subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442) extraído de una región de interés (por ejemplo, la región de interés 1478) con rasgos característicos previamente calculados (por ejemplo, los rasgos característicos previamente calculados 2102). Por ejemplo, el agrupador de conjunto de rasgos característicos 1416 de la FIG. 14 puede agrupar el primer subconjunto de rasgos característicos y los rasgos característicos previamente calculados 2102. Para ilustrar, la región de interés 1478 puede corresponder a una porción particular de la imagen que cambió en comparación con una imagen anterior y los rasgos característicos previamente calculados 2102 pueden corresponder a una porción restante de la imagen
que permaneció sin cambios en comparación con la imagen anterior. Por ejemplo, los rasgos característicos previamente calculados 2102 se pueden haber extraído previamente cuando se analizó la imagen anterior. El agrupador de conjunto de rasgos característicos 1416 de la FIG. 14 puede agrupar el primer subconjunto de rasgos característicos, los rasgos característicos previamente calculadas 2102 y otro subconjunto de rasgos característicos de una segunda imagen, como se describe adicionalmente con referencia a la FIG. 14.
[0210] El uso de los rasgos característicos previamente calculados 2102, en comparación con la extracción de los rasgos característicos correspondientes a la imagen completa, puede conservar los recursos del dispositivo 1402. Además, la agrupación de los rasgos característicos previamente calculados 2102 y la región de interés 1478 para su clasificación puede mejorar el análisis de clasificación en comparación con la agrupación de la región de interés 1478 solo.
[0211] En referencia a la FIG. 22, se divulga un diagrama de un modo de realización ilustrativo particular de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 2200. Una o más operaciones del sistema 2200 se pueden realizar por el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG. 4, el circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514, el procesador de aplicaciones 518 de la FIG. 5, el circuito de preprocesamiento 604, el uno o más procesadores adicionales 622, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708 de la FIG. 7, el analizador de activación 814, el analizador de desactivación 816, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el AP SS 910, el uno o más procesadores 912 de la FIG. 9, el motor de determinación contextual 1380 de la FIG. 13, el dispositivo 1402 de la FIG. 14, o una combinación de los mismos.
[0212] El sistema 2200 puede incluir un sensor de imagen 2208 (por ejemplo, uno o más de los sensores de imagen, tales como la cámara 302 de la FIG. 3, el sensor 402 de la FIG. 4, el sensor 502 de la FIG. 5, el sensor 602 de la FIG.
6, la cámara 842 de la FIG. 8, la una o más cámaras 1210 de la FIG. 12, el uno o más sensores 1360 de la FIG. 13, el primer sensor de imagen 1404 o el N-ésimo sensor de imagen 1440 de la FIG. 14) acoplado a, o en comunicación con, el detector de cambio de escena 1460 por medio de la memoria 1408. En un aspecto particular, la memoria 1408 puede corresponder a la memoria 306 de la FIG. 3.
[0213] La memoria 1408 puede incluir una memoria intermedia de imagen de baja/alta resolución 2214, una primera memoria intermedia de imagen de alta resolución 2216, una segunda memoria intermedia de imagen de alta resolución 2218, o cualquier combinación de las mismas. Cada una de las memorias intermedias de imagen puede tener un tamaño de memoria distinto y puede tener un tiempo de acceso a memoria distinto. Por ejemplo, la segunda memoria intermedia de imagen de alta resolución 2218 puede tener un mayor tamaño de memoria y puede tener un mayor tiempo de acceso a la memoria que la primera memoria intermedia de imagen de alta resolución 2216 y la primera memoria intermedia de imagen de alta resolución 2216 puede tener un mayor tamaño de memoria y puede tener un mayor tiempo de acceso a la memoria que la memoria intermedia de imagen de baja/alta resolución 2214.
[0214] La memoria 1408 se puede acoplar a, o estar en comunicación con el detector de cambio de escena 1460 por medio de un filtro 2222. El primer sensor de imagen 1404 se puede acoplar a, o estar en comunicación con, la lógica de disparo 2202. La lógica de disparo 2202 se puede acoplar a, o estar en comunicación con, un contador 2204. El detector de cambio de escena 1460 puede incluir, se puede acoplar a, o estar en comunicación con, un almacenamiento local 2228. En un modo de realización particular, el sistema 2200 puede corresponder a un dominio de potencia siempre encendido del dispositivo 1402.
[0215] Durante el funcionamiento, la lógica de disparo 2202 puede enviar una solicitud de captación de imagen (por ejemplo, la primera solicitud de captación de imagen 1472) al primer sensor de imagen 1404. En un modo de realización particular, la lógica de disparo 2202 puede enviar la primera solicitud de captación de imagen 1472 en respuesta a una o más notificaciones de acontecimientos asíncronos (por ejemplo, la(s) notificación/notificaciones de acontecimientos asíncronos 2206). La(s) notificación/notificaciones de acontecimientos asíncronos 2206 puede(n) incluir una notificación con respecto a la disponibilidad de recursos, una entrada de usuario, una proximidad de usuario, una señal de radiofrecuencia, una señal electromagnética, una señal mecánica, una señal de sistema microelectromecánico (MEMS), otra información de contexto, o cualquier combinación de los mismos. Por ejemplo, la(s) notificación/notificaciones de acontecimientos asíncronos 2206 pueden incluir una notificación con respecto a la disponibilidad de recursos. La lógica de disparo 2202 puede enviar la primera solicitud de captación de imagen 1472 en respuesta a la notificación con respecto a la disponibilidad de recursos. Para ilustrar, la lógica de disparo 2202 puede enviar la primera solicitud de captación de imagen 1472 en respuesta a la determinación de que la disponibilidad de recursos satisface un presupuesto de recursos (por ejemplo, el presupuesto de recursos 1420), una preferencia de usuario (por ejemplo, la(s) preferencia(s) de usuario 1422), o ambos.
[0216] Como otro ejemplo, la(s) notificación/notificaciones de acontecimientos asíncronos 2206 puede(n) incluir una notificación con respecto a la entrada de usuario (por ejemplo, la entrada de usuario 1430). La entrada de usuario 1430 puede corresponder a una solicitud de usuario para captar la imagen. La lógica de disparo 2202 puede enviar la
primera solicitud de captación de imagen 1472 en respuesta a la notificación con respecto a la entrada de usuario 1430.
[0217] En un modo de realización particular, la lógica de disparo 2202 puede enviar la primera solicitud de captación de imagen 1472 en respuesta a un valor de un contador 2204. Por ejemplo, el contador 2204 puede indicar que ha transcurrido una duración particular desde una captación de imagen previa. La lógica de disparo 2202 puede enviar la primera solicitud de captación de imagen 1472 al primer sensor de imagen 1404 en respuesta a la determinación de que la duración particular satisface una duración de captación de imagen umbral (por ejemplo, la(s) duración/duraciones umbral 1480), como se describe adicionalmente con referencia a la FIG. 14.
[0218] En respuesta a la recepción de la primera solicitud de captación de imagen 1472, el primer sensor de imagen 1404 puede enviar datos de imagen sin procesar de alta resolución 2220 a la memoria 1408. En un modo de realización particular, los datos de imagen sin procesar de alta resolución 2220 pueden corresponder a los primeros datos sensoriales 1470 de la FIG. 14. La memoria 1408 puede almacenar los datos de imagen sin procesar de alta resolución 2220 en una memoria intermedia de imagen (por ejemplo, la memoria intermedia de imagen de baja/alta resolución 2214, la primera memoria intermedia de imagen de alta resolución 2216, la segunda memoria intermedia de imagen de alta resolución 2218, o cualquier combinación de las mismas). La memoria 1408 puede enviar (o hacer accesible) los datos de imagen sin procesar de alta resolución 2220 al filtro 2222.
[0219] El filtro 2222 puede generar datos de imagen sin procesar de baja resolución 2226 a partir de los datos de imagen sin procesar de alta resolución 2220. Por ejemplo, los datos de imagen sin procesar de baja resolución 2226 pueden corresponder a menos píxeles de imagen que los datos de imagen sin procesar de alta resolución 2220. En un modo de realización particular, se puede generar un valor de los datos de imagen sin procesar de baja resolución 2226 correspondientes a un píxel particular a partir de los valores de los datos de imagen sin procesar de alta resolución 2220 correspondientes a múltiples (por ejemplo, cuatro) píxeles. Por ejemplo, el valor correspondiente al píxel particular puede ser un promedio de los valores correspondientes a los múltiples píxeles.
[0220] El filtro 2222 puede enviar (o hacer accesible) los datos de imagen sin procesar de baja resolución 2226 al detector de cambio de escena 1460. El detector de cambio de escena 1460 puede almacenar los datos de imagen sin procesar de baja resolución 2226 en el almacenamiento local 2228. En un modo de realización particular, el filtro 2222 puede enviar (o hacer accesible) los datos de imagen sin procesar de baja resolución 2226 al almacenamiento local 2228. El detector de cambio de escena 1460 puede comparar los datos de imagen sin procesar de baja resolución 2226 con otros datos de imagen correspondientes a una imagen captada previamente. En base a la comparación, el detector de cambio de escena 1460 puede determinar si los datos de imagen sin procesar de baja resolución 2226 indican un cambio de escena, en 2226. Por ejemplo, el detector de cambio de escena 1460 puede dividir la imagen y la imagen captada previamente en bloques (por ejemplo, bloques 3x3). El detector de cambio de escena 1460 puede determinar una diferencia entre una porción de los primeros datos sensoriales 1470 (por ejemplo, los datos de imagen sin procesar de baja resolución 2226) asociados a cada bloque de la imagen con una porción de datos sensoriales (por ejemplo, los otros datos de imagen) asociados a un bloque correspondiente de la imagen captada previamente. Por ejemplo, el detector de cambio de escena 1460 puede determinar una media de la diferencia absoluta entre las porciones de la imagen y la imagen captada previamente. El detector de cambio de escena 1460 puede comparar la diferencia (por ejemplo, la media) con una diferencia de imagen umbral para determinar si los primeros datos sensoriales 1470 (por ejemplo, los datos de imagen sin procesar de baja resolución 2226) indican un cambio de escena.
[0221] En respuesta a la determinación de que los datos de imagen sin procesar de baja resolución 2226 no indican un cambio de escena, el sistema 2200 puede esperar un siguiente disparo, en 2242. Por ejemplo, el clasificador de contenido multimedia 1412 de la FIG. 14 puede esperar a que la lógica de disparo 2202 reciba otra notificación de acontecimiento asíncrono 2206 u otro valor del contador 2204.
[0222] En respuesta a la determinación de que los datos de imagen sin procesar de baja resolución 2226 indican un cambio de escena, en 2226, el sistema 2200 puede funcionar como se describe adicionalmente con referencia a la FIG. 23. En un modo de realización particular, el filtro 2222 se puede incluir en el primer dispositivo de procesamiento 304 de la FIG. 3 y el detector de cambio de escena 1460 se puede incluir en el dispositivo de procesamiento de estadísticas 108 de la FIG. 1. Por ejemplo, los datos de imagen sin procesar de baja resolución 2226 pueden corresponder a las primeras estadísticas de imagen. El detector de cambio de escena 1460 puede determinar que se satisface un criterio de extracción en base a la determinación de que los datos de imagen sin procesar de baja resolución 2226 indican el cambio de escena.
[0223] En un modo de realización particular, la memoria 1408 puede recibir una solicitud de datos de imagen 2238, como se describe adicionalmente con referencia a la FIG. 24. En respuesta a la solicitud de datos de imagen 2238, la memoria 1408 puede emitir los datos de imagen 2240, como se describe adicionalmente con referencia a la FIG. 24. Los datos de imagen 2240 pueden corresponder a los datos de imagen sin procesar de alta resolución 2220.
[0224] El filtro 2222 se puede usar para generar datos de imagen de baja resolución cuando el primer sensor de imagen 1404 genera datos de imagen de alta resolución. Los datos de imagen de baja resolución se pueden analizar
por el detector de cambio de escena 1460 para determinar si continúa con un análisis de los datos de imagen de alta resolución. Hacer que el detector de cambio de escena 1460 analice los datos de imagen de baja resolución, en comparación con los datos de imagen de alta resolución, puede conservar los recursos del dispositivo 1402.
[0225] En referencia a la FIG. 23, se divulga un modo de realización ilustrativo particular de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 2300. El sistema 2300 se puede acoplar al sistema 2200 de la FIG. 22. Una o más operaciones del sistema 2300 se pueden realizar por el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG.
4, el circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514, el procesador de aplicaciones 518 de la FIG. 5, el circuito de preprocesamiento 604, el uno o más procesadores adicionales 622, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708 de la FIG. 7, el analizador de activación 814, el analizador de desactivación 816, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el AP SS 910, el uno o más procesadores 912 de la FIG. 9, el motor de determinación contextual 1380 de la FIG.
13, el dispositivo 1402 de la FIG. 14, o una combinación de los mismos.
[0226] El sistema 2300 puede incluir el detector de imagen borrosa 1462 de la FIG. 14. El detector de imagen borrosa 1462 puede incluir, se puede acoplar a, o estar en comunicación con, el almacenamiento local 2306.
[0227] Durante el funcionamiento, el sistema 2300 puede activar un primer dominio de potencia del dispositivo 1402, en 2302. Por ejemplo, el clasificador de contenido multimedia 1412 puede activar el primer dominio de potencia en respuesta al detector de cambio de escena 1460 que determina que los datos de imagen (por ejemplo, los datos de imagen sin procesar de baja resolución 2226) corresponden a un cambio de escena, como se describe adicionalmente con referencia a la FIG. 22. Como otro ejemplo, el dispositivo de procesamiento de estadísticas 108 puede activar un primer dominio de potencia del segundo dispositivo de procesamiento 310 en base a la determinación de que se satisface un criterio de extracción (por ejemplo, se detecta un cambio de escena).
[0228] El detector de imagen borrosa 1462 puede recibir los datos de imagen sin procesar de baja resolución de 2226. Por ejemplo, el detector de imagen borrosa 1462 puede recibir los datos de imagen sin procesar de baja resolución 2226 desde el filtro 2222. El detector de imagen borrosa 1462 puede almacenar los datos de imagen sin procesar de baja resolución 2226 en el almacenamiento local 2306. El detector de imagen borrosa 1462 puede determinar si los datos de imagen sin procesar de baja resolución 2226 indican que la imagen está borrosa, en 2308. Por ejemplo, el detector de imagen borrosa 1462 puede determinar si los datos de imagen sin procesar de baja resolución 2226 indican que la nitidez de la imagen satisface un nivel de nitidez umbral (por ejemplo, el nivel de nitidez umbral 1484). Para ilustrar, el detector de imagen borrosa 1462 puede determinar que los datos de imagen sin procesar de baja resolución 2226 indican una imagen borrosa en base a la determinación de que los datos de imagen sin procesar de baja resolución 2226 indican que la nitidez de la imagen no logra satisfacer el nivel de nitidez umbral 1484. El detector de imagen borrosa 1462 puede determinar de forma alternativa que los datos de imagen sin procesar de baja resolución 2226 no indican una imagen borrosa en base a la determinación de que los datos de imagen sin procesar de baja resolución 2226 indican que la nitidez de la imagen satisface el nivel de nitidez umbral 1484.
[0229] En respuesta al detector de imagen borrosa 1462 que determina que los datos de imagen sin procesar de baja resolución 2226 indican que la imagen está borrosa, en 2308, el sistema 2300 puede desactivar el primer dominio de potencia del dispositivo 1402, en 2310. Por ejemplo, el clasificador de contenido multimedia 1412 puede desactivar el primer dominio de potencia del dispositivo 1402 en respuesta a que el detector de imagen borrosa 1462 determine que los datos de imagen sin procesar de baja resolución 2226 indican que la imagen está borrosa. En un modo de realización particular, el dispositivo de procesamiento de estadísticas 108, el segundo dispositivo de procesamiento 310, o ambos, pueden incluir el detector de imagen borrosa 1462. El dispositivo de procesamiento de estadísticas 108 o el segundo dispositivo de procesamiento 310 puede desactivar el primer dominio de potencia del dispositivo de procesamiento de estadísticas 108 en base a que el detector de imagen borrosa 1462 determine que los datos de imagen sin procesar de baja resolución 2226 indican que la imagen está borrosa.
[0230] En respuesta a que el detector de imagen borrosa 1462 determine que los datos de imagen sin procesar de baja resolución 2226 indican que la imagen no está borrosa, en 2308, el sistema 2300 puede funcionar como se describe con referencia a la FIG. 26.
[0231] Por tanto, el primer dominio de potencia del dispositivo 1402 ilustrado en la FIG. 23 puede permanecer desactivado cuando la imagen no corresponde a un cambio de escena, conservando los recursos del dispositivo 1402. Además, los datos de imagen de baja resolución se pueden analizar por el detector de imagen borrosa 1462 para determinar si continúa con un análisis de los datos de imagen de alta resolución. Hacer que el detector de imagen borrosa 1462 analice los datos de imagen de baja resolución, en comparación con los datos de imagen de alta resolución, también puede conservar los recursos del dispositivo 1402.
[0232] En referencia a la FIG. 24, se divulga un modo de realización ilustrativo particular de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 2400. El sistema 2400 se puede acoplar a, o
estar en comunicación con, el sistema 2200 de la FIG. 22, el sistema 2300 de la FIG. 12, o ambos. Una o más operaciones del sistema 2400 se pueden realizar por el dispositivo de procesamiento de estadísticas 108 de la FIG.
1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG. 4, el circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514, el procesador de aplicaciones 518 de la FIG. 5, el circuito de preprocesamiento 604, el uno o más procesadores adicionales 622, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708 de la FIG. 7, el analizador de activación 814, el analizador de desactivación 816, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el AP SS 910, el uno o más procesadores 912 de la FIG. 9, el motor de determinación contextual 1380 de la FIG. 13, el dispositivo 1402 de la FIG. 14, o una combinación de los mismos.
[0233] Durante el funcionamiento, el sistema 2400 puede activar un segundo dominio de potencia del dispositivo 1402, en 2402. Por ejemplo, el clasificador de contenido multimedia 1412 puede activar el segundo dominio de potencia en respuesta a que el detector de imagen borrosa 1462 determine que los datos de imagen sin procesar de baja resolución 2226 indican que la imagen no está borrosa, como se describe adicionalmente con referencia a la FIG. 23.
[0234] En un modo de realización particular, el dispositivo de procesamiento de estadísticas 108 de la FIG. 1 o el segundo dispositivo de procesamiento 310 de la FIG. 3 puede activar un segundo dominio de potencia del segundo dispositivo de procesamiento 310 en base a que el detector de imagen borrosa 1462 determine que los datos de imagen sin procesar de baja resolución 2226 indican que la imagen no está borrosa, como se describe adicionalmente con referencia a la FIG. 23.
[0235] El sistema 2400 puede emitir una solicitud de datos de imagen (por ejemplo, la solicitud de datos de imagen 2238 de la FIG. 22), en 2402. Por ejemplo, el clasificador de contenido multimedia 1412 puede emitir la solicitud de datos de imagen 2238 a la memoria 1408, como se describe adicionalmente con referencia a la FIG. 22, en respuesta a que el detector de imagen borrosa 1462 determine que los datos de imagen sin procesar de baja resolución 2226 indican que la imagen no está borrosa. En un modo de realización particular, el segundo dispositivo de procesamiento 310 puede emitir la solicitud de datos de imagen a la memoria 306 en base a que el detector de imagen borrosa 1462 determine que los datos de imagen sin procesar de baja resolución 2226 indican que la imagen no está borrosa.
[0236] El sistema 2400 puede recibir datos de imagen (por ejemplo, los datos de imagen 2240) y puede realizar el cálculo de rasgos característicos 2404. Por ejemplo, la memoria 1408 puede emitir los datos de imagen 2240 al clasificador de contenido multimedia 1412 en respuesta a la solicitud de datos de imagen 2238), como se describe adicionalmente con referencia a la FIG. 22. Los datos de imagen 2240 pueden corresponder a los datos de imagen sin procesar de alta resolución 2220. El extractor de conjunto de rasgos característicos 1414 puede extraer un primer subconjunto de rasgos característicos de los datos de imagen sin procesar de alta resolución 2220, como se describe adicionalmente con referencia a la FIG. 14. En un modo de realización particular, el segundo dispositivo de procesamiento 310 puede realizar un procesamiento específico de la aplicación en datos de imagen sin procesar de alta resolución recibidos desde la memoria 306. Por ejemplo, el segundo dispositivo de procesamiento 310 puede activar dominios de potencia posteriores correspondientes a etapas particulares del procesamiento específico de la aplicación. Para ilustrar, el segundo dominio de potencia puede corresponder al segundo procesador de aplicaciones 706 de la FIG. 7 y un dominio de potencia posterior puede corresponder al Mésimo procesador de aplicaciones 708.
[0237] El sistema 2400 puede realizar la agrupación de rasgos característicos 1606 y puede realizar la clasificación de conjunto de rasgos característicos 1608, como se describe adicionalmente con referencia a la FIG. 16. El sistema 2400 puede determinar si los niveles de confianza asociados al primer subconjunto de rasgos característicos son altos, en 2406. En un modo de realización particular, la operación 1306 puede corresponder a la operación 1622 de la FIG.
16. Por ejemplo, el clasificador de contenido multimedia 1412 puede determinar si los niveles de confianza asociados a un primer subconjunto clasificado de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos clasificados 1474) satisfacen un nivel de confianza umbral (por ejemplo, el nivel de confianza umbral 1482), como se describe adicionalmente con referencia a la FIG. 14.
[0238] En respuesta a la determinación de que el nivel de confianza no es alto (por ejemplo, no satisface un umbral numérico (por ejemplo, un 75 %) que represente "alta" confianza), en 2406, el sistema 2400 puede realizar el cálculo de un rasgo característico adicional 2404 (por ejemplo, MPEG-7, GIST, CENTRIST, etc.). Por ejemplo, el extractor de conjunto de rasgos característicos 1414 puede extraer un segundo subconjunto de rasgos característicos de los datos de imagen 2240, como se describe adicionalmente con referencia a la FIG. 24.
[0239] En respuesta a la determinación de que el nivel de confianza es alto, en 2406, el sistema 2400 puede proceder a emitir datos de entorno visual, en 2408. Por ejemplo, el clasificador de contenido multimedia 1412 puede generar datos de contexto (por ejemplo, los datos de contexto 1490), como se describe con referencia a la FIG. 14. El clasificador de contenido multimedia 1412 puede iniciar la visualización de los datos de contexto 1490 en la pantalla 1406.
[0240] El sistema 2400 puede desactivar el segundo dominio de potencia, en 2410. Por ejemplo, el clasificador de contenido multimedia 1412 puede desactivar el segundo dominio de potencia del dispositivo 1402. En un modo de realización particular, el segundo dispositivo de procesamiento 310 puede desactivar el segundo dominio de potencia del segundo dispositivo de procesamiento 310.
[0241] Por tanto, el segundo dominio de potencia del dispositivo 1402, ilustrado en la FIG. 24, puede permanecer desactivado cuando la imagen no corresponde a un cambio de escena o cuando la imagen está borrosa, conservando de este modo los recursos del dispositivo 1402.
[0242] En referencia a la FIG. 25, se divulga un modo de realización ilustrativo particular de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 2500. El sistema 2500 se puede acoplar al sistema 2400 de la FIG. 24. Una o más operaciones del sistema 2500 se pueden realizar por el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG.
4, el circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514, el procesador de aplicaciones 518 de la FIG. 5, el circuito de preprocesamiento 604, el uno o más procesadores adicionales 622, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708 de la FIG. 7, el analizador de activación 814, el analizador de desactivación 816, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el AP SS 910, el uno o más procesadores 912 de la FIG. 9, el motor de determinación contextual 1380 de la FIG.
13, el dispositivo 1402 de la FIG. 14, o una combinación de los mismos.
[0243] Los componentes del sistema 2500 pueden funcionar de manera similar a los componentes correspondientes del sistema 2200 de la FIG. 22. El sistema 2500 puede incluir un sensor de imagen y filtro 2502. El sensor de imagen y filtro 2502 puede ser una combinación de un sensor de imagen (por ejemplo, uno o más de los sensores de imagen del dispositivo 1402 de la FIG. 14, tal como el primer sensor de imagen 1404, el N-ésimo sensor de imagen 1440 de la FIG. 14, o ambos) y un filtro (por ejemplo, el filtro 2222 de la FIG. 22).
[0244] El sensor de imagen y filtro 2502 puede generar datos de imagen sin procesar 2504. Los datos de imagen sin procesar 2504 pueden corresponder a los primeros datos sensoriales 1470 de la FIG. 14. Los datos de imagen sin procesar 2504 pueden incluir datos de imagen de baja resolución (por ejemplo, los datos de imagen sin procesar de baja resolución 2226), datos de imagen de alta resolución (por ejemplo, los datos de imagen sin procesar de alta resolución 2220), o ambos. En un modo de realización particular, el primer dispositivo de procesamiento 304 y la cámara 302 de la FIG. 3 puede corresponder al sensor de imagen y filtro 2502 y los datos de imagen sin procesar 2504 pueden corresponder a las primeras estadísticas de imagen proporcionadas por el primer dispositivo de procesamiento 304 de la FIG. 3 al dispositivo de procesamiento de estadísticas 108.
[0245] En un modo de realización particular, el sensor de imagen y filtro 2502 puede generar los datos de imagen sin procesar de alta resolución 2220 en respuesta a la primera solicitud de captación de imagen 1472 que indica que se van a captar datos de imagen de alta resolución. Por ejemplo, el clasificador de contenido multimedia 1412 puede indicar una resolución solicitada en la primera solicitud de captación de imagen 1472. En un modo de realización particular, el sensor de imagen y filtro 2502 puede captar los datos de imagen sin procesar de baja resolución 2226 usando uno o más de los sensores de imagen del dispositivo 1402 (por ejemplo, el primer sensor de imagen 1404 o el N-ésimo sensor de imagen 1440) y puede captar los datos de imagen sin procesar de alta resolución 2220 usando otro de los sensores de imagen del dispositivo 1402 (por ejemplo, el otro del primer sensor de imagen 1404 y el N-ésimo sensor de imagen 1440 u otro sensor de imagen).
[0246] Los datos de imagen 2240 pueden corresponder a los datos de imagen sin procesar 2504. Por ejemplo, los datos de imagen 2240 pueden incluir los datos de imagen sin procesar de baja resolución 2226, los datos de imagen sin procesar de alta resolución 2220, o ambos.
[0247] La memoria 1408 puede emitir los datos de imagen sin procesar 2504, como se describe adicionalmente con referencia a la FIG. 26. La memoria 308 puede enviar los datos de imagen sin procesar 2504 al detector de cambio de escena 1460. En un modo de realización particular, la memoria 1408 puede emitir los datos de imagen sin procesar 2504 al almacenamiento local 2228. El detector de cambio de escena 1460 puede determinar si los datos de imagen sin procesar 2504 indican un cambio de escena, en 2226, como se describe adicionalmente con referencia a la FIG.
14.
[0248] En respuesta a que el detector de cambio de escena 1460 determine que los datos de imagen sin procesar 2504 indican un cambio de escena, el sistema 2500 puede realizar operaciones como se describe adicionalmente con referencia a la FIG. 26.
[0249] Por tanto, el sensor de imagen y filtro 2502 puede generar datos de imagen que tienen diversas resoluciones. Generar solo los datos de imagen de baja resolución puede conservar los recursos del dispositivo 1402, mientras que generar los datos de imagen de alta resolución puede mejorar los niveles de confianza asociados a los datos de contexto generados a partir de los datos de imagen.
[0250] En referencia a la FIG. 26, se divulga un modo de realización ilustrativo particular en diagrama de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 2600. El sistema 2600 se puede acoplar al sistema 2400 de la FIG. 24, el sistema 2500 de la FIG. 25, o ambos. Una o más operaciones del sistema 2600 se pueden realizar por el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG. 4, el circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514, el procesador de aplicaciones 518 de la FIG. 5, el circuito de preprocesamiento 604, el uno o más procesadores adicionales 622, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708 de la FIG. 7, el analizador de activación 814, el analizador de desactivación 816, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el AP SS 910, el uno o más procesadores 912 de la FIG. 9, el motor de determinación contextual 1380 de la FIG. 13, el dispositivo 1402 de la FIG. 14, o una combinación de los mismos.
[0251] Los componentes del sistema 2600 pueden funcionar de manera similar a los componentes correspondientes del sistema 2300 de la FIG. 23. El detector de imagen borrosa 1462 puede recibir datos de imagen sin procesar (por ejemplo, los datos de imagen sin procesar 2504) desde la memoria 1408, como se describe adicionalmente con referencia a la FIG. 25. Por ejemplo, el detector de imagen borrosa 1462 puede recibir los datos de imagen sin procesar 2504 desde la memoria 1408.
[0252] En respuesta al detector de imagen borrosa 1462 que determina que los datos de imagen sin procesar 2504 indican que la imagen no está borrosa, en 2308, el sistema 2500 puede realizar operaciones como se describe adicionalmente con referencia a la FIG. 24.
[0253] Por tanto, el primer dominio de potencia del dispositivo 1402 puede permanecer desactivado cuando la imagen no corresponde a un cambio de escena, conservando los recursos del dispositivo 1402. Además, se pueden analizar los datos de imagen por el detector de imagen borrosa 1462 para determinar si continúa con un análisis (por ejemplo, extracción, agrupamiento o clasificación) de los datos de imagen.
[0254] En referencia a la FIG. 27, se divulga un modo de realización ilustrativo particular de un sistema operativo para identificar un contexto de una imagen y se designa, en general, como 2700. El sistema 2700 se puede acoplar al sistema 2400 de la FIG. 24, el sistema 2600 de la FIG. 26, o ambos. Una o más operaciones del sistema 2700 se pueden realizar por el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el circuito de detección de cambio 414, el procesador de aplicaciones 418 de la FIG. 4, el circuito de selección 506, el analizador de señal 512, el circuito de detección de cambio 514, el procesador de aplicaciones 518 de la FIG. 5, el circuito de preprocesamiento 604, el uno o más procesadores adicionales 622, el segundo procesador de aplicaciones 706, el Mésimo procesador de aplicaciones 708 de la FIG. 7, el analizador de activación 814, el analizador de desactivación 816, el detector de objetos 850, el identificador de objetos 852, el clasificador de actividad 854, el controlador del sistema 806 de la FIG. 8, la VFE-Lite 904, el LPCVSS 906, el LPASS 908, el AP SS 910, el uno o más procesadores 912 de la FIG. 9, el motor de determinación contextual 1380 de la FIG. 13, el dispositivo 1402 de la FIG. 14, o una combinación de los mismos.
[0255] Los componentes del sistema 2700 pueden funcionar de manera similar a los componentes correspondientes del sistema 2500 de la FIG. 25. El sistema 2700 puede incluir un sensor de imagen, filtro y detector de cambio de escena 2702. El sensor de imagen, filtro y detector de cambio de escena 2702 puede ser una combinación de un sensor de imagen (por ejemplo, uno o más sensores de imagen del dispositivo 1402 de la FIG. 14, tal como el primer sensor de imagen 1404, el N-ésimo sensor de imagen 1440, o ambos), un detector de cambio de escena (por ejemplo, el detector de cambio de escena 1460 de la FIG. 14) y un filtro (por ejemplo, el filtro 2222 de la FIG. 22).
[0256] En un modo de realización particular, la cámara 302, el primer dispositivo de procesamiento 304 de la FIG. 3, y el dispositivo de procesamiento de estadísticas 108 de la FIG. 1 puede corresponder al sensor de imagen, filtro y detector de cambio de escena 2702. El dispositivo de procesamiento de estadísticas 108 puede proporcionar la notificación de cambio de escena 2704 y los datos de imagen sin procesar 2504 al segundo dispositivo de procesamiento 310 de la FIG. 3. El sensor de imagen, filtro y detector de cambio de escena 2702 pueden generar datos de imagen sin procesar 2504. El sensor de imagen, filtro y detector de cambio de escena 2702 también puede generar una notificación de cambio de escena 2704. El sensor de imagen, filtro y detector de cambio de escena 2702 puede generar la notificación de cambio de escena 2704 en respuesta a la determinación de que la imagen corresponde a un cambio de escena, como se describe adicionalmente con referencia a la FIG. 14. El sensor de imagen, filtro y detector de cambio de escena 2702 pueden emitir la notificación de cambio de escena 2704. Por ejemplo, el sistema 2700 puede realizar operaciones como se describe adicionalmente con referencia a la FIG. 26 en respuesta a la notificación de cambio de escena 2704.
[0257] En referencia a la FIG. 28, se muestra un gráfico de barras que ilustra un ejemplo de tiempos de ejecución asociados a la extracción de diversos subconjuntos de rasgos característicos de imágenes de prueba y se designa, en general, como 2800. En un modo de realización particular, los diversos subconjuntos de rasgos característicos se pueden extraer por el extractor de rasgos característicos 1414 de la FIG. 14.
[0258] El gráfico de barras 2800 ilustra los tiempos de ejecución asociados a la extracción de diversos subconjuntos de rasgos característicos a partir de los datos sensoriales asociados a cada una de las múltiples imágenes de prueba (por ejemplo, las imágenes de prueba 1 -4). Por ejemplo, cada imagen de prueba puede tener una resolución de barrido progresivo de 1080 (1080p). Un primer subconjunto de rasgos característicos incluye un rasgo característico de prueba 1, un rasgo característico de prueba 2 y un rasgo característico de prueba 3. Un segundo subconjunto de rasgos característicos incluye el primer subconjunto de rasgos característicos y un rasgo característico de prueba 4. Un tercer subconjunto de rasgos característicos incluye el segundo subconjunto de rasgos característicos y un rasgo característico de prueba 5. Un cuarto subconjunto de rasgos característicos incluye el tercer subconjunto de rasgos característicos y un rasgo característico de prueba 6. En un modo de realización particular, el rasgo característico de prueba 1 puede corresponder a un descriptor de disposición de colores, el rasgo característico de prueba 2 puede corresponder a un descriptor de textura homogénea, el rasgo característico de prueba 3 puede corresponder a un descriptor de histograma de bordes, el rasgo característico de prueba 4 puede corresponder a un descriptor de estructura de colores, el rasgo característico de prueba 5 puede corresponder a un descriptor de colores escalables, y el rasgo característico de prueba 6 puede corresponder a un descriptor de colores dominantes.
[0259] El gráfico de barras 2800 incluye una barra 2802 correspondiente a un tiempo de ejecución de unos cientos de milisegundos asociados a la extracción del primer subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 1. El gráfico de barras 2800 incluye una barra 2812 correspondiente a un tiempo de ejecución de aproximadamente un segundo asociado a la extracción del primer subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 2. El gráfico de barras 2800 incluye una barra 2822 correspondiente a un tiempo de ejecución de aproximadamente un segundo asociado a la extracción del primer subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 3. El gráfico de barras 2800 incluye una barra 2832 correspondiente a un tiempo de ejecución de aproximadamente un segundo asociado a la extracción del primer subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 4.
[0260] El gráfico de barras 2800 incluye una barra 2804 correspondiente a un tiempo de ejecución de extracción del segundo subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 1 y es aproximadamente el doble del tiempo de ejecución de la extracción del primer subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 1. El gráfico de barras 2800 incluye una barra 2814 correspondiente a un tiempo de ejecución de aproximadamente 2 segundos asociado a la extracción del segundo subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 2. El gráfico de barras 2800 incluye una barra 2824 correspondiente a un tiempo de ejecución de aproximadamente 2 segundos asociado a la extracción del segundo subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 3. El gráfico de barras 2800 incluye una barra 2834 correspondiente a un tiempo de ejecución de aproximadamente 2 segundos asociado a la extracción del segundo subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 4.
[0261] El gráfico de barras 2800 incluye una barra 2806 correspondiente a un tiempo de ejecución de medio segundo asociado a la extracción del tercer subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 1. El gráfico de barras 2800 incluye una barra 2816 correspondiente a un tiempo de ejecución de aproximadamente 3 segundos asociado a la extracción del tercer subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 2. El gráfico de barras 2800 incluye una barra 2826 correspondiente a un tiempo de ejecución de aproximadamente 3 segundos asociado a la extracción del tercer subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 3. El gráfico de barras 2800 incluye una barra 2836 correspondiente a un tiempo de ejecución de aproximadamente 3 segundos asociado a la extracción del tercer subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 4.
[0262] El gráfico de barras 2800 incluye una barra 2808 correspondiente a un tiempo de ejecución de aproximadamente 3 segundos asociado a la extracción del cuarto subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 1. El gráfico de barras 2800 incluye una barra 2818 correspondiente a un tiempo de ejecución de aproximadamente 36 segundos asociado a la extracción del cuarto subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 2. El gráfico de barras 2800 incluye una barra 2828 correspondiente a un tiempo de ejecución de aproximadamente 33 segundos asociado a la extracción del cuarto subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 3. El gráfico de barras 2800 incluye una barra 2838 correspondiente a un tiempo de ejecución de aproximadamente 38 segundos asociado a la extracción del cuarto subconjunto de rasgos característicos a partir de los datos sensoriales de la imagen de prueba 4.
[0263] Por tanto, los tiempos de ejecución asociados a la extracción de un subconjunto de rasgos característicos varían en base a los descriptores incluidos en el subconjunto. En particular, la extracción del rasgo característico de prueba 6 a partir de los datos sensoriales de las imágenes de prueba 2-4 tarda aproximadamente 30 segundos. Por tanto, la extracción incremental de subconjuntos de rasgos característicos en base a niveles de confianza puede conservar los recursos del dispositivo 1402 ya que es posible que algunos subconjuntos de rasgos característicos no se extraigan para cada imagen.
[0264] En referencia a la FIG. 29, se muestra un gráfico de barras que ilustra un ejemplo del uso de memoria asociado a la extracción de diversos subconjuntos de rasgos característicos de las imágenes de prueba de la FIG. 28 y se designa, en general, como 2900. En un modo de realización particular, los diversos subconjuntos de rasgos característicos se pueden extraer por el extractor de conjunto de rasgos característicos 1414 de la FIG. 14.
[0265] El gráfico de barras 2900 incluye una barra 2902 que indica un uso de memoria de aproximadamente 100 kilobytes asociado a la extracción del primer subconjunto de rasgos característicos, una barra 2904 que indica un uso de memoria de aproximadamente 140 kilobytes asociado a la extracción del segundo subconjunto de rasgos característicos, una barra 2906 que indica un uso de memoria de aproximadamente 200 kilobytes asociado a la extracción del tercer subconjunto de rasgos característicos, y una barra 2908 que indica un uso de memoria de aproximadamente 280 kilobytes asociado a la extracción del cuarto subconjunto de rasgos característicos. En un modo de realización particular, el uso de memoria puede indicar una cantidad de memoria 308 usada por el extractor de conjunto de rasgos característicos 1414.
[0266] Por tanto, el uso de memoria asociado a la extracción de un subconjunto de rasgos característicos varía en base a los descriptores incluidos en el subconjunto. En particular, la extracción del rasgo característico de prueba 4, el rasgo característico de prueba 5 y el rasgo característico de prueba 6 a partir de los datos sensoriales aumenta el uso de memoria en aproximadamente 180 kilobytes. Por tanto, la extracción incremental de subconjuntos de rasgos característicos en base a niveles de confianza puede conservar los recursos del dispositivo 1402 ya que es posible que algunos subconjuntos de rasgos característicos no se extraigan para cada imagen.
[0267] En referencia a la FIG. 30, se muestra un diagrama de flujo de un modo de realización particular de un procedimiento 3000 de reducción del uso de potencia asociado a aplicaciones de visión informática en base a estadísticas de imagen. En un modo de realización ilustrativo, el procedimiento 3000 se puede realizar usando al menos uno de los sistemas, dispositivos y técnicas descritos con respecto a las FIG. 1-29.
[0268] El procedimiento 3000 incluye generar primeras estadísticas de imagen para una primera trama de datos de imagen, en 3002. Por ejemplo, en la FIG. 3, la cámara 302 puede captar la primera trama 102 de la FIG. 1 en el primer tiempo y el primer dispositivo de procesamiento 304 puede generar las primeras estadísticas de imagen para la primera trama 102. El primer dispositivo de procesamiento 304 puede proporcionar las primeras estadísticas de imagen a la memoria 306.
[0269] Se pueden generar segundas estadísticas de imagen para una segunda trama de datos de imagen, en 3004. Por ejemplo, en la FIG. 3, después de captar la primera trama 102, la cámara 302 puede captar la segunda trama 104 de la FIG. 1 en el segundo tiempo, y el primer dispositivo de procesamiento 304 puede generar las segundas estadísticas de imagen para la segunda trama 104. El primer dispositivo de procesamiento 304 puede proporcionar las segundas estadísticas de imagen a la memoria 306. Adicionalmente, el primer dispositivo de procesamiento 304 puede proporcionar la segunda trama 104 y las segundas estadísticas de imagen al dispositivo de procesamiento de estadísticas 108.
[0270] Se puede hacer una determinación de si una primera cantidad de cambio entre las segundas estadísticas de imagen y las primeras estadísticas de imagen satisface un umbral, en 3006. Por ejemplo, en la FIG. 3, el dispositivo de procesamiento de estadísticas 108 puede comparar las segundas estadísticas de imagen con las primeras estadísticas de imagen para determinar si se proporciona la segunda trama 104 al segundo dispositivo de procesamiento 310 para el procesamiento específico de la aplicación en la segunda trama 104. Por ejemplo, el dispositivo de procesamiento de estadísticas 108 puede determinar si una primera cantidad de cambio entre las segundas estadísticas de imagen y las primeras estadísticas de imagen satisface un umbral.
[0271] El procesamiento específico de la aplicación en la segunda trama se puede realizar en respuesta a una determinación de que la primera cantidad de cambio satisface el umbral, en 3008. Por ejemplo, en la FIG. 3, si la cantidad de cambio satisface el umbral, el dispositivo de procesamiento de estadísticas 108 puede proporcionar la segunda trama 104 al segundo dispositivo de procesamiento 310 para el procesamiento específico de la aplicación en la segunda trama 104.
[0272] En un modo de realización particular, el procedimiento 3000 puede incluir omitir o prescindir del procesamiento específico de la aplicación en la segunda trama en respuesta a una determinación de que la primera cantidad de cambio no satisface el umbral. Por ejemplo, en la FIG. 3, si la cantidad de cambio no satisface el umbral, el dispositivo de procesamiento de estadísticas 108 puede determinar conservar potencia y omitir el procesamiento específico de la aplicación de la segunda trama 104.
[0273] En un modo de realización particular, el procedimiento 3000 puede incluir generar terceras estadísticas de imagen para una tercera trama de datos de imagen después de omitir el procesamiento específico de la aplicación de la segunda trama. Por ejemplo, en la FIG. 3, después de captar la segunda trama 104, la cámara 302 puede captar la tercera trama 106 en el tercer tiempo, y el primer dispositivo de procesamiento 304 puede generar las terceras estadísticas de imagen para la tercera trama 106. El primer dispositivo de procesamiento 304 puede proporcionar las
terceras estadísticas de imagen a la memoria 306. En este ejemplo, el procedimiento 3000 puede incluir determinar si una segunda cantidad de cambio entre las terceras estadísticas de imagen y las segundas estadísticas de imagen satisface el umbral. Por ejemplo, en la FIG. 3, si el dispositivo de procesamiento de estadísticas 108 determinó omitir o prescindir del procesamiento específico de la aplicación en la segunda trama 104, el dispositivo de procesamiento de estadísticas 108 puede comparar las segundas estadísticas de imagen con las segundas estadísticas de imagen (o las primeras estadísticas de imagen) para determinar si realizar un procesamiento específico de la aplicación en la tercera trama 106.
[0274] En un modo de realización particular, el procedimiento 3000 puede incluir realizar un procesamiento específico de la aplicación en la tercera trama en respuesta a una determinación de que la segunda cantidad de cambio satisface el umbral. Por ejemplo, en la FIG. 3, si la segunda cantidad de cambio satisface el umbral, el dispositivo de procesamiento de estadísticas 108 puede proporcionar la tercera trama 106 al segundo dispositivo de procesamiento 310 para el procesamiento específico de la aplicación en la tercera trama 106.
[0275] Omitir o prescindir del procesamiento específico de la aplicación en una trama particular que tiene estadísticas de imagen similares a una trama previa puede conservar potencia en los dispositivos electrónicos. Por ejemplo, el procesamiento específico de la aplicación puede utilizar dispositivos de alta potencia dentro de un sistema de procesamiento, tal como un procesador de propósito general o un procesador de gráficos. Al usar dispositivos de baja potencia (por ejemplo, un procesador de señal digital, un circuito integrado específico de la aplicación, etc.), tal como el dispositivo de procesamiento de estadísticas 108 y el primer dispositivo de procesamiento 304, para generar y/o evaluar las estadísticas de cada trama, se puede determinar que las tramas particulares son sustancialmente idénticas y que el procesamiento específico de la aplicación solo se necesita realizar en una de las tramas idénticas. Como resultado, la potencia se puede conservar prescindiendo del procesamiento específico de la aplicación en tramas idénticas o similares.
[0276] En referencia a la FIG. 31, se muestra un diagrama de flujo de un modo de realización ilustrativo particular de un procedimiento de identificación de un contexto de una imagen y se designa, en general, como 3100. El procedimiento 3100 se puede realizar usando al menos uno de los sistemas, dispositivos y técnicas descritos con respecto a las FIGS. 1-29.
[0277] El procedimiento 3100 puede incluir recibir, en un dispositivo móvil, datos sensoriales desde un sensor de imagen, en 3102. Los datos sensoriales pueden estar relacionados con una imagen. Por ejemplo, el dispositivo 1402 de la FIG. 14 puede recibir datos sensoriales (por ejemplo, los primeros datos sensoriales 1470) desde el primer sensor de imagen 1404. Los primeros datos sensoriales 1470 pueden estar relacionados con la segunda trama 104 de la FIG.
1.
[0278] El procedimiento 1300 también puede incluir generar primeras estadísticas de imagen de la imagen en base a los datos sensoriales, en 1304. Se puede satisfacer un criterio de extracción cuando una cantidad de cambio entre las primeras estadísticas de imagen y las segundas estadísticas de imagen de una segunda imagen satisface un umbral de cambio. Por ejemplo, el dispositivo de procesamiento de estadísticas 108 de la FIG. 1 puede generar primeras estadísticas de imagen correspondientes a la segunda trama 104 y puede generar segundas estadísticas de imagen correspondientes a la primera trama 102, como se describe con referencia a la FIG. 1. Se puede satisfacer un criterio de extracción cuando una cantidad de cambio entre las primeras estadísticas de imagen y las segundas estadísticas de imagen satisface un umbral de cambio, como se describe adicionalmente con referencia a la FIG. 14.
[0279] El procedimiento 3100 puede incluir además extraer un primer subconjunto de rasgos característicos de la imagen a partir de los datos sensoriales en base al criterio de extracción que se satisface, en 3106. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 de la FIG. 14 puede extraer un primer subconjunto de rasgos característicos (por ejemplo, uno primero del/de los subconjunto(s) de rasgos característicos 1442 de la FIG. 14) a partir de los primeros datos sensoriales 1470 en base al criterio de extracción que se satisface, como se describe adicionalmente con referencia a la FIG. 14.
[0280] El procedimiento 3100 de la FIG. 31 se puede implementar por un dispositivo de matriz de puertas programables in situ (FPGA), un circuito integrado específico de la aplicación (ASIC), una unidad de procesamiento tal como una unidad de procesamiento central (CPU), un procesador de señales digitales (DSP), un controlador, otro dispositivo de hardware, dispositivo de firmware o cualquier combinación de los mismos. Como ejemplo, el procedimiento 3100 de la FIG. 31 se puede realizar por un procesador que ejecuta instrucciones.
[0281] Por tanto, el procedimiento 3100 puede posibilitar la identificación del contexto de la imagen. La extracción de subconjuntos de rasgos característicos en base a un criterio de extracción puede evitar la extracción de rasgos característicos de una imagen en determinadas situaciones, conservando de este modo los recursos del dispositivo 1402.
[0282] En referencia a la FIG. 32, se muestra un diagrama de flujo de un modo de realización ilustrativo particular de un procedimiento de identificación de un contexto de una imagen y se designa, en general, como 3200. El procedimiento 3200 se puede realizar usando al menos uno de los sistemas, dispositivos y técnicas descritos con
respecto a las FIGS. 1-29. En un modo de realización particular, el procedimiento 3200 puede proseguir desde 3106 de la FIG. 31.
[0283] El procedimiento 3200 puede incluir generar un primer subconjunto de rasgos característicos agrupados en base a una primera marca de tiempo que está dentro de una duración umbral de una segunda marca de tiempo, en 3202. La primera marca de tiempo está asociada a la imagen (por ejemplo, la segunda trama 104 de la FIG. 1). La segunda marca de tiempo está asociada a una segunda imagen. El primer subconjunto de rasgos característicos agrupados incluye el primer subconjunto de rasgos característicos, un segundo subconjunto de rasgos característicos de la segunda imagen, o ambos. Por ejemplo, el agrupador de conjunto de rasgos característicos 1416 de la FIG. 14 puede generar un primer subconjunto de rasgos característicos agrupados (por ejemplo, el/los subconjunto(s) de rasgos característicos agrupados 1476 de la FIG. 14) en base a una primera marca de tiempo (por ejemplo, una primera de la(s) marca(s) de tiempo 1494) que está dentro de una duración de captación de imagen umbral (por ejemplo, la(s) duración/duraciones umbral 1480) de una segunda marca de tiempo (por ejemplo, una segunda de la(s) marca(s) de tiempo 1494), como se describe adicionalmente con referencia a la FIG. 14.
[0284] El procedimiento 3200 también puede incluir generar un subconjunto de rasgos característicos clasificados clasificando el primer subconjunto de rasgos característicos agrupados en base a un primer modelo de clasificación, en 3204. Por ejemplo, el clasificador de conjunto de rasgos característicos 1418 de la FIG. 14 puede generar un subconjunto de rasgos característicos clasificados (por ejemplo, el/los subconjunto(s) de rasgos característicos clasificados 1474) clasificando el primer subconjunto de rasgos característicos agrupados en base a un primer modelo de clasificación (por ejemplo, un primer del/de los modelo(s) de clasificación 1428), como se describe adicionalmente con referencia a la FIG. 14.
[0285] El procedimiento 3200 puede incluir además determinar que un nivel de confianza asociado a la extracción del primer subconjunto de rasgos característicos no satisface un nivel de confianza umbral en base a la determinación de que un nivel de confianza de datos de contexto intermedio no satisface el nivel de confianza umbral, en 3206. Los datos de contexto intermedio pueden corresponder al primer subconjunto de rasgos característicos, el primer subconjunto de rasgos característicos agrupados o el subconjunto de rasgos característicos clasificados. Por ejemplo, el clasificador de contenido multimedia 1412 puede determinar que un nivel de confianza asociado a la extracción del primer subconjunto de rasgos característicos no satisface el nivel de confianza umbral 1482 en base a la determinación de que un nivel de confianza de los datos de contexto intermedios 1492 no satisface el nivel de confianza umbral 1482, como se describe adicionalmente con referencia a la FIG. 14.
[0286] El procedimiento 3200 también puede incluir extraer un segundo subconjunto de rasgos característicos de la imagen a partir de los datos sensoriales en base al primer subconjunto de rasgos característicos que satisfacen un criterio de análisis, en 3208. El criterio de análisis se basa en el nivel de confianza asociado a la extracción del primer subconjunto de rasgos característicos. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 de la FIG.
14 puede extraer un segundo subconjunto de rasgos característicos (por ejemplo, un segundo del/de los subconjunto(s) de rasgos característicos 1442) a partir de los primeros datos sensoriales 1470 en base al primer subconjunto de rasgos característicos que satisfacen un criterio de análisis, como se describe adicionalmente con referencia a la FIG. 14. El criterio de análisis se puede basar en el nivel de confianza asociado a la extracción del primer subconjunto de rasgos característicos, como se describe adicionalmente con referencia a la FIG. 14.
[0287] El procedimiento 3200 puede incluir además generar un segundo subconjunto de rasgos característicos agrupados agrupando el segundo subconjunto de rasgos característicos en base a la primera marca de tiempo y la segunda marca de tiempo, en 3210. Por ejemplo, el agrupador de conjunto de rasgos característicos 1416 de la FIG.
14 puede generar un segundo subconjunto de rasgos característicos agrupados (por ejemplo, un segundo del/de los subconjunto(s) de rasgos característicos agrupados 1476) agrupando el segundo subconjunto de rasgos característicos en base a la primera marca de tiempo y la segunda marca de tiempo, como se describe adicionalmente con referencia a la FIG. 14.
[0288] El procedimiento 3200 también puede incluir generar datos de contexto que indican un contexto de la imagen en base al menos en parte al segundo subconjunto de rasgos característicos, en 3212. Los datos de contexto se pueden generar clasificando el primer subconjunto de rasgos característicos agrupados, el segundo subconjunto de rasgos característicos agrupados, o ambos, en base a un segundo modelo de clasificación. Por ejemplo, el clasificador de contenido multimedia 1412 puede generar los datos de contexto 1490 que indican un contexto de la imagen en base al menos en parte al segundo subconjunto de rasgos característicos, como se describe adicionalmente con referencia a la FIG. 14.
[0289] El procedimiento 3200 de la FIG. 32 se puede implementar por un dispositivo de matriz de puertas programables in situ (FPGA), un circuito integrado específico de la aplicación (ASIC), una unidad de procesamiento tal como una unidad de procesamiento central (CPU), un procesador de señales digitales (DSP), un controlador, otro dispositivo de hardware, dispositivo de firmware o cualquier combinación de los mismos. Como ejemplo, el procedimiento 3200 de la FIG. 32 se puede realizar por un procesador que ejecuta instrucciones.
[0290] Por tanto, el procedimiento 3200 puede posibilitar la identificación del contexto de la imagen. Analizar (por ejemplo, extraer, agrupar y clasificar) subconjuntos de rasgos característicos en base a los niveles de confianza asociados puede dar como resultado la extracción de menos que la totalidad de los rasgos característicos de una imagen, conservando de este modo los recursos del dispositivo 1402.
[0291] En referencia a la FIG. 33, se muestra un diagrama de flujo de un modo de realización particular de un procedimiento de identificación de un contexto de una imagen y se designa, en general, como 3300. El procedimiento 3300 se puede realizar usando al menos uno de los sistemas, dispositivos y técnicas descritos con respecto a las FIGS. 1-29.
[0292] El procedimiento 3300 puede incluir recibir, en un dispositivo móvil, datos sensoriales desde un sensor de imagen, en 3302. Los datos sensoriales están relacionados con una imagen. Por ejemplo, el dispositivo 1402 de la FIG. 14 puede recibir datos sensoriales (por ejemplo, los primeros datos sensoriales 1470) desde el primer sensor de imagen 1404. Los primeros datos sensoriales 1470 pueden estar relacionados con la segunda trama 104 de la FIG.
1.
[0293] El procedimiento 3300 también puede incluir generar primeras estadísticas de imagen de la imagen en base a los datos sensoriales. Un criterio de extracción se basa al menos en parte en las primeras estadísticas de imagen. Las primeras estadísticas de imagen se generan en base al procesamiento específico de la aplicación que incluye al menos uno de reconocimiento de actividades, reconocimiento de personas, reconocimiento de objetos, reconocimiento de ubicaciones o reconocimiento de gestos. Por ejemplo, el dispositivo de procesamiento de estadísticas 108 de la FIG.
3 puede generar primeras estadísticas de imagen de la segunda trama 104 en base a los primeros datos sensoriales 1470 y un criterio de extracción se puede basar al menos en parte en las primeras estadísticas de imagen, como se describe con referencia a la FIG. 14. Las primeras estadísticas de imagen se pueden generar en base al procesamiento específico de la aplicación que incluye al menos uno de reconocimiento de actividades, reconocimiento de personas, reconocimiento de objetos, reconocimiento de ubicaciones o reconocimiento de gestos, como se describe con referencia a la FIG. 14.
[0294] El procedimiento 3300 puede incluir además extraer un primer subconjunto de rasgos característicos a partir de los datos sensoriales en base al criterio de extracción que se satisface, en 3306. El primer subconjunto de rasgos característicos se puede seleccionar en base a un criterio de selección. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 de la FIG. 14 puede extraer un primer subconjunto de rasgos característicos (por ejemplo, el/los subconjunto(s) de rasgos característicos 1442 de la FIG. 14) a partir de los primeros datos sensoriales 1470 en base al criterio de extracción que se satisface, como se describe con referencia a la FIG. 14. El extractor de conjunto de rasgos característicos 1414 puede seleccionar el primer subconjunto de rasgos característicos en base a un criterio de selección (por ejemplo, los criterios de selección 1438 de la FIG. 14), como se describe adicionalmente con referencia a la FIG. 14.
[0295] El procedimiento 3300 puede incluir además activar un primer dominio de potencia en respuesta a la determinación de que los datos sensoriales indican un cambio de escena, en 3308. Por ejemplo, el clasificador de contenido multimedia 1412 de la FIG. 14 puede activar un primer dominio de potencia del dispositivo 1402 en respuesta a la determinación de que los primeros datos sensoriales 1470 indican un cambio de escena, como se describe adicionalmente con referencia a la FIG. 23.
[0296] El procedimiento 3300 también puede incluir activar un segundo dominio de potencia en respuesta a la determinación de que los datos sensoriales indican que la nitidez de la imagen satisface un nivel de nitidez umbral, en 3310. Por ejemplo, el clasificador de contenido multimedia 1412 de la FIG. 14 puede activar un segundo dominio de potencia del dispositivo 1402 en respuesta a la determinación de que los primeros datos sensoriales 1470 indican que una nitidez de la imagen satisface el nivel de nitidez umbral, como se describe adicionalmente con referencia a la FIG.
24.
[0297] El procedimiento 3300 puede incluir además generar datos de contexto que indican un contexto de la imagen en base al menos en parte al primer subconjunto de rasgos característicos, en 3312. Por ejemplo, el clasificador de contenido multimedia 1412 de la FIG. 14 puede generar los datos de contexto 1490 que indican un contexto de la imagen en base al menos en parte al primer subconjunto de rasgos característicos, como se describe adicionalmente con referencia a la FIG. 14.
[0298] El procedimiento 3300 de la FIG. 33 se puede implementar por un dispositivo de matriz de puertas programables in situ (FPGA), un circuito integrado específico de la aplicación (ASIC), una unidad de procesamiento tal como una unidad de procesamiento central (CPU), un procesador de señales digitales (DSP), un controlador, otro dispositivo de hardware, dispositivo de firmware o cualquier combinación de los mismos. Como ejemplo, el procedimiento 3300 de la FIG. 33 se puede realizar por un procesador que ejecuta instrucciones.
[0299] Por tanto, el procedimiento 3300 puede posibilitar la identificación del contexto de la imagen. El análisis de subconjuntos de rasgos característicos de una imagen en respuesta a la determinación de que la imagen corresponde a un cambio de escena, que la imagen no está borrosa, o ambas, puede dar como resultado un análisis selectivo de
imágenes, conservando de este modo los recursos del dispositivo 1402. Además, la activación selectiva del primer dominio de potencia, el segundo dominio de potencia, o ambos, del dispositivo 1402 también puede conservar los recursos del dispositivo 1402.
[0300] En referencia a la FIG. 34, se muestra un diagrama de flujo de un modo de realización ilustrativo particular de un procedimiento de identificación de un contexto de una imagen y se designa, en general, como 3400.
[0301] El procedimiento 3400 puede incluir recibir, en un dispositivo móvil, los primeros datos sensoriales desde un primer sensor de imagen, en 3402. Los primeros datos sensoriales pueden estar relacionados con una primera imagen. Por ejemplo, el dispositivo 1402 de la FIG. 14 puede recibir datos sensoriales (por ejemplo, los primeros datos sensoriales 1470) desde el primer sensor de imagen 1404. Los primeros datos sensoriales 1470 pueden estar relacionados con la primera trama 102 de la FIG. 1.
[0302] El procedimiento 3400 también puede incluir generar primeras estadísticas de imagen de la primera imagen en base a los datos sensoriales, en 3404. Las primeras estadísticas de imagen se generan en base al procesamiento específico de la aplicación. Por ejemplo, el dispositivo de procesamiento de estadísticas 108 puede generar primeras estadísticas de imagen de la primera trama 102 de la FIG. 1 en base a los primeros datos sensoriales 1470, como se describe con referencia a la FIG. 14. Las primeras estadísticas de imagen se pueden generar en base al procesamiento específico de la aplicación, como se describe con referencia a la FIG. 14.
[0303] El procedimiento 3400 puede incluir además extraer un primer subconjunto de rasgos característicos de la primera imagen a partir de los primeros datos sensoriales, en 3406. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 de la FIG. 14 puede extraer un primer subconjunto de rasgos característicos (por ejemplo, uno primero del/de los subconjunto(s) de rasgos característicos 1442 de la FIG. 14) a partir de los primeros datos sensoriales 1470.
[0304] El procedimiento 3400 también puede incluir solicitar segundos datos sensoriales desde un segundo sensor de imagen en base al primer subconjunto de rasgos característicos que satisfacen un criterio de análisis, en 3408. Por ejemplo, el clasificador de contenido multimedia 1412 de la FIG. 14 puede enviar una segunda solicitud de captación de imagen (por ejemplo, la segunda solicitud de captación de imagen 1426) al N-ésimo sensor de imagen 1440 en respuesta a la determinación de que un nivel de confianza asociado a la extracción del primer subconjunto de rasgos característicos no satisface el nivel de confianza umbral 1482, como se describe adicionalmente con referencia a la FIG. 14.
[0305] El procedimiento 3400 puede incluir además recibir los segundos datos sensoriales desde el segundo sensor de imagen, en 3410. Los segundos datos sensoriales pueden estar relacionados con una segunda imagen. Por ejemplo, el clasificador de contenido multimedia 1412 de la FIG. 14 puede recibir segundos datos sensoriales (por ejemplo, los segundos datos sensoriales 1424) desde el N-ésimo sensor de imagen 1440. Los segundos datos sensoriales 1424 pueden estar relacionados con la segunda trama 104 de la FIG. 1.
[0306] El procedimiento 3400 también puede incluir generar segundas estadísticas de imagen de la segunda imagen en base a los segundos datos sensoriales, en 3412. Las segundas estadísticas de imagen se generan en base al procesamiento específico de la aplicación. Por ejemplo, el dispositivo de procesamiento de estadísticas 108 puede generar segundas estadísticas de imagen de la segunda trama 104 de la FIG. 1 en base a los segundos datos sensoriales 1424, como se describe con referencia a la FIG. 14. Las segundas estadísticas de imagen se pueden generar en base al procesamiento específico de la aplicación, como se describe con referencia a la FIG. 14.
[0307] El procedimiento 3400 puede incluir además extraer un segundo subconjunto de rasgos característicos de la segunda imagen a partir de los segundos datos sensoriales, en 3414. El segundo subconjunto de rasgos característicos se extrae en base a una cantidad de cambio entre las primeras estadísticas de imagen y las segundas estadísticas de imagen que satisface un umbral de cambio. Por ejemplo, el extractor de conjunto de rasgos característicos 1414 puede extraer un segundo subconjunto de rasgos característicos (por ejemplo, un segundo del/de los subconjunto(s) de rasgos característicos 1442) a partir de los segundos datos sensoriales 1424 en base a una cantidad de cambio entre las primeras estadísticas de imagen y las segundas estadísticas de imagen que satisface un umbral de cambio, como se describe adicionalmente con referencia a la FIG. 14.
[0308] El procedimiento 3400 también puede incluir generar un subconjunto de rasgos característicos agrupados agrupando el primer subconjunto de rasgos característicos, el segundo subconjunto de rasgos característicos, o ambos, en 3416. Por ejemplo, el agrupador de conjunto de rasgos característicos 1416 puede generar un subconjunto de rasgos característicos agrupados (por ejemplo, el/los subconjunto(s) de rasgos característicos agrupados 1476) agrupando el primer subconjunto de rasgos característicos, el segundo subconjunto de rasgos característicos, o ambos, como se describe adicionalmente con referencia a la FIG. 14.
[0309] El procedimiento 3400 puede incluir además generar datos de contexto que indican un contexto de la primera imagen en base al menos en parte al segundo subconjunto de rasgos característicos, en 3418. Los datos de contexto se pueden generar clasificando el subconjunto de rasgos característicos agrupados en base a un modelo de
clasificación. Por ejemplo, el clasificador de contenido multimedia 1412 de la FIG. 14 puede generar los datos de contexto 1490 en base al menos en parte en el segundo subconjunto de rasgos característicos, como se describe adicionalmente con referencia a la FIG. 14.
[0310] El procedimiento 3400 de la FIG. 34 se puede implementar por un dispositivo de matriz de puertas programables in situ (FPGA), un circuito integrado específico de la aplicación (ASIC), una unidad de procesamiento tal como una unidad de procesamiento central (CPU), un procesador de señales digitales (DSP), un controlador, otro dispositivo de hardware, dispositivo de firmware o cualquier combinación de los mismos. Como ejemplo, el procedimiento 3400 de la FIG. 34 se puede realizar por un procesador que ejecuta instrucciones.
[0311] Por tanto, el procedimiento 3400 puede posibilitar la identificación del contexto de la imagen. El clasificador de contenido multimedia 1412 puede identificar un contexto de una imagen en base al análisis de datos sensoriales de múltiples sensores de imagen cuando los niveles de confianza asociados a los datos sensoriales de un único sensor de imagen no satisfacen un nivel de confianza umbral. El análisis de datos sensoriales de un único sensor de imagen puede conservar los recursos del dispositivo 1402, mientras que el análisis de datos sensoriales de múltiples sensores de imagen puede aumentar los niveles de confianza asociados a los resultados del análisis. Los datos sensoriales de una imagen posterior se pueden analizar cuando se detecta un cambio entre una imagen previa y la imagen posterior. Los recursos del dispositivo 1402 se pueden conservar no analizando la imagen posterior cuando no hay un cambio suficiente (por ejemplo, mayor que el umbral de cambio) de la imagen previa.
[0312] En referencia a la FIG. 35, se muestra un modo de realización ilustrativo particular de un procedimiento 3500 de reducción del uso de potencia asociado a aplicaciones de visión informática. El procedimiento 3500 se puede realizar usando al menos uno de los sistemas, dispositivos y técnicas descritos con respecto a las FIGS. 1-29.
[0313] El procedimiento 3500 puede incluir generar, en un circuito de detección de cambio, una señal de control en base a una cantidad de cambio entre los primeros datos del sensor captados por un sensor y los segundos datos del sensor captados por el sensor, en 3502. Por ejemplo, en referencia a la FIG. 4, el circuito de detección de cambio 414 puede generar la señal de control en base a una cantidad de cambio entre los primeros datos del sensor 430 captados por el sensor 402 y los segundos datos del sensor 430 captados por el sensor 402. El circuito de detección de cambio 414 se puede incluir en la primera ruta de procesamiento 408.
[0314] Los segundos datos del sensor se pueden proporcionar a una segunda ruta de procesamiento para el procesamiento específico de la aplicación de visión informática en base a la señal de control, en 3504. Por ejemplo, en referencia a la FIG. 4, el circuito de detección de cambio 414 puede proporcionar los segundos datos del sensor 430 al procesador de aplicaciones 418 de la segunda ruta de procesamiento 410 para el procesamiento específico de la aplicación de visión informática en base a la señal de control que indica una diferencia entre los primeros datos del sensor 430 y los segundos datos del sensor 430. En modos de realización alternativos (por ejemplo, las FIGS. 5-6), la señal de control puede ser una señal de retroalimentación proporcionada al circuito de selección (por ejemplo, un multiplexor) y los segundos datos del sensor se pueden proporcionar a un procesador de aplicaciones (por ejemplo, el procesador de aplicaciones 518) por medio del circuito de selección.
[0315] El procedimiento 3500 puede reducir el consumo de potencia omitiendo el procesamiento específico de la aplicación de visión informática en una trama particular que es similar a una trama previa. Por ejemplo, el circuito de detección de cambio 414 puede indicar (por medio de la señal de control 416) si se activa (por ejemplo, acciona) el procesador de aplicaciones 418 en base a una comparación entre una trama actual y una trama previa. Si el circuito de detección de cambio 414 determina que las diferencias entre la trama actual y la trama previa no satisfacen un umbral (por ejemplo, un umbral de cambio), el circuito de detección de cambio 414 puede determinar desactivar el procesador de aplicaciones 418 (por ejemplo, mantener el procesador de aplicaciones 418 en el estado de suspensión) para conservar potencia
[0316] En referencia a la FIG. 36, se representa un diagrama de un modo de realización ilustrativo de un dispositivo móvil y se designa en general, como 3600. El dispositivo móvil 3600 puede incluir y/o acoplar de forma comunicativa con una cámara siempre encendida. En un modo de realización particular, el dispositivo móvil 3600 puede corresponder a uno o más de los dispositivos móviles 1200 de la FIG. 12. En un modo de realización ilustrativo, el dispositivo móvil 3600 puede funcionar de acuerdo con los procedimientos 3000-3500 de las FIGS. 30-35, o cualquier combinación de los mismos.
[0317] Cabe destacar que la FIG. 16 es para proporcionar una ilustración generalizada de diversos componentes, cualquiera o todos de los cuales se pueden utilizar según corresponda. Además, los componentes de hardware y/o software del dispositivo móvil 3600 mostrado en la FIG. 36 se pueden configurar para implementar uno o más de los componentes ilustrados en la FIG. 13, tales como el motor de determinación contextual 1380, los sensores y otros componentes.
[0318] Los componentes mostrados en la FIG. 36 se pueden localizar en un único dispositivo móvil y/o distribuirse entre diversos dispositivos en red, que se pueden disponer en diferentes ubicaciones físicas. Por ejemplo, algunos modos de realización pueden incluir la(s) cámara(s) distribuida(s) 3643 y/u otros sensores 3649 en diversas
ubicaciones en o cerca del cuerpo de un usuario. Una cámara siempre encendida de un HMD (usado en la cabeza de un usuario), por ejemplo, se puede acoplar de forma comunicativa con un teléfono móvil en el bolsillo del usuario, y los componentes mostrados en la FIG. 36 se pueden distribuir entre el HMD y el teléfono móvil en cualquiera de una variedad de formas, dependiendo de la funcionalidad deseada.
[0319] El dispositivo móvil 3600 se muestra incluyendo elementos de hardware que se pueden acoplar eléctricamente por medio de un bus 3605 (o de otro modo pueden estar en comunicación, según corresponda). Los elementos de hardware pueden incluir la(s) unidad(es) de procesamiento 3610 que puede(n) incluir, sin limitación, uno o más procesadores de propósito general, uno o más procesadores de propósito especial (tales como procesadores de señales digitales (DSP), procesadores de aceleración de gráficos, circuitos integrados específicos de la aplicación (ASIC), y/o similares), y/u otra estructura o medios de procesamiento, que se pueden configurar para realizar uno o más de los procedimientos descritos en el presente documento, incluyendo los procedimientos 3000-3500 de las FIGS.
30-35. El dispositivo móvil 3600 también puede incluir uno o más dispositivos de entrada 3670 (por ejemplo, una pantalla táctil, un panel táctil, botón/botones, dial(es), interruptor(es) y/o similares) y uno o más dispositivos de salida 3615, que pueden incluir sin limitación una pantalla, diodo emisor de luz (LED), altavoces y/o similares.
[0320] El dispositivo móvil 3600 también puede incluir una interfaz de comunicación inalámbrica 3630, que puede incluir sin limitación un módem, una tarjeta de red, un dispositivo de comunicación por infrarrojos, un dispositivo de comunicación inalámbrica y/o un conjunto de chips (tal como un dispositivo Bluetooth® (marca registrada de Bluetooth SIG, Inc.), un dispositivo de IEEE 802.1 1, un dispositivo de IEEE 802.15.4, un dispositivo Wifi, un dispositivo WiMax, instalaciones de comunicación celular, etc.) y/o similares. La comunicación hacia y desde el dispositivo móvil 3600 también se puede implementar, en algunos modos de realización, usando diversas redes de comunicación inalámbrica. Estas redes pueden incluir, por ejemplo, una red inalámbrica de área amplia (WWAN), una red inalámbrica de área local (WLAN), una red inalámbrica de área personal (WPAN) y similares. Una WWAN puede ser una red de acceso múltiple por división de código (CDMA), una red de acceso múltiple por división de tiempo (TDMA), una red de acceso múltiple por división de frecuencia (FDMA), una red de acceso múltiple por división ortogonal de frecuencia (OFDMA), una red de acceso múltiple por división de frecuencia de portadora única (SC-FDMA), una red WiMax (IEEE 802.16) y así sucesivamente. Una red de CDMA puede implementar una o más tecnologías de acceso por radio (RAT), tales como cdma2000, CDMA de banda ancha (W-CDMA) y así sucesivamente. Cdma2000 incluye las normas IS-95, IS-2000 y/o IS-856. Una red de TDMA puede implementar el sistema global de comunicaciones móviles (GSM), el sistema telefónico móvil avanzado digital (D-AMPS) o alguna otra RAT. Una red de OFDMA puede implementar evolución a largo plazo (LTE), LTE avanzada y así sucesivamente. LTE, LTE avanzada, GSM y W-CDMA se describen en documentos de un consorcio denominado "Proyecto de Colaboración de Tercera Generación" (3GPP). La cdma2000 se describe en documentos de un consorcio denominado "Proyecto 2 de Colaboración de Tercera Generación" (3GPP2). Los documentos del 3GPP y del 3GPP2 están a disposición del público. Una WLAN también puede ser una red IEEE 802.11x, y una WPAN puede ser una red Bluetooth® (marca registrada de Bluetooth SIG, Inc.), una IEEE 802.15x o algún otro tipo de red. Las técnicas descritas en el presente documento también se pueden usar para cualquier combinación de WWAN, WLAN y/o WPAN. La interfaz de comunicación inalámbrica 3630 puede permitir que los datos se intercambien directamente con otros sensores, sistemas y/o cualquier otro dispositivo electrónico descrito en el presente documento. La comunicación se puede llevar a cabo por medio de una o más antenas de comunicación inalámbrica 3632 que envían y/o reciben señales inalámbricas 3634.
[0321] La interfaz de comunicación inalámbrica 3630 también se puede utilizar para determinar una ubicación del dispositivo móvil 3600. Por ejemplo, los puntos de acceso (incluyendo las estaciones base y/u otros sistemas usados para la comunicación inalámbrica de voz y/o datos) pueden servir como fuentes independientes de datos de posición, por ejemplo, a través de la implementación de procedimientos basados en trilateración en base a, por ejemplo, mediciones de tiempo de viaje de ida y vuelta (RTT) y/o de indicación de intensidad de señal recibida (RSSI). Los puntos de acceso pueden formar parte de una WLAN que funciona en un edificio para realizar comunicaciones en regiones geográficas más pequeñas que una WWAN. Además, los puntos de acceso pueden formar parte de una red Wifi (802.1 lx), picorredes celulares y/o femtocélulas, una red Bluetooth® (marca registrada de Bluetooth SIG, Inc.) y similares. Los puntos de acceso también pueden formar parte de un sistema de posicionamiento interior Qualcomm (QUIPSTM).
[0322] El dispositivo móvil 3600 puede incluir además el/los sensor(es) 3640. Como se indica en el presente documento, el/los sensor(es) 3640, que puede(n) corresponder a los sensores descritos en la FIG. 2, puede(n) incluir sensores a partir de los cuales se puede determinar una orientación y/o movimiento del dispositivo móvil 3600, tales como uno o más acelerómetros 3641, giroscopios 3642, magnetómetros 3644 y similares. El dispositivo móvil 3600 puede incluir además otro(s) sensor(es) 1640, tales como el/los micrófono(s) 1665, el/los sensor(es) de luz 1646, sensores de proximidad y otros sensores, como se describe con referencia a la FIG. 13. La(s) cámara(s) 3643 puede(n) incluir cualquier número de cámaras diferentes con diferentes rasgos característicos (RGB, infrarrojo, gran angular, ojo de pez, alta resolución, etc.), cualquiera o todas de las cuales se pueden utilizar como una cámara siempre encendida como se describe en el presente documento.
[0323] Los modos de realización del dispositivo móvil 3600 también pueden incluir un receptor de sistema de posicionamiento por satélite (SPS) 3680 que puede recibir las señales 3684 desde uno o más SPS usando una antena SPS 3682. El receptor SPS 3680 puede corresponder al/a los receptor(es) de posicionamiento por satélite 1350 de la
FIG. 13, que puede proporcionar información de ubicación (por ejemplo, coordenadas) con respecto al dispositivo móvil 3600, así como información derivada del mismo (velocidad, aceleración, etc.). Las señales de satélite transmitidas 3684 pueden incluir, por ejemplo, señales marcadas con un código de ruido pseudoaleatorio (PN) repetitivo de un número establecido de chips y se puede ubicar en estaciones de control en tierra, en equipos de usuario y/o en vehículos espaciales. Los sistemas de posicionamiento por satélite pueden incluir sistemas tales como el sistema de posicionamiento global (GPS), Galileo, Glonass, Compass, el sistema de satélites cuasicenitales (QZSS) en Japón, el sistema indio de satélites de navegación regional (IRNSS) en la India, Beidou en China, etc., y/o diversos sistemas de aumento (por ejemplo, un sistema de aumento basado en satélites (SBAS)) que se pueden asociar o de otro modo habilitar para su uso con uno o más sistemas de satélites de navegación global y/o regional. A modo de ejemplo, pero no de limitación, un SBAS puede incluir un(os) sistema(s) de aumento que proporciona(n) información de integridad, correcciones diferenciales, etc., tales como, por ejemplo, el sistema de aumento de área extensa (WAAS), el servicio europeo de superposición de navegación geoestacionaria (EGNOS), el sistema de aumento por satélite multifuncional (MSAS), la navegación geoaumentada y asistida por GPS, o el sistema de navegación geoaumentada y con GPS (GAGAN), y/o similares.
[0324] El dispositivo móvil 3600 puede incluir además (y/o estar en comunicación con) una memoria 3660. La memoria 3660 puede incluir, sin limitación, almacenamiento local y/o accesible por red, una unidad de disco, una matriz de unidades, un dispositivo de almacenamiento óptico, un dispositivo de almacenamiento de estado sólido, tal como una memoria de acceso aleatorio ("RAM"), y/o una memoria de solo lectura ("ROM"), que puede ser programable, actualizable por flash y/o similar. Dichos dispositivos de almacenamiento se pueden configurar para implementar cualquier almacenamiento de datos apropiado, incluyendo, sin limitación, diversos sistemas de ficheros, estructuras de bases de datos y/o similares.
[0325] La memoria 3660 del dispositivo móvil 3600 también puede incluir elementos de software (no mostrados), que incluyen un sistema operativo, controladores de dispositivo, bibliotecas ejecutables y/u otro código, tal como uno o más programas de aplicación, que pueden comprender programas informáticos proporcionados por diversos modos de realización, y/o se pueden diseñar para implementar procedimientos y/o configurar sistemas, proporcionados por otros modos de realización, como se describe en el presente documento. Simplemente a modo de ejemplo, uno o más procedimientos descritos con respecto a los procedimientos de las FIGS. 30-35 se pueden implementar como código y/o instrucciones ejecutables por el dispositivo móvil 3600 (y/o una unidad de procesamiento dentro de un dispositivo móvil 3600) (y/u otro dispositivo de un sistema de posicionamiento). En un aspecto, dicho código y/o instrucciones se pueden usar para configurar y/o adaptar un ordenador de propósito general (u otro dispositivo) para realizar una o más operaciones de acuerdo con los procedimientos descritos.
[0326] En referencia a la FIG. 37, se muestra un diagrama de bloques del dispositivo inalámbrico 3700 que incluye componentes operativos para reducir el uso de potencia asociado a las aplicaciones de visión informática. El dispositivo 3700 incluye los procesadores 3710 (por ejemplo, el circuito de detección de cambio 414 y el procesador de aplicaciones 418) operativos para reducir el uso de potencia asociado a aplicaciones de visión informática. Los procesadores 3710 están acoplados a una memoria 3732. En un modo de realización particular, los procesadores 3710 pueden incluir el sistema de procesamiento 300 de la FIG. 3, el sistema de procesamiento 400 de la FIG. 4, el sistema de procesamiento 500 de la FIG. 5, el sistema de procesamiento 600 de la FIG. 6, el sistema de procesamiento 800 de la FIG. 8, o cualquier combinación de los mismos.
[0327] La FIG. 37 también muestra un controlador de pantalla 3726 que está acoplado a los procesadores 3710 y a una pantalla 3728. Un controlador de cámara 3790 se puede acoplar a los procesadores 3710 y al sensor 402. El sensor 402 se puede configurar para captar una secuencia de vídeo que incluye tramas de imagen (por ejemplo, las imágenes 102-106 de la FIG. 1). También se puede acoplar un codificador/decodificador (CÓd Ec ) 3734 a los procesadores 3710. Un altavoz 3736 y un micrófono 3738 se pueden acoplar al CÓDEC 3734. La FIG. 37 también indica que un controlador inalámbrico 3740 se puede acoplar a los procesadores 3710 y a una antena inalámbrica 3742 por medio de una interfaz de radiofrecuencia (RF) 3780.
[0328] La memoria 3732 puede ser un medio de almacenamiento tangible no transitorio legible por procesador que incluye las instrucciones ejecutables 3756. Las instrucciones 3756 se pueden ejecutar por un procesador, tal como los procesadores 3710 o un dispositivo dentro de los procesadores 3710 (por ejemplo, el primer dispositivo de procesamiento 304, el generador de estadísticas 304 y/o el segundo dispositivo de procesamiento 310) para realizar cualquiera de los procedimientos 3000-3500 de las FIGs .30-35.
[0329] En un modo de realización particular, el procesador 3710, el controlador de pantalla 3726, la memoria 3732, el CÓDEC 3734 y el controlador inalámbrico 3740 están incluidos en un dispositivo de sistema en paquete o sistema en chip 3722. En un modo de realización particular, un dispositivo de entrada 3730 y una fuente de alimentación 3744 están acoplados al dispositivo de sistema en chip 3722. Además, en un modo de realización particular, como se ilustra en la FIG. 37, la pantalla 3728, el dispositivo de entrada 3730, la cámara 302, el altavoz 3736, el micrófono 3738, la antena inalámbrica 3742 y la fuente de alimentación 3744 son externos al dispositivo de sistema en chip 3722. Sin embargo, cada uno de la pantalla 3728, el dispositivo de entrada 3730, la cámara 302, el altavoz 3736, el micrófono 3738, la antena inalámbrica 3742 y la fuente de alimentación 3744 se puede acoplar a un componente del dispositivo de sistema en chip 3722, tal como una interfaz o un controlador.
[0330] Junto con los modos de realización descritos, se divulga un aparato que incluye medios para generar primeras estadísticas de imagen para una primera trama de datos de imagen y segundas estadísticas de imagen para una segunda trama de datos de imagen. Por ejemplo, los medios para generar las estadísticas de imagen pueden incluir el primer dispositivo de procesamiento 304 de la FIG. 3, los procesadores 3710 programados para ejecutar las instrucciones 3756 de la FIG. 37, uno o más de otros dispositivos, circuitos, módulos o instrucciones para generar estadísticas de imagen, o cualquier combinación de los mismos.
[0331] El aparato también puede incluir medios para determinar si una cantidad de cambio entre las segundas estadísticas de imagen y las primeras estadísticas de imagen satisface un umbral. Por ejemplo, los medios para determinar pueden incluir el dispositivo de procesamiento de estadísticas 108 de la FIG. 3, los procesadores 3710 programados para ejecutar las instrucciones 3756 de la FIG. 37, uno o más de otros dispositivos, circuitos, módulos o instrucciones para determinar si la primera cantidad de cambio entre las segundas estadísticas de imagen y las primeras estadísticas de imagen satisface el umbral, o cualquier combinación de los mismos.
[0332] El aparato también puede incluir medios para realizar un procesamiento específico de la aplicación en la segunda trama en respuesta a una determinación de que la cantidad de cambio satisface el umbral. Por ejemplo, los medios para realizar el procesamiento específico de la aplicación pueden incluir el segundo dispositivo de procesamiento 310 de la FIG. 3, los procesadores 3710 programados para ejecutar las instrucciones 3756 de la FIG.
37, uno o más de otros dispositivos, circuitos, módulos o instrucciones para realizar el procesamiento específico de la aplicación, o cualquier combinación de los mismos.
[0333] Junto con los modos de realización descritos, se divulga un aparato que incluye medios para generar una señal de control en base a una cantidad de cambio entre los primeros datos del sensor captados por un sensor y los segundos datos del sensor captados por el sensor. Los medios para generar la señal de control pueden incluir el dispositivo de procesamiento de estadísticas 108 de las FIGS. 1-3, el circuito de detección de cambio 414 de la FIG.
4, el circuito de detección de cambio 514 de las FIGS. 5-6, el analizador de activación 814 de la FIG. 8, el analizador de activación 816 de la FIG. 8, uno o más de otros dispositivos, circuitos, módulos o instrucciones para generar la señal de control, o cualquier combinación de los mismos.
[0334] El aparato también puede incluir medios para realizar el procesamiento específico de la aplicación de visión informática en los segundos datos del sensor en base a la señal de control. Los medios para realizar el procesamiento específico de la aplicación de visión artificial pueden incluir el segundo dispositivo de procesamiento 310 de la FIG. 3, componentes en la segunda ruta de procesamiento 410 de la FIG. 4, componentes en la segunda ruta de procesamiento 510 de la FIG. 5, componentes en la segunda ruta de procesamiento 610 de la FIG. 6, componentes en la segunda ruta de procesamiento 810 de la FIG. 8, uno o más de otros dispositivos, circuitos, módulos o instrucciones para realizar el procesamiento específico de la aplicación de visión informática en los segundos datos del sensor, o cualquier combinación de los mismos.
[0335] En referencia a la FIG. 38, se representa un diagrama de bloques de un modo de realización ilustrativo particular de un dispositivo móvil y se designa, en general, como 3800. En diversos modos de realización, el dispositivo 3800 puede tener más o menos componentes que los ilustrados en la FIG. 38. El dispositivo 3800 puede incluir, estar incluido en, o corresponder al dispositivo 302 de la FIG. 3. En un modo de realización ilustrativo, el dispositivo 3800 puede funcionar de acuerdo con los procedimientos de las FIGS. 30-34, o cualquier combinación de los mismos.
[0336] En un modo de realización particular, el dispositivo 3800 incluye un procesador 3810 (por ejemplo, una unidad de procesamiento central (CPU) o un procesador de señales digitales (DSP)) acoplado a la memoria 1408 de la FIG.
14, a un codificador/decodificador (CÓDEC) 3834, y a una antena inalámbrica 3842 por medio de un controlador inalámbrico 3840. El procesador 3810 también se puede acoplar a la pantalla 1406 de la FIG. 14 por medio de un controlador de pantalla 3826. Un altavoz 3836 y un micrófono 3838 se pueden acoplar al CÓDEC 3834. El dispositivo 3800 se puede acoplar al uno o más sensores de imagen del dispositivo 1402 de la FIG. 14. Por ejemplo, el dispositivo 3800 se puede acoplar al primer sensor de imagen 1404, al Nésimo sensor de imagen 1440 de la FIG. 14, o a ambos. El dispositivo 3800 se puede acoplar a uno o más de otros sensores 3846. Por ejemplo, el uno o más de otros sensores 3846 pueden incluir un sensor de sistema microelectromecánico (MEMS), un sensor óptico, un sensor magnético o cualquier combinación de los mismos. El dispositivo 3800 puede incluir el clasificador de contenido multimedia 1412 de la FIG. 14. En un modo de realización particular, el procesador 3810 puede corresponder al procesador 1410 de la FIG. 14. En un modo de realización particular, el procesador 3810 puede incluir el clasificador de contenido multimedia 1412 de la FIG. 14.
[0337] El clasificador de contenido multimedia 1412 se puede usar para implementar un modo de realización de hardware de las técnicas de identificación de contexto de imagen descritas en el presente documento. De forma alternativa, o además, se puede implementar un modo de realización de software (o un modo de realización de software/hardware combinado). Por ejemplo, la memoria 1408 puede incluir las instrucciones 3856. Las instrucciones 3856 pueden corresponder al clasificador de contenido multimedia 1412. Las instrucciones 3856 pueden ser ejecutables por el procesador 3810 u otra unidad de procesamiento del dispositivo 3800. Por ejemplo, la memoria 1408 puede ser un medio o dispositivo legible por ordenador no transitorio que almacena las instrucciones 3856 que
son ejecutables por el procesador 3810 para identificar un contexto de una imagen al recibir datos sensoriales, extraer un primer subconjunto de rasgos característicos, determinar que los niveles de confianza asociados al primer subconjunto de rasgos característicos no satisfacen un nivel de confianza umbral, extraer un segundo subconjunto de rasgos característicos en respuesta a la determinación, y generar datos de contexto que indican el contexto de la imagen en base al menos en parte al segundo subconjunto de rasgos característicos.
[0338] En un modo de realización particular, el procesador 3810, el controlador de pantalla 3826, la memoria 1408, el CÓDEC 3834 y el controlador inalámbrico 3840 están incluidos en un dispositivo de sistema en paquete o sistema en chip 3822. En un modo de realización particular, un dispositivo de entrada 3830 y una fuente de alimentación 3844 están acoplados al dispositivo de sistema en chip 3822. Además, en un modo de realización particular, como se ilustra en la FIG. 38, la pantalla 1406, el dispositivo de entrada 3830, el altavoz 3836, el micrófono 3838, el primer sensor de imagen 1404, el N-ésimo sensor de imagen 340, la antena inalámbrica 3842 y la fuente de alimentación 3844 son externos al dispositivo de sistema en chip 3822. Sin embargo, cada uno de la pantalla 1406, el dispositivo de entrada 3830, el altavoz 3836, el micrófono 3838, el primer sensor de imagen 1404, el N-ésimo sensor de imagen 1440, la antena inalámbrica 3842 y la fuente de alimentación 3844 puede estar acoplado a un componente del dispositivo de sistema en chip 3822, tal como una interfaz o un controlador.
[0339] Junto con los modos de realización descritos, se divulga un sistema que puede incluir medios para recibir datos sensoriales desde un sensor de imagen, tal como la antena inalámbrica 3842, el clasificador contenido multimedia 1412 de la FIG. 14, el primer dispositivo de procesamiento 304 de la FIG. 3, uno o más de otros dispositivos o circuitos configurados para recibir datos sensoriales, o cualquier combinación de los mismos. Los datos sensoriales pueden estar relacionados con una imagen. El sistema también puede incluir medios para extraer un primer subconjunto de rasgos característicos a partir de los datos sensoriales, tales como el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el extractor de conjunto de rasgos característicos 1414, el clasificador de contenido multimedia 1412, el procesador 1410 de la FIG. 14, el procesador 3810 de la FIG. 38, uno o más de otros dispositivos o circuitos configurados para extraer un primer subconjunto de rasgos característicos, o cualquier combinación de los mismos. El primer subconjunto de rasgos característicos se puede seleccionar en base a un criterio de selección. El sistema puede incluir además medios para generar datos de contexto que indican un contexto de la imagen en base al menos en parte al primer subconjunto de rasgos característicos, tal como el segundo dispositivo de procesamiento 310 de la FIG. 3, el clasificador de contenido de medios multimedia 1412, el procesador 1410 de la FIG. 14, el procesador 3810 de la FIG. 38, uno o más de otros dispositivos o circuitos configurados para generar datos de contexto, o cualquier combinación de los mismos.
[0340] El sistema también puede incluir medios para determinar si se satisface un criterio de extracción en base a los datos sensoriales, tal como el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el clasificador de contenido de medios multimedia 1412, el extractor 1414 de la FIG. 14, el procesador 3810 de la FIG. 38, uno o más de otros dispositivos o circuitos configurados para determinar si el criterio de extracción se cumple en base a los datos sensoriales, o cualquier combinación de los mismos. El primer subconjunto de rasgos característicos se puede extraer en base al criterio de extracción que se satisface.
[0341] El sistema puede incluir también medios para activar un primer dominio de potencia en respuesta a la determinación de que los datos sensoriales indican un cambio de escena, tal como el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el clasificador de contenido de medios multimedia 1412, el extractor 1414 de la FIG. 14, el procesador 3810 de la FIG. 38, uno o más de otros dispositivos o circuitos configurados para activar el primer dominio de potencia, o cualquier combinación de los mismos.
[0342] El sistema puede incluir además medios para activar un segundo dominio de potencia en respuesta a la determinación de que los datos sensoriales indican que una nitidez de la imagen satisface un nivel de nitidez umbral, tal como el dispositivo de procesamiento de estadísticas 108 de la FIG. 1, el primer dispositivo de procesamiento 304, el segundo dispositivo de procesamiento 310 de la FIG. 3, el clasificador de contenido de medios multimedia 1412, el extractor 1414 de la FIG. 14, el procesador 3810 de la FIG. 38, uno o más de otros dispositivos o circuitos configurados para activar el segundo dominio de potencia, o cualquier combinación de los mismos.
[0343] Los expertos apreciarán, además, que los diversos bloques lógicos, configuraciones, módulos, circuitos y etapas de algoritmo ilustrativos descritos en relación con los modos de realización divulgados en el presente documento se pueden implementar como hardware electrónico, software informático ejecutado por un procesador o combinaciones de ambos. Se han descrito anteriormente diversos componentes, bloques, configuraciones, módulos, circuitos y etapas ilustrativos, en general, en términos de su funcionalidad. Que dicha funcionalidad se implemente como hardware o instrucciones ejecutables por procesador depende de la aplicación particular y de las restricciones de diseño impuestas al sistema global. Los expertos en la técnica pueden implementar la funcionalidad descrita de varias formas para cada aplicación particular, pero no se debe interpretar que dichas decisiones de implementación suponen una desviación del alcance de la presente divulgación.
[0344] Las etapas de un procedimiento o algoritmo descrito en relación con los modos de realización divulgados en el presente documento se pueden realizar directamente en hardware, en un módulo de software ejecutado por un procesador o en una combinación de los dos. Un módulo de software puede residir en una memoria de acceso aleatorio (RAM), memoria flash, memoria de solo lectura (ROM), memoria de solo lectura programable (PROM), memoria de solo lectura programable y borrable (EPROM), memoria de solo lectura programable y borrable eléctricamente (EEPROM), registros, disco duro, disco extraíble, disco compacto con memoria de solo lectura (CD-ROM) o en cualquier otra forma de medio de almacenamiento no transitorio conocido en la técnica. Un medio de almacenamiento ejemplar se acopla al procesador de modo que el procesador pueda leer información de, y escribir información en, el medio de almacenamiento. De forma alternativa, el medio de almacenamiento puede estar integrado en el procesador. El procesador y el medio de almacenamiento pueden residir en un circuito integrado específico de la aplicación (ASIC). El ASIC puede residir en un dispositivo informático o en un terminal de usuario. Como alternativa, el procesador y el medio de almacenamiento pueden residir como componentes discretos en un dispositivo informático o en un terminal de usuario.
[0345] La descripción previa de los modos de realización divulgados se proporciona para posibilitar que un experto en la técnica realice o use los modos de realización divulgados. Diversas modificaciones de estos modos de realización resultarán inmediatamente evidentes para los expertos en la técnica, y los principios definidos en el presente documento se pueden aplicar a otros modos de realización sin apartarse del alcance de la divulgación. Por tanto, la presente divulgación no pretende limitarse a los modos de realización mostrados en el presente documento, sino que se le ha de conceder el alcance más amplio posible consecuente con los principios y rasgos característicos novedosos como se define en las reivindicaciones siguientes.
Claims (15)
1. Un procedimiento que comprende:
generar, en un circuito de detección de cambio (414, 514, 614, 814) incluido en una primera ruta de procesamiento (408, 508, 608, 808), una señal de control en base a una cantidad de cambio entre los primeros datos del sensor (112) y los segundos datos del sensor (114) que satisface un umbral, los primeros datos del sensor (112) correspondientes a un primer conjunto de valores de píxel asociados a una primera imagen (102) captada por un primer sensor (402, 502, 602, 842) y los segundos datos del sensor (114) correspondientes a un segundo conjunto de valores de píxel asociados a una segunda imagen (104) captada por el primer sensor (402, 502, 602, 842); el procedimiento caracterizado por proporcionar los segundos datos del sensor (114) a una segunda ruta de procesamiento (410, 510, 610, 810) para el procesamiento específico de la aplicación de visión informática en base a la señal de control (416, 516, 844), la segunda ruta de procesamiento (410, 510, 610, 810) diferente de la primera ruta de procesamiento (408, 508, 606, 808), en el que la potencia informática para la primera ruta de procesamiento (408, 508, 608, 808) es menor que la potencia informática para la segunda ruta de procesamiento (410, 510, 610, 810).
2. El procedimiento de la reivindicación 1, que comprende además:
introducir datos de sensor de baja velocidad (834) en la primera ruta de procesamiento (808), los datos de sensor de baja velocidad (834) introducidos a una primera velocidad de datos que es menor que una segunda velocidad de datos de los datos de sensor de alta velocidad (832) introducidos en la segunda ruta de procesamiento (810),
en el que el primer sensor (842) comprende un sensor de imagen.
3. El procedimiento de la reivindicación 1, que comprende además:
extraer los primeros rasgos característicos a partir de los primeros datos del sensor (112) en el circuito de detección de cambios (414, 514, 614, 814) y extraer los segundos rasgos característicos a partir de los segundos datos del sensor (114) en el circuito de detección de cambios (414, 514, 614, 814), en el que la cantidad de cambio se basa en los primeros rasgos característicos y se basa en los segundos rasgos característicos.
4. El procedimiento de la reivindicación 1, que comprende además:
determinar una diferencia entre las primeras estadísticas de imagen de los primeros datos del sensor (112) y las segundas estadísticas de imagen de los segundos datos del sensor (114),
en el que la cantidad de cambio se basa en la diferencia.
5. El procedimiento de la reivindicación 4, que comprende además determinar, en un procesador de aplicaciones (418, 518) en la segunda ruta de procesamiento (410, 510, 610, 810), un tipo particular de estadísticas de imagen en base a una aplicación de visión informática particular.
6. El procedimiento de la reivindicación 5, que comprende además:
proporcionar, en el procesador de aplicaciones (418, 518), una indicación del tipo particular de estadísticas de imagen a un analizador de señal (512) en la primera ruta de procesamiento (408, 508, 608, 808); y generar, en el analizador de señal (512), las primeras estadísticas de imagen y las segundas estadísticas de imagen en base al tipo particular de estadísticas de imagen.
7. El procedimiento de la reivindicación 1, en el que el procesamiento específico de la aplicación de visión informática comprende:
extraer un primer subconjunto de rasgos característicos de una segunda trama correspondiente a los segundos datos del sensor (114);
extraer un segundo subconjunto de rasgos característicos de la segunda trama en base al primer subconjunto de rasgos característicos que satisfacen un criterio de análisis; y
generar datos de contexto que indican un contexto de la segunda trama en base al menos en parte al segundo subconjunto de rasgos característicos.
8. El procedimiento de la reivindicación 1, que comprende además:
realizar, en un primer procesador de aplicaciones (418, 518) en la segunda ruta de procesamiento (410, 510, 610, 810), el primer procesamiento específico de la aplicación de visión informática en una segunda trama correspondiente a los segundos datos del sensor (114),
en el que el primer procesador de aplicaciones (418, 518) consume una primera cantidad de potencia.
9. El procedimiento de la reivindicación 8, que comprende además:
solicitar, en el primer procesador de aplicaciones (418, 518) en base a un acontecimiento particular, el uso de un segundo procesador de aplicaciones (706) en la segunda ruta de procesamiento (410, 510, 610, 810) para realizar un segundo procesamiento específico de la aplicación de visión informática en la segunda trama, en el que el segundo procesador de aplicaciones (706) consume una segunda cantidad de potencia que es mayor que la primera cantidad de potencia; y
determinar, en el segundo procesador de aplicaciones (706), si realizar el segundo procesamiento específico de la aplicación de visión informática en la segunda trama.
10. El procedimiento de la reivindicación 9, en el que:
el primer procesamiento específico de la aplicación de visión informática incluye hacer un barrido de píxeles de la segunda trama en busca de un color particular,
el acontecimiento particular comprende determinar que un píxel particular de la segunda trama tiene el color particular, y
el segundo procesamiento específico de la aplicación de visión informática incluye realizar detección de objetos, reconocimiento de objetos o una combinación de los mismos.
11. El procedimiento de la reivindicación 9, que comprende además realizar, en el segundo procesador de aplicaciones (706), el segundo procesamiento específico de la aplicación de visión informática en la segunda trama.
12. El procedimiento de la reivindicación 11, que comprende además:
determinar, en el segundo procesador de aplicaciones (706), si se interrumpe el primer procesamiento específico de la aplicación de visión informática en la segunda trama en el primer procesador de aplicaciones (418, 518); e
interrumpir el primer procesamiento específico de la aplicación de visión informática en la segunda trama en el primer procesador de aplicaciones (418, 518) en base a la determinación en el segundo procesador de aplicaciones (708).
13. El procedimiento de la reivindicación 12, que comprende además apagar el primer procesador de aplicaciones (418, 518) después de interrumpir el primer procesamiento específico de la aplicación de visión informática en la segunda trama.
14. Un aparato que comprende:
medios (414, 514, 614, 814) configurados para generar una señal de control (416, 516, 844) en base a una cantidad de cambio entre los primeros datos del sensor (112) y los segundos datos del sensor (114) que satisface un umbral, los primeros datos del sensor (112) correspondientes a un primer conjunto de valores de píxel asociados a una primera imagen (102) captada por un primer sensor (402, 502, 602, 842) y los segundos datos del sensor (114) correspondientes a un segundo conjunto de valores de píxel asociados a una segunda imagen (104) captada por el primer sensor (402, 502, 602, 842), en el que los medios (414, 514, 614, 814) configurados para generar la señal de control (416, 516, 844) se incluyen en una primera ruta de procesamiento (408, 508, 608, 808); el aparato caracterizado por
medios (418, 518) configurados para realizar el procesamiento específico de la aplicación de visión informática en los segundos datos del sensor (114) en base a la señal de control (416, 516, 844), en el que los medios configurados para realizar el procesamiento específico de la aplicación de visión informática se incluyen en una segunda ruta de procesamiento (410, 510, 610, 810) diferente de la primera ruta de
procesamiento (408, 508, 608, 808), en el que la potencia informática para la primera ruta de procesamiento (408, 508, 608, 808), es menor que la potencia informática para la segunda ruta de procesamiento (410, 510, 610, 810).
15. Un medio legible por ordenador que comprende instrucciones que, cuando se ejecutan por un ordenador, hacen que el ordenador realice el procedimiento de acuerdo con una cualquiera de las reivindicaciones 1 a 13.
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201361835400P | 2013-06-14 | 2013-06-14 | |
| US201361871678P | 2013-08-29 | 2013-08-29 | |
| US14/303,490 US10694106B2 (en) | 2013-06-14 | 2014-06-12 | Computer vision application processing |
| PCT/US2014/042353 WO2014201386A1 (en) | 2013-06-14 | 2014-06-13 | Computer vision application processing |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2753373T3 true ES2753373T3 (es) | 2020-04-08 |
Family
ID=52018885
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES14737434T Active ES2753373T3 (es) | 2013-06-14 | 2014-06-13 | Procesamiento de aplicación de visión informática |
Country Status (8)
| Country | Link |
|---|---|
| US (2) | US10091419B2 (es) |
| EP (2) | EP3008892B1 (es) |
| JP (2) | JP6422955B2 (es) |
| KR (2) | KR20160021131A (es) |
| CN (2) | CN105284102B (es) |
| ES (1) | ES2753373T3 (es) |
| HU (1) | HUE045984T2 (es) |
| WO (2) | WO2014201386A1 (es) |
Families Citing this family (80)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9959471B2 (en) | 2008-05-06 | 2018-05-01 | Careview Communications, Inc. | Patient video monitoring systems and methods for thermal detection of liquids |
| US20170155877A1 (en) * | 2008-05-06 | 2017-06-01 | Careview Communications, Inc. | System and method for predicting patient falls |
| US9140590B2 (en) * | 2011-02-09 | 2015-09-22 | Texas Instruments Incorporated | System and method of power-saving in MEMS sensor applications |
| US10091419B2 (en) | 2013-06-14 | 2018-10-02 | Qualcomm Incorporated | Computer vision application processing |
| US9560273B2 (en) * | 2014-02-21 | 2017-01-31 | Apple Inc. | Wearable information system having at least one camera |
| KR102146857B1 (ko) * | 2014-04-07 | 2020-08-21 | 삼성전자주식회사 | 촬영 장치 및 이의 제어 방법 |
| KR102266195B1 (ko) * | 2014-06-20 | 2021-06-17 | 삼성전자주식회사 | 객체와 관련된 정보를 제공하는 방법 및 장치 |
| US9965021B2 (en) * | 2014-06-23 | 2018-05-08 | Mediatek, Inc. | Method and system providing power management for multimedia processing |
| CN105637852B (zh) * | 2014-08-29 | 2019-03-01 | 华为技术有限公司 | 一种图像处理方法、装置及电子设备 |
| US20170132466A1 (en) | 2014-09-30 | 2017-05-11 | Qualcomm Incorporated | Low-power iris scan initialization |
| US9923004B2 (en) | 2014-09-30 | 2018-03-20 | Qualcomm Incorporated | Hardware acceleration of computer vision feature detection |
| US9838635B2 (en) | 2014-09-30 | 2017-12-05 | Qualcomm Incorporated | Feature computation in a sensor element array |
| US10728450B2 (en) | 2014-09-30 | 2020-07-28 | Qualcomm Incorporated | Event based computer vision computation |
| US9762834B2 (en) | 2014-09-30 | 2017-09-12 | Qualcomm Incorporated | Configurable hardware for computing computer vision features |
| US10515284B2 (en) | 2014-09-30 | 2019-12-24 | Qualcomm Incorporated | Single-processor computer vision hardware control and application execution |
| US9986179B2 (en) | 2014-09-30 | 2018-05-29 | Qualcomm Incorporated | Sensor architecture using frame-based and event-based hybrid scheme |
| US9554100B2 (en) | 2014-09-30 | 2017-01-24 | Qualcomm Incorporated | Low-power always-on face detection, tracking, recognition and/or analysis using events-based vision sensor |
| US9940533B2 (en) * | 2014-09-30 | 2018-04-10 | Qualcomm Incorporated | Scanning window for isolating pixel values in hardware for computer vision operations |
| EP3007029B1 (en) * | 2014-10-07 | 2017-12-27 | LG Electronics Inc. | Mobile terminal and wearable device |
| US9621741B2 (en) * | 2014-12-10 | 2017-04-11 | Intel Corporation | Techniques for context and performance adaptive processing in ultra low-power computer vision systems |
| US9836591B2 (en) | 2014-12-16 | 2017-12-05 | Qualcomm Incorporated | Managing latency and power in a heterogeneous distributed biometric authentication hardware |
| GB201501510D0 (en) * | 2015-01-29 | 2015-03-18 | Apical Ltd | System |
| US9692967B1 (en) * | 2015-03-23 | 2017-06-27 | Snap Inc. | Systems and methods for reducing boot time and power consumption in camera systems |
| US9704056B2 (en) * | 2015-04-02 | 2017-07-11 | Qualcomm Incorporated | Computing hierarchical computations for computer vision calculations |
| US9622177B2 (en) | 2015-08-06 | 2017-04-11 | Qualcomm Incorporated | Context aware system with multiple power consumption modes |
| JP6529383B2 (ja) * | 2015-08-11 | 2019-06-12 | 京セラ株式会社 | ウェアラブル装置及び出力システム |
| US9811881B2 (en) * | 2015-12-09 | 2017-11-07 | Goodrich Corporation | Off-band resolution emhancement |
| US9916866B2 (en) * | 2015-12-22 | 2018-03-13 | Intel Corporation | Emotional timed media playback |
| US9838641B1 (en) * | 2015-12-30 | 2017-12-05 | Google Llc | Low power framework for processing, compressing, and transmitting images at a mobile image capture device |
| CN105759935B (zh) * | 2016-01-29 | 2019-01-18 | 华为技术有限公司 | 一种终端控制方法及终端 |
| JP6727840B2 (ja) | 2016-02-19 | 2020-07-22 | ソニーモバイルコミュニケーションズ株式会社 | 撮像装置、撮像制御方法及びコンピュータプログラム |
| US10037459B2 (en) * | 2016-08-19 | 2018-07-31 | Sage Software, Inc. | Real-time font edge focus measurement for optical character recognition (OCR) |
| US11218586B2 (en) * | 2016-09-09 | 2022-01-04 | Honor Device Co., Ltd. | Method for controlling screen of mobile terminal, and apparatus |
| CN109154979A (zh) * | 2016-10-26 | 2019-01-04 | 奥康科技有限公司 | 用于分析图像和提供反馈的可佩戴设备和方法 |
| US10984235B2 (en) | 2016-12-16 | 2021-04-20 | Qualcomm Incorporated | Low power data generation for iris-related detection and authentication |
| US10614332B2 (en) | 2016-12-16 | 2020-04-07 | Qualcomm Incorportaed | Light source modulation for iris size adjustment |
| BR112019014550A2 (pt) * | 2017-01-23 | 2020-02-18 | Qualcomm Incorporated | Execução de aplicativos e controle de hardware de visão computacional de processador único |
| US10488912B1 (en) * | 2017-01-27 | 2019-11-26 | Digimarc Corporation | Method and apparatus for analyzing sensor data |
| JP2018191209A (ja) * | 2017-05-10 | 2018-11-29 | オリンパス株式会社 | 情報記録装置、情報記録システム及び情報記録装置の制御方法 |
| US20190088108A1 (en) * | 2017-09-18 | 2019-03-21 | Qualcomm Incorporated | Camera tampering detection |
| US10574890B2 (en) * | 2018-01-12 | 2020-02-25 | Movidius Ltd. | Methods and apparatus to operate a mobile camera for low-power usage |
| US11301022B2 (en) * | 2018-03-06 | 2022-04-12 | Motorola Mobility Llc | Methods and electronic devices for determining context while minimizing high-power sensor usage |
| US11429192B2 (en) | 2018-06-05 | 2022-08-30 | Google Llc | Confidence-based application-specific user interactions |
| WO2019236764A1 (en) * | 2018-06-05 | 2019-12-12 | Google Llc | Confidence-based application-specific user interactions |
| EP3776008B1 (en) * | 2018-06-05 | 2022-07-27 | Google LLC | Method and electronic device for ultrasonic sensing in smart devices |
| US12001614B2 (en) | 2019-05-07 | 2024-06-04 | Google Llc | Confidence-based application-specific user interactions |
| DE102019205079A1 (de) * | 2018-06-19 | 2019-12-19 | Robert Bosch Gmbh | Selektive Deaktivierung von Recheneinheiten für künstliche neuronale Netzwerke |
| CN109299315B (zh) * | 2018-09-03 | 2023-03-28 | 腾讯科技(深圳)有限公司 | 多媒体资源分类方法、装置、计算机设备及存储介质 |
| US10915995B2 (en) | 2018-09-24 | 2021-02-09 | Movidius Ltd. | Methods and apparatus to generate masked images based on selective privacy and/or location tracking |
| US10524461B1 (en) * | 2018-09-25 | 2020-01-07 | Jace W. Files | Pest detector to identify a type of pest using machine learning |
| US11244050B2 (en) * | 2018-12-03 | 2022-02-08 | Mayachitra, Inc. | Malware classification and detection using audio descriptors |
| KR102257325B1 (ko) * | 2018-12-10 | 2021-05-27 | 한국과학기술원 | 다중 서비스 요청 및 맥락인지 기반의 IoT 카메라 가상화 장치 및 방법 |
| US11094114B2 (en) * | 2019-02-08 | 2021-08-17 | Ursa Space Systems Inc. | Satellite SAR artifact suppression for enhanced three-dimensional feature extraction, change detection, and visualizations |
| CN111832366B (zh) | 2019-04-22 | 2024-04-02 | 富联精密电子(天津)有限公司 | 图像识别装置及方法 |
| TWI723383B (zh) * | 2019-04-22 | 2021-04-01 | 鴻齡科技股份有限公司 | 圖像識別裝置及方法 |
| US11157777B2 (en) * | 2019-07-15 | 2021-10-26 | Disney Enterprises, Inc. | Quality control systems and methods for annotated content |
| CN110531641B (zh) * | 2019-08-19 | 2020-10-16 | 深圳市晨北科技有限公司 | 控制终端设备的方法、控制装置及终端设备 |
| US11645579B2 (en) | 2019-12-20 | 2023-05-09 | Disney Enterprises, Inc. | Automated machine learning tagging and optimization of review procedures |
| US11635802B2 (en) * | 2020-01-13 | 2023-04-25 | Sony Interactive Entertainment Inc. | Combined light intensity based CMOS and event detection sensor for high speed predictive tracking and latency compensation in virtual and augmented reality HMD systems |
| EP3855348A1 (en) * | 2020-01-27 | 2021-07-28 | Microsoft Technology Licensing, LLC | Error management |
| US11119587B1 (en) * | 2020-03-25 | 2021-09-14 | Pixart Imaging Inc. | Computer readable recording medium can perform image sensing system control method and image sensing system |
| JP2021174135A (ja) * | 2020-04-22 | 2021-11-01 | ソニーセミコンダクタソリューションズ株式会社 | 画像認識装置及び画像認識方法 |
| USD989412S1 (en) | 2020-05-11 | 2023-06-13 | Shenzhen Liyi99.Com, Ltd. | Double-tier pet water fountain |
| CN111814745B (zh) * | 2020-07-31 | 2024-05-10 | Oppo广东移动通信有限公司 | 手势识别方法、装置、电子设备及存储介质 |
| KR102730355B1 (ko) * | 2020-09-24 | 2024-11-15 | 한국전자통신연구원 | 저전력 시스템-온-칩 및 그것의 동작 방법 |
| US11790677B2 (en) * | 2020-10-01 | 2023-10-17 | Bank Of America Corporation | System for distributed server network with embedded image decoder as chain code program runtime |
| USD993548S1 (en) | 2021-01-15 | 2023-07-25 | Shenzhen Liyi99.Com, Ltd. | Pet water fountain |
| USD1003727S1 (en) | 2021-01-15 | 2023-11-07 | Aborder Products, Inc. | Container |
| JP2024512523A (ja) * | 2021-03-23 | 2024-03-19 | クアルコム,インコーポレイテッド | 組込みシステム上でシーケンシャルセンサデータの分類を再開するための状態変化検出 |
| US12375799B2 (en) | 2021-06-02 | 2025-07-29 | Qualcomm Incorporated | Low power object detection |
| USD1013974S1 (en) | 2021-06-02 | 2024-02-06 | Aborder Products, Inc. | Pet water fountain |
| US11308775B1 (en) | 2021-08-13 | 2022-04-19 | Sai Group Limited | Monitoring and tracking interactions with inventory in a retail environment |
| US11302161B1 (en) | 2021-08-13 | 2022-04-12 | Sai Group Limited | Monitoring and tracking checkout activity in a retail environment |
| CN113836358B (zh) * | 2021-09-14 | 2024-11-12 | 北京百度网讯科技有限公司 | 数据处理方法、装置、电子设备及存储介质 |
| GB2624150A (en) | 2022-11-01 | 2024-05-15 | Advanced Risc Mach Ltd | Methods and apparatuses for processing image data |
| CN116055864A (zh) * | 2022-12-27 | 2023-05-02 | 歌尔科技有限公司 | 设备的启动方法、装置、设备及存储介质 |
| US12475583B2 (en) * | 2023-04-28 | 2025-11-18 | Qualcomm Incorporated | Stereo vision with census transform |
| US12592048B2 (en) * | 2023-06-07 | 2026-03-31 | Schlumberger Technology Corporation | System and method for creating anchors in augmented or mixed reality |
| US20250234098A1 (en) * | 2024-01-17 | 2025-07-17 | Apple Inc. | Computer Vision Processing Circuitry |
| US20250278871A1 (en) * | 2024-02-29 | 2025-09-04 | L'oreal | Apparatus, systems and methods for an effects rendering pipeline, including makeup effects |
Family Cites Families (66)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1994003014A1 (en) | 1992-07-24 | 1994-02-03 | Koz Mark C | Low power video security monitoring system |
| US5418714A (en) | 1993-04-08 | 1995-05-23 | Eyesys Laboratories, Inc. | Method and apparatus for variable block size interpolative coding of images |
| US5713055A (en) | 1996-11-25 | 1998-01-27 | Eastman Kodak Company | Ambient light sensitive automatic flash control circuit |
| IL122299A (en) * | 1997-11-25 | 2003-11-23 | Broadcom Corp | Video encoding device |
| US6895048B2 (en) | 1998-03-20 | 2005-05-17 | International Business Machines Corporation | Adaptive encoding of a sequence of still frames or partially still frames within motion video |
| US6539055B1 (en) * | 1999-12-03 | 2003-03-25 | Intel Corporation | Scene change detector for video data |
| JP4080276B2 (ja) | 2002-08-27 | 2008-04-23 | 富士フイルム株式会社 | オブジェクト抽出方法および装置ならびにプログラム |
| JP4231320B2 (ja) | 2003-03-31 | 2009-02-25 | 本田技研工業株式会社 | 移動体の検出装置 |
| JP2005176301A (ja) | 2003-11-11 | 2005-06-30 | Canon Inc | 画像処理装置、ネットワークカメラシステム、画像処理方法、及びプログラム |
| US7668376B2 (en) | 2004-06-30 | 2010-02-23 | National Instruments Corporation | Shape feature extraction and classification |
| JP2006079387A (ja) | 2004-09-10 | 2006-03-23 | Seiko Epson Corp | 集積回路装置及びマイクロコンピュータ |
| FR2875627B1 (fr) * | 2004-09-21 | 2007-03-16 | Canon Res Ct France S A S Soc | Procede de determination d'un descripteur d'image, procede de comparaison d'images, procede de recherche d'image et dispositifs associes |
| KR100682906B1 (ko) * | 2004-12-09 | 2007-02-15 | 삼성전자주식회사 | 부스트 알고리즘을 이용한 영상의 얼굴 검출 장치 및 방법 |
| US7945938B2 (en) * | 2005-05-11 | 2011-05-17 | Canon Kabushiki Kaisha | Network camera system and control method therefore |
| US20070028286A1 (en) | 2005-07-28 | 2007-02-01 | Greene David P | Systems, methods, and media for detecting content change in a streaming image system |
| CN100517374C (zh) * | 2005-12-29 | 2009-07-22 | 佳能株式会社 | 从复杂背景文档图像提取文本的装置、方法 |
| JP2007194850A (ja) | 2006-01-18 | 2007-08-02 | Sharp Corp | 画像処理方法、画像処理装置、画像形成装置、及びコンピュータプログラム |
| TW200736900A (en) * | 2006-03-31 | 2007-10-01 | Benq Corp | Computer system capable of operating functions according to scene change and method thereof |
| US7668369B2 (en) | 2006-04-26 | 2010-02-23 | Hewlett-Packard Development Company, L.P. | Using camera metadata to classify images into scene type classes |
| US8134642B2 (en) * | 2007-01-24 | 2012-03-13 | Focaltech Systems, Ltd. | Method and system for converting interleaved video fields to progressive video frames in spatial domain |
| US7916971B2 (en) * | 2007-05-24 | 2011-03-29 | Tessera Technologies Ireland Limited | Image processing method and apparatus |
| JP4964044B2 (ja) * | 2007-07-06 | 2012-06-27 | 三菱電機株式会社 | 顔検出装置及び顔検出方法 |
| US7683305B2 (en) | 2007-09-27 | 2010-03-23 | Aptina Imaging Corporation | Method and apparatus for ambient light detection |
| JP4660827B2 (ja) * | 2007-11-16 | 2011-03-30 | Necカシオモバイルコミュニケーションズ株式会社 | 映像信号処理装置、コントラスト制御方法及びプログラム |
| US20100027663A1 (en) * | 2008-07-29 | 2010-02-04 | Qualcomm Incorporated | Intellegent frame skipping in video coding based on similarity metric in compressed domain |
| US8170278B2 (en) | 2008-08-06 | 2012-05-01 | Sri International | System and method for detecting and tracking an object of interest in spatio-temporal space |
| US8995731B2 (en) * | 2008-11-26 | 2015-03-31 | Medtronic, Inc. | Image-based characterization of implanted medical leads |
| JP5002575B2 (ja) | 2008-11-28 | 2012-08-15 | 日本電信電話株式会社 | 非定常度推定装置、非定常度推定方法、非定常度推定プログラム |
| JP2010136292A (ja) | 2008-12-08 | 2010-06-17 | Toshiba Corp | 画像処理装置 |
| US20120033040A1 (en) * | 2009-04-20 | 2012-02-09 | Dolby Laboratories Licensing Corporation | Filter Selection for Video Pre-Processing in Video Applications |
| JP4830007B2 (ja) * | 2009-06-22 | 2011-12-07 | 株式会社沖データ | 画像形成装置 |
| US8339459B2 (en) * | 2009-09-16 | 2012-12-25 | Microsoft Corporation | Multi-camera head pose tracking |
| KR101688655B1 (ko) | 2009-12-03 | 2016-12-21 | 엘지전자 주식회사 | 사용자의 프레전스 검출에 의한 제스쳐 인식 장치의 전력 제어 방법 |
| KR101652110B1 (ko) * | 2009-12-03 | 2016-08-29 | 엘지전자 주식회사 | 사용자의 제스쳐로 제어가능한 장치의 전력 제어 방법 |
| CN102147851B (zh) | 2010-02-08 | 2014-06-04 | 株式会社理光 | 多角度特定物体判断设备及多角度特定物体判断方法 |
| US8971628B2 (en) | 2010-07-26 | 2015-03-03 | Fotonation Limited | Face detection using division-generated haar-like features for illumination invariance |
| US8625902B2 (en) * | 2010-07-30 | 2014-01-07 | Qualcomm Incorporated | Object recognition using incremental feature extraction |
| US8599934B2 (en) | 2010-09-08 | 2013-12-03 | Cisco Technology, Inc. | System and method for skip coding during video conferencing in a network environment |
| US8467611B2 (en) | 2010-12-10 | 2013-06-18 | Eastman Kodak Company | Video key-frame extraction using bi-level sparsity |
| JP6106921B2 (ja) * | 2011-04-26 | 2017-04-05 | 株式会社リコー | 撮像装置、撮像方法および撮像プログラム |
| ES2906422T3 (es) | 2011-06-24 | 2022-04-18 | Tomra Systems Asa | Procedimiento y aparato para detectar intentos de fraude en máquinas expendedoras inversas |
| CN103049733B (zh) | 2011-10-11 | 2016-02-03 | 株式会社理光 | 人脸检测方法和人脸检测设备 |
| JP5805511B2 (ja) | 2011-12-01 | 2015-11-04 | セコム株式会社 | 画像監視装置 |
| US9063574B1 (en) * | 2012-03-14 | 2015-06-23 | Amazon Technologies, Inc. | Motion detection systems for electronic devices |
| US8965046B2 (en) * | 2012-03-16 | 2015-02-24 | Qualcomm Technologies, Inc. | Method, apparatus, and manufacture for smiling face detection |
| US9600744B2 (en) * | 2012-04-24 | 2017-03-21 | Stmicroelectronics S.R.L. | Adaptive interest rate control for visual search |
| US8971642B2 (en) | 2012-04-26 | 2015-03-03 | Google Inc. | Testing the rendering of visual content |
| KR101303124B1 (ko) | 2012-05-31 | 2013-09-09 | 삼성에스디에스 주식회사 | 특징점 기술자에 의한 객체 추적장치 및 방법, 그리고 에러 특징점 제거장치 및 방법 |
| KR101925412B1 (ko) * | 2012-07-03 | 2018-12-05 | 삼성전자주식회사 | 휴대 단말기의 슬립 모드 제어 방법 및 장치 |
| US20150294189A1 (en) | 2012-07-23 | 2015-10-15 | Selim BenHimane | Method of providing image feature descriptors |
| US9264584B2 (en) * | 2012-09-19 | 2016-02-16 | Tata Consultancy Services Limited | Video synchronization |
| US9002109B2 (en) | 2012-10-09 | 2015-04-07 | Google Inc. | Color correction based on multiple images |
| US9165196B2 (en) | 2012-11-16 | 2015-10-20 | Intel Corporation | Augmenting ADAS features of a vehicle with image processing support in on-board vehicle platform |
| US9183460B2 (en) * | 2012-11-30 | 2015-11-10 | Google Inc. | Detecting modified images |
| WO2014088621A1 (en) * | 2012-12-03 | 2014-06-12 | Google, Inc. | System and method for detecting gestures |
| US9245276B2 (en) * | 2012-12-12 | 2016-01-26 | Verint Systems Ltd. | Time-in-store estimation using facial recognition |
| US9092665B2 (en) * | 2013-01-30 | 2015-07-28 | Aquifi, Inc | Systems and methods for initializing motion tracking of human hands |
| US9633272B2 (en) * | 2013-02-15 | 2017-04-25 | Yahoo! Inc. | Real time object scanning using a mobile phone and cloud-based visual search engine |
| US9202129B2 (en) | 2013-03-12 | 2015-12-01 | Qualcomm Incorporated | Reducing object detection time by utilizing space localization of features |
| US9661221B2 (en) | 2013-03-15 | 2017-05-23 | Qualcomm Incorporated | Always-on camera sampling strategies |
| US10091419B2 (en) | 2013-06-14 | 2018-10-02 | Qualcomm Incorporated | Computer vision application processing |
| FR3009635B1 (fr) * | 2013-08-08 | 2016-08-19 | St Microelectronics Sa | Procede de recherche d'une image similaire dans une banque d'images a partir d'une image de reference |
| US9129189B2 (en) * | 2013-08-14 | 2015-09-08 | Qualcomm Incorporated | Performing vocabulary-based visual search using multi-resolution feature descriptors |
| US9443134B2 (en) * | 2014-05-15 | 2016-09-13 | Adobe Systems Incorporated | Propagating object selection across multiple images |
| US9836591B2 (en) | 2014-12-16 | 2017-12-05 | Qualcomm Incorporated | Managing latency and power in a heterogeneous distributed biometric authentication hardware |
| GB2553105B (en) * | 2016-08-22 | 2019-09-04 | Canon Kk | Method and system for determining a relationship between two regions of a scene |
-
2014
- 2014-06-12 US US14/303,491 patent/US10091419B2/en active Active
- 2014-06-12 US US14/303,490 patent/US10694106B2/en active Active
- 2014-06-13 HU HUE14737434A patent/HUE045984T2/hu unknown
- 2014-06-13 ES ES14737434T patent/ES2753373T3/es active Active
- 2014-06-13 CN CN201480033498.XA patent/CN105284102B/zh not_active Expired - Fee Related
- 2014-06-13 KR KR1020157035988A patent/KR20160021131A/ko not_active Abandoned
- 2014-06-13 WO PCT/US2014/042353 patent/WO2014201386A1/en not_active Ceased
- 2014-06-13 WO PCT/US2014/042319 patent/WO2014201362A2/en not_active Ceased
- 2014-06-13 JP JP2016519688A patent/JP6422955B2/ja not_active Expired - Fee Related
- 2014-06-13 EP EP14737434.2A patent/EP3008892B1/en active Active
- 2014-06-13 EP EP14737431.8A patent/EP3008891B1/en not_active Not-in-force
- 2014-06-13 CN CN201480032471.9A patent/CN105264879B/zh active Active
- 2014-06-13 KR KR1020157035986A patent/KR20160021130A/ko not_active Withdrawn
- 2014-06-13 JP JP2016519681A patent/JP2016532182A/ja not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| EP3008891B1 (en) | 2020-10-14 |
| WO2014201362A3 (en) | 2015-03-05 |
| US20140368626A1 (en) | 2014-12-18 |
| EP3008892A1 (en) | 2016-04-20 |
| US10091419B2 (en) | 2018-10-02 |
| HUE045984T2 (hu) | 2020-01-28 |
| CN105264879A (zh) | 2016-01-20 |
| EP3008891A2 (en) | 2016-04-20 |
| KR20160021131A (ko) | 2016-02-24 |
| WO2014201386A1 (en) | 2014-12-18 |
| US10694106B2 (en) | 2020-06-23 |
| EP3008892B1 (en) | 2019-07-31 |
| WO2014201362A2 (en) | 2014-12-18 |
| CN105284102A (zh) | 2016-01-27 |
| US20140368688A1 (en) | 2014-12-18 |
| CN105264879B (zh) | 2019-01-08 |
| JP2016529585A (ja) | 2016-09-23 |
| JP6422955B2 (ja) | 2018-11-14 |
| KR20160021130A (ko) | 2016-02-24 |
| JP2016532182A (ja) | 2016-10-13 |
| CN105284102B (zh) | 2018-07-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2753373T3 (es) | Procesamiento de aplicación de visión informática | |
| KR101826189B1 (ko) | 올웨이즈-온 카메라 샘플링 전략들 | |
| KR102496225B1 (ko) | 영상 인코딩 방법 및 이를 지원하는 전자 장치 | |
| US9986211B2 (en) | Low-power always-on face detection, tracking, recognition and/or analysis using events-based vision sensor | |
| Zarepour et al. | A context-based privacy preserving framework for wearable visual lifeloggers | |
| WO2016088611A1 (ja) | 情報処理装置、情報処理方法及びコンピュータプログラム | |
| TWI391881B (zh) | Dodge image processing capacity of the fall detection and care system | |
| TWI775801B (zh) | 低功率虹膜掃描初始化 | |
| KR20240026415A (ko) | 볼링공 궤적정보 표시 서비스 제공 시스템 | |
| anonymous | disease control: an inside view: Acceleromters in smartphones can be used to co-locate train passengers at carriage level, helping to monitor the spread of epidemic disease |