ES2925500T3 - Reconocimiento de imágenes - Google Patents
Reconocimiento de imágenes Download PDFInfo
- Publication number
- ES2925500T3 ES2925500T3 ES09741408T ES09741408T ES2925500T3 ES 2925500 T3 ES2925500 T3 ES 2925500T3 ES 09741408 T ES09741408 T ES 09741408T ES 09741408 T ES09741408 T ES 09741408T ES 2925500 T3 ES2925500 T3 ES 2925500T3
- Authority
- ES
- Spain
- Prior art keywords
- image
- human face
- light source
- camera
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/12—Details of acquisition arrangements; Constructional details thereof
- G06V10/14—Optical characteristics of the device performing the acquisition or on the illumination arrangements
- G06V10/143—Sensing or illuminating at different wavelengths
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/56—Cameras or camera modules comprising electronic image sensors; Control thereof provided with illuminating means
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/166—Detection; Localisation; Normalisation using acquisition arrangements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Studio Devices (AREA)
- Drying Of Semiconductors (AREA)
- Holo Graphy (AREA)
- Control Of Motors That Do Not Use Commutators (AREA)
- Image Analysis (AREA)
Abstract
Un sujeto (1) es iluminado por una fuente de luz (2) y observado por un par de cámaras (3). Las salidas de las cámaras (3) se envían a un procesador de imágenes (4), operado bajo el control de un controlador (5), que también controla la operación de la fuente de luz (2). La fuente de luz (2) transmite radiación en un rango de frecuencia que se limita sustancialmente a una región de mayor opacidad en el espectro de transmisión atmosférica. Esto puede permitir discriminar la iluminación con bastante claridad, incluso a distancias relativamente grandes y con luz diurna intensa. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Reconocimiento de imágenes
La presente invención se refiere a la formación de imágenes en 3D de rostros humanos y se refiere particularmente a proporcionar iluminación para facilitar el reconocimiento de imágenes.
El reconocimiento de imágenes por máquina continúa atrayendo un interés considerable. Dos ejemplos de literatura en la técnica se pueden encontrar en los documentos WO 03/054779 y WO 2005/038700. Ambos están relacionados con el reconocimiento de imágenes naturales y, en particular, rostros humanos. Los beneficios potenciales de reconocer rostros humanos de manera confiable por motivos de seguridad son evidentes. Sin embargo, aún quedan desafíos para lograr esto KIYOTAKA AKASAKA y otros: "A Sensor for Simultaneously Capturing Texture and Shape by Projecting Structured Infrared Light", IMAGEN Y MODELADO DIGITAL 3-D, 2007. 3DIM'07. SEXTA CONFERENCIA INTERNACIONAL SOBRE, IEEE, PISCATAWAY, NJ, EE. UU., 1 de agosto de 2007 (01-08-2007), páginas 375-381, XP031131019, ISBN: 978-0-7695-2939-4 describe un sistema para la captura simultánea de la textura y la forma de un objeto en movimiento en tiempo real. Denise D Padilla y otros: "Advancements in Sensing and Perception using Structured Lighting Techniques: An LDRD Final Report", sAn D REPORT SAND2005-5935, 1 de septiembre de 2005 (01-09-2005), páginas 1-31, XP055640406, Obtenido de Internet: URL: https://pdfs.semanticscholar.org/b271/457592a0b0a6e72ee78cb7da9abcfb787800.pdf [recuperado el 08-11-2019] describe un sensor de iluminación estructurado en 3D ligero, resistente, de bajo costo y seguro para los ojos para usar en aplicaciones al aire libre a plena luz del día. El documento US 2004/125222 A1 (BRADSKI Ga RY R [Us ] y otros) 1 de julio de 2004 (01-07-2004) describe un sensor para una cámara de vídeo que tiene dos uniones a una profundidad específica en un sustrato semiconductor para detectar las respectivas radiaciones infrarrojas y visibles. LIEBE CC y otros: "Three dimensional imaging utilizing structured light", CONFERENCIA AEROESPa CiaL, 2004. ACTAS. 2004 IEEE, IEEE, PISCATAWAY, NJ, EE. UU., vol. 4, 6 de marzo de 2004(06-03-2004), páginas 2647-2655, XP010748388, describe un método de detección remota de la estructura tridimensional de la proximidad utilizando un láser, una rejilla holográfica y una única cámara CCD normal.
Si un sujeto se coloca en una posición determinada bajo condiciones de iluminación controladas, capturar una imagen del sujeto y, posteriormente, reconocer la imagen capturada puede ser relativamente sencillo. Sin embargo, estas condiciones previas no son muy prácticas para muchas circunstancias cotidianas. En realidad, los sujetos pueden estar a distancias variables de las cámaras, la iluminación puede variar, el sujeto puede estar en una aglomeración (otros objetos en la escena) y el sujeto puede asumir diferentes orientaciones.
Una forma conocida de tratar con diferentes orientaciones del sujeto es usar una imagen 3D. Esto puede superar el problema de orientación, ya que después de la captura, la cara se puede volver a alinear al frente para reconocerla. Para ayudar a la captura de la imagen 3D, es posible proyectar un patrón de luz predeterminado sobre el sujeto, lo que a menudo se denomina "luz estructurada". Esto puede ayudar considerablemente en la construcción de la imagen 3D.
Las condiciones de iluminación controladas son a menudo un factor crítico en la captura de imágenes que son confiables para fines de reconocimiento. Esto a menudo implica tanto la provisión de iluminación controlada como la exclusión de fuentes de iluminación ambiental no controladas.
Los ejemplos preferidos de la presente invención tienen como objetivo proporcionar la iluminación de un sujeto de tal manera que se pueda capturar una imagen de manera confiable desde una distancia del orden de, digamos, 3 a 5 metros, en condiciones al aire libre, que incluyen la luz solar brillante, sin que la luz proyectada sea visible para el sujeto y los demás.
Los ejemplos preferidos de la presente invención pueden usarse en el contexto del reconocimiento de una imagen, una imagen 3-D de un rostro humano.
De acuerdo con la presente invención, se proporciona un método para formar una imagen 3D de un rostro humano a la luz del día en un ambiente al aire libre, a una distancia de al menos 3 metros, que comprende las etapas de:
iluminar el rostro humano mediante un medio de iluminación que comprende una fuente de luz coherente y transmite radiación a una longitud de onda de 940 nanómetros, el medio de iluminación que proyecta un patrón sobre el sujeto;
capturar mediante un medio de cámara, a una distancia de al menos 3 metros del rostro humano, una imagen del rostro humano iluminado por el medio de iluminación, el medio de cámara que comprende al menos una cámara dispuesta para capturar los componentes de una imagen 3D; y
recibir y procesar por medio de un procesador de imágenes la imagen de la o cada cámara para calcular la imagen 3D de la o cada imagen recibida.
Dicho rostro humano puede estar a una distancia de al menos 5 metros de dicho medio de cámara.
Dicho medio de cámara puede comprender un par de cámaras.
Preferentemente, dicho patrón es un patrón moteado.
Preferentemente, dicha fuente de luz coherente comprende un láser.
Un método de acuerdo con cualquiera de los aspectos anteriores de la invención incluye preferentemente la etapa de comparar la imagen 3D calculada con una pluralidad de imágenes almacenadas y producir un resultado de reconocimiento para indicar si la imagen 3D calculada excede un umbral de similitud con al menos una de las imágenes almacenadas.
Para una mejor comprensión de la invención, y para mostrar cómo se pueden llevar a cabo sus modalidades, se hará referencia ahora, a manera de ejemplo, a los dibujos diagramáticos adjuntos en los que:
La Figura 1 es una representación esquemática de un sistema de reconocimiento de imágenes; y
La Figura 2 es un gráfico que representa un espectro de transmisión atmosférico típico, en la banda de onda de 300 a 1200 nanómetros.
En el sistema de reconocimiento de imágenes de la Figura 1, un sujeto 1 es iluminado por una fuente de luz 2 y observado por un par de cámaras 3. Las salidas de las cámaras 3 se envían a un procesador de imágenes 4, operado bajo el control de un controlador 5, que también controla la operación de la fuente de luz 2. El sujeto 1 es un rostro humano, que debe ser reconocido.
El par de cámaras 3 proporciona los componentes para una imagen 3D del sujeto 1, la imagen 3D se forma por el procesador de imágenes 4 a partir de las imágenes recibidas de las cámaras 3. Bajo el control del controlador 5, el procesador de imágenes 4 se dispone para comparar una imagen 3-D capturada con varias imágenes almacenadas, con el fin de buscar el reconocimiento de la imagen capturada. Una unidad de reconocimiento 6 se dispone para producir datos de reconocimiento para indicar si la imagen capturada supera un umbral de similitud con al menos una de las imágenes almacenadas. La tecnología para formar imágenes 3-D y reconocer imágenes capturadas de un banco de datos de imágenes almacenadas se conoce por otras publicaciones, que incluyen las expuestas anteriormente. Como tal tecnología no es el enfoque particular de la presente modalidad, no se describe aquí con más detalle.
En lugar de un par de cámaras 3, puede usarse una sola cámara o más de dos cámaras.
El enfoque de la modalidad de la Figura 1 es la manera en que el sujeto 1 es iluminado por la fuente de luz 2. En este ejemplo, la fuente de luz 2 es una fuente de luz coherente que comprende un láser de 940 nm de longitud de onda y se dispone para proyectar un patrón predeterminado (es decir, "luz estructurada") sobre el sujeto 1. La razón para seleccionar una longitud de onda de 940 nm es que representa una caída en el espectro de transmisión atmosférica natural en condiciones típicas, como se muestra en la Figura 2.
El gráfico de la Figura 2 demuestra que, en el intervalo ilustrado de longitud de onda (correspondiente a las frecuencias del infrarrojo cercano), hay tres caídas pronunciadas en el espectro de transmisión. La primero está a unos 760 nm (justo al borde de la luz roja visible), debido a la presencia de oxígeno. La siguiente está a unos 940 nm, debido a la presencia de vapor de agua y la tercero, también debido a la presencia de vapor de agua, está a unos 1130 nm. Se apreciará que cada caída o región detransmisibilidad reducida corresponde a un pico o región de opacidad aumentada
Al iluminar el sujeto 1 a 940 nm, la iluminación puede discriminarse con bastante claridad, incluso a distancias relativamente grandes de 3 a 5 metros, e incluso con luz solar brillante. De cualquier otra manera es difícil combatir la intensidad de la luz solar y evitar que sature el patrón proyectado.
Por lo tanto, el ejemplo ilustrado puede proporcionar las ventajas extremadamente útiles de poder capturar y reconocer imágenes a distancias relativamente grandes (en el contexto del reconocimiento de imágenes) y en prácticamente cualquier condición de iluminación.
El patrón proyectado por la fuente de luz 2 puede ser cualquier patrón adecuado. Un patrón "moteado" (patrón óptico pseudoaleatorio) se usa a menudo para el reconocimiento de objetos. Sin embargo, pueden usarse otros patrones que comprenden líneas, cuadrículas o cualquier patrón predeterminado. El procesador 4 puede hacer uso de patrones para crear mejores imágenes 3D (más completas y precisas). Puede usarse más de una fuente de luz 2. Puede usarse una fuente de luz alternativa a un láser, por ejemplo, un LED.
En esta descripción, el verbo "comprende" tiene su significado normal en el diccionario, para denotar la inclusión no exclusiva. Es decir, el uso de la palabra "comprende" (o cualquiera de sus derivados) para incluir una característica o más, no excluye la posibilidad de incluir también características adicionales.
Claims (6)
1. Un método para formar una imagen 3D de un rostro humano a la luz del día en un ambiente al aire libre, a una distancia de al menos 3 metros, que comprende las etapas de:
iluminar el rostro humano mediante un medio de iluminación que comprende una fuente de luz coherente y transmite radiación a una longitud de onda de 940 nanómetros, el medio de iluminación que proyecta un patrón sobre el rostro humano;
capturar mediante un medio de cámara, a una distancia de al menos 3 metros del rostro humano, una imagen del rostro humano iluminado por el medio de iluminación, el medio de cámara que comprende al menos una cámara dispuesta para capturar los componentes de una imagen 3D; y
recibir y procesar por medio de un procesador de imágenes la imagen de la o cada cámara para calcular la imagen 3D de la o cada imagen recibida.
2. Un método de acuerdo con la reivindicación 1, en donde dicho rostro humano está a una distancia de al menos 5 metros de dicho medio de cámara.
3. Un método de acuerdo con la reivindicación 1 o 2, en donde dicho medio de cámara comprende un par de cámaras.
4. Un método de acuerdo con la reivindicación 1, 2 o 3, en donde dicho patrón es un patrón moteado.
5. Un método de acuerdo con cualquiera de las reivindicaciones anteriores, en donde dicha fuente de luz coherente comprende un láser.
6. Un método de acuerdo con cualquiera de las reivindicaciones anteriores, que incluye la etapa de comparar la imagen 3D calculada con una pluralidad de imágenes almacenadas y producir un resultado de reconocimiento para indicar si la imagen 3D calculada excede un umbral de similitud con al menos una de las imágenes almacenadas.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| GB0817647A GB2463724B (en) | 2008-09-26 | 2008-09-26 | Forming 3D images |
| PCT/GB2009/051260 WO2010035046A1 (en) | 2008-09-26 | 2009-09-25 | Image recognition |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2925500T3 true ES2925500T3 (es) | 2022-10-18 |
Family
ID=40019604
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES09741408T Active ES2925500T3 (es) | 2008-09-26 | 2009-09-25 | Reconocimiento de imágenes |
Country Status (8)
| Country | Link |
|---|---|
| US (1) | US8860788B2 (es) |
| EP (1) | EP2342892B1 (es) |
| ES (1) | ES2925500T3 (es) |
| GB (1) | GB2463724B (es) |
| HU (1) | HUE059660T2 (es) |
| PL (1) | PL2342892T3 (es) |
| PT (1) | PT2342892T (es) |
| WO (1) | WO2010035046A1 (es) |
Families Citing this family (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8417385B2 (en) * | 2009-07-01 | 2013-04-09 | Pixart Imaging Inc. | Home appliance control device |
| CN110717446B (zh) | 2014-03-13 | 2023-11-07 | 日本电气株式会社 | 检测设备、检测方法和记录介质 |
| CN106156769A (zh) * | 2016-07-14 | 2016-11-23 | 上海摩象网络科技有限公司 | 基于特征频率光学系统的多目标识别技术 |
| GB2574669A (en) | 2018-06-15 | 2019-12-18 | The Face Recognition Company Ltd | Recognition of 3D objects |
Family Cites Families (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5016282A (en) * | 1988-07-14 | 1991-05-14 | Atr Communication Systems Research Laboratories | Eye tracking image pickup apparatus for separating noise from feature portions |
| GB2307816B (en) * | 1995-12-01 | 2000-03-29 | Fuji International Productions | Television production using infra-red light |
| US6320610B1 (en) * | 1998-12-31 | 2001-11-20 | Sensar, Inc. | Compact imaging device incorporating rotatably mounted cameras |
| JP2000028315A (ja) * | 1998-07-13 | 2000-01-28 | Honda Motor Co Ltd | 対象物検出装置 |
| US8042740B2 (en) * | 2000-11-24 | 2011-10-25 | Metrologic Instruments, Inc. | Method of reading bar code symbols on objects at a point-of-sale station by passing said objects through a complex of stationary coplanar illumination and imaging planes projected into a 3D imaging volume |
| EP1689172B1 (en) * | 2001-06-05 | 2016-03-09 | Microsoft Technology Licensing, LLC | Interactive video display system |
| GB2384095B (en) | 2001-12-10 | 2004-04-28 | Cybula Ltd | Image recognition |
| US7174033B2 (en) * | 2002-05-22 | 2007-02-06 | A4Vision | Methods and systems for detecting and recognizing an object based on 3D image data |
| US7154157B2 (en) * | 2002-12-30 | 2006-12-26 | Intel Corporation | Stacked semiconductor radiation sensors having color component and infrared sensing capability |
| JP2005017863A (ja) * | 2003-06-27 | 2005-01-20 | Oki Electric Ind Co Ltd | 撮影装置および撮影方法 |
| US8705808B2 (en) * | 2003-09-05 | 2014-04-22 | Honeywell International Inc. | Combined face and iris recognition system |
| GB2428325B (en) * | 2003-10-09 | 2007-08-01 | Univ York | Image Recognition |
| WO2007105205A2 (en) * | 2006-03-14 | 2007-09-20 | Prime Sense Ltd. | Three-dimensional sensing using speckle patterns |
| KR20070081773A (ko) * | 2006-02-13 | 2007-08-17 | 스마트 와이어레스 가부시키가이샤 | 적외선 얼굴 인증장치, 이를 구비하는 휴대 단말기 및보안장치 |
| US20070229850A1 (en) * | 2006-04-04 | 2007-10-04 | Boxternal Logics, Llc | System and method for three-dimensional image capture |
| US7912252B2 (en) * | 2009-02-06 | 2011-03-22 | Robert Bosch Gmbh | Time-of-flight sensor-assisted iris capture system and method |
-
2008
- 2008-09-26 GB GB0817647A patent/GB2463724B/en active Active
-
2009
- 2009-09-25 WO PCT/GB2009/051260 patent/WO2010035046A1/en not_active Ceased
- 2009-09-25 PL PL09741408.0T patent/PL2342892T3/pl unknown
- 2009-09-25 PT PT97414080T patent/PT2342892T/pt unknown
- 2009-09-25 HU HUE09741408A patent/HUE059660T2/hu unknown
- 2009-09-25 ES ES09741408T patent/ES2925500T3/es active Active
- 2009-09-25 EP EP09741408.0A patent/EP2342892B1/en active Active
- 2009-09-25 US US13/121,243 patent/US8860788B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| US8860788B2 (en) | 2014-10-14 |
| PT2342892T (pt) | 2022-08-30 |
| US20110261163A1 (en) | 2011-10-27 |
| HUE059660T2 (hu) | 2022-12-28 |
| GB2463724B (en) | 2011-05-04 |
| GB2463724A (en) | 2010-03-31 |
| EP2342892A1 (en) | 2011-07-13 |
| GB0817647D0 (en) | 2008-11-05 |
| PL2342892T3 (pl) | 2022-10-17 |
| EP2342892B1 (en) | 2022-05-25 |
| WO2010035046A1 (en) | 2010-04-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI723529B (zh) | 臉部辨識模組及臉部辨識方法 | |
| US20160044301A1 (en) | 3d modeling of imaged objects using camera position and pose to obtain accuracy with reduced processing requirements | |
| KR20230006795A (ko) | 편광을 사용한 센서 시스템 및 이미징 시스템의 증강 시스템 및 방법 | |
| CN107202554B (zh) | 同时具备摄影测量和三维扫描功能的手持式大尺度三维测量扫描仪系统 | |
| EP3423865B1 (en) | Gated imaging apparatus, system and method | |
| US8081797B2 (en) | Selective and adaptive illumination of a target | |
| CN104755874B (zh) | 具有多个光源的运动传感器装置 | |
| US10119808B2 (en) | Systems and methods for estimating depth from projected texture using camera arrays | |
| US9269145B2 (en) | System and method for automatically registering an image to a three-dimensional point set | |
| GB2582469A (en) | Systems and methods for motion capture | |
| ES2925500T3 (es) | Reconocimiento de imágenes | |
| CN109425306A (zh) | 深度测量组件 | |
| US9091748B2 (en) | Methods and apparatus for 3D UV imaging | |
| US20190098276A1 (en) | 3-d 360 degree depth projector | |
| CN110226184A (zh) | 用于机器感知的系统和方法 | |
| US20160267682A1 (en) | Object detection device | |
| WO2015098288A1 (ja) | 画像処理装置、および画像処理方法 | |
| CN101777123B (zh) | 一种基于红外投影标志点的视觉位置跟踪系统 | |
| JP2023532676A (ja) | 拡散照射及び構造化光用プロジェクタ | |
| CN104685318A (zh) | 具有多个光源的运动传感器装置 | |
| EP3030859A1 (en) | 3d mapping device for modeling of imaged objects using camera position and pose to obtain accuracy with reduced processing requirements | |
| EP3069100A2 (en) | Collimation and homogenization system for an led luminaire | |
| CN206905709U (zh) | 手持式大尺度三维测量扫描仪 | |
| WO2021048917A1 (ja) | 画像処理装置、3次元計測システム、画像処理方法 | |
| US9992472B1 (en) | Optoelectronic devices for collecting three-dimensional data |