ES2925500T3 - Reconocimiento de imágenes - Google Patents

Reconocimiento de imágenes Download PDF

Info

Publication number
ES2925500T3
ES2925500T3 ES09741408T ES09741408T ES2925500T3 ES 2925500 T3 ES2925500 T3 ES 2925500T3 ES 09741408 T ES09741408 T ES 09741408T ES 09741408 T ES09741408 T ES 09741408T ES 2925500 T3 ES2925500 T3 ES 2925500T3
Authority
ES
Spain
Prior art keywords
image
human face
light source
camera
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES09741408T
Other languages
English (en)
Inventor
James Austin
John Mcavoy
Julian Young
Mark Vernon
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Face Recognition Co Ltd
Original Assignee
Face Recognition Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Face Recognition Co Ltd filed Critical Face Recognition Co Ltd
Application granted granted Critical
Publication of ES2925500T3 publication Critical patent/ES2925500T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/143Sensing or illuminating at different wavelengths
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/56Cameras or camera modules comprising electronic image sensors; Control thereof provided with illuminating means
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Studio Devices (AREA)
  • Drying Of Semiconductors (AREA)
  • Holo Graphy (AREA)
  • Control Of Motors That Do Not Use Commutators (AREA)
  • Image Analysis (AREA)

Abstract

Un sujeto (1) es iluminado por una fuente de luz (2) y observado por un par de cámaras (3). Las salidas de las cámaras (3) se envían a un procesador de imágenes (4), operado bajo el control de un controlador (5), que también controla la operación de la fuente de luz (2). La fuente de luz (2) transmite radiación en un rango de frecuencia que se limita sustancialmente a una región de mayor opacidad en el espectro de transmisión atmosférica. Esto puede permitir discriminar la iluminación con bastante claridad, incluso a distancias relativamente grandes y con luz diurna intensa. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Reconocimiento de imágenes
La presente invención se refiere a la formación de imágenes en 3D de rostros humanos y se refiere particularmente a proporcionar iluminación para facilitar el reconocimiento de imágenes.
El reconocimiento de imágenes por máquina continúa atrayendo un interés considerable. Dos ejemplos de literatura en la técnica se pueden encontrar en los documentos WO 03/054779 y WO 2005/038700. Ambos están relacionados con el reconocimiento de imágenes naturales y, en particular, rostros humanos. Los beneficios potenciales de reconocer rostros humanos de manera confiable por motivos de seguridad son evidentes. Sin embargo, aún quedan desafíos para lograr esto KIYOTAKA AKASAKA y otros: "A Sensor for Simultaneously Capturing Texture and Shape by Projecting Structured Infrared Light", IMAGEN Y MODELADO DIGITAL 3-D, 2007. 3DIM'07. SEXTA CONFERENCIA INTERNACIONAL SOBRE, IEEE, PISCATAWAY, NJ, EE. UU., 1 de agosto de 2007 (01-08-2007), páginas 375-381, XP031131019, ISBN: 978-0-7695-2939-4 describe un sistema para la captura simultánea de la textura y la forma de un objeto en movimiento en tiempo real. Denise D Padilla y otros: "Advancements in Sensing and Perception using Structured Lighting Techniques: An LDRD Final Report", sAn D REPORT SAND2005-5935, 1 de septiembre de 2005 (01-09-2005), páginas 1-31, XP055640406, Obtenido de Internet: URL: https://pdfs.semanticscholar.org/b271/457592a0b0a6e72ee78cb7da9abcfb787800.pdf [recuperado el 08-11-2019] describe un sensor de iluminación estructurado en 3D ligero, resistente, de bajo costo y seguro para los ojos para usar en aplicaciones al aire libre a plena luz del día. El documento US 2004/125222 A1 (BRADSKI Ga RY R [Us ] y otros) 1 de julio de 2004 (01-07-2004) describe un sensor para una cámara de vídeo que tiene dos uniones a una profundidad específica en un sustrato semiconductor para detectar las respectivas radiaciones infrarrojas y visibles. LIEBE CC y otros: "Three dimensional imaging utilizing structured light", CONFERENCIA AEROESPa CiaL, 2004. ACTAS. 2004 IEEE, IEEE, PISCATAWAY, NJ, EE. UU., vol. 4, 6 de marzo de 2004(06-03-2004), páginas 2647-2655, XP010748388, describe un método de detección remota de la estructura tridimensional de la proximidad utilizando un láser, una rejilla holográfica y una única cámara CCD normal.
Si un sujeto se coloca en una posición determinada bajo condiciones de iluminación controladas, capturar una imagen del sujeto y, posteriormente, reconocer la imagen capturada puede ser relativamente sencillo. Sin embargo, estas condiciones previas no son muy prácticas para muchas circunstancias cotidianas. En realidad, los sujetos pueden estar a distancias variables de las cámaras, la iluminación puede variar, el sujeto puede estar en una aglomeración (otros objetos en la escena) y el sujeto puede asumir diferentes orientaciones.
Una forma conocida de tratar con diferentes orientaciones del sujeto es usar una imagen 3D. Esto puede superar el problema de orientación, ya que después de la captura, la cara se puede volver a alinear al frente para reconocerla. Para ayudar a la captura de la imagen 3D, es posible proyectar un patrón de luz predeterminado sobre el sujeto, lo que a menudo se denomina "luz estructurada". Esto puede ayudar considerablemente en la construcción de la imagen 3D.
Las condiciones de iluminación controladas son a menudo un factor crítico en la captura de imágenes que son confiables para fines de reconocimiento. Esto a menudo implica tanto la provisión de iluminación controlada como la exclusión de fuentes de iluminación ambiental no controladas.
Los ejemplos preferidos de la presente invención tienen como objetivo proporcionar la iluminación de un sujeto de tal manera que se pueda capturar una imagen de manera confiable desde una distancia del orden de, digamos, 3 a 5 metros, en condiciones al aire libre, que incluyen la luz solar brillante, sin que la luz proyectada sea visible para el sujeto y los demás.
Los ejemplos preferidos de la presente invención pueden usarse en el contexto del reconocimiento de una imagen, una imagen 3-D de un rostro humano.
De acuerdo con la presente invención, se proporciona un método para formar una imagen 3D de un rostro humano a la luz del día en un ambiente al aire libre, a una distancia de al menos 3 metros, que comprende las etapas de:
iluminar el rostro humano mediante un medio de iluminación que comprende una fuente de luz coherente y transmite radiación a una longitud de onda de 940 nanómetros, el medio de iluminación que proyecta un patrón sobre el sujeto;
capturar mediante un medio de cámara, a una distancia de al menos 3 metros del rostro humano, una imagen del rostro humano iluminado por el medio de iluminación, el medio de cámara que comprende al menos una cámara dispuesta para capturar los componentes de una imagen 3D; y
recibir y procesar por medio de un procesador de imágenes la imagen de la o cada cámara para calcular la imagen 3D de la o cada imagen recibida.
Dicho rostro humano puede estar a una distancia de al menos 5 metros de dicho medio de cámara.
Dicho medio de cámara puede comprender un par de cámaras.
Preferentemente, dicho patrón es un patrón moteado.
Preferentemente, dicha fuente de luz coherente comprende un láser.
Un método de acuerdo con cualquiera de los aspectos anteriores de la invención incluye preferentemente la etapa de comparar la imagen 3D calculada con una pluralidad de imágenes almacenadas y producir un resultado de reconocimiento para indicar si la imagen 3D calculada excede un umbral de similitud con al menos una de las imágenes almacenadas.
Para una mejor comprensión de la invención, y para mostrar cómo se pueden llevar a cabo sus modalidades, se hará referencia ahora, a manera de ejemplo, a los dibujos diagramáticos adjuntos en los que:
La Figura 1 es una representación esquemática de un sistema de reconocimiento de imágenes; y
La Figura 2 es un gráfico que representa un espectro de transmisión atmosférico típico, en la banda de onda de 300 a 1200 nanómetros.
En el sistema de reconocimiento de imágenes de la Figura 1, un sujeto 1 es iluminado por una fuente de luz 2 y observado por un par de cámaras 3. Las salidas de las cámaras 3 se envían a un procesador de imágenes 4, operado bajo el control de un controlador 5, que también controla la operación de la fuente de luz 2. El sujeto 1 es un rostro humano, que debe ser reconocido.
El par de cámaras 3 proporciona los componentes para una imagen 3D del sujeto 1, la imagen 3D se forma por el procesador de imágenes 4 a partir de las imágenes recibidas de las cámaras 3. Bajo el control del controlador 5, el procesador de imágenes 4 se dispone para comparar una imagen 3-D capturada con varias imágenes almacenadas, con el fin de buscar el reconocimiento de la imagen capturada. Una unidad de reconocimiento 6 se dispone para producir datos de reconocimiento para indicar si la imagen capturada supera un umbral de similitud con al menos una de las imágenes almacenadas. La tecnología para formar imágenes 3-D y reconocer imágenes capturadas de un banco de datos de imágenes almacenadas se conoce por otras publicaciones, que incluyen las expuestas anteriormente. Como tal tecnología no es el enfoque particular de la presente modalidad, no se describe aquí con más detalle.
En lugar de un par de cámaras 3, puede usarse una sola cámara o más de dos cámaras.
El enfoque de la modalidad de la Figura 1 es la manera en que el sujeto 1 es iluminado por la fuente de luz 2. En este ejemplo, la fuente de luz 2 es una fuente de luz coherente que comprende un láser de 940 nm de longitud de onda y se dispone para proyectar un patrón predeterminado (es decir, "luz estructurada") sobre el sujeto 1. La razón para seleccionar una longitud de onda de 940 nm es que representa una caída en el espectro de transmisión atmosférica natural en condiciones típicas, como se muestra en la Figura 2.
El gráfico de la Figura 2 demuestra que, en el intervalo ilustrado de longitud de onda (correspondiente a las frecuencias del infrarrojo cercano), hay tres caídas pronunciadas en el espectro de transmisión. La primero está a unos 760 nm (justo al borde de la luz roja visible), debido a la presencia de oxígeno. La siguiente está a unos 940 nm, debido a la presencia de vapor de agua y la tercero, también debido a la presencia de vapor de agua, está a unos 1130 nm. Se apreciará que cada caída o región detransmisibilidad reducida corresponde a un pico o región de opacidad aumentada
Al iluminar el sujeto 1 a 940 nm, la iluminación puede discriminarse con bastante claridad, incluso a distancias relativamente grandes de 3 a 5 metros, e incluso con luz solar brillante. De cualquier otra manera es difícil combatir la intensidad de la luz solar y evitar que sature el patrón proyectado.
Por lo tanto, el ejemplo ilustrado puede proporcionar las ventajas extremadamente útiles de poder capturar y reconocer imágenes a distancias relativamente grandes (en el contexto del reconocimiento de imágenes) y en prácticamente cualquier condición de iluminación.
El patrón proyectado por la fuente de luz 2 puede ser cualquier patrón adecuado. Un patrón "moteado" (patrón óptico pseudoaleatorio) se usa a menudo para el reconocimiento de objetos. Sin embargo, pueden usarse otros patrones que comprenden líneas, cuadrículas o cualquier patrón predeterminado. El procesador 4 puede hacer uso de patrones para crear mejores imágenes 3D (más completas y precisas). Puede usarse más de una fuente de luz 2. Puede usarse una fuente de luz alternativa a un láser, por ejemplo, un LED.
En esta descripción, el verbo "comprende" tiene su significado normal en el diccionario, para denotar la inclusión no exclusiva. Es decir, el uso de la palabra "comprende" (o cualquiera de sus derivados) para incluir una característica o más, no excluye la posibilidad de incluir también características adicionales.

Claims (6)

REIVINDICACIONES
1. Un método para formar una imagen 3D de un rostro humano a la luz del día en un ambiente al aire libre, a una distancia de al menos 3 metros, que comprende las etapas de:
iluminar el rostro humano mediante un medio de iluminación que comprende una fuente de luz coherente y transmite radiación a una longitud de onda de 940 nanómetros, el medio de iluminación que proyecta un patrón sobre el rostro humano;
capturar mediante un medio de cámara, a una distancia de al menos 3 metros del rostro humano, una imagen del rostro humano iluminado por el medio de iluminación, el medio de cámara que comprende al menos una cámara dispuesta para capturar los componentes de una imagen 3D; y
recibir y procesar por medio de un procesador de imágenes la imagen de la o cada cámara para calcular la imagen 3D de la o cada imagen recibida.
2. Un método de acuerdo con la reivindicación 1, en donde dicho rostro humano está a una distancia de al menos 5 metros de dicho medio de cámara.
3. Un método de acuerdo con la reivindicación 1 o 2, en donde dicho medio de cámara comprende un par de cámaras.
4. Un método de acuerdo con la reivindicación 1, 2 o 3, en donde dicho patrón es un patrón moteado.
5. Un método de acuerdo con cualquiera de las reivindicaciones anteriores, en donde dicha fuente de luz coherente comprende un láser.
6. Un método de acuerdo con cualquiera de las reivindicaciones anteriores, que incluye la etapa de comparar la imagen 3D calculada con una pluralidad de imágenes almacenadas y producir un resultado de reconocimiento para indicar si la imagen 3D calculada excede un umbral de similitud con al menos una de las imágenes almacenadas.
ES09741408T 2008-09-26 2009-09-25 Reconocimiento de imágenes Active ES2925500T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0817647A GB2463724B (en) 2008-09-26 2008-09-26 Forming 3D images
PCT/GB2009/051260 WO2010035046A1 (en) 2008-09-26 2009-09-25 Image recognition

Publications (1)

Publication Number Publication Date
ES2925500T3 true ES2925500T3 (es) 2022-10-18

Family

ID=40019604

Family Applications (1)

Application Number Title Priority Date Filing Date
ES09741408T Active ES2925500T3 (es) 2008-09-26 2009-09-25 Reconocimiento de imágenes

Country Status (8)

Country Link
US (1) US8860788B2 (es)
EP (1) EP2342892B1 (es)
ES (1) ES2925500T3 (es)
GB (1) GB2463724B (es)
HU (1) HUE059660T2 (es)
PL (1) PL2342892T3 (es)
PT (1) PT2342892T (es)
WO (1) WO2010035046A1 (es)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8417385B2 (en) * 2009-07-01 2013-04-09 Pixart Imaging Inc. Home appliance control device
CN110717446B (zh) 2014-03-13 2023-11-07 日本电气株式会社 检测设备、检测方法和记录介质
CN106156769A (zh) * 2016-07-14 2016-11-23 上海摩象网络科技有限公司 基于特征频率光学系统的多目标识别技术
GB2574669A (en) 2018-06-15 2019-12-18 The Face Recognition Company Ltd Recognition of 3D objects

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5016282A (en) * 1988-07-14 1991-05-14 Atr Communication Systems Research Laboratories Eye tracking image pickup apparatus for separating noise from feature portions
GB2307816B (en) * 1995-12-01 2000-03-29 Fuji International Productions Television production using infra-red light
US6320610B1 (en) * 1998-12-31 2001-11-20 Sensar, Inc. Compact imaging device incorporating rotatably mounted cameras
JP2000028315A (ja) * 1998-07-13 2000-01-28 Honda Motor Co Ltd 対象物検出装置
US8042740B2 (en) * 2000-11-24 2011-10-25 Metrologic Instruments, Inc. Method of reading bar code symbols on objects at a point-of-sale station by passing said objects through a complex of stationary coplanar illumination and imaging planes projected into a 3D imaging volume
EP1689172B1 (en) * 2001-06-05 2016-03-09 Microsoft Technology Licensing, LLC Interactive video display system
GB2384095B (en) 2001-12-10 2004-04-28 Cybula Ltd Image recognition
US7174033B2 (en) * 2002-05-22 2007-02-06 A4Vision Methods and systems for detecting and recognizing an object based on 3D image data
US7154157B2 (en) * 2002-12-30 2006-12-26 Intel Corporation Stacked semiconductor radiation sensors having color component and infrared sensing capability
JP2005017863A (ja) * 2003-06-27 2005-01-20 Oki Electric Ind Co Ltd 撮影装置および撮影方法
US8705808B2 (en) * 2003-09-05 2014-04-22 Honeywell International Inc. Combined face and iris recognition system
GB2428325B (en) * 2003-10-09 2007-08-01 Univ York Image Recognition
WO2007105205A2 (en) * 2006-03-14 2007-09-20 Prime Sense Ltd. Three-dimensional sensing using speckle patterns
KR20070081773A (ko) * 2006-02-13 2007-08-17 스마트 와이어레스 가부시키가이샤 적외선 얼굴 인증장치, 이를 구비하는 휴대 단말기 및보안장치
US20070229850A1 (en) * 2006-04-04 2007-10-04 Boxternal Logics, Llc System and method for three-dimensional image capture
US7912252B2 (en) * 2009-02-06 2011-03-22 Robert Bosch Gmbh Time-of-flight sensor-assisted iris capture system and method

Also Published As

Publication number Publication date
US8860788B2 (en) 2014-10-14
PT2342892T (pt) 2022-08-30
US20110261163A1 (en) 2011-10-27
HUE059660T2 (hu) 2022-12-28
GB2463724B (en) 2011-05-04
GB2463724A (en) 2010-03-31
EP2342892A1 (en) 2011-07-13
GB0817647D0 (en) 2008-11-05
PL2342892T3 (pl) 2022-10-17
EP2342892B1 (en) 2022-05-25
WO2010035046A1 (en) 2010-04-01

Similar Documents

Publication Publication Date Title
TWI723529B (zh) 臉部辨識模組及臉部辨識方法
US20160044301A1 (en) 3d modeling of imaged objects using camera position and pose to obtain accuracy with reduced processing requirements
KR20230006795A (ko) 편광을 사용한 센서 시스템 및 이미징 시스템의 증강 시스템 및 방법
CN107202554B (zh) 同时具备摄影测量和三维扫描功能的手持式大尺度三维测量扫描仪系统
EP3423865B1 (en) Gated imaging apparatus, system and method
US8081797B2 (en) Selective and adaptive illumination of a target
CN104755874B (zh) 具有多个光源的运动传感器装置
US10119808B2 (en) Systems and methods for estimating depth from projected texture using camera arrays
US9269145B2 (en) System and method for automatically registering an image to a three-dimensional point set
GB2582469A (en) Systems and methods for motion capture
ES2925500T3 (es) Reconocimiento de imágenes
CN109425306A (zh) 深度测量组件
US9091748B2 (en) Methods and apparatus for 3D UV imaging
US20190098276A1 (en) 3-d 360 degree depth projector
CN110226184A (zh) 用于机器感知的系统和方法
US20160267682A1 (en) Object detection device
WO2015098288A1 (ja) 画像処理装置、および画像処理方法
CN101777123B (zh) 一种基于红外投影标志点的视觉位置跟踪系统
JP2023532676A (ja) 拡散照射及び構造化光用プロジェクタ
CN104685318A (zh) 具有多个光源的运动传感器装置
EP3030859A1 (en) 3d mapping device for modeling of imaged objects using camera position and pose to obtain accuracy with reduced processing requirements
EP3069100A2 (en) Collimation and homogenization system for an led luminaire
CN206905709U (zh) 手持式大尺度三维测量扫描仪
WO2021048917A1 (ja) 画像処理装置、3次元計測システム、画像処理方法
US9992472B1 (en) Optoelectronic devices for collecting three-dimensional data