WO2026044925A1 - 一种嘘声手势检测方法、装置、电子设备和存储介质 - Google Patents
一种嘘声手势检测方法、装置、电子设备和存储介质Info
- Publication number
- WO2026044925A1 WO2026044925A1 PCT/CN2024/130280 CN2024130280W WO2026044925A1 WO 2026044925 A1 WO2026044925 A1 WO 2026044925A1 CN 2024130280 W CN2024130280 W CN 2024130280W WO 2026044925 A1 WO2026044925 A1 WO 2026044925A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- shushing
- face
- target
- feature point
- gesture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/59—Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
- G06V20/597—Recognising the driver's state or behaviour, e.g. attention or drowsiness
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/59—Context or environment of the image inside of a vehicle, e.g. relating to seat occupancy, driver state or inner lighting conditions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
- G06V40/11—Hand-related biometrics; Hand pose recognition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/107—Static hand or arm
- G06V40/113—Recognition of static hand signs
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- User Interface Of Digital Computer (AREA)
- Image Analysis (AREA)
Abstract
Description
Claims (11)
- 一种嘘声手势检测方法,其特征在于,所述方法包括:根据车载摄像头拍摄到的车辆内部的包括人脸的人脸图像,获取所述人脸图像中人脸特征点;根据以所述人脸特征点中的目标特征点为中心,以所述人脸特征点构成的图形的外接矩形面积的第一预设倍数为宽度,以所述宽度的预设比例为高度,以所述人脸图像中人脸的延伸方向为所述高度的倾斜方向构建的矩形区域,从所述人脸图像中截取第一目标图像,其中,所述第一预设倍数为正数,所述预设比例小于1,所述目标特征点属于嘴唇区域的特征点;将所述第一目标图像输入到嘘声检测模型中,判断所述人脸图像中是否包含嘘声手势;当确定所述人脸图像中包含所述嘘声手势时,控制车辆中的目标可控部件执行预设动作。
- 如权利要求1所述的方法,其特征在于,在得到所述人脸特征点后,所述方法还包括:将所述人脸图像输入到人脸检测模型中,得到所述人脸图像中初始人脸特征点;将所述初始人脸特征点映射到标准三维人脸模型中的同一特征点上,得到人脸重建三维模型;将所述人脸重建三维模型映射回所述人脸图像中同一特征点上,确定所述目标特征点。
- 如权利要求1所述的方法,其特征在于,所述当确定所述人脸图像中包含所述嘘声手势时,控制车辆中的目标可控部件执行预设动作,包括:当确定所述人脸图像中包含所述嘘声手势时,根据以距离所述目标特征点延所述延伸方向的反方向的指定距离为中心,以人脸的第二预设倍数为边长,以所述延伸方向为倾斜方向构建的菱形,从所述人脸图像中截取第二目标图像;根据所述第二目标图像,确定所述第二目标图像中在进行嘘声时,食指所在区域的嘘声虚拟槽;将所述第二目标图像输入到定位手部特征点模型中,得到手部特征点;根据所述手部特征点中用于表示食指的食指特征点,以及与所述嘘声虚拟槽的位置关系,判断所述嘘声手势是否为正确的嘘声手势;如果是正确的嘘声手势,控制车辆中的目标可控部件执行预设动作。
- 如权利要求3所述的方法,其特征在于,所述目标特征点为用于表示上嘴唇中心的嘴唇特征点,三维坐标系是以所述人脸重建三维模型中表示鼻尖的鼻尖特征点为原点,以 双眼连线方向为X轴,以面部朝向为Z轴,与X轴和Z轴所在平面垂直的方向为Y轴构建的,所述延伸方向为所述三维坐标系的Y轴方向。
- 如权利要求4所述的方法,其特征在于,所述嘘声虚拟槽的长度是从人脸特征点中用于表示鼻尖的鼻尖特征点到所述嘴唇特征点的距离,所述嘘声虚拟槽的上端点位于所述鼻尖特征沿所述Z轴正方向0.1倍所述长度上,所述嘘声虚拟槽的下端点位于所述嘴唇特征点沿所述Z轴正方向0.1倍所述长度上。
- 如权利要求3所述的方法,其特征在于,所述指定距离为0.25倍人脸高度,第二预设倍数为数值1。
- 如权利要求1所述的方法,其特征在于,所述第一预设倍数为所述外接矩形面积的平方根,所述预设比例为三分之二。
- 如权利要求1所述的方法,其特征在于,所述控制车辆中的目标可控部件执行预设动作,包括:当所述目标可控部件为车载电话时,则拒接所述车载电话当前的通话来电;当所述目标可控部件为车载多媒体时,则暂停所述车载多媒体当前的播放的内容;当所述目标可控部件为车窗时,则关闭所述车窗。
- 一种嘘声手势检测装置,其特征在于,所述装置包括:获取单元,用于根据车载摄像头拍摄到的车辆内部的包括人脸的人脸图像,获取所述人脸图像中人脸特征点;截取单元,用于根据以所述人脸特征点中的目标特征点为中心,以所述人脸特征点构成的图形的外接矩形面积的第一预设倍数为宽度,以所述宽度的预设比例为高度,以所述人脸图像中人脸的延伸方向为所述高度的倾斜方向构建的矩形区域,从所述人脸图像中截取第一目标图像,其中,所述第一预设倍数为正数,所述预设比例小于1,所述目标特征点属于嘴唇区域的特征点;判断单元,用于将所述第一目标图像输入到嘘声检测模型中,判断所述人脸图像中是否包含嘘声手势;控制单元,用于当确定所述人脸图像中包含所述嘘声手势时,控制车辆中的目标可控部件执行预设动作。
- 一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器执行所述机器可执行指令以实现权利要求1-8中任一项所述的嘘声手势检测方法。
- 一种机器可读存储介质,其特征在于,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被处理器调用和执行时,所述机器可执行指令促使所述处理 器实现权利要求1-8中任一项所述的嘘声手势检测方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP24943658.5A EP4730281A4 (en) | 2024-08-26 | 2024-11-06 | METHOD AND APPARATUS FOR DETECTING A GESTURE REQUESTING SILENCE, ELECTRONIC DEVICE AND STORAGE MEDIA |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202411170859.7 | 2024-08-26 | ||
| CN202411170859.7A CN118675204B (zh) | 2024-08-26 | 2024-08-26 | 一种嘘声手势检测方法、装置、电子设备和存储介质 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2026044925A1 true WO2026044925A1 (zh) | 2026-03-05 |
Family
ID=92731472
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/CN2024/130280 Pending WO2026044925A1 (zh) | 2024-08-26 | 2024-11-06 | 一种嘘声手势检测方法、装置、电子设备和存储介质 |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP4730281A4 (zh) |
| CN (1) | CN118675204B (zh) |
| WO (1) | WO2026044925A1 (zh) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN118675204B (zh) * | 2024-08-26 | 2024-11-01 | 杭州锐见智行科技有限公司 | 一种嘘声手势检测方法、装置、电子设备和存储介质 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20180060706A1 (en) * | 2016-09-01 | 2018-03-01 | International Business Machines Corporation | Dynamic determination of human gestures based on context |
| CN108229345A (zh) * | 2017-12-15 | 2018-06-29 | 吉利汽车研究院(宁波)有限公司 | 一种驾驶员检测系统 |
| CN108399009A (zh) * | 2018-02-11 | 2018-08-14 | 易视腾科技股份有限公司 | 利用人机交互手势唤醒智能设备的方法及装置 |
| CN111723602A (zh) * | 2019-03-19 | 2020-09-29 | 杭州海康威视数字技术股份有限公司 | 驾驶员的行为识别方法、装置、设备及存储介质 |
| CN112799515A (zh) * | 2021-02-01 | 2021-05-14 | 重庆金康赛力斯新能源汽车设计院有限公司 | 一种视觉交互方法和系统 |
| CN118675204A (zh) * | 2024-08-26 | 2024-09-20 | 杭州锐见智行科技有限公司 | 一种嘘声手势检测方法、装置、电子设备和存储介质 |
Family Cites Families (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017090613A (ja) * | 2015-11-09 | 2017-05-25 | 三菱自動車工業株式会社 | 音声認識制御システム |
| US20230282023A1 (en) * | 2016-06-01 | 2023-09-07 | Pixart Imaging Inc. | Electronic device unlocked and controlled by gesture recognition |
| DE102017209562B4 (de) * | 2017-06-07 | 2022-09-01 | Audi Ag | Verfahren zum Betreiben einer Anzeigeanordnung eines Kraftfahrzeugs, Bedienvorrichtung, und Kraftfahrzeug |
| CN108459712A (zh) * | 2018-02-11 | 2018-08-28 | 北京光年无限科技有限公司 | 一种基于虚拟人的手势交互方法及系统 |
| US10885322B2 (en) * | 2019-01-31 | 2021-01-05 | Huawei Technologies Co., Ltd. | Hand-over-face input sensing for interaction with a device having a built-in camera |
| CN111552368A (zh) * | 2019-05-16 | 2020-08-18 | 毛文涛 | 一种车载人机交互方法及车载设备 |
| WO2023273372A1 (zh) * | 2021-06-30 | 2023-01-05 | 华为技术有限公司 | 手势识别对象确定方法及装置 |
| EP4374335A1 (en) * | 2021-07-19 | 2024-05-29 | Sony Semiconductor Solutions Corporation | Electronic device and method |
| CN215663250U (zh) * | 2021-08-24 | 2022-01-28 | 江苏掌默智能科技有限公司 | 一种具有刷手识别功能的汽车座舱 |
| CN115063849A (zh) * | 2022-05-23 | 2022-09-16 | 中国第一汽车股份有限公司 | 一种基于深度学习的动态手势控车系统和方法 |
| CN117055720A (zh) * | 2022-06-28 | 2023-11-14 | 北京罗克维尔斯科技有限公司 | 车辆的交互方法、装置、电子设备、车辆和存储介质 |
| CN115756163A (zh) * | 2022-11-17 | 2023-03-07 | 新华三智能终端有限公司 | 手势识别实时交互方法、网络设备及存储介质 |
| CN116610212A (zh) * | 2023-04-28 | 2023-08-18 | 重庆长安汽车股份有限公司 | 一种多模态娱乐交互方法、装置、设备及介质 |
| CN117962742B (zh) * | 2024-03-29 | 2024-06-21 | 长城汽车股份有限公司 | 车辆组件的控制方法、装置和车辆 |
-
2024
- 2024-08-26 CN CN202411170859.7A patent/CN118675204B/zh active Active
- 2024-11-06 WO PCT/CN2024/130280 patent/WO2026044925A1/zh active Pending
- 2024-11-06 EP EP24943658.5A patent/EP4730281A4/en active Pending
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20180060706A1 (en) * | 2016-09-01 | 2018-03-01 | International Business Machines Corporation | Dynamic determination of human gestures based on context |
| CN108229345A (zh) * | 2017-12-15 | 2018-06-29 | 吉利汽车研究院(宁波)有限公司 | 一种驾驶员检测系统 |
| CN108399009A (zh) * | 2018-02-11 | 2018-08-14 | 易视腾科技股份有限公司 | 利用人机交互手势唤醒智能设备的方法及装置 |
| CN111723602A (zh) * | 2019-03-19 | 2020-09-29 | 杭州海康威视数字技术股份有限公司 | 驾驶员的行为识别方法、装置、设备及存储介质 |
| CN112799515A (zh) * | 2021-02-01 | 2021-05-14 | 重庆金康赛力斯新能源汽车设计院有限公司 | 一种视觉交互方法和系统 |
| CN118675204A (zh) * | 2024-08-26 | 2024-09-20 | 杭州锐见智行科技有限公司 | 一种嘘声手势检测方法、装置、电子设备和存储介质 |
Non-Patent Citations (1)
| Title |
|---|
| See also references of EP4730281A4 * |
Also Published As
| Publication number | Publication date |
|---|---|
| EP4730281A1 (en) | 2026-04-22 |
| CN118675204A (zh) | 2024-09-20 |
| EP4730281A4 (en) | 2026-04-29 |
| CN118675204B (zh) | 2024-11-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102346294B1 (ko) | 2차원 이미지로부터 사용자의 제스처를 추정하는 방법, 시스템 및 비일시성의 컴퓨터 판독 가능 기록 매체 | |
| JP4149213B2 (ja) | 指示位置検出装置及び自律ロボット | |
| US10394334B2 (en) | Gesture-based control system | |
| JP5887775B2 (ja) | ヒューマンコンピュータインタラクションシステム、手と手指示点位置決め方法、及び手指のジェスチャ決定方法 | |
| Reale et al. | A multi-gesture interaction system using a 3-D iris disk model for gaze estimation and an active appearance model for 3-D hand pointing | |
| CN102165396B (zh) | 挥动约定姿态的增强检测 | |
| US9727776B2 (en) | Object orientation estimation | |
| CN114690900B (zh) | 一种虚拟场景中的输入识别方法、设备及存储介质 | |
| US9619042B2 (en) | Systems and methods for remapping three-dimensional gestures onto a finite-size two-dimensional surface | |
| CN104951073B (zh) | 一种基于虚拟界面的手势交互方法 | |
| CN115951783A (zh) | 一种基于手势识别的计算机人机交互方法 | |
| US12424029B2 (en) | Devices and methods for single or multi-user gesture detection using computer vision | |
| CN112037143A (zh) | 一种图像处理方法及装置 | |
| Lin et al. | Hand tracking using spatial gesture modeling and visual feedback for a virtual DJ system | |
| JP4608326B2 (ja) | 指示動作認識装置及び指示動作認識プログラム | |
| WO2026044925A1 (zh) | 一种嘘声手势检测方法、装置、电子设备和存储介质 | |
| CN113703577A (zh) | 一种绘图方法、装置、计算机设备及存储介质 | |
| WO2024055957A1 (zh) | 拍摄参数的调整方法、装置、电子设备和可读存储介质 | |
| Shan | Gesture control for consumer electronics | |
| Kim et al. | ThunderPunch: A bare-hand, gesture-based, large interactive display interface with upper-body-part detection in a top view | |
| TW202321775A (zh) | 校正由頭戴式顯示器臉部相機捕捉之影像內檢測到之臉部特徵興趣點之原始座標之技術 | |
| CN117648035B (zh) | 一种虚拟手势的控制方法及装置 | |
| CN117173734B (zh) | 手掌轮廓提取、控制指令生成方法、装置和计算机设备 | |
| Ukita et al. | Wearable Virtual Tablet: Fingertip Drawing Interface Using an Active-Infrared Camera. | |
| CN121693712A (zh) | 手势识别装置及手势识别方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| ENP | Entry into the national phase |
Ref document number: 2024943658 Country of ref document: EP Effective date: 20251222 |
|
| ENP | Entry into the national phase |
Ref document number: 2024943658 Country of ref document: EP Effective date: 20251222 |
|
| ENP | Entry into the national phase |
Ref document number: 2024943658 Country of ref document: EP Effective date: 20251222 |
|
| ENP | Entry into the national phase |
Ref document number: 2024943658 Country of ref document: EP Effective date: 20251222 |
|
| ENP | Entry into the national phase |
Ref document number: 2024943658 Country of ref document: EP Effective date: 20251222 |