TWI852489B - 語音活動檢測裝置及方法 - Google Patents
語音活動檢測裝置及方法 Download PDFInfo
- Publication number
- TWI852489B TWI852489B TW112114808A TW112114808A TWI852489B TW I852489 B TWI852489 B TW I852489B TW 112114808 A TW112114808 A TW 112114808A TW 112114808 A TW112114808 A TW 112114808A TW I852489 B TWI852489 B TW I852489B
- Authority
- TW
- Taiwan
- Prior art keywords
- volume
- value
- threshold value
- processing module
- volume threshold
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/1613—Constructional details or arrangements for portable computers
- G06F1/163—Wearable computers, e.g. on a belt
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/1613—Constructional details or arrangements for portable computers
- G06F1/1633—Constructional details or arrangements of portable computers not specific to the type of enclosures covered by groups G06F1/1615 - G06F1/1626
- G06F1/1684—Constructional details or arrangements related to integrated I/O peripherals not covered by groups G06F1/1635 - G06F1/1675
- G06F1/1686—Constructional details or arrangements related to integrated I/O peripherals not covered by groups G06F1/1635 - G06F1/1675 the I/O peripheral being an integrated camera
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
- G06F3/0674—Disk device
- G06F3/0676—Magnetic disk device
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
- G06F3/0679—Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING SYSTEMS, e.g. PERSONAL CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B13/00—Burglar, theft or intruder alarms
- G08B13/18—Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
- G08B13/189—Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
- G08B13/194—Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
- G08B13/196—Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
- G08B13/19617—Surveillance camera constructional details
- G08B13/19621—Portable camera
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01H—ELECTRIC SWITCHES; RELAYS; SELECTORS; EMERGENCY PROTECTIVE DEVICES
- H01H9/00—Details of switching devices, not covered by groups H01H1/00 - H01H7/00
- H01H9/16—Indicators for switching condition, e.g. "on" or "off"
- H01H9/161—Indicators for switching condition, e.g. "on" or "off" comprising light emitting elements
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
- H04N5/77—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
- H04N5/772—Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/183—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/183—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
- H04N7/185—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source from a mobile camera, e.g. for remote control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
- G10L2025/786—Adaptive threshold
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
- Studio Devices (AREA)
- User Interface Of Digital Computer (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Television Signal Processing For Recording (AREA)
- Input From Keyboards Or The Like (AREA)
- Switches With Compound Operations (AREA)
- Traffic Control Systems (AREA)
- Closed-Circuit Television Systems (AREA)
- Slide Switches (AREA)
Abstract
一種語音活動檢測裝置及方法,其中語音活動檢測裝置包括收音模組、耦接收音模組的處理模組及耦接處理模組的提示模組,其中處理模組用以執行語音活動檢測方法包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否小於或等於第一音量臨界值;當判斷音量值小於或等於第一音量臨界值時,通過提示模組產生音量值提高的第一提示信息;以及當判斷音量值大於第一音量臨界值時,通過提示模組產生符合音量值標準的第二提示信息。藉此,有效提高接收語音時音量產生的電平信號,及語音轉文本的準確率。
Description
本發明是有關一種語音活動檢測技術,尤其是一種語音轉文字的語音活動檢測裝置及方法。
目前大多數內建麥克風實際收音的線路輸入皆需透過微軟應用程式來進行增益大小的管理。然而,當增益大小設定不當或使用者無法確認語音辨識演算法模型收到的實際麥克風聲音,麥克風的實際聲音會被預先內建的控制單元處理過(量化增益大小),導致原始的音量大小無法被還原,這將導致演算法模型輸出的語音的準確性。特別地是,於室外環境並具有背景噪音的情況下,處理後語音進行語音轉文字的準確率相對低。
本發明提供一種語音活動檢測裝置及方法,可以有效提高接收語音時由音量產生的電平信號,以及在有背景噪音的室外環境中語音轉文本的準確率。
本發明所提供的語音活動檢測裝置包括收音模組、處理模組、及提示模組,其中處理模組耦接收音模組,以及提示模組耦接處理模組。其中處理模組用以執行語音活動檢測方法,包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否小於或等於第一音量臨界值;當判斷音量值小於或等於第一音量臨界值時,通過提示模組產生音量值提高的第一提示信息;以及當判斷音量值大於第一音量臨界值時,通過提示模組產生符合音量值標準的第二提示信息。
本發明所提供的語音活動檢測方法,適用於語音活動檢測裝置,其中語音活動檢測裝置包括收音模組、處理模組及提示模組,語音活動檢測方法包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否小於或等於第一音量臨界值;當判斷音量值小於或等於第一音量臨界值時,通過提示模組產生音量值提高的第一提示信息;以及當判斷音量值大於第一音量臨界值時,通過提示模組產生符合音量值標準的第二提示信息。
在本發明的一實施例中,上述之第一音量臨界值係介於50~60dB。
在本發明的一實施例中,上述之語音活動檢測方法更包括:通過處理模組判斷音量值是否小於或等於第二音量臨界值;當判斷音量值小於或等於第二音量臨界值時,通過提示模組產生音量值提高的第一提示信息;以及當判斷音量值大於第二音量臨界值時,通過處理模組判斷音量值是否小於或等於第一音量臨界值。
在本發明的一實施例中,上述之第二音量臨界值係介於40~50dB。
在本發明的一實施例中,上述之語音活動檢測方法更包括:通過處理模組獲取收音模組的音量調整值以產生語音信息的音量值。
在本發明的一實施例中,上述之語音活動檢測方法更包括:當判斷音量值大於第一音量臨界值時,通過處理模組判斷音量值是否小於或等於第三音量臨界值;當判斷音量值大於第三音量臨界值時,通過處理模組調整音量值至小於第三音量臨界值;以及當判斷音量值小於或等於第三音量臨界值時,通過提示模組產生符合音量值標準的第二提示信息。
本發明所提供的語音活動檢測裝置包括:收音模組、處理模組、及提示模組,其中處理模組耦接收音模組,以及提示模組耦接處理模組。其中處理模組用以執行語音活動檢測方法,包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否介於第一音量臨界值與第二音量臨界值之間;當判斷音量值介於第一音量臨界值與第二音量臨界值之間時,通過提示模組產生符合音量值標準的第一提示信息;以及當判斷音量值不介於第一音量臨界值與第二音量臨界值之間時,通過處理模組調整音量值至音量預設值。
本發明所提供的語音活動檢測方法,適用於語音活動檢測裝置,其中語音活動檢測裝置包括收音模組、處理模組及提示模組,語音活動檢測方法包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否介於第一音量臨界值與第二音量臨界值之間;當判斷音量值介於第一音量臨界值與第二音量臨界值之間時,通過提示模組產生符合音量值標準的第一提示信息;以及當判斷音量值不介於第一音量臨界值與第二音量臨界值之間時,通過處理模組調整音量值至音量預設值。
在本發明的一實施例中,上述之第一音量臨界值大於第二音量臨界值,音量預設值介於第一音量臨界值與第二音量臨界值之間。
在本發明的一實施例中,上述之第一音量臨界值係90dB,第二音量臨界值係介於50~60dB,音量預設值係介於60~70dB。
本發明所提供的語音活動檢測裝置包括:收音模組、處理模組、及提示模組,其中處理模組耦接收音模組,以及提示模組耦接處理模組。其中處理模組用以執行語音活動檢測方法,包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否小於或等於第一音量臨界值;當判斷音量值小於或等於第一音量臨界值時,通過提示模組產生音量值提高的第一提示信息;當判斷音量值大於第一音量臨界值時,通過處理模組判斷音量值是否小於或等於第二音量臨界值;當判斷音量值小於或等於第二音量臨界值時,通過處理模組調整音量值至音量預設值;當判斷音量值大於第二音量臨界值時,通過處理模組判斷音量值是否小於或等於第三音量臨界值;當判斷音量值小於或等於第三音量臨界值時,通過提示模組產生符合音量值標準的第一提示信息;以及當判斷音量值大於第三音量臨界值時,通過處理模組調整音量值至音量預設值。
本發明所提供的語音活動檢測方法,適用於語音活動檢測裝置,其中語音活動檢測裝置包括收音模組、處理模組及提示模組,語音活動檢測方法包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否小於或等於第一音量臨界值;當判斷音量值小於或等於第一音量臨界值時,通過提示模組產生音量值提高的第一提示信息;當判斷音量值大於第一音量臨界值時,通過處理模組判斷音量值是否小於或等於第二音量臨界值;當判斷音量值小於或等於第二音量臨界值時,通過處理模組調整音量值至音量預設值;當判斷音量值大於第二音量臨界值時,通過處理模組判斷音量值是否小於或等於第三音量臨界值;當判斷音量值小於或等於第三音量臨界值時,通過提示模組產生符合音量值標準的第一提示信息;以及當判斷音量值大於第三音量臨界值時,通過處理模組調整音量值至音量預設值。
在本發明的一實施例中,上述之第三音量臨界值大於第二音量臨界值,第二音量臨界值大於第一音量臨界值,音量預設值係介於第三音量臨界值與第二音量臨界值之間。
在本發明的一實施例中,上述之第一音量臨界值係90dB,第二音量臨界值係介於50~60dB,第三音量臨界值係介於40~50dB,音量預設值係介於60~70dB。
本發明因採用語音活動檢測方法,因此可以有效提高接收語音時由音量產生的電平信號,以及在有背景噪音的室外環境中語音轉文本的準確率。
為讓本發明之上述和其他目的、特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式,作詳細說明如下。
為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用以解釋本發明,並不用於限定本發明。基於本發明中的實施例,所屬技術領域中具有通常知識者在沒有作出進步性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
需要說明的是,如果不衝突,本發明實施例中的各個特徵可以相互結合,均在本發明的保護範圍之內。另外,本發明所採用的「第一」、「第二」、「第三」等字樣並不對數據和執行次序進行限定,僅是對功能和作用基本相同的相同項或相似項進行區分。
再者,需要說明的是,在本發明實施例中,耦接的方式包括了:直接電連接,以及通過其他元件、模組、或裝置電連接。後文中出現的“耦接”均包括了這些方式,後文不再贅述。
請參閱圖1所示,為本發明一實施例所提供的語音活動檢測裝置的方塊圖。本實施例的語音活動檢測裝置1包括收音模組2、處理模組3、以及提示模組4,其中處理模組3耦接收音模組2,以及提示模組4耦接處理模組3。在另一實施例中,語音活動檢測裝置1例如但不限於包括硬體、韌體、及軟體。在另一實施例中,收音模組2例如但不限於麥克風。在另一實施例中,處理模組3例如但不限於包括處理電路、編解碼電路、降噪電路、及儲存電路。在另一實施例中,提示模組4例如但不限於顯示電路、發光電路、播音電路,用於顯示語音的波形與顏色、及發出聲音提醒等。
在一實施例中,語音活動檢測裝置1具有一應用程式介面提供使用者手動選擇可基於其他播放軟體例如但不限於多媒體擴展(MME)中的wavein以依據收音模組2的音量調整值的wavein模式、可直接通過通用音頻架構(UAA)的視窗音頻對話應用程式介面(WASAPI)以直接接收收音模組2所接收到的語音信息的WASAPI模式、以及可由語音活動檢測裝置1自主決定wavein模式、WASAPI模式、或wavein模式與WASAPI模式交互使用的自動模式。
請參閱圖2所示,為本發明第一實施例所提供的語音活動檢測方法的流程圖。本實施例的語音活動檢測方法適用於語音活動檢測裝置1,執行於WASAPI模式與自動模式中,並由處理模組3執行以包括以下步驟。步驟S1:通過收音模組2接收語音信息。步驟S3:通過處理模組3獲取語音信息的音量值。步驟S5:通過處理模組3判斷音量值是否小於或等於第一音量臨界值。步驟S7:當判斷音量值小於或等於第一音量臨界值時,通過提示模組4產生音量值提高的第一提示信息。步驟S9:當判斷音量值大於第一音量臨界值,通過提示模組4產生符合音量值標準的第二提示信息。在本實施例中,第一音量臨界值係例如但不限於介於40~50dB、或介於50~60dB等。其中,第一音量臨界值可依據實際環境及需求來設定,本發明不以上述音量範圍為限。在本實施例中,當第一音量臨界值介於40~50dB時,第一提示信息例如但不限於語音波形及波形顏色如無振幅紅色波形,及第二提示信息例如但不限於語音波形及波形顏色如微小振幅黃色波形;或是,當第一音量臨界值介於50~60dB時,第一提示信息例如但不限於語音波形及波形顏色如微小振幅黃色波形,及第二提示信息例如但不限於語音波形及波形顏色如劇烈振幅綠色波形。
在一實施例中,當使用者通過應用程式介面選擇自動模式,收音模組2在接收語音信息之後,處理模組3是直接獲取語音信息的音量值,而並不會受到微軟其他播放軟體調整收音的音量調整值所影響,如此可避免原始的音量大小無法被還原而影響到語音信息轉文本信息的準確率。接著,處理模組3判斷音量值是否小於或等於第一音量臨界值如50dB。如果音量值小於或等於50dB,則提示模組4如顯示電路顯示微小振幅黃色波形的第一提示信息。如果音量值大於50dB,則提示模組4如顯示電路顯示劇烈振幅綠色波形的第二提示信息。
請參閱圖3所示,為本發明第二實施例所提供的語音活動檢測方法的流程圖。本實施例的語音活動檢測方法適用於語音活動檢測裝置1,執行於WASAPI模式與自動模式中,並由處理模組3執行以包括以下步驟。步驟S1:通過收音模組2接收語音信息。步驟S3:通過處理模組3獲取語音信息的音量值。步驟S11:通過處理模組3判斷音量值是否小於或等於第二音量臨界值。步驟S7:當判斷音量值小於或等於第二音量臨界值時,通過提示模組4產生音量值提高的第一提示信息。步驟S15:當判斷音量值大於第二音量臨界值時,通過處理模組3判斷音量值是否小於或等於第一音量臨界值。步驟S7:當判斷音量值小於或等於第一音量臨界值時,通過提示模組4產生音量值提高的第一提示信息。步驟S9:當判斷音量值大於第一音量臨界值,通過提示模組4產生符合音量值標準的第二提示信息。在本實施例中,第一音量臨界值係例如但不限於介於50~60dB等,第二音量臨界值係例如但不限於介於40~50dB等,其中第二音量臨界值小於第一音量臨界值。其中,第一音量臨界值及第二音量臨界值可依據實際環境及需求來設定,本發明不以上述音量範圍為限。在本實施例中,第一提示信息例如但不限於語音波形及波形顏色如無振幅紅色波形或是微小振幅黃色波形,及第二提示信息例如但不限於語音波形及波形顏色如劇烈振幅綠色波形。
在一實施例中,當使用者通過應用程式介面選擇自動模式,收音模組2在接收語音信息之後,處理模組3是直接獲取語音信息的音量值,而並不會受到微軟其他播放軟體調整收音的音量調整值所影響,如此可避免原始的音量大小無法被還原而影響到語音信息轉文本信息的準確率。接著,處理模組3判斷音量值是否小於或等於第二音量臨界值如45dB。如果音量值小於或等於45dB,則提示模組4如顯示電路顯示無振幅紅色波形的第一提示信息。如果音量值大於45dB,則提示模組4如顯示電路顯示微小振幅黃色波形的第一提示信息。接著,處理模組3判斷音量值是否小於或等於第一音量臨界值如55dB。如果音量值小於或等於55dB,則提示模組4如顯示電路顯示微小振幅黃色波形的第一提示信息。如果音量值大於55dB,則提示模組4如顯示電路顯示劇烈振幅綠色波形的第二提示信息。
請參閱圖4所示,為本發明第三實施例所提供的語音活動檢測方法的流程圖。本實施例的語音活動檢測方法適用於語音活動檢測裝置1,執行於wavein模式中,並由處理模組3執行以包括以下步驟。步驟S1:通過收音模組2接收語音信息。步驟S2:通過處理模組3獲取收音模組2的音量調整值以產生語音信息的音量值。步驟S3:通過處理模組3獲取語音信息的音量值。步驟S5:通過處理模組3判斷音量值是否小於或等於第一音量臨界值。步驟S7:當判斷音量值小於或等於第一音量臨界值時,通過提示模組4產生音量值提高的第一提示信息。步驟S17:當判斷音量值大於第一音量臨界值,通過處理模組3判斷音量值是否小於或等於第三音量臨界值。步驟S19:當判斷音量值大於第三音量臨界值時,通過處理模組3調整音量值至小於第三音量臨界值。步驟S9:當判斷音量值小於或等於第三音量臨界值時,通過提示模組4產生符合音量值標準的第二提示信息。
在一實施例中,當使用者通過應用程式介面選擇wavein模式,收音模組2在接收語音信息之後,處理模組會根據其他播放軟體的收音的音量調整值來產生語音信息的音量值。接著,處理模組3獲取語音信息的音量值並判斷音量值是否小於或等於第一音量臨界值如55dB。如果音量值小於或等於55dB,則提示使用者提高語音信息的音量值至65dB。如果音量值大於55dB,則處理模組3判斷音量值是否小於或等於第三音量臨界值如90dB。如果音量值大於90dB,則通過處理模組3調整音量值至65dB以避免收音時爆音。如果音量值小於65dB,通過處理模組3持續獲取語音信息的音量值。
請參閱圖5所示,為本發明第四實施例所提供的語音活動檢測方法的流程圖。本實施例的語音活動檢測方法適用於語音活動檢測裝置1,執行於自動模式中,並由處理模組3執行以包括以下步驟。步驟S1:通過收音模組2接收語音信息。步驟S3:通過處理模組3獲取語音信息的音量值。步驟S21:通過處理模組3判斷音量值是否介於第一音量臨界值與第三音量臨界值之間。步驟S9:當判斷音量值介於第一音量臨界值與第三音量臨界值之間時,通過提示模組4產生符合音量值標準的第二提示信息。步驟S23:當判斷音量值不介於第一音量臨界值與第三音量臨界值之間時,通過處理模組3調整音量值至音量預設值。在本實施例中,第三音量臨界值大於第一音量臨界值,音量預設值介於第三音量臨界值與第一音量臨界值之間。在本實施例中,第三音量臨界值係例如但不限於90dB、第一音量臨界值係例如但不限於介於50~60dB,音量預設值係例如但不限於60~70dB。其中,第三音量臨界值、第一音量臨界值及音量預設值可依據實際環境及需求來設定,本發明不以上述音量範圍為限。
請參閱圖6所示,為本發明第五實施例所提供的語音活動檢測方法的流程圖。本實施例的語音活動檢測方法適用於語音活動檢測裝置1,執行於自動模式中,並由處理模組3執行以包括以下步驟。步驟S1:通過收音模組2接收語音信息。步驟S3:通過處理模組3獲取語音信息的音量值。步驟S11:通過處理模組3判斷音量值是否小於或等於第二音量臨界值。步驟S7:當判斷音量值小於或等於第二音量臨界值時,通過提示模組4產生音量值提高的第一提示信息。步驟S15:當判斷音量值大於第二音量臨界值時,通過處理模組3判斷音量值是否小於或等於第一音量臨界值。步驟S23:當判斷音量值小於或等於第一音量臨界值時,通過處理模組3調整音量值至音量預設值。步驟S17:當判斷音量值大於第一音量臨界值時,通過處理模組3判斷音量值是否小於或等於第三音量臨界值。步驟S9:當判斷音量值小於或等於第三音量臨界值時,通過提示模組4產生符合音量值標準的第二提示信息。步驟S23:當判斷音量值大於第三音量臨界值時,通過處理模組3調整音量值至小於音量預設值。在本實施例中,第三音量臨界值大於第一音量臨界值,第一音量臨界值大於第二音量臨界值,音量預設值係介於該第三音量臨界值與該第一音量臨界值之間。在本實施例中,第三音量臨界值係例如但不限於90dB,第一音量臨界值係例如但不限於介於50~60dB,第二音量臨界值係例如但不限於介於40~50dB,音量預設值係例如但不限於60~70dB。其中,第三音量臨界值、第二音量臨界值、第一音量臨界值及音量預設值可依據實際環境及需求來設定,本發明不以上述音量範圍為限。
綜上所述,本發明所提供的語音活動檢測裝置因採用語音活動檢測方法,因此可以有效提高接收語音時由音量產生的電平信號,以及在有背景噪音的室外環境中語音轉文本的準確率。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,本發明所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作些許之更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
1:語音活動檢測裝置
2:收音模組
3:處理模組
4:提示模組
S1, S2, S3, S5, S7, S9, S11, S15, S17, S19, S21, S23:步驟
圖1為本發明一實施例所提供的語音活動檢測裝置的方塊圖;
圖2為本發明第一實施例所提供的語音活動檢測方法的流程圖;
圖3為本發明第二實施例所提供的語音活動檢測方法的流程圖;
圖4為本發明第三實施例所提供的語音活動檢測方法的流程圖;
圖5為本發明第四實施例所提供的語音活動檢測方法的流程圖;以及
圖6為本發明第五實施例所提供的語音活動檢測方法的流程圖。
S1,S3,S5,S7,S9:步驟
Claims (22)
- 一種語音活動檢測方法,適用於一語音活動檢測裝置,其中該語音活動檢測裝置包括一收音模組、一處理模組及一提示模組,該語音活動檢測方法包括:通過該收音模組接收一語音信息;通過該處理模組獲取該語音信息的一音量值;通過該處理模組判斷該音量值是否小於或等於一第一音量臨界值;當判斷該音量值小於或等於該第一音量臨界值時,通過該提示模組產生該音量值提高的一第一提示信息;以及當判斷該音量值大於該第一音量臨界值時,通過該提示模組產生符合音量值標準的一第二提示信息;其中該第一音量臨界值係介於50~60dB。
- 如請求項1所述之語音活動檢測方法,更包括:通過該處理模組判斷該音量值是否小於或等於一第二音量臨界值;當判斷該音量值小於或等於該第二音量臨界值時,通過該提示模組產生該音量值提高的該第一提示信息;以及當判斷該音量值大於該第二音量臨界值時,通過該處理模組判斷該音量值是否小於或等於該第一音量臨界值。
- 如請求項2所述之語音活動檢測方法,其中該第二音量臨界值係介於40~50dB。
- 如請求項1所述之語音活動檢測方法,更包括: 通過該處理模組獲取該收音模組的一音量調整值以產生該語音信息的該音量值。
- 如請求項4所述之語音活動檢測方法,更包括:當判斷該音量值大於該第一音量臨界值時,通過該處理模組判斷該音量值是否小於或等於一第三音量臨界值;當判斷該音量值大於該第三音量臨界值時,通過該處理模組調整該音量值至小於該第三音量臨界值;以及當判斷該音量值小於或等於該第三音量臨界值時,通過該提示模組產生符合音量值標準的該第二提示信息。
- 一種語音活動檢測裝置,包括:一收音模組;一處理模組,耦接該收音模組;以及一提示模組,耦接該處理模組;其中該處理模組用以執行一語音活動檢測方法,該方法包括:通過該收音模組接收一語音信息;通過該處理模組獲取該語音信息的一音量值;通過該處理模組判斷該音量值是否小於或等於一第一音量臨界值;當判斷該音量值小於或等於該第一音量臨界值時,通過該提示模組產生該音量值提高的一第一提示信息;以及當判斷該音量值大於該第一音量臨界值時,通過該提示模組產生符合音量值標準的一第二提示信息;其中該第一音量臨界值係介於50~60dB。
- 如請求項6所述之語音活動檢測裝置,其中該方法更包括:通過該處理模組判斷該音量值是否小於或等於一第二音量臨界值;當判斷該音量值小於或等於該第二音量臨界值時,通過該提示模組產生該音量值提高的該第一提示信息;以及當判斷該音量值大於該第二音量臨界值時,通過該處理模組判斷該音量值是否小於或等於該第一音量臨界值。
- 如請求項7所述之語音活動檢測裝置,其中該第二音量臨界值係介於40~50dB。
- 如請求項6所述之語音活動檢測裝置,該方法更包括:通過該處理模組獲取該收音模組的一音量調整值以產生該語音信息的該音量值。
- 如請求項9所述之語音活動檢測裝置,該方法更包括:當判斷該音量值大於該第一音量臨界值時,通過該處理模組判斷該音量值是否小於或等於一第三音量臨界值;當判斷該音量值大於該第三音量臨界值時,通過該處理模組調整該音量值至小於該第三音量臨界值;以及當判斷該音量值小於或等於該第三音量臨界值時,通過該提示模組產生符合音量值標準的該第二提示信息。
- 一種語音活動檢測方法,適用於一語音活動檢測裝置,其中該語音活動檢測裝置包括一收音模組、一處理模組及一提示模組,該語音活動檢測方法包括:通過該收音模組接收一語音信息; 通過該處理模組獲取該語音信息的一音量值;通過該處理模組判斷該音量值是否介於一第一音量臨界值與一第二音量臨界值之間;當判斷該音量值介於該第一音量臨界值與該第二音量臨界值之間時,通過該提示模組產生符合音量值標準的一第一提示信息;以及當判斷該音量值不介於該第一音量臨界值與該第二音量臨界值之間時,通過該處理模組調整該音量值至一音量預設值。
- 如請求項11所述之語音活動檢測方法,其中該第一音量臨界值大於該第二音量臨界值,該音量預設值介於該第一音量臨界值與該第二音量臨界值之間。
- 如請求項11所述之語音活動檢測方法,其中該第一音量臨界值係90dB,該第二音量臨界值係介於50~60dB,該音量預設值係介於60~70dB。
- 一種語音活動檢測裝置,包括:一收音模組;一處理模組,耦接該收音模組;以及一提示模組,耦接該處理模組;其中該處理模組用以執行一語音活動檢測方法,該方法包括:通過該收音模組接收一語音信息;通過該處理模組獲取該語音信息的一音量值;通過該處理模組判斷該音量值是否介於一第一音量臨界值與一第二音量臨界值之間; 當判斷該音量值介於該第一音量臨界值與該第二音量臨界值之間時,通過該提示模組產生符合音量值標準的一第一提示信息;以及當判斷該音量值不介於該第一音量臨界值與該第二音量臨界值之間時,通過該處理模組調整該音量值至一音量預設值。
- 如請求項14所述之語音活動檢測裝置,其中該第一音量臨界值大於該第二音量臨界值,該音量預設值介於該第一音量臨界值與該第二音量臨界值之間。
- 如請求項15所述之語音活動檢測裝置,其中該第一音量臨界值係90dB,該第二音量臨界值係介於50~60dB,該音量預設值係60~70dB。
- 一種語音活動檢測方法,適用於一語音活動檢測裝置,其中該語音活動檢測裝置包括一收音模組、一處理模組及一提示模組,該語音活動檢測方法包括:通過該收音模組接收一語音信息;通過該處理模組獲取該語音信息的一音量值;通過該處理模組判斷該音量值是否小於或等於一第一音量臨界值;當判斷該音量值小於或等於該第一音量臨界值時,通過該提示模組產生該音量值提高的一第一提示信息;當判斷該音量值大於該第一音量臨界值時,通過該處理模組判斷該音量值是否小於或等於一第二音量臨界值;當判斷該音量值小於或等於該第二音量臨界值時,通過該處理模組調整該音量值至一音量預設值; 當判斷該音量值大於該第二音量臨界值時,通過該處理模組判斷該音量值是否小於或等於一第三音量臨界值;當判斷該音量值小於或等於該第三音量臨界值時,通過該提示模組產生符合音量值標準的一第一提示信息;以及當判斷該音量值大於該第三音量臨界值時,通過該處理模組調整該音量值至該音量預設值。
- 如請求項17所述之語音活動檢測方法,其中該第三音量臨界值大於該第二音量臨界值,該第二音量臨界值大於該第一音量臨界值,該音量預設值係介於該第三音量臨界值與該第二音量臨界值之間。
- 如請求項17所述之語音活動檢測方法,其中該第一音量臨界值係90dB,該第二音量臨界值係介於50~60dB,該第三音量臨界值係介於40~50dB,該音量預設值係介於60~70dB。
- 一種語音活動檢測裝置,包括:一收音模組;一處理模組,耦接該收音模組;以及一提示模組,耦接該處理模組;其中該處理模組用以執行一語音活動檢測方法,該方法包括:通過該收音模組接收一語音信息;通過該處理模組獲取該語音信息的一音量值;通過該處理模組判斷該音量值是否小於或等於一第一音量臨界值;當判斷該音量值小於或等於該第一音量臨界值時,通過該提示模組產生該音量值提高的一第一提示信息; 當判斷該音量值大於該第一音量臨界值時,通過該處理模組判斷該音量值是否小於或等於一第二音量臨界值;當判斷該音量值小於或等於該第二音量臨界值時,通過該處理模組調整該音量值至一音量預設值;當判斷該音量值大於該第二音量臨界值時,通過該處理模組判斷該音量值是否小於或等於一第三音量臨界值;當判斷該音量值小於或等於該第三音量臨界值時,通過該提示模組產生符合音量值標準的一第一提示信息;以及當判斷該音量值大於該第三音量臨界值時,通過該處理模組調整該音量值至該音量預設值。
- 如請求項20所述之語音活動檢測裝置,其中該第三音量臨界值大於該第二音量臨界值,該第二音量臨界值大於該第一音量臨界值,該音量預設值係介於該第三音量臨界值與該第二音量臨界值之間。
- 如請求項20所述之語音活動檢測裝置,其中該第一音量臨界值係90dB,該第二音量臨界值係介於50~60dB,該第三音量臨界值係介於40~50dB,該音量預設值係介於60~70dB。
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US202263423453P | 2022-11-07 | 2022-11-07 | |
| US63/423,453 | 2022-11-07 | ||
| US202363449272P | 2023-03-01 | 2023-03-01 | |
| US63/449,272 | 2023-03-01 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW202420296A TW202420296A (zh) | 2024-05-16 |
| TWI852489B true TWI852489B (zh) | 2024-08-11 |
Family
ID=86604778
Family Applications (5)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW112114808A TWI852489B (zh) | 2022-11-07 | 2023-04-20 | 語音活動檢測裝置及方法 |
| TW112121192A TWI832774B (zh) | 2022-11-07 | 2023-06-07 | 隨身攝影機及其操作方法 |
| TW112121198A TWI882349B (zh) | 2022-11-07 | 2023-06-07 | 具有運作指示模式切換結構的裝置、運作指示模式切換電路與其運作方法 |
| TW112129654A TWI841470B (zh) | 2022-11-07 | 2023-08-08 | 連續記錄數位內容的記憶體管理方法與電路系統 |
| TW112142737A TWI906690B (zh) | 2022-11-07 | 2023-11-07 | 可攜式電子裝置及其使用者介面操作方法 |
Family Applications After (4)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW112121192A TWI832774B (zh) | 2022-11-07 | 2023-06-07 | 隨身攝影機及其操作方法 |
| TW112121198A TWI882349B (zh) | 2022-11-07 | 2023-06-07 | 具有運作指示模式切換結構的裝置、運作指示模式切換電路與其運作方法 |
| TW112129654A TWI841470B (zh) | 2022-11-07 | 2023-08-08 | 連續記錄數位內容的記憶體管理方法與電路系統 |
| TW112142737A TWI906690B (zh) | 2022-11-07 | 2023-11-07 | 可攜式電子裝置及其使用者介面操作方法 |
Country Status (3)
| Country | Link |
|---|---|
| US (5) | US12393334B2 (zh) |
| EP (4) | EP4365892A1 (zh) |
| TW (5) | TWI852489B (zh) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI852489B (zh) * | 2022-11-07 | 2024-08-11 | 神基科技股份有限公司 | 語音活動檢測裝置及方法 |
| US20250251902A1 (en) * | 2024-02-07 | 2025-08-07 | SuperScope Technologies Inc. | Record Check |
| JP7665249B1 (ja) * | 2024-10-25 | 2025-04-21 | Matsuo Sangyoグループ株式会社 | カメラシステム |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TW201414274A (zh) * | 2012-09-21 | 2014-04-01 | Hon Hai Prec Ind Co Ltd | 音效處理系統及方法 |
| CN108320742A (zh) * | 2018-01-31 | 2018-07-24 | 广东美的制冷设备有限公司 | 语音交互方法、智能设备及存储介质 |
| CN108630202A (zh) * | 2017-03-21 | 2018-10-09 | 株式会社东芝 | 语音识别装置、语音识别方法以及语音识别程序 |
| US20220021978A1 (en) * | 2020-07-20 | 2022-01-20 | Apple Inc. | Multi-device audio adjustment coordination |
Family Cites Families (59)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0675588A (ja) | 1992-08-27 | 1994-03-18 | Fujitsu Ltd | 音声認識装置 |
| US5418762A (en) * | 1992-12-09 | 1995-05-23 | Sony Corporation | Optical disk recording device having a pre-recording mode |
| US6519003B1 (en) | 1998-03-26 | 2003-02-11 | Eastman Kodak Company | Camera with combination four-way directional and mode control interface |
| US6825875B1 (en) * | 1999-01-05 | 2004-11-30 | Interval Research Corporation | Hybrid recording unit including portable video recorder and auxillary device |
| US7155735B1 (en) | 1999-10-08 | 2006-12-26 | Vulcan Patents Llc | System and method for the broadcast dissemination of time-ordered data |
| JP4101421B2 (ja) | 1999-12-27 | 2008-06-18 | 富士フイルム株式会社 | 入力ユニット、入力ユニットを利用可能な情報記録装置およびデジタルカメラ |
| JP4620894B2 (ja) * | 2001-04-06 | 2011-01-26 | キヤノン株式会社 | 電子機器 |
| US6957397B1 (en) * | 2001-06-11 | 2005-10-18 | Palm, Inc. | Navigating through a menu of a handheld computer using a keyboard |
| TWI225369B (en) * | 2003-03-18 | 2004-12-11 | Jin-Shu Chen | Diversified video recording apparatus |
| US20040212637A1 (en) | 2003-04-22 | 2004-10-28 | Kivin Varghese | System and Method for Marking and Tagging Wireless Audio and Video Recordings |
| US7023004B2 (en) | 2003-10-23 | 2006-04-04 | Timothy Ford | Multi-mode electromagnetic radiation emitting device |
| US20050147397A1 (en) * | 2003-12-17 | 2005-07-07 | Sony Corporation | Image pickup apparatus |
| KR20050090798A (ko) | 2004-03-10 | 2005-09-14 | 삼성전자주식회사 | 촬영장치의 모드선택 스위치 |
| JP4379800B2 (ja) * | 2004-07-12 | 2009-12-09 | ソニー・エリクソン・モバイルコミュニケーションズ株式会社 | 受信装置およびそのメモリ解放方法 |
| JP2006040382A (ja) * | 2004-07-27 | 2006-02-09 | Sony Corp | デジタルデータの記録装置および記録方法 |
| TWI245191B (en) * | 2004-09-14 | 2005-12-11 | Ali Corp | Sound receiving and pre-recording device and method |
| US20060085834A1 (en) * | 2004-10-19 | 2006-04-20 | Cayin Technology Co., Ltd. | System and method for transmitting multi-channel signals |
| WO2008085206A2 (en) * | 2006-12-29 | 2008-07-17 | Prodea Systems, Inc. | Subscription management of applications and services provided through user premises gateway devices |
| US8140325B2 (en) * | 2007-01-04 | 2012-03-20 | International Business Machines Corporation | Systems and methods for intelligent control of microphones for speech recognition applications |
| US8209728B2 (en) | 2007-08-31 | 2012-06-26 | At&T Intellectual Property I, L.P. | System and method of delivering video content |
| JP5075664B2 (ja) * | 2008-02-15 | 2012-11-21 | 株式会社東芝 | 音声対話装置及び支援方法 |
| US8872940B2 (en) * | 2008-03-03 | 2014-10-28 | Videoiq, Inc. | Content aware storage of video data |
| US10354689B2 (en) | 2008-04-06 | 2019-07-16 | Taser International, Inc. | Systems and methods for event recorder logging |
| TWI402718B (zh) * | 2008-07-01 | 2013-07-21 | Inventec Corp | 電子裝置及其操控方法 |
| US10737185B2 (en) * | 2009-03-18 | 2020-08-11 | Microsoft Technology Licensing, Llc | Virtual environment controls based on voice chat audio inputs |
| CN117294934B (zh) | 2010-09-13 | 2025-03-14 | 康道尔知识产权控股有限责任公司 | 配置用于远程图像采集控制和观看的便携式数字视频摄像机 |
| JP6088733B2 (ja) | 2011-11-29 | 2017-03-01 | オリンパス株式会社 | 撮像装置 |
| JP5189221B1 (ja) * | 2012-03-13 | 2013-04-24 | シャープ株式会社 | コンテンツ表示装置、テレビジョン受像機、メニュー画面生成方法、プログラム、及び、記録媒体 |
| WO2014052898A1 (en) * | 2012-09-28 | 2014-04-03 | Digital Ally, Inc. | Portable video and imaging system |
| US20140104493A1 (en) * | 2012-10-11 | 2014-04-17 | Tangome, Inc. | Proactive video frame dropping for hardware and network variance |
| WO2014065127A1 (ja) * | 2012-10-22 | 2014-05-01 | ソニー株式会社 | 情報処理端末、撮像機、情報処理方法、プログラム、および遠隔撮像システム |
| US9329833B2 (en) * | 2013-12-20 | 2016-05-03 | Dell Products, L.P. | Visual audio quality cues and context awareness in a virtual collaboration session |
| TWI516950B (zh) | 2013-12-23 | 2016-01-11 | 勝捷光電股份有限公司 | 即時記錄分享系統及方法 |
| KR102164798B1 (ko) | 2014-09-11 | 2020-10-13 | 삼성전자 주식회사 | 디스플레이 구동 회로 및 이를 포함하는 디스플레이 장치 |
| WO2016088919A1 (ko) * | 2014-12-04 | 2016-06-09 | (주) 트라이너스 | 무선 마이크로폰 시스템 |
| US9661283B2 (en) | 2014-12-24 | 2017-05-23 | Panasonic Intellectual Property Management Co., Ltd. | Wearable camera |
| US20160196693A1 (en) | 2015-01-06 | 2016-07-07 | Seiko Epson Corporation | Display system, control method for display device, and computer program |
| CA2913568C (en) | 2015-01-29 | 2024-01-02 | Panasonic Intellectual Property Management Co., Ltd. | Wearable camera system, and video recording control method for wearable camera system |
| US20160286156A1 (en) | 2015-02-12 | 2016-09-29 | Creative Law Enforcement Resources, Inc. | System for managing information related to recordings from video/audio recording devices |
| TWI550612B (zh) * | 2015-03-23 | 2016-09-21 | 群聯電子股份有限公司 | 資料程式化方法、記憶體儲存裝置及記憶體控制電路單元 |
| CN105045473A (zh) * | 2015-07-01 | 2015-11-11 | 沈波 | 一种人机交互系统及方法 |
| CN105120063A (zh) | 2015-07-13 | 2015-12-02 | 联想(北京)有限公司 | 一种输入语音的音量提示方法及电子设备 |
| US20170094231A1 (en) * | 2015-09-29 | 2017-03-30 | Faraday&Future Inc. | Scene reconstruction using pre-buffering in sensor triggered automobile cameras |
| US9697884B2 (en) * | 2015-10-08 | 2017-07-04 | Rambus Inc. | Variable width memory module supporting enhanced error detection and correction |
| US10812894B2 (en) | 2016-12-23 | 2020-10-20 | Motorola Solutions, Inc. | Portable communication device and method of operating the same in covert operation mode |
| JP6894736B2 (ja) * | 2017-03-24 | 2021-06-30 | キヤノン株式会社 | 記録装置、制御方法、及びプログラム |
| CN107291341B (zh) * | 2017-07-11 | 2021-03-09 | 广州飞傲电子科技有限公司 | 音乐播放器通过触摸转盘旋转进行选择的方法及系统 |
| CN109548080B (zh) * | 2017-08-11 | 2023-05-16 | 夏普株式会社 | 用于媒体接入控制层组包的相关方法、用户设备和基站 |
| US20190266881A1 (en) | 2018-02-25 | 2019-08-29 | Laura Gasparis Vonfrolio | System and method for an alert and crisis/emergency management system |
| CN108668017A (zh) | 2018-04-19 | 2018-10-16 | Oppo广东移动通信有限公司 | 音量提示方法、模式切换方法、装置、终端及存储介质 |
| CN110750491A (zh) | 2018-07-06 | 2020-02-04 | 神讯电脑(昆山)有限公司 | 信息撷取装置的设定方法 |
| CN110858493A (zh) | 2018-08-23 | 2020-03-03 | 神讯电脑(昆山)有限公司 | 资讯撷取装置 |
| CN110881076A (zh) * | 2018-09-06 | 2020-03-13 | 上海伴我科技有限公司 | 终端通信装置 |
| TW202113561A (zh) * | 2019-09-20 | 2021-04-01 | 和碩聯合科技股份有限公司 | 筆記型電腦及其操作方法 |
| JP2022022152A (ja) * | 2020-07-24 | 2022-02-03 | シンクウェア コーポレーション | 不揮発性メモリ記憶装置の寿命および故障を判断するための電子装置およびその方法 |
| TW202205143A (zh) | 2020-07-30 | 2022-02-01 | 杰悉科技股份有限公司 | 影像物件標籤方法 |
| US11489996B2 (en) * | 2021-03-31 | 2022-11-01 | Johnny Burton | Wireless earpiece camera apparatus |
| US11950017B2 (en) * | 2022-05-17 | 2024-04-02 | Digital Ally, Inc. | Redundant mobile video recording |
| TWI852489B (zh) * | 2022-11-07 | 2024-08-11 | 神基科技股份有限公司 | 語音活動檢測裝置及方法 |
-
2023
- 2023-04-20 TW TW112114808A patent/TWI852489B/zh active
- 2023-05-16 US US18/318,649 patent/US12393334B2/en active Active
- 2023-05-25 EP EP23175301.3A patent/EP4365892A1/en active Pending
- 2023-06-07 TW TW112121192A patent/TWI832774B/zh active
- 2023-06-07 TW TW112121198A patent/TWI882349B/zh active
- 2023-07-11 US US18/350,707 patent/US12353710B2/en active Active
- 2023-07-18 US US18/354,552 patent/US12554396B2/en active Active
- 2023-07-31 EP EP23188628.4A patent/EP4365705A1/en active Pending
- 2023-08-03 EP EP23189417.1A patent/EP4365893A1/en active Pending
- 2023-08-08 TW TW112129654A patent/TWI841470B/zh active
- 2023-10-09 EP EP23202395.2A patent/EP4365899A1/en active Pending
- 2023-10-11 US US18/484,594 patent/US12360668B2/en active Active
- 2023-11-07 TW TW112142737A patent/TWI906690B/zh active
-
2025
- 2025-06-27 US US19/252,206 patent/US20250328241A1/en active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TW201414274A (zh) * | 2012-09-21 | 2014-04-01 | Hon Hai Prec Ind Co Ltd | 音效處理系統及方法 |
| CN108630202A (zh) * | 2017-03-21 | 2018-10-09 | 株式会社东芝 | 语音识别装置、语音识别方法以及语音识别程序 |
| CN108320742A (zh) * | 2018-01-31 | 2018-07-24 | 广东美的制冷设备有限公司 | 语音交互方法、智能设备及存储介质 |
| US20220021978A1 (en) * | 2020-07-20 | 2022-01-20 | Apple Inc. | Multi-device audio adjustment coordination |
Also Published As
| Publication number | Publication date |
|---|---|
| US20240155082A1 (en) | 2024-05-09 |
| TW202420042A (zh) | 2024-05-16 |
| TWI841470B (zh) | 2024-05-01 |
| TW202420038A (zh) | 2024-05-16 |
| TWI832774B (zh) | 2024-02-11 |
| EP4365892A1 (en) | 2024-05-08 |
| US12554396B2 (en) | 2026-02-17 |
| US20240153719A1 (en) | 2024-05-09 |
| EP4365705A1 (en) | 2024-05-08 |
| EP4365893A1 (en) | 2024-05-08 |
| EP4365899A1 (en) | 2024-05-08 |
| TW202420219A (zh) | 2024-05-16 |
| TW202420296A (zh) | 2024-05-16 |
| US20240153530A1 (en) | 2024-05-09 |
| TW202420801A (zh) | 2024-05-16 |
| TWI906690B (zh) | 2025-12-01 |
| US12360668B2 (en) | 2025-07-15 |
| TWI882349B (zh) | 2025-05-01 |
| US20250328241A1 (en) | 2025-10-23 |
| US12353710B2 (en) | 2025-07-08 |
| US12393334B2 (en) | 2025-08-19 |
| US20240152273A1 (en) | 2024-05-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI852489B (zh) | 語音活動檢測裝置及方法 | |
| US8165321B2 (en) | Intelligent clip mixing | |
| CN114868403B (zh) | 多频带限制器模式和噪声补偿方法 | |
| US9525392B2 (en) | System and method for dynamically adapting playback device volume on an electronic device | |
| CN114902560B (zh) | 具有环境噪音补偿的用于自动音量控制的设备和方法 | |
| US11627421B1 (en) | Method for realizing hearing aid function based on bluetooth headset chip and a bluetooth headset | |
| CN1369188A (zh) | 用于声复制的补偿系统和方法 | |
| CN103236263A (zh) | 一种改善通话质量的方法、系统及移动终端 | |
| WO2018018705A1 (zh) | 一种语音通话的方法、装置及终端 | |
| CN110347366B (zh) | 音量调节方法、终端设备、存储介质及电子设备 | |
| CN114664322B (zh) | 基于蓝牙耳机芯片的单麦克风助听降噪方法及蓝牙耳机 | |
| CN107168677A (zh) | 音频处理方法及装置、电子设备、存储介质 | |
| CN105764008B (zh) | 一种调试扩声系统传输频率特性的方法及装置 | |
| CN111552452A (zh) | 匹配音频输出参数的方法、设备及存储介质 | |
| WO2019033940A1 (zh) | 音量调节方法、装置、终端设备及存储介质 | |
| WO2023070792A1 (zh) | 通话式门铃的音量均衡方法、设备和可读存储介质 | |
| TW202226230A (zh) | 將麥克風信號靜音和取消靜音之方法 | |
| CN113360129A (zh) | 声音播放方法、装置、电子设备及可读存储介质 | |
| CN117998253A (zh) | 语音活动检测装置及方法 | |
| CN118921521B (zh) | 音频信号处理方法、装置、电子设备及存储介质 | |
| CN102446510A (zh) | 自动增益控制系统及方法 | |
| CN116132869A (zh) | 耳机音量的调节方法、耳机及存储介质 | |
| CN112700785B (zh) | 语音信号处理方法、装置及相关设备 | |
| CN110072174B (zh) | 音量自适应播放机 | |
| CN101686039A (zh) | 用于多媒体装置的音频处理装置以及音频处理方法 |