TWI852489B - 語音活動檢測裝置及方法 - Google Patents

語音活動檢測裝置及方法 Download PDF

Info

Publication number
TWI852489B
TWI852489B TW112114808A TW112114808A TWI852489B TW I852489 B TWI852489 B TW I852489B TW 112114808 A TW112114808 A TW 112114808A TW 112114808 A TW112114808 A TW 112114808A TW I852489 B TWI852489 B TW I852489B
Authority
TW
Taiwan
Prior art keywords
volume
value
threshold value
processing module
volume threshold
Prior art date
Application number
TW112114808A
Other languages
English (en)
Other versions
TW202420296A (zh
Inventor
危仁靖
柯律廷
Original Assignee
神基科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 神基科技股份有限公司 filed Critical 神基科技股份有限公司
Publication of TW202420296A publication Critical patent/TW202420296A/zh
Application granted granted Critical
Publication of TWI852489B publication Critical patent/TWI852489B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0604Improving or facilitating administration, e.g. storage management
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1613Constructional details or arrangements for portable computers
    • G06F1/163Wearable computers, e.g. on a belt
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/1613Constructional details or arrangements for portable computers
    • G06F1/1633Constructional details or arrangements of portable computers not specific to the type of enclosures covered by groups G06F1/1615 - G06F1/1626
    • G06F1/1684Constructional details or arrangements related to integrated I/O peripherals not covered by groups G06F1/1635 - G06F1/1675
    • G06F1/1686Constructional details or arrangements related to integrated I/O peripherals not covered by groups G06F1/1635 - G06F1/1675 the I/O peripheral being an integrated camera
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0655Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0674Disk device
    • G06F3/0676Magnetic disk device
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0679Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING SYSTEMS, e.g. PERSONAL CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B13/00Burglar, theft or intruder alarms
    • G08B13/18Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
    • G08B13/189Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
    • G08B13/194Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
    • G08B13/196Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
    • G08B13/19617Surveillance camera constructional details
    • G08B13/19621Portable camera
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01HELECTRIC SWITCHES; RELAYS; SELECTORS; EMERGENCY PROTECTIVE DEVICES
    • H01H9/00Details of switching devices, not covered by groups H01H1/00 - H01H7/00
    • H01H9/16Indicators for switching condition, e.g. "on" or "off"
    • H01H9/161Indicators for switching condition, e.g. "on" or "off" comprising light emitting elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/183Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/183Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
    • H04N7/185Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source from a mobile camera, e.g. for remote control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • G10L2025/786Adaptive threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Studio Devices (AREA)
  • User Interface Of Digital Computer (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Input From Keyboards Or The Like (AREA)
  • Switches With Compound Operations (AREA)
  • Traffic Control Systems (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Slide Switches (AREA)

Abstract

一種語音活動檢測裝置及方法,其中語音活動檢測裝置包括收音模組、耦接收音模組的處理模組及耦接處理模組的提示模組,其中處理模組用以執行語音活動檢測方法包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否小於或等於第一音量臨界值;當判斷音量值小於或等於第一音量臨界值時,通過提示模組產生音量值提高的第一提示信息;以及當判斷音量值大於第一音量臨界值時,通過提示模組產生符合音量值標準的第二提示信息。藉此,有效提高接收語音時音量產生的電平信號,及語音轉文本的準確率。

Description

語音活動檢測裝置及方法
本發明是有關一種語音活動檢測技術,尤其是一種語音轉文字的語音活動檢測裝置及方法。
目前大多數內建麥克風實際收音的線路輸入皆需透過微軟應用程式來進行增益大小的管理。然而,當增益大小設定不當或使用者無法確認語音辨識演算法模型收到的實際麥克風聲音,麥克風的實際聲音會被預先內建的控制單元處理過(量化增益大小),導致原始的音量大小無法被還原,這將導致演算法模型輸出的語音的準確性。特別地是,於室外環境並具有背景噪音的情況下,處理後語音進行語音轉文字的準確率相對低。
本發明提供一種語音活動檢測裝置及方法,可以有效提高接收語音時由音量產生的電平信號,以及在有背景噪音的室外環境中語音轉文本的準確率。
本發明所提供的語音活動檢測裝置包括收音模組、處理模組、及提示模組,其中處理模組耦接收音模組,以及提示模組耦接處理模組。其中處理模組用以執行語音活動檢測方法,包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否小於或等於第一音量臨界值;當判斷音量值小於或等於第一音量臨界值時,通過提示模組產生音量值提高的第一提示信息;以及當判斷音量值大於第一音量臨界值時,通過提示模組產生符合音量值標準的第二提示信息。
本發明所提供的語音活動檢測方法,適用於語音活動檢測裝置,其中語音活動檢測裝置包括收音模組、處理模組及提示模組,語音活動檢測方法包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否小於或等於第一音量臨界值;當判斷音量值小於或等於第一音量臨界值時,通過提示模組產生音量值提高的第一提示信息;以及當判斷音量值大於第一音量臨界值時,通過提示模組產生符合音量值標準的第二提示信息。
在本發明的一實施例中,上述之第一音量臨界值係介於50~60dB。
在本發明的一實施例中,上述之語音活動檢測方法更包括:通過處理模組判斷音量值是否小於或等於第二音量臨界值;當判斷音量值小於或等於第二音量臨界值時,通過提示模組產生音量值提高的第一提示信息;以及當判斷音量值大於第二音量臨界值時,通過處理模組判斷音量值是否小於或等於第一音量臨界值。
在本發明的一實施例中,上述之第二音量臨界值係介於40~50dB。
在本發明的一實施例中,上述之語音活動檢測方法更包括:通過處理模組獲取收音模組的音量調整值以產生語音信息的音量值。
在本發明的一實施例中,上述之語音活動檢測方法更包括:當判斷音量值大於第一音量臨界值時,通過處理模組判斷音量值是否小於或等於第三音量臨界值;當判斷音量值大於第三音量臨界值時,通過處理模組調整音量值至小於第三音量臨界值;以及當判斷音量值小於或等於第三音量臨界值時,通過提示模組產生符合音量值標準的第二提示信息。
本發明所提供的語音活動檢測裝置包括:收音模組、處理模組、及提示模組,其中處理模組耦接收音模組,以及提示模組耦接處理模組。其中處理模組用以執行語音活動檢測方法,包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否介於第一音量臨界值與第二音量臨界值之間;當判斷音量值介於第一音量臨界值與第二音量臨界值之間時,通過提示模組產生符合音量值標準的第一提示信息;以及當判斷音量值不介於第一音量臨界值與第二音量臨界值之間時,通過處理模組調整音量值至音量預設值。
本發明所提供的語音活動檢測方法,適用於語音活動檢測裝置,其中語音活動檢測裝置包括收音模組、處理模組及提示模組,語音活動檢測方法包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否介於第一音量臨界值與第二音量臨界值之間;當判斷音量值介於第一音量臨界值與第二音量臨界值之間時,通過提示模組產生符合音量值標準的第一提示信息;以及當判斷音量值不介於第一音量臨界值與第二音量臨界值之間時,通過處理模組調整音量值至音量預設值。
在本發明的一實施例中,上述之第一音量臨界值大於第二音量臨界值,音量預設值介於第一音量臨界值與第二音量臨界值之間。
在本發明的一實施例中,上述之第一音量臨界值係90dB,第二音量臨界值係介於50~60dB,音量預設值係介於60~70dB。
本發明所提供的語音活動檢測裝置包括:收音模組、處理模組、及提示模組,其中處理模組耦接收音模組,以及提示模組耦接處理模組。其中處理模組用以執行語音活動檢測方法,包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否小於或等於第一音量臨界值;當判斷音量值小於或等於第一音量臨界值時,通過提示模組產生音量值提高的第一提示信息;當判斷音量值大於第一音量臨界值時,通過處理模組判斷音量值是否小於或等於第二音量臨界值;當判斷音量值小於或等於第二音量臨界值時,通過處理模組調整音量值至音量預設值;當判斷音量值大於第二音量臨界值時,通過處理模組判斷音量值是否小於或等於第三音量臨界值;當判斷音量值小於或等於第三音量臨界值時,通過提示模組產生符合音量值標準的第一提示信息;以及當判斷音量值大於第三音量臨界值時,通過處理模組調整音量值至音量預設值。
本發明所提供的語音活動檢測方法,適用於語音活動檢測裝置,其中語音活動檢測裝置包括收音模組、處理模組及提示模組,語音活動檢測方法包括:通過收音模組接收語音信息;通過處理模組獲取語音信息的音量值;通過處理模組判斷音量值是否小於或等於第一音量臨界值;當判斷音量值小於或等於第一音量臨界值時,通過提示模組產生音量值提高的第一提示信息;當判斷音量值大於第一音量臨界值時,通過處理模組判斷音量值是否小於或等於第二音量臨界值;當判斷音量值小於或等於第二音量臨界值時,通過處理模組調整音量值至音量預設值;當判斷音量值大於第二音量臨界值時,通過處理模組判斷音量值是否小於或等於第三音量臨界值;當判斷音量值小於或等於第三音量臨界值時,通過提示模組產生符合音量值標準的第一提示信息;以及當判斷音量值大於第三音量臨界值時,通過處理模組調整音量值至音量預設值。
在本發明的一實施例中,上述之第三音量臨界值大於第二音量臨界值,第二音量臨界值大於第一音量臨界值,音量預設值係介於第三音量臨界值與第二音量臨界值之間。
在本發明的一實施例中,上述之第一音量臨界值係90dB,第二音量臨界值係介於50~60dB,第三音量臨界值係介於40~50dB,音量預設值係介於60~70dB。
本發明因採用語音活動檢測方法,因此可以有效提高接收語音時由音量產生的電平信號,以及在有背景噪音的室外環境中語音轉文本的準確率。
為讓本發明之上述和其他目的、特徵和優點能更明顯易懂,下文特舉實施例,並配合所附圖式,作詳細說明如下。
為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅用以解釋本發明,並不用於限定本發明。基於本發明中的實施例,所屬技術領域中具有通常知識者在沒有作出進步性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。
需要說明的是,如果不衝突,本發明實施例中的各個特徵可以相互結合,均在本發明的保護範圍之內。另外,本發明所採用的「第一」、「第二」、「第三」等字樣並不對數據和執行次序進行限定,僅是對功能和作用基本相同的相同項或相似項進行區分。
再者,需要說明的是,在本發明實施例中,耦接的方式包括了:直接電連接,以及通過其他元件、模組、或裝置電連接。後文中出現的“耦接”均包括了這些方式,後文不再贅述。
請參閱圖1所示,為本發明一實施例所提供的語音活動檢測裝置的方塊圖。本實施例的語音活動檢測裝置1包括收音模組2、處理模組3、以及提示模組4,其中處理模組3耦接收音模組2,以及提示模組4耦接處理模組3。在另一實施例中,語音活動檢測裝置1例如但不限於包括硬體、韌體、及軟體。在另一實施例中,收音模組2例如但不限於麥克風。在另一實施例中,處理模組3例如但不限於包括處理電路、編解碼電路、降噪電路、及儲存電路。在另一實施例中,提示模組4例如但不限於顯示電路、發光電路、播音電路,用於顯示語音的波形與顏色、及發出聲音提醒等。
在一實施例中,語音活動檢測裝置1具有一應用程式介面提供使用者手動選擇可基於其他播放軟體例如但不限於多媒體擴展(MME)中的wavein以依據收音模組2的音量調整值的wavein模式、可直接通過通用音頻架構(UAA)的視窗音頻對話應用程式介面(WASAPI)以直接接收收音模組2所接收到的語音信息的WASAPI模式、以及可由語音活動檢測裝置1自主決定wavein模式、WASAPI模式、或wavein模式與WASAPI模式交互使用的自動模式。
請參閱圖2所示,為本發明第一實施例所提供的語音活動檢測方法的流程圖。本實施例的語音活動檢測方法適用於語音活動檢測裝置1,執行於WASAPI模式與自動模式中,並由處理模組3執行以包括以下步驟。步驟S1:通過收音模組2接收語音信息。步驟S3:通過處理模組3獲取語音信息的音量值。步驟S5:通過處理模組3判斷音量值是否小於或等於第一音量臨界值。步驟S7:當判斷音量值小於或等於第一音量臨界值時,通過提示模組4產生音量值提高的第一提示信息。步驟S9:當判斷音量值大於第一音量臨界值,通過提示模組4產生符合音量值標準的第二提示信息。在本實施例中,第一音量臨界值係例如但不限於介於40~50dB、或介於50~60dB等。其中,第一音量臨界值可依據實際環境及需求來設定,本發明不以上述音量範圍為限。在本實施例中,當第一音量臨界值介於40~50dB時,第一提示信息例如但不限於語音波形及波形顏色如無振幅紅色波形,及第二提示信息例如但不限於語音波形及波形顏色如微小振幅黃色波形;或是,當第一音量臨界值介於50~60dB時,第一提示信息例如但不限於語音波形及波形顏色如微小振幅黃色波形,及第二提示信息例如但不限於語音波形及波形顏色如劇烈振幅綠色波形。
在一實施例中,當使用者通過應用程式介面選擇自動模式,收音模組2在接收語音信息之後,處理模組3是直接獲取語音信息的音量值,而並不會受到微軟其他播放軟體調整收音的音量調整值所影響,如此可避免原始的音量大小無法被還原而影響到語音信息轉文本信息的準確率。接著,處理模組3判斷音量值是否小於或等於第一音量臨界值如50dB。如果音量值小於或等於50dB,則提示模組4如顯示電路顯示微小振幅黃色波形的第一提示信息。如果音量值大於50dB,則提示模組4如顯示電路顯示劇烈振幅綠色波形的第二提示信息。
請參閱圖3所示,為本發明第二實施例所提供的語音活動檢測方法的流程圖。本實施例的語音活動檢測方法適用於語音活動檢測裝置1,執行於WASAPI模式與自動模式中,並由處理模組3執行以包括以下步驟。步驟S1:通過收音模組2接收語音信息。步驟S3:通過處理模組3獲取語音信息的音量值。步驟S11:通過處理模組3判斷音量值是否小於或等於第二音量臨界值。步驟S7:當判斷音量值小於或等於第二音量臨界值時,通過提示模組4產生音量值提高的第一提示信息。步驟S15:當判斷音量值大於第二音量臨界值時,通過處理模組3判斷音量值是否小於或等於第一音量臨界值。步驟S7:當判斷音量值小於或等於第一音量臨界值時,通過提示模組4產生音量值提高的第一提示信息。步驟S9:當判斷音量值大於第一音量臨界值,通過提示模組4產生符合音量值標準的第二提示信息。在本實施例中,第一音量臨界值係例如但不限於介於50~60dB等,第二音量臨界值係例如但不限於介於40~50dB等,其中第二音量臨界值小於第一音量臨界值。其中,第一音量臨界值及第二音量臨界值可依據實際環境及需求來設定,本發明不以上述音量範圍為限。在本實施例中,第一提示信息例如但不限於語音波形及波形顏色如無振幅紅色波形或是微小振幅黃色波形,及第二提示信息例如但不限於語音波形及波形顏色如劇烈振幅綠色波形。
在一實施例中,當使用者通過應用程式介面選擇自動模式,收音模組2在接收語音信息之後,處理模組3是直接獲取語音信息的音量值,而並不會受到微軟其他播放軟體調整收音的音量調整值所影響,如此可避免原始的音量大小無法被還原而影響到語音信息轉文本信息的準確率。接著,處理模組3判斷音量值是否小於或等於第二音量臨界值如45dB。如果音量值小於或等於45dB,則提示模組4如顯示電路顯示無振幅紅色波形的第一提示信息。如果音量值大於45dB,則提示模組4如顯示電路顯示微小振幅黃色波形的第一提示信息。接著,處理模組3判斷音量值是否小於或等於第一音量臨界值如55dB。如果音量值小於或等於55dB,則提示模組4如顯示電路顯示微小振幅黃色波形的第一提示信息。如果音量值大於55dB,則提示模組4如顯示電路顯示劇烈振幅綠色波形的第二提示信息。
請參閱圖4所示,為本發明第三實施例所提供的語音活動檢測方法的流程圖。本實施例的語音活動檢測方法適用於語音活動檢測裝置1,執行於wavein模式中,並由處理模組3執行以包括以下步驟。步驟S1:通過收音模組2接收語音信息。步驟S2:通過處理模組3獲取收音模組2的音量調整值以產生語音信息的音量值。步驟S3:通過處理模組3獲取語音信息的音量值。步驟S5:通過處理模組3判斷音量值是否小於或等於第一音量臨界值。步驟S7:當判斷音量值小於或等於第一音量臨界值時,通過提示模組4產生音量值提高的第一提示信息。步驟S17:當判斷音量值大於第一音量臨界值,通過處理模組3判斷音量值是否小於或等於第三音量臨界值。步驟S19:當判斷音量值大於第三音量臨界值時,通過處理模組3調整音量值至小於第三音量臨界值。步驟S9:當判斷音量值小於或等於第三音量臨界值時,通過提示模組4產生符合音量值標準的第二提示信息。
在一實施例中,當使用者通過應用程式介面選擇wavein模式,收音模組2在接收語音信息之後,處理模組會根據其他播放軟體的收音的音量調整值來產生語音信息的音量值。接著,處理模組3獲取語音信息的音量值並判斷音量值是否小於或等於第一音量臨界值如55dB。如果音量值小於或等於55dB,則提示使用者提高語音信息的音量值至65dB。如果音量值大於55dB,則處理模組3判斷音量值是否小於或等於第三音量臨界值如90dB。如果音量值大於90dB,則通過處理模組3調整音量值至65dB以避免收音時爆音。如果音量值小於65dB,通過處理模組3持續獲取語音信息的音量值。
請參閱圖5所示,為本發明第四實施例所提供的語音活動檢測方法的流程圖。本實施例的語音活動檢測方法適用於語音活動檢測裝置1,執行於自動模式中,並由處理模組3執行以包括以下步驟。步驟S1:通過收音模組2接收語音信息。步驟S3:通過處理模組3獲取語音信息的音量值。步驟S21:通過處理模組3判斷音量值是否介於第一音量臨界值與第三音量臨界值之間。步驟S9:當判斷音量值介於第一音量臨界值與第三音量臨界值之間時,通過提示模組4產生符合音量值標準的第二提示信息。步驟S23:當判斷音量值不介於第一音量臨界值與第三音量臨界值之間時,通過處理模組3調整音量值至音量預設值。在本實施例中,第三音量臨界值大於第一音量臨界值,音量預設值介於第三音量臨界值與第一音量臨界值之間。在本實施例中,第三音量臨界值係例如但不限於90dB、第一音量臨界值係例如但不限於介於50~60dB,音量預設值係例如但不限於60~70dB。其中,第三音量臨界值、第一音量臨界值及音量預設值可依據實際環境及需求來設定,本發明不以上述音量範圍為限。
請參閱圖6所示,為本發明第五實施例所提供的語音活動檢測方法的流程圖。本實施例的語音活動檢測方法適用於語音活動檢測裝置1,執行於自動模式中,並由處理模組3執行以包括以下步驟。步驟S1:通過收音模組2接收語音信息。步驟S3:通過處理模組3獲取語音信息的音量值。步驟S11:通過處理模組3判斷音量值是否小於或等於第二音量臨界值。步驟S7:當判斷音量值小於或等於第二音量臨界值時,通過提示模組4產生音量值提高的第一提示信息。步驟S15:當判斷音量值大於第二音量臨界值時,通過處理模組3判斷音量值是否小於或等於第一音量臨界值。步驟S23:當判斷音量值小於或等於第一音量臨界值時,通過處理模組3調整音量值至音量預設值。步驟S17:當判斷音量值大於第一音量臨界值時,通過處理模組3判斷音量值是否小於或等於第三音量臨界值。步驟S9:當判斷音量值小於或等於第三音量臨界值時,通過提示模組4產生符合音量值標準的第二提示信息。步驟S23:當判斷音量值大於第三音量臨界值時,通過處理模組3調整音量值至小於音量預設值。在本實施例中,第三音量臨界值大於第一音量臨界值,第一音量臨界值大於第二音量臨界值,音量預設值係介於該第三音量臨界值與該第一音量臨界值之間。在本實施例中,第三音量臨界值係例如但不限於90dB,第一音量臨界值係例如但不限於介於50~60dB,第二音量臨界值係例如但不限於介於40~50dB,音量預設值係例如但不限於60~70dB。其中,第三音量臨界值、第二音量臨界值、第一音量臨界值及音量預設值可依據實際環境及需求來設定,本發明不以上述音量範圍為限。
綜上所述,本發明所提供的語音活動檢測裝置因採用語音活動檢測方法,因此可以有效提高接收語音時由音量產生的電平信號,以及在有背景噪音的室外環境中語音轉文本的準確率。
雖然本發明已以實施例揭露如上,然其並非用以限定本發明,本發明所屬技術領域中具有通常知識者,在不脫離本發明之精神和範圍內,當可作些許之更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
1:語音活動檢測裝置 2:收音模組 3:處理模組 4:提示模組 S1, S2, S3, S5, S7, S9, S11, S15, S17, S19, S21, S23:步驟
圖1為本發明一實施例所提供的語音活動檢測裝置的方塊圖; 圖2為本發明第一實施例所提供的語音活動檢測方法的流程圖; 圖3為本發明第二實施例所提供的語音活動檢測方法的流程圖; 圖4為本發明第三實施例所提供的語音活動檢測方法的流程圖; 圖5為本發明第四實施例所提供的語音活動檢測方法的流程圖;以及 圖6為本發明第五實施例所提供的語音活動檢測方法的流程圖。
S1,S3,S5,S7,S9:步驟

Claims (22)

  1. 一種語音活動檢測方法,適用於一語音活動檢測裝置,其中該語音活動檢測裝置包括一收音模組、一處理模組及一提示模組,該語音活動檢測方法包括:通過該收音模組接收一語音信息;通過該處理模組獲取該語音信息的一音量值;通過該處理模組判斷該音量值是否小於或等於一第一音量臨界值;當判斷該音量值小於或等於該第一音量臨界值時,通過該提示模組產生該音量值提高的一第一提示信息;以及當判斷該音量值大於該第一音量臨界值時,通過該提示模組產生符合音量值標準的一第二提示信息;其中該第一音量臨界值係介於50~60dB。
  2. 如請求項1所述之語音活動檢測方法,更包括:通過該處理模組判斷該音量值是否小於或等於一第二音量臨界值;當判斷該音量值小於或等於該第二音量臨界值時,通過該提示模組產生該音量值提高的該第一提示信息;以及當判斷該音量值大於該第二音量臨界值時,通過該處理模組判斷該音量值是否小於或等於該第一音量臨界值。
  3. 如請求項2所述之語音活動檢測方法,其中該第二音量臨界值係介於40~50dB。
  4. 如請求項1所述之語音活動檢測方法,更包括: 通過該處理模組獲取該收音模組的一音量調整值以產生該語音信息的該音量值。
  5. 如請求項4所述之語音活動檢測方法,更包括:當判斷該音量值大於該第一音量臨界值時,通過該處理模組判斷該音量值是否小於或等於一第三音量臨界值;當判斷該音量值大於該第三音量臨界值時,通過該處理模組調整該音量值至小於該第三音量臨界值;以及當判斷該音量值小於或等於該第三音量臨界值時,通過該提示模組產生符合音量值標準的該第二提示信息。
  6. 一種語音活動檢測裝置,包括:一收音模組;一處理模組,耦接該收音模組;以及一提示模組,耦接該處理模組;其中該處理模組用以執行一語音活動檢測方法,該方法包括:通過該收音模組接收一語音信息;通過該處理模組獲取該語音信息的一音量值;通過該處理模組判斷該音量值是否小於或等於一第一音量臨界值;當判斷該音量值小於或等於該第一音量臨界值時,通過該提示模組產生該音量值提高的一第一提示信息;以及當判斷該音量值大於該第一音量臨界值時,通過該提示模組產生符合音量值標準的一第二提示信息;其中該第一音量臨界值係介於50~60dB。
  7. 如請求項6所述之語音活動檢測裝置,其中該方法更包括:通過該處理模組判斷該音量值是否小於或等於一第二音量臨界值;當判斷該音量值小於或等於該第二音量臨界值時,通過該提示模組產生該音量值提高的該第一提示信息;以及當判斷該音量值大於該第二音量臨界值時,通過該處理模組判斷該音量值是否小於或等於該第一音量臨界值。
  8. 如請求項7所述之語音活動檢測裝置,其中該第二音量臨界值係介於40~50dB。
  9. 如請求項6所述之語音活動檢測裝置,該方法更包括:通過該處理模組獲取該收音模組的一音量調整值以產生該語音信息的該音量值。
  10. 如請求項9所述之語音活動檢測裝置,該方法更包括:當判斷該音量值大於該第一音量臨界值時,通過該處理模組判斷該音量值是否小於或等於一第三音量臨界值;當判斷該音量值大於該第三音量臨界值時,通過該處理模組調整該音量值至小於該第三音量臨界值;以及當判斷該音量值小於或等於該第三音量臨界值時,通過該提示模組產生符合音量值標準的該第二提示信息。
  11. 一種語音活動檢測方法,適用於一語音活動檢測裝置,其中該語音活動檢測裝置包括一收音模組、一處理模組及一提示模組,該語音活動檢測方法包括:通過該收音模組接收一語音信息; 通過該處理模組獲取該語音信息的一音量值;通過該處理模組判斷該音量值是否介於一第一音量臨界值與一第二音量臨界值之間;當判斷該音量值介於該第一音量臨界值與該第二音量臨界值之間時,通過該提示模組產生符合音量值標準的一第一提示信息;以及當判斷該音量值不介於該第一音量臨界值與該第二音量臨界值之間時,通過該處理模組調整該音量值至一音量預設值。
  12. 如請求項11所述之語音活動檢測方法,其中該第一音量臨界值大於該第二音量臨界值,該音量預設值介於該第一音量臨界值與該第二音量臨界值之間。
  13. 如請求項11所述之語音活動檢測方法,其中該第一音量臨界值係90dB,該第二音量臨界值係介於50~60dB,該音量預設值係介於60~70dB。
  14. 一種語音活動檢測裝置,包括:一收音模組;一處理模組,耦接該收音模組;以及一提示模組,耦接該處理模組;其中該處理模組用以執行一語音活動檢測方法,該方法包括:通過該收音模組接收一語音信息;通過該處理模組獲取該語音信息的一音量值;通過該處理模組判斷該音量值是否介於一第一音量臨界值與一第二音量臨界值之間; 當判斷該音量值介於該第一音量臨界值與該第二音量臨界值之間時,通過該提示模組產生符合音量值標準的一第一提示信息;以及當判斷該音量值不介於該第一音量臨界值與該第二音量臨界值之間時,通過該處理模組調整該音量值至一音量預設值。
  15. 如請求項14所述之語音活動檢測裝置,其中該第一音量臨界值大於該第二音量臨界值,該音量預設值介於該第一音量臨界值與該第二音量臨界值之間。
  16. 如請求項15所述之語音活動檢測裝置,其中該第一音量臨界值係90dB,該第二音量臨界值係介於50~60dB,該音量預設值係60~70dB。
  17. 一種語音活動檢測方法,適用於一語音活動檢測裝置,其中該語音活動檢測裝置包括一收音模組、一處理模組及一提示模組,該語音活動檢測方法包括:通過該收音模組接收一語音信息;通過該處理模組獲取該語音信息的一音量值;通過該處理模組判斷該音量值是否小於或等於一第一音量臨界值;當判斷該音量值小於或等於該第一音量臨界值時,通過該提示模組產生該音量值提高的一第一提示信息;當判斷該音量值大於該第一音量臨界值時,通過該處理模組判斷該音量值是否小於或等於一第二音量臨界值;當判斷該音量值小於或等於該第二音量臨界值時,通過該處理模組調整該音量值至一音量預設值; 當判斷該音量值大於該第二音量臨界值時,通過該處理模組判斷該音量值是否小於或等於一第三音量臨界值;當判斷該音量值小於或等於該第三音量臨界值時,通過該提示模組產生符合音量值標準的一第一提示信息;以及當判斷該音量值大於該第三音量臨界值時,通過該處理模組調整該音量值至該音量預設值。
  18. 如請求項17所述之語音活動檢測方法,其中該第三音量臨界值大於該第二音量臨界值,該第二音量臨界值大於該第一音量臨界值,該音量預設值係介於該第三音量臨界值與該第二音量臨界值之間。
  19. 如請求項17所述之語音活動檢測方法,其中該第一音量臨界值係90dB,該第二音量臨界值係介於50~60dB,該第三音量臨界值係介於40~50dB,該音量預設值係介於60~70dB。
  20. 一種語音活動檢測裝置,包括:一收音模組;一處理模組,耦接該收音模組;以及一提示模組,耦接該處理模組;其中該處理模組用以執行一語音活動檢測方法,該方法包括:通過該收音模組接收一語音信息;通過該處理模組獲取該語音信息的一音量值;通過該處理模組判斷該音量值是否小於或等於一第一音量臨界值;當判斷該音量值小於或等於該第一音量臨界值時,通過該提示模組產生該音量值提高的一第一提示信息; 當判斷該音量值大於該第一音量臨界值時,通過該處理模組判斷該音量值是否小於或等於一第二音量臨界值;當判斷該音量值小於或等於該第二音量臨界值時,通過該處理模組調整該音量值至一音量預設值;當判斷該音量值大於該第二音量臨界值時,通過該處理模組判斷該音量值是否小於或等於一第三音量臨界值;當判斷該音量值小於或等於該第三音量臨界值時,通過該提示模組產生符合音量值標準的一第一提示信息;以及當判斷該音量值大於該第三音量臨界值時,通過該處理模組調整該音量值至該音量預設值。
  21. 如請求項20所述之語音活動檢測裝置,其中該第三音量臨界值大於該第二音量臨界值,該第二音量臨界值大於該第一音量臨界值,該音量預設值係介於該第三音量臨界值與該第二音量臨界值之間。
  22. 如請求項20所述之語音活動檢測裝置,其中該第一音量臨界值係90dB,該第二音量臨界值係介於50~60dB,該第三音量臨界值係介於40~50dB,該音量預設值係介於60~70dB。
TW112114808A 2022-11-07 2023-04-20 語音活動檢測裝置及方法 TWI852489B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US202263423453P 2022-11-07 2022-11-07
US63/423,453 2022-11-07
US202363449272P 2023-03-01 2023-03-01
US63/449,272 2023-03-01

Publications (2)

Publication Number Publication Date
TW202420296A TW202420296A (zh) 2024-05-16
TWI852489B true TWI852489B (zh) 2024-08-11

Family

ID=86604778

Family Applications (5)

Application Number Title Priority Date Filing Date
TW112114808A TWI852489B (zh) 2022-11-07 2023-04-20 語音活動檢測裝置及方法
TW112121192A TWI832774B (zh) 2022-11-07 2023-06-07 隨身攝影機及其操作方法
TW112121198A TWI882349B (zh) 2022-11-07 2023-06-07 具有運作指示模式切換結構的裝置、運作指示模式切換電路與其運作方法
TW112129654A TWI841470B (zh) 2022-11-07 2023-08-08 連續記錄數位內容的記憶體管理方法與電路系統
TW112142737A TWI906690B (zh) 2022-11-07 2023-11-07 可攜式電子裝置及其使用者介面操作方法

Family Applications After (4)

Application Number Title Priority Date Filing Date
TW112121192A TWI832774B (zh) 2022-11-07 2023-06-07 隨身攝影機及其操作方法
TW112121198A TWI882349B (zh) 2022-11-07 2023-06-07 具有運作指示模式切換結構的裝置、運作指示模式切換電路與其運作方法
TW112129654A TWI841470B (zh) 2022-11-07 2023-08-08 連續記錄數位內容的記憶體管理方法與電路系統
TW112142737A TWI906690B (zh) 2022-11-07 2023-11-07 可攜式電子裝置及其使用者介面操作方法

Country Status (3)

Country Link
US (5) US12393334B2 (zh)
EP (4) EP4365892A1 (zh)
TW (5) TWI852489B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI852489B (zh) * 2022-11-07 2024-08-11 神基科技股份有限公司 語音活動檢測裝置及方法
US20250251902A1 (en) * 2024-02-07 2025-08-07 SuperScope Technologies Inc. Record Check
JP7665249B1 (ja) * 2024-10-25 2025-04-21 Matsuo Sangyoグループ株式会社 カメラシステム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201414274A (zh) * 2012-09-21 2014-04-01 Hon Hai Prec Ind Co Ltd 音效處理系統及方法
CN108320742A (zh) * 2018-01-31 2018-07-24 广东美的制冷设备有限公司 语音交互方法、智能设备及存储介质
CN108630202A (zh) * 2017-03-21 2018-10-09 株式会社东芝 语音识别装置、语音识别方法以及语音识别程序
US20220021978A1 (en) * 2020-07-20 2022-01-20 Apple Inc. Multi-device audio adjustment coordination

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0675588A (ja) 1992-08-27 1994-03-18 Fujitsu Ltd 音声認識装置
US5418762A (en) * 1992-12-09 1995-05-23 Sony Corporation Optical disk recording device having a pre-recording mode
US6519003B1 (en) 1998-03-26 2003-02-11 Eastman Kodak Company Camera with combination four-way directional and mode control interface
US6825875B1 (en) * 1999-01-05 2004-11-30 Interval Research Corporation Hybrid recording unit including portable video recorder and auxillary device
US7155735B1 (en) 1999-10-08 2006-12-26 Vulcan Patents Llc System and method for the broadcast dissemination of time-ordered data
JP4101421B2 (ja) 1999-12-27 2008-06-18 富士フイルム株式会社 入力ユニット、入力ユニットを利用可能な情報記録装置およびデジタルカメラ
JP4620894B2 (ja) * 2001-04-06 2011-01-26 キヤノン株式会社 電子機器
US6957397B1 (en) * 2001-06-11 2005-10-18 Palm, Inc. Navigating through a menu of a handheld computer using a keyboard
TWI225369B (en) * 2003-03-18 2004-12-11 Jin-Shu Chen Diversified video recording apparatus
US20040212637A1 (en) 2003-04-22 2004-10-28 Kivin Varghese System and Method for Marking and Tagging Wireless Audio and Video Recordings
US7023004B2 (en) 2003-10-23 2006-04-04 Timothy Ford Multi-mode electromagnetic radiation emitting device
US20050147397A1 (en) * 2003-12-17 2005-07-07 Sony Corporation Image pickup apparatus
KR20050090798A (ko) 2004-03-10 2005-09-14 삼성전자주식회사 촬영장치의 모드선택 스위치
JP4379800B2 (ja) * 2004-07-12 2009-12-09 ソニー・エリクソン・モバイルコミュニケーションズ株式会社 受信装置およびそのメモリ解放方法
JP2006040382A (ja) * 2004-07-27 2006-02-09 Sony Corp デジタルデータの記録装置および記録方法
TWI245191B (en) * 2004-09-14 2005-12-11 Ali Corp Sound receiving and pre-recording device and method
US20060085834A1 (en) * 2004-10-19 2006-04-20 Cayin Technology Co., Ltd. System and method for transmitting multi-channel signals
WO2008085206A2 (en) * 2006-12-29 2008-07-17 Prodea Systems, Inc. Subscription management of applications and services provided through user premises gateway devices
US8140325B2 (en) * 2007-01-04 2012-03-20 International Business Machines Corporation Systems and methods for intelligent control of microphones for speech recognition applications
US8209728B2 (en) 2007-08-31 2012-06-26 At&T Intellectual Property I, L.P. System and method of delivering video content
JP5075664B2 (ja) * 2008-02-15 2012-11-21 株式会社東芝 音声対話装置及び支援方法
US8872940B2 (en) * 2008-03-03 2014-10-28 Videoiq, Inc. Content aware storage of video data
US10354689B2 (en) 2008-04-06 2019-07-16 Taser International, Inc. Systems and methods for event recorder logging
TWI402718B (zh) * 2008-07-01 2013-07-21 Inventec Corp 電子裝置及其操控方法
US10737185B2 (en) * 2009-03-18 2020-08-11 Microsoft Technology Licensing, Llc Virtual environment controls based on voice chat audio inputs
CN117294934B (zh) 2010-09-13 2025-03-14 康道尔知识产权控股有限责任公司 配置用于远程图像采集控制和观看的便携式数字视频摄像机
JP6088733B2 (ja) 2011-11-29 2017-03-01 オリンパス株式会社 撮像装置
JP5189221B1 (ja) * 2012-03-13 2013-04-24 シャープ株式会社 コンテンツ表示装置、テレビジョン受像機、メニュー画面生成方法、プログラム、及び、記録媒体
WO2014052898A1 (en) * 2012-09-28 2014-04-03 Digital Ally, Inc. Portable video and imaging system
US20140104493A1 (en) * 2012-10-11 2014-04-17 Tangome, Inc. Proactive video frame dropping for hardware and network variance
WO2014065127A1 (ja) * 2012-10-22 2014-05-01 ソニー株式会社 情報処理端末、撮像機、情報処理方法、プログラム、および遠隔撮像システム
US9329833B2 (en) * 2013-12-20 2016-05-03 Dell Products, L.P. Visual audio quality cues and context awareness in a virtual collaboration session
TWI516950B (zh) 2013-12-23 2016-01-11 勝捷光電股份有限公司 即時記錄分享系統及方法
KR102164798B1 (ko) 2014-09-11 2020-10-13 삼성전자 주식회사 디스플레이 구동 회로 및 이를 포함하는 디스플레이 장치
WO2016088919A1 (ko) * 2014-12-04 2016-06-09 (주) 트라이너스 무선 마이크로폰 시스템
US9661283B2 (en) 2014-12-24 2017-05-23 Panasonic Intellectual Property Management Co., Ltd. Wearable camera
US20160196693A1 (en) 2015-01-06 2016-07-07 Seiko Epson Corporation Display system, control method for display device, and computer program
CA2913568C (en) 2015-01-29 2024-01-02 Panasonic Intellectual Property Management Co., Ltd. Wearable camera system, and video recording control method for wearable camera system
US20160286156A1 (en) 2015-02-12 2016-09-29 Creative Law Enforcement Resources, Inc. System for managing information related to recordings from video/audio recording devices
TWI550612B (zh) * 2015-03-23 2016-09-21 群聯電子股份有限公司 資料程式化方法、記憶體儲存裝置及記憶體控制電路單元
CN105045473A (zh) * 2015-07-01 2015-11-11 沈波 一种人机交互系统及方法
CN105120063A (zh) 2015-07-13 2015-12-02 联想(北京)有限公司 一种输入语音的音量提示方法及电子设备
US20170094231A1 (en) * 2015-09-29 2017-03-30 Faraday&Future Inc. Scene reconstruction using pre-buffering in sensor triggered automobile cameras
US9697884B2 (en) * 2015-10-08 2017-07-04 Rambus Inc. Variable width memory module supporting enhanced error detection and correction
US10812894B2 (en) 2016-12-23 2020-10-20 Motorola Solutions, Inc. Portable communication device and method of operating the same in covert operation mode
JP6894736B2 (ja) * 2017-03-24 2021-06-30 キヤノン株式会社 記録装置、制御方法、及びプログラム
CN107291341B (zh) * 2017-07-11 2021-03-09 广州飞傲电子科技有限公司 音乐播放器通过触摸转盘旋转进行选择的方法及系统
CN109548080B (zh) * 2017-08-11 2023-05-16 夏普株式会社 用于媒体接入控制层组包的相关方法、用户设备和基站
US20190266881A1 (en) 2018-02-25 2019-08-29 Laura Gasparis Vonfrolio System and method for an alert and crisis/emergency management system
CN108668017A (zh) 2018-04-19 2018-10-16 Oppo广东移动通信有限公司 音量提示方法、模式切换方法、装置、终端及存储介质
CN110750491A (zh) 2018-07-06 2020-02-04 神讯电脑(昆山)有限公司 信息撷取装置的设定方法
CN110858493A (zh) 2018-08-23 2020-03-03 神讯电脑(昆山)有限公司 资讯撷取装置
CN110881076A (zh) * 2018-09-06 2020-03-13 上海伴我科技有限公司 终端通信装置
TW202113561A (zh) * 2019-09-20 2021-04-01 和碩聯合科技股份有限公司 筆記型電腦及其操作方法
JP2022022152A (ja) * 2020-07-24 2022-02-03 シンクウェア コーポレーション 不揮発性メモリ記憶装置の寿命および故障を判断するための電子装置およびその方法
TW202205143A (zh) 2020-07-30 2022-02-01 杰悉科技股份有限公司 影像物件標籤方法
US11489996B2 (en) * 2021-03-31 2022-11-01 Johnny Burton Wireless earpiece camera apparatus
US11950017B2 (en) * 2022-05-17 2024-04-02 Digital Ally, Inc. Redundant mobile video recording
TWI852489B (zh) * 2022-11-07 2024-08-11 神基科技股份有限公司 語音活動檢測裝置及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201414274A (zh) * 2012-09-21 2014-04-01 Hon Hai Prec Ind Co Ltd 音效處理系統及方法
CN108630202A (zh) * 2017-03-21 2018-10-09 株式会社东芝 语音识别装置、语音识别方法以及语音识别程序
CN108320742A (zh) * 2018-01-31 2018-07-24 广东美的制冷设备有限公司 语音交互方法、智能设备及存储介质
US20220021978A1 (en) * 2020-07-20 2022-01-20 Apple Inc. Multi-device audio adjustment coordination

Also Published As

Publication number Publication date
US20240155082A1 (en) 2024-05-09
TW202420042A (zh) 2024-05-16
TWI841470B (zh) 2024-05-01
TW202420038A (zh) 2024-05-16
TWI832774B (zh) 2024-02-11
EP4365892A1 (en) 2024-05-08
US12554396B2 (en) 2026-02-17
US20240153719A1 (en) 2024-05-09
EP4365705A1 (en) 2024-05-08
EP4365893A1 (en) 2024-05-08
EP4365899A1 (en) 2024-05-08
TW202420219A (zh) 2024-05-16
TW202420296A (zh) 2024-05-16
US20240153530A1 (en) 2024-05-09
TW202420801A (zh) 2024-05-16
TWI906690B (zh) 2025-12-01
US12360668B2 (en) 2025-07-15
TWI882349B (zh) 2025-05-01
US20250328241A1 (en) 2025-10-23
US12353710B2 (en) 2025-07-08
US12393334B2 (en) 2025-08-19
US20240152273A1 (en) 2024-05-09

Similar Documents

Publication Publication Date Title
TWI852489B (zh) 語音活動檢測裝置及方法
US8165321B2 (en) Intelligent clip mixing
CN114868403B (zh) 多频带限制器模式和噪声补偿方法
US9525392B2 (en) System and method for dynamically adapting playback device volume on an electronic device
CN114902560B (zh) 具有环境噪音补偿的用于自动音量控制的设备和方法
US11627421B1 (en) Method for realizing hearing aid function based on bluetooth headset chip and a bluetooth headset
CN1369188A (zh) 用于声复制的补偿系统和方法
CN103236263A (zh) 一种改善通话质量的方法、系统及移动终端
WO2018018705A1 (zh) 一种语音通话的方法、装置及终端
CN110347366B (zh) 音量调节方法、终端设备、存储介质及电子设备
CN114664322B (zh) 基于蓝牙耳机芯片的单麦克风助听降噪方法及蓝牙耳机
CN107168677A (zh) 音频处理方法及装置、电子设备、存储介质
CN105764008B (zh) 一种调试扩声系统传输频率特性的方法及装置
CN111552452A (zh) 匹配音频输出参数的方法、设备及存储介质
WO2019033940A1 (zh) 音量调节方法、装置、终端设备及存储介质
WO2023070792A1 (zh) 通话式门铃的音量均衡方法、设备和可读存储介质
TW202226230A (zh) 將麥克風信號靜音和取消靜音之方法
CN113360129A (zh) 声音播放方法、装置、电子设备及可读存储介质
CN117998253A (zh) 语音活动检测装置及方法
CN118921521B (zh) 音频信号处理方法、装置、电子设备及存储介质
CN102446510A (zh) 自动增益控制系统及方法
CN116132869A (zh) 耳机音量的调节方法、耳机及存储介质
CN112700785B (zh) 语音信号处理方法、装置及相关设备
CN110072174B (zh) 音量自适应播放机
CN101686039A (zh) 用于多媒体装置的音频处理装置以及音频处理方法