JPH09185487A - 音声認識方式 - Google Patents
音声認識方式Info
- Publication number
- JPH09185487A JPH09185487A JP7354361A JP35436195A JPH09185487A JP H09185487 A JPH09185487 A JP H09185487A JP 7354361 A JP7354361 A JP 7354361A JP 35436195 A JP35436195 A JP 35436195A JP H09185487 A JPH09185487 A JP H09185487A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- file
- software
- character code
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 7
- 238000007796 conventional method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
Abstract
(57)【要約】
【課題】 人間の会話を音声認識を利用して自動的に文
章化することができる音声認識方式を提供することであ
る。 【解決手段】 人間の会話をコンピュータシステムに取
り込み、波形解析により言葉を解析し、音声を文字コー
ドとしてファイルに出力することにより、人手を介さず
リアルタイムに人間の会話を文章化する。
章化することができる音声認識方式を提供することであ
る。 【解決手段】 人間の会話をコンピュータシステムに取
り込み、波形解析により言葉を解析し、音声を文字コー
ドとしてファイルに出力することにより、人手を介さず
リアルタイムに人間の会話を文章化する。
Description
【0001】
【発明の属する技術分野】本発明は、音声認識方式に関
し、特に認識結果の文章化に関する。
し、特に認識結果の文章化に関する。
【0002】
【従来の技術】従来の技術では、会議録等、人間の会話
を文章として記録する場合、速記の能力を持った者が人
手により記録を行っていた。さらに、速記により作成さ
れた文章を活字にするため、再度タイプし直す作業が必
要であった。
を文章として記録する場合、速記の能力を持った者が人
手により記録を行っていた。さらに、速記により作成さ
れた文章を活字にするため、再度タイプし直す作業が必
要であった。
【0003】
【発明が解決しようとする課題】しかしながら従来の技
術において、速記やタイプといった特殊な能力を持った
人材が必要なため、人材の確保及び人手を介することに
よる経費がかかることである。
術において、速記やタイプといった特殊な能力を持った
人材が必要なため、人材の確保及び人手を介することに
よる経費がかかることである。
【0004】その理由は、音声認識の技術が進んでいて
も、それを応用する手段が考えられていないからであ
る。
も、それを応用する手段が考えられていないからであ
る。
【0005】本発明の課題は人間の会話を音声認識を利
用して、自動的に文章化することができる音声認識方式
を提供することである。
用して、自動的に文章化することができる音声認識方式
を提供することである。
【0006】
【課題を解決するための手段】本発明によれば、人間の
会話をコンピュータシステムに取り込み、波形解析によ
り言葉を解析し、音声を文字コードとしてファイルに出
力することにより、人手を介さずリアルタイムに人間の
会話を文章化することを特徴とする音声認識方式が得ら
れる。
会話をコンピュータシステムに取り込み、波形解析によ
り言葉を解析し、音声を文字コードとしてファイルに出
力することにより、人手を介さずリアルタイムに人間の
会話を文章化することを特徴とする音声認識方式が得ら
れる。
【0007】さらに、本発明によれば、前記コンピュー
タシステムは人間の会話の音声を検出し、デジタル波形
を発生させる音声検出部を備えており、前記コンピュー
タシステム上で稼働するソフトウエアを有し、該ソフト
ウエアが、前記デジタル波形を解析して言葉に変換する
音声認識ソフトウエアと、該音声認識ソフトウエアで認
識された音声データを文字コードとしてファイルに出力
するデータ出力ソフトウエアから構成されていることを
特徴とする音声認識方式が得られる。
タシステムは人間の会話の音声を検出し、デジタル波形
を発生させる音声検出部を備えており、前記コンピュー
タシステム上で稼働するソフトウエアを有し、該ソフト
ウエアが、前記デジタル波形を解析して言葉に変換する
音声認識ソフトウエアと、該音声認識ソフトウエアで認
識された音声データを文字コードとしてファイルに出力
するデータ出力ソフトウエアから構成されていることを
特徴とする音声認識方式が得られる。
【0008】さらに、本発明によれば、前記ファイルの
オープンを行って音声の検出を待ち、前記音声検出部に
て音声を検出した時、前記音声認識ソフトウエアを稼働
させて音声の解析を行って該音声に対応した文字コード
を決定し、この決定した文字コードを前記データ出力ソ
フトウエアにて前記ファイルへ出力し、次の音声を待
ち、音声が検出されると再び上記手順を実行し、音声が
ない場合は前記ファイルのクローズを行うことを特徴と
する音声認識方式が得られる。
オープンを行って音声の検出を待ち、前記音声検出部に
て音声を検出した時、前記音声認識ソフトウエアを稼働
させて音声の解析を行って該音声に対応した文字コード
を決定し、この決定した文字コードを前記データ出力ソ
フトウエアにて前記ファイルへ出力し、次の音声を待
ち、音声が検出されると再び上記手順を実行し、音声が
ない場合は前記ファイルのクローズを行うことを特徴と
する音声認識方式が得られる。
【0009】
【作用】音声認識した結果は文字コードのファイルとし
て出力される。文字コードのファイルは、エディタ、ワ
ープロ等から容易に見ることができ、編集や再利用など
が自由にできる。
て出力される。文字コードのファイルは、エディタ、ワ
ープロ等から容易に見ることができ、編集や再利用など
が自由にできる。
【0010】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して詳細に説明する。
て図面を参照して詳細に説明する。
【0011】図1に示すように、本発明に係る音声認識
方式はコンピュータシステム及びその上で稼働するソフ
トウエアを有する構成となっている。
方式はコンピュータシステム及びその上で稼働するソフ
トウエアを有する構成となっている。
【0012】前記コンピュータシステムは、音声を検出
しデジタル波形を発生させる音声検出部11を有してお
り、前記ソフトウエアは、波形を解析して言葉に変換す
る音声認識ソフトウエア12と、認識した音声データを
文字コードとしてファイルに出力するデータ出力ソフト
ウエア13を有している。
しデジタル波形を発生させる音声検出部11を有してお
り、前記ソフトウエアは、波形を解析して言葉に変換す
る音声認識ソフトウエア12と、認識した音声データを
文字コードとしてファイルに出力するデータ出力ソフト
ウエア13を有している。
【0013】次に、本発明の実施の形態の動作について
図2を参照して説明する。本発明の音声認識方式では、
まずファイルのオープンを行い(ステップS21)、音
声の検出(ステップS22)を待つ。音声検出部11に
て音声を検出すると、音声認識ソフトウエア12を稼働
させて音声の解析(ステップS23)を行い、文字コー
ドを決定する(ステップS24)。決定した文字コード
はデータ出力ソフトウエア13によってファイルへ出力
(ステップS25)され、次の音声を待つ(ステップS
26)。これ以上音声がない場合、ファイルのクローズ
(ステップS27)を行う。
図2を参照して説明する。本発明の音声認識方式では、
まずファイルのオープンを行い(ステップS21)、音
声の検出(ステップS22)を待つ。音声検出部11に
て音声を検出すると、音声認識ソフトウエア12を稼働
させて音声の解析(ステップS23)を行い、文字コー
ドを決定する(ステップS24)。決定した文字コード
はデータ出力ソフトウエア13によってファイルへ出力
(ステップS25)され、次の音声を待つ(ステップS
26)。これ以上音声がない場合、ファイルのクローズ
(ステップS27)を行う。
【0014】
【発明の効果】本発明によれば、音声を文字コードでフ
ァイル出力することである。これにより、会議議事録の
自動作成等ができるようになる。
ァイル出力することである。これにより、会議議事録の
自動作成等ができるようになる。
【0015】その理由は、文字コードで出力されたファ
イルは、各種のワープロ、エディタで編集、加工ができ
るからである。
イルは、各種のワープロ、エディタで編集、加工ができ
るからである。
【図1】本発明の一実施の形態を示した構成図である。
【図2】本発明の一実施の形態の動作を示すフローチャ
ートである。
ートである。
11 音声検出部 12 音声認識ソフトウエア 13 データ出力ソフトウエア
Claims (3)
- 【請求項1】 人間の会話をコンピュータシステムに取
り込み、波形解析により言葉を解析し、音声を文字コー
ドとしてファイルに出力することにより、人手を介さず
リアルタイムに人間の会話を文章化することを特徴とす
る音声認識方式。 - 【請求項2】 前記コンピュータシステムは人間の会話
の音声を検出し、デジタル波形を発生させる音声検出部
を備えており、前記コンピュータシステム上で稼働する
ソフトウエアを有し、該ソフトウエアが、前記デジタル
波形を解析して言葉に変換する音声認識ソフトウエア
と、該音声認識ソフトウエアで認識された音声データを
文字コードとしてファイルに出力するデータ出力ソフト
ウエアから構成されていることを特徴とする請求項1記
載の音声認識方式。 - 【請求項3】 前記ファイルのオープンを行って音声の
検出を待ち、前記音声検出部にて音声を検出した時、前
記音声認識ソフトウエアを稼働させて音声の解析を行っ
て該音声に対応した文字コードを決定し、この決定した
文字コードを前記データ出力ソフトウエアにて前記ファ
イルへ出力し、次の音声を待ち、音声が検出されると再
び上記手順を実行し、音声がない場合は前記ファイルの
クローズを行うことを特徴とする請求項2記載の音声認
識方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7354361A JPH09185487A (ja) | 1995-12-29 | 1995-12-29 | 音声認識方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP7354361A JPH09185487A (ja) | 1995-12-29 | 1995-12-29 | 音声認識方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH09185487A true JPH09185487A (ja) | 1997-07-15 |
Family
ID=18437043
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP7354361A Pending JPH09185487A (ja) | 1995-12-29 | 1995-12-29 | 音声認識方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH09185487A (ja) |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03224055A (ja) * | 1990-01-30 | 1991-10-03 | Hitachi Ltd | 同時通訳向き音声認識システムおよびその音声認識方法 |
-
1995
- 1995-12-29 JP JP7354361A patent/JPH09185487A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03224055A (ja) * | 1990-01-30 | 1991-10-03 | Hitachi Ltd | 同時通訳向き音声認識システムおよびその音声認識方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6175820B1 (en) | Capture and application of sender voice dynamics to enhance communication in a speech-to-text environment | |
| CN110047481B (zh) | 用于语音识别的方法和装置 | |
| KR20170103925A (ko) | 일종의 로봇 시스템의 음성 식별 시스템 및 식별 방법 | |
| JPWO2019106517A5 (ja) | ||
| US20220238118A1 (en) | Apparatus for processing an audio signal for the generation of a multimedia file with speech transcription | |
| CN109543021B (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
| CN109460548B (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
| CN117577095A (zh) | 一种基于ai的智能语音识别系统及方法 | |
| CN109065019B (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
| JP2009288567A (ja) | 議事録作成装置、議事録作成方法、議事録作成プログラム、議事録作成システム | |
| JPH09185487A (ja) | 音声認識方式 | |
| CN109241331B (zh) | 一种面向智能机器人的故事数据处理方法 | |
| CN114937457B (zh) | 一种音频信息处理方法、装置和电子设备 | |
| CN118351835A (zh) | 一种显示设备及语音识别方法 | |
| JPH10133678A (ja) | 音声再生装置 | |
| KR102274275B1 (ko) | 음성파일이 연동된 텍스트 링크 생성 어플리케이션 및 방법 | |
| Fanfeng | Application research of voice control in reading assistive device for visually impaired persons | |
| CN85100180A (zh) | 一种计算机对汉语语音的识别方法 | |
| Sharma et al. | EchoText: Integrating whisper and YAMNet models for comprehensive audio analysis and subtitle generation | |
| US20080249776A1 (en) | Methods and Arrangements for Enhancing Machine Processable Text Information | |
| Gan et al. | An Improved Multi-Speaker Tibetan Speaker Diarization Based on EDA-EEND | |
| WO2026013766A1 (ja) | 音声認識処理装置、音声認識処理方法、及び記録媒体 | |
| Aman et al. | CirdoX: an on/off-line multisource speech and sound analysis software | |
| Bigi | SPPAS-the automatic annotation and analysis of speech (version 4.7) | |
| Yashaswini et al. | Real-Time Audio Summarization and Language Detection System |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 19971007 |