JP2003255982A

JP2003255982A - 音声認識システムおよび音声ファイル記録システム

Info

Publication number: JP2003255982A
Application number: JP2002054368A
Authority: JP
Inventors: Naoji Matsuo; 直司松尾
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2002-02-28
Filing date: 2002-02-28
Publication date: 2003-09-10
Anticipated expiration: 2022-02-28
Also published as: JP4017887B2; US20030163308A1; US7979278B2

Abstract

(57)【要約】【課題】入力データを音声ファイルとして記録し、内
容を端的に把握できるファイル名を自動付与する音声認
識及び音声ファイル記録システムを提供する。【解決手段】あらかじめ、利用者用語情報抽出部２０
により、利用者が音声記録用途以外の用途を持つアプリ
ケーション１０に対して入力した情報から利用者用語情
報を抽出し、音声認識辞書管理部３０が利用者用語情報
を基に音声認識辞書３１の語彙を追加しておく。次に、
利用者は音声入力部４０を介して音声を入力し、音声認
識部５０は音声認識辞書３１を用いて音声認識を実行す
る。代表利用者用語情報選択部６０により、音声認識結
果に含まれる利用者用語情報を抽出し、当該利用者用語
情報の中から一又は複数の代表利用者用語情報を選択す
る。音声ファイル記録部７０は音声データを音声ファイ
ルとして記録し、ファイル名を代表利用者用語情報に基
づいて付与する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力された音声デ
ータを認識する音声認識システムと当該音声データを音
声ファイルとして記録する音声ファイル記録システム及
び方法に関するものである。特に、ＰＤＡ（Personal d
ata assistance）などに用いられる携帯端末や電話シス
テムなどにおける、音声メモ記録アプリケーションや音
声電子メールアプリケーションなど、音声ファイルの記
録処理を伴うアプリケーションに適用される。

【０００２】

【従来の技術】ＰＤＡなどに用いられる携帯端末は、持
ち運びするために小型化されており、入力デバイスとし
てはペンや小型キーボードなどが装備されていることが
多い。

【０００３】ペンを用いたいわゆるペン入力の場合、電
子パッドにペンのペン先を接触させ、電子パッド内に入
力したいテキスト文字を書いたり、ペン入力用に決めら
れた特別の記号を書いたり、クロスなど特別なジェスチ
ャをペン先で描いたりすることにより情報を入力する。

【０００４】電子パッドに入力したいテキスト文字その
ものを書く場合、文字入力処理、文字認識処理に時間を
要し、利用者が外出先や打ち合わせの席上などにおい
て、簡単にメモ情報を記録する際に不便を感じることが
多い。

【０００５】電子パッドにペン入力用に決められた特別
の記号を書いたり、クロスなど特別なジェスチャをペン
先で描いたりする場合、利用者はこれら特別の記号やジ
ェスチャを覚える必要があり、利用者が負担を感じるこ
とが多い。

【０００６】そこで、ＰＤＡなどの携帯端末において、
音声入力が注目されている。

【０００７】音声入力が可能であれば、利用者は装備さ
れたマイクロフォンを介して、メモしたい内容を音声で
入力するのみで良く、音声を発することが許される状況
であれば、簡単にメモ情報を音声入力により記録するこ
とができる。

【０００８】図１２は、音声入力された音声メモ情報を
音声ファイルとして記録する従来の音声メモ情報記録シ
ステムを説明する図である。

【０００９】５１０はマイクロフォン、５２０は音声フ
ァイル記録部、５３０は音声ファイル名入力部、５４０
は音声ファイル再生部である。

【００１０】利用者はマイクロフォン５１０を介して音
声を入力する。音声はマイクロフォン５１０により音声
データに変換される。音声データは音声ファイルとして
音声ファイル記録部５２０に記録される。その際、音声
ファイルに対してファイル名を付与する必要がある。利
用者は自ら音声ファイル名入力部５３０を介して音声フ
ァイルに対するファイル名を入力する。この音声ファイ
ル名入力部５３０は、ＰＤＡが備えるペンによるペン入
力インタフェースにより提供されることが想定される。

【００１１】なお、利用者は自らによるファイル名の入
力に代え、音声ファイル名入力部５３０が自動的に通し
番号をファイル名として付けることは可能である。例え
ば、記録される順番に“ｖｏｉｃｅ.１”、“ｖｏｉｃ
ｅ.２”と付与することになる。

【００１２】また、従来のＰＤＡにおいて、音声入力を
受け付け、入力された音声データを音声ファイルとして
記録するのではなく、続いて音声認識処理を行ない、テ
キストファイルとして記録する音声メモ情報記録システ
ムが知られている。

【００１３】図１３は、従来技術における音声認識処理
を伴う音声メモ情報記録システムを説明する図である。

【００１４】６１０はマイクロフォン、６２０は音響解
析部、６３０は音響モデル、６４０は音声認識辞書、６
５０は照合認識部である。

【００１５】利用者はマイクロフォン６１０を介して音
声を入力する。音声はマイクロフォン６１０により音声
データに変換される。音響解析部６２０により音声デー
タに対する音響解析が行なわれ、音声データは音素単位
に分割され、各音素単位で特徴量が抽出される。音響モ
デル６３０はモデルとなる各音素単位の特徴量を照合す
る際のデータ形式で格納している。例えば、ＨＭＭ（Hi
dden Markov Model）を用いた確率モデルが使われてい
る。

【００１６】照合認識部６５０は、音響解析部６２０か
ら入力される音声データの音素単位の特徴量と、音響モ
デル６３０に格納されている各音素単位の特徴量デー
タ、例えば、各音素単位の特徴量の確率モデルとを比較
照合し、入力された音声データの音素単位を認識する。
その際、照合認識部６５０は、さらに音声認識辞書６４
０を参照し、認識した音素単位からなる情報が単語等、
登録されている語として認識され得るものかを確認し、
当該認識された単語を音声認識結果として出力する。

【００１７】ここで、音声認識処理の性能を大きく左右
するものは、辞書格納部６３０が格納する辞書の語彙で
ある。利用者が入力した単語が辞書の語彙として含まれ
ている場合にのみ、音声認識を行なうことができる。辞
書の語彙数が増えれば音声認識処理を行なうことができ
る単語等の数が増えることとなるが、ＰＤＡのような小
型携帯端末では辞書容量も制限され、さらに、語彙数が
増えれば照合処理に要する時間がかかるので、辞書の語
彙数は制限されている。

【００１８】そこで、制限された語彙数で、利用者が入
力する単語を効率良くカバーするため、辞書の語彙を利
用者向けにカスタマイズしたユーザ辞書を用いることが
広く行なわれている。

【００１９】

【発明が解決しようとする課題】上記従来の音声メモ情
報記録システムには以下の問題点がある。

【００２０】まず、音声ファイル名を利用者自らのテキ
ストデータの入力により与える場合には、音声ファイル
名の利用者による付与が不便であるという問題点があ
る。

【００２１】メモ情報自体を音声により簡単に入力して
も、そのファイル名をペン入力やキーボードを用いた入
力で行なうこととなれば、上記したように利用者にとっ
て不便であり、利用者が負担を感じるという問題が生じ
る。

【００２２】ファイル名はかならずテキストデータで与
えなければならないので、ファイル名の付与を音声入力
により行なう場合は、音声認識処理を行なう構成部分が
必要となってしまう。

【００２３】また、上記したように、音声ファイルのフ
ァイル名を自動的に通し番号により与える場合には、利
用者自身がファイル名を入力するという負担は生じない
が、多数の音声メモ情報を記録する場合、通し番号だけ
では記録した音声ファイルの内容が分かりにくいため、
音声メモ情報を参照する時点において、目的とする音声
メモ情報がどの音声ファイルとして記録されているかを
判別するのが困難であるという問題が生じる。

【００２４】次に、音声入力された音声メモ情報を音声
認識し、音声メモ情報をテキストファイルとして記録す
る音声メモ情報記録システムの場合、ユーザ辞書作成の
利用者負担が大きいという問題がある。

【００２５】従来技術の欄でも述べたように、音声認識
の認識率を向上させるためには、少ない辞書容量で利用
者による入力が想定される単語等を効率良くカバーする
語彙を備えたユーザ辞書を用意する必要があるが、当該
ユーザ辞書はユーザ自身が作成する必要があり、当該ユ
ーザ辞書作成の利用者負担が生じる。当該ユーザ辞書の
作成をペン入力やキーボードを用いた入力で行なうこと
となれば、利用者にとっての負担はさらに大きくなる。

【００２６】本発明は、上記問題を解決し、音声入力し
た音声メモ情報を音声ファイルとして記録し、かつ、音
声メモ情報の内容を端的に把握できるファイル名を自動
的に付与し、さらに、利用者による入力が想定される単
語を効率良くカバーする語彙を備えたユーザ辞書を自動
的に生成することができる音声ファイル記録システムを
提供することを目的とする。

【００２７】

【課題を解決するための手段】上記目的を達成するた
め、本発明の音声認識システムは、利用者が任意のアプ
リケーションに対して入力した情報から前記利用者の用
語情報を抽出する利用者用語情報抽出部と、音声認識辞
書を備え、前記利用者の用語情報を基に前記音声認識辞
書の語彙を追加する音声認識辞書管理部と、前記利用者
の音声データを入力する音声入力部と、前記音声認識辞
書を用いて前記音声データの音声認識を実行する音声認
識部を備えることを特徴とする。

【００２８】上記構成により、音声認識辞書を利用者が
他のアプリケーションで用いた利用者用語情報により追
加するので、利用者による入力が想定される単語を効率
良くカバーする語彙を備えた音声認識辞書を自動的に生
成することができる。

【００２９】本発明の音声認識システムにおいて、前記
音声認識辞書より多い語彙数を持つ他の音声認識辞書を
用いて音声認識を実行する音声認識サーバをネットワー
ク上に備え、前記音声認識部による認識率または信頼度
が所定値より低い場合、前記音声認識部がネットワーク
を介して前記音声データを前記音声認識サーバに対して
送信し、前記音声認識サーバが前記音声データの音声認
識処理を実行し、当該音声認識結果を前記音声入力部に
送信することも可能である。

【００３０】上記構成により、音声認識処理を音声認識
サーバで実行させることができる。音声認識サーバ上で
高精度な認識処理を実行すれば音声認識精度の向上を図
ることができる。

【００３１】なお、上記構成において、音声認識辞書管
理部が音声認識サーバによる音声認識の結果に基づいて
音声認識辞書の語彙を追加することとすれば、音声認識
辞書の語彙を適切に更新して行くことができる。また、
当該音声認識辞書の語彙の追加の実行を利用者が選択す
る選択部を備えることも好ましい。

【００３２】次に、本発明の音声ファイル記録システム
は、上記本発明の音声認識システムから音声認識結果を
入力し、前記音声認識の結果に含まれる前記利用者の用
語情報を抽出し、当該利用者の用語情報の中から一又は
複数の利用者用語情報を代表利用者用語情報として選択
する代表利用者用語情報選択部と、前記音声データを音
声ファイルとして記録する音声ファイル記録部を備え、
前記音声ファイル記録部が、前記音声ファイルのファイ
ル名を、前記代表利用者用語情報に基づいて付与するこ
とを特徴とする。

【００３３】上記構成によれば、代表利用者用語情報を
基に音声メモ情報の内容を端的に把握できるファイル名
を自動的に付与することができる。

【００３４】次に、本発明の音声ファイル記録システム
は、さらに、前記音声ファイルを格納する音声ファイル
サーバをネットワーク上に備え、前記音声ファイル記録
部が、前記音声ファイルと検索キーワードを前記ネット
ワークを介して前記音声ファイルサーバに転送して、当
該音声ファイルサーバ内に前記音声ファイルを格納し、
前記音声ファイル記録部内には、前記音声ファイルのフ
ァイル名と前記検索キーワードと前記音声ファイルサー
バのネットワークアドレスを記録する。

【００３５】上記構成により、音声ファイルを音声ファ
イルサーバ上に格納することができ、利用者が用いる携
帯端末のメモリ容量を低減することができる。

【００３６】なお、上記構成において、さらに、前記音
声ファイル記録部による前記音声ファイルサーバへの前
記音声ファイルの転送に先立ち、前記音声ファイルに記
録されている音声データの一部を抽出し、前記音声ファ
イルのダイジェスト音声データを生成するダイジェスト
音声データ生成部を備え、前記音声ファイル記録部は、
前記音声ファイルのファイル名と前記検索キーワードと
前記音声ファイルサーバのネットワークアドレスに加
え、前記ダイジェスト音声データを記録することも好ま
しい。

【００３７】上記構成により、当該ダイジェストデータ
を参照することにより、音声ファイルの内容を簡単に把
握することができる。

【００３８】次に、本発明の音声ファイル記録システム
は、さらに、タイトルと本文からなる電子メールを生成
する電子メール生成部を備え、前記電子メール生成部
は、前記音声ファイル内の音声データの認識結果の内容
を前記電子メールの本文とし、前記音声ファイル内の音
声データの認識結果に含まれる前記利用者の用語情報を
前記電子メールのタイトルとし、前記電子メールのファ
イル名を前記代表利用者用語情報に基づいて付与する。

【００３９】上記構成によれば、音声ファイル内の音声
データの認識結果の内容を電子メールとして生成するこ
とができ、内容を端的に把握できるファイル名を自動的
に付与することができる。

【００４０】また、前記電子メール生成部は前記音声フ
ァイルのファイル名と前記音声ファイルサーバのネット
ワークアドレスを前記電子メールの本文とし、前記音声
ファイル内の音声データの認識結果に含まれる前記利用
者の用語情報を前記電子メールのタイトルとする。

【００４１】上記構成によれば、当該電子メールを受領
した者は、音声ファイルのファイル名と音声ファイルサ
ーバのネットワークアドレスを得ることができ、音声フ
ァイルにアクセスできる。

【００４２】

【発明の実施の形態】以下、図面を参照しつつ、本発明
の音声認識システムおよび音声認識方法、ならびに音声
ファイル記録システムおよび音声ファイル記録方法の実
施形態を説明する。

【００４３】（実施形態１）本発明の実施形態１とし
て、ＰＤＡなどの携帯端末に適用され、音声認識辞書の
語彙自動追加処理、音声認識処理、音声ファイル記録処
理、音声ファイル名自動付与処理を行なう第１の音声フ
ァイル記録システムを説明する。

【００４４】図１は、実施形態１にかかる、本発明の第
１の音声ファイル記録システムの構成を説明する図であ
る。

【００４５】１０は音声記録用途以外の用途を持つアプ
リケーション、２０は利用者用語情報抽出部、３０は音
声認識辞書管理部、３１は音声認識辞書、４０は音声入
力部、５０は音声認識部、６０は代表利用者用語情報選
択部、７０は音声ファイル記録部である。

【００４６】上記構成のうち、音声認識辞書３１の語彙
自動追加処理に関する構成要素は、アプリケーション１
０、利用者用語情報抽出部２０、音声認識辞書管理部３
０である。音声認識処理に関する構成要素は、音声入力
部４０、音声認識部５０、音声認識辞書３１である。音
声ファイル記録処理と音声ファイル名自動付与処理に関
する構成要素は、代表利用者用語情報選択部６０と音声
ファイル記録部７０である。

【００４７】アプリケーション１０は、音声記録用途以
外の用途を持つ任意のアプリケーションである。当該ア
プリケーションの用途は特に限定されないが、利用者が
良く用いる用語情報を効率良く収集するために、例え
ば、ＰＩＭ（Personal Information Manager：個人情報
管理）で用いられるアプリケーションとする。

【００４８】利用者用語情報抽出部２０は、利用者がア
プリケーション１０に対して入力した情報から利用者の
用語情報を抽出する部分である。

【００４９】音声認識辞書管理部３０は、音声認識辞書
３１を備え、利用者用語情報抽出部２０が抽出した利用
者の用語情報を基に音声認識辞書３１の語彙を追加する
部分である。

【００５０】音声入力部４０は利用者の音声データを入
力する部分である。例えば、マイクロフォンとサンプリ
ング処理部を備え、入力された音声波動を電気信号に変
換し、所定周波数でサンプリングしてサンプリングデー
タを入力する。

【００５１】音声認識部５０は、音声認識辞書３１を用
いて音声データの音声認識を実行する部分である。音声
認識部５０は、音響解析機能と音響モデルと照合機能を
備えている。音声認識部５０は、音響解析機能により音
声データを音素単位に分割して特徴量を抽出し、照合機
能により当該特徴量を用いた音素単位の照合および単語
単位の照合を行なう。音素単位の照合は音響モデル内の
特徴量との照合により行ない、単語単位の照合は音声認
識辞書３１内の語彙との照合により行なう。

【００５２】代表利用者用語情報選択部６０は、音声認
識部５０による音声認識の結果に含まれる利用者の用語
情報を抽出し、当該利用者の用語情報の中から一又は複
数の利用者用語情報を代表利用者用語情報として選択す
る部分である。

【００５３】音声ファイル記録部７０は、音声入力部４
０から入力された音声データを音声ファイルとして記録
する部分である。音声ファイル記録部７０は、音声ファ
イルのファイル名を、代表利用者用語情報選択部７０が
選択した代表利用者用語情報に基づいて付与する。

【００５４】次に、本発明の第１の音声ファイル記録シ
ステムの処理の流れを説明する。

【００５５】まず、音声認識辞書３１の語彙自動追加処
理の流れを図２を用いて説明する。当該音声認識辞書３
１の語彙自動追加処理は音声認識処理に先立って行なわ
れるものとし、また、当該処理はその後も適宜実行さ
れ、音声認識辞書３１は自動的に更新される。自動更新
は、例えば、一定期間ごとに行なったり、ＰＩＭアプリ
ケーションが利用されて新たなデータが蓄積された場合
に行なう。

【００５６】以下の例ではアプリケーション１０はＰＩ
Ｍアプリケーションとする。ＰＩＭアプリケーション
は、利用者のスケジュール管理データ、利用者本人の個
人データ、利用者および取引先などの住所録データな
ど、種々の利用者に関する情報を管理するアプリケーシ
ョンである。利用者は普段からＰＩＭアプリケーション
を使用しているものとする。当該ＰＩＭアプリケーショ
ンを介して種々のデータが蓄積されている。

【００５７】まず、利用者用語情報抽出部２０は、アプ
リケーション１０のデータに含まれている利用者の用語
情報を抽出する（ステップＳ２０１）。

【００５８】アプリケーション１０のデータに含まれる
種々の用語が利用者用語情報として抽出される。このよ
うに利用者用語情報抽出部２０によってＰＩＭなどのア
プリケーションから抽出される用語情報は、利用者が良
く用いる用語情報や利用者が用いる独特の用語情報を含
むものとなる。ここでは、利用者のスケジュール管理デ
ータから抽出された仕事の取引先の担当者の名前“Ａ”
に注目して以下の説明を続ける。ここで、名前“Ａ”は
通常の音声認識辞書には含まれていないような珍しい名
前とする。

【００５９】次に、音声認識辞書管理部３０は、利用者
用語情報抽出部２０により抽出した利用者の用語情報に
より音声認識辞書の語彙を追加する（ステップＳ２０
２）。

【００６０】このように、当該利用者の用語情報により
音声認識辞書３１の語彙を追加するので、音声認識辞書
３１は利用者が良く用いると想定される用語情報や利用
者が使う独特の用語情報をカバーするものとすることが
できる。また、用語情報を効率的に編纂できるので辞書
容量を低減することができる。

【００６１】図４は音声認識辞書の語彙を模式的に説明
した図である。この例では、音声認識に利用される汎用
的な語彙の集合である基本語彙部分と、利用者の用語情
報を基に追加する利用者用語情報部分を備えている。こ
こでは、利用者用語情報抽出部２０が抽出した仕事の取
引先の担当者の名前“Ａ”を含む種々の利用者の用語情
報が当該利用者用語情報部分に追加される。

【００６２】上記の処理の流れにより音声認識辞書３１
を追加する。このように追加された音声認識辞書３１は
音声認識処理に用いられる。

【００６３】次に、音声認識処理の流れ、続いて、音声
ファイル記録処理および音声ファイル名自動付与処理の
流れを図３を用いて説明する。

【００６４】まず、利用者は音声入力部４０を介して音
声入力を行なう（ステップＳ３０１）。ここでは、音声
メモとして、Ａさんに依頼する予定の仕事の内容に関す
る情報を音声で入力したとする。

【００６５】次に、音声認識部５０は、音声入力部４０
を介して入力された音声データに対する音声認識処理を
実行する（ステップＳ３０２）。音声認識部５０は、音
声認識辞書３１を用いて音声認識処理を行なう。

【００６６】なお、音声認識辞書３１は上記の語彙自動
追加処理が施され、語彙が追加されているので、利用者
が良く用いる用語情報や利用者が用いる独特の用語情報
をカバーするものとなっており、利用者から入力された
音声データを効率良く認識できる。この例では名前
“Ａ”は珍しい名前であり、音声認識辞書３１の基本語
彙部分では認識することができないが、本発明では音声
認識辞書３１は利用者用語情報部分を備えているので、
名前“Ａ”を正しく認識することができる。

【００６７】次に、代表利用者用語情報選択部６０は、
音声認識部５０から認識結果を受け取り、その中から代
表利用者用語情報を選択する（ステップＳ３０３）。代
表利用者用語情報は、音声認識の結果に含まれる代表的
な利用者の用語情報となる。例えば、仕事の取引先の担
当者の名前“Ａ”が代表利用者用語情報として選択され
る。

【００６８】次に、音声ファイル記録部７０は、音声フ
ァイルのファイル名を代表利用者用語情報に基づいて付
与し、当該音声ファイルを記録する（ステップＳ３０
４）。ここで、代表利用者用語情報は音声ファイルの内
容に含まれる代表的な利用者の用語情報であるので、当
該代表利用者用語情報を基にファイル名を自動的に付与
すれば、利用者にとって音声ファイルの内容を想起し、
把握しやすいファイル名となる。

【００６９】以上、本発明の実施形態１にかかる、音声
ファイル記録システムを用いれば、音声認識辞書を利用
者用語情報により追加し、利用者による入力が想定され
る単語を効率良くカバーする語彙を備えたものとでき、
入力された音声データを音声ファイルとして記録し、そ
の内容を端的に把握できるファイル名を自動的に付与す
ることができる。

【００７０】なお、上記構成のうち、利用者用語情報抽
出部２０、音声認識辞書管理部３０、音声認識辞書３
１、音声入力部４０、音声認識部５０を別途、第１の音
声認識システムとして構成することができ、また、音声
認識辞書の語彙自動追加処理、音声認識処理を当該第１
の音声認識システムの処理とすることができる。

【００７１】（実施形態２）本発明の実施形態２にかか
る第２の音声ファイル記録システムは、ネットワーク上
にある音声認識サーバを利用し、入力された音声データ
を音声認識サーバに送り、音声認識処理を音声認識サー
バで実行させ、その結果を受け取ることにより、ＰＤＡ
などの携帯端末上での音声認識処理の負荷を低減させ、
音声ファイル記録処理およびファイル名自動付与処理を
行なうものである。。

【００７２】図５は、本発明の第２の音声ファイル記録
システムの構成を説明する図である。

【００７３】第２の音声ファイル記録システムは、実施
形態１に示した第１の音声ファイル記録システムと同
様、音声記録用途以外の用途を持つ任意のアプリケーシ
ョン１０、利用者用語情報抽出部２０、音声認識辞書管
理部３０、音声認識辞書３１、音声入力部４０、音声認
識部５０、代表利用者用語情報選択部６０、音声ファイ
ル記録部７０を備え、さらに、音声認識切換部８０、音
声データ転送部９０を備えている。また、ネットワーク
１００上に音声認識サーバ２００を備えている。

【００７４】音声認識切換部８０は、音声認識部５０に
よる音声認識率や信頼度をチェックし、音声認識率や信
頼度が閾値より低い場合に、音声認識部５０による音声
認識処理を中止し、音声ファイル記録システム上での音
声認識処理に代え、音声認識サーバ２００による音声認
識処理に切り換える部分である。

【００７５】音声データ転送部９０は、音声入力部４０
を介して音声認識部５０に一時記憶されている音声ファ
イルを、ネットワーク１００を介して音声認識サーバ２
００に転送する処理を行なう部分である。

【００７６】音声認識サーバ２００は、音声認識辞書３
１ａ、音声認識部５０ａを備えている。ここで、音声認
識サーバ２００の音声認識辞書３１ａは、音声ファイル
記録システム内の音声認識辞書３１より多い語彙数を持
つ音声認識辞書である。音声認識サーバ２００の音声認
識辞書であるので大規模な語彙を備えている。音声認識
部５０ａも高精度のアルゴリズムと音響モデルを備え、
高い認識精度を実現するものである。

【００７７】次に、第２の音声記録ファイルシステムの
処理の流れを図６を用いて説明する。

【００７８】以下の例においてもアプリケーション１０
はＰＩＭアプリケーションとする。また、利用者用語情
報抽出部２０による利用者の用語情報の抽出処理、音声
認識辞書管理部３０による音声認識辞書の語彙の追加処
理は、実施形態１で説明した図２のフローチャートと同
様で良い。

【００７９】次に、音声認識処理において、まず、利用
者は音声入力部４０を介して音声入力を行なう（ステッ
プＳ６０１）。

【００８０】音声認識部５０は、音声入力部４０を介し
て入力された音声データに対する音声認識処理を実行す
る（ステップＳ６０２）。音声認識部５０は、音声認識
辞書３１を用いて音声認識処理を行なう。

【００８１】次に、音声認識切換部８０は、音声認識部
５０による音声認識率と信頼度をチェックする（ステッ
プＳ６０３）。チェックの結果、音声認識率と信頼度が
閾値より低い場合（ステップＳ６０３：Ｙ）、音声認識
部５０による音声認識処理を中止し（ステップＳ６０
４）、音声認識サーバ２００による音声認識処理に切り
換え、音声データ転送部９０に対して音声ファイルをネ
ットワーク１００を介して音声認識サーバ２００に転送
するように指示する（ステップＳ６０５）。

【００８２】音声認識サーバ２００は、音声認識辞書３
１ａを用いて、音声ファイルの音声データを音声認識処
理を実行し（ステップＳ６０６）、音声認識結果をネッ
トワーク１００を介して代表利用者用語情報選択部６０
に入力する。

【００８３】代表利用者用語情報選択部６０は、音声認
識サーバ２００から認識結果を受け取り、その中から代
表利用者用語情報を選択する（ステップＳ６０７）。代
表利用者用語情報は、音声認識の結果に含まれる代表的
な利用者の用語情報となる。

【００８４】次に、音声ファイル記録部７０は、音声フ
ァイルのファイル名を代表利用者用語情報に基づいて付
与し、当該音声ファイルを記録する（ステップＳ６０
８）。

【００８５】上記処理により、音声認識をネットワーク
上の音声認識サーバにより実行し、当該音声認識結果を
利用して代表利用者用語情報を選択し、音声ファイルの
ファイル名を自動付与する。

【００８６】なお、音声認識辞書管理部３０は、音声認
識サーバ２００による音声認識の結果に基づいて、音声
認識辞書３１の語彙を追加することが可能である。音声
認識サーバ２００による音声認識結果を有効に活用する
ためである。ここで、当該語彙の追加を実行するか否か
を利用者が選択する選択部を備える構成とすることも可
能である。音声認識サーバ２００による音声認識結果が
良好とは言えない場合もあり、かならずしも当該音声認
識結果を音声認識辞書３１の語彙の追加に用いる方が良
いとは限らないからである。

【００８７】なお、上記構成のうち、利用者用語情報抽
出部２０、音声認識辞書管理部３０、音声認識辞書３
１、音声入力部４０、音声認識部５０、音声認識切換部
８０、音声データ転送部９０を別途、第１の音声認識シ
ステムとして構成することができ、また、音声認識辞書
の語彙自動追加処理、音声認識処理を当該第１の音声認
識システムの処理とすることができる。

【００８８】（実施形態３）本発明の実施形態３にかか
る第３の音声ファイル記録システムは、ネットワーク上
にある音声ファイルサーバを利用し、音声ファイル記録
処理を音声ファイルサーバ上で行なうものである。音声
ファイルを音声ファイルサーバ上に格納することによ
り、ＰＤＡなどの携帯端末上での記録処理を不要とする
ものである。

【００８９】図７は、本発明の第３の音声ファイル記録
システムの構成を説明する図である。

【００９０】実施形態３の音声ファイル記録システム
は、実施形態１と同様、音声記録用途以外の用途を持つ
任意のアプリケーション１０、利用者用語情報抽出部２
０、音声認識辞書管理部３０、音声認識辞書３１、音声
入力部４０、音声認識部５０、代表利用者用語情報選択
部６０、音声ファイル記録部７０を備え、さらに、音声
ファイル転送部９１を備えている。また、ネットワーク
１００上に音声ファイルサーバ３００を備えている。

【００９１】音声ファイル転送部９１は、音声入力部４
０を介して音声ファイル記録部７０に一時記憶されてい
る音声ファイルを、ネットワーク１００を介して音声フ
ァイルサーバ３００に転送する処理を行なう。また、音
声ファイル記録部７０内には、音声ファイルのファイル
名と音声ファイルサーバのネットワークアドレスを記録
しておく。さらに、ダイジェスト音声データを記録する
ことも可能である。

【００９２】ダイジェスト音声データは、音声ファイル
の音声データの一部を抽出したものである。例えば、音
声ファイルの音声データの冒頭部分を抽出したもので良
い。ダイジェスト音声データは容量が小さいので小さい
メモリ容量で多数のダイジェスト音声データを記録する
ことができ、また、一つ一つは短い時間で再生できるの
で、音声ファイルの内容を端的に把握する手掛かりとす
ることができる。図８は、ダイジェスト音声データを利
用する場合の音声ファイル記録処理の流れを模式的に示
した図である。図８には模式的に音声ファイル記録部７
０と音声ファイルサーバ３００のみを示している。音声
ファイル記録部７０には音声ファイルのファイル名、音
声ファイルサーバ３００のアドレスデータ、ダイジェス
ト音声データのみが記録され、音声ファイル本体は音声
ファイルサーバ３００にアップロードされ、格納されて
いる。

【００９３】なお、ダイジェスト音声データを記録する
構成の場合、音声ファイル記録部７０がダイジェスト音
声データ生成部７１を備える。ダイジェスト音声データ
生成部７１は音声ファイルの音声データの一部を抽出
し、音声ファイルのダイジェスト音声データを生成する
部分である。

【００９４】（実施形態４）実施形態４にかかる第４の
音声ファイル記録システムは、音声ファイル内の音声デ
ータの認識結果を本文とする電子メールを生成する機能
を備えたものである。

【００９５】図９は本発明の第４の音声ファイル記録シ
ステムの構成を説明する図である。実施形態４の音声フ
ァイル記録システムは、実施形態１と同様、音声記録用
途以外の用途を持つアプリケーション１０、利用者用語
情報抽出部２０、音声認識辞書管理部３０、音声認識辞
書３１、音声入力部４０、音声認識部５０、代表利用者
用語情報選択部６０、音声ファイル記録部７０を備え、
さらに、電子メール生成部９５を備えている。

【００９６】電子メール生成部９５は、音声認識部５０
の音声認識結果を受け、音声ファイルの音声データの認
識結果を本文とする電子メールを生成する部分である。
ここで、電子メール生成部９５は、代表利用者用語情報
選択部６０から代表利用者用語情報を受け、電子メール
のタイトル名と添付ファイルとする音声ファイルのファ
イル名を代表利用者用語情報に基づいて付与する。

【００９７】また、音声ファイルを音声ファイルサーバ
に記録する構成である場合、電子メール生成部９５は、
音声ファイルのファイル名と音声ファイルサーバのネッ
トワークアドレスを電子メールの本文として生成し、音
声ファイル内の音声データの認識結果に含まれる利用者
の用語情報に基づいて電子メールのタイトルを生成す
る。

【００９８】利用者用語情報抽出部２０による利用者の
用語情報の抽出処理、音声認識辞書管理部３０による音
声認識辞書の語彙の追加処理は、実施形態１で説明した
図２のフローチャートと同様で良い。

【００９９】音声認識処理の流れは実施形態１で説明し
た図３のフローチャートと同様に、図１０に示すよう
に、音声入力部４０を介した音声入力処理（ステップＳ
１００１）、音声認識部５０による音声認識処理（ステ
ップＳ１００２）、代表利用者用語情報選択部６０によ
る代表利用者用語情報の選択処理（ステップＳ１００
３）が行なわれる。次に、電子メール生成部９５は、音
声認識部５０の音声認識結果を受け、音声ファイル内の
音声データの認識結果を本文とする電子メールを生成し
（ステップＳ１００４）、代表利用者用語情報選択部６
０から代表利用者用語情報を受け、電子メールのファイ
ル名を代表利用者用語情報に基づいて付与し（ステップ
Ｓ１００５）、さらに、電子メールのタイトルを音声フ
ァイル内の音声データの認識結果に含まれる利用者の用
語情報に基づいて生成する（ステップＳ１００６）。生
成した電子メールを相手先アドレスに宛てて送信する
（ステップＳ１００７）。

【０１００】（実施形態５）本発明の音声認識処理およ
び音声ファイル記録処理は、上記に説明した処理を実現
するステップを記述したプログラムとして記述すること
ができ、当該プログラムをコンピュータに読み取らせる
ことにより、本発明の音声ファイル記録処理を実行する
ことができる。本発明の音声ファイル記録システムを実
現する処理ステップを備えたプログラムは、図１１に図
示した例のように、ＣＤ−ＲＯＭ１００２やフレキシブ
ルディスク１００３等の可搬型記録媒体１００１だけで
なく、ネットワーク上にある記録装置内の記録媒体１０
００や、コンピュータのハードディスクやＲＡＭ等の記
録媒体１００５に格納して提供することができ、ネット
ワークからダウンロードすることもできる。プログラム
実行時には、プログラムはコンピュータ１００４上にロ
ーディングされ、主メモリ上で実行される。

【０１０１】（付記）本発明の音声認識システムおよび
音声ファイル記録システムに関し、以下の項をさらに開
示する。

【０１０２】（付記１）利用者が任意のアプリケーシ
ョンに対して入力した情報から前記利用者の用語情報を
抽出する利用者用語情報抽出部と、音声認識辞書を備
え、前記利用者の用語情報を基に前記音声認識辞書の語
彙を追加する音声認識辞書管理部と、前記利用者の音声
データを入力する音声入力部と、前記音声認識辞書を用
いて前記音声データの音声認識を実行する音声認識部を
備えることを特徴とする音声認識システム（１）。

【０１０３】（付記２）前記音声認識辞書より多い語
彙数を持つ他の音声認識辞書を用いて音声認識を実行す
る音声認識サーバをネットワーク上に備え、前記音声認
識部による認識率または信頼度が所定値より低い場合、
前記音声認識部がネットワークを介して前記音声データ
を前記音声認識サーバに対して送信し、前記音声認識サ
ーバが前記音声データの音声認識処理を実行し、当該音
声認識結果を前記音声入力部に送信する付記１に記載の
音声認識システム（２）。

【０１０４】（付記３）前記音声認識辞書管理部が、
前記音声認識サーバによる音声認識の結果に基づいて、
前記音声認識辞書の語彙を追加する付記２に記載の音声
認識システム（３）。

【０１０５】（付記４）さらに、前記音声認識辞書管
理部による前記音声認識辞書の語彙の追加を実行するか
否かを利用者が選択する選択部を備えた付記３に記載の
音声認識システム。

【０１０６】（付記５）利用者が任意のアプリケーシ
ョンに対して入力した情報から前記利用者の用語情報を
抽出する利用者用語情報抽出部と、音声認識辞書を備
え、前記利用者の用語情報を基に前記音声認識辞書の語
彙を追加する音声認識辞書管理部と、前記利用者の音声
データを入力する音声入力部と、入力された前記音声デ
ータを音声ファイルとして記録する音声ファイル記録部
と、前記音声認識辞書を用いて前記音声データの音声認
識を実行する音声認識部と、前記音声認識の結果に含ま
れる前記利用者の用語情報を抽出し、当該利用者の用語
情報の中から一又は複数の利用者用語情報を代表利用者
用語情報として選択する代表利用者用語情報選択部を備
え、前記音声ファイル記録部が、前記音声ファイルのフ
ァイル名を、前記代表利用者用語情報に基づいて付与す
ることを特徴とする音声ファイル記録システム（４）（付記６）前記音声認識辞書より多い語彙数を持つ他
の音声認識辞書を用いて音声認識を実行する音声認識サ
ーバをネットワーク上に備え、前記音声認識部による認
識率または信頼度が所定値より低い場合、前記音声ファ
イル記録部が、ネットワークを介して前記音声ファイル
を前記音声認識サーバに対して送信し、前記音声認識サ
ーバが前記音声データの音声認識処理を実行し、前記代
表利用者用語情報選択部が、前記ネットワークを介して
前記音声認識サーバから音声認識結果を浮け、前記音声
認識サーバによる音声認識の結果に含まれる前記利用者
の用語情報を抽出し、当該利用者の用語情報の中から一
又は複数の利用者用語情報を代表利用者用語情報として
選択する付記５に記載の音声ファイル記録システム
（４）。

【０１０７】（付記７）前記音声ファイルを格納する
音声ファイルサーバをネットワーク上に備え、前記音声
ファイル記録部が、前記音声ファイルと検索キーワード
を前記ネットワークを介して前記音声ファイルサーバに
転送して、当該音声ファイルサーバ内に前記音声ファイ
ルを格納し、前記音声ファイル記録部内には、前記音声
ファイルのファイル名と前記検索キーワードと前記音声
ファイルサーバのネットワークアドレスを記録する付記
５または６に記載の音声ファイル記録システム（５）。

【０１０８】（付記８）さらに、前記音声ファイル記
録部による前記音声ファイルサーバへの前記音声ファイ
ルの転送に先立ち、前記音声ファイルに記録されている
音声データの一部を抽出し、前記音声ファイルのダイジ
ェスト音声データを生成するダイジェスト音声データ生
成部を備え、前記音声ファイル記録部は、前記音声ファ
イルのファイル名と前記検索キーワードと前記音声ファ
イルサーバのネットワークアドレスに加え、前記ダイジ
ェスト音声データを記録する付記７に記載の音声ファイ
ル記録システム（６）。

【０１０９】（付記９）さらに、タイトルと本文から
なる電子メールを生成する電子メール生成部を備え、前
記電子メール生成部が、前記音声ファイル内の音声デー
タの認識結果の内容を前記電子メールの本文とし、前記
音声ファイル内の音声データの認識結果に含まれる前記
利用者の用語情報を前記電子メールのタイトルとし、前
記電子メールのファイル名を前記代表利用者用語情報に
基づいて付与する付記５または６に記載の音声ファイル
記録システム（７）。

【０１１０】（付記１０）さらに、タイトルと本文か
らなる電子メールを生成する電子メール生成部を備え、
前記電子メール生成部が、前記音声ファイルのファイル
名と前記音声ファイルサーバのネットワークアドレスを
前記電子メールの本文とし、前記音声ファイル内の音声
データの認識結果に含まれる前記利用者の用語情報を前
記電子メールのタイトルとする付記７に記載の音声ファ
イル記録システム（８）。

【０１１１】（付記１１）任意のアプリケーションに
対して利用者が入力した情報から前記利用者の用語情報
を抽出し、音声認識辞書を保持し、抽出した前記利用者
の用語情報を基に前記音声認識辞書の語彙を追加し、前
記利用者の音声データを入力し、前記音声認識辞書を用
い、前記音声データの音声認識を実行することを特徴と
する音声認識方法（９）。

【０１１２】（付記１２）入力された音声データを認
識する音声認識処理プログラムであって、任意のアプリ
ケーションに対して利用者が入力した情報から前記利用
者の用語情報を抽出する処理ステップと、音声認識辞書
を保持し、抽出した前記利用者の用語情報を基に前記音
声認識辞書の語彙を追加する処理ステップと、前記利用
者の音声データを入力する処理ステップと、前記音声認
識辞書を用い、前記音声データの音声認識を実行する処
理ステップとを備えたことを特徴とする音声認識処理プ
ログラム（１０）。

【０１１３】（付記１３）任意のアプリケーションに
対して利用者が入力した情報から前記利用者の用語情報
を抽出し、音声認識辞書を保持し、抽出した前記利用者
の用語情報を基に前記音声認識辞書の語彙を追加し、前
記利用者の音声データを入力し、入力された前記音声デ
ータを音声ファイルとして記録し、前記音声認識辞書を
用い、前記音声データの音声認識を実行し、前記音声認
識の結果に含まれる前記利用者の用語情報を抽出し、当
該利用者の用語情報の中から一又は複数の利用者用語情
報を代表利用者用語情報として選択し、前記音声ファイ
ルのファイル名を、前記代表利用者用語情報に基づいて
付与することを特徴とする音声ファイル記録方法。

【０１１４】（付記１４）入力された音声データを音
声ファイルとして記録する音声ファイル記録処理プログ
ラムであって、任意のアプリケーションに対して利用者
が入力した情報から前記利用者の用語情報を抽出する処
理ステップと、音声認識辞書を保持し、抽出した前記利
用者の用語情報を基に前記音声認識辞書の語彙を追加す
る処理ステップと、前記利用者の音声データを入力する
処理ステップと、入力された前記音声データを音声ファ
イルとして記録する処理ステップと、前記音声認識辞書
を用い、前記音声データの音声認識を実行する処理ステ
ップと、前記音声認識の結果に含まれる前記利用者の用
語情報を抽出し、当該利用者の用語情報の中から一又は
複数の利用者用語情報を代表利用者用語情報として選択
する処理ステップと、前記音声ファイルのファイル名
を、前記代表利用者用語情報に基づいて付与する処理ス
テップを備えたことを特徴とする音声ファイル記録処理
プログラム。

【０１１５】

【発明の効果】本発明の第１の音声ファイル記録システ
ムによれば、代表利用者用語情報を基に音声メモ情報の
内容を端的に把握できるファイル名を自動的に付与する
ことができる。また、利用者用語情報を用いて利用者に
よる入力が想定される単語を効率良くカバーする語彙を
備えた音声認識辞書を自動的に生成することができる。

【０１１６】また、本発明の第２の音声ファイル記録シ
ステムによれば、ネットワークを介して音声認識処理を
音声認識サーバで実行させることができ、ＰＤＡなどの
携帯端末の処理負荷を低減することができる。

【０１１７】また、本発明の第３の音声ファイル記録シ
ステムによれば、音声ファイルを音声ファイルサーバ上
に格納することができ、ＰＤＡなどの携帯端末のメモリ
容量を低減することができる。

【０１１８】また、本発明の第４の音声ファイル記録シ
ステムによれば、音声ファイル内の音声データの認識結
果を電子メールの本文とし、音声ファイルのファイル
名、音声ファイルサーバのネットワークアドレス、ダイ
ジェスト音声データなどを本文とすることもできる。電
子メールのタイトルは、音声ファイル内の音声データの
認識結果に含まれる利用者の用語情報に基づいて生成す
ることができる。

【図面の簡単な説明】

【図１】本発明の第１の音声ファイル記録システムの
構成を説明する図

【図２】音声ファイル記録システムの処理の流れを示
すフローチャート

【図３】音声認識処理、音声ファイル記録処理、音声
ファイル名自動付与処理の流れを示すフローチャート

【図４】音声認識辞書の語彙を模式的に説明した図

【図５】本発明の第２の音声ファイル記録システムの
構成を説明する図

【図６】本発明の第２の音声ファイル記録システムの
音声認識処理、音声ファイル記録処理、音声ファイル名
自動付与処理の流れを示すフローチャート

【図７】本発明の第３の音声ファイル記録システムの
構成を説明する図

【図８】ダイジェスト音声情報を利用する場合の音声
ファイル記録処理の流れを模式的に示した図

【図９】本発明の第４の音声ファイル記録システムの
構成を説明する図

【図１０】本発明の第４の音声ファイル記録システム
の処理の流れを示すフローチャート

【図１１】本発明の音声ファイル記録システムを実現
する処理ステップを記録した記録媒体の例を示す図

【図１２】音声入力された音声メモ情報を音声ファイ
ルとして記録する従来の音声メモ情報記録システムを説
明する図

【図１３】従来技術における音声認識処理を伴う音声
メモ情報記録システムを説明する図

【符号の説明】

１０音声記録用途以外の用途を持つアプリケーション２０利用者用語情報抽出部３０音声認識辞書管理部３１音声認識辞書４０音声入力部５０音声認識部６０代表利用者用語情報選択部７０音声ファイル記録部７１ダイジェスト音声情報生成部８０音声認識切換部９０音声データ転送部９１音声ファイル転送部９５電子メール生成部１００ネットワーク２００音声認識サーバ３００音声ファイルサーバ５１０マイクロフォン５２０音声ファイル記録部５３０音声ファイル名入力部５４０音声ファイル再生部６１０マイクロフォン６２０音響解析部６３０音響モデル６４０音声認識辞書６５０照合部１０００回線先のハードディスク等の記録媒体１００１ＣＤ−ＲＯＭやフレキシブルディスク等の可
搬型記録媒体１００２ＣＤ−ＲＯＭ１００３フレキシブルディスク１００４コンピュータ１００５コンピュータ上のＲＡＭ／ハードディスク等
の記録媒体

Claims

【特許請求の範囲】

【請求項１】利用者が任意のアプリケーションに対し
て入力した情報から前記利用者の用語情報を抽出する利
用者用語情報抽出部と、音声認識辞書を備え、前記利用者の用語情報を基に前記
音声認識辞書の語彙を追加する音声認識辞書管理部と、前記利用者の音声データを入力する音声入力部と、前記音声認識辞書を用いて前記音声データの音声認識を
実行する音声認識部を備えることを特徴とする音声認識
システム。
【請求項２】前記音声認識辞書より多い語彙数を持つ
他の音声認識辞書を用いて音声認識を実行する音声認識
サーバをネットワーク上に備え、前記音声認識部による認識率または信頼度が所定値より
低い場合、前記音声認識部がネットワークを介して前記
音声データを前記音声認識サーバに対して送信し、前記音声認識サーバが前記音声データの音声認識処理を
実行し、当該音声認識結果を前記音声入力部に送信する
請求項１に記載の音声認識システム。
【請求項３】前記音声認識辞書管理部が、前記音声認
識サーバによる音声認識の結果に基づいて、前記音声認
識辞書の語彙を追加する請求項２に記載の音声認識シス
テム。
【請求項４】請求項１または２に記載の音声認識シス
テムから音声認識結果を入力し、前記音声認識結果に含
まれる前記利用者の用語情報を抽出し、当該利用者の用
語情報の中から一又は複数の利用者用語情報を代表利用
者用語情報として選択する代表利用者用語情報選択部
と、前記音声データを音声ファイルとして記録する音声ファ
イル記録部を備え、前記音声ファイル記録部が、前記音声ファイルのファイ
ル名を、前記代表利用者用語情報に基づいて付与するこ
とを特徴とする音声ファイル記録システム。
【請求項５】前記音声ファイルを格納する音声ファイ
ルサーバをネットワーク上に備え、前記音声ファイル記録部が、前記音声ファイルと検索キ
ーワードを前記ネットワークを介して前記音声ファイル
サーバに転送して、当該音声ファイルサーバ内に前記音
声ファイルを格納し、前記音声ファイル記録部内には、前記音声ファイルのフ
ァイル名と前記検索キーワードと前記音声ファイルサー
バのネットワークアドレスを記録する請求項４に記載の
音声ファイル記録システム。
【請求項６】さらに、前記音声ファイル記録部による
前記音声ファイルサーバへの前記音声ファイルの転送に
先立ち、前記音声ファイルに記録されている音声データ
の一部を抽出し、前記音声ファイルのダイジェスト音声
データを生成するダイジェスト音声データ生成部を備
え、前記音声ファイル記録部は、前記音声ファイルのファイ
ル名と前記検索キーワードと前記音声ファイルサーバの
ネットワークアドレスに加え、前記ダイジェスト音声デ
ータを記録する請求項５に記載の音声ファイル記録シス
テム。
【請求項７】さらに、タイトルと本文からなる電子メ
ールを生成する電子メール生成部を備え、前記電子メー
ル生成部が、前記音声ファイル内の音声データの認識結
果の内容を前記電子メールの本文とし、前記音声ファイ
ル内の音声データの認識結果に含まれる前記利用者の用
語情報を前記電子メールのタイトルとし、前記電子メー
ルのファイル名を前記代表利用者用語情報に基づいて付
与する請求項４に記載の音声ファイル記録システム。
【請求項８】さらに、タイトルと本文からなる電子メ
ールを生成する電子メール生成部を備え、前記電子メー
ル生成部が、前記音声ファイルのファイル名と前記音声
ファイルサーバのネットワークアドレスを前記電子メー
ルの本文とし、前記音声ファイル内の音声データの認識
結果に含まれる前記利用者の用語情報を前記電子メール
のタイトルとする請求項５に記載の音声ファイル記録シ
ステム。
【請求項９】任意のアプリケーションに対して利用者
が入力した情報から前記利用者の用語情報を抽出し、音声認識辞書を保持し、抽出した前記利用者の用語情報
を基に前記音声認識辞書の語彙を追加し、前記利用者の音声データを入力し、前記音声認識辞書を用い、前記音声データの音声認識を
実行することを特徴とする音声認識方法。
【請求項１０】入力された音声データを認識する音声
認識処理プログラムであって、任意のアプリケーションに対して利用者が入力した情報
から前記利用者の用語情報を抽出する処理ステップと、音声認識辞書を保持し、抽出した前記利用者の用語情報
を基に前記音声認識辞書の語彙を追加する処理ステップ
と、前記利用者の音声データを入力する処理ステップと、前記音声認識辞書を用い、前記音声データの音声認識を
実行する処理ステップとを備えたことを特徴とする音声
認識処理プログラム。