JP4516112B2

JP4516112B2 - 音声認識プログラム

Info

Publication number: JP4516112B2
Application number: JP2007507947A
Authority: JP
Inventors: 英雄山本
Original assignee: 岐阜サービス株式会社
Priority date: 2005-03-11
Filing date: 2005-03-11
Publication date: 2010-08-04
Anticipated expiration: 2025-03-11
Also published as: JPWO2006097975A1; WO2006097975A1; US20080177542A1

Description

本発明は、医療用カルテの自動作成等に好適な音声認識プログラムに関する。

従来、医療機関におけるカルテの記載は、担当医師自身が、専用の用紙（カルテ）に手書きで記入したり、パーソナルコンピュータ（ＰＣ）を使用して専用の入力画面にキーボードで入力したりしている。ここで、かかる医療用カルテ等の作成において、音声認識技術を利用できれば、また、手書きやキーボード入力による入力ミスを効果的に防止でき、また、医師等の手書きやキーボード入力の入力作業の手間及び時間を大幅に削減することができると考えられる。医療用カルテに音声認識技術を利用した技術として、例えば、特許文献１に記載の技術がある。
特開２００３−１２２８４９号公報

特許文献１には、診療所及びその他の医療機関において発生する診療情報を電子的に記録する電子カルテの入力／管理を行なう電子カルテシステムが開示されている。この電子カルテシステムは、電子カルテの入力を行なう医師端末の表示画面を、患者に関する氏名・性別・生年月日等の患者情報表示部分、患者に関するカルテ情報を示す電子カルテ表示部分、該当患者に関する指導料実施情報を示す指導料実施情報表示部分、その他、所定の条件によって当該患者の診療情報を検索する手段であるショートカット表示部分とから構成する。医師は、該ショートカット機能を使用して、該当する条件に従った内容の電子カルテ情報を画面表示させる。ここで、この電子カルテシステムは、前記ショートカットを、例えば２文字程度のキーワードと関連付けて、このキーワード内容を音声認識手段と連動させることにより、入力の簡易化を実現することができるとしている。

しかし、特許文献１に記載の技術は、ショートカット機能の実現開始に音声認識手段を利用する程度であり、その他のデータ入力は、やはり、基本的にＰＣのキーボードやマウス等の入力装置を使用して行なう必要がある。したがって、医師等のカルテ作成作業の省力化の点で十分ではなく、また、ＰＣの操作に不慣れな医師にとって、入力作業が困難となる可能性がある。

そこで、本発明は、定形文の入力作業を簡易化し、医療用カルテ等の作成に応用することができ、ＰＣの操作に不慣れな医師等の使用者にとっても使い勝手を良くして、医師等の入力作業の手間及び時間を大幅に削減することができる音声認識プログラムの提供を課題とする。

請求項１に係る音声認識プログラムは、音声入力された単語を、記憶手段に格納した限定された個数の開始確認語と照合して、文認識の開始確認語が音声入力されたか否か判断する開始確認語認識手順と、音声入力された単語を、記憶手段に格納した限定された個数の終了確認語と照合して、前記開始確認語の音声入力後に文認識の終了確認語が音声入力されたか否か判断する終了確認語認識手順と、前記開始確認語認識手順及び終了確認語認識手順で前記開始確認語及び前記終了確認語が音声入力されたと判断したとき、前記開始確認語と前記終了確認語との間の中間文を音声認識する文認識手順とをコンピュータに実行させ、前記開始確認語、終了確認語及び中間文として、一連の文として発話される開始確認語、終了確認語及び中間文のセットを用意すると共に、前記中間文として複数の定形文を定形文辞書に格納し、前記文認識手順で音声認識された中間文を、前記定形文辞書に格納された定形文の各々とパターンマッチングし、前記中間文に対応する定形文を出力する文変換手順をコンピュータに実行させ、前記文認識手順は、前記開始確認語認識手順及び前記終了確認語認識手順において前記対をなす開始確認語及び終了確認語を確認するまでは、音声認識は単語認識の段階までとし、前記対をなす開始確認語及び終了確認語のうちの当該開始確認語が音声入力された後に当該終了確認語が音声入力されたことを判断及び確認したときにのみ、前記文認識手順における当該開始確認語と当該終了確認語との間の中間文の文認識を実行する。

請求項２に係る音声認識プログラムは、一方の対話者が他方の対話者に所定内容の情報を提示して確認するための確認文を音声認識するための音声認識プログラムであって、前記一方の対話者と他方の対話者との間の一連の対話を、音素モデル及び単語モデルを使用した音素認識及び単語認識により音声認識し、前記対話中の単語をモニターする単語認識手順と、前記単語認識手順でモニターした単語を、前記確認文の直前に付加されて一連の文を構成する接続語からなると共に記憶手段に格納した限定された個数の所定の開始確認語にパターンマッチングし、前記開始確認語が音声入力されたか否かを確認する開始確認語認識手順と、前記単語認識手順でモニターした単語を、前記確認文の直後に付加されて一連の文を構成する助動詞からなると共に記憶手段に格納した限定された個数の所定の終了確認語にパターンマッチングし、前記終了確認語が音声入力されたか否かを確認する終了確認語認識手順と、前記開始確認語が音声入力された後に前記終了確認語が音声入力されたときにのみ、前記開始確認語と前記終了確認語との間の中間文を音声認識する文認識手順とをコンピュータに実行させ、前記開始確認語、終了確認語及び中間文として、一連の文として発話される開始確認語、終了確認語及び中間文のセットを用意すると共に、前記中間文として複数の定形文を定形文辞書に格納し、前記文認識手順で音声認識された中間文を、前記定形文辞書に格納された定形文の各々とパターンマッチングし、前記中間文に対応する定形文を出力する文変換手順をコンピュータに実行させ、前記文認識手順は、前記開始確認語認識手順及び前記終了確認語認識手順において前記対をなす開始確認語及び終了確認語を確認するまでは、音声認識は単語認識の段階までとし、前記対をなす開始確認語及び終了確認語のうちの当該開始確認語が音声入力された後に当該終了確認語が音声入力されたことを判断及び確認したときにのみ、前記文認識手順における当該開始確認語と当該終了確認語との間の中間文の文認識を実行する。

請求項３に係る音声認識プログラムは、請求項１または２の構成において、前記文変換手順が、前記文認識手順で音声認識された口語文からなる中間文を、予め記憶手段に格納された文語文からなる定形文と対比し、前記中間文に対応する定形文に変換して出力する。

請求項４に係る音声認識プログラムは、請求項１乃至３のいずれかの構成において、更に、前記文変換手順が、前記開始確認語と終了確認語との間に前記中間文が存在しない場合は実行されず、前記開始確認語の直後に前記終了確認語以外の単語の入力があり、その後、前記終了確認語の入力があったときにのみ実行される。

請求項５に係る音声認識プログラムは、請求項２の構成において、前記開始確認語として、前記記憶手段としての単語辞書に格納した限定された個数の順接、説明、転換等の接続語を使用し、前記終了確認語として、前記単語辞書に格納した限定された個数の付加疑問文の末尾語または助動詞を使用し、前記中間文として、前記一方の対話者としての医師が前記他方の対話者としての患者に提示して確認するための医療用カルテの記入文を、前記定形文辞書に前記定形文として格納して使用し、医師が患者との対話中に発話する前記医療用カルテの記入文に対応する口語文に対応するよう、前記開始確認語、中間文及び終了確認語を組み合わせて前記セットを構成し、更に、医師と患者との対話をモニターすると共に、対話中に医師が発話する複数の文に対し、前記文認識手順で文認識した中間文に対応する定形文のみを電子カルテに順次記入する手順をコンピュータに実行させる。

請求項６に係る音声認識プログラムは、請求項５の構成において、更に、前記文認識手順において、音声認識された中間文を前記定形文辞書に格納された定形文の各々とパターンマッチングしたとき、当該中間文に対応して複数候補の定形文が存在する場合、それら複数候補の定形文をリスト表示する手順と、前記リスト表示された複数候補の定形文を医師自身に確認させて最も適当な定形文を選択させ、当該選択された最も適当な定形文を前記電子カルテに記入する手順とをコンピュータに実行させる。

請求項７に係る音声認識プログラムは、請求項１または２の構成において、前記文変換手順が、発話される複数の文に対し、前記文認識手順で文認識した中間文に対応する定形文のみを順次出力する。

請求項８に係る音声認識プログラムは、請求項１または２の構成において、前記文認識手順が、前記単語認識手順の認識結果を利用すると共に、前記定型文辞書に格納した定型文に含まれる限定された個数の単語に基づき作成した言語モデルを参照して、前記中間文を音声認識する。

請求項９に係る音声認識プログラムは、音声入力された単語を、記憶手段に格納した限定された個数の開始確認語と照合して、文認識の開始確認語が音声入力されたか否か判断する開始確認語認識手順と、音声入力された単語を、記憶手段に格納した限定された個数の終了確認語と照合して、前記開始確認語の音声入力後に文認識の終了確認語が音声入力されたか否か判断する終了確認語認識手順と、前記開始確認語認識手順及び終了確認語認識手順で前記開始確認語及び前記終了確認語が音声入力されたと判断したとき、前記開始確認語と前記終了確認語との間の中間文を音声認識する文認識手順とをコンピュータに実行させ、前記開始確認語、終了確認語及び中間文として、一連の文として発話される開始確認語、終了確認語及び中間文のセットを用意すると共に、前記中間文として複数の定形文を定形文辞書に格納し、前記文認識手順で音声認識された中間文を、前記定形文辞書に格納された定形文の各々とパターンマッチングし、前記中間文に対応する定形文を出力する文変換手順をコンピュータに実行させ、前記開始確認語として、前記記憶手段としての単語辞書に格納した限定された個数の順接、説明、転換等の接続語を使用し、前記終了確認語として、前記単語辞書に格納した限定された個数の付加疑問文の末尾語または助動詞を使用し、前記文変換手順は、発話者が発話する口語文に対応するよう、前記開始確認語、中間文及び終了確認語を組み合わせて前記セットを構成し、更に、発話者の発話をモニターすると共に、発話中に発話者が発話する複数の文に対し、前記文認識手順で文認識した中間文に対応する定形文のみを出力する手順をコンピュータに実行させる。

請求項１０に係る音声認識プログラムは、一方の対話者が他方の対話者に所定内容の情報を提示して確認するための確認文を音声認識するための音声認識プログラムであって、前記一方の対話者と他方の対話者との間の一連の対話を、音素モデル及び単語モデルを使用した音素認識及び単語認識により音声認識し、前記対話中の単語をモニターする単語認識手順と、前記単語認識手順でモニターした単語を、前記確認文の直前に付加されて一連の文を構成する接続語からなると共に記憶手段に格納した限定された個数の所定の開始確認語にパターンマッチングし、前記開始確認語が音声入力されたか否かを確認する開始確認語認識手順と、前記単語認識手順でモニターした単語を、前記確認文の直後に付加されて一連の文を構成する助動詞からなると共に記憶手段に格納した限定された個数の所定の終了確認語にパターンマッチングし、前記終了確認語が音声入力されたか否かを確認する終了確認語認識手順と、前記開始確認語が音声入力された後に前記終了確認語が音声入力されたときにのみ、前記開始確認語と前記終了確認語との間の中間文を音声認識する文認識手順とをコンピュータに実行させ、前記開始確認語、終了確認語及び中間文として、一連の文として発話される開始確認語、終了確認語及び中間文のセットを用意すると共に、前記中間文として複数の定形文を定形文辞書に格納し、前記文認識手順で音声認識された中間文を、前記定形文辞書に格納された定形文の各々とパターンマッチングし、前記中間文に対応する定形文を出力する文変換手順をコンピュータに実行させ、前記開始確認語として、前記記憶手段としての単語辞書に格納した限定された個数の順接、説明、転換等の接続語を使用し、前記終了確認語として、前記単語辞書に格納した限定された個数の付加疑問文の末尾語または助動詞を使用し、前記文変換手順は、前記中間文として、前記一方の対話者が前記他方の対話者に提示して確認するための文を、前記定形文辞書に前記定形文として格納して使用し、前記一方の対話者が前記他方の対話者との対話中に発話する前記文に対応する口語文に対応するよう、前記開始確認語、中間文及び終了確認語を組み合わせて前記セットを構成し、更に、前記一方の対話者と前記他方の対話者との対話をモニターすると共に、対話中に前記一方の対話者が発話する複数の文に対し、前記文認識手順で文認識した中間文に対応する定形文のみを出力する手順をコンピュータに実行させる。

本発明に係る音声認識プログラムは、定形文の入力作業を簡易化し、医療用カルテ等の作成に応用することができ、ＰＣの操作に不慣れな医師等の使用者にとっても使い勝手を良くして、医師等の入力作業の手間及び時間を大幅に削減することができる。

図１は本発明の一実施の形態に係る音声認識プログラムを実行するコンピュータの主要な機能実現手段を示す機能ブロック図である。図２は本発明の一実施の形態に係る音声認識プログラムの処理手順を示すフローチャートである。

ＳＴＥＰ７：開始確認語認識手順
ＳＴＥＰ８：終了確認語認識手順
ＳＴＥＰ９：中間文認識手順

以下、本発明を実施するための最良の形態（以下、実施の形態という）を説明する。図１は本発明の一実施の形態に係る音声認識プログラムを実行するコンピュータの主要な機能実現手段を示す機能ブロック図である。

本実施の形態の音声認識プログラムは、一方の対話者が他方の対話者に所定内容の情報を提示して確認するための確認文（定形文）を音声認識するための音声認識プログラムに具体化される。例えば、本実施の形態の音声認識プログラムは、一方の対話者としての医師が、他方の対話者としての外来患者や入院患者に、医療用カルテに記入する必要のある事項の内容を提示して確認するための確認文（定形文としてのカルテ記入文）を音声認識するための音声認識プログラムに具体化することができる。本実施の形態の音声認識プログラムは、図１に示すように、ＣＰＵ、ＲＯＭ、ＲＡＭ等の一般的な構成を備えるコンピュータ（ＰＣ、ＰＤＡ、オフコン等）からなる音声認識装置に一連の処理手順を実行させるものである。図１に示す音声認識装置は、接話マイクロホン、指向性マイクロホン等からなる音声入力手段１１により音声を電気信号に変換する。また、音声認識装置は、周波数分析手段１２及び特徴パラメータ抽出手段１３により、音声入力手段１１から入力された音声信号（音声波形）を、例えば、数ｍｓ〜十数ｍｓごとのフレームに分割し、それぞれのフレームについて高速フーリエ変換等によりスペクトルを計算すると共に、スペクトルを聴覚尺度に基づく音声パラメータに変換する一方、雑音除去を行なう。更に、音声認識装置は、音素認識手段１４により、音声パラメータの時系列を表現した音素モデル記憶手段２１中の音素モデルと入力音声を照合する。なお、音素モデルは、隠れマルコフモデル（ＨＭＭ）等を使用して多数のデータから学習される。

また、音声認識装置は、単語認識手段１５により、単語辞書２２から変換した単語モデル格納手段２３中の単語モデルと音素認識結果とを照合し、両者の一致度を計算する。即ち、単語認識手段１５は、予め登録してある単語モデルと、入力された音声データとを比較して、入力音声データがどの登録単語に一番似ているかを計算し、一番似ているものを認識結果として出力する（パターンマッチング）。なお、単語モデルとしては、単語中の母音の無声化、長音化、鼻音化、子音の口蓋化等、音素の変形を考慮したモデルが用意されると共に、各音素の発声タイミングの変動については、動的計画法の原理を用いた照合法（ＤＰマッチング）等で対処される。また、単語認識手段１５は、限定された個数の単語（後述する定形文に含まれる単語）を格納した単語辞書２２を使用し、音素認識手段１４による音素認識結果に誤りがあっても、単語辞書２２の中からもっとも一致度の高い単語を選択することで、単語としての認識率を向上する。このように、音声認識プログラムは、周波数分析手段１２、特徴パラメータ抽出手段１３、音素認識手段１４及び単語認識手段１５を使用して、一方の対話者と他方の対話者との間の一連の対話を、音素モデル及び単語モデルを使用した音素認識及び単語認識により音声認識し、前記対話中の単語をモニターする単語認識手順を実行する。

音声認識装置は、文認識手段１６により、単語認識結果から言語モデル格納手段２４中の言語モデルに合致する単語列を選出する。また、文認識手段１６は、入力単語列が所定の言語モデルに従って発声されているという限定を付与し、かかる文法により文としての認識率を向上する。一方、音声認識装置は、単語認識手段１５により認識された単語を確認語判定手段１０１に入力する。確認語判定手段１０１は、所定の対をなすキーワードとして、一対または複数対の開始確認語及び終了確認語を格納し、単語認識手段１５から入力された単語と、予め用意した前記開始確認語及び終了確認語とをパターンマッチングし、開始確認語または終了確認語が音声入力されたか否かを判断及び確認する。即ち、確認語判定手段１０１は、単語認識手段１５でモニターした単語を、確認文の直前に付加されて一連の文を構成する接続語からなる所定の開始確認語にパターンマッチングし、開始確認語が音声入力されたか否かを確認する開始確認語認識手順を実行すると共に、単語認識手順でモニターした単語を、確認文の直後に付加されて一連の文を構成する助動詞からなる所定の終了確認語にパターンマッチングし、終了確認語が音声入力されたか否かを確認する終了確認語認識手順を実行する。

確認語判定手段１０１は、開始確認語の音声入力を確認したとき、その結果を文認識開始終了指令手段１０２に出力し、これに基づき、文認識開始終了指令手段１０２は、文認識手段１６に対し、言語モデルによる文認識の開始を指令する。また、確認語判定手段１０１は、終了確認語の音声入力を確認したとき、その結果を文認識開始終了指令手段１０２に出力し、これに基づき、文認識開始終了指令手段１０２は、文認識手段１６に対し、言語モデルによる文認識の終了を指令する。そして、文認識手段１６は、文認識開始終了指令手段１０２からの指令があったときのみ機能を実現し、開始確認語が音声入力された後に前記終了確認語が音声入力されたときにのみ、前記開始確認語と前記終了確認語との間の中間文を音声認識する文認識手順を実行する。このとき、文認識手段は、また、指令手段は、開始確認語の直後に連続して終了確認語が発話された場合、即ち、中間文が存在しない場合は、指令せず、開始確認語の入力後、所定時間を経過した後に終了確認語の入力があったときのみ、指令を実行するよう構成することが好ましく、また、開始確認語の直後に終了確認語以外の単語の入力があり、その後、終了確認語の入力があったときに、はじめて、指令を実行するよう構成することが好ましい。なお、文認識手段１６は、音素モデル、単語モデル、言語モデルを使用した音素認識、単語認識、文認識からなる通常の音声認識により中間文を音声認識する。

ここで、開始確認語としては、「それでは・・・」といった接続語等（順接、説明、転換等）があり、「それでは」以外にも、例えば、「では」、「じゃあ」、「それなら」、「だから」、「ということで」、「すると」、「そうすると」、「そうしたら」、「結果」、「結局」、「つまり」、「とどのつまり」、「だから」、「よって」、「したがって」、「要するに」、「つまるところ」、「結論として」等を使用することができる。また、終了確認語としては、「・・・ですね」といった付加疑問文の末尾語（相手に同意を求める語）や助動詞等があり、「ですね」以外にも、「ますね」、「だよね」、「だな」、「でしょう」、「ですか」、「でしょうね」、「です」、「だ」、「である」等を使用することができる。そして、中間文の一例としては、医療用カルテの記載事項であるバイタルデータ、病状等を表現する文があり、例えば、「熱は３８度」、「血圧は上が１３０、下が９５」、「昨夜から頭が痛い」、「昨日から食欲がない」、「２日前から下痢気味」等の文がある。よって、開始確認語、中間文及び終了確認語からなる確認文は、例えば、「それでは熱は３８度ですね」、「それでは血圧は上が１３０、下が９５ですね」、「それでは昨夜から頭が痛い（ん）ですね」、「昨日から食欲がない（ん）ですね」、「２日前から下痢気味ですね」といった文になる。この場合、文認識手段１６は、確認文中の中間文のみ、即ち、「熱は３８℃」、「血圧は上が１３０、下が９５」、「昨夜から頭が痛い」、「昨日から食欲がない」、「２日前から下痢気味である」のみ音声認識して、文変換手段１０３に出力する。

音声認識装置は、文変換手段１０３により、文認識手段１６で音声認識された口語文からなる中間文を、定形文辞書１１１に格納された文語文からなる定形文とパターンマッチングし、前記中間文に対応する定形文を出力する文変換手順を実行する。なお、定形文辞書１１１に格納する定形文は、前記中間文に対応して、例えば、「熱は３８℃である。」、「血圧は上が１３０、下が９５である。」、「昨夜から頭が痛い。」、「昨日から食欲がない。」、「２日前から下痢気味である。」等の文語文とする。また、音声認識装置は、文変換手段１０３のパターンマッチングにより得られた定形文を、カルテ作成手段１０４に出力する。カルテ作成手段１０４は、カルテ用テンプレート１１２を呼び出して電子カルテ１１３（未記入）を作成すると共に、文変換手段１０３から入力された定形文を前記電子カルテ１１３の所定の記入欄に順次記入する手順を実行する。更に、音声認識装置は、カルテ作成手段１０４により、文変換手段１０３からの定形文をＰＣのモニタ等からなる画面表示装置１２１に出力し、画面表示装置１２１にその定形文を表示させる。更に、音声認識装置は、画面表示装置１２１にチェック手段１２２を接続し、画面表示装置１２１に表示された定形文を医師等のユーザが確認して、必要な場合は、チェック手段１２２により、入力した定形文の追加、削除、修正等の編集操作を実行できるようにしている。

次に、本実施の形態に係る音声認識プログラムの処理手順について説明する。図２は本発明の一実施の形態に係る音声認識プログラムの処理手順を示すフローチャートである。

図２に示すように、本実施の形態に係る音声認識プログラムでは、まず、起動処理が実行された後、ＳＴＥＰ１で初期化処理が実行され、カルテ作成手段１０４が、カルテ用テンプレート１１２を参照して、必要な形式の電子カルテ１１３を準備する。次に、ＳＴＥＰ２で、音声入力手段１１からの音声入力があったときは、ＳＴＥＰ３で、周波数分析手段１２が周波数分析処理を実行し、ＳＴＥＰ４で、特徴パラメータ抽出手段１３が音声パラメータの抽出処理を実行する。次に、ＳＴＥＰ５で、音素認識手段１４が、音素モデル２１を参照し、音声パラメータに基づき音素認識処理を実行し、ＳＴＥＰ６で、単語認識手段１５が、単語モデル２３を参照し、音素認識結果に基づき単語認識処理を実行する。次に、ＳＴＥＰ７で、単語認識手段１５からの入力単語に基づき、確認語判定手段１０１が、開始確認語が入力されたか否かを判断する。なお、ＳＴＥＰ７は、文認識の開始確認語が音声入力されたか否か判断する開始確認語認識手順を構成する。次に、ＳＴＥＰ７がＹＥＳの場合、ＳＴＥＰ８で、単語認識手段１５からの入力単語に基づき、確認語判定手段１０１が、終了確認語が入力されたか否かを判断する。なお、ＳＴＥＰ８は、開始確認語の音声入力後に文認識の終了確認語が音声入力されたか否か判断する終了確認語認識手順を構成する。そして、ＳＴＥＰ７で開始確認語の入力を確認し、かつ、ＳＴＥＰ８で終了確認語の入力を確認すると、ＳＴＥＰ９で、確認語判定手段１０１からの入力に基づき、文認識開始終了指令手段１０２が、文認識手段１６に対して文認識を指令し、この指令に基づき、文認識手段１６が中間文の認識処理を実行する。なお、このとき、文認識手段１６は、前記音素認識手順（ＳＴＥＰ５）及び単語認識手順（ＳＴＥＰ６）の認識結果を利用し、言語モデルを参照して中間文を音声認識する。なお、ＳＴＥＰ９は、開始確認語認識手順及び終了確認語認識手順で開始確認語及び終了確認語が音声入力されたと判断したとき、開始確認語と終了確認語との間（開始確認語の直後から終了確認語の直前まで）の中間文を音声認識する文認識手順を構成する。次に、ＳＴＥＰ１０で、文変換手段１０３が、文認識手段１６から入力された中間文を定形文辞書１１１の定形文と対比してパターンマッチング処理を実行し、中間文を対応する定形文（文語文）に変換する。次に、ＳＴＥＰ１１で、カルテ作成手段１０４が、文変換手段１０３から入力された定形文を、準備した電子カルテ１１３の所定の記入欄に記入し、電子カルテ（記入済）を作成する。なお、ＳＴＥＰ１１の後、カルテ作成手段１０４からの定形文が画面表示装置１２１に表示され、医師によるチェック手段１２２を利用した記入内容のチェックが可能となる。

このようにして、音声認識プログラムは、上記ＳＴＥＰ２〜ＳＴＥＰ１１を繰り返し、ＳＴＥＰ２〜ＳＴＥＰ６により、医師と患者との対話をモニターすると共に、ＳＴＥＰ７〜ＳＴＥＰ１１により、対話中に医師が発話する複数の確認文（確認開始後＋中間文＋終了確認語）中の中間文に対応する定形文のみを、電子カルテ１１３に順次記入して、電子カルテ１１３の作成を完了することができる。

なお、上記処理手順では、ＳＴＥＰ７で開始確認語を確認し、ＳＴＥＰ８で終了確認語を確認した後に、ＳＴＥＰ９で中間文認識を実行するようにしたが、ＳＴＥＰ７で開始確認語を確認した直後に、ＳＴＥＰ９の中間文認識を実行し、次のステップで終了確認語を確認した後に、ＳＴＥＰ９の中間文認識を終了するよう構成してもよい。また、ＳＴＥＰ１０の定形文選択の際に、中間文に対応する複数候補の定形文を選択し、画面表示装置１２１にリスト表示するよう構成してもよい。この場合、医師が、画面表示装置１２１に表示された複数の定形文を確認し、最も適当な定形文を選択して、電子カルテ１１３に記入するようにすることができる。

上記のように、本発明に係る音声認識プログラムによれば、医師が来院患者や入院患者に対して行う問診において、カルテ記入事項である定形文の入力作業を簡易化し、ＰＣの操作に不慣れな医師にとっても使い勝手を良くして、医師の入力作業の手間及び時間を大幅に削減することができる。また、本発明によれば、対話中の音声認識は、文認識の手前の段階の単語認識の段階までであり、開始確認語及び終了確認語の入力が確認されてはじめて、文認識（中間文である定形文の認識）が開始される。よって、音声認識の処理量を大幅に削減することができる。特に、中間文認識開始終了用の指令のためには、開始確認語及び終了確認語のみ用意すれば良いため、例えば、開始確認語及び終了確認語を「それでは」及び「ですね」とした場合、単語認識手段１５は、第一音素が「Ｓ」または「Ｄ」である単語のみを認識すればよく、音素認識手段１４の処理量を大幅に削減することができる。更に、単語辞書２２及び単語モデルも、定形文の範囲内の単語とすればよく、処理量を軽減できる。更に、言語モデルも、予め用意する必要のある定形文に含まれる範囲内の単語とすればよいため、やはり、処理量を大幅に軽減することができると共に、登録単語を少なくすることができるため、認識誤りの発生率を減少して認識率を大幅に向上することができる。また、一般的な連続音声認識では、人間は機械ではないために連続的にスムーズに発話しないことから、言い誤ったり、単語と単語の間で考え込んだり（言いよどみ）、無意識のうちに「の」を入れたりする等、種々の発話現象が発生する。一方、本発明では、確認文として、上記（「それでは・・・ですね」）のように、一連の文として発話されるような開始確認語、中間文、終了確認語のセットを用意することにより、連続文のうち確認文のみを文認識することで、上記言いよどみ等の発話現象による影響を防止することができる。

ところで、本発明では、医師等の発話者（権限者）と受話者（患者等）との一連の対話（問診等）中に、マイク等の音声入力手段１１から対話音声の波形信号（アナログ信号）を継続的に入力するが、このとき、発話者の音声パターンを予め入力して特定し、前記開始確認語、中間文、終了確認語の音声が発話者のものであると判断したときにのみ、上記処理を実行し、非権限者の発話は無視するよう構成することが好ましい。こうすると、権限者以外のものの発話を誤って入力することを防止することができる。

本発明に係る音声認識プログラムは、医療用カルテ自動作成用等、定形文を書類等に自動入力する場合の各種用途に適用できる。

Claims

音声入力された単語を、記憶手段に格納した限定された個数の開始確認語と照合して、文認識の開始確認語が音声入力されたか否か判断する開始確認語認識手順と、
音声入力された単語を、記憶手段に格納した限定された個数の終了確認語と照合して、前記開始確認語の音声入力後に文認識の終了確認語が音声入力されたか否か判断する終了確認語認識手順と、
前記開始確認語認識手順及び終了確認語認識手順で前記開始確認語及び前記終了確認語が音声入力されたと判断したとき、前記開始確認語と前記終了確認語との間の中間文を音声認識する文認識手順とをコンピュータに実行させ、
前記開始確認語、終了確認語及び中間文として、一連の文として発話される開始確認語、終了確認語及び中間文のセットを用意すると共に、前記中間文として複数の定形文を定形文辞書に格納し、前記文認識手順で音声認識された中間文を、前記定形文辞書に格納された定形文の各々とパターンマッチングし、前記中間文に対応する定形文を出力する文変換手順をコンピュータに実行させ、
前記文認識手順は、前記開始確認語認識手順及び前記終了確認語認識手順において前記対をなす開始確認語及び終了確認語を確認するまでは、音声認識は単語認識の段階までとし、前記対をなす開始確認語及び終了確認語のうちの当該開始確認語が音声入力された後に当該終了確認語が音声入力されたことを判断及び確認したときにのみ、前記文認識手順における当該開始確認語と当該終了確認語との間の中間文の文認識を実行する
ことを特徴とする音声認識プログラム。
一方の対話者が他方の対話者に所定内容の情報を提示して確認するための確認文を音声認識するための音声認識プログラムであって、
前記一方の対話者と他方の対話者との間の一連の対話を、音素モデル及び単語モデルを使用した音素認識及び単語認識により音声認識し、前記対話中の単語をモニターする単語認識手順と、
前記単語認識手順でモニターした単語を、前記確認文の直前に付加されて一連の文を構成する接続語からなると共に記憶手段に格納した限定された個数の所定の開始確認語にパターンマッチングし、前記開始確認語が音声入力されたか否かを確認する開始確認語認識手順と、
前記単語認識手順でモニターした単語を、前記確認文の直後に付加されて一連の文を構成する助動詞からなると共に記憶手段に格納した限定された個数の所定の終了確認語にパターンマッチングし、前記終了確認語が音声入力されたか否かを確認する終了確認語認識手順と、
前記開始確認語が音声入力された後に前記終了確認語が音声入力されたときにのみ、前記開始確認語と前記終了確認語との間の中間文を音声認識する文認識手順とをコンピュータに実行させ、
前記開始確認語、終了確認語及び中間文として、一連の文として発話される開始確認語、終了確認語及び中間文のセットを用意すると共に、前記中間文として複数の定形文を定形文辞書に格納し、前記文認識手順で音声認識された中間文を、前記定形文辞書に格納された定形文の各々とパターンマッチングし、前記中間文に対応する定形文を出力する文変換手順をコンピュータに実行させ、
前記文認識手順は、前記開始確認語認識手順及び前記終了確認語認識手順において前記対をなす開始確認語及び終了確認語を確認するまでは、音声認識は単語認識の段階までとし、前記対をなす開始確認語及び終了確認語のうちの当該開始確認語が音声入力された後に当該終了確認語が音声入力されたことを判断及び確認したときにのみ、前記文認識手順における当該開始確認語と当該終了確認語との間の中間文の文認識を実行する
ことを特徴とする音声認識プログラム。
前記文変換手順は、前記文認識手順で音声認識された口語文からなる中間文を、予め記憶手段に格納された文語文からなる定形文と対比し、前記中間文に対応する定形文に変換して出力することを特徴とする請求項１または２に記載の音声認識プログラム。
更に、前記文変換手順は、前記開始確認語と終了確認語との間に前記中間文が存在しない場合は実行されず、前記開始確認語の直後に前記終了確認語以外の単語の入力があり、その後、前記終了確認語の入力があったときにのみ実行されることを特徴とする請求項１乃至３のいずれか１項記載の音声認識プログラム。
前記開始確認語として、前記記憶手段としての単語辞書に格納した限定された個数の順接、説明、転換等の接続語を使用し、
前記終了確認語として、前記単語辞書に格納した限定された個数の付加疑問文の末尾語または助動詞を使用し、
前記中間文として、前記一方の対話者としての医師が前記他方の対話者としての患者に提示して確認するための医療用カルテの記入文を、前記定形文辞書に前記定形文として格納して使用し、
医師が患者との対話中に発話する前記医療用カルテの記入文に対応する口語文に対応するよう、前記開始確認語、中間文及び終了確認語を組み合わせて前記セットを構成し、
更に、医師と患者との対話をモニターすると共に、対話中に医師が発話する複数の文に対し、前記文認識手順で文認識した中間文に対応する定形文のみを電子カルテに順次記入する手順をコンピュータに実行させることを特徴とする請求項２記載の音声認識プログラム。
更に、前記文認識手順において、音声認識された中間文を前記定形文辞書に格納された定形文の各々とパターンマッチングしたとき、当該中間文に対応して複数候補の定形文が存在する場合、それら複数候補の定形文をリスト表示する手順と、
前記リスト表示された複数候補の定形文を医師自身に確認させて最も適当な定形文を選択させ、当該選択された最も適当な定形文を前記電子カルテに記入する手順とをコンピュータに実行させることを特徴とする請求項５記載の音声認識プログラム。
前記文変換手順は、発話される複数の文に対し、前記文認識手順で文認識した中間文に対応する定形文のみを順次出力することを特徴とする請求項１または２記載の音声認識プログラム。
前記文認識手順は、前記単語認識手順の認識結果を利用すると共に、前記定型文辞書に格納した定型文に含まれる限定された個数の単語に基づき作成した言語モデルを参照して、前記中間文を音声認識することを特徴とする請求項１または２記載の音声認識プログラム。
音声入力された単語を、記憶手段に格納した限定された個数の開始確認語と照合して、文認識の開始確認語が音声入力されたか否か判断する開始確認語認識手順と、
音声入力された単語を、記憶手段に格納した限定された個数の終了確認語と照合して、前記開始確認語の音声入力後に文認識の終了確認語が音声入力されたか否か判断する終了確認語認識手順と、
前記開始確認語認識手順及び終了確認語認識手順で前記開始確認語及び前記終了確認語が音声入力されたと判断したとき、前記開始確認語と前記終了確認語との間の中間文を音声認識する文認識手順とをコンピュータに実行させ、
前記開始確認語、終了確認語及び中間文として、一連の文として発話される開始確認語、終了確認語及び中間文のセットを用意すると共に、前記中間文として複数の定形文を定形文辞書に格納し、前記文認識手順で音声認識された中間文を、前記定形文辞書に格納された定形文の各々とパターンマッチングし、前記中間文に対応する定形文を出力する文変換手順をコンピュータに実行させ、
前記開始確認語として、前記記憶手段としての単語辞書に格納した限定された個数の順接、説明、転換等の接続語を使用し、
前記終了確認語として、前記単語辞書に格納した限定された個数の付加疑問文の末尾語または助動詞を使用し、
前記文変換手順は、
発話者が発話する口語文に対応するよう、前記開始確認語、中間文及び終了確認語を組み合わせて前記セットを構成し、
更に、発話者の発話をモニターすると共に、発話中に発話者が発話する複数の文に対し、前記文認識手順で文認識した中間文に対応する定形文のみを出力する手順をコンピュータに実行させることを特徴とする音声認識プログラム。
一方の対話者が他方の対話者に所定内容の情報を提示して確認するための確認文を音声認識するための音声認識プログラムであって、
前記一方の対話者と他方の対話者との間の一連の対話を、音素モデル及び単語モデルを使用した音素認識及び単語認識により音声認識し、前記対話中の単語をモニターする単語認識手順と、
前記単語認識手順でモニターした単語を、前記確認文の直前に付加されて一連の文を構成する接続語からなると共に記憶手段に格納した限定された個数の所定の開始確認語にパターンマッチングし、前記開始確認語が音声入力されたか否かを確認する開始確認語認識手順と、
前記単語認識手順でモニターした単語を、前記確認文の直後に付加されて一連の文を構成する助動詞からなると共に記憶手段に格納した限定された個数の所定の終了確認語にパターンマッチングし、前記終了確認語が音声入力されたか否かを確認する終了確認語認識手順と、
前記開始確認語が音声入力された後に前記終了確認語が音声入力されたときにのみ、前記開始確認語と前記終了確認語との間の中間文を音声認識する文認識手順とをコンピュータに実行させ、
前記開始確認語、終了確認語及び中間文として、一連の文として発話される開始確認語、終了確認語及び中間文のセットを用意すると共に、前記中間文として複数の定形文を定形文辞書に格納し、前記文認識手順で音声認識された中間文を、前記定形文辞書に格納された定形文の各々とパターンマッチングし、前記中間文に対応する定形文を出力する文変換手順をコンピュータに実行させ、
前記開始確認語として、前記記憶手段としての単語辞書に格納した限定された個数の順接、説明、転換等の接続語を使用し、
前記終了確認語として、前記単語辞書に格納した限定された個数の付加疑問文の末尾語または助動詞を使用し、
前記文変換手順は、
前記中間文として、前記一方の対話者が前記他方の対話者に提示して確認するための文を、前記定形文辞書に前記定形文として格納して使用し、
前記一方の対話者が前記他方の対話者との対話中に発話する前記文に対応する口語文に対応するよう、前記開始確認語、中間文及び終了確認語を組み合わせて前記セットを構成し、
更に、前記一方の対話者と前記他方の対話者との対話をモニターすると共に、対話中に前記一方の対話者が発話する複数の文に対し、前記文認識手順で文認識した中間文に対応する定形文のみを出力する手順をコンピュータに実行させることを特徴とする音声認識プログラム。