JPH0415960B2 - - Google Patents

Info

Publication number
JPH0415960B2
JPH0415960B2 JP57039013A JP3901382A JPH0415960B2 JP H0415960 B2 JPH0415960 B2 JP H0415960B2 JP 57039013 A JP57039013 A JP 57039013A JP 3901382 A JP3901382 A JP 3901382A JP H0415960 B2 JPH0415960 B2 JP H0415960B2
Authority
JP
Japan
Prior art keywords
section
standard pattern
dictionary
pattern
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP57039013A
Other languages
Japanese (ja)
Other versions
JPS58156998A (en
Inventor
Kazunaga Yoshida
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP57039013A priority Critical patent/JPS58156998A/en
Publication of JPS58156998A publication Critical patent/JPS58156998A/en
Publication of JPH0415960B2 publication Critical patent/JPH0415960B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 本発明は情報入力装置、特に音韻単位に発声さ
れた音声や手書き文字などのように人間により発
生された情報を、機械に入力する情報入力装置に
関するものである。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to an information input device, and particularly to an information input device for inputting information generated by a human, such as speech uttered in phoneme units or handwritten characters, into a machine.

本発明による情報入力装置は入力される情報が
音声でも手書き文字でも適用可能である。しかし
以後の説明においては分かりやすくするために音
声による入力の場合についてのみ述べる。またこ
こで言う入力情報の単位は、以後の説明において
は「あ」「い」「う」「え」「お」などの日本語の単
音節とする。
The information input device according to the present invention can be applied whether the input information is voice or handwritten characters. However, in the following explanation, only the case of voice input will be described for the sake of clarity. Furthermore, in the following explanation, the units of input information referred to here are Japanese monosyllables such as "a", "i", "u", "e", and "o".

従来、単音節単位に区切つて発声された音声を
認識する音声入力装置はすでに存在する。この一
つの例としてあらかじめ発声された単音節を標準
パタンとして登録しておき、入力された単音節と
の間のパタンマツチングにより認識を行なう方法
が提案されている。このような登録型の音声入力
装置においては標準パタンの選択が重要である。
登録時に不適当に発声された場合や、登録時から
時間がたつて実際の発声と標準パタンとが異なつ
てしまう場合がある。この影響を除くためには、
入力された最新の音声をもとにした標準パタンの
自動学習が有効である。認識誤りが生じた場合、
利用者が必ず訂正するようにすれば入力された音
声パタンをもとに標準パタンを更新することがで
きる。しかし、特に単音節の場合は利用者が誤り
を見のがすおそれがあるため、このように更新す
ることは誤つた音声パタンを標準パタンとしてし
まう可能性がある。
2. Description of the Related Art Conventionally, there are already speech input devices that recognize speech uttered in units of monosyllables. As an example of this, a method has been proposed in which uttered monosyllables are registered in advance as standard patterns, and recognition is performed by pattern matching between the uttered monosyllables and the input monosyllables. In such a registration type voice input device, selection of a standard pattern is important.
There are cases where the utterance is inappropriately uttered at the time of registration, or where the actual utterance differs from the standard pattern as time passes from the time of registration. To eliminate this effect,
Automatic learning of standard patterns based on the latest input audio is effective. If a recognition error occurs,
If the user always makes corrections, the standard pattern can be updated based on the input voice pattern. However, especially in the case of monosyllables, there is a risk that the user may overlook the error, so updating in this way may result in the incorrect speech pattern becoming the standard pattern.

本発明の目的は利用者がたとえば音声の場合、
単音節単位の訂正を行なわなくても標準パタンを
正しく、新しい音声パタンをもとに更新できるよ
うな情報入力装置を提供することにある。
The purpose of the present invention is to
To provide an information input device that can correctly update a standard pattern based on a new speech pattern without making corrections on a monosyllable basis.

本発明は入力された音声・手書き文字などの情
報をある定められた単位毎にあらかじめ登録され
た標準パタンをもとに認識し認識結果を出力する
認識部と、前記定められた単位の列として単語が
記憶されている単語辞書部と、前記辞書部の内容
と前記認識結果をマツチングし単語認識結果を得
る辞書マツチング部と、前記単語認識結果より前
記定められた単位毎の認識結果の正誤を判断しこ
の判断結果をもとに前記標準パタンの更新を指示
する更新指示部とを含んで構成される。
The present invention includes a recognition unit that recognizes input information such as voice and handwritten characters based on a standard pattern registered in advance for each predetermined unit, and outputs a recognition result, and a word dictionary section in which words are stored; a dictionary matching section that matches the contents of the dictionary section with the recognition results to obtain word recognition results; and a dictionary matching section that matches the contents of the dictionary section with the recognition results to obtain word recognition results; and an update instruction section that makes a judgment and instructs updating of the standard pattern based on the judgment result.

以下具体的な一実施例に基づいて本発明を詳細
に説明する。第1図は本発明の一実施例のブロツ
ク構成図である。図に於いて1はマイクロフオ
ン、2は分析部、3は認識部としての音声マツチ
ング部、4は標準パタンメモリ部、5は辞書マツ
チング部、6は単語辞書部、7は更新指示部であ
る。マイクロフオン1より入力された単音節は分
析部2において分析され音声パタンPとして出力
される。同時に音声パタンPは分析部2に保持さ
れる。音声パタンPは音声マツチング部3におい
て標準パタンメモリ部4の中に記憶されている標
準パタンRとマツチングされる。単音節単位の認
識結果Mは確からしさの順に上記数位の結果が確
からしさの値すなわち類似度とともに出力され
る。通常単音節の認識結果は上位3位程度の中に
99%以上正しい結果がはいるので出力される結果
はこの程度の数でよい。
The present invention will be described in detail below based on a specific example. FIG. 1 is a block diagram of an embodiment of the present invention. In the figure, 1 is a microphone, 2 is an analysis section, 3 is a voice matching section as a recognition section, 4 is a standard pattern memory section, 5 is a dictionary matching section, 6 is a word dictionary section, and 7 is an update instruction section. . A monosyllable inputted from the microphone 1 is analyzed by the analysis section 2 and outputted as a speech pattern P. At the same time, the voice pattern P is held in the analysis section 2. The audio pattern P is matched with the standard pattern R stored in the standard pattern memory section 4 in the audio matching section 3. As for the recognition results M in units of monosyllables, the results of the above-mentioned numbers are outputted in order of likelihood together with the likelihood value, that is, the degree of similarity. The recognition results for monosyllables are usually in the top 3.
Since more than 99% of the results are correct, this number of results is sufficient.

辞書マツチング部5では前記認識結果Mと単語
辞書部6の内容をマツチングして単語認識結果W
を出力する。ここで言う単語とは通常の単語に限
らずいくつかの単音節の連続という意味であり、
フレーズ等も含むものである。辞書マツチング部
5に1単語分の単音節の認識結果が入力される
と、まず単語辞書部6の中の単語のうち文字数の
一致するものを選択し読み出す。認識結果の単音
節列と単語辞書内の単語の単音節列とを比較し、
一致した単音節における類似度の合計をその単語
の類似度とする。この類似度が最大となる単語を
単語認識結果とする。
The dictionary matching section 5 matches the recognition result M with the contents of the word dictionary section 6 to obtain a word recognition result W.
Output. A word here means not only a normal word but also a series of several monosyllables.
It also includes phrases and the like. When the recognition result of one word of monosyllables is input to the dictionary matching section 5, first, among the words in the word dictionary section 6, the word with the matching number of characters is selected and read out. Compare the monosyllabic string of recognition results with the monosyllabic string of words in the word dictionary,
The sum of the degrees of similarity among the matched single syllables is taken as the degree of similarity of that word. The word with the highest degree of similarity is taken as the word recognition result.

たとえば、音声で「か・な・が・わ」と入力し
た場合のそれぞれの単音節の認識結果と類似度の
関係の一例を第2図に示す。類似度は大きいほう
がより近いとする。この場合、単語「かながわ」
と「かなざわ」と類似度は前者が80+50+80+80
=290後者は80+50+10+80=220であるため、類
似度のより大きい「かながわ」が認識結果とな
る。
For example, FIG. 2 shows an example of the relationship between the recognition results of each monosyllable and the degree of similarity when "ka-na-ga-wa" is input by voice. It is assumed that the larger the degree of similarity, the closer. In this case, the word "Kanagawa"
and "Kanazawa", the former has a similarity of 80 + 50 + 80 + 80
= 290 Since the latter is 80 + 50 + 10 + 80 = 220, the recognition result is "Kanagawa", which has a higher degree of similarity.

この例によると2番目の「な」が「ま」に誤つ
ていることを検出することができる。辞書マツチ
ング5からのこのような結果信号DRをもとに、
更新指示部7より標準パタンメモリ部4内の標準
パタンを更新する指示信号Cを出力する。すなわ
ち、すでに標準パタンメモリ部4の内にある
「な」の標準パタンのかわりに、今回入力され、
分析部2に保持されている音声パタンPのうちの
「な」のパタンを標準パタンとして標準パタンメ
モリ部4で保持する。
According to this example, it is possible to detect that the second "na" is incorrectly translated into "ma". Based on the result signal DR from dictionary matching 5,
The update instruction section 7 outputs an instruction signal C for updating the standard pattern in the standard pattern memory section 4. That is, instead of the standard pattern "na" which is already in the standard pattern memory section 4, the pattern input this time is
Among the voice patterns P held in the analysis section 2, the pattern of "na" is held as a standard pattern in the standard pattern memory section 4.

標準パタンの更新方法としては上記の方法の他
にもいくつかの方法が考えられる。たとえば、各
単音節の標準パタンごとにカウンタを設ける。辞
書とのマツチングにより単音節の認識誤りが検出
された場合、誤認識した標準パタンの前記カウン
タをカウントアツプする。標準パタンごとの誤認
識の数がある定められた回数以上になつた時、こ
の標準パタンを新しいパタンにより更新するとい
う方法がある。標準パタンの更新は新しいパタン
と入れかえる方法の他に、入力されたパタンと標
準パタンとの平均をとることにより新たに標準パ
タンを作成する方法も考えられる。
In addition to the above methods, several other methods can be considered for updating the standard pattern. For example, a counter is provided for each standard pattern of each monosyllable. When a recognition error of a single syllable is detected by matching with a dictionary, the counter of the erroneously recognized standard pattern is counted up. There is a method of updating this standard pattern with a new pattern when the number of misrecognitions for each standard pattern exceeds a predetermined number of times. In addition to the method of updating the standard pattern by replacing it with a new pattern, it is also possible to create a new standard pattern by taking the average of the input pattern and the standard pattern.

このように、以上述べてきた実施例は説明の便
宜上選択したほんの一例であつて本発明はこの実
施例のみに限定されるものではない。入力された
単音節列と辞書とのマツチング方法も他のさまざ
まな方法が考えられる。
As described above, the embodiments described above are only examples selected for convenience of explanation, and the present invention is not limited to these embodiments. Various other methods can be considered for matching the input monosyllable string with the dictionary.

最初に述べたように本発明は手書き文字入力に
も適用できる。この場合単音節のかわりに1つの
文字を単位とすればよい。オンライン手書き文字
認識等は標準パタンとのパタンマツチング法も有
効であると考えられるので本発明を適用すること
ができる。
As mentioned at the beginning, the present invention can also be applied to handwritten character input. In this case, one character may be used as a unit instead of a single syllable. The present invention can be applied to online handwritten character recognition, etc., since a pattern matching method with a standard pattern is considered to be effective.

本発明によると、音声や文字の認識において、
定められた単位の標準パタンを正しいパタンに更
新できる、情報入力装置が得られる。
According to the present invention, in speech and character recognition,
An information input device capable of updating a standard pattern of a predetermined unit to a correct pattern is obtained.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例のブロツク構成図、
第2図は単音節の認識結果と類似度の関係の一例
について示した図である。 図中、1……マイクロフオン、2……分析部、
3……音声マツチング部、4……標準パタンメモ
リ部、5……辞書マツチング部、6……単語辞書
部、7……更新指示部、である。
FIG. 1 is a block diagram of an embodiment of the present invention.
FIG. 2 is a diagram showing an example of the relationship between monosyllable recognition results and similarity. In the figure, 1... Microphone, 2... Analysis department,
3... Voice matching section, 4... Standard pattern memory section, 5... Dictionary matching section, 6... Word dictionary section, 7... Update instruction section.

Claims (1)

【特許請求の範囲】[Claims] 1 入力された音声・手書き文字などの情報をあ
る定められた単位毎にあらかじめ登録された標準
パタンをもとに認識し認識結果を出力する認識部
と、前記定められた単位の列として単語が記憶さ
れている単語辞書部と、前記辞書部の内容と前記
認識結果をマツチングし単語認識結果を得る辞書
マツチング部と、前記単語認識結果より前記定め
られた単位毎の認識結果の正誤を判断しこの判断
結果をもとに前記標準パタンの更新を指示する更
新指示部とを含むことを特徴とする情報入力装
置。
1. A recognition unit that recognizes input information such as voice and handwritten characters based on standard patterns registered in advance for each predetermined unit and outputs the recognition result, and a stored word dictionary section; a dictionary matching section that matches the contents of the dictionary section with the recognition result to obtain a word recognition result; An information input device comprising: an update instruction section that instructs updating of the standard pattern based on the determination result.
JP57039013A 1982-03-12 1982-03-12 Information input unit Granted JPS58156998A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57039013A JPS58156998A (en) 1982-03-12 1982-03-12 Information input unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57039013A JPS58156998A (en) 1982-03-12 1982-03-12 Information input unit

Publications (2)

Publication Number Publication Date
JPS58156998A JPS58156998A (en) 1983-09-19
JPH0415960B2 true JPH0415960B2 (en) 1992-03-19

Family

ID=12541216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57039013A Granted JPS58156998A (en) 1982-03-12 1982-03-12 Information input unit

Country Status (1)

Country Link
JP (1) JPS58156998A (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0654503B2 (en) * 1983-11-16 1994-07-20 株式会社東芝 Pattern recognition device
JP2014149457A (en) * 2013-02-01 2014-08-21 Sharp Corp Voice recognition device, electronic apparatus, and control program of voice recognition device

Also Published As

Publication number Publication date
JPS58156998A (en) 1983-09-19

Similar Documents

Publication Publication Date Title
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
US6732074B1 (en) Device for speech recognition with dictionary updating
WO1994016437A1 (en) Speech recognition system
JPH06110494A (en) Pronounciation learning device
JPH0261700A (en) voice recognition device
EP0987681B1 (en) Speech recognition method and apparatus
JPH0415960B2 (en)
JP2001188556A (en) Voice recognition method and apparatus
JP2528105B2 (en) Voice recognition device
JPH0736481A (en) Interpolation speech recognition device
JPH0540853A (en) Post-processing system for character recognizing result
JPS6180298A (en) voice recognition device
JPS62147492A (en) Correction of reference parameter for voice recognition equipment
JPS63153596A (en) Voice sentence input device
JPS60182499A (en) voice recognition device
JPS63153595A (en) Voice sentence input device
JPH0160159B2 (en)
JPS62166399A (en) Voice recognition
JPS61279925A (en) Interactive input device
JPS6134599A (en) Pattern recognition system
JPS63173098A (en) Voice recognition equipment
JPS62218997A (en) Word voice recognition equipment
JPS6167898A (en) Pattern creation method
JPH0458634B2 (en)
JPH0711760B2 (en) Method for correcting standard parameters in voice recognition device