JPH0367890A - Voice control device of crane - Google Patents
Voice control device of craneInfo
- Publication number
- JPH0367890A JPH0367890A JP1200783A JP20078389A JPH0367890A JP H0367890 A JPH0367890 A JP H0367890A JP 1200783 A JP1200783 A JP 1200783A JP 20078389 A JP20078389 A JP 20078389A JP H0367890 A JPH0367890 A JP H0367890A
- Authority
- JP
- Japan
- Prior art keywords
- standard
- standard pattern
- pattern
- crane
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は操作者が発する指令語によりクレーンを遠隔操
作するクレーン音声制御装置に関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a crane voice control device for remotely controlling a crane using command words issued by an operator.
近年、クレーン設備においては、運転作業の合理化及び
省力化を図る為に、音声認識装置を用いたクレーン音声
制御装置が各種開発されている。In recent years, various types of crane voice control devices using voice recognition devices have been developed in order to rationalize and save labor in crane equipment operations.
これは例えば特開昭61−267689号公報等に開示
されているように、操作者はマイクロフォン付きの移動
無線機を携帯し、操作者によって発声される指令語が音
声系無線装置を介して音声認識装置に伝送される。音声
認識装置には予め操作者により複数種類の指令語の音声
の標準パターンが登録してあり、これらと運転時に操作
者が発した指令語の音声の特徴パターンとが11((合
され該当する標準パターンが認識される。標準パターン
により指令語が認識されると、この指令内容に応した信
号がクレーン制御装置へ出力され、該クレーン制御装置
によりクレーンの駆動部が制御され、指令内容に応した
運転動作が行われるように構成されている。For example, as disclosed in Japanese Unexamined Patent Application Publication No. 61-267689, an operator carries a mobile radio equipped with a microphone, and the command words uttered by the operator are transmitted to the voice via an audio radio device. transmitted to a recognition device. In the voice recognition device, the standard voice patterns of multiple types of command words are registered in advance by the operator, and these and the characteristic patterns of the voice of the command words uttered by the operator during driving are combined into 11 ((combined) The standard pattern is recognized. When the command word is recognized by the standard pattern, a signal corresponding to the command content is output to the crane control device, which controls the crane drive unit and responds to the command content. The vehicle is configured to perform a specific driving operation.
ところで、上述の如き装置において、最も重要なのは音
声認識装置による指令語の認識能力である。これは多く
の場合、使用環境が高騒音下にあることから、確実に指
令者が発する指令語を誤ることなく認識する必要がある
。−に記装置にあっては一度認識した指令語を操作者に
アンサーバツクする機能が付与してあり、操作者はこれ
を確認した上で実際に駆動を開始させる指令語を発する
のであるが、ここで音声認識装置の認識条件を騒音等に
よる誤認を防止すべく、非常に厳密に設定しておくと、
操作者の微妙な発声の違いによって該当する指令語が登
録されていないとリジェクト判定され、動作を開始でき
ないという問題が発生ずる。そこで逆に認識条件を比較
的大まかに設定すると、音声認識装置は指令語を誤認し
易くなり、合致する指令語がアンサーバンクされるまで
操作者は指令を繰り返す必要があったり、また、その誤
認によるアンサーバンクを聞ぎ逃したり、聞き間違えた
りして動作を開始させた場合には、意図しない運転動作
が行われてしまうという問題もある。By the way, in the above-mentioned devices, the most important thing is the command word recognition ability of the voice recognition device. Since the environment in which the device is used is often high noise, it is necessary to reliably recognize the command word uttered by the commander without making a mistake. - The device mentioned above has a function of answering the command word once recognized to the operator, and after confirming this, the operator issues the command word to actually start the drive. If you set the recognition conditions of the speech recognition device very strictly to prevent misidentification due to noise, etc.
Due to subtle differences in the operator's utterances, if the corresponding command word is not registered, it is determined to be rejected, causing a problem that the operation cannot be started. On the other hand, if the recognition conditions are set relatively roughly, the voice recognition device is likely to misrecognize the command word, and the operator may have to repeat the command until a matching command word is answered. If you miss or mishear the answer bank and start the operation, there is also the problem that an unintended driving operation will be performed.
この為、従来装置にあっては、リジェクトの多発及び誤
動作の発止を招き、安全性及び操作性が低く、実用化が
妨げられていた。For this reason, the conventional device suffers from frequent rejections and malfunctions, has low safety and operability, and is hindered from being put to practical use.
また、誤動作を防止する策としては、クレーンの運転動
作による規則性を利用することが有効と考えられる。こ
れに関して前記特開昭61−267689号公報に少し
記載されてはいるものの、具体的な記載に乏しく、明確
化されていない。Furthermore, as a measure to prevent malfunctions, it is considered effective to utilize the regularity of crane operation. Although there is some description regarding this in the above-mentioned Japanese Patent Application Laid-open No. 61-267689, it lacks specific description and is not clarified.
本発明は斯かる事情に鑑みてなされたものであり、音声
認識装置の認識条件に標準バクーンとの相違度による判
定基準を設け、またクレーン運転規則による指令順序に
火づいて誤認される指令語を検出することによりリジェ
クト率及び誤認率を低下せしめ、実用性に優れたクレー
ン音声制御装置の提供を目的とする。The present invention has been made in view of the above circumstances, and it sets a judgment criterion based on the degree of difference from the standard Bakun in the recognition conditions of the voice recognition device, and also prevents command words that are misrecognized due to the order of commands according to crane operation rules. The purpose of this invention is to provide a highly practical crane voice control device that reduces the rejection rate and misidentification rate by detecting the following.
rI!!!を解決するための手段〕
本発明に係るクレーン音声制御装置は、予め特定話者に
より登録してある複数の指令語の音声の標準パターンと
、入力される特徴パターンとを照合して一致する標準パ
ターンを認識し、この標準パターンに対応する信号をク
レーン制御部へ出力する音声認識装置をDihえるクレ
ーン音声制御装置において、各指令語について標準パタ
ーンを多重登録する登録手段と、入力された信号の特徴
パターンと、前記登録手段にて登録してある各指令語の
標準パターンの相違度を各別に算出する相違度算出手段
と、前記登録手段に登録されている標i(Lパターンの
中から、前記相違度算出手段にて算出された相違度が1
番低い第1の標準パターン及び2番目に低い第2の標準
パターンを選択する選択手段と、該選択手段にて選択さ
れた第1及び第2の標準パターンに対応する指令語を比
較する比1咬手段と、第1.第2の標準パターンの指令
語が等しい場合、第1の標準パターンの相違度が第1貼
準値より小さいとき、前記第1の標準パターンを一致す
るものとして認識する第1認識手段と、第1、第2の標
準パターンの指令語が異なる場合、第1の標準パターン
の相違度が前記第1jJiyp値よりも低い第2&準値
より小さく、かつ第1及び第2の標準パターンの相違度
の差が前記第2ii4B植よりも低い第3基準値より大
きいとき、前記第1の標準パターンを一致するものとし
て認識する第2認識手段とを具備することを第1発明の
特徴とし、また、以前に認識し、対応する信号が出力さ
れた標準パターンを記憶する記憶手段と、該記憶手段に
記憶された標準パターンから次に認識される標準パター
ンを、所定の運転規則による指令順序に基づいて推定す
る推定手段と、該推定手段にて推定された標準パターン
以外の標準パターンが次に認識された場合、対応する前
記クレーン制御部への信号の出力を拒否する手段とを具
備すること第2発明の特徴とする。rI! ! ! [Means for Solving the Problems] The crane voice control device according to the present invention compares the input characteristic pattern with a standard pattern of voice of a plurality of command words registered in advance by a specific speaker, and determines a standard pattern that matches. In a crane voice control device equipped with a voice recognition device that recognizes a pattern and outputs a signal corresponding to the standard pattern to the crane control section, the crane voice control device includes a registration means for multiple-registering standard patterns for each command word, and a registering means for multiple-registering standard patterns for each command word, and a registration means for multiple registering standard patterns for each command word. a dissimilarity calculation means for separately calculating the dissimilarity between the characteristic pattern and the standard pattern of each command word registered in the registration means; The degree of difference calculated by the degree of difference calculation means is 1.
A selection means for selecting the lowest first standard pattern and the second lowest standard pattern, and a ratio 1 for comparing the command words corresponding to the first and second standard patterns selected by the selection means. a biting means; a first recognition means that recognizes the first standard patterns as matching when the command words of the second standard patterns are equal and the degree of difference of the first standard patterns is smaller than the first standard value; 1. When the command words of the second standard patterns are different, the degree of difference of the first standard pattern is smaller than the second & quasi-value which is lower than the 1st jJiyp value, and the degree of difference of the first and second standard patterns is The first invention is characterized by comprising a second recognition means for recognizing the first standard pattern as a match when the difference is greater than a third reference value lower than the second ii4B pattern, and a storage means for storing a standard pattern that is recognized by the user and a corresponding signal is output; and a standard pattern to be recognized next from the standard pattern stored in the storage means is estimated based on a command order according to a predetermined driving rule. and means for refusing to output a signal to the corresponding crane control unit when a standard pattern other than the standard pattern estimated by the estimation means is next recognized. The characteristics of
第1の発明に係るクレーン音声制御装置は、予め特定話
者により各指令語について標準パターンが多重登録され
る。操作者が指令語を発声すると、この特徴パターンと
多重登録されている標準パターンの相違度が各別に算出
され、それらの相違度の中で1番低い相違度が算出され
た標準パターンと2番目に低い相違度が算出された標準
パターン、換言すれば特徴パターンとの類似度が1番高
いものと2番目に高い標準パターンが夫々選択され、そ
れらに対応する指令語が比較される。ここで指令語が等
しい場合、第1の標準パターンの相違度が第1基準値よ
り小さいとき、第1の標準パターンが操作者によって発
声された指令語の音声の肪敬パターンと一致するものと
して認識される。つまり、第1及び第2の標準パターン
が等しくとも、第■の標準パターンの相違度が第1基準
値より大きいときには一致する標準パターンがないとし
て拒否される。一方、第1及び第2の標準パターンに対
応する指令語が異なる場合でも、第1の標準パターンの
相違度が第1基IJ=値より低い第2基準値より小さく
、かつ第1及び第2の標準パターンの相違度の差が第2
基準値より低い第3基準値より大きいときには第1の標
準パターンが操作者によって発声された指令語の音声の
特徴パターンと一致するものとして認識される。In the crane voice control device according to the first invention, standard patterns are multiple-registered for each command word by a specific speaker in advance. When the operator utters a command word, the degree of difference between this characteristic pattern and the multiple registered standard pattern is calculated separately, and the standard pattern with the lowest degree of difference calculated among them and the second standard pattern are calculated. The standard patterns for which the lowest degree of dissimilarity has been calculated, in other words, the standard patterns with the highest and second highest degrees of similarity to the feature pattern are selected, respectively, and their corresponding command words are compared. Here, if the command words are equal, and the degree of difference of the first standard pattern is smaller than the first reference value, it is assumed that the first standard pattern matches the voice pattern of the command word uttered by the operator. Recognized. In other words, even if the first and second standard patterns are equal, if the degree of difference of the second standard pattern is greater than the first reference value, it is rejected as there is no matching standard pattern. On the other hand, even if the command words corresponding to the first and second standard patterns are different, the difference degree of the first standard pattern is smaller than the second reference value which is lower than the first base IJ= value, and the first and second The difference in the degree of dissimilarity between the standard patterns is the second
When the first standard pattern is greater than the third standard value, which is lower than the standard value, the first standard pattern is recognized as matching the voice characteristic pattern of the command word uttered by the operator.
第2の発明に係るクレーン音声制御装置は、以前に認識
され、対応する信号が出力された標準パターンが記憶さ
れ、この標準パターンから次に認識される標準パターン
が所定の運転規則による指令順序に基づいて推定される
。そして次に認識された標準パターンが推定された標準
パターン以外の場合、認識された表示パターンに対応す
る信号はクレーン制御部へ出力されない。In the crane voice control device according to the second invention, a standard pattern that has been previously recognized and a corresponding signal has been output is stored, and the standard pattern that is next recognized from this standard pattern is in a command order according to a predetermined operation rule. Estimated based on If the next recognized standard pattern is other than the estimated standard pattern, a signal corresponding to the recognized display pattern is not output to the crane control unit.
以下、本発明をその実施例を示す図面に基づき具体的に
説明する。第1図は本発明に係るクレン音声制御装置の
構成を示すブロツク図である。DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be specifically described below based on drawings showing embodiments thereof. FIG. 1 is a block diagram showing the configuration of a crane voice control device according to the present invention.
本実施例は、天井走行型クレーンへの適用例を示してあ
り、大別してヘソドセソト1を装備し、操作者に携帯さ
れる携帯型移動局23該携帯型移動局2と無線による信
号送受を行う地上設置装置A及び、該地上設置装置Aと
無線による信号送受を行うクレーン機上搭載装置Bとに
よって構成される。This embodiment shows an example of application to an overhead traveling crane, which is roughly divided into a mobile phone 1 equipped with a portable mobile station 23 carried by the operator, and transmits and receives signals by radio to the portable mobile station 2. It is composed of a ground-mounted device A and a crane-mounted device B that performs wireless signal transmission and reception with the ground-mounted device A.
ヘンドセソト1は音声入力マイクロフォン1aと、音声
応答用ヘソトフォン1bとを備え、操作者の頭部に着用
される。音声入力マイクロフォンlaに入力される操作
者の指令語は、携帯型移動局2から音声信号による無線
電波として発信され、地上設置装置Aの音声入力系アン
テナ3にて受信される。The handphone 1 includes a voice input microphone 1a and a voice response phone 1b, and is worn on the head of an operator. The operator's command input into the voice input microphone la is transmitted from the portable mobile station 2 as a radio wave in the form of a voice signal, and is received by the voice input system antenna 3 of the ground installation device A.
音声入力系アンテナ3は空中線結合器4及び音声入力固
定局5等と、音声系無線装置を構成し、音声入力系アン
テナ3にて受信された音声信号は空中線結合器4及び音
声入力固定局5を夫々介して音声認識装置6に伝送され
る。The audio input antenna 3 constitutes an audio wireless device together with the antenna coupler 4 and the audio input fixed station 5, and the audio signal received by the audio input antenna 3 is transmitted to the antenna coupler 4 and the audio input fixed station 5. are transmitted to the speech recognition device 6 via the respective channels.
音声認識装置6は例えば日本電気(11製DP−300
0等を使用することができ、各指令語の音声の標準パタ
ーンを複数種類(3種類以上)多重登録できるようにな
っており、操作者は予め各指令語を複数種類多重登録し
ておく。これはクレーン運転時に操作者が常に指令語を
登録した標準パターンと同一の音声パターンで発声でき
るとは限らないことに対処する為であり、このように同
一の指令語について同一の操作者による複数種類の標準
パターンを登録しておくことにより、特定の操作者によ
り発声される指令語を認識し易くするのである。The voice recognition device 6 is, for example, manufactured by NEC Corporation (DP-300 manufactured by 11).
0, etc. can be used, and multiple types (three or more types) of standard speech patterns for each command word can be multiple-registered, and the operator can multiple-register multiple types of each command word in advance. This is to deal with the fact that when operating a crane, the operator cannot always utter the same voice pattern as the standard pattern in which the command word has been registered. By registering standard patterns of different types, command words uttered by a specific operator can be easily recognized.
音声認識装置6は制御装置7と接続してあり、制御装置
7は音声認識装置6による後述する指令語の認識条件及
びクレーン運転規則に基づく指令順序を記憶しており、
これらを用いて最終的な指令語の認識を行うと共に、認
識された指令語に対応する動作を実際に行うか、否かを
判断する機能を有する。The voice recognition device 6 is connected to a control device 7, and the control device 7 stores a command order based on the command word recognition conditions and crane operation rules, which will be described later, by the voice recognition device 6.
It has the function of performing final command word recognition using these and determining whether or not to actually perform the action corresponding to the recognized command word.
制御装置7は無線地上局8と接続してあり、無線地上局
8は操作出力系アンテナ10を備える空中線結合器9と
接続してある。制御装置7にて最終的に認識され動作が
許可された指令語に対応する操作出力信号は操作出力系
アンテナ10から発信され、クレーン機上搭載装置Bの
無線機上局12に接続されたアンテナ11にて受信され
る。無線機上局12はシーケンサ13と接続してあり、
シーケンサ13は操作出力信号をディジタル信号として
入力し、動作条件及び動作時間のロジック処理を行い、
最終操作出力をクレーン制jB!14へ出力する。The control device 7 is connected to a radio ground station 8, and the radio ground station 8 is connected to an antenna coupler 9 equipped with a control output system antenna 10. The operation output signal corresponding to the command word that is finally recognized and permitted to operate by the control device 7 is transmitted from the operation output system antenna 10, and is transmitted from the antenna connected to the radio station 12 of the crane on-board device B. It is received at 11. The radio station 12 is connected to a sequencer 13,
The sequencer 13 inputs the operation output signal as a digital signal, performs logic processing on operating conditions and operating time,
Crane control the final operation output! Output to 14.
クレーン制御盤14は最終操作出力を入力して該当する
駆動部(図示せず)へ駆動信号を出力する。The crane control panel 14 inputs the final operation output and outputs a drive signal to a corresponding drive section (not shown).
また、制御装置7は操作出力信号を出力する一方、指令
語の採否結果、即ち運転動作を許可した場合はその指令
語を、拒否した場合はエラー等の用語を図示しない音声
合成装置にて音声信号として出力させ、これを前記空中
線結合器4及び音声入力系アンテナ3から発信して携帯
型移動局2に受信させ、ヘッドセソト1の音声応答用ヘ
ン1゛フオン1bより操作者にアンサハソクさセるdさ
て、以上のように構成された本発明装置において、まず
、音声認識装置6及び制御装置7による認識条件につい
て説明する。音声認識装置6には前述した如く各指令語
について複数の標準パターンが登録してあり、これらの
標準パターンと運転時に入力される指令語の音声の特徴
パターンとの照合は、周波数毎に振幅パターンを比較す
ることによって行う。ここで標準パターンと特徴パター
ンとが完全に一致する場合は、相違度(以下、スコア値
という)は零となり、異なる度合が大きい程スコア値は
高くなる。なお、この照合は類似度によって行うことも
勿論可能である。このように入力された特徴パターンに
対して標準パターン全てのスコア値を算出する・。そし
てスコア値が最2
も低い標準パターンと、2番目に低い標準パターンとを
選択する。さて、通常、これらの標準バタンに対応する
指令語(以下、第1候補用語、第2候補用語という)が
等しい場合は第1候補用語の標準パターンを認識し、ま
た異なる場合は認識不可能ということでリジェクトする
ことが考えられる。In addition, while the control device 7 outputs an operation output signal, the control device 7 outputs the result of acceptance or rejection of the command word, that is, if the driving operation is permitted, the command word is pronounced, and if the driving action is rejected, a term such as an error is voiced by a speech synthesizer (not shown). This is output as a signal, transmitted from the antenna coupler 4 and the audio input system antenna 3, received by the portable mobile station 2, and sent to the operator from the audio response phone 1b of the headset 1. Now, in the apparatus of the present invention configured as described above, the recognition conditions by the speech recognition device 6 and the control device 7 will be explained first. As mentioned above, the voice recognition device 6 has a plurality of standard patterns registered for each command word, and these standard patterns are compared with the voice characteristic pattern of the command word input during driving by using the amplitude pattern for each frequency. This is done by comparing. Here, when the standard pattern and the characteristic pattern completely match, the degree of difference (hereinafter referred to as a score value) is zero, and the greater the degree of difference, the higher the score value. Note that this comparison can of course be performed based on similarity. Calculate the score values of all standard patterns for the feature patterns input in this way. Then, the standard pattern with the 2 lowest score value and the standard pattern with the second lowest score value are selected. Now, normally, if the command words corresponding to these standard patterns (hereinafter referred to as the first candidate term and second candidate term) are the same, the standard pattern of the first candidate term is recognized, and if they are different, it is said that they are unrecognizable. This may lead to rejection.
ところが、これでは誤認率及びリジェクト率が非常に高
くなり、正常認識率(95%〉を確保するのが難しく、
音声制御装置の適用が不可能になる。However, with this, the false recognition rate and rejection rate are extremely high, and it is difficult to maintain a normal recognition rate (95%).
It becomes impossible to apply voice control devices.
そこで本発明装置にあっては認識条件を以下に示すよう
に定めた。Therefore, in the apparatus of the present invention, the recognition conditions are set as shown below.
(1)第1候補用語−第2候補用語の場合、第1候補用
語のスコア値<3.であれば第1候補用語を認識。(1) In the case of the first candidate term - the second candidate term, the score value of the first candidate term <3. If so, the first candidate term is recognized.
第1候補用語のスコア値≧S、であればりジェツト。If the score value of the first candidate term is ≧S, then it is a jet.
(2)第1候補用語≠第2候補用語の場合、第1候補用
語のスコア値〈S2かつ、第1候補用語のスコア値−第
2候補用語のスコア値〉S3であれば第1候補用語を認
識。(2) If the first candidate term ≠ the second candidate term, the score value of the first candidate term <S2 and the score value of the first candidate term - the score value of the second candidate term> S3, the first candidate term Recognize.
第1候補用語のスコア値≧32又は、第1候補用語のス
コア値−第2候補用語のスコア値≦33であればりジエ
クト。If the score value of the first candidate term≧32 or the score value of the first candidate term−the score value of the second candidate term≦33, then select.
但し、スコア値はS、>S2>S3とし、本実施例にお
いては、S、 =100.S2 =80. S3 =
5とした場合に良好な判定結果が得られた。However, the score value is S,>S2>S3, and in this example, S, =100. S2=80. S3 =
Good judgment results were obtained when the value was set to 5.
つまり、第1候補用語と第2候補用語とが等しい場合で
も、第1候補用詔のスコア値がS、以上と比較的高いと
きは、誤認する可能性が高い為、リジェクト判定をする
。また、第1候補用語と第2候補用語とが異なる場合で
も、第1候補用話のスコア値が32よりも低く、かつ第
1及び第2候補用語のスコア値の差が33よりも高いと
ぎは第1候補用詔である可能性が高いのでリジェクトす
ることなく、第1候補用語を認識するのである。That is, even if the first candidate term and the second candidate term are equal, if the score value of the edict for the first candidate is relatively high, such as S or more, there is a high possibility of misidentification, so a rejection determination is made. Furthermore, even if the first candidate term and the second candidate term are different, if the score value of the first candidate term is lower than 32 and the difference between the score value of the first and second candidate terms is higher than 33, then is likely to be an edict for the first candidate, so the first candidate term is recognized without being rejected.
さて、以上のようにして指令語が認識された場合、制御
装置7は次に認識された指令語がクレーン運転規則に基
づく所定の指令順序に則しているか判定する。Now, when the command word is recognized as described above, the control device 7 next determines whether the recognized command word conforms to a predetermined order of commands based on crane operation rules.
制御装置7は既に認識して対応する操作出力信号を発生
した指令語の標準パターンを記憶するようになしてあり
、次の標準パターンが認識された場合に、記憶してある
標準パターンの指令語から次の指令語集団を推定し、こ
の指令語集団内に、次に認識された標準パターンの指令
語が含まれているか否かの判定、即ち運転規則の合理性
チェフクを行う。ここで次に認識された標準パターンの
指令語が含まれている場合は、その指令語を最終認識指
令語として対応する操作出力信号を発生し、また含まれ
ていない場合は認識された標準バタンの指令語が誤認識
であったと判断して操作出力信号の発生を禁止すること
により、指令語の誤認を抑制して異常運転を防止する。The control device 7 is configured to store the standard pattern of the command word that has already been recognized and generated the corresponding operation output signal, and when the next standard pattern is recognized, the command word of the stored standard pattern is stored. The next group of command words is estimated from the group of command words, and it is determined whether the command word of the next recognized standard pattern is included in this group of command words, that is, the rationality of the driving rule is checked. If the command word of the next recognized standard pattern is included, that command word is used as the final recognized command word and a corresponding operation output signal is generated, and if the command word is not included, the standard pattern recognized By determining that the command word was misrecognized and prohibiting the generation of the operation output signal, misrecognition of the command word is suppressed and abnormal operation is prevented.
以下、第2図〜第4図に示す操作動作のタイミングチャ
ート図を用いて具体的に説明する。Hereinafter, a detailed explanation will be given using timing charts of operation operations shown in FIGS. 2 to 4.
第2図は単一操作の例を示してあり、まず第6図に示す
指令語群の方向指示用語集団の中から“ヒガシ”が発声
され、これが認識されることにより、クレーン制御盤1
4は実行運転の指令持ち状5
態に設定される。そして実行開始を指令する用語゛スタ
ート”が発声され、これが認識されると実行運転が開始
される。さて、この後、認識される指令語が指令順序に
則している場合は、運転が停止されることはないが、指
令順序に則さない指令語が誤認識されたり、又は認識不
可能な用語が入力されリジェクトされると実行運転は停
止される。FIG. 2 shows an example of a single operation. First, "Higashi" is uttered from the direction instruction word group of the command word group shown in FIG. 6, and when this is recognized, the crane control panel
4 is set to the command holding state of execution operation. Then, the word "start" that commands the start of execution is uttered, and when this is recognized, the execution operation begins.After this, if the recognized command word is in accordance with the command order, the operation will stop. However, if a command word that does not conform to the command order is erroneously recognized, or if an unrecognized word is input and rejected, the execution operation is stopped.
ここで運転規則の合理性チェフクはパヒガシ”“スター
ト”に対して行われ、この次の指令語で運転規則による
指令順序に反するのは、相反する方向指示用語、即ち西
行運転を指令する“ニジニジ”であり、これが認識され
たということは誤認と考えられる為、拒否される。一方
、“ニジニジ”以外の方向指示用語及び停止用語“トマ
ト”等が認識された場合は許可される。つまり、゛ヒガ
シ゛′“ニジニジ”以外の方向指示用語は複合操作され
る可能性もあるので許可され、運転中の方向と同一方向
の“ヒガシ”は“トマト”と同様にこの場合、運転停止
用語として許可される。Here, the rationality of the driving rules is checked for ``Pahigashi'' and ``Start'', and the next command word that violates the order of commands according to the driving rules is the contradictory direction instruction term, ie, ``Nijini'', which commands westbound driving. ”, and if this is recognized, it is considered to be a misidentification, so it will be rejected.On the other hand, if a direction indicating word other than “nijiniji” or a stop word such as “tomato” is recognized, it will be permitted.In other words, Direction-indicating words other than ``Higashi'' and ``Nijiniji'' are permitted because they may be used in combination, and ``Higashi'', which is in the same direction as the direction in which you are driving, is permitted as a driving stop term in this case, just like ``Tomato''. be done.
第3.4図は複合操作の例を示してあり、第3G
図では同様に“′ヒガシ”、“スタート”で実行運転が
開始された後、“マキオロシ”が認識された次の指令語
で誤認、又はリジェクト判定されて実行運転が停止され
ている。ここで誤認として判定される指令語は、“スタ
ート”2 “トマト”“チョイ”、″チョイチョイ”、
″フレトメ”“ギャクスン”以外の全ての方向指示用語
であり、例えば南行運転を指令する゛ごナミガワ”が認
識されると、“マキオロシ”と共に方向指示用語が連続
するので、誤認として判定され許可されない。Figure 3.4 shows an example of a compound operation, and in Figure 3G, after the execution operation is started with "Higashi" and "Start", the next command word that is recognized is "Makioroshi". Execution operation has been stopped due to misidentification or rejection. The command words judged as misidentified here are “start” 2 “tomato” “choi” “choi choi”
All direction indicating terms other than ``furetome'' and ``gaksun'' are recognized.For example, if ``gonamigawa'', which instructs southbound driving, is recognized, the direction indicating terms are consecutive along with ``makioroshi'', so it is determined to be a misrecognition and permission is granted. Not done.
第4図では実行運転が開始された後、更に“マキオロシ
”、“スタート”により巻下運転も開始され、この次の
指令語で誤認、又はリジェクト判定されて実行及び巻下
運転が停止されている。ここで誤認として判定される指
令語は、゛′ヒガシ”“マキオロシ”1 “トマト”以
外の用語であり、例えば北行運転を指令する“キタキタ
゛′が認識されても、既に実行と巻下との複合運転が行
われているので、誤認として判定され、また“ヂジイ”
等の寸動勅作は実行巻下のいずれかの運転が“1・マレ
”等によって停止された後でないと実行されないように
なっているので、同様に誤認として判定される。In Fig. 4, after the execution operation has started, the lowering operation is also started by "Makioroshi" and "Start", and the execution and lowering operation are stopped due to a misrecognition or rejection at the next command word. There is. The command words that are judged to be misrecognized here are words other than ``Higashi,''``Makioroshi,'' 1 and ``Tomato.'' For example, even if ``Kitakita'', which instructs northbound driving, is recognized, it has already been determined that execution and lowering have been performed. Since the combined operation of
Since the inching commands such as the above are not executed until after one of the operations under execution has been stopped by "1. Male", etc., it is similarly determined to be a misrecognition.
第5図は上述の複合運転の内容をまとめた指令順序の系
統図の一例である。まず、“パワーオン状態によりクレ
ーンの各駆動部が駆動可能状態に設定される。次の■で
方向指示用語の1つが発声認識され、“スタート”によ
り認識された方向に対する運転が開始される。次の■で
認識許可されるのは■と同じ方向指示用語でなく、かつ
相反する方向の指示用語以外の方向指示用語である。こ
れが認識されて次に“スタート”が認識されると複合運
転が開始される。■では■か■で発声した方向指示用語
及び“トマト”だけが認識許可され、“トマト”が認識
された場合は■、■の複合運転の両方が停止される。■
か■のいずれか一方の方向指示用語が認識許可されて一
方の運転だけが停止された場合、次の■で認識許可され
るのは■で認識されていない他方の方向指示用語及び、
゛1マレ″ “ブレーキ”ヂョイ゛、“チョイチョイ゛
、“フレトメ”、′ギャクスン”である。FIG. 5 is an example of a system diagram of the order of commands summarizing the contents of the above-mentioned combined operation. First, each drive part of the crane is set to a driveable state by the "power-on state." Next, one of the direction instruction terms is uttered and recognized by "start," and operation in the recognized direction is started by "start." What is recognized and permitted in the next ■ is a direction indication term other than the same direction indication term as ■, and a direction indication term other than the conflicting direction indication term.When this is recognized and "start" is recognized next, the compound operation is started. is started. In ■, only the direction indicating words uttered with ■ or ■ and "tomato" are recognized, and if "tomato" is recognized, both the combined operations of ■ and ■ are stopped.■
If either one of the direction indicating words in ■ is recognized and permitted and only one of the driving is stopped, the recognition and permission in the next ■ will be the other direction indicating term that is not recognized in ■ and,
``1 Male''``Brake'',``Choichoi'',``Fletome'', and ``Gaxun''.
ここで“トマト”が認識されると他方の運転も停止され
る。また、“ブレーキ゛′が認識されると■の認識によ
り停止された運転動作に制動が加えられ、′チョイ”、
″チョイチョイ”、“フレトメ”、″ギャクスン”が認
識されると10秒以内であればこれらに対応する寸動動
作が行われる。If "tomato" is recognized here, the other operation is also stopped. In addition, when "brake" is recognized, braking is applied to the driving operation that was stopped due to the recognition of ■, and "choice",
When "choi choi", "furetome", and "gaxun" are recognized, the corresponding inching motion is performed within 10 seconds.
■で現在運転中の他方の方向指示用語が認識されると、
次の■で認識許可されるのは前記寸動動作用語及び“ブ
レーキ”であり、“ブレーキ”が認識されると同様に■
の認識により停止された運転動作に制動が加えられ、寸
動動作用語であれば10秒以内の寸動動作が行われ、1
0秒以上になると初期のパワーオン状態に復帰される。■When the direction indication term of the other person currently driving is recognized,
What is recognized and permitted in the next ■ is the above-mentioned inching operation term and "brake", and when "brake" is recognized, similarly ■
Braking is applied to the stopped driving operation based on the recognition of
When the time is longer than 0 seconds, the initial power-on state is restored.
下記第1表は上述の如き運転規則の合理性チェツクによ
る音声認識試験を、小径管工場及び冷間製管工場におい
て行った試験結果を示してあり、騒音レベルは冷間製管
工場の方が大きい。Table 1 below shows the test results of a voice recognition test based on the above-mentioned operating rule rationality check conducted at a small diameter pipe factory and a cold pipe factory.The noise level was higher at the cold pipe factory. big.
(以下余白)
9
第1表
0
第2表
これから分かるように各工場共、合理性チ1ソクによっ
て検出された誤認の数は0.3%であり、誤認減少に有
効であるといえる。(Leaving space below) 9 Table 1 0 Table 2 As can be seen, the number of misidentifications detected by the rationality check in each factory was 0.3%, and it can be said that it is effective in reducing misperceptions.
第2表は従来装置と本発明装置とによる音声認識能力の
比較結果を示してあり、従来装置は冷間製管工場におけ
る試験結果を、本発明装置は冷間製管工場及び小径管工
場における試験結果を夫々示してある。Table 2 shows the comparison results of the speech recognition ability of the conventional device and the device of the present invention. The test results are shown respectively.
(以下余白)
表から明らかなように本発明装置においては、リジェク
ト率及び誤認率が大幅に低減されている為、正常認識率
が実用上まず支障がないといえる95%を上回る98%
にまで高められている。(Left below) As is clear from the table, in the device of the present invention, the rejection rate and false recognition rate are significantly reduced, so the normal recognition rate is 98%, which exceeds 95%, which is considered to have no practical problems.
It has been raised to .
なお、正常認識率が冷間製管工場の方が約1%小径管工
場よりも低いのは発声中における衝撃音の発生頻度の差
異が主因である。この為、騒音入力によるリジェクト発
生を防止する為には音声入力袋W6には適用される場所
の騒音条件に応して゛音声入力動作パラメータを設定す
ることが必要である。例えば’<5’+ 撃音を音声入
力の始端として誤検出させない為には、衝撃音がピーク
が大きい割に入力時間が比較的短いことを利用し、積分
値を高めに設定することによって排除することができる
。The reason why the normal recognition rate is approximately 1% lower in the cold pipe factory than in the small diameter pipe factory is mainly due to the difference in the frequency of occurrence of impulsive sounds during utterance. Therefore, in order to prevent the occurrence of rejection due to noise input, it is necessary to set the voice input operation parameters for the voice input bag W6 according to the noise conditions of the place where it is applied. For example, in order to avoid falsely detecting a '<5'+ impact sound as the start of audio input, take advantage of the fact that the input time is relatively short for the impact sound, which has a large peak, and eliminate it by setting a high integral value. can do.
また、本実施例における指令語で番よ、゛ニジニジ”、
゛ミナξガワ”等、識別し易い用語を採用している為、
正常認識率の向−にに有効であり、更に“ヒガシ”スタ
ート”等、無声摩擦音で始まる用語は拍端入力が難しく
リジェクトし易いが、例えば“ヒガシ”を“イーストに
する等して対処することも可能である。In addition, the command words in this example are ``Nijiniji'',
Because we use easy-to-identify terms such as "゛mina ξ gawa",
It is effective in improving the normal recognition rate, and it is also difficult to input the end of beats for words that start with a voiceless fricative, such as "Higashi" start, and is likely to be rejected, but this can be countered by changing "Higashi" to "East", for example. It is also possible.
なお、本実施例においては、音声認識装置6及び制御装
置7等の主要装置ば地」二側に設置する構成としてある
が、これに代えてクレーン機」二に設置してもよい。し
かし、クレーン機」二はクレーンの運転動作の際の振動
及び温度上昇等により悪環境であり、故障及び誤動作を
回避でき、保守管理もし易い地上側に設置するのが望ま
しい。また、主要装置を地上側に設置した場合、クレー
ン操作出力信号は無線によりクレーン機上へ伝送する構
成になるが、伝送データの異常、又は無線装置の異常等
が発生した場合には、自動的に非常停止する安全対策を
講しると良い。In this embodiment, the main devices such as the voice recognition device 6 and the control device 7 are installed on the ground, but they may be installed on the crane machine instead. However, the crane machine 2 is in a bad environment due to vibrations and temperature rises during crane operation, so it is desirable to install it on the ground side, where failures and malfunctions can be avoided and maintenance management is easy. In addition, when the main equipment is installed on the ground side, the crane operation output signal is transmitted to the top of the crane machine by wireless, but if an abnormality in the transmitted data or an abnormality in the wireless device occurs, it will be automatically transmitted. It is a good idea to take safety measures to make an emergency stop.
以上の如く本発明に係るクレーン音声制御装置において
は、まず音声認識装置の認識条件が多重登録された複数
の標準パターンと、入力される特徴パターンとの相違度
の大小に基づいて決められている為、従来、誤認識され
ていた指令語はリジェクトでき、またリジェクトされて
いた指令語は認識できるようになり、誤動作を防止でき
、正常認識率を向上できる。As described above, in the crane voice control device according to the present invention, the recognition conditions of the voice recognition device are first determined based on the degree of difference between a plurality of multiple registered standard patterns and an input characteristic pattern. Therefore, command words that were conventionally recognized incorrectly can be rejected, and command words that were rejected can now be recognized, preventing malfunctions and improving the normal recognition rate.
また、認識された指令語はクレーン運転規則に基づく指
令順序に則しているか、否かによって最終的に対応する
動作が許可されるか、又はリジェクトされる為、誤認に
よる誤動作を確実に防止できる。In addition, the corresponding operation is ultimately permitted or rejected depending on whether the recognized command word conforms to the order of commands based on the crane operation rules, so malfunctions due to misrecognition can be reliably prevented. .
このように本発明装置にあっては的確に不要な音声をリ
ジェクトでき、また誤認も検出できるのでリジェクト率
及び誤認率を大幅に低減させるこ3
とが可能となり、安全性及び操作性が大幅に向上され、
十分実用可能である等、本発明は優れた効果を奏する。In this way, the device of the present invention can accurately reject unnecessary sounds and also detect false recognition, making it possible to significantly reduce the rejection rate and false recognition rate3, greatly improving safety and operability. improved,
The present invention has excellent effects such as being fully practical.
第1図は本発明に係るクレーン音声制御装置の構成を示
すブロツク図、第2図〜第4図は操作動作のタイミング
チャート図、第5図は複合運転におOる指令順序系統図
、第6図は運転指令用語の説明図である。FIG. 1 is a block diagram showing the configuration of the crane voice control device according to the present invention, FIGS. 2 to 4 are timing charts of operation operations, and FIG. 5 is a command sequence diagram for combined operation. FIG. 6 is an explanatory diagram of driving command terms.
Claims (1)
声の標準パターンと、入力される特徴パターンとを照合
して一致する標準パターンを認識し、この標準パターン
に対応する信号をクレーン制御部へ出力する音声認識装
置を備えるクレーン音声制御装置において、 各指令語について標準パターンを多重登録 する登録手段と、 入力された信号の特徴パターンと、前記登 録手段にて登録してある各指令語の標準パターンの相違
度を各別に算出する相違度算出手段と、 前記登録手段に登録されている標準パター ンの中から、前記相違度算出手段にて算出された相違度
が1番低い第1の標準パターン及び2番目に低い第2の
標準パターンを選択する選択手段と、 該選択手段にて選択された第1及び第2の 標準パターンに対応する指令語を比較する比較手段と、 第1、第2の標準パターンの指令語が等し い場合、第1の標準パターンの相違度が第1基準値より
小さいとき、前記第1の標準パターンを一致するものと
して認識する第1認識手段と、 第1、第2の標準パターンの指令語が異な る場合、第1の標準パターンの相違度が前記第1基準値
よりも低い第2基準値より小さく、かつ第1及び第2の
標準パターンの相違度の差が前記第2基準値よりも低い
第3基準値より大きいとき、前記第1の標準パターンを
一致するものとして認識する第2認識手段と を具備することを特徴とするクレーン音声 制御装置。 2、予め特定話者により登録してある複数の指令語の音
声の標準パターンと、入力される特徴パターンとを照合
して一致する標準パターンを認識し、この標準パターン
に対応する信号をクレーン制御部へ出力する音声認識装
置を備えるクレーン音声制御装置において、 以前に認識し、対応する信号が出力された 標準パターンを記憶する記憶手段と、 該記憶手段に記憶された標準パターンから 次に認識される標準パターンを、所定の運転規則による
指令順序に基づいて推定する推定手段と、 該推定手段にて推定された標準パターン以 外の標準パターンが次に認識された場合、対応する前記
クレーン制御部への信号の出力を拒否する手段と を具備することを特徴とするクレーン音声 制御装置。[Claims] 1. A standard pattern of speech of a plurality of command words registered in advance by a specific speaker is compared with the input characteristic pattern, a matching standard pattern is recognized, and this standard pattern is used. A crane voice control device equipped with a voice recognition device that outputs a corresponding signal to a crane control unit, a registration means for multiple-registering a standard pattern for each command word, and a characteristic pattern of an input signal and registered by the registration means. a dissimilarity calculation means that calculates the dissimilarity of the standard patterns of each command word separately; and a dissimilarity calculation means that calculates the dissimilarity of the standard patterns of each command word separately; A selection means for selecting the lowest first standard pattern and the second lowest standard pattern, and a comparison for comparing command words corresponding to the first and second standard patterns selected by the selection means. a means for recognizing the first standard pattern as matching when the command words of the first and second standard patterns are equal and the degree of difference of the first standard pattern is smaller than a first reference value; the recognition means, and when the command words of the first and second standard patterns are different, the degree of difference of the first standard pattern is smaller than a second reference value which is lower than the first reference value, and the first and second standard patterns are different from each other; and second recognition means that recognizes the first standard pattern as matching when the difference in the degree of difference between the standard patterns is greater than a third reference value that is lower than the second reference value. Crane voice control device. 2. Compare the input characteristic pattern with the standard voice patterns of multiple command words registered in advance by a specific speaker, recognize the matching standard pattern, and send the signal corresponding to this standard pattern to the crane control. The crane voice control device includes a voice recognition device that outputs a voice signal to a storage device, and includes a storage device for storing a standard pattern previously recognized and a corresponding signal output, and a storage device for storing a standard pattern that is recognized next from the standard pattern stored in the storage device. an estimating means for estimating a standard pattern based on a command sequence according to a predetermined operation rule; A crane voice control device characterized by comprising means for rejecting the output of a signal.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1200783A JPH0829915B2 (en) | 1989-08-02 | 1989-08-02 | Crane voice controller |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1200783A JPH0829915B2 (en) | 1989-08-02 | 1989-08-02 | Crane voice controller |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0367890A true JPH0367890A (en) | 1991-03-22 |
| JPH0829915B2 JPH0829915B2 (en) | 1996-03-27 |
Family
ID=16430121
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1200783A Expired - Lifetime JPH0829915B2 (en) | 1989-08-02 | 1989-08-02 | Crane voice controller |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0829915B2 (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2001068503A1 (en) * | 2000-03-16 | 2001-09-20 | Atecs Mannesmann Ag | Method for perceiving dangerous movements carried out by cranes |
| JP2017088385A (en) * | 2015-11-16 | 2017-05-25 | 株式会社竹中工務店 | Voice control system |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61114299A (en) * | 1984-11-09 | 1986-05-31 | 日本電気株式会社 | Voice recognition system |
| JPS63295393A (en) * | 1987-05-23 | 1988-12-01 | 株式会社日本起重機製作所 | Crane controller |
| JPS63295395A (en) * | 1987-05-23 | 1988-12-01 | 株式会社日本起重機製作所 | Speech recognition control method in crane controller |
-
1989
- 1989-08-02 JP JP1200783A patent/JPH0829915B2/en not_active Expired - Lifetime
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61114299A (en) * | 1984-11-09 | 1986-05-31 | 日本電気株式会社 | Voice recognition system |
| JPS63295393A (en) * | 1987-05-23 | 1988-12-01 | 株式会社日本起重機製作所 | Crane controller |
| JPS63295395A (en) * | 1987-05-23 | 1988-12-01 | 株式会社日本起重機製作所 | Speech recognition control method in crane controller |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2001068503A1 (en) * | 2000-03-16 | 2001-09-20 | Atecs Mannesmann Ag | Method for perceiving dangerous movements carried out by cranes |
| JP2017088385A (en) * | 2015-11-16 | 2017-05-25 | 株式会社竹中工務店 | Voice control system |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0829915B2 (en) | 1996-03-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0518638B1 (en) | Apparatus and method for identifying a speech pattern | |
| FI97919C (en) | Speech recognition method and system for a voice-controlled telephone | |
| US6697782B1 (en) | Method in the recognition of speech and a wireless communication device to be controlled by speech | |
| EP0757342B1 (en) | User selectable multiple threshold criteria for voice recognition | |
| EP2107553B1 (en) | Method for determining barge-in | |
| US7437297B2 (en) | Systems and methods for predicting consequences of misinterpretation of user commands in automated systems | |
| US4610023A (en) | Speech recognition system and method for variable noise environment | |
| US20130253933A1 (en) | Voice recognition device and navigation device | |
| EP0121248A1 (en) | Speaker verification system and process | |
| JPH11119792A (en) | Device control device with voice recognition function and voice recognition device | |
| JPH0367890A (en) | Voice control device of crane | |
| US8731925B2 (en) | Solution that integrates voice enrollment with other types of recognition operations performed by a speech recognition engine using a layered grammar stack | |
| EP4328904A1 (en) | Techniques for authorizing and prioritizing commands directed towards a virtual private assistant device from multiple sources | |
| KR101176174B1 (en) | Black box for vehicle and method for recording traffic accident of the same | |
| JPH0627986A (en) | Equipment control system utilizing speech recognizing device | |
| JPS59180599A (en) | Voice recognition controller to be carried on vehicle | |
| JP3384165B2 (en) | Voice recognition device | |
| JPH11205430A (en) | Telephone set having voice dial function | |
| JPS59180600A (en) | Voice recognition controller to be carried on vehicle | |
| JP2754960B2 (en) | Voice recognition device | |
| JPH03203488A (en) | Voice remote control equipment | |
| JP3114757B2 (en) | Voice recognition device | |
| US20070005361A1 (en) | Process and device for interaction with a speech recognition system for selection of elements from lists | |
| KR102406115B1 (en) | System and method for automatic control of vehicle audio | |
| JPH02305776A (en) | Elevator device |