JPH10208023A - Sign language recognition device - Google Patents
Sign language recognition deviceInfo
- Publication number
- JPH10208023A JPH10208023A JP9011103A JP1110397A JPH10208023A JP H10208023 A JPH10208023 A JP H10208023A JP 9011103 A JP9011103 A JP 9011103A JP 1110397 A JP1110397 A JP 1110397A JP H10208023 A JPH10208023 A JP H10208023A
- Authority
- JP
- Japan
- Prior art keywords
- sign language
- sequential
- static
- unit
- recognizing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Processing (AREA)
- Position Input By Displaying (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】
【課題】全ての動作の基本単位を正しく評価し、精度良
く手話を認識する。すなわち、静的な動作の基本単位の
認識範囲の問題、あるいは静的な動作の基本単位のみに
よって構成される逐次的な動作の単位についても、それ
ぞれの動作の基本単位の検出時間に影響を受ける問題を
解消して、動作の基本単位の適切な評価値を求めること
ができ、手話の認識精度を向上する。
【解決手段】動的な動作の基本単位を検出し、それらか
ら構成される逐次的な動作の単位を認識した後、認識さ
れた逐次的な動作の単位の時間範囲内において静的な動
作の基本単位の評価結果を統合する。静的な動作の基本
単位のみによって構成される逐次的な動作の単位は、各
時刻における動作全体の評価値を求め、評価値が極大に
なる時刻を求めることにより認識を行う。
(57) [Summary] [Problem] To correctly evaluate basic units of all actions and recognize sign language with high accuracy. In other words, the problem of the recognition range of the basic unit of the static operation or the sequential operation unit composed only of the basic unit of the static operation is affected by the detection time of the basic unit of each operation. The problem can be solved and an appropriate evaluation value of the basic unit of operation can be obtained, thereby improving the sign language recognition accuracy. After detecting a basic unit of a dynamic operation and recognizing a sequential operation unit composed of the basic units, a static operation within a time range of the recognized sequential operation unit is detected. Integrate the evaluation results of the basic units. Recognition is performed for a sequential operation unit composed of only basic units of static operation by obtaining an evaluation value of the entire operation at each time and obtaining a time at which the evaluation value reaches a maximum.
Description
【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION
【0001】[0001]
【発明の属する技術分野】本発明は、手話を入力して、
その結果を音声または文字の形で正確に出力することに
より、聴覚障害者と健聴者とのコミュニケーションを支
援する手話認識装置に関するものである。The present invention relates to a method for inputting sign language,
The present invention relates to a sign language recognition device that supports communication between a hearing-impaired person and a hearing-impaired person by accurately outputting the result in the form of voice or text.
【0002】[0002]
【従来の技術】従来より、手話を入力して、その入力結
果を解析しその手話を認識する装置が種々提案されてい
る。これら従来の認識方法としては、手話の動作データ
をパターン照合の技術(例えば、特願平5−12569
8号明細書および図面参照)や、ニューラルネットワー
クの技術を用いて認識を行う技術と、手話動作を構成す
る動作の基本単位に基づいて手話の認識を行う技術(例
えば、特願平6−253457号明細書および図面参
照)がある。前者(特願平5−125698号)の手法
では、全体としての手動作パターンを単語辞書に格納さ
れた標準手動作パターンと比較して、一致するか否かに
より認識する方法であり、後者(特願平6−25345
7号)の手法では、手動作パターン自体を比較するので
はなく、手動作パターンを先ず動作の基本単位毎(部分
パターン)に認識し、次にその動作の基本単位の結果を
統合して単語を認識するものである。このように、後者
の技術では、先ず認識を行う手話を構成する動作の基本
単位を全て認識する。その結果と、あらかじめ手話を動
作の基本単位の組み合わせとして記憶してある手話テン
プレート中の動作の基本単位の時間的な関係とを比較す
ることにより認識を行うのである。この場合、手話テン
プレート中の動作の基本単位の種類や属性は全て記号に
よって記述されていた。2. Description of the Related Art Conventionally, various devices have been proposed in which a sign language is input, the input result is analyzed, and the sign language is recognized. These conventional recognition methods include a technique of pattern matching using sign language motion data (for example, Japanese Patent Application No. Hei 5-12569).
No. 8 and the drawings), a technique of performing recognition using a neural network technique, and a technique of performing sign language recognition based on a basic unit of motion constituting a sign language motion (for example, Japanese Patent Application No. Hei 6-253457). References and drawings). The former method (Japanese Patent Application No. 5-125698) is a method in which the entire hand movement pattern is compared with a standard hand movement pattern stored in a word dictionary and recognized based on whether or not they match, and the latter ( Japanese Patent Application No. 6-25345
In the method of No. 7), instead of comparing the hand movement patterns themselves, the hand movement patterns are first recognized for each basic unit of movement (partial pattern), and then the results of the basic units of the movement are integrated to form a word. It recognizes. As described above, in the latter technique, first, all basic units of the operation constituting the sign language for recognition are recognized. Recognition is performed by comparing the result with the temporal relationship between the basic units of the motion in the sign language template in which the sign language is previously stored as a combination of the basic units of the motion. In this case, the types and attributes of the basic units of the motion in the sign language template are all described by symbols.
【0003】[0003]
【発明が解決しようとする課題】従来における動作の基
本単位に基づく手話認識技術(前述した後者の技術)で
は、静的な動作の基本単位も動的な動作の基本単位も同
時に認識を行い、認識された動作の基本単位を統合する
ことにより手話を認識していた。このうち、静的な動作
の基本単位とは、形状(手の形等)や方向(指の方向
等)など、ある時間範囲においてパラメータが安定した
状態を示す動作の特徴である。一方、動的な動作の基本
単位は、直線運動や円運動などある時間範囲におけるパ
ラメータの変化(移動等)を表す動作の特徴である。静
的な動作の基本単位を検出するためには、基準となるパ
ラメータ(サンプルをとって、そこから抽出したパラメ
ータ)と入力されたパラメータの差に対して閾値を設定
し、その閾値以内の区間を検出することによって行えば
よい。しかしながら、静的な動作の基本単位のパラメー
タは変化しやすいため、認識したい時間範囲より大きい
範囲で認識されたり、小さい範囲で検出されたりするこ
とが多い。例えば、毎回同じような形で、かつ入力され
たパラメータが閾値の境界のところで変動すると、閾値
を往復してしまう結果、小間切れの区間として検出され
てしまうことがある。逆に大きい区間として検出する場
合も生じる。また、パラメータの変動の状態によって
は、一つの動作の区間が二つ以上に分割されて認識され
る場合もある。このため、静的な動作の基本単位と動的
な基本単位を対等に扱っていた従来技術では、静的な動
作の基本単位については正しい評価が行えないという問
題があった。また、従来の技術では、手話テンプレート
を全て動作の基本単位を表す記号によって記述していた
ため、動作の基本単位の認識ではあらかじめ設定してあ
る基準値に基づき認識を行い、その評価値も基準に基づ
いて計算を行っていた。さらに、手話の認識結果も認識
された動作の基本単位の評価値(基準値にどの程度近い
かを表わす値で、近い程高い値)に基づいて計算を行っ
ていた。このため、実際の動作におけるパラメータの範
囲とあらかじめ決定していた基準値によって与えられる
パラメータの範囲のずれにより、正しい評価値が得られ
ないことが多く、認識精度が低いという問題があった。
すなわち、パラメータの集中する場所は、基準値に近い
とは限らず、基準値の中間位置に集中することがある。
このような場合には、入力されたパラメータと基準値と
の差は大きくなり、評価値としては小さくなってしま
う。そこで、本発明の目的は、このような従来の課題を
解決し、全ての動作の基本単位を正しく評価し、精度良
く手話を認識する手話認識装置を提供することである。In the conventional sign language recognition technology based on the basic unit of motion (the latter technology described above), the basic unit of static motion and the basic unit of dynamic motion are simultaneously recognized. Sign language was recognized by integrating the basic units of the recognized motion. Among these, the basic unit of the static operation is a feature of the operation indicating a state where the parameters are stable in a certain time range such as a shape (a hand shape or the like) or a direction (a finger direction or the like). On the other hand, the basic unit of the dynamic operation is a feature of the operation representing a change (movement or the like) of a parameter in a certain time range such as a linear motion or a circular motion. In order to detect a basic unit of static operation, a threshold is set for a difference between a reference parameter (a parameter extracted from a sample taken therefrom) and an input parameter, and a section within the threshold is set. May be detected by detecting However, since the parameter of the basic unit of the static operation is easily changed, it is often recognized in a range larger than the time range to be recognized or detected in a smaller range. For example, if the input parameters fluctuate in the same manner each time at the boundary of the threshold value, the threshold value may reciprocate, and as a result, may be detected as a short break section. Conversely, a case may be detected in which a large section is detected. Further, depending on the state of parameter fluctuation, one operation section may be recognized as being divided into two or more sections. For this reason, in the related art in which the basic unit of the static operation and the basic unit of the dynamic operation are treated equally, there is a problem that the basic unit of the static operation cannot be correctly evaluated. Further, in the conventional technology, since all sign language templates are described by symbols representing basic units of motion, the basic units of motion are recognized based on a preset reference value, and the evaluation value is also used as a reference. The calculation was based on that. Furthermore, the recognition result of the sign language is also calculated based on the evaluation value of the basic unit of the recognized motion (a value indicating how close to the reference value, the higher the value, the closer). For this reason, there is a problem that a correct evaluation value is often not obtained due to a difference between a parameter range in an actual operation and a parameter range given by a predetermined reference value, and recognition accuracy is low.
That is, the location where the parameters are concentrated is not always close to the reference value, and may be concentrated at an intermediate position between the reference values.
In such a case, the difference between the input parameter and the reference value increases, and the evaluation value decreases. Therefore, an object of the present invention is to solve such a conventional problem and to provide a sign language recognition device that correctly evaluates the basic units of all operations and recognizes sign language with high accuracy.
【0004】[0004]
【課題を解決するための手段】上記目的を達成するた
め、本発明の手話認識装置では、動的な動作の基本単位
を検出し、それらにより構成される逐次的な動作の単位
を認識した後、認識した逐次的な動作の単位の時間範囲
内において静的な動作の基本単位の評価結果を統合す
る。静的な動作の基本単位のみによって構成される逐次
的な動作の単位は、各時刻における動作全体の評価値を
求め、評価値が極大になる時刻を求めることにより認識
を行う。また、動作の基本単位を正しく評価するため
に、手話テンプレートに記述される動作の基本単位は、
実際の手話データを用いて決定した属性値を連続量を用
いて記述する。認識された動作の基本単位の評価値は、
その連続量を用いて求める。このように、動的な動作の
基本単位の認識結果から決定される時間範囲に基づいて
静的な動作の基本単位を評価するため、静的な動作の基
本単位の認識範囲に関する問題がなくなる。また、静的
な動作の基本単位のみによって構成される逐次的な動作
の単位についても、各時刻毎に逐次的な動作の単位全体
の評価値を求め、評価値の極大値となる時刻を検出する
ことにより認識を行うため、それぞれの動作の基本単位
の検出時間に影響を受けることがなくなる。さらに、動
作の基本単位の特徴を表す属性値を実際の動作データか
ら求めた連続量によって表現し、それに基づいて認識さ
れた動作の基本単位を評価するため、動作の基本単位の
適切な評価値を求めることが可能となり、手話の認識精
度を向上することができる。In order to achieve the above object, a sign language recognition apparatus according to the present invention detects a basic unit of a dynamic operation and recognizes a sequential operation unit constituted by the basic units. And integrating the evaluation result of the basic unit of the static operation within the time range of the recognized sequential operation unit. Recognition is performed for a sequential operation unit composed of only basic units of static operation by obtaining an evaluation value of the entire operation at each time and obtaining a time at which the evaluation value reaches a maximum. Also, in order to correctly evaluate the basic unit of motion, the basic unit of motion described in the sign language template is
The attribute value determined using the actual sign language data is described using a continuous amount. The evaluation value of the basic unit of the recognized action is
It is determined using the continuous amount. As described above, since the basic unit of the static operation is evaluated based on the time range determined from the recognition result of the basic unit of the dynamic operation, there is no problem regarding the recognition range of the basic unit of the static operation. In addition, for the sequential operation unit composed only of the basic unit of the static operation, the evaluation value of the entire sequential operation unit is obtained at each time, and the time when the evaluation value becomes the maximum value is detected. By doing so, the recognition is performed, so that the detection time of the basic unit of each operation is not affected. Furthermore, an appropriate evaluation value of the basic unit of the motion is used to represent the attribute value representing the characteristic of the basic unit of the motion by the continuous amount obtained from the actual motion data and to evaluate the basic unit of the recognized motion based on the attribute value. Can be obtained, and the sign language recognition accuracy can be improved.
【0005】[0005]
【発明の実施の形態】以下、本発明の実施例を、図面に
より詳細に説明する。図2は、本発明における動作要素
に基づく手話動作モデルを示す図である。本発明を説明
するために、まず手話動作のモデルを説明する。手話動
作は、動作の基本単位の組み合わせにより構成される。
この手話における動作の基本単位を、以後動作要素と呼
ぶことにする。手話の動作を構成する動作要素間には時
間的な逐次性および同時性があるため、手話の認識を行
うためには、それら動作要素間の時間的な関係も記述し
ておく必要がある。このために、図2に示すモデルを使
用する。図2において、201は手話形態素の動作全体
を表す。手話形態素は、手話における意味の単位であ
る。手話形態素は、まず逐次的な単位である逐次要素2
02,203,204に分解される。横軸は左端を基準
として時間の経過を表わしているので、逐次要素20
2,203,204の順序で動作が発生したことにな
る。逐次要素は必ず連続的に表現され、同時に表現され
ることはない動作の単位である。逐次要素は、さらに複
数の同じ時間範囲に表現される単位である同時要素20
5,206,207に分解される。同時要素には、動作
要素208,209が含まれる。同時要素には二種類あ
り、一つの動作要素のみから構成される同時要素と、二
つ以上の動作要素のみから構成される同時要素がある。
二つ以上の動作要素から構成される同時要素は、その中
に含まれる動作要素が逐次的に表現された場合に存在す
るとみなされる。ただし、一つの同時要素に含まれる動
作要素は、必ず同じ種類の動作要素であるとする。なお
動作要素とは、方向が同じで手の形状だけ異なる等の動
作の要素である。手話動作は、このように動作要素の逐
次的構造と同時的構造の組み合わせによって構成され
る。Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 2 is a diagram showing a sign language operation model based on an operation element in the present invention. In order to explain the present invention, a sign language operation model will be described first. The sign language operation is configured by a combination of basic units of the operation.
The basic unit of operation in this sign language will be hereinafter referred to as an operation element. Since there is temporal sequentiality and synchronism between the operation elements constituting the operation of the sign language, in order to recognize the sign language, it is necessary to also describe a temporal relationship between the operation elements. For this purpose, the model shown in FIG. 2 is used. In FIG. 2, reference numeral 201 denotes the entire operation of the sign language morpheme. A sign language morpheme is a unit of meaning in sign language. The sign language morpheme is a sequential element 2 which is a sequential unit.
02, 203, and 204. Since the horizontal axis represents the passage of time based on the left end, the sequential element 20
The operations have occurred in the order of 2, 203, and 204. A sequential element is a unit of operation that is always expressed continuously and is not simultaneously expressed. The sequential element is a simultaneous element 20 which is a plurality of units expressed in the same time range.
5,206,207. The simultaneous elements include operation elements 208 and 209. There are two types of simultaneous elements, a simultaneous element composed of only one operation element and a simultaneous element composed of only two or more operation elements.
A simultaneous element composed of two or more operation elements is considered to exist when the operation elements included therein are sequentially expressed. However, it is assumed that the operation elements included in one simultaneous element are always the same type of operation element. The operation element is an operation element such as the same direction but a different hand shape. The sign language operation is thus constituted by a combination of the sequential structure and the simultaneous structure of the operation elements.
【0006】図1は、本発明の一実施例を示す手話認識
装置の概念ブロック図である。図1において、手話入力
部101(データグローブ)は手話における動作を電気
信号に変換し、時系列データとして動的動作要素認識部
102および静的動作要素認識部103に入力する。動
的動作要素認識部102では、動作データから動的な動
作要素を認識する。静的動作要素認識部103では、動
作データの各時刻のデータに対して静的な動作要素の評
価値を求める。動的逐次要素認識部104では、認識さ
れた動的な動作要素から構成される逐次要素を認識す
る。静的逐次要素認識部105では、静的な動作要素の
みから構成される逐次要素の認識を行う。静的動作要素
統合部106では、動的な動作要素から構成される逐次
要素に静的な動作要素の認識結果を統合することによ
り、手話形態素の認識を行う。本発明は、この静的動作
要素統合部106を設けたことに特徴がある。先にモデ
ルの説明で述べたように、静的動作要素の認識範囲は基
本単位のパラメータが変化し易いため、認識したい時間
範囲より小さい範囲で検出されたり、大きい範囲で認識
されたりするとともに、通常、静的動作要素は動的動作
要素と一緒に現われるので、動的動作要素の逐次要素と
静的動作要素の認識結果を統合し、評価するのである。
つまり、動的動作要素は、直線運動や円運動で時間が明
確に決められるので、認識した時間範囲内において静的
動作要素を評価してやればよい。なお、図2のモデルと
図1の関係では、図2の動作要素208,209の中に
動的動作要素と静的動作要素とが含まれると考えればよ
い。手話形態素の認識結果は、出力部108によりモニ
タ109およびスピーカ110へ出力される。手話形態
素辞書111には、手話における意味の単位である手話
形態素毎に、動作要素の組み合わせによって記述した手
話テンプレートが格納されている。FIG. 1 is a conceptual block diagram of a sign language recognition apparatus showing one embodiment of the present invention. In FIG. 1, a sign language input unit 101 (data glove) converts an operation in sign language into an electric signal, and inputs the electric signal to the dynamic operation element recognition unit 102 and the static operation element recognition unit 103 as time-series data. The dynamic operation element recognition unit 102 recognizes a dynamic operation element from the operation data. The static operation element recognizing unit 103 obtains an evaluation value of a static operation element for the data at each time of the operation data. The dynamic sequential element recognition unit 104 recognizes a sequential element composed of the recognized dynamic operation elements. The static sequential element recognition unit 105 recognizes a sequential element composed of only static operation elements. The static operation element integration unit 106 recognizes the sign language morpheme by integrating the recognition result of the static operation element into the sequential element composed of the dynamic operation elements. The present invention is characterized in that the static operation element integration unit 106 is provided. As described earlier in the description of the model, the recognition range of the static operation element is detected in a range smaller than the time range to be recognized or recognized in a larger range because the parameter of the basic unit is easily changed, Usually, since the static operation element appears together with the dynamic operation element, the recognition result of the sequential element of the dynamic operation element and the recognition result of the static operation element are integrated and evaluated.
That is, since the time of the dynamic operation element is clearly determined by the linear motion or the circular motion, the static operation element may be evaluated within the recognized time range. In the relationship between the model of FIG. 2 and FIG. 1, it may be considered that the dynamic elements and the static elements are included in the operation elements 208 and 209 of FIG. The recognition result of the sign language morpheme is output to the monitor 109 and the speaker 110 by the output unit 108. The sign language morpheme dictionary 111 stores a sign language template described by a combination of motion elements for each sign language morpheme that is a unit of meaning in sign language.
【0007】図3は、動的動作要素認識部の構造を示す
ブロック図であり、図4は、静的動作要素認識部の構造
を示すブロック図である。動的動作要素認識部102
は、図3に示すように、独立したそれぞれの動作要素毎
の認識部301,302,303から構成されている。
各動作要素認識部には、それぞれの認識処理に必要な認
識用パラメータ304,305,306が用意される。
図3に示す動的動作要素認識部では、考えられる全ての
動作要素を認識することになるが、手話形態素辞書中の
動的動作要素のみを認識するようにしても良い。静的動
作要素認識部103も、図4に示すように、各動作要素
毎の認識部401,402,403から構成されてい
る。静的動作要素認識部103では、認識に必要なパラ
メータは全て手話形態素辞書に格納されているデータを
用いる。FIG. 3 is a block diagram showing the structure of the dynamic operation element recognition unit, and FIG. 4 is a block diagram showing the structure of the static operation element recognition unit. Dynamic operation element recognition unit 102
As shown in FIG. 3, is constituted by independent recognition units 301, 302, and 303 for each operation element.
Each motion element recognition unit is provided with recognition parameters 304, 305, and 306 necessary for the respective recognition processes.
The dynamic motion element recognition unit shown in FIG. 3 recognizes all conceivable motion elements, but may recognize only the dynamic motion elements in the sign language morphological dictionary. As shown in FIG. 4, the static operation element recognition unit 103 also includes recognition units 401, 402, and 403 for each operation element. The static operation element recognition unit 103 uses data stored in the sign language morphological dictionary for all parameters required for recognition.
【0008】図5は、図1における手話認識装置を実現
するためのハードウェアの一構成例を示す図である。図
5において、手話入力装置501は手話における手動作
を電気信号に変換する装置であり、手袋にセンサを設置
し、手の形状や動きを電気信号に変換する装置として良
く知られている装置(データグローブ)を利用すること
ができる。手話入力装置501によって、手話の手動作
は指の曲げ角度や手の位置などからなる多次元の時系列
データに変換される。演算装置502は、動作要素の認
識や手話形態素の認識を行う装置であり、メモリ50
4,506,507,508,509,511からプロ
グラムを読み込み、それらのプログラムに従って認識処
理を行う。出力装置503は、手話形態素の認識結果を
出力する装置であり、文字による出力や音声合成を用い
た音声による出力装置を利用することができる。メモリ
504は、動的動作要素を認識するためのプログラムを
記憶するための記憶装置、メモリ505は動的動作要素
を認識するために必要なパラメータを記憶するための記
憶装置、メモリ506は動的な動作要素から構成される
逐次要素を認識するためのプログラムを記憶するための
記憶装置、メモリ507は静的動作要素を認識するため
に必要なプログラムを記憶するための記憶装置、メモリ
508は動的な動作要素から構成される逐次要素と静的
な動作要素の認識結果を統合するためのプログラムを記
憶するための記憶装置、509は静的な動作要素のみで
構成される逐次要素を認識するためのプログラムを記憶
するための記憶装置、メモリ510は手話形態素の動作
データである手話形態素辞書を記憶するための記憶装
置、メモリ511は手話形態素を認識するためのプログ
ラムを記憶するための記憶装置である。図5のハードウ
ェア構成では、全ての認識プログラムの実行を一つの演
算装置だけで行う構成であるが、この他に、複数の演算
装置を用いて認識プログラムの実行をそれぞれの演算装
置に分散させる構成も可能である。FIG. 5 is a diagram showing an example of a configuration of hardware for realizing the sign language recognition device in FIG. In FIG. 5, a sign language input device 501 is a device that converts a hand motion in a sign language into an electric signal, and is a device that is well known as a device that installs a sensor on a glove and converts the shape and movement of a hand into an electric signal ( Data gloves). The sign language input device 501 converts the hand movement of the sign language into multidimensional time-series data including the bending angle of the finger, the position of the hand, and the like. The arithmetic device 502 is a device for recognizing a motion element or a sign language morpheme.
Programs are read from 4, 506, 507, 508, 509, and 511, and recognition processing is performed according to those programs. The output device 503 is a device that outputs a recognition result of a sign language morpheme, and can use a character output or a voice output device using voice synthesis. The memory 504 is a storage device for storing a program for recognizing a dynamic operation element, the memory 505 is a storage device for storing parameters necessary for recognizing a dynamic operation element, and the memory 506 is a dynamic device. A memory for storing a program for recognizing a sequential element composed of various operation elements, a memory 507 is a storage for storing a program required for recognizing a static operation element, and a memory 508 is a memory for storing a program for recognizing a static operation element. Storage device 509 for storing a program for integrating a sequential element composed of static operation elements and a recognition result of static operation elements, and 509 recognizes a sequential element composed only of static operation elements And a memory 510 for storing a sign language morpheme dictionary which is operation data of a sign language morpheme. 1 is a storage device for storing a program for recognizing sign language morphemes. In the hardware configuration of FIG. 5, the execution of all the recognition programs is performed by only one arithmetic device. In addition, the execution of the recognition program is distributed to the respective arithmetic devices by using a plurality of arithmetic devices. Configurations are also possible.
【0009】図6は、図1の手話入力部により入力され
る動作データのフォーマット図である。図6において、
601は手の位置に関するデータであり、手の位置はさ
らにx軸のデータ602,y軸のデータ603,z軸の
データ604から構成されている。605は手の方向に
関するデータであり、手の方向はさらにx軸回りの角度
606,y軸回りの角度607,z軸回りの角度608
から構成されている。609は指の曲げに関するデータ
であり、指の曲げはさらに、親指の第2関節の曲げ角度
610,親指の第3関節の曲げ角度611,人差し指の
第1関節の曲げ角度612,人差し指の第2関節の曲げ
角度613,中指の第1関節の曲げ角度614,中指の
第2関節の曲げ角度615,薬指の第1関節の曲げ角度
616,薬指の第2関節の曲げ角度617,小指の第1
関節の曲げ角度618,小指の第2関節の曲げ角度61
9から構成されている。また、620,621,622
は、それぞれ時刻t1,t2,tnにおける手の位置,
方向,指の曲げのデータを表す。このように、手話にお
ける動作は、手の位置601,手の方向605,指の曲
げ609からなる時系列データとして表される。図7
は、図5の動的動作要素認識用パラメータを格納するメ
モリ(505)に格納されるパラメータのフォーマット
図である。図7において、動作要素名701はそのパラ
メータを認識処理に使用する動作要素の名称,パラメー
タ数702はその動作要素の認識に使用するパラメータ
の数,703,704は各パラメータを表す。また、パ
ラメータ種類705,707はそのパラメータの意味を
表す名称,パラメータ706,708は実際に認識処理
に利用されるパラメータの値を表す。FIG. 6 is a format diagram of operation data input by the sign language input unit of FIG. In FIG.
Reference numeral 601 denotes data relating to the position of the hand. The position of the hand further includes data 602 on the x-axis, data 603 on the y-axis, and data 604 on the z-axis. Reference numeral 605 denotes data on the direction of the hand. The direction of the hand further includes an angle 606 about the x axis, an angle 607 about the y axis, and an angle 608 about the z axis.
It is composed of Reference numeral 609 denotes data relating to the bending of the finger. The bending of the finger further includes a bending angle 610 of the second joint of the thumb, a bending angle 611 of the third joint of the thumb, a bending angle 612 of the first joint of the index finger, and a second angle of the second finger of the index finger. Bending angle of joint 613, bending angle of first joint of middle finger 614, bending angle of second joint of middle finger 615, bending angle of first joint of ring finger 616, bending angle of second joint of ring finger 617, first finger of little finger
Bending angle 618 of the joint, bending angle 61 of the second joint of the little finger
9. 620, 621, 622
Are the hand positions at times t1, t2, and tn, respectively.
Represents data on direction and finger bending. As described above, the operation in the sign language is represented as time-series data including the hand position 601, the hand direction 605, and the finger bending 609. FIG.
FIG. 8 is a format diagram of parameters stored in a memory (505) for storing dynamic operation element recognition parameters in FIG. In FIG. 7, an operation element name 701 indicates the name of an operation element used for recognition processing of the parameter, a parameter number 702 indicates the number of parameters used for recognition of the operation element, and 703 and 704 indicate each parameter. The parameter types 705 and 707 represent names representing the meanings of the parameters, and the parameters 706 and 708 represent parameter values actually used in the recognition processing.
【0010】図8は、図5の手話形態素辞書メモリに格
納されるフォーマット図である。図8において、手話形
態素名801は、それ以下に記述される動作要素の組み
合わせが表す手話形態素の名称を表す。繰り返し回数8
02は、それ以下に記述される動作が繰り返される回数
を表す。逐次要素数803は、手話動作を構成する逐次
要素の数を表す。逐次要素間重なり度804は、それぞ
れの逐次要素が実際の手話動作中に表現された場合に生
じる重なり、あるいはギャップに対する許容範囲を表
す。すなわち、実際に認識される場合には、要素相互が
重なってしまったり、あるいは要素と要素の間が空いて
しまう場合があるので、その度合を登録しておく。この
場合には、離れていたとき+、重なっていたとき−とな
る。逐次要素間重なり度は、逐次要素数が2以上の場合
に有効である。逐次要素805,806,807は、そ
れぞれの逐次要素の記述を表す。同時要素数808は、
逐次要素を構成する同時要素の数を表す。同時要素間重
なり度809は、逐次要素を構成するそれぞれの同時要
素が実際の手話動作中で表現された場合に生じる重なり
に対する許容範囲を表す。同時要素間重なり度は、同時
要素数が2以上の場合に有効である。繰り返し回数81
0,815は、それ以下に記述される動作要素の列が繰
り返される回数を表す。動作要素状態数811,816
は、それぞれの同時要素を構成する動作要素の数を表
す。動作要素間重なり度812,817は、逐次的に表
現される動作要素が実際の手話動作中で表現された場合
に生じる重なりあるいはギャップに対する許容値を表
す。動作要素間重なり度は、動作要素状態数が2以上の
時に有効である。動作要素813,814,818,8
19は、それぞれの同時要素を構成する動作要素を表
す。FIG. 8 is a format diagram stored in the sign language morphological dictionary memory of FIG. In FIG. 8, a sign language morpheme name 801 represents a name of a sign language morpheme represented by a combination of operation elements described below. Repeat count 8
02 represents the number of times the operation described below is repeated. The number of sequential elements 803 indicates the number of sequential elements constituting the sign language operation. The degree of overlap between sequential elements 804 indicates an allowable range for an overlap or a gap that occurs when each sequential element is expressed during an actual sign language operation. That is, when the elements are actually recognized, the elements may overlap with each other or there may be a gap between the elements. Therefore, the degree is registered. In this case, the value is + when separated and-when overlapped. The degree of overlap between sequential elements is effective when the number of sequential elements is two or more. Sequential elements 805, 806, and 807 represent descriptions of the respective sequential elements. The number of simultaneous elements 808 is
Represents the number of simultaneous elements that make up a sequential element. The overlapping degree 809 between the simultaneous elements represents an allowable range for the overlapping that occurs when each of the simultaneous elements constituting the sequential elements is expressed in an actual sign language operation. The overlapping degree between simultaneous elements is effective when the number of simultaneous elements is two or more. 81 repetitions
0,815 represents the number of times the sequence of operation elements described below is repeated. Number of operating element states 811,816
Represents the number of operation elements constituting each simultaneous element. The degree of overlap between motion elements 812 and 817 indicates an allowable value for the overlap or gap that occurs when the sequentially expressed motion elements are expressed in an actual sign language operation. The degree of overlap between operation elements is effective when the number of operation element states is two or more. Operating elements 813, 814, 818, 8
Reference numeral 19 denotes an operation element constituting each simultaneous element.
【0011】図9は、動作要素の記述フォーマット図で
あり、図10は、動作要素の種類およびそれぞれの属性
値の種類を示す図であり、図11は、動作要素の属性値
のフォーマット図である。図9において、901は動作
要素の種類を、902はその動作要素を表現するために
使用される手の部位を、903,904,905はその
動作要素を表すために必要な属性値を表す。動作要素の
種類は、図10に示すように、14種類の動作要素から
選択する。また、図10に示すように、動作要素の種類
に応じて属性値の種類もあらかじめ決定されている。図
11の属性値フォーマットにおいて、1101,110
2,1103は複数の動作データから学習した属性値の
平均値,1104,1105,1106は複数の動作デ
ータから学習した属性値の分散である。ここで属性値の
平均値とは、サンプルをとって、それらの平均値p1〜
pnをとったものであり、また属性値の分散とは、平均
値に対するばらつきであって、何回かとったパラメータ
がどのくらいばらついているかを同じデータから計算し
て、s1〜snとして表わしたものである。なお属性値
の次元は、図10に示した属性値の種類に応じてあらか
じめ決定されている。FIG. 9 is a diagram showing a description format of an operation element. FIG. 10 is a view showing the types of operation elements and the types of respective attribute values. FIG. 11 is a format diagram of attribute values of the operation elements. is there. In FIG. 9, reference numeral 901 denotes a type of an operation element; 902, a part of a hand used to represent the operation element; and 903, 904, 905, attribute values necessary to represent the operation element. The type of the operation element is selected from 14 types of operation elements as shown in FIG. Further, as shown in FIG. 10, the type of the attribute value is determined in advance according to the type of the operation element. In the attribute value format of FIG.
Reference numeral 2 1103 denotes an average value of attribute values learned from a plurality of pieces of motion data, and reference numerals 1104, 1105 and 1106 denote variances of attribute values learned from a plurality of pieces of motion data. Here, the average value of the attribute values refers to the average value p1
pn, and the variance of the attribute value is the variation with respect to the average value, and it is calculated from the same data how many times the parameter varies and expressed as s1 to sn It is. The dimension of the attribute value is determined in advance according to the type of the attribute value shown in FIG.
【0012】次に、本発明における認識処理について説
明する。図12は、動作要素状態数が2以上の同時要素
に含まれる静的動作要素の認識処理を示すフローチャー
トである。図1における動的動作要素認識部102で
は、振動や直線等の動的な動作要素および手話形態素辞
書において、動作要素状態数が2以上の同時要素に含ま
れる形状や方法などの静的な動作要素の二種類の認識
(動的動作要素および静的動作要素の認識)を行う。動
的な動作要素認識の技術としては、既にある技術(例え
ば、特願平6―253457号明細書および図面『手話
認識装置』参照)を使用することができる。動作要素状
態数が2以上の同時要素に含まれる静的な動作要素の認
識は、図12に示すフローチャートに従って行うことが
できる。図12において、ステップ1201では、まず
手話形態素辞書から動作要素状態数が2以上の同時要素
に含まれる静的動作要素を抽出し、そのリストを作成す
る。リスト中の動作要素のフォーマットは、図9に示す
動作要素のフォーマットと同じで良い。次に、ステップ
1202において、手話入力部から1時刻分のデータを
読み込む。ステップ1203において、動作データが最
後であれば処理を終了する。最後でなければ、ステップ
1204に移る。ステップ1204において、静的動作
要素リストの全ての動作要素について、動作要素の属性
値と読み込んだデータとからその時刻における評価値を
求める。Next, the recognition processing according to the present invention will be described. FIG. 12 is a flowchart illustrating a process of recognizing a static operation element included in a simultaneous element having two or more operation element states. The dynamic motion element recognition unit 102 in FIG. 1 performs dynamic motion elements such as vibrations and straight lines, and static motions such as shapes and methods included in simultaneous elements having two or more motion element states in the sign language morphological dictionary. Two types of recognition of elements (recognition of dynamic operation elements and static operation elements) are performed. An existing technique (for example, see Japanese Patent Application No. 6-253457 and the drawing "Sign Language Recognition Apparatus") can be used as a technique for dynamic motion element recognition. Recognition of a static operation element included in a simultaneous element having two or more operation element states can be performed according to the flowchart shown in FIG. In FIG. 12, at step 1201, first, a static operation element included in a simultaneous element having two or more operation element states is extracted from the sign language morphological dictionary, and a list thereof is created. The format of the operation element in the list may be the same as the format of the operation element shown in FIG. Next, in step 1202, data for one time is read from the sign language input unit. In step 1203, if the operation data is the last, the process ends. If it is not the last, the process proceeds to step 1204. In step 1204, the evaluation value at that time is obtained from the attribute values of the operation elements and the read data for all the operation elements in the static operation element list.
【0013】評価値は、静的動作要素の属性値の種類を
n,i番目の属性値の次元数をm(i),静的動作要素
の手話形態素辞書に記述されているi番目の属性値の平
均を(P(i,1),P(i,2),…,P(i,m
(i))),分散を(S(i,1),S(i,2),
…,S(i,m(i)),入力された時刻をt,入力さ
れたデータのi番目の属性値を(X(t,i,1),X
(t,i,2),…,X(t,i,m(i))として、
各時刻の評価値E1(t)は下記(数1)の式によって
求められる。The evaluation value is such that the type of the attribute value of the static operation element is n, the number of dimensions of the i-th attribute value is m (i), the i-th attribute described in the sign language morphological dictionary of the static operation element. The average of the values is (P (i, 1), P (i, 2),..., P (i, m
(I))) and the variances are (S (i, 1), S (i, 2),
, S (i, m (i)), the input time is t, and the i-th attribute value of the input data is (X (t, i, 1), X
(T, i, 2),..., X (t, i, m (i))
The evaluation value E1 (t) at each time is obtained by the following equation (Equation 1).
【数1】 次に、ステップ1205において、各動作要素毎にそれ
までに求めた評価値と新しく求めた評価値からなる評価
値の時系列が極大になる時間範囲を求める。評価値の時
系列が、例えば図13に示す曲線1301のように求め
られた場合には、極大となる時刻1302から時刻13
03の範囲が動作要素として検出される。ステップ12
06において、求めた時間範囲とそれに対応する動作要
素,評価値を認識結果として出力する。ステップ120
7において、求めた各動作要素毎の評価値を次の時刻で
の認識に使用するためにバッファに格納し、ステップ1
202に戻る。図14は、図12のフローで検出された
動作要素のフォーマット図である。1401は動作要素
の検出された時間範囲の開始時刻,1402は動作要素
の検出された時間範囲の終了時刻,1403は検出され
た動作要素に対する評価値,1404は検出された動作
要素の種類,1405はその動作要素を表現するために
使用される手の部位,1406,1407は各動作要素
に付属する属性値である。属性値は、動作要素が検出さ
れた範囲における動作データから求めた値である。(Equation 1) Next, in step 1205, a time range in which the time series of the evaluation value including the evaluation value obtained so far and the evaluation value newly obtained is maximized is obtained for each operation element. When the time series of the evaluation values is obtained, for example, as a curve 1301 shown in FIG.
The range of 03 is detected as an operation element. Step 12
At 06, the obtained time range, the corresponding operation element, and the evaluation value are output as a recognition result. Step 120
In step 7, the obtained evaluation value for each operation element is stored in a buffer for use in recognition at the next time.
Return to 202. FIG. 14 is a format diagram of the operation element detected in the flow of FIG. 1401 is the start time of the time range in which the operation element is detected, 1402 is the end time of the time range in which the operation element is detected, 1403 is the evaluation value for the detected operation element, 1404 is the type of the detected operation element, 1405 Is a part of the hand used to represent the action element, and 1406 and 1407 are attribute values attached to each action element. The attribute value is a value obtained from operation data in a range where the operation element is detected.
【0014】次に、図1に示す動的逐次要素認識部10
4において、動的な動作要素を含む逐次要素を認識する
方法について説明する。図15は、動的逐次要素の認識
処理のフローチャートである。この処理では、大きく分
けて同時要素の認識と逐次要素の認識の二段階の処理が
行われる。ステップ1501では、手話形態素辞書から
動的な動作要素によって構成される同時要素と、動作要
素状態が2以上の静的な動作要素によって構成される同
時要素を抽出し、同時要素リストを作成する。この場合
の同時要素のフォーマットを図16に示す。図16にお
いて、1601は手話形態素辞書中の同時要素の通し番
号,1602は動作要素間の重なり度,1603は動作
要素状態数,1604,1605は同時要素に含まれる
各動作要素である。動作要素のフォーマットは図9に示
すフォーマットと同じであり、また動作要素のフォーマ
ット中の属性値は図11のフォーマットと同じである。
ステップ1502では、手話形態素辞書から動的な動作
要素によって構成される同時要素と、動作要素状態数が
2以上の静的動作要素を含む同時要素を含む逐次要素を
抽出し、動的な動作要素を含む同時要素および動作要素
状態数が2以上の静的な動作要素を含む同時要素と逐次
要素の対応リストを作成する。この同時要素と逐次要素
の対応リスト中の逐次要素のフォーマットを図17に示
す。図17において、1701は手話形態素辞書中にお
ける逐次要素の通し番号,1702は同時要素間の重な
り度,1703はその逐次要素に含まれる動的な動作要
素含む同時要素および動作要素状態数が2以上の同時要
素の数,1704,1705は動的な動作要素を含む同
時要素および動作要素状態数が2以上の静的な動作要素
を含む同時要素の手話形態素辞書中における通し番号で
ある。Next, a dynamic sequential element recognition unit 10 shown in FIG.
4, a method of recognizing sequential elements including dynamic operation elements will be described. FIG. 15 is a flowchart of the dynamic sequential element recognition process. In this processing, roughly divided two-step processing of simultaneous element recognition and sequential element recognition is performed. In step 1501, a simultaneous element constituted by a dynamic operation element and a simultaneous element constituted by a static operation element having two or more operation element states are extracted from the sign language morphological dictionary, and a simultaneous element list is created. FIG. 16 shows the format of the simultaneous element in this case. In FIG. 16, reference numeral 1601 denotes the serial number of the simultaneous element in the sign language morphological dictionary, 1602 denotes the degree of overlap between the operation elements, 1603 denotes the number of operation element states, and 1604 and 1605 denote each operation element included in the simultaneous element. The format of the operation element is the same as the format shown in FIG. 9, and the attribute values in the format of the operation element are the same as the format of FIG.
In step 1502, a simultaneous element constituted by a dynamic operation element and a sequential element including a simultaneous element including a static operation element having two or more operation element states are extracted from the sign language morphological dictionary. And a correspondence list of the simultaneous elements including the static operation elements having the number of operation elements of 2 or more and the sequential elements is created. FIG. 17 shows the format of the sequential elements in the correspondence list of the simultaneous elements and the sequential elements. In FIG. 17, reference numeral 1701 denotes the serial number of a sequential element in the sign language morphological dictionary, 1702 denotes the degree of overlap between the simultaneous elements, and 1703 denotes the number of simultaneous elements including dynamic operation elements included in the sequential element and the number of operation element states of 2 or more. The number of simultaneous elements, 1704 and 1705, are serial numbers in the sign language morphological dictionary of the simultaneous elements including the dynamic operation elements and the simultaneous elements including the static operation elements having two or more operation element states.
【0015】ステップ1503では、動的動作要素認識
部102からの認識結果を一つ読み込む。次にステップ
1504において、認識結果が最後であれば処理を終了
する。そうでなければ、ステップ1505に進む。ステ
ップ1505では、読み込んだ動作要素によって構成さ
れる同時要素の認識を行う。この処理は、図18に示す
フローチャートに従って行われる。図18において、ス
テップ1801では、ステップ1503で読み込んだ動
作要素を含む同時要素を同時要素リストから検索する。
ステップ1802において、検索された同時要素の数を
カウンタiに代入する。ステップ1803において、検
索された同時要素のうちi番目の同時要素の動作要素状
態数が1であればステップ1804に、そうでなければ
ステップ1805に進む。ステップ1804では、i番
目の同時要素中の動作要素の属性値と読み込んだ動作要
素の属性値とから評価値を求める。この場合の評価値E
2は、i番目の同時要素の属性値の種類をn,i番目の
同時要素のj番目の属性値の次元数をm(j),i番目
の同時要素のj番目の属性値を(P(j,1),P
(j,2),…,P(j,m(j))),分散を(S
(j,1),S(j,2),…,S(j,m
(j))),読み込んだ動作要素のj番目の属性値を
(X(j,1),X(j,2),…,X(j,m
(j)))として、下記(数2)の式によって求めるこ
とができる。In step 1503, one recognition result from the dynamic motion element recognition unit 102 is read. Next, in step 1504, if the recognition result is the last, the process ends. Otherwise, go to step 1505. In step 1505, a simultaneous element constituted by the read operation elements is recognized. This process is performed according to the flowchart shown in FIG. In FIG. 18, in step 1801, a simultaneous element including the operation element read in step 1503 is searched from the simultaneous element list.
In step 1802, the number of found simultaneous elements is substituted for the counter i. In step 1803, if the number of operating element states of the i-th simultaneous element among the searched simultaneous elements is 1, the flow proceeds to step 1804; otherwise, the flow proceeds to step 1805. In step 1804, an evaluation value is obtained from the attribute value of the operation element in the i-th simultaneous element and the attribute value of the read operation element. Evaluation value E in this case
2, the attribute value type of the i-th simultaneous element is n, the dimension number of the j-th attribute value of the i-th simultaneous element is m (j), and the j-th attribute value of the i-th simultaneous element is (P (J, 1), P
(J, 2),..., P (j, m (j))) and the variance to (S
(J, 1), S (j, 2), ..., S (j, m
(J))), and the j-th attribute value of the read operation element is represented by (X (j, 1), X (j, 2),..., X (j, m
(J))) can be obtained by the following equation (Equation 2).
【数2】 (Equation 2)
【0016】次にステップ1805では、読み込んだ動
作要素とバッファ中の動作要素からi番目の同時要素を
構成する動作要素列と同じ動作要素列を検索する。ステ
ップ1806では、検索した動作要素列中の動作要素の
属性値とi番目の同時要素中の動作要素の属性値から同
時要素の評価値を求める。この場合の評価値E3は、i
番目の同時要素の動作要素の数をn,i番目の同時要素
のj番目の動作要素の属性値の種類をm(j), i番
目の同時要素のj番目の動作要素のk番目の属性値の次
元数をq(j,k),i番目の同時要素のj番目の動作
要素のk番目の属性値を(P(j,k,1),P(j,
k,2),…,P(j,k,q(j,k))),分散を
(S(j,k,1),S(j,k,2),…,S(j,
k,q(j,k))), i番目の同時要素のj番目の
動作要素に対応する読み込んだ動作要素あるいはバッフ
ァ中の動作要素のk番目の属性値を(X(j,k,
1),X(j,k,2),…,X(j,k,q(j,
k))),j番目とj+1番目の動作要素間の重なりあ
るいはギャップをG(j)(重なりの場合正,ギャップ
の場合負),動作要素間の重なりあるいはギャップの平
均値をA,分散をσとして,下記(数3)の式によって
求めることができる。Next, in step 1805, a search is made from the read operation elements and the operation elements in the buffer for the same operation element sequence as the operation element sequence constituting the i-th simultaneous element. In step 1806, an evaluation value of the simultaneous element is obtained from the attribute value of the operation element in the searched operation element sequence and the attribute value of the operation element in the i-th simultaneous element. The evaluation value E3 in this case is i
The number of operation elements of the i-th simultaneous element is n, the type of attribute value of the j-th operation element of the i-th simultaneous element is m (j), and the k-th attribute of the j-th operation element of the i-th simultaneous element The dimension number of the value is q (j, k), and the k-th attribute value of the j-th operation element of the i-th simultaneous element is (P (j, k, 1), P (j,
, P (j, k, q (j, k))) and the variance to (S (j, k, 1), S (j, k, 2), ..., S (j,
k, q (j, k))), the read-out operation element corresponding to the j-th operation element of the i-th simultaneous element or the k-th attribute value of the operation element in the buffer is (X (j, k,
1), X (j, k, 2),..., X (j, k, q (j,
k))), the overlap or gap between the j-th and j + 1th motion elements is G (j) (positive for overlap, negative for gap), the overlap or gap between the motion elements is A, and the variance is σ can be obtained by the following equation (Equation 3).
【数3】 (Equation 3)
【0017】ステップ1807では、求めた評価値とi
番目の同時要素を同時要素の認識結果として、認識され
た同時要素のバッファに格納する。バッファに格納され
る同時要素のフォーマットを図19に示す。図19にお
いて、1901は認識された同時要素の時間範囲の開始
時刻,1902は認識された同時要素の時間範囲の終了
時刻,1903は手話形態素辞書中における同時要素の
通し番号,1904は同時要素に対する評価値である。
開始時刻1901および終了時刻1902は、その同時
要素が認識されたと判定されるもととなった動作要素の
時間範囲に基づいて計算される。元に戻って、図15の
ステップ1506では、ステップ1505で認識された
同時要素によって構成される逐次要素を認識する。図2
0は、図15に示す逐次要素の認識処理のフローチャー
トである。図20では、まずステップ2001におい
て、認識された同時要素のバッファ中で新しく認識され
た同時要素を含む逐次要素を同時要素と逐次要素の対応
リストから検索する。ステップ2002において、検索
された逐次要素の数をカウンタiに代入する。ステップ
2003において、検索された逐次要素のi番目の逐次
要素を構成する同時要素を、同時要素のバッファから検
索する。ステップ2004において、i番目の逐次要素
を構成する同時要素が全て検索された場合には、ステッ
プ2005に移る。必要な同時要素が全て見つからなか
った場合には、ステップ2007に移る。In step 1807, the obtained evaluation value and i
The second simultaneous element is stored in the buffer of the recognized simultaneous element as a result of the recognition of the simultaneous element. FIG. 19 shows the format of the simultaneous element stored in the buffer. 19, reference numeral 1901 denotes the start time of the time range of the recognized simultaneous element, 1902 denotes the end time of the time range of the recognized simultaneous element, 1903 denotes the serial number of the simultaneous element in the sign language morphological dictionary, and 1904 denotes the evaluation of the simultaneous element. Value.
The start time 1901 and the end time 1902 are calculated based on the time range of the operation element from which the simultaneous element is determined to be recognized. Returning to the original, in step 1506 of FIG. 15, the sequential elements constituted by the simultaneous elements recognized in step 1505 are recognized. FIG.
0 is a flowchart of the sequential element recognition process shown in FIG. In FIG. 20, first, in step 2001, a sequential element including a newly recognized simultaneous element in the buffer of the recognized simultaneous element is searched from the correspondence list of the simultaneous element and the sequential element. In step 2002, the number of searched sequential elements is substituted for a counter i. In step 2003, the simultaneous element forming the i-th sequential element of the searched sequential element is searched from the buffer of the simultaneous element. If it is determined in step 2004 that all the simultaneous elements constituting the i-th sequential element have been searched, the process proceeds to step 2005. If all necessary simultaneous elements have not been found, the process proceeds to step 2007.
【0018】ステップ2005では、検索された同時要
素の評価値に基づき、i番目の逐次要素の評価値を求め
る。評価値は、i番目の逐次要素を構成する同時要素の
数をn,j番目の同時要素の評価値をE4(j),同時
要素間の重なり度をO,同時要素間の重なり度の平均を
A,分散をσとして下記(数4)の式によって求めるこ
とができる。なお、式中のE4は、上記(数1)の式か
ら容易に求められる。In step 2005, the evaluation value of the i-th sequential element is obtained based on the searched evaluation value of the simultaneous element. The evaluation value is n, the number of simultaneous elements forming the i-th sequential element, the evaluation value of the j-th simultaneous element is E4 (j), the overlap between the simultaneous elements is O, and the average of the overlap between the simultaneous elements is Is A and the variance is σ. In addition, E4 in the equation can be easily obtained from the equation (Equation 1).
【数4】 また、式中の同時要素間の重なり度Oは、j番目の同時
要素の開始時刻をs(j),終了時刻をe(j)として
下記(数5)の式によって求めることができる。(Equation 4) Further, the degree of overlap O between the simultaneous elements in the equation can be obtained by the following equation (5), where the start time of the j-th simultaneous element is s (j) and the end time is e (j).
【数5】 ステップ2006において、求めた評価値とその逐次要
素を認識結果として出力する。出力される逐次要素のフ
ォーマットを、図21に示す。図21において、210
1は逐次要素の時間範囲の開始時刻,2102は逐次要
素の時間範囲の終了時刻,2103は手話形態素辞書中
における逐次要素の通し番号,2104はその逐次要素
の評価値である。逐次要素の時間範囲は、その逐次要素
の認識に用いられた同時要素の時間範囲に基づいて求め
る。例えば、全ての同時要素の重なり部分の時間範囲を
用いることができる。あるいは、同時要素の時間範囲の
開始時刻,終了時刻それぞれの平均を用いても良い。(Equation 5) In step 2006, the obtained evaluation value and its sequential element are output as a recognition result. FIG. 21 shows the format of the output sequential element. In FIG. 21, 210
1 is the start time of the time range of the sequential element, 2102 is the end time of the time range of the sequential element, 2103 is the serial number of the sequential element in the sign language morphological dictionary, and 2104 is the evaluation value of the sequential element. The time range of the sequential element is obtained based on the time range of the simultaneous element used for recognition of the sequential element. For example, the time range of the overlap of all simultaneous elements can be used. Alternatively, the average of the start time and the end time of the time range of the simultaneous element may be used.
【0019】図22は、図1に示す静的動作要素認識部
の処理を表すフローチャートである。図1における静的
動作要素認識部103の認識処理では、静的な動作要素
の評価値を各時刻毎に求める。図22のステップ220
1において、手話形態素辞書から静的な動作要素を抽出
し、静的動作要素のリストを作成する。この場合、動作
要素状態が2以上の同時要素を構成する静的な動作要素
は削除する。これは、前述の処理で終了しているためで
ある。動作要素リスト中の動作要素のフォーマットを図
23に示す。図23において、2301は、手話形態素
辞書中における動作要素の通し番号、2302は動作要
素の種類,2303はその動作要素を表現するために使
用される手の部位,2304,2305はその動作要素
に付属する属性値である。図22のステップ2202に
おいて、手話入力部から1時刻分のデータを読み込む。
次に、ステップ2203において、データが最後であれ
ば、処理を終了する。そうでなければ、ステップ220
4に移る。ステップ2204では、静的動作要素リスト
中の全ての動作要素について、動作要素の属性値と読み
込んだデータからその時刻における評価値を求める。評
価値は、前記(数1)の式によって求めることができ
る。ステップ2205では、求めた評価値と動作要素を
認識結果として出力する。また、静的動作要素統合部1
06で過去の静的動作要素の認識結果を使用するため、
静的動作要素のバッファを設けて、そこに認識結果を格
納する。出力される動作要素のフォーマットを図24に
示す。図24において、2401は時刻,2402は手
話形態素辞書中における動作要素の通し番号,2403
は動作要素の評価値である。FIG. 22 is a flowchart showing the processing of the static operation element recognition unit shown in FIG. In the recognition processing of the static operation element recognition unit 103 in FIG. 1, an evaluation value of a static operation element is obtained for each time. Step 220 in FIG.
In step 1, a static operation element is extracted from a sign language morphological dictionary, and a list of static operation elements is created. In this case, a static operation element that constitutes a simultaneous element having two or more operation element states is deleted. This is because the process has been completed. FIG. 23 shows the format of the operation element in the operation element list. 23, reference numeral 2301 denotes a serial number of an operation element in the sign language morphological dictionary, 2302 denotes a type of the operation element, 2303 denotes a part of a hand used to express the operation element, and 2304 and 2305 denote the operation element. This is the attribute value. In step 2202 of FIG. 22, data for one time is read from the sign language input unit.
Next, in step 2203, if the data is the last, the process is terminated. Otherwise, step 220
Move to 4. In step 2204, an evaluation value at that time is obtained from the attribute values of the operation elements and the read data for all the operation elements in the static operation element list. The evaluation value can be obtained by the equation (Equation 1). In step 2205, the obtained evaluation value and operation element are output as a recognition result. In addition, the static operation element integration unit 1
To use the past recognition result of the static operation element in 06,
A buffer of the static operation element is provided, and the recognition result is stored therein. FIG. 24 shows the format of the output operation element. In FIG. 24, 2401 is a time, 2402 is a serial number of an operation element in the sign language morphological dictionary, 2403
Is the evaluation value of the motion element.
【0020】図25は、図1に示す静的逐次要素認識部
における認識処理のフローチャートである。図1の静的
逐次要素認識部105の認識処理では、静的動作要素認
識部103で認識された静的動作要素の評価値から、静
的動作要素のみによって構成される逐次要素の認識を行
う。図25のステップ2501において、手話形態素辞
書から静的な動作要素のみによって構成される逐次要素
を抽出し、逐次要素と静的動作要素の対応リストを作成
する。対応リスト中の逐次要素のフォーマットを、図2
6に示す。図26において、2601は手話形態素辞書
中における逐次要素の通し番号,2602は逐次要素を
構成する静的動作要素の数,2603,2604は逐次
要素を構成する静的動作要素の手話形態素辞書中におけ
る通し番号である。図25のステップ2502では、静
的動作要素認識部103から静的動作要素の認識結果を
1時刻分読み込む。次にステップ2503では、認識結
果が最後であれば処理を終了する。そうでなければ、ス
テップ2504に移る。ステップ2504では、各逐次
要素について、必要な動作要素を読み込んだ静的動作要
素の認識結果から選択し、その時刻における逐次要素の
評価値を求める。時刻tにおける評価値E7(t)は、
逐次要素を構成する静的動作要素の数をn,i番目の静
的動作要素の時刻tにおける評価値をE6(t,i)と
して、下記(数6)の式によって求めることができる。
なお、E6(t,i)は、前記(数1)の式により容易
に求めることができる。FIG. 25 is a flowchart of a recognition process in the static sequential element recognition unit shown in FIG. In the recognition processing of the static sequential element recognition unit 105 in FIG. 1, the sequential element composed of only the static operation elements is recognized based on the evaluation values of the static operation elements recognized by the static operation element recognition unit 103. . In step 2501 of FIG. 25, a sequential element composed of only static operation elements is extracted from the sign language morphological dictionary, and a correspondence list of the sequential elements and the static operation elements is created. The format of the sequential elements in the correspondence list is shown in FIG.
6 is shown. In FIG. 26, 2601 is the serial number of the sequential element in the sign language morphological dictionary, 2602 is the number of static operation elements constituting the sequential element, 2603 and 2604 are the serial numbers of the static operation element forming the sequential element in the sign language morphological dictionary It is. In step 2502 of FIG. 25, the static operation element recognition result is read from the static operation element recognition unit 103 for one time. Next, in step 2503, if the recognition result is the last, the process ends. Otherwise, the process moves to step 2504. In step 2504, for each sequential element, a required operation element is selected from the recognition result of the read static operation element, and an evaluation value of the sequential element at that time is obtained. The evaluation value E7 (t) at time t is
The number of the static operation elements constituting the sequential element can be obtained by the following expression (Equation 6), where n is the evaluation value of the i-th static operation element at time t and E6 (t, i).
Note that E6 (t, i) can be easily obtained by the equation (Equation 1).
【数6】 ステップ2505では、各逐次要素について、求めた逐
次要素の評価値と過去の逐次要素の評価値の履歴を記憶
してあるバッファの内容から、評価値が極大になる時間
範囲を検索し、その時間範囲と評価値を逐次要素の認識
結果として出力する。なお、逐次要素の認識結果のフォ
ーマットは、図21に示すフォーマットと同じである。
ステップ2506では、次の時刻での処理で使用するた
めに、求めた逐次要素の評価値をバッファに格納する。(Equation 6) In step 2505, for each sequential element, a time range in which the evaluation value is maximized is searched for from the contents of the buffer storing the history of the obtained evaluation value of the sequential element and the history of the evaluation values of the past sequential elements. The range and the evaluation value are output as the sequential element recognition result. The format of the sequential element recognition result is the same as the format shown in FIG.
In step 2506, the obtained evaluation value of the sequential element is stored in the buffer for use in the processing at the next time.
【0021】図27は、図1に示す静的動作要素統合部
における統合処理のフローチャートである。静的動作要
素統合部106では、動的な動作要素のみによって構成
された逐次要素の評価結果に静的な動作要素の評価値を
統合して、逐次要素全体の評価値を求める。図27で
は、まずステップ2701において、手話形態素辞書中
から動的な動作要素を含む逐次要素および動作要素状態
数が2以上の静的動作要素から構成される同時要素を含
む逐次要素を抽出し、逐次要素と静的な動作要素の対応
リストを作成する。対応リスト中の各逐次要素のフォー
マットは、図26に示すフォーマットと同じである。ス
テップ2702では、動的逐次要素認識部104から動
的逐次要素の認識結果を一つ読み込む。ステップ270
3において、動的逐次要素の認識結果が最後であれば処
理を終了する。そうでなければ、ステップ2704に移
る。ステップ2704では、読み込んだ動的逐次要素の
時間範囲において、動的逐次要素に対応する静的動作要
素の認識結果(評価値)を静的動作要素認識部103か
ら読み込む。ステップ2705では、読み込んだ静的動
作要素の評価値の平均を動的逐次要素に対応する静的動
作要素の評価値として求める。ステップ2706では、
動的逐次要素の評価値と静的動作要素の評価値とから、
逐次要素全体の評価値を求める。この評価値の計算は、
二種類の評価値の平均や相乗平均等を計算することによ
り求めることができる。また逐次要素を構成する動作要
素の種類毎に評価値を保存しておき、それらの平均や相
乗平均等を計算することにより求めることもできる。ス
テップ2707では、動的逐次要素の時間範囲と求めた
評価値を統合結果として出力する。統合結果のフォーマ
ットは、図21に示すフォーマットと同じである。図2
7に示すフローチャートでは、静的動作要素の評価値は
全ての時刻について求め、その中から必要な時間範囲の
評価値のみを受け取ることになるが、動的な逐次要素認
識部の認識結果から得られる時間範囲についてのみ、必
要な静的動作要素の評価値を求めるように静的動作要素
認識部103に指示を送り、その評価結果を受け取って
静的動作要素の統合処理を行うようにすることもでき
る。FIG. 27 is a flowchart of the integration process in the static operation element integration section shown in FIG. The static operation element integration unit 106 integrates the evaluation value of the static operation element with the evaluation result of the sequential element composed only of the dynamic operation element, and obtains the evaluation value of the entire sequential element. In FIG. 27, first, in step 2701, a sequential element including a dynamic operation element and a sequential element including a simultaneous element including a static operation element having two or more operation element states are extracted from the sign language morphological dictionary. Create a correspondence list of sequential elements and static operation elements. The format of each sequential element in the correspondence list is the same as the format shown in FIG. In step 2702, one dynamic sequential element recognition result is read from the dynamic sequential element recognition unit 104. Step 270
In 3, if the result of the recognition of the dynamic sequential element is the last, the process ends. Otherwise, it proceeds to step 2704. In step 2704, the recognition result (evaluation value) of the static operation element corresponding to the dynamic sequential element is read from the static operation element recognition unit 103 in the time range of the read dynamic sequential element. In step 2705, the average of the read evaluation values of the static operation elements is obtained as the evaluation value of the static operation element corresponding to the dynamic sequential element. In step 2706,
From the evaluation value of the dynamic sequential element and the evaluation value of the static operation element,
Find the evaluation value of the entire sequential element. The calculation of this evaluation value is
It can be obtained by calculating an average or a geometric mean of two types of evaluation values. In addition, the evaluation value can be stored for each type of the operation element constituting the sequential element, and the average or geometric mean thereof can be calculated. In step 2707, the time range of the dynamic sequential element and the obtained evaluation value are output as an integrated result. The format of the integration result is the same as the format shown in FIG. FIG.
In the flowchart shown in FIG. 7, the evaluation value of the static operation element is obtained for all times, and only the evaluation value in the necessary time range is received from the evaluation values. However, the evaluation value of the static operation element is obtained from the recognition result of the dynamic sequential element recognition unit. Only for a given time range, an instruction is sent to the static operation element recognizing unit 103 so as to obtain a required evaluation value of the static operation element, and the evaluation result is received to perform the integration processing of the static operation element. Can also.
【0022】図28は、図1に示す手話形態素認識部に
おける認識処理のフローチャートである。手話形態素認
識部107は、逐次要素の認識結果から手話形態素を認
識する。図28では、まずステップ2801において、
手話形態素辞書から手話形態素とそれを構成する逐次要
素の対応リストを作成する。対応リスト中の各手話形態
素のフォーマットを図29に示す。図29において、2
901は手話形態素名,2902は手話形態素を構成す
る逐次要素間の重なり度,2903は手話形態素を構成
する逐次要素の数,2904,2905は手話形態素を
構成する逐次要素の手話形態素辞書中における通し番号
である。ステップ2802において、逐次要素の認識結
果を一つ読み込む。ステップ2803において、逐次要
素の認識結果が最後であれば処理を終了する。そうでな
ければ、ステップ2804に移る。ステップ2804で
は、読み込んだ逐次要素と過去の逐次要素の履歴を格納
してあるバッファ中の逐次要素から、構成される逐次要
素列に対応する手話形態素を対応リストから検索する。
ステップ2805では、検索された手話形態素につい
て、逐次要素の評価値および逐次要素間の重なりあるい
はギャップに基づいて評価値を求める。評価値E9は、
手話形態素を構成する逐次要素の数をn,i番目の逐次
要素の評価値をE8(i),i番目とi+1番目の逐次
要素間の重なりあるいはギャップをG(i)(重なりの
場合正,ギャップの場合負),逐次要素間の重なりある
いはギャップの平均をA,分散をσとして、下記(数
7)の式によって求めることができる。なお、E8
(i)は、前式(数1)により容易に求められる。FIG. 28 is a flowchart of a recognition process in the sign language morpheme recognition unit shown in FIG. The sign language morpheme recognition unit 107 recognizes a sign language morpheme from the recognition result of the sequential elements. In FIG. 28, first, in step 2801,
From the sign language morpheme dictionary, a correspondence list of sign language morphemes and their sequential elements is created. FIG. 29 shows the format of each sign language morpheme in the correspondence list. In FIG. 29, 2
Reference numeral 901 denotes a sign language morpheme name, 2902 denotes the degree of overlap between sequential elements constituting the sign language morpheme, 2903 denotes the number of sequential elements constituting the sign language morpheme, and 2904 and 2905 denote serial numbers of the sequential elements constituting the sign language morpheme in the sign language morpheme dictionary. It is. In step 2802, one recognition result of the sequential element is read. In step 2803, if the recognition result of the sequential element is the last, the process ends. Otherwise, it proceeds to step 2804. In step 2804, a sign language morpheme corresponding to the sequential element sequence configured is searched from the correspondence list from the sequential elements in the buffer storing the history of the read sequential elements and past sequential elements.
In step 2805, for the retrieved sign language morpheme, an evaluation value is determined based on the evaluation value of the sequential elements and the overlap or gap between the sequential elements. The evaluation value E9 is
The number of sequential elements constituting the sign language morpheme is n, the evaluation value of the i-th sequential element is E8 (i), and the overlap or gap between the i-th and i + 1-th sequential elements is G (i) (positive, When the gap is negative), the overlap between the sequential elements or the average of the gap is A, and the variance is σ, it can be obtained by the following equation (7). E8
(I) is easily obtained by the above equation (Equation 1).
【数7】 (Equation 7)
【0023】ステップ2806において、求めた評価
値,手話形態素名および時間範囲を認識結果として出力
する。手話形態素の時間範囲は、認識に使用された逐次
要素の時間範囲に基づいて求める。例えば、最初の逐次
要素の開始時刻から最後の逐次要素の終了時刻を、手話
形態素の時間範囲とすることができる。図30に、手話
形態素の認識結果のフォーマットを示す。図30におい
て、3001は手話形態素の時間範囲の開始時刻,30
02は手話形態素の時間範囲の終了時刻,3003は手
話形態素名,3004は手話形態素の評価値である。な
お、前式(数1),(数2),(数3),(数4),
(数6),(数7)では、評価値の計算はそれぞれを構
成要素の評価値の相乗平均を用いているが、単純な平均
(構成要素の評価値を全て加算し、その数で割算する)
を用いても良い。また、構成要素の評価値とギャップや
重なりに対する評価値に対して重み付けをしても良い。In step 2806, the obtained evaluation value, sign language morpheme name, and time range are output as recognition results. The time range of the sign language morpheme is obtained based on the time range of the sequential element used for recognition. For example, the time range from the start time of the first sequential element to the end time of the last sequential element can be a time range of the sign language morpheme. FIG. 30 shows a format of the recognition result of the sign language morpheme. In FIG. 30, reference numeral 3001 denotes the start time of the time range of the sign language morpheme;
02 is the end time of the time range of the sign language morpheme, 3003 is the sign language morpheme name, and 3004 is the evaluation value of the sign language morpheme. Note that the previous equations (Equation 1), (Equation 2), (Equation 3), (Equation 4),
In (Equation 6) and (Equation 7), each of the evaluation values is calculated using the geometric mean of the evaluation values of the constituent elements. However, a simple average (all of the evaluation values of the constituent elements are added and divided by the number) Calculate)
May be used. Also, the evaluation value of the component and the evaluation value for the gap or overlap may be weighted.
【0024】[0024]
【発明の効果】以上説明したように、本発明によれば、
動的な動作要素の認識結果から決定される時間範囲に基
づいて静的な動作要素を評価するため、静的な動作要素
の認識範囲による認識精度の低下がなくなる。また静的
な動作要素のみによって構成される逐次要素について
も、各時刻毎に逐次要素全体の評価値を求め、評価値の
極大値となる時刻を検出することにより認識を行うた
め、それぞれの動作要素の検出時間のずれによる認識低
下がなくなる。さらに動作要素の特徴を表す属性値を、
実際の動作データから求めた連続量によって表現し、そ
れに基づいて認識された動作要素を評価するため、動作
要素の適切な評価値を求めることが可能となり、手話の
認識精度を向上することができる。As described above, according to the present invention,
Since the static motion element is evaluated based on the time range determined from the recognition result of the dynamic motion element, the recognition accuracy does not decrease due to the recognition range of the static motion element. Also, for sequential elements composed only of static operation elements, the evaluation value of the entire sequential element is obtained at each time, and recognition is performed by detecting the time when the evaluation value has the maximum value. Recognition degradation due to a shift in element detection time is eliminated. In addition, attribute values representing the characteristics of the operation element
Since it is expressed by the continuous amount obtained from the actual motion data and the motion element recognized based on the continuous amount is evaluated, it is possible to obtain an appropriate evaluation value of the motion element, thereby improving sign language recognition accuracy. .
【図1】本発明の一実施例を示す手話認識装置の概念ブ
ロック図である。FIG. 1 is a conceptual block diagram of a sign language recognition apparatus according to an embodiment of the present invention.
【図2】本発明において、動作要素に基づく手話動作モ
デルを示す図である。FIG. 2 is a diagram showing a sign language operation model based on an operation element in the present invention.
【図3】図1に示す動的動作要素認識部の構造を示すブ
ロック図である。FIG. 3 is a block diagram illustrating a structure of a dynamic operation element recognition unit illustrated in FIG. 1;
【図4】図1に示す静的動作要素認識部の構造を示すブ
ロック図である。FIG. 4 is a block diagram illustrating a structure of a static operation element recognition unit illustrated in FIG. 1;
【図5】本発明の一実施例を実現するための手話認識装
置のハードウェア構成図である。FIG. 5 is a hardware configuration diagram of a sign language recognition device for realizing one embodiment of the present invention.
【図6】図1の手話入力装置から入力されるデータのフ
ォーマット図である。FIG. 6 is a format diagram of data input from the sign language input device of FIG. 1;
【図7】動的動作要素認識のためのパラメータのフォー
マット図である。FIG. 7 is a format diagram of parameters for dynamic operation element recognition.
【図8】手話形態素辞書の記述フォーマットである。FIG. 8 is a description format of a sign language morphological dictionary.
【図9】動作要素の記述フォーマットである。FIG. 9 is a description format of an operation element.
【図10】動作要素の種類およびそれぞれの属性値の種
類を示す図である。FIG. 10 is a diagram showing types of operation elements and types of respective attribute values.
【図11】動作要素の属性値のフォーマットである。FIG. 11 shows a format of an attribute value of an operation element.
【図12】動作要素状態数が2以上の同時要素に含まれ
る静的動作要素の認識処理を説明するためのフローチャ
ートである。FIG. 12 is a flowchart illustrating a process of recognizing a static operation element included in a simultaneous element having two or more operation element states.
【図13】静的動作要素の検出処理を説明するための図
である。FIG. 13 is a diagram illustrating a process of detecting a static operation element.
【図14】図13において認識された動的動作要素のフ
ォーマット図である。FIG. 14 is a format diagram of the dynamic operation element recognized in FIG. 13;
【図15】図1に示す動的逐次要素認識部の認識処理を
説明するためのフローチャートである。FIG. 15 is a flowchart illustrating a recognition process of a dynamic sequential element recognition unit illustrated in FIG. 1;
【図16】同時要素と動作要素の対応リストにおける同
時要素のフォーマット図である。FIG. 16 is a format diagram of a simultaneous element in a correspondence list of a simultaneous element and an operation element.
【図17】逐次要素と同時要素の対応リストにおける逐
次要素のフォーマット図である。FIG. 17 is a format diagram of sequential elements in a correspondence list of sequential elements and simultaneous elements.
【図18】図1に示す動的逐次要素認識部における同時
要素の認識処理を説明するためのフローチャートであ
る。FIG. 18 is a flowchart for explaining a simultaneous element recognition process in the dynamic sequential element recognition unit shown in FIG. 1;
【図19】認識された同時要素のフォーマット図であ
る。FIG. 19 is a format diagram of recognized simultaneous elements.
【図20】図1に示す動的逐次要素認識部における逐次
要素の認識処理を説明するためのフローチャートであ
る。20 is a flowchart for explaining a sequential element recognition process in the dynamic sequential element recognition unit shown in FIG. 1;
【図21】図20で認識された逐次要素のフォーマット
図である。FIG. 21 is a format diagram of a sequential element recognized in FIG. 20;
【図22】図1に示す静的動作要素認識部の認識処理を
説明するためのフローチャートである。FIG. 22 is a flowchart illustrating a recognition process of a static operation element recognition unit illustrated in FIG. 1;
【図23】静的動作要素リスト中の動作要素のフォーマ
ット図である。FIG. 23 is a format diagram of an operation element in a static operation element list.
【図24】図22で認識された静的動作要素のフォーマ
ット図である。FIG. 24 is a format diagram of a static operation element recognized in FIG. 22;
【図25】図1に示す静的逐次要素認識部の認識処理を
説明するためのフローチャートである。FIG. 25 is a flowchart illustrating a recognition process of a static sequential element recognition unit illustrated in FIG. 1;
【図26】静的逐次要素リスト中の逐次要素のフォーマ
ット図である。FIG. 26 is a format diagram of a sequential element in a static sequential element list.
【図27】図1に示す静的動作要素統合部の統合処理を
説明するためのフローチャートである。FIG. 27 is a flowchart illustrating an integration process of a static operation element integration unit illustrated in FIG. 1;
【図28】図1に示す手話形態素認識部の認識処理を説
明するためのフローチャートである。FIG. 28 is a flowchart illustrating a recognition process performed by the sign language morpheme recognition unit illustrated in FIG. 1;
【図29】手話形態素と逐次要素の対応リスト中の手話
形態素のフォーマット図である。FIG. 29 is a format diagram of a sign language morpheme in a correspondence list of sign language morphemes and sequential elements.
【図30】図28で認識された手話形態素のフォーマッ
ト図である。FIG. 30 is a format diagram of the sign language morpheme recognized in FIG. 28;
101…手話入力部、102…動的動作要素認識部、1
08…出力部、103…静的動作要素認識部、104…
動的逐次要素認識部、105…静的逐次要素認識部、1
06…動的動作要素統合部、107…手話形態素認識
部、109…モニタ、110…スピーカ、111…手話
形態素辞書、201…手話形態素、208,209…動
作要素、202,203,204…逐次要素、205,
206,207…同時要素、301,302,303…
動的動作要素認識部、304〜306…パラメータ、40
1,402,403…静的動作要素認識部、504〜5
11…メモリ、601…手の位置、605…手の方向、
609…指の曲げ、701…動作要素名、705,70
7…パラメータ種類、706,708…パラメータ、9
01…動作要素の種類、902…手の部位、903〜9
05…属性値、1101〜1103…属性値の平均値、
1104〜1106…属性値の分散、1301…評価値
の時系列、1302…時間範囲の開始時刻、1303…
時間範囲の終了時刻。101: Sign language input unit, 102: Dynamic motion element recognition unit, 1
08 output unit 103 static operation element recognition unit 104
Dynamic sequential element recognition unit, 105 ... static sequential element recognition unit, 1
06: dynamic motion element integration unit, 107: sign language morpheme recognition unit, 109: monitor, 110: speaker, 111: sign language morpheme dictionary, 201: sign language morpheme, 208, 209: motion elements, 202, 203, 204: sequential elements , 205,
206, 207 ... simultaneous elements, 301, 302, 303 ...
Dynamic operation element recognition unit, 304 to 306... Parameters, 40
1,402,403 ... Static operation element recognition unit, 504-5
11 ... memory, 601 ... hand position, 605 ... hand direction,
609: bending of finger, 701: name of operation element, 705, 70
7 ... parameter type, 706, 708 ... parameter, 9
01: Kind of operation element, 902: Hand part, 903-9
05: attribute values, 1101 to 1103: average of attribute values,
1104 to 1106: dispersion of attribute values; 1301, time series of evaluation values; 1302: start time of a time range; 1303 ...
End time of the time range.
───────────────────────────────────────────────────── フロントページの続き (72)発明者 竹内 勝 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 大木 優 東京都国分寺市東恋ケ窪一丁目280番地 株式会社日立製作所中央研究所内 ──────────────────────────────────────────────────続 き Continued on the front page (72) Inventor Masaru Takeuchi 1-280 Higashi Koigakubo, Kokubunji City, Tokyo Inside the Central Research Laboratory of Hitachi, Ltd. Central Research Laboratory
Claims (11)
時系列手話データとして入力する手話入力手段と、 該手話入力手段から入力された動作の基本単位のうち動
的な動作の基本単位を認識する動的動作要素認識手段
と、 該手話入力手段から入力された動作の基本単位のうち静
的な動作の基本単位を認識する静的動作要素認識手段
と、 上記動的動作要素認識手段から取り込まれた一つ以上の
動的な動作の基本単位によって構成される逐次的な動作
のまとまりを認識する動的逐次要素認識手段と、 上記静的動作要素認識手段から取り込まれた一つ以上の
静的な動作の基本単位によって構成される逐次的な動作
のまとまりを認識する静的逐次要素認識手段と、 上記動的逐次要素認識手段から取り込まれ、動的な動作
の基本単位によって構成される逐次的な動作のまとまり
と、上記静的動作要素認識手段から取り込まれ、静的な
動作の基本単位とを統合する静的動作要素統合手段と、 上記静的動作要素統合手段および静的逐次要素認識手段
から取り込まれた逐次要素の認識結果に対して、手話と
しての動作を認識する手話形態素認識手段と、 動作の基本単位の組み合わせによって表現した手話テン
プレートを記憶し、上記各手段に参照される手話形態素
辞書手段と、 上記手話形態素認識手段により認識した手話を、音声あ
るいは文字の形で出力する手段とを有することを特徴と
する手話認識装置。1. Converting the shape and movement of a hand into an electric signal,
Sign language input means for inputting as time-series sign language data; dynamic action element recognition means for recognizing a basic unit of dynamic action among the basic units of action input from the sign language input means; input from the sign language input means A static operation element recognizing means for recognizing a basic unit of a static operation among the basic units of operation performed, and one or more basic units of a dynamic operation taken from the dynamic operation element recognizing means. Dynamic sequential element recognizing means for recognizing a group of sequential operations to be performed, and a sequential operation composed of one or more basic units of static operations fetched from the static operation element recognizing means. A static sequential element recognizing means for recognizing a unit, and a sequential operation unit which is fetched from the dynamic sequential element recognizing means and is constituted by a basic unit of a dynamic operation; A static operation element integration means for integrating the basic unit of the static operation taken from the stage, and a recognition result of the sequential element taken from the static operation element integration means and the static sequential element recognition means. A sign language morpheme recognition means for recognizing a motion as a sign language, a sign language template expressed by a combination of basic units of motion are stored, and the sign language morpheme dictionary means and the sign language morpheme recognition means are referred to by the respective means. Means for outputting the sign language in the form of voice or characters.
て、 前記手話テンプレートを記憶する手話形態素辞書手段に
記憶される動作の基本単位は、動作の種類を表す記号と
連続量で表した動作の属性値の組み合わせによって表現
されることを特徴とする手話認識装置。2. The sign language recognition device according to claim 1, wherein the basic unit of the operation stored in the sign language morphological dictionary means for storing the sign language template is a symbol representing a type of the operation and an operation represented by a continuous amount. A sign language recognition device characterized by being represented by a combination of attribute values.
て、 前記動作の基本単位の属性値は、その平均および分散か
らなることを特徴とする手話認識装置。3. The sign language recognition device according to claim 2, wherein the attribute value of the basic unit of the action comprises its average and variance.
て、 前記動的な動作の基本単位を認識する動的動作要素認識
手段は、手話テンプレートを記憶する手話形態素辞書手
段から抽出した動的な動作の基本単位について認識を行
うことを特徴とする手話認識装置。4. The sign language recognition device according to claim 1, wherein the dynamic action element recognizing means for recognizing a basic unit of the dynamic action is a dynamic action element extracted from a sign language morphological dictionary means storing a sign language template. A sign language recognition device for recognizing a basic unit of motion.
て、 前記静的な動作の基本単位を認識する静的動作要素認識
手段は、手話テンプレートを記憶する手話形態素辞書手
段から抽出した静的な動作の基本単位について認識を行
うことを特徴とする手話認識装置。5. The sign language recognition device according to claim 1, wherein the static action element recognizing means for recognizing a basic unit of the static action is a static action element extracted from a sign language morphological dictionary means storing a sign language template. A sign language recognition device for recognizing a basic unit of motion.
て、 前記動的な動作の基本単位によって構成される逐次的な
動作のまとまりと、静的な動作の基本単位を統合する静
的動作要素統合手段は、動的な動作の基本単位によって
構成される逐次的な動作のまとまりによって決定された
時間範囲における静的な動作の基本単位の認識結果のみ
を選択することを特徴とする手話認識装置。6. The sign language recognition device according to claim 1, wherein a unit of a sequential operation constituted by the basic unit of the dynamic operation and a basic unit of the static operation are integrated. A sign language recognition device, wherein the integrating means selects only a recognition result of the basic unit of the static operation in a time range determined by a unit of the sequential operation constituted by the basic unit of the dynamic operation. .
て、 前記動的な動作の基本単位によって構成される逐次的な
動作のまとまりと、静的な動作の基本単位を統合する静
的動作要素統合手段は、まず動的な動作の基本単位によ
って構成される逐次的な動作のまとまりによって決定さ
れた時間範囲を、静的な動作の基本単位を認識する静的
動作要素認識手段に送り、該静的動作要素認識手段は送
られた時間範囲のみについて認識処理を行い、その結果
を動的な動作の基本単位によって構成される逐次的な動
作のまとまりと、静的な動作の基本単位を統合する静的
動作要素統合手段に送ることを特徴とする手話認識装
置。7. The sign language recognition device according to claim 6, wherein a unit of a sequential operation constituted by the basic unit of the dynamic operation and a basic unit of the static operation are integrated. The integrating means first sends a time range determined by a sequential operation unit constituted by the basic unit of the dynamic operation to the static operation element recognizing unit for recognizing the basic unit of the static operation. The static operation element recognition means performs recognition processing only for the time range sent, and integrates the result into a unit of sequential operation composed of basic units of dynamic operation and basic units of static operation A sign language recognition device for sending to a static operation element integrating means.
て、 前記動的な動作の基本単位によって構成される逐次的な
動作のまとまりを認識する動的逐次要素認識手段は、認
識された動的な動作の基本単位の時間範囲の重なり度に
基づいて認識を行うことを特徴とする手話認識装置。8. The sign language recognition device according to claim 1, wherein the dynamic sequential element recognizing means for recognizing a group of sequential motions constituted by the basic units of the dynamic motions comprises: A sign language recognition device that performs recognition based on the degree of overlap of a time range of a basic unit of a simple operation.
て、 前記静的な動作の基本単位の認識を行う静的動作要素認
識手段は、時系列手話データの各時刻におけるデータ
を、手話テンプレートを記憶する手話形態素辞書手段に
記憶されている静的な動作の基本単位の属性値に基づい
て評価することを特徴とする手話認識装置。9. The sign language recognition device according to claim 1, wherein the static action element recognizing means for recognizing a basic unit of the static action is configured to convert data at each time of the time-series sign language data into a sign language template. A sign language recognition apparatus characterized in that evaluation is performed based on an attribute value of a basic unit of a static action stored in a sign language morphological dictionary means to be stored.
て、 前記静的な動作の基本単位によって構成される逐次的な
動作の単位を認識する静的逐次要素認識手段は、各時刻
における静的な動作の基本単位の評価結果を逐次的な動
作の単位毎にまとめることにより、逐次的な動作の単位
に対する評価値を求め、求めた評価値が極大値となる時
間範囲を逐次的な動作の単位の認識結果とすることを特
徴とする手話認識装置。10. The sign language recognition device according to claim 1, wherein the static sequential element recognizing means for recognizing a sequential operation unit constituted by a basic unit of the static operation comprises a static sequential element recognition unit at each time. By summarizing the evaluation results of the basic units of various operations for each unit of sequential operation, the evaluation value for the unit of sequential operation is obtained, and the time range in which the obtained evaluation value is the maximum value is set for the sequential operation. A sign language recognition apparatus characterized in that the recognition result is a unit.
て、 前記手話としての動作を認識する手話形態素認識手段
は、手話の動作に対応する逐次的な動作の単位の列を求
めることにより、認識を行うことを特徴とする手話認識
装置。11. The sign language recognition device according to claim 1, wherein the sign language morpheme recognition means for recognizing the operation as the sign language obtains a sequence of sequential operation units corresponding to the operation of the sign language. A sign language recognition device characterized by performing:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP01110397A JP3615008B2 (en) | 1997-01-24 | 1997-01-24 | Sign language recognition device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP01110397A JP3615008B2 (en) | 1997-01-24 | 1997-01-24 | Sign language recognition device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH10208023A true JPH10208023A (en) | 1998-08-07 |
| JP3615008B2 JP3615008B2 (en) | 2005-01-26 |
Family
ID=11768685
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP01110397A Expired - Lifetime JP3615008B2 (en) | 1997-01-24 | 1997-01-24 | Sign language recognition device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3615008B2 (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000330467A (en) * | 1999-05-18 | 2000-11-30 | Hitachi Ltd | Sign language teaching device, sign language teaching method, and recording medium on which sign language teaching method is recorded |
| JP2003295754A (en) * | 2002-04-05 | 2003-10-15 | Hitachi Ltd | Sign language education system and program for realizing the system |
| US8775159B2 (en) | 2009-12-10 | 2014-07-08 | Electronics And Telecommunications Research Institute | Typewriter system and text input method using mediated interface device |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6234285A (en) * | 1985-08-07 | 1987-02-14 | Nippon Telegr & Teleph Corp <Ntt> | Method for recognizing animation |
| JPH0667601A (en) * | 1992-08-24 | 1994-03-11 | Hitachi Ltd | Device and system for finger language interpretation |
| JPH06333022A (en) * | 1993-05-27 | 1994-12-02 | Hitachi Ltd | Continuous sign language recognition device and input device |
| JPH07282235A (en) * | 1994-04-15 | 1995-10-27 | Matsushita Electric Ind Co Ltd | Motion recognition device |
| JPH08115408A (en) * | 1994-10-19 | 1996-05-07 | Hitachi Ltd | Sign language recognizer |
| JPH08272974A (en) * | 1995-01-31 | 1996-10-18 | Matsushita Electric Ind Co Ltd | Hand movement recognition device |
-
1997
- 1997-01-24 JP JP01110397A patent/JP3615008B2/en not_active Expired - Lifetime
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6234285A (en) * | 1985-08-07 | 1987-02-14 | Nippon Telegr & Teleph Corp <Ntt> | Method for recognizing animation |
| JPH0667601A (en) * | 1992-08-24 | 1994-03-11 | Hitachi Ltd | Device and system for finger language interpretation |
| JPH06333022A (en) * | 1993-05-27 | 1994-12-02 | Hitachi Ltd | Continuous sign language recognition device and input device |
| JPH07282235A (en) * | 1994-04-15 | 1995-10-27 | Matsushita Electric Ind Co Ltd | Motion recognition device |
| JPH08115408A (en) * | 1994-10-19 | 1996-05-07 | Hitachi Ltd | Sign language recognizer |
| JPH08272974A (en) * | 1995-01-31 | 1996-10-18 | Matsushita Electric Ind Co Ltd | Hand movement recognition device |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000330467A (en) * | 1999-05-18 | 2000-11-30 | Hitachi Ltd | Sign language teaching device, sign language teaching method, and recording medium on which sign language teaching method is recorded |
| JP2003295754A (en) * | 2002-04-05 | 2003-10-15 | Hitachi Ltd | Sign language education system and program for realizing the system |
| US8775159B2 (en) | 2009-12-10 | 2014-07-08 | Electronics And Telecommunications Research Institute | Typewriter system and text input method using mediated interface device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3615008B2 (en) | 2005-01-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100297482B1 (en) | Method and apparatus for character recognition of hand-written input | |
| JP5403699B2 (en) | Finger shape estimation device, finger shape estimation method and program | |
| JP5211334B2 (en) | Handwritten symbol recognition method and apparatus | |
| CN111401318B (en) | Action recognition method and device | |
| KR20070110399A (en) | Recognition graph | |
| KR20120052610A (en) | Apparatus and method for recognizing motion using neural network learning algorithm | |
| JPH0684006A (en) | Method of online handwritten character recognition | |
| CN103713845B (en) | Method for screening candidate items and device thereof, text input method and input method system | |
| Ruan et al. | Dynamic gesture recognition based on improved DTW algorithm | |
| JP3761937B2 (en) | Pattern recognition method and apparatus, and computer control apparatus | |
| CN109241525A (en) | Extracting method, the device and system of keyword | |
| CN112989829A (en) | Named entity identification method, device, equipment and storage medium | |
| CN102778951B (en) | Use input equipment and the input method of virtual key | |
| KR20190121593A (en) | Sign language recognition system | |
| CN117236315A (en) | Text data intelligent analysis method, device and equipment | |
| JPH08115408A (en) | Sign language recognizer | |
| CN111090989A (en) | A prompt method and electronic device based on text recognition | |
| JPH10208023A (en) | Sign language recognition device | |
| JP7095450B2 (en) | Information processing device, character recognition method, and character recognition program | |
| CN118230339A (en) | Text recognition method and device and electronic equipment | |
| CN121706769B (en) | Deep Learning-Based Intelligent Text Proofreading Method and System | |
| JP3574246B2 (en) | Pattern recognition device | |
| JPH10161524A (en) | Sign language word pattern dictionary creation system and method | |
| CN116264020B (en) | Multi-IMU Fusion Action Recognition Method and System | |
| Parvini et al. | Utilizing bio-mechanical characteristics for user-independent gesture recognition |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040216 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040220 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040420 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040629 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040824 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041015 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041028 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071112 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081112 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081112 Year of fee payment: 4 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081112 Year of fee payment: 4 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081112 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091112 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101112 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101112 Year of fee payment: 6 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101112 Year of fee payment: 6 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| EXPY | Cancellation because of completion of term |