JP2000284682A - Sign language recognition method and apparatus - Google Patents
Sign language recognition method and apparatusInfo
- Publication number
- JP2000284682A JP2000284682A JP11088023A JP8802399A JP2000284682A JP 2000284682 A JP2000284682 A JP 2000284682A JP 11088023 A JP11088023 A JP 11088023A JP 8802399 A JP8802399 A JP 8802399A JP 2000284682 A JP2000284682 A JP 2000284682A
- Authority
- JP
- Japan
- Prior art keywords
- sign language
- section
- language word
- boundary
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Processing (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】
【課題】 手話文データから、各手話単語の境界を検出
し、手話単語の認識結果から正しい手話単語列を生成す
る。
【解決手段】 両手及び左右の手の掌及び各指の先端に
おける動作速度が極小になる時刻を動作の境界とする。
左右の掌及び各指の先端の動作方向の変化が閾値を越え
ている場合、その時刻を動作の境界として検出する。動
作方向変化によって検出した境界は、動作速度の極小値
によって検出した境界のうち時間的に最も近い境界に対
応付ける。検出した境界によって分割される手話文デー
タ中の各区間に対して、認識された手話単語を手話単語
の動作の特徴に基づいて対応付ける。また、各区間にお
いて、手話文データ中から動作の特徴を抽出し、その区
間に対応付けられた手話単語の優先順位を変更する。最
後に、手話単語と各区間との対応関係及び各区間中の手
話単語の優先順位に基づいて、手話単語列を生成する。
(57) [Summary] [Problem] To detect a boundary of each sign language word from sign language sentence data and generate a correct sign language word string from a result of recognition of the sign language word. A time when the operation speeds at the palms of both hands and the left and right hands and at the tip of each finger are minimized is defined as an operation boundary.
If the change in the movement direction of the left and right palms and the tip of each finger exceeds the threshold, the time is detected as the boundary of the movement. The boundary detected by the change of the operation direction is associated with the temporally closest boundary among the boundaries detected by the minimum value of the operation speed. Recognized sign language words are associated with each section in the sign language sentence data divided by the detected boundaries based on the feature of the operation of the sign language words. In each section, the feature of the motion is extracted from the sign language sentence data, and the priority of the sign language word associated with the section is changed. Finally, a sign language word sequence is generated based on the correspondence between the sign language word and each section and the priority of the sign language word in each section.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、手話単語を連続的
に表現した手話文から個々の手話単語を検出する手話認
識装置及びコンピュータを手話認識装置として動作させ
るためのプログラムを記録した媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a sign language recognizing device for detecting individual sign language words from a sign language sentence in which sign language words are continuously expressed, and a medium recording a program for operating a computer as a sign language recognizing device.
【0002】[0002]
【従来の技術】複数の手話単語が連続的に表現された手
話文の動作から動作の境界を検出し、その結果を手話単
語列の生成処理に利用する技術としては、特開平6−3
37629号公報(手話認識装置)がある。この技術で
は、手の動作速度が極小になる時刻、及び手の動作速度
があらかじめ決められた値以下になる区間を動作の境界
として検出する。さらに、手形状の変化の有無や繰り返
しの有無を判断することにより余分な境界を削除し、手
話単語を表す区間を決定する。この結果に基づいて、境
界にまたがって認識された手話単語を削除する。また、
決定した区間の位置と手話単語の表現位置に基づいて、
認識処理を行う手話単語を制限する。2. Description of the Related Art Japanese Patent Laid-Open Publication No. Hei 6-3 discloses a technique for detecting a boundary of a motion from a motion of a sign language sentence in which a plurality of sign language words are continuously expressed, and using the result for a sign language word string generation process.
No. 37629 (Sign Language Recognition Apparatus). In this technique, a time at which the hand movement speed becomes a minimum and a section where the hand movement speed becomes equal to or less than a predetermined value are detected as movement boundaries. Further, by judging the presence or absence of a change in the hand shape and the presence or absence of repetition, an extra boundary is deleted, and a section representing a sign language word is determined. Based on this result, the sign language word recognized over the boundary is deleted. Also,
Based on the position of the determined section and the expression position of the sign language word,
Restrict sign language words for recognition processing.
【0003】[0003]
【発明が解決しようとする課題】手話単語の境界を検出
し、その結果に基づいて手話単語列を生成する従来の技
術では、手の動作速度のみから動作の境界を検出し、手
の形状は手話単語の動作中等に検出される余分な境界を
削除するためにのみ使用されていた。また、動作の境界
検出において手の方向の変化は全く考慮されていない。
しかし、手話単語の中には、手の位置は静止したままで
手の形状のみが変化する手話単語や手の方向のみが変化
する手話単語が存在する。また、手の位置が変化すると
ともに手の形状や手の方向が変化するような手話単語も
存在する。従来技術によってこのような手話単語を含む
手話文データから境界を検出しようとすると、手の形状
や方向の変化を余分な境界を削除するための条件として
使うことができないため、手話文データ中の手話単語を
表す区間を正しく検出することができなくなる。In the prior art for detecting a sign language word boundary and generating a sign language word string based on the result, the motion boundary is detected only from the movement speed of the hand, and the hand shape is determined. It was only used to remove extra boundaries detected during the operation of sign language words. In addition, a change in the direction of the hand is not considered at all in detecting the boundary of the motion.
However, among the sign language words, there are sign language words in which only the shape of the hand changes while the position of the hand remains stationary, and sign language words in which only the direction of the hand changes. Also, there is a sign language word in which the shape of the hand and the direction of the hand change as the position of the hand changes. When trying to detect a boundary from sign language sentence data including such a sign language word by a conventional technique, a change in the shape or direction of a hand cannot be used as a condition for removing an extra boundary. The section representing the sign language word cannot be correctly detected.
【0004】また、従来技術では、検出された境界にま
たがって認識された手話単語を誤りとみなして削除して
いる。しかし、手話単語は必ずしも一つの動作からのみ
構成されているわけではなく、複数の動作から構成され
ている場合もある。このような手話単語に対して従来技
術では境界が検出されてしまうため、正しい手話単語を
削除してしまうことになる。In the prior art, a sign language word recognized over a detected boundary is deleted as an error. However, a sign language word is not always composed of only one operation, but may be composed of a plurality of operations. In the related art, a boundary is detected for such a sign language word, so that a correct sign language word is deleted.
【0005】さらに、従来技術では、境界によって分割
された手話文データ中の各区間において、その位置のみ
に基づいて認識された手話単語に優先順位を付けてい
る。しかし、手話単語には位置がさまざまに変動する手
話単語も多く見られるため、このような制約では十分で
はない。本発明の目的は、上記に示したような様々な形
態の手話単語が表現される手話文の動作中において、各
手話単語を表す動作の境界を検出できる手段を備える手
話認識装置を提供することにある。Further, in the prior art, in each section in the sign language sentence data divided by the boundary, the priority is given to the sign language words recognized based only on the position. However, such a restriction is not sufficient because many sign language words whose positions fluctuate variously are found in the sign language words. SUMMARY OF THE INVENTION An object of the present invention is to provide a sign language recognition device including means for detecting a boundary of an operation representing each sign language word during operation of a sign language sentence expressing various forms of sign language words as described above. It is in.
【0006】本発明の他の目的は、検出された境界と手
話単語の認識結果に基づいて正しい手話単語列を生成す
る手段を備える手話認識装置を提供することにある。本
発明のさらに他の目的は、検出された境界によって分割
される手話文中の各区間について、それぞれの区間に対
応する手話単語に効果的に優先順位を付ける手段を備え
る手話認識装置を提供することにある。本発明の別の目
的は、コンピュータを前記特徴を備えた手話認識装置と
して動作させるためのプログラムを記録した媒体を提供
することにある。Another object of the present invention is to provide a sign language recognition apparatus including means for generating a correct sign language word sequence based on a detected boundary and a recognition result of a sign language word. Still another object of the present invention is to provide a sign language recognition device including means for effectively prioritizing sign language words corresponding to each section in a sign language sentence divided by a detected boundary. It is in. Another object of the present invention is to provide a medium in which a program for causing a computer to operate as a sign language recognition device having the above characteristics is recorded.
【0007】[0007]
【課題を解決するための手段】前記目的を達成するた
め、本発明では、手話文データ中の各時刻において、掌
及び各指の先端における動作速度を求め、求めた動作速
度が極小になる時刻を動作の境界として検出する。さら
に、検出された境界によって分割される手話文データ中
の各区間において、左右それぞれの手について掌及び各
指の動作速度が極小になる時刻を検出し、検出した時刻
を動作の境界に追加する。その際、左右の手における動
作速度の変化パターンに基づいて、境界を追加するかど
うかを決定する。また、手話文データ中の各時刻におけ
る左右の掌及び各指の先端の動作方向の変化を計算し、
動作方向の変化があらかじめ決められた閾値を越えてい
る場合、その時刻を動作の境界として検出する。動作方
向の変化によって検出した境界は、動作速度の極小値に
よって検出した境界のうち時間的に最も近い境界に対応
付ける。In order to achieve the above object, according to the present invention, at each time in the sign language sentence data, the operating speed at the tip of the palm and each finger is obtained, and the time at which the obtained operating speed becomes a minimum is obtained. Is detected as an operation boundary. Further, in each section in the sign language sentence data divided by the detected boundary, the time at which the operating speed of the palm and each finger is minimized for each of the left and right hands is detected, and the detected time is added to the boundary of the operation. . At that time, it is determined whether or not to add a boundary based on the change pattern of the operating speed of the left and right hands. In addition, the change of the movement direction of the tip of the left and right palms and each finger at each time in the sign language sentence data is calculated,
When the change in the operation direction exceeds a predetermined threshold, the time is detected as a boundary of the operation. The boundary detected by the change in the operation direction is associated with the temporally closest boundary among the boundaries detected by the minimum value of the operation speed.
【0008】次に、検出した境界によって分割される手
話文データ中の各区間に対して、認識された手話単語を
対応付ける。この際、各手話単語の動作の特徴に基づい
て対応付ける区間を決定する。また、各区間において、
データ中から動作の特徴を抽出し、その区間に対応付け
られた手話単語の優先順位を変更する。最後に、手話単
語と各区間との対応関係、及び各区間中の手話単語の優
先順位に基づいて、手話単語列を生成する。Next, a recognized sign language word is associated with each section in the sign language sentence data divided by the detected boundary. At this time, the section to be associated is determined based on the feature of the operation of each sign language word. In each section,
The feature of the motion is extracted from the data, and the priority of the sign language word associated with the section is changed. Finally, a sign language word sequence is generated based on the correspondence between the sign language words and each section and the priority of the sign language words in each section.
【0009】すなわち、本発明による手話認識装置は、
手話文の動作を電気信号に変換し時系列の手話文データ
として入力する手話動作入力手段と、手話動作入力手段
から入力された手話文データ中に表現されている各手話
単語を認識する手段と、手話動作入力手段から入力され
た手話文データ中の動作の境界を動作の特徴量に基づい
て検出する手話データ分割手段と、手話データ分割手段
によって検出された境界によって分割される手話文デー
タ中の各区間における動作の特徴を検出する動作特徴検
出手段と、手話単語に関する情報を格納する手話単語情
報格納手段と、手話単語情報格納手段に格納された手話
単語に関する情報に基づいて、手話データ分割手段によ
って検出された境界によって分割された手話文データ中
の各区間に手話単語認識手段によって認識された手話単
語を対応付ける分割区間手話単語対応手段と、分割区間
手話単語対応手段によって対応付けられた手話分データ
中の各区間と手話単語の対応関係に基づいて手話単語列
を生成する手話単語列生成手段と、を備えることを特徴
とする。That is, the sign language recognition device according to the present invention comprises:
Sign language action input means for converting the operation of the sign language sentence into an electric signal and inputting the data as time-series sign language sentence data; and means for recognizing each sign language word expressed in the sign language sentence data input from the sign language action input means. A sign language data dividing unit for detecting a boundary of the motion in the sign language sentence data input from the sign language motion input unit based on a feature amount of the motion; and a sign language sentence data divided by the boundary detected by the sign language data dividing unit. Operation characteristic detecting means for detecting the characteristic of the operation in each section, sign language word information storing means for storing information about the sign language word, and sign language data division based on the information about the sign language word stored in the sign language word information storing means. For associating each section in the sign language sentence data divided by the boundary detected by the means with the sign language word recognized by the sign language word recognition means. A section sign language word correspondence unit, and a sign language word string generation unit that generates a sign language word string based on the correspondence between each section in the sign language minute data and the sign language word associated by the divided section sign language word correspondence unit. It is characterized by.
【0010】動作の特徴量には、動作の速度や方向等が
含まれる。動作の特徴には、使用されている手の種類
(両手、右手、左手)や動作が行われてる位置等が含ま
れる。手話単語に関する情報には、手話単語の動作の特
徴や構造が含まれる。手話データ分割手段は、掌の動作
速度、掌の動作方向の変化、各指の先端の動作速度、各
指の先端の動作方向の変化のうち少なくとも1つの特徴
量に基づいて動作の境界を検出するように構成すること
ができる。好ましくは、これらの特徴量の複数を用い
て、あるいはこれらの特徴量の全てを用いて動作の境界
を検出する。より具体的には、手話データ分割手段は、
掌の動作速度あるいは各指の先端の動作速度が極小にな
る時刻、掌の動作速度あるいは各指の先端の動作速度が
あらかじめ決められた速度より小さくなる時刻、掌の動
作速度あるいは各指の先端の動作速度があらかじめ決め
られた速度より小さい状態からあらかじめ決められた速
度より大きい状態になる時刻、及び掌あるいは各指の先
端の動作方向の変化があらかじめ決められた閾値を越え
る時刻を動作の境界として検出することができる。The feature amount of the operation includes the speed and direction of the operation. The features of the motion include the type of hand used (both hands, right hand, left hand), the position where the motion is performed, and the like. The information about the sign language word includes the features and structure of the operation of the sign language word. The sign language data dividing means detects a boundary of the motion based on at least one characteristic amount among a motion speed of the palm, a change in the motion direction of the palm, a motion speed of the tip of each finger, and a change in the motion direction of the tip of each finger. Can be configured. Preferably, the boundary of the motion is detected by using a plurality of these feature amounts or by using all of these feature amounts. More specifically, the sign language data dividing means includes:
The time when the operating speed of the palm or the tip of each finger is minimized, the time when the operating speed of the palm or the tip of each finger is lower than a predetermined speed, the operating speed of the palm or the tip of each finger The boundary of the motion is defined as the time at which the motion speed of the hand changes from a state lower than the predetermined speed to a state higher than the predetermined speed, and a time at which the change of the motion direction of the tip of the palm or each finger exceeds a predetermined threshold. Can be detected as
【0011】手話データ分割手段は、また、左右両方の
掌の動作速度及び各指の先端の動作速度に基づいて動作
の境界を検出した後、検出した境界によって分割される
手話文データ中の各区間について、右手における掌の動
作速度及び各指の先端の動作速度、並びに左手における
掌の動作速度及び各指の先端の動作速度のそれぞれに基
づいて動作の境界を検出し、検出した境界を動作の境界
として追加するように構成することができる。手話デー
タ分割手段は、さらに掌あるいは各指の先端の動作方向
の変化があらかじめ決められた閾値を越える時刻を境界
として検出し、検出された境界を動作速度に基づいて検
出された境界のうち時間的に最も近い境界に対応付ける
ように構成することができる。The sign language data dividing means detects a boundary of the movement based on the movement speed of both the left and right palms and the movement speed of the tip of each finger, and then registers each of the sign language sentence data divided by the detected boundary. For the section, a motion boundary is detected based on the palm operation speed in the right hand and the operation speed of each finger tip, and the palm operation speed in the left hand and the operation speed of each finger tip, and the detected boundary is operated. May be configured to be added as a boundary. The sign language data dividing means further detects, as a boundary, a time at which a change in the movement direction of the tip of the palm or each finger exceeds a predetermined threshold, and detects the detected boundary as a time out of the detected boundaries based on the operation speed. It can be configured to correspond to the closest boundary.
【0012】動作特徴検出手段は、区間中における左右
それぞれの手についての最大動作速度の差あるいは比、
区間中における左右それぞれの手についての平均動作速
度の差あるいは比、区間中における左右それぞれの手に
ついての移動距離の差あるいは比、区間中における左右
それぞれの手についての動作速度変化の差、区間中にお
ける動作方向の差のうち少なくとも1つの特徴量に基づ
いて、区間中の動作が両手を使用しているか、右手のみ
を使用しているか、左手のみを使用しているかのいずれ
かに各区間を分類することができる。The motion feature detecting means includes a difference or a ratio between the maximum motion speeds of the right and left hands in the section,
The difference or ratio of the average operating speed of the left and right hands in the section, the difference or ratio of the moving distance of the left and right hands in the section, the difference of the operating speed change of the left and right hands in the section, Based on at least one feature amount of the motion direction difference in, each of the sections is determined as to whether the action in the section uses both hands, only the right hand, or only the left hand. Can be classified.
【0013】手話単語情報格納手段に格納される情報
は、手話単語の動作の特徴に関する情報、手話単語の動
作が動作の境界によって分割される区間の数、手話単語
の動作を行う場合に使用される手の種類のうち少なくと
も1つを含むことができる。手話単語の動作の特徴に関
する情報には、手話単語の動作を、あらかじめ決められ
た数の区間に分割される可能性のある「上限有り」、分
割される区間の数が不明確である「上限無し」、印を押
すような動作を含む「提示動作」のいずれかに分類した
結果を含むことができる。分割区間手話単語対応手段
は、手話単語の動作の特徴及び動作の境界によって分割
される区間の数に基づいて、手話単語に対応する区間を
決定する。分割区間手話単語対応手段は、また、各区間
における動作の特徴に基づいて各区間に対応付けられた
手話単語の優先順位を変更するように構成することがで
きる。The information stored in the sign language word information storage means is used for information relating to the characteristics of the operation of the sign language word, the number of sections in which the operation of the sign language word is divided by the boundaries of the operation, and the operation of the sign language word. At least one of the following types of hands. The information on the characteristics of the sign language word operation includes "upper limit" in which the sign language word operation may be divided into a predetermined number of sections, and "upper limit" in which the number of divided sections is unclear. The result may be classified into any of "none" and "presentation operation" including an operation of pressing a mark. The divided section sign language word corresponding means determines a section corresponding to the sign language word based on the feature of the operation of the sign language word and the number of sections divided by the boundaries of the operation. The divided section sign language word correspondence unit may be configured to change the priority of the sign language word associated with each section based on the feature of the operation in each section.
【0014】本発明によるコンピュータ読取可能な記録
媒体は、手話文の動作を電気信号に変換し時系列の手話
文データとして入力する手話動作入力手段と、手話動作
入力手段から入力された手話文データ中に表現されてい
る各手話単語を認識する手段と、手話動作入力手段から
入力された手話文データ中の動作の境界を動作の特徴量
に基づいて検出する手話データ分割手段と、手話データ
分割手段によって検出された境界によって分割される手
話文データ中の各区間における動作の特徴を検出する動
作特徴検出手段と、手話単語情報格納手段に格納された
手話単語に関する情報に基づいて、手話データ分割手段
によって検出された境界によって分割される手話文デー
タ中の各区間に手話単語認識手段によって認識された手
話単語を対応付ける分割区間手話単語対応手段と、分割
区間手話単語対応手段によって対応付けられた手話分デ
ータ中の各区間と手話単語の対応関係に基づいて手話単
語列を生成する手話単語列生成手段とを備える手話認識
装置、としてコンピュータを動作させるためのプログラ
ムを記録している。A computer-readable recording medium according to the present invention comprises: sign language operation input means for converting an operation of a sign language sentence into an electric signal and inputting the data as time-series sign language sentence data; and sign language sentence data input from the sign language operation input means. Means for recognizing each sign language word expressed therein, sign language data dividing means for detecting a boundary of the motion in the sign language sentence data input from the sign language motion input means based on a feature amount of the motion, and sign language data dividing Sign language data division based on the sign language word information stored in the sign language word information storage means, and an operation feature detecting means for detecting a feature of the motion in each section in the sign language sentence data divided by the boundary detected by the means. Associates each section in the sign language sentence data divided by the boundary detected by the means with the sign language word recognized by the sign language word recognition means. Sign language comprising divided section sign language word correspondence means, and sign language word string generation means for generating a sign language word string based on the correspondence between each section in the sign language data and the sign language word associated by the divided section sign language word correspondence means. A program for operating a computer as a recognition device is recorded.
【0015】プログラムを供給する記録媒体としては、
フロッピーディスク、磁気ディスク、光ディスク、光磁
気ディスク、CD−ROM、CD−R、磁気テープ、不
揮発性のメモリカード等、任意のものを使用することが
できる。この記録媒体から読み出されたプログラムがコ
ンピュータを前述の手話認識装置として動作させること
になる。As a recording medium for supplying the program,
Arbitrary ones such as a floppy disk, a magnetic disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a magnetic tape, and a nonvolatile memory card can be used. The program read from the recording medium causes the computer to operate as the sign language recognition device described above.
【0016】[0016]
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。図1は、本発明による手話認識装
置の概念ブロック図である。図1において、手話動作入
力部101は、手話文を表す動作を電気信号に変換し時
系列の手話文データとして入力するための手段であり、
良く知られている手袋型装置102を使用することがで
きる。また、手話動作入力部101としては、ビデオカ
メラ及びビデオ画像から手の位置や形状を認識する画像
認識装置を使用することもできる。手話単語認識部10
3は、手話動作入力部101によって入力された手話文
データ中に表現されている各手話単語を認識する手段で
ある。手話単語認識部には、既存の技術、例えば特開平
10−208023号公報(手話認識装置)に記載され
ている技術を用いることができる。Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a conceptual block diagram of a sign language recognition device according to the present invention. In FIG. 1, a sign language operation input unit 101 is a unit for converting an operation representing a sign language sentence into an electric signal and inputting the signal as time-series sign language sentence data.
The well-known glove-type device 102 can be used. As the sign language operation input unit 101, a video camera and an image recognition device that recognizes the position and shape of a hand from a video image can be used. Sign language word recognition unit 10
A unit 3 recognizes each sign language word expressed in the sign language sentence data input by the sign language operation input unit 101. The sign language word recognition unit can use an existing technology, for example, a technology described in Japanese Patent Application Laid-Open No. 10-208023 (sign language recognition device).
【0017】手話データ分割部104は、手話動作入力
部101によって入力された手話文データ中の各手話単
語や渡り動作(手話単語間の遷移動作)の境界を検出
し、手話文データを手話単語や渡り動作を表す区間に分
割するための手段である。動作特徴抽出部105は、手
話データ分割部104によって分割された手話文データ
中の各区間から、区間中における動作の特徴に関する情
報を抽出するための手段である。手話単語情報格納部1
06は、手話単語を表現する際に使用する手の種類や動
作の構造等の手話単語に関する情報を格納する手段であ
る。The sign language data division unit 104 detects the boundaries of each sign language word and the transition operation (transition operation between sign language words) in the sign language sentence data input by the sign language operation input unit 101, and converts the sign language sentence data into the sign language word. This is a means for dividing into sections representing jumping movements. The motion feature extraction unit 105 is a unit for extracting information on the feature of the motion in the section from each section in the sign language sentence data divided by the sign language data division unit 104. Sign language word information storage 1
Reference numeral 06 denotes a unit for storing information about the sign language word such as the type of hand and the structure of the motion used when expressing the sign language word.
【0018】分割区間手話単語対応部107は、手話単
語分割部104によって分割された手話文データ中の各
区間と手話単語認識部103によって認識された手話単
語を手話単語情報格納部106の内容に基づいて対応付
け、さらに、動作特徴抽出部105によって抽出された
各区間の動作の特徴に基づいて、各区間に対応付けられ
た手話単語に優先順位をつけるための手段である。手話
単語列生成部108は、分割区間手話単語対応部107
によって得られた手話文データ中の分割された各区間と
認識された手話単語の対応付け、及び各区間中の手話単
語の優先順位に基づいて、手話単語列を生成するための
手段である。手話単語列生成部108の出力として、生
成された手話単語列109が出力される。The divided section sign language word correspondence section 107 stores each section in the sign language sentence data divided by the sign language word division section 104 and the sign language word recognized by the sign language word recognition section 103 into the contents of the sign language word information storage section 106. This is means for assigning priorities to the sign language words associated with each section based on the characteristics of the movement of each section extracted by the movement feature extraction unit 105. The sign language word string generation unit 108 includes a divided section sign language word correspondence unit 107.
This is means for generating a sign language word string based on the correspondence between the divided sections in the sign language sentence data obtained and the recognized sign language words, and the priority of the sign language words in each section. As an output of the sign language word string generation unit 108, the generated sign language word string 109 is output.
【0019】図2に、手話動作入力部101によって入
力される手話文データのフォーマットを示す。図2にお
いて、201は手の位置に関するデータであり、手の位
置はさらにx軸のデータ202、y軸のデータ203、
z軸のデータ204から構成されている。205は手の
方向に関するデータであり、手の方向はさらにx軸回り
の回転角度206、y軸回りの回転角度207、z軸回
りの回転角度208から構成されている。209は指の
曲げに関するデータであり、指の曲げはさらに、親指の
第2関節の曲げ角度210、親指の第3関節の曲げ角度
211、人差し指の第1関節の曲げ角度212、人差し
指の第2関節の曲げ角度213、中指の第1関節の曲げ
角度214、中指の第2関節の曲げ角度215、薬指の
第1関節の曲げ角度216、薬指の第2関節の曲げ角度
217、小指の第1関節の曲げ角度218、小指の第2
関節の曲げ角度219から構成されている。また、22
0,221,…,222はそれぞれ、時刻t1,t2,
…,tnにおける手の位置、方向、指の曲げのデータを
表す。このように、手話における動作は手の位置20
1、手の方向205、指の曲げ209からなる時系列デ
ータとして表される。FIG. 2 shows a format of the sign language sentence data input by the sign language operation input unit 101. In FIG. 2, reference numeral 201 denotes data relating to the position of the hand, and the position of the hand is further represented by x-axis data 202, y-axis data 203,
It is composed of z-axis data 204. Reference numeral 205 denotes data relating to the direction of the hand. The direction of the hand further includes a rotation angle 206 about the x axis, a rotation angle 207 about the y axis, and a rotation angle 208 about the z axis. Reference numeral 209 denotes data related to the bending of the finger. The bending of the finger further includes a bending angle 210 of the second joint of the thumb, a bending angle 211 of the third joint of the thumb, a bending angle 212 of the first joint of the index finger, and a bending angle 212 of the index finger. Bending angle 213 of the joint, bending angle 214 of the first joint of the middle finger, bending angle 215 of the second joint of the middle finger, bending angle 216 of the first joint of the ring finger, bending angle 217 of the second joint of the ring finger, first bending of the little finger Joint bending angle 218, little finger second
It consists of a joint bending angle 219. Also, 22
0, 221,..., 222 are time t1, t2, respectively.
.., Tn represents the data of the hand position, direction, and finger bending. As described above, the operation in the sign language is based on the hand position 20.
1, the hand direction 205 and the finger bending 209 are represented as time-series data.
【0020】図3は、手話単語情報格納部106に格納
される各手話単語に関する情報のフォーマットである。
図3において、手話単語名301は手話単語の名称を表
す文字列である。動作タイプ302は手話単語の動作の
タイプを表す記号であり、「上限あり」、「上限無
し」、「提示動作」のいずれかが記述される。「上限有
り」は、手話データ分割部104によって一つ以上の区
間に分割されると予想される手話単語であり、分割され
る区間数があらかじめ予想できる場合である。一方、
「上限無し」は、「上限あり」の場合と同様に一つ以上
の区間に分割されると予想されるが、分割される区間数
はあらかじめ予想できない場合である。「提示動作」は
空間上に印を押すような動作を行う手話単語であり、
「上限あり」に分類される手話単語のうち、区間の数が
一つの場合に相当する。区間数が1の「上限あり」の場
合と「提示動作」の違いは、前者では手話データ分割部
104によって分割される区間全体あるいはその一部に
手話単語の動作が対応するのに対し、後者は動きのある
状態から動きの無い状態に変化する部分に意味があるた
め、区間の終了部分にのみ対応する、ということであ
る。使用手303は、手話単語を表現する際に使用する
手の種類であり、「右手」、「左手」、「両手」のいず
れかを記述する。手話単語に関する情報としては、この
他、手話単語を表現する際の手の位置や手の方向、ある
いは、両手を使用する場合であれば両手の位置関係等を
記述することができる。区間数304は、手話単語を表
す動作が手話データ分割部104によって分割される区
間の数を表す。「上限あり」の場合は区間の上限数を記
述し、「上限無し」の場合は無制限であることを表す0
を記述する。また、「提示動作」の場合は上限値1を記
述する。FIG. 3 shows a format of information on each sign language word stored in the sign language word information storage unit 106.
In FIG. 3, the sign language word name 301 is a character string representing the name of the sign language word. The action type 302 is a symbol indicating the type of action of the sign language word, and any one of “with upper limit”, “without upper limit”, and “presentation action” is described. “With upper limit” is a sign language word that is expected to be divided into one or more sections by the sign language data dividing unit 104, and is a case where the number of divided sections can be predicted in advance. on the other hand,
“No upper limit” is expected to be divided into one or more sections as in the case of “with upper limit”, but the number of sections to be split cannot be predicted in advance. “Presentation action” is a sign language word that performs an action such as pressing a mark in space.
This corresponds to the case where the number of sections is one among the sign language words classified as “with upper limit”. The difference between the case where “there is an upper limit” where the number of sections is 1 and the “presentation action” is that the sign language word action corresponds to the whole or a part of the section divided by the sign language data dividing unit 104 in the former, whereas Means that there is a meaning in the part where the state changes from a state of movement to a state of no movement, so that it corresponds only to the end part of the section. The user's hand 303 is a type of hand used when expressing a sign language word, and describes any one of “right hand”, “left hand”, and “both hands”. In addition, as the information on the sign language word, the position and hand direction of the hand when expressing the sign language word, or the positional relationship of both hands when using both hands can be described. The number of sections 304 represents the number of sections in which the operation representing the sign language word is divided by the sign language data dividing unit 104. In the case of "with upper limit", describe the upper limit number of the section, and in the case of "without upper limit", 0 indicating that there is no limit
Describe. In the case of “presentation operation”, the upper limit value 1 is described.
【0021】次に、図4から図8を用いて、手話データ
分割部104において、手話文データを分割する方法に
つい手の動作速度が極小になる時刻を検出する。両手の
動作速度は、次の(数1)によって求て説明する。手話
文の動作では、図4に示すように、手話単語の境界(図
中に×で示す時刻)で動作速度が極小になる傾向を示
す。そこで、動作の境界として、両める。Next, referring to FIG. 4 to FIG. 8, the sign language data dividing unit 104 detects the time when the operation speed of the hand is extremely low in the method of dividing the sign language sentence data. The operation speed of both hands is obtained and described by the following (Equation 1). In the operation of the sign language sentence, as shown in FIG. 4, the operation speed tends to be minimal at the boundary of the sign language word (time indicated by X in the figure). Therefore, both are used as boundaries of operation.
【0022】[0022]
【数1】 (Equation 1)
【0023】式中、V0(t)は、時刻tにおける両手の
動作速度、P(t, i, j)は時刻tにおける手i(i=
0:右手、i=1:左手)の部位j(j=0:掌、j=
1:親指、j=2:人差し指、j=3:中指、j=4:
薬指、j=5:小指)の位置ベクトルである。また、
(数1)の分母は12である。In the equation, V0 (t) is the motion speed of both hands at time t, and P (t, i, j) is the hand i (i =
0: right hand, i = 1: left hand, site j (j = 0: palm, j =
1: thumb, j = 2: index finger, j = 3: middle finger, j = 4:
Ring finger, j = 5: little finger). Also,
The denominator of (Equation 1) is 12.
【0024】図2に示した手話文データのフォーマット
では、各指の先端の位置が含まれていないため、手の位
置、手の方向、指の曲げ角度、及び図5に示すような手
のモデルを用いて各指の先端の位置を計算する。計算方
法は三次元グラフィックスの分野等で良く知られている
方法を用いることができる。あるいは、指の先端に位置
センサを装着することにより直接入力することもでき
る。In the sign language sentence data format shown in FIG. 2, the position of the tip of each finger is not included, so that the hand position, hand direction, finger bending angle, and hand position as shown in FIG. The position of the tip of each finger is calculated using the model. As a calculation method, a method well known in the field of three-dimensional graphics or the like can be used. Alternatively, the input can be made directly by attaching a position sensor to the tip of the finger.
【0025】また、動作速度があらかじめ決められた速
度より小さくなる時刻、及び動作速度があらかじめ決め
られた速度より小さい状態からあらかじめ決められた速
度より大きい状態になる時刻も境界として検出する。次
に、検出した境界によって分割される各区間において、
左右それぞれの手における動作速度の極小値を検出し、
その結果も境界に追加する。左右それぞれの手の動作速
度は、次の(数2)によって求められる。Also, the time when the operation speed becomes lower than the predetermined speed and the time when the operation speed changes from a state lower than the predetermined speed to a state higher than the predetermined speed are detected as boundaries. Next, in each section divided by the detected boundary,
Detect the minimum value of the operating speed for each of the left and right hands,
The result is also added to the boundary. The motion speed of each of the right and left hands is obtained by the following (Equation 2).
【0026】[0026]
【数2】 (Equation 2)
【0027】式中、V1(i, t)は手i(i=0:右手、
i=1:左手)の時刻tにおける動作速度である。(数
2)の分母は6である。ただし、それぞれの手の動作速
度から求めた極小値の場合、左右の手が同期して動く場
合でも、動作速度が極小になる時刻がずれる可能性があ
る。このため、図6に示す流れ図に従って追加する境界
を決定する。In the formula, V1 (i, t) is a hand i (i = 0: right hand,
i = 1: operating speed at time t (left hand). The denominator of (Equation 2) is 6. However, in the case of the minimum value obtained from the operation speed of each hand, there is a possibility that the time at which the operation speed becomes minimum is shifted even when the left and right hands move synchronously. Therefore, a boundary to be added is determined according to the flowchart shown in FIG.
【0028】図6のステップ601において、左右それ
ぞれの手で検出された動作速度の極小値の数を比較し、
極小値の数が同じであればステップ602に、違ってい
ればステップ606に進む。ステップ602では、左右
それぞれの手において、極小値によって分割される区間
全ての組み合わせに対して時間長の差を求め、さらにそ
の平均を求める。ステップ603では、右手における時
間長の差と左手における時間長の差を比較し、右手の方
が小さければステップ604に、左手の方が小さければ
ステップ605に進む。ステップ604では右手の動作
速度から検出された極小値の時刻を境界に追加する。ス
テップ605では左手の動作速度から検出された極小値
の時刻を境界に追加する。また、ステップ602におい
て、時間長の差を求める代わりに時間長の比を求めても
良い。ステップ606では、左右それぞれの手の動作速
度から検出された極小値の数を比較し、右手の方が多け
ればステップ607に、左手の方が多ければステップ6
08に進む。ステップ607では右手の動作速度から検
出された極小値の時刻を境界に追加する。ステップ60
8では左手の動作速度から検出された極小値の時刻を境
界に追加する。In step 601 of FIG. 6, the numbers of the minimum values of the operation speed detected by the right and left hands are compared.
If the number of the minimum values is the same, the process proceeds to step 602; otherwise, the process proceeds to step 606. In step 602, for each of the right and left hands, a difference in time length is obtained for all combinations of sections divided by the minimum value, and the average thereof is obtained. In step 603, the difference in time length between the right hand and the left hand is compared. If the right hand is smaller, the process proceeds to step 604. If the left hand is smaller, the process proceeds to step 605. In step 604, the time of the minimum value detected from the operation speed of the right hand is added to the boundary. In step 605, the time of the minimum value detected from the operation speed of the left hand is added to the boundary. In step 602, a ratio of time lengths may be obtained instead of obtaining a difference in time lengths. In step 606, the number of minimum values detected from the movement speed of each of the right and left hands is compared. If the right hand has more, the process proceeds to step 607;
Proceed to 08. In step 607, the time of the minimum value detected from the operation speed of the right hand is added to the boundary. Step 60
At 8, the time of the minimum value detected from the operation speed of the left hand is added to the boundary.
【0029】手話データ分割部104は、動作速度の極
小値に基づく境界に加え、動作方向変化に基づく境界の
検出も行い、境界に追加する。動作方向変化による境界
は、次の(数3)の条件を満たす場合に検出される。The sign language data dividing unit 104 detects a boundary based on a change in the operation direction in addition to the boundary based on the minimum value of the operation speed, and adds the boundary to the boundary. A boundary due to a change in the operation direction is detected when the following condition (Equation 3) is satisfied.
【0030】[0030]
【数3】 (Equation 3)
【0031】式中、I(t, i, j)は時刻t、手i、部位
jにおける動作方向変化、nは動作方向変化を求めるた
めのデータ範囲、Θは動作方向変化の閾値である。上記
(数3)によって検出される境界は、動作速度の極小値
による境界と時間的なずれが生じる可能性がある。この
ため、動作方向変化によって検出された境界は、動作速
度によって検出された境界のうち、時間的に最も近い境
界に重なって検出されたものと見なし、境界の特徴とし
て、動作方向変化が含まれることを表す情報を付加す
る。In the equation, I (t, i, j) is a change in the movement direction at time t, hand i, and site j, n is a data range for obtaining the change in the movement direction, and Θ is a threshold value of the change in the movement direction. The boundary detected by the above (Equation 3) may be temporally shifted from the boundary due to the minimum value of the operation speed. For this reason, the boundary detected by the movement direction change is considered to be detected as overlapping with the temporally closest boundary among the boundaries detected by the operation speed, and the movement direction change is included as a characteristic of the boundary. Is added.
【0032】検出された各境界に関する情報は、図7に
示すようなフォーマットで記述される。図7において時
刻701は、その境界が検出された時刻を表す。境界タ
イプ702には、「速度のみ」、「方向変化有り」、
「停止遷移」、「動作遷移」のいずれかが記述される。
「速度のみ」は、その境界が動作速度のみによって検出
された候補であることを表す。一方、「方向変化有り」
は、動作速度に加え動作方向変化によっても検出された
境界であることを表す。また、「停止遷移」は動作速度
があらかじめ決められた閾値より小さくなったことによ
り検出された境界、「動作遷移」は動作速度があらかじ
め決められた閾値より小さい状態から大きい状態に変化
したことにより検出された境界であることを表す。使用
手703は、その境界が両手の動作速度から検出された
か、左手のみの動作速度から検出されたか、あるいは右
手のみの動作速度から検出されたかを表す。Information on each detected boundary is described in a format as shown in FIG. In FIG. 7, a time 701 indicates a time when the boundary is detected. The boundary type 702 includes “speed only”, “change direction”,
Either “stop transition” or “operation transition” is described.
“Only speed” indicates that the boundary is a candidate detected only by the operation speed. On the other hand, "direction change"
Indicates that the boundary is detected not only by the operation speed but also by the change in the operation direction. Also, “stop transition” is a boundary detected when the operation speed has become smaller than the predetermined threshold, and “operation transition” is because the operation speed has changed from a state smaller than the predetermined threshold to a larger state. Indicates a detected boundary. The user's hand 703 indicates whether the boundary is detected from the operation speed of both hands, the operation speed of only the left hand, or the operation speed of only the right hand.
【0033】検出された境界に基づいて、手話文データ
を分割し、各区間に分割する。検出された境界のみで分
割を行うと、動作の微妙な揺れ等により、余分な区間に
分割される可能性があるため、ここでは、図8に示す流
れ図に従った処理により、余分な境界を削除する。この
処理は、図14に図示するように、境界タイプが「速度
のみ」である境界iについて、境界(i−1)と境界i
の間の区間における最大動作速度と境界iにおける動作
速度との差D1、あるいは境界iと境界(i+1)の間
の区間における最大動作速度と境界iにおける動作速度
との差D2が小さい場合に、境界iを削除する処理であ
る。The sign language sentence data is divided based on the detected boundaries, and divided into sections. If the division is performed only on the detected boundary, there is a possibility that the division may be made into an extra section due to a slight fluctuation of the operation or the like. Therefore, here, the extra boundary is processed by the processing according to the flowchart shown in FIG. delete. As shown in FIG. 14, this processing is performed on the boundary (i−1) and the boundary i for the boundary i whose boundary type is “velocity only”.
Is smaller than the difference D1 between the maximum operating speed in the section between and the operating speed at the boundary i, or the difference D2 between the maximum operating speed in the section between the boundary i and the boundary (i + 1) and the operating speed at the boundary i, This is the process of deleting the boundary i.
【0034】図8において、ステップ801では、検出
された境界を示すカウンタiを最初の境界を表す1に設
定する。ステップ802では、カウンタiの値が検出さ
れた境界数より大きいかどうかを調べる。小さいか等し
ければステップ803に進む。大きければ処理を終了す
る。ステップ803ではカウンタiで示される境界の境
界タイプが「停止遷移」あるいは「動作遷移」のいずれ
かであるかどうかを調べる。「停止遷移」あるいは「動
作遷移」のいずれかであれば、ステップ815に進む。
そうでなければステップ804に進む。ステップ804
では、(i−1)の値が1より小さいかどうかを調べ、
1より小さければステップ807に進み、変数D1にあ
らかじめ決められた閾値より大きい値を設定する。(i
−1)の値が1以上であればステップ805に進む。ス
テップ805では、(i−1)とiで示される境界によ
ってはさまれる区間における動作速度の最大値を求め
る。ステップ806では、求めた動作速度の最大値とカ
ウンタiによって示される境界における動作速度の差D
1を求める。動作速度の差を求める際、境界に関する情
報中の使用手703を参照し、両手の場合は両手の動作
速度の差を、左手あるいは右手の場合はそれぞれの手の
動作速度の差を求める。In FIG. 8, in step 801, a counter i indicating a detected boundary is set to 1 indicating the first boundary. In step 802, it is checked whether the value of the counter i is larger than the detected number of boundaries. If smaller or equal, the process proceeds to step 803. If it is larger, the process ends. In step 803, it is checked whether the boundary type of the boundary indicated by the counter i is “stop transition” or “operation transition”. If it is “stop transition” or “operation transition”, the process proceeds to step 815.
Otherwise, go to step 804. Step 804
Then, it is checked whether the value of (i-1) is smaller than 1.
If it is smaller than 1, the process proceeds to step 807, and a value larger than a predetermined threshold is set to the variable D1. (I
If the value of -1) is 1 or more, the process proceeds to step 805. In step 805, the maximum value of the operation speed in the section between the boundary indicated by (i-1) and i is obtained. In step 806, the difference D between the obtained maximum operation speed and the operation speed at the boundary indicated by the counter i is calculated.
Find 1 When calculating the difference between the operation speeds, the user's hand 703 in the information regarding the boundary is referred to, and the difference between the operation speeds of both hands is calculated for both hands, and the difference between the operation speeds of the respective hands is calculated for the left or right hand.
【0035】ステップ808では(i+1)の値が検出
された境界数より大きいかどうかを調べ、大きければス
テップ811へ、そうでなければステップ809へ進
む。ステップ811では変数D2にあらかじめ決められ
た閾値より大きい値を設定する。ステップ809では、
(i+1)とiで示される境界によってはさまれる区間
における動作速度の最大値を求める。ステップ810で
は、求めた動作速度の最大値とカウンタiによって示さ
れる境界における動作速度の差D2を求める。ステップ
812では、D1とD2があらかじめ決められた閾値よ
り小さいかどうかを調べる。D1あるいはD2のいずれ
かが閾値より小さい場合、ステップ813に進む。そう
でない場合はステップ815に進む。ステップ813で
は、カウンタiによって示される境界の境界タイプが
「方向変化有り」であるかどうかを調べ、「方向変化有
り」であれば、ステップ815に進む。そうでなければ
ステップ814に進み、カウンタiによって示される境
界を削除する。ステップ815ではカウンタiの値を1
増加し、ステップ802に戻る。In step 808, it is checked whether or not the value of (i + 1) is larger than the detected number of boundaries. If it is larger, the process proceeds to step 811; otherwise, the process proceeds to step 809. In step 811, a value larger than a predetermined threshold is set to the variable D2. In step 809,
The maximum value of the operation speed in a section between the boundary indicated by (i + 1) and i is obtained. In step 810, a difference D2 between the obtained maximum operation speed and the operation speed at the boundary indicated by the counter i is obtained. In step 812, it is checked whether D1 and D2 are smaller than a predetermined threshold. If either D1 or D2 is smaller than the threshold, the process proceeds to step 813. Otherwise, go to step 815. In step 813, it is checked whether the boundary type of the boundary indicated by the counter i is “change in direction”, and if it is “change in direction”, the process proceeds to step 815. Otherwise, proceed to step 814 to delete the boundary indicated by counter i. In step 815, the value of the counter i is set to 1
Increase and return to step 802.
【0036】次に、動作特徴抽出部105において行う
動作の特徴を抽出する処理について説明する。動作特徴
抽出部105では、手話データ分割部104によって検
出された境界によって分割される手話文データ中の各区
間における動作の特徴として、使用している手の種類を
抽出する。このため、各区間において、最大動作速度の
比、及び動作速度変化の差を求める。最大動作速度の比
は各区間における左右それぞれの手の最大動作速度を求
めた後、(数4)によって計算される。Next, a description will be given of a process of extracting a feature of an operation performed by the operation feature extracting unit 105. The motion feature extraction unit 105 extracts the type of hand used as a motion feature in each section in the sign language sentence data divided by the boundary detected by the sign language data division unit 104. Therefore, in each section, the ratio of the maximum operation speed and the difference in the change in the operation speed are obtained. The ratio of the maximum operation speed is calculated by (Equation 4) after obtaining the maximum operation speed of each of the right and left hands in each section.
【0037】[0037]
【数4】 (Equation 4)
【0038】式中、R0は最大動作速度の比、M1は右
手における最大動作速度、M2は左手における最大動作
速度である。また、動作速度変化の差は(数5)によっ
て計算される。In the equation, R0 is the ratio of the maximum operation speed, M1 is the maximum operation speed in the right hand, and M2 is the maximum operation speed in the left hand. Also, the difference in the change in the operating speed is calculated by (Equation 5).
【0039】[0039]
【数5】 (Equation 5)
【0040】式中、R1は動作速度変化の差、sは区間
の開始時刻、eは区間の終了時刻である。なお、(数
5)の分母は(e−s+1)である。前記(数4)及び
(数5)によって求めたパラメータR0,R1がいずれ
も閾値以下の場合、その区間は両手を使用していると判
断する。それ以外の場合は、片手のみを使用していると
判断する。(数5)では、左右それぞれの手の最大動作
速度が一致するように正規化を行って動作速度変化の差
を求めている。動作速度変化の差としては、左右それぞ
れの手における動作速度変化の差を求めた後、最大動作
速度の比に基づいて正規化を行ってもよい。また、最大
動作速度の比及び動作速度変化の差以外に、最大動作速
度の差、平均動作速度の差あるいは比、移動距離の差あ
るいは比、動作方向の差、等に基づいて判断することも
できる。両手か片手かの判定を行った後、さらに、左右
いずれの手を主に使用しているかの判定を行う。このた
めに、各区間において、最大動作速度の比を求める。こ
こで求める最大動作速度の比は(数4)と基本的に同様
であるが、符号を考慮して(数6)により計算する。In the equation, R1 is the difference in the change in operating speed, s is the start time of the section, and e is the end time of the section. The denominator of (Equation 5) is (e−s + 1). If both the parameters R0 and R1 obtained by (Equation 4) and (Equation 5) are equal to or smaller than the threshold value, it is determined that both hands are used in the section. In other cases, it is determined that only one hand is used. In (Equation 5), normalization is performed so that the maximum operation speed of each of the right and left hands coincides with each other, and the difference in the operation speed change is obtained. As the difference in the operation speed change, the difference between the operation speed changes in the right and left hands may be obtained, and then the normalization may be performed based on the ratio of the maximum operation speed. Also, in addition to the maximum operating speed ratio and the difference in operating speed change, the determination may be made based on the maximum operating speed difference, the average operating speed difference or ratio, the moving distance difference or ratio, the operating direction difference, and the like. it can. After the determination of both hands or one hand, it is further determined whether the left or right hand is mainly used. For this purpose, the ratio of the maximum operation speed is obtained in each section. The ratio of the maximum operation speed obtained here is basically the same as (Equation 4), but is calculated by (Equation 6) in consideration of the sign.
【0041】[0041]
【数6】 (Equation 6)
【0042】式中、R2は使用している手を判別するた
めの最大動作速度の比である。(数6)により計算した
パラメータR2が正の場合は右手を主に使用していると
判定し、負の場合は左手を主に使用していると判定す
る。この判定も、最大動作速度の比以外に、最大動作速
度の差、平均動作速度の差あるいは比、移動距離の差あ
るいは比、動作方向の差、等に基づいて判断することが
できる。In the equation, R2 is the ratio of the maximum operating speed for determining the hand in use. When the parameter R2 calculated by (Equation 6) is positive, it is determined that the right hand is mainly used, and when it is negative, it is determined that the left hand is mainly used. This determination can also be made based on a difference between the maximum operation speeds, a difference or ratio between the average operation speeds, a difference or ratio between the moving distances, a difference between the operation directions, and the like, in addition to the ratio between the maximum operation speeds.
【0043】動作特徴抽出部105において動作の特徴
を抽出した後、動作の境界によって分割される区間に関
する情報を図9に示すようなフォーマットで記述する。
図9において901は、その区間の開始時刻を表す。9
02はその区間の終了時刻を表す。区間タイプ903は
その区間の特徴を表し、「両手」、「右手」、「左
手」、「停止」、「ポーズ」のいずれかが記述される。
「両手」はその区間が両手を使用した動作であることを
示す。「右手」及び「左手」は片手を使用した動作であ
ることを示し、主に使用されていると判断された手の種
類を記述する。「停止」及び「ポーズ」は、境界タイプ
702が「停止遷移」と「動作遷移」である境界によっ
て挟まれる区間に対して付加される。「停止」は区間の
時間長があらかじめ決められた時間長より大きい場合、
「ポーズ」はあらかじめ決められた時間長より小さい場
合に指定される。主手904は区間タイプが「両手」の
場合にのみ記述される。(数4)及び(数5)によって
その区間のタイプが「両手」と判定された場合でも、実
際には片手の動作である可能性もある。このため、「両
手」と判定された場合、(数6)によって判定される主
に使用されている手の種類、すなわち「右手」あるいは
「左手」を主手904に記述する。区間タイプ903と
しては、手話の動作で使用されている手の種類の他、手
の位置や手の方向、あるいは、両手の場合であれば両手
の位置関係等に関する情報を抽出し、記述することもで
きる。After the motion feature extraction unit 105 extracts the motion feature, information on the section divided by the boundary of the motion is described in a format as shown in FIG.
In FIG. 9, reference numeral 901 denotes the start time of the section. 9
02 represents the end time of the section. The section type 903 indicates the feature of the section, and any one of “both hands”, “right hand”, “left hand”, “stop”, and “pause” is described.
“Both hands” indicates that the section is an operation using both hands. “Right hand” and “left hand” indicate a movement using one hand, and mainly describe the type of hand determined to be used. “Stop” and “pause” are added to a section sandwiched by boundaries whose boundary types 702 are “stop transition” and “operation transition”. "Stop" means that if the duration of the section is longer than the predetermined duration,
“Pause” is designated when the time length is shorter than a predetermined time length. The main player 904 is described only when the section type is “both hands”. Even when the type of the section is determined to be “two hands” based on (Equation 4) and (Equation 5), there is a possibility that the operation is actually one-handed. For this reason, when it is determined to be “both hands”, the type of the mainly used hand determined by (Equation 6), that is, “right hand” or “left hand” is described in the main hand 904. As the section type 903, in addition to the type of hand used in the sign language operation, information about the hand position and hand direction, or in the case of both hands, information on the positional relationship between both hands is extracted and described. Can also.
【0044】次に、手話文データから検出された境界に
よって分割された各区間に手話単語の認識結果を対応付
ける処理について説明する。図10に、手話単語認識部
103から出力される手話単語の認識結果のフォーマッ
トを示す。図10において、手話単語名1001は認識
された手話単語の名称、開始時刻1002は認識された
手話単語の開始時刻、終了時刻1003は認識された手
話単語の終了時刻、評価値1004は認識された手話単
語の確からしさを表す評価値である。Next, a description will be given of a process of associating each section divided by the boundary detected from the sign language sentence data with the recognition result of the sign language word. FIG. 10 shows a format of a recognition result of the sign language word output from the sign language word recognition unit 103. In FIG. 10, the sign language word name 1001 is the name of the recognized sign language word, the start time 1002 is the start time of the recognized sign language word, the end time 1003 is the end time of the recognized sign language word, and the evaluation value 1004 is recognized. This is an evaluation value indicating the certainty of the sign language word.
【0045】図9に示した区間に関する情報と、図10
に示した認識された手話単語の認識結果に基づいて、区
間と手話単語の対応付けは、図11に示す流れ図に従っ
て行われる。図11においてステップ1101では、ま
ず、認識された手話単語を識別するカウンタiを最初の
手話単語を表す1にセットする。ステップ1102では
カウンタiの値が認識された手話単語の数より大きいか
どうかを調べる。カウンタiの値が手話単語数より大き
ければ処理を終了する。そうでなければステップ110
3に進む。ステップ1103では、カウンタiが示す手
話単語の時間範囲との重なり度が閾値以上になる区間を
検索する。手話単語の時間範囲と各区間の時間範囲との
重なり度は(数7)によって計算する。The information on the section shown in FIG.
Based on the recognition result of the recognized sign language words shown in FIG. 11, the sections and the sign language words are associated with each other in accordance with the flowchart shown in FIG. In FIG. 11, in step 1101, first, a counter i for identifying a recognized sign language word is set to 1 representing the first sign language word. In step 1102, it is checked whether the value of the counter i is larger than the number of recognized sign language words. If the value of the counter i is larger than the number of sign language words, the process ends. Otherwise step 110
Proceed to 3. In step 1103, a section in which the degree of overlap with the time range of the sign language word indicated by the counter i is equal to or larger than a threshold is searched. The degree of overlap between the time range of the sign language word and the time range of each section is calculated by (Equation 7).
【0046】[0046]
【数7】 (Equation 7)
【0047】式中、Oは区間と手話単語の時間範囲の重
なり度、Rsは区間の開始時刻、Reは区間の終了時
刻、Wsは手話単語の開始時刻、Weは手話単語の終了
時刻である。ステップ1104では、検索された区間に
「停止」が含まれているかどうかを調べ、「停止」が含
まれていればステップ1122に進む。停止が含まれて
いなければステップ1105に進み、カウンタiの示す
手話単語が「提示動作」であるかどうかを調べる。手話
単語が「提示動作」であればステップ1106に進む。
そうでなければステップ1107に進む。ステップ11
06では、検索された区間の内時間的に最も早い区間を
カウンタiの示す手話単語に対応する区間として登録
し、ステップ1122に進む。ステップ1107ではカ
ウンタiの示す手話単語が「上限無し」であるかどうか
を調べ、「上限無し」であればステップ1108に進
む。そうでなければステップ1109に進む。ステップ
1108では、検索された全ての区間をカウンタiの示
す手話単語に対応する区間として登録し、ステップ11
22に進む。ステップ1109では、検索された区間の
数が手話単語情報中の区間数304以下であるかどうか
を調べ、区間数以下であればステップ1108に進む。
そうでなければステップ1110に進む。In the formula, O is the degree of overlap between the time range of the section and the sign language word, Rs is the start time of the section, Re is the end time of the section, Ws is the start time of the sign language word, and We is the end time of the sign language word. . In step 1104, it is checked whether “stop” is included in the searched section. If “stop” is included, the process proceeds to step 1122. If the stop is not included, the process proceeds to step 1105 to check whether the sign language word indicated by the counter i is “presentation operation”. If the sign language word is “presentation operation”, the process proceeds to step 1106.
Otherwise, go to step 1107. Step 11
At 06, the earliest section in time of the searched sections is registered as a section corresponding to the sign language word indicated by the counter i, and the process proceeds to step 1122. In step 1107, it is checked whether or not the sign language word indicated by the counter i is "no upper limit". Otherwise, go to step 1109. In step 1108, all the searched sections are registered as sections corresponding to the sign language word indicated by the counter i, and in step 11
Proceed to 22. In step 1109, it is checked whether or not the number of searched sections is equal to or less than the number of sections 304 in the sign language word information.
Otherwise, go to step 1110.
【0048】ステップ1110では、検索された区間の
内、時間的に最も早い区間と最も遅い区間の手話単語と
の重なり度を計算し、ステップ1111に進む。重なり
度の計算は(数7)によって行うことができる。ステッ
プ1111では、時間的に最も早い区間の重なり度が時
間的に最も遅い区間の重なり度より小さいかどうかを調
べ、小さければステップ1112に進む。そうでなけれ
ばステップ1118に進む。ステップ1112では、時
間的に最も早い区間を削除し、ステップ1113におい
て残りの区間の数が手話単語情報中の区間数304以下
であるかどうかを調べる。区間数以下であればステップ
1115に進む。そうでなければステップ1116に進
む。ステップ1115では、残っている区間全てをカウ
ンタiが示す手話単語に対応する区間として登録し、ス
テップ1122へ進む。ステップ1116では、時間的
に最も遅い区間を削除し、ステップ1117において残
りの区間の数が手話単語情報中の区間数304以下であ
るかどうかを調べる。区間数以下であればステップ11
15に進む。そうでなければステップ1122に進む。
ステップ1118では、時間的に最も遅い区間を削除
し、ステップ1119において残りの区間の数が手話単
語情報中の区間数304以下であるかどうかを調べる。
区間数以下であればステップ1115に進む。そうでな
ければステップ1120に進む。ステップ1120で
は、時間的に最も早い区間を削除し、ステップ1121
において残りの区間の数が手話単語情報中の区間数30
4以下であるかどうかを調べる。区間数以下であればス
テップ1115に進む。そうでなければステップ112
2に進む。ステップ1122ではカウンタiの値を1増
加し、ステップ1102に戻る。ステップ1115にお
いて、残っている区間を手話単語に対応する区間として
登録する前に、残っている区間によって表される時間範
囲と手話単語との時間範囲との重なりを調べ、重なりが
閾値以上であれば、残っている区間を登録するようにし
てもよい。At step 1110, the degree of overlap between the earliest and the latest sign language words in the searched sections is calculated, and the process proceeds to step 1111. The calculation of the degree of overlap can be performed by (Equation 7). In step 1111, it is determined whether or not the overlap degree of the earliest section is smaller than the overlap degree of the latest section. If the overlap degree is smaller, the process proceeds to step 1112. Otherwise, go to step 1118. In step 1112, the earliest section is deleted, and it is checked in step 1113 whether the number of remaining sections is equal to or less than the number 304 of sections in the sign language word information. If it is equal to or less than the number of sections, the process proceeds to step 1115. Otherwise, go to step 1116. In step 1115, all remaining sections are registered as sections corresponding to the sign language word indicated by the counter i, and the process proceeds to step 1122. In step 1116, the section that is the latest in time is deleted, and in step 1117 it is checked whether the number of remaining sections is equal to or less than the number of sections 304 in the sign language word information. If less than the number of sections, step 11
Proceed to 15. Otherwise, go to step 1122.
In step 1118, the section that is the latest in time is deleted, and in step 1119, it is checked whether the number of remaining sections is equal to or less than the number of sections 304 in the sign language word information.
If it is equal to or less than the number of sections, the process proceeds to step 1115. Otherwise, go to step 1120. In step 1120, the earliest section in time is deleted, and in step 1121
, The number of remaining sections is 30 in the sign language word information.
Check if it is 4 or less. If it is equal to or less than the number of sections, the process proceeds to step 1115. Otherwise, step 112
Proceed to 2. In step 1122, the value of the counter i is increased by 1, and the process returns to step 1102. In step 1115, before registering the remaining section as the section corresponding to the sign language word, the overlap between the time range represented by the remaining section and the time range of the sign language word is checked. For example, the remaining sections may be registered.
【0049】手話単語と区間との対応付けを行った後、
各区間毎に対応する手話単語のリストを作成する。手話
単語リストの作成は、同じ区間に対応する手話単語を検
索することにより、容易に作成することができる。区間
毎の手話単語リストのフォーマットを図12に示す。図
12において1201は区間の開始時刻、1202は区
間の終了時刻を表す。区間の開始時刻1201及び終了
時刻1202は、図9に示した区間に関する情報中に記
述される開始時刻901及び終了時刻902と同じであ
る。1203はその区間に対応する手話単語の数であ
る。手話単語名1204及び1208はその区間に対応
する手話単語の名称、評価値1205及び1209はそ
の区間に対応する手話単語の評価値である。手話単語名
及び評価値は、手話単語の認識結果に含まれる手話単語
名1001及び評価値1004を記述する。開始区間1
206及び1210は手話単語が対応する最初の区間を
表す番号、終了区間1207及び1211は手話単語が
対応する最後の区間を表す番号である。区間の番号12
06,1207,1210,1211は、手話単語に複
数の区間が対応する場合に、後述の手話単語列生成にお
いて正しい候補を生成するために使用される。After associating the sign language words with the sections,
A list of sign language words corresponding to each section is created. The sign language word list can be easily created by searching for sign language words corresponding to the same section. FIG. 12 shows the format of the sign language word list for each section. In FIG. 12, reference numeral 1201 denotes a section start time, and 1202 denotes a section end time. The start time 1201 and the end time 1202 of the section are the same as the start time 901 and the end time 902 described in the information on the section shown in FIG. Reference numeral 1203 denotes the number of sign language words corresponding to the section. The sign language word names 1204 and 1208 are the names of the sign language words corresponding to the section, and the evaluation values 1205 and 1209 are the evaluation values of the sign language words corresponding to the section. The sign language word name and the evaluation value describe the sign language word name 1001 and the evaluation value 1004 included in the recognition result of the sign language word. Start section 1
Reference numerals 206 and 1210 are numbers representing the first section corresponding to the sign language word, and end sections 1207 and 1211 are numbers representing the last section corresponding to the sign language word. Section number 12
061, 1207, 1210, and 1211 are used to generate a correct candidate in the sign language word string generation described later when a plurality of sections correspond to the sign language word.
【0050】手話単語リストを作成した後、区間に関す
る情報中の区間タイプ903及び主手904と、手話単
語情報中の使用手303を比較することにより、手話単
語リスト中の手話単語の優先順位を変更する。これは、
使用する手303が区間タイプ903と同じ手話単語の
優先順位を上げることにより行う。また、区間タイプ9
03が「両手」の場合、使用手303が主手904と同
じである手話単語の優先順位も上げる。ただし、この場
合、優先順位を上げる程度は、使用手303が同じであ
る場合より小さいものとする。例えば、優先順位の変更
方法として評価値に1より大きい定数を乗じることによ
り増加させる方法を用いる場合、区間タイプ903と使
用手303が同じ場合に使用する定数をα、主手904
と使用手303が同じ場合に使用する定数をβとして、
α>βとなる定数を設定する。優先順位を変更する方法
としては、あらかじめ決められた定数を評価値に加算す
る方法でも良い。あるいは、区間タイプ903と使用手
303が同じ手話単語は、それ以外の手話単語より無条
件に優先し、その次に、主手904と使用手303が同
じ手話単語を無条件に優先する、という方法を用いるこ
ともできる。また、手話単語情報及び区間タイプとし
て、使用する手の種類以外に、手の位置や手の方向、あ
るいは、両手を使用する場合であれば両手の位置関係等
に関する情報が記述されている場合も同様の方法によ
り、区間に対応する手話単語の優先順位を変更すること
ができる。After the sign language word list is created, the priority of the sign language words in the sign language word list is determined by comparing the section type 903 and the main sign 904 in the information about the section with the user's hand 303 in the sign language word information. change. this is,
This is performed by raising the priority of the sign language used by the hand 303 used, which is the same as the section type 903. In addition, section type 9
When 03 is “both hands”, the priority order of the sign language word whose hand 303 is the same as the main hand 904 is also increased. However, in this case, the degree of raising the priority is smaller than the case where the users 303 are the same. For example, when a method of increasing the evaluation value by multiplying the evaluation value by a constant greater than 1 is used as a method of changing the priority, the constant used when the section type 903 and the user 303 are the same is α, and the main operator 904 is used.
And β is a constant used when the user 303 is the same as
Set a constant such that α> β. As a method of changing the priority, a method of adding a predetermined constant to the evaluation value may be used. Alternatively, a sign language word having the same section type 903 and the user's sign 303 has unconditional priority over other sign language words, and then the master sign 904 and the user's hand 303 unconditionally prioritize the same sign language word. A method can also be used. In addition, as the sign language word information and the section type, in addition to the type of the hand to be used, information on the position and hand direction of the hand, or the positional relationship of both hands when using both hands may be described. In a similar manner, the priority of the sign language word corresponding to the section can be changed.
【0051】各区間に対応する手話単語の優先順位を変
更した後、各区間と手話単語の対応関係に基づいて手話
単語列を生成する。手話単語列の生成では、各区間から
それに対応する手話単語を優先順位の高い順に選択し、
それらを結合して手話単語列候補を生成する。その際、
手話単語列候補全体の評価値を計算し、評価値の高い候
補を結果として選択する。この際、複数の区間に対応す
る手話単語の場合、その手話単語の区間に重なった手話
単語が結合されないようにする。このため、手話単語列
の生成は図13に示す流れ図に従って行う。After the priority of the sign language word corresponding to each section is changed, a sign language word string is generated based on the correspondence between each section and the sign language word. In the generation of the sign language word sequence, the corresponding sign language words are selected from each section in descending order of priority,
By combining them, a sign language word string candidate is generated. that time,
An evaluation value of the entire sign language word string candidate is calculated, and a candidate having a high evaluation value is selected as a result. At this time, in the case of a sign language word corresponding to a plurality of sections, the sign language words overlapping the section of the sign language word are prevented from being combined. Therefore, the generation of the sign language word string is performed according to the flowchart shown in FIG.
【0052】図13において、ステップ1301では、
手話単語列候補を格納する領域をクリアする。ステップ
1302では、区間を示すカウンタiを最初の区間を表
す1に設定する。ステップ1303では、カウンタiの
値が手話文データから検出された区間数より大きいかど
うかを調べ、小さいか等しければステップ1304に進
む。大きければステップ1305に進む。ステップ13
05では、手話単語列を格納する領域に格納されている
手話単語列を結果として出力し、処理を終了する。ステ
ップ1304では、カウンタiの示す区間に対応付けら
れている手話単語を示すカウンタjを最初の手話単語を
表す1に設定する。ステップ1306では、カウンタj
の値がカウンタiの示す区間に対応する手話単語数より
大きいかどうかを調べ、大きければステップ1307に
進む。そうでなければステップ1310に進む。In FIG. 13, in step 1301,
Clear the area for storing sign language word string candidates. In step 1302, the counter i indicating the section is set to 1 indicating the first section. In step 1303, it is checked whether or not the value of the counter i is greater than the number of sections detected from the sign language sentence data. If it is larger, the process proceeds to step 1305. Step 13
At 05, the sign language word string stored in the area for storing the sign language word string is output as a result, and the process is terminated. In step 1304, the counter j indicating the sign language word associated with the section indicated by the counter i is set to 1 representing the first sign language word. At step 1306, the counter j
Is greater than the number of sign language words corresponding to the section indicated by the counter i. Otherwise, go to step 1310.
【0053】ステップ1307では、手話単語列の候補
を評価値の高い順に並べ替える。手話単語列候補の評価
値は、候補中に含まれる手話単語の評価値の平均により
求めることができる。あるいは、手話単語の評価値の相
乗平均を使用しても良い。あるいは、手話単語間の位置
関係や文法的、意味的な関係に基づいた評価値等を使用
することもできる。ステップ1308では、手話単語列
候補中の同じ手話単語の列からなる候補を削除し、評価
値の高い候補から順に、あらかじめ決められた個数の候
補を選択し、それ以外の候補は削除する。ステップ13
09では、カウンタiの値を1増加し、ステップ130
3に戻る。In step 1307, the sign language word string candidates are rearranged in descending order of evaluation value. The evaluation value of the sign language word string candidate can be obtained by averaging the evaluation values of the sign language words included in the candidate. Alternatively, the geometric mean of the evaluation values of the sign language words may be used. Alternatively, an evaluation value or the like based on the positional relationship, grammatical, or semantic relationship between sign language words can be used. In step 1308, candidates consisting of the same sign language word string in the sign language word string candidates are deleted, a predetermined number of candidates are selected in order from the candidate having the highest evaluation value, and the other candidates are deleted. Step 13
In step 09, the value of the counter i is increased by one, and in step 130
Return to 3.
【0054】ステップ1310では、カウンタiが示す
区間中のカウンタjによって示される手話単語を選択す
る。ステップ1311では、既にある手話単語列候補を
示すカウンタkを最初の手話単語列候補を表す1に設定
する。ステップ1312では、カウンタkの値が既にあ
る手話単語列候補数より大きいかどうかを調べ、大きけ
ればステップ1313に進む。小さいか等しければステ
ップ1314に進む。ステップ1313ではカウンタj
の値を1増加し、ステップ1306に戻る。At step 1310, a sign language word indicated by the counter j in the section indicated by the counter i is selected. In step 1311, a counter k indicating an existing sign language word string candidate is set to 1 representing the first sign language word string candidate. In step 1312, it is checked whether or not the value of the counter k is larger than the number of the existing sign language word string candidates. If smaller or equal, go to step 1314. In step 1313, the counter j
Is incremented by 1, and the process returns to step 1306.
【0055】ステップ1314では、カウンタkが示す
手話単語列候補中の最後の手話単語が対応する区間が、
カウンタjが示す手話単語が対応する区間と重なってい
るかどうかを調べる。ステップ1315では、重なりが
ある場合はステップ1316に進み、重なりがない場合
はステップ1317に進む。ステップ1316では、カ
ウンタkが示す手話単語列候補中の手話単語の内、カウ
ンタjが示す手話単語が対応する区間と重なりがある手
話単語を除いた後、カウンタjが示す手話単語をカウン
タkが示す手話単語列候補に結合し、新たな手話単語列
候補として格納する。ステップ1317では、カウンタ
kが示す手話単語列候補にカウンタjが示す手話単語を
結合し、カウンタkが示す手話単語列候補を更新する。
ステップ1318では、カウンタkを1増加し、ステッ
プ1312に戻る。In step 1314, the section corresponding to the last sign language word in the sign language word string candidate indicated by the counter k is
It is checked whether the sign language word indicated by the counter j overlaps with the corresponding section. In step 1315, if there is an overlap, the process proceeds to step 1316; otherwise, the process proceeds to step 1317. In step 1316, the sign language word indicated by the counter j is replaced by the counter k after the sign language word overlapping with the section corresponding to the sign language word indicated by the counter j is removed from the sign language words in the sign language word string candidate indicated by the counter k. It is combined with the indicated sign language word string candidate and stored as a new sign language word string candidate. In step 1317, the sign language word indicated by the counter j is combined with the sign language word string candidate indicated by the counter k, and the sign language word string candidate indicated by the counter k is updated.
At step 1318, the counter k is incremented by 1, and the process returns to step 1312.
【0056】ステップ1314において、カウンタkが
示す手話単語列候補中の最後の手話単語が対応する区間
が、カウンタjが示す手話単語が対応する区間と重なっ
ているかどうかを調べる代わりに、カウンタkが示す手
話単語列候補中の最後の手話単語が対応する区間の時間
範囲と、カウンタjが示す手話単語の時間範囲との重な
りを計算しても良い。この場合、ステップ1315にお
いて、重なりの大きさが閾値以上の場合、ステップ13
16に進み、そうでない場合はステップ1317に進
む。また、ステップ1316において、カウンタjが示
す手話単語の時間範囲とカウンタkが示す手話単語列候
補の時間範囲との重なりが閾値未満になるまで、カウン
タkが示す手話単語列候補中の手話単語を削除した後、
その手話単語列候補にカウンタjが示す手話単語を結合
し、新たな候補として登録する。In step 1314, instead of checking whether the section corresponding to the last sign language word in the sign language word string candidate indicated by the counter k overlaps the section corresponding to the sign language word indicated by the counter j, the counter k sets The overlap between the time range of the section corresponding to the last sign language word in the candidate sign language word string shown and the time range of the sign language word indicated by the counter j may be calculated. In this case, if the size of the overlap is equal to or larger than the threshold in step 1315,
Proceed to 16; otherwise, proceed to step 1317. In step 1316, the sign language words in the sign language word sequence candidates indicated by the counter k are changed until the overlap between the time range of the sign language words indicated by the counter j and the time range of the sign language word sequence candidates indicated by the counter k becomes less than the threshold value. After deleting,
The sign language word indicated by the counter j is combined with the sign language word string candidate and registered as a new candidate.
【0057】[0057]
【発明の効果】本発明によると、両手における動作速度
変化、左右それぞれの手における動作速度変化、及び動
作方向変化に基づいて手話単語動作の境界を検出するこ
とにより、様々な形態で表現される手話単語を含む手話
文データから、各手話単語を表す動作の境界を精度良く
検出することができるようになる。According to the present invention, the boundaries between sign language word motions are detected in various forms by detecting a motion speed change in both hands, a motion speed change in each of the left and right hands, and a motion direction change. From the sign language sentence data including the sign language word, it is possible to accurately detect the boundary of the operation representing each sign language word.
【0058】また、手話単語の動作の特徴に基づいて、
分割された手話文データ中の各区間に認識された手話単
語を対応付け、その結果に基づいて手話単語列を生成す
ることにより、適切な手話単語列を生成することが可能
となる。さらに、各区間中における動作の特徴に基づい
て、認識された手話単語の優先順位を変更することによ
り、手話単語列生成における精度を向上することが可能
となる。Further, based on the characteristics of the operation of the sign language word,
By associating the recognized sign language words with each section in the divided sign language sentence data and generating a sign language word string based on the result, it is possible to generate an appropriate sign language word string. Furthermore, by changing the priority of the recognized sign language words based on the feature of the operation in each section, it is possible to improve the accuracy in generating the sign language word string.
【図1】本発明による手話認識装置の概念ブロック図。FIG. 1 is a conceptual block diagram of a sign language recognition device according to the present invention.
【図2】手話文データのフォーマットを示す図。FIG. 2 is a diagram showing a format of sign language sentence data.
【図3】手話単語情報格納部に格納される情報のフォー
マットを示す図。FIG. 3 is a diagram showing a format of information stored in a sign language word information storage unit.
【図4】手話文データにおける動作速度の変化と手話単
語及び渡りとの関係の一例を説明する図。FIG. 4 is a view for explaining an example of a relationship between a change in operation speed in sign language sentence data and a sign language word and a transition.
【図5】各指の先端の位置を計算するために用いられる
手のモデルの一例を示す図。FIG. 5 is a diagram showing an example of a hand model used to calculate the position of the tip of each finger.
【図6】左右それぞれの手の動作速度から検出した境界
を追加する処理の流れ図。FIG. 6 is a flowchart of processing for adding a boundary detected from the movement speed of each of the right and left hands.
【図7】境界に関する情報のフォーマットを示す図。FIG. 7 is a diagram showing a format of information regarding a boundary.
【図8】手話文データを検出した境界により各区間に分
割する処理の流れ図。FIG. 8 is a flowchart of a process of dividing sign language sentence data into sections according to detected boundaries.
【図9】区間に関する情報のフォーマットを示す図。FIG. 9 is a diagram showing a format of information on sections.
【図10】認識された手話単語に関する情報のフォーマ
ットを示す図。FIG. 10 is a diagram showing a format of information on recognized sign language words.
【図11】手話文データを分割した各区間に認識された
手話単語を対応づける処理の流れ図。FIG. 11 is a flowchart of a process of associating a recognized sign language word with each section obtained by dividing the sign language sentence data.
【図12】各区間に対応する手話単語リストのフォーマ
ットを示す図。FIG. 12 is a diagram showing a format of a sign language word list corresponding to each section.
【図13】手話単語列を生成する処理の流れ図。FIG. 13 is a flowchart of a process of generating a sign language word string.
【図14】境界を削除する処理の説明図。FIG. 14 is an explanatory diagram of processing for deleting a boundary.
101…手話動作入力部、102…手袋型装置、103
…手話単語認識部、104…手話データ分割部、105
…動作特徴抽出部、106…手話単語情報格納部、10
7…分割区間手話単語対応部、108…手話単語列生成
部、109…手話単語列101: Sign language operation input unit, 102: Glove type device, 103
... Sign language word recognition unit, 104 ... Sign language data division unit, 105
... operation feature extraction unit, 106 ... sign language word information storage unit, 10
7: Signed section sign language word correspondence unit, 108: Sign language word string generation unit, 109: Sign language word string
───────────────────────────────────────────────────── フロントページの続き (72)発明者 竹内 勝 東京都国分寺市東恋ヶ窪一丁目280番地 株式会社日立製作所中央研究所内 Fターム(参考) 5B057 AA20 DA20 DC02 DC08 5B091 CB01 ──────────────────────────────────────────────────続 き Continuing from the front page (72) Inventor Masaru Takeuchi 1-280 Higashi Koigabo, Kokubunji-shi, Tokyo F-term in Central Research Laboratory, Hitachi, Ltd. 5B057 AA20 DA20 DC20 DC08 DC08 5B091 CB01
Claims (11)
の手話文データとして入力する手話動作入力手段と、 前記手話動作入力手段から入力された手話文データ中に
表現されている各手話単語を認識する手段と、 前記手話動作入力手段から入力された手話文データ中の
動作の境界を動作の特徴量に基づいて検出する手話デー
タ分割手段と、 前記手話データ分割手段によって検出された境界によっ
て分割される手話文データ中の各区間における動作の特
徴を検出する動作特徴検出手段と、 手話単語に関する情報を格納する手話単語情報格納手段
と、 前記手話単語情報格納手段に格納された手話単語に関す
る情報に基づいて、前記手話データ分割手段によって検
出された境界によって分割された手話文データ中の各区
間に前記手話単語認識手段によって認識された手話単語
を対応付ける分割区間手話単語対応手段と、 前記分割区間手話単語対応手段によって対応付けられた
手話分データ中の各区間と手話単語の対応関係に基づい
て手話単語列を生成する手話単語列生成手段と、を備え
ることを特徴とする手話認識装置。1. Sign language operation input means for converting an operation of a sign language sentence into an electric signal and inputting it as time-series sign language sentence data, and each sign language expressed in the sign language sentence data input from the sign language operation input means. Means for recognizing a word; sign language data dividing means for detecting a boundary of an action in the sign language sentence data input from the sign language action input means based on a feature amount of the action; and a boundary detected by the sign language data dividing means. Feature detecting means for detecting the feature of the action in each section in the sign language sentence data divided by the sign language sentence data; sign language word information storage means for storing information relating to the sign language word; and sign language words stored in the sign language word information storage means On the basis of the information on the sign language word recognition means in each section in the sign language sentence data divided by the boundary detected by the sign language data division means. Thus, a divided section sign language word correspondence unit for associating the recognized sign language words, and a sign language word string is generated based on a correspondence relationship between each section in the sign language data and the sign language word associated by the divided section sign language word correspondence unit. A sign language word string generating means.
前記手話データ分割手段は、掌の動作速度、掌の動作方
向の変化、各指の先端の動作速度、各指の先端の動作方
向の変化のうち少なくとも1つの特徴量に基づいて動作
の境界を検出することを特徴とする手話認識装置。2. The sign language recognition device according to claim 1, wherein
The sign language data dividing means determines a boundary of the motion based on at least one characteristic amount among a motion speed of the palm, a change in the motion direction of the palm, a motion speed of the tip of each finger, and a change in the motion direction of the tip of each finger. A sign language recognition device characterized by detecting.
前記手話データ分割手段は、掌の動作速度あるいは各指
の先端の動作速度が極小になる時刻、掌の動作速度ある
いは各指の先端の動作速度があらかじめ決められた速度
より小さくなる時刻、掌の動作速度あるいは各指の先端
の動作速度があらかじめ決められた速度より小さい状態
からあらかじめ決められた速度より大きい状態になる時
刻、及び掌あるいは各指の先端の動作方向の変化があら
かじめ決められた閾値を越える時刻を動作の境界として
検出することを特徴とする手話認識装置。3. The sign language recognition device according to claim 1,
The sign language data dividing means performs a time when the operation speed of the palm or the operation speed of the tip of each finger is minimized, a time when the operation speed of the palm or the operation speed of the tip of each finger is smaller than a predetermined speed, The time when the operating speed or the operating speed of the tip of each finger changes from a state lower than the predetermined speed to a state higher than the predetermined speed, and a change in the operating direction of the palm or the end of each finger is a predetermined threshold. A sign language recognition device that detects a time that exceeds a time as a boundary of an action.
前記手話データ分割手段は、左右両方の掌の動作速度及
び各指の先端の動作速度に基づいて動作の境界を検出し
た後、検出した境界によって分割される手話文データ中
の各区間について、右手における掌の動作速度及び各指
の先端の動作速度、並びに左手における掌の動作速度及
び各指の先端の動作速度のそれぞれに基づいて動作の境
界を検出し、検出した境界を動作の境界として追加する
ことを特徴とする手話認識装置。4. The sign language recognition device according to claim 1,
The sign language data dividing means detects a boundary of the motion based on the motion speed of both the left and right palms and the motion speed of the tip of each finger, and then, for each section in the sign language sentence data divided by the detected boundary, the right hand Based on the motion speed of the palm and the motion speed of the tip of each finger, and the motion speed of the palm in the left hand and the motion speed of the tip of each finger, the motion boundaries are detected, and the detected boundaries are added as motion boundaries. Sign language recognition device characterized by performing.
いて、前記手話データ分割手段は、さらに掌あるいは各
指の先端の動作方向の変化があらかじめ決められた閾値
を越える時刻を境界として検出し、検出された境界を動
作速度に基づいて検出された境界のうち時間的に最も近
い境界に対応付けることを特徴とする手話認識装置。5. The sign language recognition device according to claim 3, wherein said sign language data dividing means further detects, as a boundary, a time at which a change in the movement direction of the tip of the palm or each finger exceeds a predetermined threshold. A sign language recognition device that associates the detected boundary with a temporally closest boundary among the boundaries detected based on the operation speed.
前記動作特徴検出手段は、区間中における左右それぞれ
の手についての最大動作速度の差あるいは比、区間中に
おける左右それぞれの手についての平均動作速度の差あ
るいは比、区間中における左右それぞれの手についての
移動距離の差あるいは比、区間中における左右それぞれ
の手についての動作速度変化の差、区間中における動作
方向の差のうち少なくとも1つの特徴量に基づいて、区
間中の動作が両手を使用しているか、右手のみを使用し
ているか、左手のみを使用しているかのいずれかに各区
間を分類することを特徴とする手話認識装置。6. The sign language recognition device according to claim 1,
The operation feature detecting means includes: a difference or a ratio of the maximum operation speed of each of the right and left hands in the section; a difference or a ratio of the average operation speed of each of the right and left hands in the section; Based on at least one characteristic amount among the difference or ratio of the moving distance, the difference between the movement speeds of the right and left hands in the section, and the difference in the movement direction in the section, the movement in the section uses both hands. A sign language recognition apparatus characterized in that each section is classified into one of the following states: using only a right hand or using only a left hand.
手話単語情報格納手段に格納される情報は、手話単語の
動作の特徴に関する情報、手話単語の動作が動作の境界
によって分割される区間の数、手話単語の動作を行う場
合に使用される手の種類のうち少なくとも1つを含むこ
とを特徴とする手話認識装置。7. The sign language recognition device according to claim 1,
The information stored in the sign language word information storage means includes information on the characteristics of the sign language word motion, the number of sections in which the sign language word motion is divided by the boundaries of the motion, and the hand used when performing the sign language word motion. A sign language recognition device comprising at least one of the types.
手話単語の動作の特徴に関する情報には、手話単語の動
作を、あらかじめ決められた数の区間に分割される可能
性のある「上限有り」、分割される区間の数が不明確で
ある「上限無し」、印を押すような動作を含む「提示動
作」のいずれかに分類した結果が含まれることを特徴と
する手話認識装置。8. The sign language recognition device according to claim 7,
The information on the characteristics of the sign language word operation includes "upper limit" in which the sign language word operation may be divided into a predetermined number of sections, and "upper limit" in which the number of divided sections is unclear. A sign language recognition device characterized by including a result classified into any of "none" and "presentation operation" including an operation of pressing a mark.
認識装置において、分割区間手話単語対応手段は、手話
単語の動作の特徴及び動作の境界によって分割される区
間の数に基づいて、手話単語に対応する区間を決定する
ことを特徴とする手話認識装置。9. The sign language recognition device according to claim 1, wherein the divided section sign language word correspondence unit is based on the number of sections divided by the feature of the sign language word operation and the boundary of the operation. A sign language recognition device for determining a section corresponding to a sign language word.
て、分割区間手話単語対応手段は、各区間における動作
の特徴に基づいて各区間に対応付けられた手話単語の優
先順位を変更することを特徴とする手話認識装置。10. The sign language recognition device according to claim 9, wherein the divided section sign language word correspondence unit changes the priority of the sign language word associated with each section based on the feature of the operation in each section. Sign language recognition device.
列の手話文データとして入力する手話動作入力手段と、 前記手話動作入力手段から入力された手話文データ中に
表現されている各手話単語を認識する手段と、 前記手話動作入力手段から入力された手話文データ中の
動作の境界を動作の特徴量に基づいて検出する手話デー
タ分割手段と、 前記手話データ分割手段によって検出された境界によっ
て分割される手話文データ中の各区間における動作の特
徴を検出する動作特徴検出手段と、 手話単語情報格納手段に格納された手話単語に関する情
報に基づいて、前記手話データ分割手段によって検出さ
れた境界によって分割される手話文データ中の各区間に
前記手話単語認識手段によって認識された手話単語を対
応付ける分割区間手話単語対応手段と、 前記分割区間手話単語対応手段によって対応付けられた
手話分データ中の各区間と手話単語の対応関係に基づい
て手話単語列を生成する手話単語列生成手段とを備える
手話認識装置、としてコンピュータを動作させるための
プログラムを記録したコンピュータ読取可能な記録媒
体。11. A sign language operation input means for converting an operation of a sign language sentence into an electric signal and inputting the signal as time-series sign language sentence data; and each sign language expressed in the sign language sentence data input from the sign language operation input means. Means for recognizing a word; sign language data dividing means for detecting a boundary of an action in the sign language sentence data input from the sign language action input means based on a feature amount of the action; and a boundary detected by the sign language data dividing means. Based on information on the sign language words stored in the sign language word information storage means, based on the motion feature detection means for detecting the features of the actions in each section in the sign language sentence data divided by the sign language sentence data. A divided section sign language word pair that associates each section in the sign language sentence data divided by the boundary with the sign language word recognized by the sign language word recognition unit. Means, a sign language word string generating means for generating a sign language word string based on the correspondence between each section in the sign language data and the sign language word associated by the divided section sign language word corresponding means, A computer-readable recording medium on which a program for operating a computer is recorded.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP08802399A JP3623394B2 (en) | 1999-03-30 | 1999-03-30 | Sign language recognition device and recording medium on which program for realizing the device is recorded |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP08802399A JP3623394B2 (en) | 1999-03-30 | 1999-03-30 | Sign language recognition device and recording medium on which program for realizing the device is recorded |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2000284682A true JP2000284682A (en) | 2000-10-13 |
| JP3623394B2 JP3623394B2 (en) | 2005-02-23 |
Family
ID=13931243
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP08802399A Expired - Lifetime JP3623394B2 (en) | 1999-03-30 | 1999-03-30 | Sign language recognition device and recording medium on which program for realizing the device is recorded |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3623394B2 (en) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003295754A (en) * | 2002-04-05 | 2003-10-15 | Hitachi Ltd | Sign language education system and program for realizing the system |
| JP2009265276A (en) * | 2008-04-23 | 2009-11-12 | Internatl Business Mach Corp <Ibm> | Support device, program, and support method |
| JP2015166902A (en) * | 2014-03-03 | 2015-09-24 | 日本放送協会 | Non-finger movement detection device and program |
| JP2019159192A (en) * | 2018-03-15 | 2019-09-19 | 株式会社ユニオンソフトウェアマネイジメント | Word decision system |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06337629A (en) * | 1993-05-31 | 1994-12-06 | Hitachi Ltd | Sign language recognizer |
| JPH07311545A (en) * | 1994-05-16 | 1995-11-28 | Hitachi Ltd | Sign language interpreter |
| JPH08115408A (en) * | 1994-10-19 | 1996-05-07 | Hitachi Ltd | Sign language recognizer |
-
1999
- 1999-03-30 JP JP08802399A patent/JP3623394B2/en not_active Expired - Lifetime
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06337629A (en) * | 1993-05-31 | 1994-12-06 | Hitachi Ltd | Sign language recognizer |
| JPH07311545A (en) * | 1994-05-16 | 1995-11-28 | Hitachi Ltd | Sign language interpreter |
| JPH08115408A (en) * | 1994-10-19 | 1996-05-07 | Hitachi Ltd | Sign language recognizer |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003295754A (en) * | 2002-04-05 | 2003-10-15 | Hitachi Ltd | Sign language education system and program for realizing the system |
| JP2009265276A (en) * | 2008-04-23 | 2009-11-12 | Internatl Business Mach Corp <Ibm> | Support device, program, and support method |
| JP2015166902A (en) * | 2014-03-03 | 2015-09-24 | 日本放送協会 | Non-finger movement detection device and program |
| JP2019159192A (en) * | 2018-03-15 | 2019-09-19 | 株式会社ユニオンソフトウェアマネイジメント | Word decision system |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3623394B2 (en) | 2005-02-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6169612B2 (en) | System and method for text input | |
| JP5897725B2 (en) | User interface device, user interface method, program, and computer-readable information storage medium | |
| JP4887264B2 (en) | Voice data retrieval system | |
| JPH06176199A (en) | Pattern recognition method and device | |
| WO2007137487A1 (en) | Method and apparatus for named entity recognition in natural language | |
| US20130290894A1 (en) | System and method for text input with a multi-touch screen | |
| US20260017971A1 (en) | Systems and methods for handwriting recognition | |
| CN109659009A (en) | Motion management method, apparatus and electronic equipment | |
| CN111079494A (en) | Learning content pushing method and electronic equipment | |
| JP3623394B2 (en) | Sign language recognition device and recording medium on which program for realizing the device is recorded | |
| JP5774235B2 (en) | User interface device, user interface method, program, and computer-readable information storage medium | |
| JP4175093B2 (en) | Topic boundary determination method and apparatus, and topic boundary determination program | |
| JP3554571B2 (en) | Sign language recognition device | |
| CN109508390B (en) | Input prediction method, device and electronic device based on knowledge graph | |
| Kiefer et al. | A Framework for Mobile Intention Recognition in Spatially Structured Environments. | |
| Osaki et al. | A motion recognition method by using primitive motions | |
| JP4063551B2 (en) | Character string prediction apparatus and method, and computer-executable program for implementing the method | |
| JP2013025390A (en) | Handwriting input method | |
| CN115273220A (en) | Gesture-based word searching method, word searching equipment and computer-readable storage medium | |
| Ramakrishnan | Segmentation of hand gestures using motion capture data | |
| JP3622488B2 (en) | Sign language word dictionary creation method and dictionary learning device | |
| JP4604424B2 (en) | Speech recognition apparatus and method, and program | |
| JP3615008B2 (en) | Sign language recognition device | |
| JP2020035023A (en) | Learning method, error determination method, learning system, error determination system, and program | |
| JP4024614B2 (en) | Language model generation method, apparatus and program, text analysis apparatus and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040817 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041014 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041109 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041124 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071203 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081203 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081203 Year of fee payment: 4 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081203 Year of fee payment: 4 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091203 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101203 Year of fee payment: 6 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101203 Year of fee payment: 6 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101203 Year of fee payment: 6 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| EXPY | Cancellation because of completion of term |