JPH0614377B2 - 文節候補選択装置 - Google Patents

文節候補選択装置

Info

Publication number
JPH0614377B2
JPH0614377B2 JP1316790A JP31679089A JPH0614377B2 JP H0614377 B2 JPH0614377 B2 JP H0614377B2 JP 1316790 A JP1316790 A JP 1316790A JP 31679089 A JP31679089 A JP 31679089A JP H0614377 B2 JPH0614377 B2 JP H0614377B2
Authority
JP
Japan
Prior art keywords
bunsetsu
phrase
unit
pair
selecting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1316790A
Other languages
English (en)
Other versions
JPH03176763A (ja
Inventor
康二 柿ケ原
逞 森元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR JIDO HONYAKU DENWA
Original Assignee
ATR JIDO HONYAKU DENWA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR JIDO HONYAKU DENWA filed Critical ATR JIDO HONYAKU DENWA
Priority to JP1316790A priority Critical patent/JPH0614377B2/ja
Publication of JPH03176763A publication Critical patent/JPH03176763A/ja
Publication of JPH0614377B2 publication Critical patent/JPH0614377B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] この発明は、文節候補選択装置に関し、特に、文法上正
確でない文章を構成する文節ついても、最適な文節候補
を選択できる文節候補選択装置に関する。
[従来の技術および発明が解決しようとする課題] 従来から、与えられた複数の文節の中から文章を構成す
るのに最適な文節を選択する方法として、種々の方法が
提案されかつ実用化されつつある。その方法の1つとし
て、多数の係り受け関係の中から最適な係り受け関係を
求めて文節の候補を選択する最適文節候補選択方式が知
られている。一般に1つの文の中には複数の文節が存在
する。音声認識装置や文字認識装置などを用いて認識処
理を行なうと、その認識結果として個々の文節に対して
複数の文節候補が得られる。したがって、文全体では非
常に多くの文節候補が存在することになる。従来の方法
では、これらの多数の文節候補の中から係り受け関係を
用いて文章を構成する可能性のある文節候補の組合わせ
を見つけ出すのであるが、文法的に正確でない文が認識
装置に与えられている場合に、文として成立することが
できる正しい文節候補を選択することができないという
課題があった。
文法的に正確でない文とは、たとえば1つの述語に対し
2以上の主語を含む文や、既に現われた目的語が2以上
現われる文などがある。このような文は、話言葉の中に
多く現われ、それを音声認識処理する場合に問題とな
る。従来の最適文節候補選択方式では、文法的に正しい
文章を構成する文節が与えられるという前提があったの
で、上記のような文法的に誤った文が与えられた場合
に、最適な文節候補を選択することはできなかった。
この発明は、上記のような課題を解決するためになされ
たもので、文法上正確でない文章を構成する文節が与え
られた場合においても、最適な文節候補を選択できる文
節候補選択装置を得ることを目的とする。
[課題を解決するための手段] この発明に係る文節候補選択装置は、与えられた複数の
文節の各々について、選択されるべき可能性を示す可能
性データを与える手段と、予め文節対についてその出現
頻度を示す頻度データを記憶する記憶手段と、与えられ
た複数の文節の中から文節対を選択する選択手段と、選
択手段によって選択された文節対について記憶手段を参
照し、頻度データを得る参照手段と、選択手段よって選
択された文節間の距離を計算する距離計算手段と、選択
手段によって選択された文節対について、与えられた可
能性データ、参照手段によって得られた頻度データおよ
び距離計算手段によって計算された距離を所定の評価式
に従って演算し、係り受け関係を評価する評価手段とを
含む。
[作用] この発明における文節候補選択装置では、選択手段によ
って選択された文節対ごとに、評価手段は、与えられた
可能性データ、参照手段によって得られた頻度データお
よび距離計算手段によって計算された距離を所定の評価
式に従って演算し、その係り受け関係を評価する。した
がって、文法上正確でない文章を構成する複数の文節が
与えられても、評価手段による評価結果に基づいて係り
受け関係が評価されるので、最適な文節を選び出すこと
ができる。
[発明の実施例] 第1図は、この発明の一実施例を示す文節候補選択装置
40を含む認識システムのブロック図である。第1図を
参照して、この認識システムは、音声または文字などを
入力する入力装置20と、入力された音声または文字に
ついて認識処理を行なう認識装置30と、認識装置30
によって得られた複数の文節の中から最適な文節候補を
選択する文節候補選択装置40と、予め係り受け関係に
関する情報が記憶されている係り受けデータベース60
と、文節候補選択装置40によって選択された文節を表
示する表示装置50とを含む。
文節候補選択装置40は、認識装置30から認識結果で
ある複数の文節候補および認識された各文節についての
認識確率を受け、それを保持する保持部2と、保持され
た複数の文節候補の中から任意の対を選び出す文節候補
選択部3と、選択された文節対について係り受けデータ
ベース60に対して係り受け関係の有無を参照する係り
受け関係参照部4と、選択された文節対について係り受
けデータベース60に対してその出現頻度を参照する出
現頻度参照部5と、選択された文節間の距離を計算する
距離計算部9と、保持部2からの認識確率および文節対
の出現頻度ならびに文節間の距離に基づいて係り受けの
評価を行なう評価値演算部10と、文節候補のすべてに
ついての評価値を保持する評価値保持部11と、評価値
保持部11の中に保持された評価値の中から評価値の最
も高い文節候補を判定する判定部12とを含む。係り受
けデータベース60は、文節対について係り受け関係の
有無を示す係り受け関係データ7と、文節対の係り受け
関係の出現頻度を示す出現頻度データ8とを含む。
第2図は、第1図に示した認識システムの動作を説明す
るためのフロー図である。第1図および第2図を参照し
て、次に動作について説明する。なお、以下の説明で
は、入力装置20に文法的に正確でない文章の例とし
て、「至急送ります登録の用紙をそちらに。」が与えら
れた場合について説明する。
上記の文章は入力装置20を介して認識装置30に与え
られる。まず、ステップ(図中SPで示す)1におい
て、認識装置30により入力文の認識処理が行なわれ
る。認識処理の結果、上記の入力文の各文節に対応して
各々3つずつの文節候補および認識確率が得られるもの
とする。
第3図は、上記の入力文の各文節についての文節候補と
その認識確率とを示す対応図である。たとえば、「至
急」に対応する文節候補の例として、「七十」、「始
終」および「至急」などの文節候補が認識され、各々に
ついて認識確率3、2および1が認識装置30から得ら
れる。第3図に示した文節候補および認識確率は保持部
2中に保持される。
次に、ステップ2において、文節候補選択部3により文
節対が選択される。この選択は、未だ係り受け関係を評
価していない2つの文節の組合わせについてなされる。
ステップ3において、選択された文節対について文節間
の距離が距離計算部9により計算される。計算された距
離は評価値演算部10に与えられる。
次の表1は係り受けデータベース60中に予め準備され
ているデータの内容を示す。
この表1に示すように、係り受けデータベース60中に
は、係り受け関係を有することのある文節対と、その出
現頻度とが対応づけられてストアされている。
次に、ステップ4において、係り受け関係参照部4によ
り係り受けデータベース60中に選択された文節対につ
いて係り受け関係の存在が調べられる。
ステップ5において、係り受け関係が存在する文節対に
ついて、係り受けデータベース60から出現頻度が参照
される。したがって、上記の文章の例では、表1に示す
ように文節対に対する出現頻度データが得られる。
ステップ6において、評価値演算部10により次の評価
式に基づいて評価値が計算される。
評価値=認識確率+W1×出現頻度−W2×距離 …(1) ここで、W1,W2は予め定められた係数である。
たとえば、文節候補選択部3が文節対「登録の」および
「用紙を」を選択している場合、表1に示した係り受け
データベースから出現頻度12が得られる。一方、第3
図に示したように、認識装置30から文節「登録の」お
よび「用紙を」の各々について認識確率4が既に与えら
れている。距離計算部9において得られる文節間の距離
を4とし、式(1)における係数W1およびW2の値を
1とすると、式(1)から評価値16が得られる。同様
にして、文節候補選択部3により文節対「そちらに」お
よび「送ります」が選ばれた場合では、表1から出現頻
度8が得られ、第3図に示した認識結果から認識確率5
および7が得られる。さらに、この場合の文節間の距離
を1とすると、式(1)より評価値19が得られる。
ステップ7において、評価値演算部10によって得られ
た評価値が評価値保持部11中に保持される。
ステップ8において、すべての文節対について評価値が
得られたかどうかを判定し、未だ係り受け関係が評価さ
れていない文節がある場合にはステップ2に戻り上記の
動作が繰返される。
第4図は、各文節対について得られた評価値と係り受け
関係とを示す模式図である。このようにして、係り受け
関係が存在する文節対について、それぞれ評価値が得ら
れる。
ステップ9において、判定部12により評価値の最も大
きい文節が選択される。
第5図は、各文節候補についての評価値を示す対応図で
ある。判定部12において、各文節候補について最も大
きい評価値が得られた文節を判定することにより、文章
を構成する可能性がある最適な文節、すなわち「至
急」、「送ります」、「答録の」、「用紙を」、および
「そちらに」が選択される。
こうして得られた最適な文節候補はたとえば表示装置5
0などに与えられ、表示される。
[発明の効果] 以上のように、この発明によれば、選択された文節対に
ついて、与えられた文節の可能性データ、文節対の頻度
データおよび文節間の距離について所定の評価式に従っ
て演算し、係り受け関係を評価する評価手段を設けたの
で、文法上正確でない文章を構成する複数の文節が与え
られても、最適な文節候補を選択できる文節候補選択装
置が得られた。
【図面の簡単な説明】
第1図は、この発明の一実施例を示す文節候補選択装置
を含む認識システムのブロック図である。第2図は、第
1図に示した認識システムの動作を説明するためのフロ
ー図である。第3図は、第1図に示した認識装置から出
力される文節候補と認識確率との対応を示す対応図であ
る。第4図は、各文節対について得られた評価値と係り
受け関係を示す模式図である。第5図は、各文節候補と
その評価値との対応を示す対応図である。 図において、2は保持部、3は文節候補選択部、4は係
り受け関係参照部、5は出現頻度参照部、9は距離計算
部、10は評価演算部、11は評価値保持部、12は判
定部、20は入力装置、30は認識装置、40は文節候
補選択装置、50は表示装置、60は係り受けデータベ
ースである。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】与えられた複数の文節の中から文章を構成
    するのに最適な文節を選択する文節候補選択装置であっ
    て、 前記複数の文節の各々について、選択されるべき可能性
    を示す可能性データを与える手段と、 前記複数の文節を構成する文節対について、予めその出
    現頻度を示す頻度データを記憶する記憶手段と、 前記複数の文節の中から文節対を選択する選択手段と、 前記選択手段によって選択された文節対について前記記
    憶手段を参照し、頻度データを得る参照手段と、 前記選択手段によって選択された文節間の距離を計算す
    る距離計算手段と、 前記選択手段によって選択された文節対について、与え
    られた可能性データ、前記参照手段によって得られた頻
    度データおよび前記距離計算手段によって計算された距
    離を所定の評価式に従って演算し、係り受け関係を評価
    する評価手段とを含む、文節候補選択装置。
JP1316790A 1989-12-05 1989-12-05 文節候補選択装置 Expired - Lifetime JPH0614377B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1316790A JPH0614377B2 (ja) 1989-12-05 1989-12-05 文節候補選択装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1316790A JPH0614377B2 (ja) 1989-12-05 1989-12-05 文節候補選択装置

Publications (2)

Publication Number Publication Date
JPH03176763A JPH03176763A (ja) 1991-07-31
JPH0614377B2 true JPH0614377B2 (ja) 1994-02-23

Family

ID=18080952

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1316790A Expired - Lifetime JPH0614377B2 (ja) 1989-12-05 1989-12-05 文節候補選択装置

Country Status (1)

Country Link
JP (1) JPH0614377B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0640328B2 (ja) * 1989-11-29 1994-05-25 キヤノン株式会社 文字処理装置

Also Published As

Publication number Publication date
JPH03176763A (ja) 1991-07-31

Similar Documents

Publication Publication Date Title
US7580835B2 (en) Question-answering method, system, and program for answering question input by speech
Rosenberg et al. Referential processes of speakers and listeners.
US6269335B1 (en) Apparatus and methods for identifying homophones among words in a speech recognition system
US6068485A (en) System for synthesizing spoken messages
WO2021017612A1 (zh) 基于语音分析的问答方法、装置、设备及存储介质
EP1209659B1 (en) Method and apparatus for text input utilizing speech recognition
CN110675871B (zh) 一种语音识别方法及装置
CN109522397B (zh) 信息处理方法及装置
Treisman A theory of the identification of complex stimuli with an application to word recognition.
EP1617409B1 (en) Multimodal method to provide input to a computing device
JP2009198614A (ja) 対話装置及びプログラム
KR100501413B1 (ko) 유엠엘에스를 기반으로 생물학 문헌으로부터 생물학적개체명을 인식하는 장치 및 그 방법
JP2005222294A (ja) 文章の感情認識装置及び文章の感情認識方法ならびにそのプログラム
CN120385355A (zh) 语音导航模型训练方法、装置、导航方法及车载导航系统
JP4220151B2 (ja) 音声対話装置
JPH0614377B2 (ja) 文節候補選択装置
CN117591654A (zh) 一种问答方法及装置
JP4661239B2 (ja) 音声対話装置及び音声対話方法
JP3036591B2 (ja) 音声認識装置
CN111898923B (zh) 一种信息分析方法
EP0896320A2 (en) System for sorting prospective speech recognition results, obtained by a language processor, in optimized order
JP2005227555A (ja) 音声認識装置
JPH07105203A (ja) 文書処理方法及び装置
JPH0887502A (ja) テキスト用話題構造認識における話題語選択方法と話題構造認識装置
JPH0695827A (ja) ガイド装置