JPH05108704A - 接続マトリクス作成方法およびその装置 - Google Patents

接続マトリクス作成方法およびその装置

Info

Publication number
JPH05108704A
JPH05108704A JP3270814A JP27081491A JPH05108704A JP H05108704 A JPH05108704 A JP H05108704A JP 3270814 A JP3270814 A JP 3270814A JP 27081491 A JP27081491 A JP 27081491A JP H05108704 A JPH05108704 A JP H05108704A
Authority
JP
Japan
Prior art keywords
entropy
heading
likelihood
symbol string
transition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3270814A
Other languages
English (en)
Inventor
Atsushi Horioka
篤史 堀岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3270814A priority Critical patent/JPH05108704A/ja
Priority to US07/961,507 priority patent/US5355311A/en
Publication of JPH05108704A publication Critical patent/JPH05108704A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/197Probabilistic grammars, e.g. word n-grams
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 日本語処理装置などに用いられる接続マトリ
クスに関するもので、登録しておくべき尤度の個数を減
少させると共に、推定精度を高めた接続マトリクスを出
力する接続マトリクス作成装置を提供することを目的と
する。 【構成】 先行記号列から後続記号への遷移尤度を求め
る尤度計算部2と、先行記号列の見出しごとのエントロ
ピーを求めるエントロピー計算部4と、先行記号列の見
出しごとのエントロピーの中で最大のエントロピーを持
つ見出しの記号列の先頭に記号を挿入して新たな先行記
号列の見出しを作成して見出しを更新する見出し更新部
5とから構成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はワードプロセッサなどの
日本語情報処理装置に使用される接続マトリクスの作成
方法およびその装置に関するものである。
【0002】
【従来の技術】近年、形態素解析技術などの日本語情報
処理技術を利用したワードプロセッサなどのシステムが
広く利用されている。
【0003】通常のワードプロセッサにおける形態素解
析部は、単語についての情報を記録する機能(辞書)、
キーボードなどから入力された仮名文字列を単語ごとに
分割(形態素解析)する機能、与えられた単語列の順列
が入力として正しいか否かを接続マトリクスを参照して
判定する機能などを有している。この接続マトリクスに
記録されている尤度の値を0〜1にすれば確率として求
めることができる。確率を尤度に用いれば接続マトリク
スの作成が容易となり、以下に示す従来例は、これに従
うものである。さて、記号列w(1),w(2),・・・,w(i-1)に記
号w(i)が後続する確率(これを尤度とする)はP{w(i)|
w(1),w(2),・・・,w(i-1)}であるが、記号がM種類存在す
る場合には記号列w(1),w(2),・・・,w(i-1)の異なり数はM
i-1も存在し、Mi-1種類の確率を登録せねばならず、す
べての確率を登録することはほぼ不可能である。しかし
(数1)のような近似を行うことにより、登録しておく
べき確率の個数は入力される記号列の長さに関わらずMN
個に制限させることができる。
【0004】
【数1】
【0005】図7は従来の接続マトリクス作成装置の構
成図である。図中、111は学習用データ保管部で、数
多くの記号列をあらかじめ収集して作成しておく。11
2は尤度計算部で、上記学習用データ保管部111のデ
ータを使って先行記号列w(i-N),・・・,w(i-1)に記号w(i)
が後続する遷移尤度(確率)P{w(i)|w(i-N),・・・,w(i-
1)}を求めるためのものである。113は接続マトリク
スで、尤度計算部112で得られた遷移尤度のことであ
り、これが本装置の出力となるものである。
【0006】前述のように構成された従来の接続マトリ
クス作成装置において、記号列w(i-N),・・・,w(i-1)から
記号w(i)への遷移尤度を(数2)のように求める。
【0007】
【数2】
【0008】ここでn{w(i-N),・・・,w(i-1),w(i)}は学
習用データに含まれる記号列w(i-N),・・・,w(i-1),w(i)の
総数、n{w(i-N),・・・,w(i-1)}は学習用データに含まれ
る記号列w(i-N),・・・,w(i-1)の総数である。
【0009】
【発明が解決しようとする課題】しかしながら、上記の
構成では登録しておくべき尤度の個数をMN個に減少させ
たとはいえ、その推定精度を上げるためにNの値を大き
くした場合ではMNも非常に大きな値となってしまい、限
られたメモリ容量では登録できないといった問題点があ
った。
【0010】本発明は、従来の接続マトリクス作成装置
が有していた上記の問題点に鑑み、登録しておくべき尤
度の個数を従来の個数以下に抑えながらも、その推定精
度は従来の精度より高い接続マトリクスが得られるマト
リクス作成装置を提供することを目的としたものであ
る。
【0011】
【課題を解決するための手段】上記の目的を達成するた
めに本発明は、先行記号列から後続記号への接続マトリ
クスの作成において、遷移尤度を求める尤度計算部と、
上記遷移尤度から上記先行記号列の見出しごとのエント
ロピーを求めるエントロピー計算部と、上記先行記号列
の見出しごとのエントロピーの中で最大のエントロピー
を持つ見出しの記号列の先頭に記号を挿入して新たな先
行記号列の見出しを作成して見出しを更新する見出し更
新部と備えたことを特徴とする接続マトリクス作成装置
を構成する。
【0012】
【作用】前記した構成により本発明は、先行記号列から
後続記号への接続マトリクスの作成において、尤度計算
部で遷移尤度を求め、エントロピー計算部で上記遷移尤
度から上記先行記号列の見出しごとのエントロピーを求
め、見出し更新部で上記先行記号列の見出しごとのエン
トロピーの中で最大のエントロピーを持つ見出しの記号
列の先頭に記号を挿入して新たな先行記号列の見出しを
作成して見出しを更新し、再び上記計算部で新たな見出
しにおける遷移尤度を求め、これを接続マトリクスとし
て出力する。
【0013】
【実施例】以下、本発明の接続マトリクス作成装置の一
実施例を図面を用いて説明する。
【0014】図1は本発明の請求項1の一実施例のマト
リクス作成装置の構成図である。図中、1は学習用デー
タ保管部で、学習用データとして使うための数多くの記
号列をあらかじめ収集して作成しておく。2は尤度計算
部で、上記学習用データ保管部1のデータを使って記号
列w(i-N),・・・,w(i-1)に記号w(i)が後続する遷移尤度を
求めるためのものである。ここで尤度には従来例と同様
に確率を使用するので、記号列w(i-N),・・・,w(i-1)に記
号w(i)が後続する確率P{w(i)|w(i-N),・・・,w(i-1)}が
遷移尤度となる。3は接続マトリクスで、尤度計算部2
で得られた遷移尤度のことであり、これが本装置の出力
となるものである。4はエントロピー計算部で、すべて
の異なり先行記号列の見出しごとのエントロピーを計算
するものである。5は見出し更新部で、エントロピー計
算部4で得られた見出しごとのエントロピーの中で最大
のエントロピーを持つ見出しの記号列の先頭に記号を挿
入して見出しを更新するものである。
【0015】前述のように構成された本発明の実施例を
示す接続マトリクス作成方法について図2を参照しなが
ら説明する。ただし、ここで先行記号列の見出しのカウ
ンタをj、見出しの上限数をj_maxとする(j=1,2,・・・,j_
max)。
【0016】1.まず、すべての先行記号列の見出しの
記号列の長さNj=1(ただしj=1,2,・・・,jmax)とし、先行
記号列の見出しw(1-Nj),・・・,w(i-1)(すなわちw(i-1)、
∵Nj=1)として記号wk(ただしk=1,2,・・・,M)を登録す
る(見出しの初期化)。よって、現在の先行記号列の見
出し数j_curr=kとなる。このときの接続マトリクスを図
3に示す。
【0017】2.学習用データを使って、すべての先行
記号列w(1-Nj),・・・,w(i-1)から後続記号w(i)への遷移尤
度P{w(i)|w(i-Nj),・・・,w(i-1)}を(数3)に従って計
算する。
【0018】
【数3】
【0019】ここでn{w(i-N),・・・,w(i-1),w(i)}は学
習用データに含まれる記号列w(i-N),・・・,w(i-1),w(i)の
総数、n{w(i-N),・・・,w(i-1)}は学習用データに含まれ
る記号列w(i-N),・・・,w(i-1)の総数である。このときの
接続マトリクスを図4に示す。
【0020】3.j_max<j_currならば処理を終わり、
処理7に移る。 4.見出しjごとのエントロピーH(j)(ただしj=1,2,・・
・,j_max)を(数4)に従って計算する。
【0021】
【数4】
【0022】ただし、Wjは見出しjの記号列、wkは後続
記号(k=1,2,・・・,M)である。 5.最大のエントロピーを持つ見出しを見つけ、その先
行記号列がWmaxの長さがNjであれば、Nj=Nj+1と更新
し、新しい見出しwkmax(k=1,2,・・・,M)を追加し、古
い見出しWmaxを消去して、処理2に戻る。
【0023】7.遷移尤度を接続マトリクスとして出力
する。 次に、図5は本発明の請求項2の一実施例のマトリクス
作成装置の構成図である。
【0024】図中、51は学習用データ保管部で、学習
用データとして使うための数多くの記号列をあらかじめ
収集して作成しておく。52は初期尤度計算部で、上記
学習用データ保管部51のデータを使って記号列w(i-
N),・・・,w(i-1)に記号w(i)が後続する遷移尤度P{w(i)|w
(i-N),・・・,w(i-1)}を求めるためのものである。53は
初期エントロピー計算部で、見出しごとのエントロピー
を計算するものである。54は尤度計算部で、上記学習
用データ保管部51のデータを使って記号列w(i-N),・・
・,w(i-1)に記号w(i)が後続する遷移尤度P{w(i)|w(i-
N),・・・,w(i-1)}を求めるためのものである。55は接
続マトリクスで、上記尤度計算部54で得られた遷移尤
度のことであり、これが本装置の出力となるものであ
る。56はエントロピー計算部で、見出しごとのエント
ロピーを計算するものである。57は見出し更新部で、
エントロピー計算部56で更新すべきであると決定され
た見出しを更新するためのものである。 前述のように
構成された本発明の実施例を示す接続マトリクス作成方
法について図6を参照しながら説明する。ただし、ここ
で先行記号列見出しのカウンタをj、見出しの上限数をj
_maxとする(j=1,2,・・・,j_max)。
【0025】1.まず、すべての見出しの記号列の長さ
Nj=1(ただしj=1,2,・・・,j_max)とし、見出しw(1-Nj),・
・・,w(i-1)(すなわちw(i-1)、∵Nj=1)として記号w
k(ただしk=1,2,・・・,M)を登録する(見出しの初期
化)。よって、現在の先行記号列の見出し数j_curr=kと
なる。
【0026】2.学習用データを使って先行記号列w(1-
N),・・・,w(i-1)から後続記号w(i)への(初期)遷移尤度P
{w(i)|w(i-Nj),・・・,w(i-1)}を計算する。
【0027】
【数5】
【0028】ここでn{w(i-N),・・・,w(i-1),w(i)}は学
習用データに含まれる記号列w(i-N),・・・,w(i-1),w(i)の
総数、n{w(i-N),・・・,w(i-1)}は学習用データに含まれ
る記号列w(i-N),・・・,w(i-1)の総数である。
【0029】3.すべての先行記号列の見出しjごとの
エントロピーH(j)(ただしj=1,2,・・・,j_max)を(数
6)に従って計算する。
【0030】
【数6】
【0031】ただし、Wjは見出しjの記号列、wkは後続
記号(k=1,2,・・・,M)である。 4.全エントロピーHallを(数7)に従って計算す
る。
【0032】
【数7】
【0033】5.先行記号列の見出しのカウンタj=1と
する。 6.先行記号列に先行する記号のカウンタj'=1とする。
【0034】7.先行記号列の見出しjの記号列Wjの先
頭に記号wj'を挿入して仮に先行記号列の更新を行い、
新しい見出しwj'jを仮に追加する。
【0035】8.先行記号列に先行する記号のカウンタ
j'=j'+1と更新する。 9.もしj'≦Mならば処理7に戻る。そうでなければ、
処理10に進む。
【0036】10.仮に先行記号列Wjを削除し、仮更
新後の先行記号列の見出しjにおけるエントロピーを
(数8)に従って計算する。
【0037】
【数8】
【0038】ただし、Wjは見出しjの記号列、wkは後続
記号(k=1,2,・・・,M)である。 11.見出しを処理7〜10の仮更新の処理を行う前の
状態に戻す。
【0039】12.先行記号列の見出しのカウンタj=j+
1と更新する。 13.もしj≦j_currならば処理6に戻る。そうでなけ
れば処理14に進む。
【0040】14.仮更新前と仮更新後のエントロピー
の差dH(j)(数9)が最大であるような先行記号列の見
出しを見つけ、正式に見出しjの記号列Wjをwj'j(た
だしj'=1,2,・・・,M)に更新する。同時にj_currも更新
し、先行記号列Wjをもつ見出しjを消去する。
【0041】
【数9】
【0042】15.もしj_max<j_currならば処理16
に進む。そうでなければ処理5に戻る。
【0043】16.遷移尤度を接続マトリクスとして出
力する。 また、上記実施例の処理14の後に、以下の処理14’
を行って、j_currを減少させることもできる。(請求項
3、7) 14’.見出しjにおける前向き遷移密度を(数10)
に従って算出し、
【0044】
【数10】
【0045】(ここでn(Wj)、n(Wjwk)はそれぞれ
学習用データに含まれる記号列Wj、Wjwkの総数であ
る。)そして、見出しj1とj2の距離(数11)の近いも
のを1つの見出しにまとめる。
【0046】
【数11】
【0047】また、上記実施例の処理14の後に、以下
の処理14’’を行って、j_currを減少させることもで
きる。(請求項4、8) 14’’.見出しjにおける後向き遷移密度を(数1
2)に従って算出し、
【0048】
【数12】
【0049】(ここでn(Wj)、n(wlj)はそれぞれ
学習用データに含まれる記号列Wj、w ljの総数であ
る。)そして、見出しj1とj2の距離(数13)の近いも
のを1つの見出しにまとめる。
【0050】
【数13】
【0051】
【発明の効果】以上詳細に説明したように、本発明によ
れば、次のような効果を得ることができる。 (1)エントロピーの高い見出しから、見出しの生成を
行ってゆくので、見出しの数(登録しておくべき尤度の
個数)を抑えながらも高い精度を持つ接続マトリクスを
得ることができる。 (2)見出しの更新を行う場合、あらかじめ最もエント
ロピーの減少が得られるような見出しを見つけてから更
新を行うので、必ず、エントロピーの減少が得られるよ
うな更新だけを行うことができる。 (3)前向き、前後向き遷移密度の類似したものどうし
を1つの見出しにまとめる処理を行うので、見出しの数
が減少すると共に、1つの見出し当りのデータ量が増加
し、接続マトリクスの推定精度を上げることができる。
【図面の簡単な説明】
【図1】本発明の一実施例における接続マトリクス作成
装置の構成を示すブロック図
【図2】本発明の一実施例における接続マトリクス作成
フローチャート
【図3】本発明の一実施例における初期化後の接続マト
リクスの説明図
【図4】本発明の一実施例における先行記号列から後続
記号への遷移確率算出後の接続マトリクスの説明図
【図5】本発明の一実施例における接続マトリクス作成
装置の構成図
【図6】本発明の一実施例における接続マトリクス作成
フローチャート
【図7】従来例における接続マトリクス作成装置の構成
【符号の説明】
1 学習用データ保管部 2 尤度計算部 3 接続マトリクス 4 エントロピー計算部 5 見出し更新部 51 学習用データ保管部 52 初期尤度計算部 53 初期エントロピー計算部 54 尤度計算部 55 接続マトリクス 56 エントロピー計算部 57 見出し更新部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】1個以上の記号からなる記号列(以下、先
    行記号列)からそれらに後続する記号(以下、後続記
    号)への接続マトリクスの作成において、すべての異な
    り先行記号列の後にすべての異なり後続記号が出現する
    尤度(以下、遷移尤度)を求める尤度計算部と、上記尤
    度計算部により求められた遷移尤度から先行記号列の見
    出しごとのエントロピーを求めるエントロピー計算部
    と、上記エントロピー計算部により求められた先行記号
    列の見出しごとのエントロピーの中で最大のエントロピ
    ーを持つ見出しの記号列の先頭に記号を挿入して新たな
    先行記号列の見出しを作成して見出しを更新する見出し
    更新部とを備えたことを特徴とする接続マトリクス作成
    装置。
  2. 【請求項2】先行記号列から後続記号への接続マトリク
    スの作成において、すべての異なり先行記号列からすべ
    ての異なり後続記号への遷移尤度を求める尤度計算部
    と、上記尤度計算部により求められた遷移尤度から先行
    記号列の見出しごとのエントロピーを求めるエントロピ
    ー計算部と、上記エントロピー計算部により求められた
    先行記号列の見出しごとのエントロピーから全体のエン
    トロピーを求める全エントロピー計算部と、上記先行記
    号列の見出しの記号列の先頭に記号を挿入して見出しを
    仮に更新した場合の全エントロピー(以下、仮全エント
    ロピー)を求める仮全エントロピー計算部と、上記全エ
    ントロピー計算部から得られた上記全エントロピーおよ
    びその先行記号列の見出し数と、上記仮全エントロピー
    計算ステップから得られた上記仮全エントロピーおよび
    その先行記号列の見出し数とから更新すべき先行単語列
    の見出しを決定し、その先頭に記号列を挿入して新たな
    先行記号列の見出しを作成して見出しを更新する見出し
    更新部とを備えたことを特徴とする接続マトリクス作成
    装置。
  3. 【請求項3】すべての異なり先行記号列からすべての異
    なり後続記号への遷移尤度(以下、前向き遷移密度)を
    求める密度計算部と、上記前向き遷移密度の類似した上
    記見出しどうしを1つの見出しにまとめて見出しを更新
    する見出し更新部とを備えたことを特徴とする請求項1
    に記載の接続マトリクス作成装置。
  4. 【請求項4】すべての異なり先行記号列にすべての異な
    り記号が先行する尤度(以下、後向き遷移密度)を求め
    る密度計算部と、上記後向き遷移密度の類似した上記見
    出しどうしを1つの見出しにまとめて見出しを更新する
    見出し更新部とを備えたことを特徴とする請求項1に記
    載の接続マトリクス作成装置。
  5. 【請求項5】先行記号列から後続記号への接続マトリク
    スの作成において、遷移尤度を求める尤度計算ステップ
    と、上記尤度計算ステップにより求められた遷移尤度か
    ら上記先行記号列の見出しごとのエントロピーを求める
    エントロピー計算ステップと、上記エントロピー計算ス
    テップにより求められた先行記号列の見出しごとのエン
    トロピーの中で最大のエントロピーを持つ見出しの記号
    列の先頭に記号を挿入して新たな先行記号列の見出しを
    作成して見出しを更新する見出し更新ステップと、再び
    新たな見出しにおける遷移尤度を求める上記尤度計算ス
    テップとを実行し、上記尤度計算ステップにより得られ
    た遷移尤度を接続マトリクスとして出力することを特徴
    とする接続マトリクス作成方法。
  6. 【請求項6】先行記号列から後続記号への接続マトリク
    スの作成において、遷移尤度を求める尤度計算ステップ
    と、上記尤度計算ステップにより求められた遷移尤度か
    ら上記先行記号列の見出しごとのエントロピーを求める
    エントロピー計算ステップと、上記エントロピー計算ス
    テップにより求められた先行記号列の見出しごとエント
    ロピーから接続マトリクス全体のエントロピーを求める
    全エントロピー計算ステップと、仮全エントロピーを求
    める仮全エントロピー計算ステップと、上記全エントロ
    ピー計算ステップから得られた上記全エントロピーおよ
    びその先行記号列の見出し数と、上記仮全エントロピー
    計算ステップから得られた上記仮全エントロピーおよび
    その先行記号列の見出し数とから更新すべき先行単語列
    の見出しを決定し、その先頭に記号列を挿入して新たな
    先行記号列の見出しを作成して見出しを更新する見出し
    更新ステップとを実行し、上記尤度計算ステップにより
    得られた遷移尤度を接続マトリクスとして出力すること
    を特徴とする接続マトリクス作成方法。
  7. 【請求項7】前向き遷移密度を求める密度計算ステップ
    と、上記密度計算ステップにより求められた前向き遷移
    密度の類似した先行記号列の見出しどうしを1つの見出
    しにまとめて見出しを更新する見出し更新ステップとを
    実行することを特徴とした請求項5に記載の接続マトリ
    クス作成方法。
  8. 【請求項8】後向き遷移密度を求める密度計算ステップ
    と、上記密度計算ステップにより求められた後向き遷移
    密度の類似した先行記号列の見出しどうしを1つの見出
    しにまとめて見出しを更新する見出し更新ステップとを
    実行することを特徴とした請求項5に記載の接続マトリ
    クス作成方法。
JP3270814A 1991-10-18 1991-10-18 接続マトリクス作成方法およびその装置 Pending JPH05108704A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP3270814A JPH05108704A (ja) 1991-10-18 1991-10-18 接続マトリクス作成方法およびその装置
US07/961,507 US5355311A (en) 1991-10-18 1992-10-15 Method and apparatus for creating a connection matrix

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3270814A JPH05108704A (ja) 1991-10-18 1991-10-18 接続マトリクス作成方法およびその装置

Publications (1)

Publication Number Publication Date
JPH05108704A true JPH05108704A (ja) 1993-04-30

Family

ID=17491394

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3270814A Pending JPH05108704A (ja) 1991-10-18 1991-10-18 接続マトリクス作成方法およびその装置

Country Status (2)

Country Link
US (1) US5355311A (ja)
JP (1) JPH05108704A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310388A (zh) * 2013-05-28 2013-09-18 清华大学 基于信源熵的电网运行综合指数计算方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6950814B2 (en) * 2000-06-24 2005-09-27 International Business Machines Corporation Natural language processing methods and systems
US20040267529A1 (en) * 2003-06-24 2004-12-30 Aurilab, Llc N-gram spotting followed by matching continuation tree forward and backward from a spotted n-gram
US7739103B2 (en) * 2004-04-06 2010-06-15 Educational Testing Service Lexical association metric for knowledge-free extraction of phrasal terms
US12008048B2 (en) 2021-01-04 2024-06-11 Oracle International Corporation Drill back to original audio clip in virtual assistant initiated lists and reminders

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5033087A (en) * 1989-03-14 1991-07-16 International Business Machines Corp. Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system
JP3211241B2 (ja) * 1990-07-27 2001-09-25 オムロン株式会社 近似推論装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103310388A (zh) * 2013-05-28 2013-09-18 清华大学 基于信源熵的电网运行综合指数计算方法
CN103310388B (zh) * 2013-05-28 2016-06-01 清华大学 基于信源熵的电网运行综合指数计算方法

Also Published As

Publication number Publication date
US5355311A (en) 1994-10-11

Similar Documents

Publication Publication Date Title
JP4652737B2 (ja) 単語境界確率推定装置及び方法、確率的言語モデル構築装置及び方法、仮名漢字変換装置及び方法、並びに、未知語モデルの構築方法、
JP4215418B2 (ja) 単語予測方法、音声認識方法、その方法を用いた音声認識装置及びプログラム
CN110750993A (zh) 分词方法及分词器、命名实体识别方法及系统
CN111462751A (zh) 解码语音数据的方法、装置、计算机设备和存储介质
KR100582968B1 (ko) 문자열 입력 장치 및 방법
CN110603583A (zh) 语音识别系统和用于语音识别的方法
CN100508024C (zh) 基于hmm的文字-音素分析器及其训练方法
CN111626041B (zh) 一种基于深度学习的音乐评论生成方法
CN110688450B (zh) 一种基于蒙特卡洛树搜索的关键词生成方法、基于强化学习的关键词生成模型及电子设备
CN113574545A (zh) 用于训练模型的训练数据修改
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
Heigold et al. Neural morphological tagging from characters for morphologically rich languages
JP6941494B2 (ja) エンドツーエンド日本語音声認識モデル学習装置およびプログラム
CN120745801A (zh) 利用大语言模型生成文本的方法和装置
CN109284358B (zh) 一种中文地址名词分层级的方法和装置
JPH05108704A (ja) 接続マトリクス作成方法およびその装置
CN116129907A (zh) 指令识别方法及装置、设备、计算机可读存储介质
CN116013278A (zh) 基于拼音对齐算法的语音识别多模型结果合并方法及装置
CN118571236A (zh) 一种基于音域范围的音频token化编码方法及装置
JP3080066B2 (ja) 文字認識装置、方法及び記憶媒体
US20070055515A1 (en) Method for automatically matching graphic elements and phonetic elements
CN113836917B (zh) 文本分词处理方法及其装置、设备与介质
JP2938865B1 (ja) 音声認識装置
JP3953772B2 (ja) 読みがな付与装置およびプログラム
JP4226942B2 (ja) アクセント位置推定方法、装置およびプログラム