JPS6079469A - 日本語文の語「い」上「あい」味性検出装置 - Google Patents
日本語文の語「い」上「あい」味性検出装置Info
- Publication number
- JPS6079469A JPS6079469A JP58188146A JP18814683A JPS6079469A JP S6079469 A JPS6079469 A JP S6079469A JP 58188146 A JP58188146 A JP 58188146A JP 18814683 A JP18814683 A JP 18814683A JP S6079469 A JPS6079469 A JP S6079469A
- Authority
- JP
- Japan
- Prior art keywords
- ambiguity
- word
- character
- sentence
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の技術分骨〕
本発明は、自然言語処理装置に係り、特に、語尾インデ
ックスを持つ単語辞書を備え、辞書引きを含む形態素解
析、および語粟上の曖昧性(語境界の曖昧性、同級異義
、同音異義、多品側)の検出を文字単位のパイプライン
処理に基いて高速に実行できる日本語文の語粟上曖昧性
検出装置に関する。
ックスを持つ単語辞書を備え、辞書引きを含む形態素解
析、および語粟上の曖昧性(語境界の曖昧性、同級異義
、同音異義、多品側)の検出を文字単位のパイプライン
処理に基いて高速に実行できる日本語文の語粟上曖昧性
検出装置に関する。
形態素解析装置は、例えば「私は花が好きだ。」という
8つの文字列(句点の0を含む)よりなる日本語文があ
るとすると、これを、「私」、「は」、「花」、「が」
、「好き旭す6’5roJのように、文を解析して単語
の切り出しを行って単語列を生成する処理を行う。とこ
ろで日本語の中には、同級異義、例えば「こうふ」と「
くふう」と読む「工夫」のような単語や、同音異義、例
えば「花」と「鼻」に対する読み「はな」のような単語
、多品詞、例えば名詞と動詞連用形のいずれにもなり得
る「思い」のような単語など、曖昧な単語がかな)存在
する。また、電文などの例としてよく用いられる「カネ
オクレタノム。」の場合、 「金送れ頼む。」なのか、
或いは「金なくれ頼む。」なのか、また、 「カ本」は
「金」なのか、或いは「鐘」なのかなどが曖昧になって
しまう。
8つの文字列(句点の0を含む)よりなる日本語文があ
るとすると、これを、「私」、「は」、「花」、「が」
、「好き旭す6’5roJのように、文を解析して単語
の切り出しを行って単語列を生成する処理を行う。とこ
ろで日本語の中には、同級異義、例えば「こうふ」と「
くふう」と読む「工夫」のような単語や、同音異義、例
えば「花」と「鼻」に対する読み「はな」のような単語
、多品詞、例えば名詞と動詞連用形のいずれにもなり得
る「思い」のような単語など、曖昧な単語がかな)存在
する。また、電文などの例としてよく用いられる「カネ
オクレタノム。」の場合、 「金送れ頼む。」なのか、
或いは「金なくれ頼む。」なのか、また、 「カ本」は
「金」なのか、或いは「鐘」なのかなどが曖昧になって
しまう。
従来の形態素解析装置としては、日本語の入力文が語垂
上の曖昧性を有する場合、■単語の分割において、何ら
かの制限を加えることによシ、1通りの単語列のみ出力
する方式と、■可能な単語列(複数個)を全て出力する
が処理形態は逐次処理である方式とがあるが、前者は、
構文解析、意味解析、文脈解析などによシ解釈を判定す
べき場合であっても、それらの情報を使わずに解釈を固
定してしまうことがあるという欠点を有し、また後者は
、曖昧な入力文を逐次処理することにより、処理時間が
解釈の数(単語列の数)に比例して増大するという欠点
を有する。
上の曖昧性を有する場合、■単語の分割において、何ら
かの制限を加えることによシ、1通りの単語列のみ出力
する方式と、■可能な単語列(複数個)を全て出力する
が処理形態は逐次処理である方式とがあるが、前者は、
構文解析、意味解析、文脈解析などによシ解釈を判定す
べき場合であっても、それらの情報を使わずに解釈を固
定してしまうことがあるという欠点を有し、また後者は
、曖昧な入力文を逐次処理することにより、処理時間が
解釈の数(単語列の数)に比例して増大するという欠点
を有する。
本発明は、上記の考察に基づ(ものであって、分かち書
きされない日本語文人力に対し、1文字分の処理を2動
作単位とし、同時にN個(Nは〕ぜイブラインの長さ)
の文を解析し得るノぐイブライン処理装置によシ形態素
解析をすることによって、入力文を持つ曖昧性を検出し
、可能な単語分かち書きを全て出力することを高速に実
現する日本語文の語垂上曖昧性検出装置を提供すること
を目的とするものである。
きされない日本語文人力に対し、1文字分の処理を2動
作単位とし、同時にN個(Nは〕ぜイブラインの長さ)
の文を解析し得るノぐイブライン処理装置によシ形態素
解析をすることによって、入力文を持つ曖昧性を検出し
、可能な単語分かち書きを全て出力することを高速に実
現する日本語文の語垂上曖昧性検出装置を提供すること
を目的とするものである。
そのために本発明の日本語文の語粟上曖昧性検出装置は
、日本語の入力文章の文字列を分かち書きされた単語列
に変換して変換結果と曖昧性に関する情報を出力する日
本語文の語垂上曖昧性検出装置であって、日本語文の入
力を制御し入力文章に識別番号を添加する入力制御部、
語尾文字インデックスによシ単語が配列され各単語に曖
昧性に関する情報をもつ単語辞書、パイプライン処理に
おいて次の文字を先読みして当該文字を語尾文字インデ
ックスとして上記辞書から単語群を辞書引きする先読み
辞書引き部、文字単位のノ々イブライン処理により上記
先読み辞書引き部の前段で辞書引きされた単語群と前段
までに変換処理された単語・文字混合列の組とのマツチ
ングを行い、変換結果の単語・文字混合列の組と曖昧性
に関する情報を次段に送ると共に1次の文字を上記先読
み辞書引き部に送る曖昧性検出部、及び上記曖昧性検出
部で単語列として分かち書きされた変換結果と曖昧性に
関する情報を上記識別番号に従って出力する出力制御部
を具備することを特徴とするものである。
、日本語の入力文章の文字列を分かち書きされた単語列
に変換して変換結果と曖昧性に関する情報を出力する日
本語文の語垂上曖昧性検出装置であって、日本語文の入
力を制御し入力文章に識別番号を添加する入力制御部、
語尾文字インデックスによシ単語が配列され各単語に曖
昧性に関する情報をもつ単語辞書、パイプライン処理に
おいて次の文字を先読みして当該文字を語尾文字インデ
ックスとして上記辞書から単語群を辞書引きする先読み
辞書引き部、文字単位のノ々イブライン処理により上記
先読み辞書引き部の前段で辞書引きされた単語群と前段
までに変換処理された単語・文字混合列の組とのマツチ
ングを行い、変換結果の単語・文字混合列の組と曖昧性
に関する情報を次段に送ると共に1次の文字を上記先読
み辞書引き部に送る曖昧性検出部、及び上記曖昧性検出
部で単語列として分かち書きされた変換結果と曖昧性に
関する情報を上記識別番号に従って出力する出力制御部
を具備することを特徴とするものである。
以下、本発明の実施例を図面を参照しつつ説明する。
第1図は本発明が適用される曖昧性検出装置の1実施例
構成を示す図、第2図は語尾文字をインデックスとする
単語辞書の構成例を示す図、第3図は本発明の曖昧性検
出装置の他の実施例構成を示す図である。図において、
alないしaNは曖昧性検出器、bは出力バツフ了、C
1は入力制御器、C9は出力制御器、dは辞書、e、な
いしeNは先読み辞書引き器、fl、1ないしfN L
Mは単語分割1の並列処理用プロセッサを示す。
構成を示す図、第2図は語尾文字をインデックスとする
単語辞書の構成例を示す図、第3図は本発明の曖昧性検
出装置の他の実施例構成を示す図である。図において、
alないしaNは曖昧性検出器、bは出力バツフ了、C
1は入力制御器、C9は出力制御器、dは辞書、e、な
いしeNは先読み辞書引き器、fl、1ないしfN L
Mは単語分割1の並列処理用プロセッサを示す。
本発明は、パイプライン処理の並列動作の特徴を利用す
ることにより、日本語文の語索上の曖昧性を高速に検出
するようにし、また、1文字車位のパイプライン処理に
最適な単語辞書として、語 。
ることにより、日本語文の語索上の曖昧性を高速に検出
するようにし、また、1文字車位のパイプライン処理に
最適な単語辞書として、語 。
尾文字インデックスによシ候補単語群の一括検索が可能
な語尾インデックス辞書を利用し、辞書の検索効率を上
げるようにしたものである。
な語尾インデックス辞書を利用し、辞書の検索効率を上
げるようにしたものである。
漠字カナ交り表記の入力文章に対し、単語列に分かち書
きして出力し、さらに語常上の曖昧性(語境界の曖昧性
、同級異義、同音異議、多品詞)を含む場合には、それ
を検出し、可能な単語列を全て出力する機能を有する曖
昧性検出装置の1実施例構成を示したのが第1図である
。
きして出力し、さらに語常上の曖昧性(語境界の曖昧性
、同級異義、同音異議、多品詞)を含む場合には、それ
を検出し、可能な単語列を全て出力する機能を有する曖
昧性検出装置の1実施例構成を示したのが第1図である
。
第1図において、入力文章は2バイト・コード列として
入力制御器C8より入力され、句点6゜′によ#)1文
ごとに区切られ、順次曖昧性検出器a0に送られる。そ
してN台の曖昧性検出器a、ないしaNNノミ、a、、
・・・・・・a8の順にパイプライン処理が施される。
入力制御器C8より入力され、句点6゜′によ#)1文
ごとに区切られ、順次曖昧性検出器a0に送られる。そ
してN台の曖昧性検出器a、ないしaNNノミ、a、、
・・・・・・a8の順にパイプライン処理が施される。
各曖昧性検出器a1ないしaNは、1〜
、・文字ごとに文字列→単語列の変換を行うので、パイ
プライン処理が施され、パイプラインを通過すると、N
文字分の変換が施される。従って、日本語入力文の1文
当シの文字数の分布を考慮してNを設定すべきである。
プライン処理が施され、パイプラインを通過すると、N
文字分の変換が施される。従って、日本語入力文の1文
当シの文字数の分布を考慮してNを設定すべきである。
また、各検出器ah (↓−1,2、・・・・・・、N
)には、先読み辞書引き器e↓が接続されておシ、次の
文字を先読みして、その文字を語尾とする単語群を辞書
dよシ獲得して、後続の曖昧性検出器aL+1へ送る。
)には、先読み辞書引き器e↓が接続されておシ、次の
文字を先読みして、その文字を語尾とする単語群を辞書
dよシ獲得して、後続の曖昧性検出器aL+1へ送る。
辞書dは、第2図に示すように、語尾文字をインデック
スとして、°その文字を語尾とする単語群を一括して検
索できるようになっている。辞書項目としては、漠字カ
ナ交シ表記の見出し、見出しの文字数、曖昧性情報(曖
昧性の独別を示す)、読みがな、品詞分類があるが、こ
れらの項目は、応用によって増減してもよい。この語尾
文字をインデックスとする辞書dは、1文字を処理単位
とするパイプライン構造の場合、特に単語の切シ出しの
効率が高くなるので、有効な辞書構成法である。ま、た
、1文の長さがm文字(m≦N)であるような文は、曖
昧性検出器amにおいて、文字列→単語列の変換が終了
するので、変換結果の後部に未変換の文字が残っている
ような単語分割については、不適格として棄却する。そ
れ以外の単語分割については全て適格であり、それぞれ
の単語列は、曖昧性情報、文の識別番号Iとともに出力
バッフ了すに送られる。
スとして、°その文字を語尾とする単語群を一括して検
索できるようになっている。辞書項目としては、漠字カ
ナ交シ表記の見出し、見出しの文字数、曖昧性情報(曖
昧性の独別を示す)、読みがな、品詞分類があるが、こ
れらの項目は、応用によって増減してもよい。この語尾
文字をインデックスとする辞書dは、1文字を処理単位
とするパイプライン構造の場合、特に単語の切シ出しの
効率が高くなるので、有効な辞書構成法である。ま、た
、1文の長さがm文字(m≦N)であるような文は、曖
昧性検出器amにおいて、文字列→単語列の変換が終了
するので、変換結果の後部に未変換の文字が残っている
ような単語分割については、不適格として棄却する。そ
れ以外の単語分割については全て適格であり、それぞれ
の単語列は、曖昧性情報、文の識別番号Iとともに出力
バッフ了すに送られる。
文の長さは不特定であるので、出力バッファbに送られ
る順番は必ずしも入力の順番と一致しない。
る順番は必ずしも入力の順番と一致しない。
出力制御器C7は、既に出力法の最新の文の識別番号が
Jであるとき、出カバ、フ丁すのデータ中からJ+1の
文に対応するデータを探して出力する。もし、見つから
なければ、J+1の文のデータが到着するまで待機する
。
Jであるとき、出カバ、フ丁すのデータ中からJ+1の
文に対応するデータを探して出力する。もし、見つから
なければ、J+1の文のデータが到着するまで待機する
。
また、出力制御器C7は、出力バッフ了すの状態を監視
し、出カバ、フ了すの容量近くまでデータが格納された
ときには、入力制御器C1に対して、入力の一時停止の
指示を送り、その後出力バザフフの状態が緩和されたと
きに入力再開の指示を送るO 次に、パイプライン処理の成るフェーズTKニおける曖
昧性検出器aLの処理および曖昧性検出器a!+1との
関係について詳述する。フェーズTえの始めの時刻にお
いては、曖昧性検出器aAは、曖昧性検出器3L−1か
ら1番目の文S、のA−1番目の文字まで変換処理を施
した単語・文字混合らは文S の1番目の文字l、を語
尾とする単語文字l、が句点である場合には、文末処理
(単語・文字混合列の組sj/−1の中から未変換の文
字列を含むような単語分割を棄却する)を施した後、文
識別番号Jを付けたまま出力バッファすへ送る。
し、出カバ、フ了すの容量近くまでデータが格納された
ときには、入力制御器C1に対して、入力の一時停止の
指示を送り、その後出力バザフフの状態が緩和されたと
きに入力再開の指示を送るO 次に、パイプライン処理の成るフェーズTKニおける曖
昧性検出器aLの処理および曖昧性検出器a!+1との
関係について詳述する。フェーズTえの始めの時刻にお
いては、曖昧性検出器aAは、曖昧性検出器3L−1か
ら1番目の文S、のA−1番目の文字まで変換処理を施
した単語・文字混合らは文S の1番目の文字l、を語
尾とする単語文字l、が句点である場合には、文末処理
(単語・文字混合列の組sj/−1の中から未変換の文
字列を含むような単語分割を棄却する)を施した後、文
識別番号Jを付けたまま出力バッファすへ送る。
しかし文字tJ、が句点でない場合には、まず曖昧性検
出器a、は文字t>+sを先読み辞書引き器e4に送る
。先読み辞書引き器eLは、文字1j+1を語尾インデ
ックスとして辞書dから単語群v (4+t )を獲得
し、フェーズTP:の終シの時刻(= Tx+1の始め
の時刻)に曖昧性検出器aj刊へ出力する。曖昧性検出
器a、は、上記の先読み辞書引き器eLの動作と、は並
列に、文s;=1と単語群V(ZL/)とのマッチンレ
・や図6ot□ゎち、文8.。各章お0文字混合↓−1 列の文字1.以前の部分文字列と単語群V(Z、)中の
各単語の中に一致するものがあるが否かを調べる。
出器a、は文字t>+sを先読み辞書引き器e4に送る
。先読み辞書引き器eLは、文字1j+1を語尾インデ
ックスとして辞書dから単語群v (4+t )を獲得
し、フェーズTP:の終シの時刻(= Tx+1の始め
の時刻)に曖昧性検出器aj刊へ出力する。曖昧性検出
器a、は、上記の先読み辞書引き器eLの動作と、は並
列に、文s;=1と単語群V(ZL/)とのマッチンレ
・や図6ot□ゎち、文8.。各章お0文字混合↓−1 列の文字1.以前の部分文字列と単語群V(Z、)中の
各単語の中に一致するものがあるが否かを調べる。
今、1番目の文S/が文字列1.1.・・・・・・t、
TIであり、曖昧性検出器aL−1の出方結果、文sニ
ー1の各単語・文字混合列の変換部分(A−1文字目ま
で)が、 W8.、・・・・・・・・・W、、tl(Zハ ・・・
・・・・・・1b−s )W7,1・・・・・・・・W
、 、 t、、 (l、、・・・・・・・・・To−s
)wn、t・・・・・・・” Wn、tn (2An
・・・・・・・・・1.−1)但し、11α11:文字
列aの長さとすると、また、x = l、2、・・・・
・・、力についてtLK・・・・・・・・・tl−1φ
■(tLJ、−1)かつ b−Lx <’maX 、−
1(If a II )d5V(7/) であること。
TIであり、曖昧性検出器aL−1の出方結果、文sニ
ー1の各単語・文字混合列の変換部分(A−1文字目ま
で)が、 W8.、・・・・・・・・・W、、tl(Zハ ・・・
・・・・・・1b−s )W7,1・・・・・・・・W
、 、 t、、 (l、、・・・・・・・・・To−s
)wn、t・・・・・・・” Wn、tn (2An
・・・・・・・・・1.−1)但し、11α11:文字
列aの長さとすると、また、x = l、2、・・・・
・・、力についてtLK・・・・・・・・・tl−1φ
■(tLJ、−1)かつ b−Lx <’maX 、−
1(If a II )d5V(7/) であること。
である場合、文S;を得るためには、例えば第1番目の
Wl、1・・・・・・・・・WI + ts (Ah
l−9−911−8)に対して■(tlr・・・・・t
t1)ムこv(z;)ならばWl、1°°°00渭1t
l W(t、t)+ ts+> (H81但し・W(’
4 ’ ) + t1+1 = (1−AI・・・・・
・t、−x ) lb■W1. t、+p、−°−VJ
、 、 t、 (1,、−−−−−−t 、−1) t
、 〔v(lJ、)ならば Wl、、°”Wt、ts−pt−+W(s、pla)
、tt−ptε87但し、W(1、pt+* ) 、
tl−pi°W!、 tl−pi°°°°°゛…w、、
tl(tL、・・・・・・・・・1.−1>1にという
条件を満たさなければならない。
Wl、1・・・・・・・・・WI + ts (Ah
l−9−911−8)に対して■(tlr・・・・・t
t1)ムこv(z;)ならばWl、1°°°00渭1t
l W(t、t)+ ts+> (H81但し・W(’
4 ’ ) + t1+1 = (1−AI・・・・・
・t、−x ) lb■W1. t、+p、−°−VJ
、 、 t、 (1,、−−−−−−t 、−1) t
、 〔v(lJ、)ならば Wl、、°”Wt、ts−pt−+W(s、pla)
、tt−ptε87但し、W(1、pt+* ) 、
tl−pi°W!、 tl−pi°°°°°゛…w、、
tl(tL、・・・・・・・・・1.−1>1にという
条件を満たさなければならない。
また、■と■のいずれも満たさない場合、■II(tL
l・・・・・・1h−s ) 1L11 <MDのとき
、WI、ビ°1°0Wt 、’tt (tb1……I
A−1) ’LIEES/但し、MDは辞書中の見出し
の文字列の長さの最大値 ■II(z、1・・・・・・1b−t ) 1b11〉
Mnのとき、単飴分割W口・・・・・・Wllt、は不
適格となる。
l・・・・・・1h−s ) 1L11 <MDのとき
、WI、ビ°1°0Wt 、’tt (tb1……I
A−1) ’LIEES/但し、MDは辞書中の見出し
の文字列の長さの最大値 ■II(z、1・・・・・・1b−t ) 1b11〉
Mnのとき、単飴分割W口・・・・・・Wllt、は不
適格となる。
次に、1文の文字数がNを越える文の処理について述べ
る。この場合、N+1文字目以降を処理するプロセッサ
が存在しないので、パイプライン処理を循環型に動作さ
せる。すなわち、曖昧性検出器anへの入力文S7tか
ら入力文の長さがN +1以上であることがわかった場
合、曖昧性検出器a1は、入力制御器C1へ信号を送り
、入力制御器c1が新たな入力文を曖昧性検出器amに
入力しないように指示する。
る。この場合、N+1文字目以降を処理するプロセッサ
が存在しないので、パイプライン処理を循環型に動作さ
せる。すなわち、曖昧性検出器anへの入力文S7tか
ら入力文の長さがN +1以上であることがわかった場
合、曖昧性検出器a1は、入力制御器C1へ信号を送り
、入力制御器c1が新たな入力文を曖昧性検出器amに
入力しないように指示する。
そして、N+1文字目の文字!/1 を先読み辞書引き
器eNに送る。先読み辞■引き器eNは、文字4+1を
語尾インデックスとして辞書引きし、その結果とのマツ
チングを行い、不適格でないものを文s、1として出力
し、曖昧性検出器a、へ送る。そして、次のフェーズに
おいて、曖昧性検出器a、は、5番目の文のN+1文字
目について処理を行う。このフェーズにおいて、入力制
御器6に曖昧性検出器a、Iから新たな入力停止信号が
送られない限シ、入力制御器CIは次のフェーズに新た
な入力文を入力する準備を行う。
器eNに送る。先読み辞■引き器eNは、文字4+1を
語尾インデックスとして辞書引きし、その結果とのマツ
チングを行い、不適格でないものを文s、1として出力
し、曖昧性検出器a、へ送る。そして、次のフェーズに
おいて、曖昧性検出器a、は、5番目の文のN+1文字
目について処理を行う。このフェーズにおいて、入力制
御器6に曖昧性検出器a、Iから新たな入力停止信号が
送られない限シ、入力制御器CIは次のフェーズに新た
な入力文を入力する準備を行う。
本発明の他の実施例を示したのが第3図である。
第3図において、第1図に示す構成と異なるのは、■各
曖昧性検出器a1ないしaNがL↓個ずつのプロセッサ
fLJLから構成されている点であり、これにL+1 れぞれの単語分割について並列動作によって文S。
曖昧性検出器a1ないしaNがL↓個ずつのプロセッサ
fLJLから構成されている点であり、これにL+1 れぞれの単語分割について並列動作によって文S。
をめることができる点、及び■辞書において、語尾を文
字tとする単語群V (Z)の配列を逆配列(単語の綴
シを逆順に並べ換えた文字列を基準にして、アルファベ
ット順に辞書配列すること)にし、文字列1.・・・・
・・lKの部分文字列になシ得る単語群V/ (tl・
・・・・・1K)を迅速に得ることによシ、文字列→単
語変換の処理をさらに高速化できる点の2点である。
字tとする単語群V (Z)の配列を逆配列(単語の綴
シを逆順に並べ換えた文字列を基準にして、アルファベ
ット順に辞書配列すること)にし、文字列1.・・・・
・・lKの部分文字列になシ得る単語群V/ (tl・
・・・・・1K)を迅速に得ることによシ、文字列→単
語変換の処理をさらに高速化できる点の2点である。
以上の説明から明らかなように、本発明によれば、形態
素解析において、入力の日本語文章を高速に分かち書き
し、さらにat上の曖昧性を能率良く検出できるという
りl果がある。
素解析において、入力の日本語文章を高速に分かち書き
し、さらにat上の曖昧性を能率良く検出できるという
りl果がある。
第1図は本発明が適用される曖昧性検出装置の1実施例
構成を示す図、第2図は語尾文字をインデックスとする
単語辞書の構成例を示す図、第3図は本発明の曖昧性検
出装置の他の実施例構成を示す図である。 alないしa)I・・・曖昧性検出器、b・・・出カバ
ッフ丁、C8・・・入力制御器、C2・・・出力制御器
、d・・・辞書、elないしe)I・・・先読み辞書引
き器、’11ないし’N、I、N・・・単語分割の並列
処理用プロセッサ。 特許出願人 富士通株式会社 代理人弁理士 京 谷 四 部
構成を示す図、第2図は語尾文字をインデックスとする
単語辞書の構成例を示す図、第3図は本発明の曖昧性検
出装置の他の実施例構成を示す図である。 alないしa)I・・・曖昧性検出器、b・・・出カバ
ッフ丁、C8・・・入力制御器、C2・・・出力制御器
、d・・・辞書、elないしe)I・・・先読み辞書引
き器、’11ないし’N、I、N・・・単語分割の並列
処理用プロセッサ。 特許出願人 富士通株式会社 代理人弁理士 京 谷 四 部
Claims (1)
- 日本語の入力文章の文字列を分がち書きされた単語列に
変換して変換結果と曖昧性に関する情報を出力する日本
語文の語粟上曖昧性検出装置であって、日本語文の入力
を制御し入力文章に識別番号を添加する入力制御部、語
尾文字インデックスにより単語が配列され各単語に曖昧
性に関する情報をもつ単語辞書、パイプライン処理にお
いて次の文字を先読みして当該文字を語尾文字インデッ
クスとして上記辞書から単語群を辞書引きする先読み辞
書引き部、文字単位のパイプライン処理により上記先読
み辞書引き部の前段で辞書引きされた単語群と前段まで
に変換処理された単語・文字混合列の組とのマツチング
を行い、変換結果の単語・文字混合列の組と曖昧性に関
する情報を次段に送ると共に、次の文字を上記先読み辞
書引き部に送る曖昧性検出部、及び上記曖昧性検出部で
単語列として分かち書きされた変換結果と曖昧性に関す
る情報を上記識別番号に従って出力する出力制御部を具
備することを特徴とする日本語文の語垂上曖昧性検出装
置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58188146A JPS6079469A (ja) | 1983-10-07 | 1983-10-07 | 日本語文の語「い」上「あい」味性検出装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58188146A JPS6079469A (ja) | 1983-10-07 | 1983-10-07 | 日本語文の語「い」上「あい」味性検出装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS6079469A true JPS6079469A (ja) | 1985-05-07 |
Family
ID=16218549
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58188146A Pending JPS6079469A (ja) | 1983-10-07 | 1983-10-07 | 日本語文の語「い」上「あい」味性検出装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6079469A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01108646A (ja) * | 1987-10-20 | 1989-04-25 | Sharp Corp | テンプレートマッチング回路 |
| JPH01108647A (ja) * | 1987-10-20 | 1989-04-25 | Sharp Corp | テンプレートマッチング回路 |
-
1983
- 1983-10-07 JP JP58188146A patent/JPS6079469A/ja active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH01108646A (ja) * | 1987-10-20 | 1989-04-25 | Sharp Corp | テンプレートマッチング回路 |
| JPH01108647A (ja) * | 1987-10-20 | 1989-04-25 | Sharp Corp | テンプレートマッチング回路 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0971294A2 (en) | Method and apparatus for automated search and retrieval processing | |
| JP2002215617A (ja) | 品詞タグ付けをする方法 | |
| JPS6079469A (ja) | 日本語文の語「い」上「あい」味性検出装置 | |
| Sinha et al. | Enhancing the performance of part of speech tagging of nepali language through hybrid approach | |
| Garvin | Syntactic retrieval | |
| JPS58123129A (ja) | 仮名漢字変換装置 | |
| Bowers et al. | Cloze, transformational theory and redundancy | |
| JPS61208162A (ja) | かな漢字変換方式 | |
| JP3132563B2 (ja) | 文書作成支援装置 | |
| JPH04130578A (ja) | 未登録語検索方法および装置 | |
| JP3585944B2 (ja) | データ処理方法及びその装置 | |
| JPS61282966A (ja) | 仮名漢字変換方式 | |
| JPS57161971A (en) | Kana(japanese syllable) to kanji(chinese character) converting system | |
| JPS63308665A (ja) | 仮名漢字変換装置 | |
| JPS58200328A (ja) | カナ漢字変換装置 | |
| JPH01144162A (ja) | キーワードを用いた形態素解析方式及び装置 | |
| JP2728666B2 (ja) | 文章解析装置 | |
| Pyne | Some Ideas on Inter-structural Syntax | |
| JPH03116265A (ja) | かな漢字変換装置 | |
| JPS5831434A (ja) | 日本語文作成装置 | |
| JPS62131372A (ja) | 自然言語解析装置 | |
| JPH0630100B2 (ja) | 仮名漢字変換方式 | |
| JPH047670A (ja) | 文章解析方式 | |
| JPS6132167A (ja) | カナ漢字変換処理装置 | |
| JPS58214931A (ja) | 単語切り出し装置 |