JPS584481A - 日本語解析システム - Google Patents

日本語解析システム

Info

Publication number
JPS584481A
JPS584481A JP56102634A JP10263481A JPS584481A JP S584481 A JPS584481 A JP S584481A JP 56102634 A JP56102634 A JP 56102634A JP 10263481 A JP10263481 A JP 10263481A JP S584481 A JPS584481 A JP S584481A
Authority
JP
Japan
Prior art keywords
relationship
clauses
word
grammatical
phrases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56102634A
Other languages
English (en)
Other versions
JPH0157827B2 (ja
Inventor
Yuji Uchida
裕士 内田
Kenji Sugiyama
健司 杉山
Masato Kobe
正人 小部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56102634A priority Critical patent/JPS584481A/ja
Publication of JPS584481A publication Critical patent/JPS584481A/ja
Publication of JPH0157827B2 publication Critical patent/JPH0157827B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、日本語文を入力として、その意味していると
ころを解析し、文節間の関係を示す情報を出力できるよ
うになりた日本語解析システムに関するものである。
従来の日本語解析システムとしては、動詞毎に詞は、動
作主、動作の相手および対象物を必要とスル、というも
のである。ところが、日本語においては、動作や動作の
相手、時間に関する表現が省略されることが多く、この
ため正確な格パターンを用意しようとすれば、 (イ)複雑な形式となってしまう・ (cyJ  1つの動詞に対して数多くの格パターンが
必要となる。
という欠点を従来方式は有している。
本発明は、上記の欠点を除去するものであって、日本語
の文節間の関係を比較的に簡単な構成を持つ辞書を用い
て調べ、この文節間の関係情報を出力できるようにした
日本語解析システムを提供することを目的としている。
そしてそのため、本発明の日本語解析システムは、複数
種類の文節間の文法的関係の有無を判別する文法的関係
判別装置、複数種類の自立語と複数種類の付属語の意味
的関係の有無および自立語と付属語とよりなる複数種類
の組と自立語との間の意味的関係の有無を判別する意味
的関係判別装置、入力日本語文を上記日本語辞書検索装
置を用いて単語の列に分解した後に文節の列に合成する
文節合成装置、並びに該文節合成装置によって作成され
た文節の列の中に含まれる2個の文節間における文法的
関係の有無を上記文法的関係判別装置を用いて調べ文法
的関係ありとされた場合には当該2個の文節間における
意味的関係の有無を上記意味的関係判別装置を用゛いて
調べ意味的関係ありとされた場合には尚該2個の文節と
文節量関係とを出力する係り受は解析装置を備えること
を特徴とするものである。以下、本発明を図面を参照し
つつ説明する。
第1図は本発明の1実施例の概要を示す図、第2図は文
節合成装置の1実施例のブロック図、第3図は日本語辞
書検索装置を説明する図、第4図は自立語・付属語判別
装置を説明する図、第5図は係シ受は解析装置の1実施
例のブロック図、第6図および第7図は意味的関係判別
装置を説明する図、第8図は文法的関係判別装置を説明
する図、第1O図0)、←)、(ハ)、に)は処理の流
れを説明する図である。
本発明は1日本語の表現している意味は文節と文節の間
の関係で捉えることが出来る”という認識に基づいてお
り、そして文節の所持している特性を文法的、意味的に
抽出し、文節間の関係を文法面と意味面とに分離して検
査している。
第1図は本発明の1実施例の概要を示すものであって、
lは文節合成装置、2は係り受は解析装置、3は日本語
辞書検索装置、4は文法的関係判別装置、5は意味的関
係判別装置をそれぞれ示している。
日本語文は分かち書きの習慣はないので文節合成装置1
は、日本語辞書検索装置3などを参照して、入力日本語
文を文節の列に分割する。係り受は解析装置2は、日本
語辞書検索装置3、文法的関係判別装置4および意味的
関係判別装置5を参照して文節間の関係を調べ、文節間
関係表を出力する。
第2図は文節合成装置1の1実施例のブロック図であっ
て、6は単語単位への分割装置、7は文節への合成装置
、8は自立語・付属語判別装置をそれぞれ示している。
なお、第1図と同一符号は同一物を示している。日本語
辞書検索装置3は、第3図のような日本語辞書を有して
おり、この辞書は、単語および単語の関係情報が書込ま
れた複数のエン) IJを有している。自立語・付属語
判別装置8は、第4図に示すような自立語・付属語判別
辞書を有しており、この中には単語毎に自立語か、付属
語かの別が記載されている。いま「私は彼女に本を与え
た。」という日本語文が入力されたと仮定する。単語単
位への分割装置6は、日本語辞書検索装置3を用いて入
力文に対応する単語を検索しながら単語に分割する。こ
\まで処理が済めば、入力文は[私Uはす彼女w K 
LJ本口を与えUた口。」と分割されている。
単位単語に分割された単語列は文節への合成装置7へ入
力される。こ\では、それぞれの単語が自立語か付属語
かを自立語・付属語判別装置を用いて検査しながら文節
へと合成する・こ\まで処理が進むと、「私はり彼女に
1本を−与えた。」という文節の列に合成されている。
第5図は係り受は解析装置2の1実施例のブロック図で
ある。第5図において、9は文法的特徴抽出装置、10
は意味的特徴抽出装置、11は未解決文節記憶装置をそ
れぞれ示している。なお、第1図と同一符号は同一物を
示している。文法的関係判別装置4は、第8図に示すよ
う表辞書を有している。第8図の例は用言修飾型文節と
動詞文節との間には文法的関係(係り受けの関係)のあ
ることを示している。意味的関係判別装置5は。
第6図に示すようなマトリックス形式の意味的関係辞書
を有している。このマトリックスの横の並びを機能語と
概念語の部分に分割し、縦の部分を概念語ならびに概念
語・機械語対の部分に分割する。機能語とは付属語であ
ると考えて良゛<、自立語に付属して文節を構成し、そ
の文節の自立語の属性を決定するものである0機能語と
は、付属語の一部分で表わしながら、概念語の概念語間
の関係も細かく分類できるようにしたものである。第7
図は意味的関係辞書のマトリックスの行および列がどの
ように分割され使用されるか、また、マトリックス内の
部分が如何なることを表現しているかを示している。第
6図において、縦の並びの概念語中の「鳥」に対して機
能語との交点をみると、「生物・動作主」と「所有車」
の箇所が「1」となっている、これは「鳥」のもつ属性
として[生物・動作主」および「所有車」があることを
示している。一方、1時間」との交点は「0」となって
いるが、これは「鳥」のもつ属性K「時間」はないこと
を示している。「生物・動作主」の後に「(が)」と書
いであるが、これは助詞「が」がこの属性を代表してい
ることを示している。
次に縦の並び概念語と機能語の「鳥 ×生物・動作主」
に対して概念語の交点を見ると「食べる」に対しては「
1」となっている。これは「鳥」の生物・動作主なる属
性を通じて「食べる」と関係があることを示している。
他の1羽」、「鳥」に対して「0」となっているのは、
生物・動作主なる属性を通じては関係が存在しないこと
を示している0次の「鳥×所有主については所有なる概
念を通じて「羽」と関係があることを示している。
「鳥×所有主」と「鳥」との間がrdJとなっているの
は、関係が末だ定義されていないことを示している。な
お、第7図にあるように、「概念語」と「概念語」の部
分が使用されないとなっているのは、′″概念語と概念
語が直接関係することはない。なんらかの属性を通して
関係が存在する。″という考えに基づいているからであ
る。「概念語×機能語」と「機能語」の部分が使用しな
いとなっているのは、設定する意味がないからである。
「鳥がU食べる口、」という文節列を入力した場合には
、下記のような処理が行われて、意味的関係あり、意味
的関係なしか調べられる。いi、「鳥」K1000番、
「が」に対して10番と、11番、「食べる」に対して
2000番が4見られているものとなお、単語と番号の
対応は1日本語辞書を調べれば判るようになっている。
「鳥」に対応する横一列(1000番目の横一列)と「
が」に対応する縦の列(10番目と11番目の縦の列)
の交点を調べたところ、10番どの交点がrlJ、11
番との交点が「0」であったとすると1次の処理へ進む
0両方とも「0」のときは意味関係なしとされる1次に
、1000+10Xnの横一列(nは概念語の個数)の
横一列と、「食べる」に対応する縦の列(2000番目
)との交点を調べる。交点が「1」であれ#i1関係あ
り”、「0」であれば1関係なし”とされる。
−次に、係、り受は解析装置2の動作について説明する
。係シ受は解析装置2においては1文節が2つ送られて
来た時点から作動を始める。
先ず1文法的特徴抽出装置9Vcおいては、各々の文節
の文法的な特徴を日本語辞書検索装f13を文法的特性
から文節の文法的な特徴を決定する。
例えは、「私は」という文節において、「私」は代名詞
、「は」は話題提示型助詞である。したがって、「私は
」は1代名詞子話題提示盟助詞、即ち用言修飾文節とな
る。2つの文節□の文法的特徴が決定すると1文法的関
係判別装置4を用いて。
この2つの文節間に文法的な修飾関係が存在するか、否
かを調べる。そして1文法的修飾関係が存在した場合に
は、制御を意味的特徴抽出装置10に移し1文法的な修
飾関係が存在しなかった場合には、それら文節を未解決
文節記憶装fllF11へ送る。未解決文節記憶装置1
1においては、送られて来る文節をその順番に記憶して
いる。そして。
文節を要求された場合には、一番最近に送られて来た文
節から渡すようkなっている。意味的特徴抽出装置10
は1文節を構成する概念語(自立語)および機能語(付
属語)の番号を日本語辞書検索装置3を参照して求める
0次に、単語番号で表わされた2個の文節を意味的関係
判別装置5に渡し。
意味的関係有無の調査を依頼する。この依頼を受付ける
と、意味的関係判別装置3は第6図および第7図と関連
して説明したようにして意味的関係の有無を判別し、意
味的関係の有無を返送する。
意味的関係ありの場合は、意味的関係あシのみでなく、
その機能語・の単語番号をも返送する。意味的特徴抽出
装置10は、意味的関係あシが返送されて来た場合には
、この2つの文節間の関係が定まったとして1文節量関
係表を出力する。そして。
未解決文節記憶装置11に対して新しい文節を要求し、
これを新しい係シ文節とする。受は文節は今までと同じ
ものを使い、以前と同じように文法的関係および意味的
関係の有無が調べられる・これは未解決記憶装置11が
空になるまで繰り返される。一方、意味的な関係が存在
しなければ、2つの文節は未解決記憶!1tllK送ら
れる。上記の処理において1文節間に文法的、意味的関
係なしとして、未解決文節記憶装置11へ文節を送った
後は1文節合成装置i<対して新たな文節を要求する・
セして1文節合成装置1から送られて来た文節と未解決
文節記憶装置11から取出した文節との間で再び文法的
、意味的関係を調べる・第9図は日本語解析システムの
入出力例を示すものである。「私は彼女に本を与えた」
という日本語文を日本語解析システムSに入力すると1
図示のような文節間関係表Tが出力される。
第1O図口)ないしくニ)は本発明の日本語解析システ
ムにおける処理の流れを示すものである。第10図(イ
)に示すように、「私は」という係9文節と「彼女に」
という受け・文節が文法的特徴抽出装置9に入力される
と1文法的特徴抽出装置9は日本語辞書検索装置3を用
い、「私は」が用言修飾型文節。
「彼女に」は動詞修飾型文節であることを知る。
文法的特徴抽出装置9は、用言修飾型文節と動詞修飾型
文節との間における文法的関係有無の調査を文法的関係
判別装置4に依頼する0文法的関係なしと返送されてく
ると1文法的特徴抽出装置9は、これらの文節を未解決
文節記憶装置11に送り、新たな文節を要求する。
第10図(ロ)に示すように、「彼女k」という文節が
未解決文節記憶装置11から取出され、「本を」という
文節が文成合成装置1から送られて来る0文法的特徴抽
出装置9は1日本語辞書検索装置3を用いて「彼女に」
という文節と「本を」という文節の性格を調べる。「彼
女に」が動詞修飾型文節、1本を」が動詞修飾型文節で
あることが判ると1文法的特徴抽出装置9は1文法的判
別装置4を用いて両者間の文法的関係有無を調べる。
文法的関係なしとされた場合には、これらの文節を未解
決文節記憶装置11へ送り、新た表文節を要求する。
第1θ図(ハ)k示されるように、「本を」という文節
と「寿えた」という文節が送られて来ると。
文法的特徴抽出装置9は、先−に述べたようにして両者
間の文法的関係の有無が調べられる。文法的関係あ夛と
された場合には、データおよび制御は意味特徴抽出装置
10に渡される。意味的特徴抽出装置10は1日本語辞
書検索装置3を用い、意とする。たソし@5”の「を」
は対象物を示し。
@6#の「を」は経過する場所を示している。意味特徴
抽出装置10は、意味的関係判別装置5を用いて100
10番目の概念語と5番の機能語との間の意味的関係の
有無および10010番の概念語と6番の機能語との間
の意味的関係有無を調べる。
10010番の概念語と5番の機能語との間に意味的関
係布シとされると、意味特徴抽出装置lOは意味的関係
判別装置5を用いて「本を」と「与わとめ間の意味的関
係有無を調べる。これは先に述べたように、10010
+5Xn番の横の一列と30000番の縦の1列の交点
が「1」か、「0」かを調べれば判る。意味的関係あり
と判定された場合には。
図示のような文節間関係表が出力される0文節量関係表
の文節1.2の関係は「対象物」となっているが、これ
は機能語の番号15#番を人間が判り易い形に変換した
ものである。
第10図(ロ)に示すように、「彼女に」という節と「
与えた」とい゛う文節が入力されると1文法的特徴抽出
装置9はさきのようにして両文節間に文法的関係がある
か否かを調べる0文法的関係ありの場合には、意味的特
徴抽出装置10に制御およびデータが渡される。意味的
特徴抽出装置10は。
日本語辞書検索装量3および意味的関係判別装置5を用
い、「彼女に」という文節と「4えた」という文節の間
に意味的関係があるか、否かを調べる0両文節間には意
味的関係があるので1図示の如き文節間関係表が出力さ
れる。
以上の説明から明らかなように1本発明によれば1日本
語で表現している意味内容を機械的に文節間の関係によ
って表現するので、計算機による日本語の意味処理1例
えば機械翻訳や質疑応答システムの実現を可能とする。
【図面の簡単な説明】
第1図は本発明の1実施例の概要を示す図・第2図は文
節合成装置の1実施例のブロック図、第6図および第7
図は意味的関係判別装置を説明する図、第8図は文法的
関係判別装置を説明する図。 第9図は日本語解析システムの入出力例を示す図。 第10図(イ)、(ロ)、(ハ)、に)は処理の流れを
説明する図である。 1・・・文節合成装置、2・・・係シ受は解析装量。 3・・・日本語辞書検索装置、4・・・文法的関係判別
装置、5・・・意味的関係判別装置、6・・・単語単位
への分割装置、7・・・文節への合成装置、8・・・自
立語・付属語判別装置、9・・・文法的特徴抽出装置、
10・・・意味的特徴抽出装置、11・・・未解決文節
記憶装置。 特許出願人 富士通株式会社 代理人弁理士  京 谷 四 部

Claims (1)

    【特許請求の範囲】
  1. 日本語辞書検索装置、複数種類の文節間の文法的関係の
    有無を判別する文法的関係判別装置、複数種類の自立語
    と複数種類の付属語の意味関係の1幅無および自立語と
    付属語とよりなる複数種類のと自立語との間の意味的関
    係の有無を判別する意味的関係判別装置、入力日本語文
    を上記日本語辞書検索装置を用いて単語の列に分解した
    後に文節の列に合成する文節合成装置、並びに該文節合
    成装置によって作成された文節の列の中に含まれる2個
    の文節間における文法的関係の有無を上記文法的関係判
    別装置を用いて調べ文法的関係ありとされ穴場合には当
    該2個の文節間における意味的関係の有無を上記意味的
    関係判別装置を用いて調べ、意味的関係ありとされた場
    合には当該2個の文節と文節量関係とを出力する係り受
    は解析装置を備えることを特徴とする日本語解析システ
    ム。
JP56102634A 1981-06-30 1981-06-30 日本語解析システム Granted JPS584481A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56102634A JPS584481A (ja) 1981-06-30 1981-06-30 日本語解析システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56102634A JPS584481A (ja) 1981-06-30 1981-06-30 日本語解析システム

Publications (2)

Publication Number Publication Date
JPS584481A true JPS584481A (ja) 1983-01-11
JPH0157827B2 JPH0157827B2 (ja) 1989-12-07

Family

ID=14332662

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56102634A Granted JPS584481A (ja) 1981-06-30 1981-06-30 日本語解析システム

Country Status (1)

Country Link
JP (1) JPS584481A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6151270A (ja) * 1984-08-18 1986-03-13 Fujitsu Ltd 二語間関係抽出方式
JPS6144914U (ja) * 1984-08-27 1986-03-25 東芝首都圏サ−ビス株式会社 衛星放送受信アンテナ
JPS6165358A (ja) * 1984-09-06 1986-04-03 Ricoh Co Ltd 日本語解析装置
JPS61126533A (ja) * 1984-11-24 1986-06-14 Nippon Telegr & Teleph Corp <Ntt> 光フアイバ伝送路
JPS6386072A (ja) * 1986-09-30 1988-04-16 Nippon Telegr & Teleph Corp <Ntt> 日本文解析制御方式

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55102071A (en) * 1979-01-27 1980-08-04 Jisutoran Inst G Fuyuuru Fuoru Use of programmed digital computer for translation between natural languages

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55102071A (en) * 1979-01-27 1980-08-04 Jisutoran Inst G Fuyuuru Fuoru Use of programmed digital computer for translation between natural languages

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6151270A (ja) * 1984-08-18 1986-03-13 Fujitsu Ltd 二語間関係抽出方式
JPS6144914U (ja) * 1984-08-27 1986-03-25 東芝首都圏サ−ビス株式会社 衛星放送受信アンテナ
JPS6165358A (ja) * 1984-09-06 1986-04-03 Ricoh Co Ltd 日本語解析装置
JPS61126533A (ja) * 1984-11-24 1986-06-14 Nippon Telegr & Teleph Corp <Ntt> 光フアイバ伝送路
JPS6386072A (ja) * 1986-09-30 1988-04-16 Nippon Telegr & Teleph Corp <Ntt> 日本文解析制御方式

Also Published As

Publication number Publication date
JPH0157827B2 (ja) 1989-12-07

Similar Documents

Publication Publication Date Title
Kondrak Algorithms for language reconstruction
JP2764343B2 (ja) 節/句境界抽出方式
Niyogi The computational nature of language learning and evolution
US20200243076A1 (en) Multi-Dimensional Parsing Method and System for Natural Language Processing
Ferreira et al. Good-enough representations in language comprehension
McCauley et al. Language emergence in development: A computational perspective
EP0972254A1 (en) Didactic and content oriented word processing method with incrementally changed belief system
Mihalcea et al. Open mind word expert: Creating large annotated data collections with web users’ help
Sharp et al. Cognitive approach to natural language processing
Odijk et al. MWE-Finder: Querying for multiword expressions in large Dutch text corpora
JPS584481A (ja) 日本語解析システム
Abu Bakar et al. NUWT: Jawi-specific buckwalter corpus for Malay word tokenization
Massaro A stage model of reading and listening
Lee et al. The Roles of Syllables in Korean Lexical Processing and Korean Orthographic-Phonological Syllable Access Model (K-OPSAM)
KR950013128B1 (ko) 기계번역장치 및 방법
Adorni et al. Natural language input for scene generation
Alhama et al. Retrodiction as delayed recurrence: the case of adjectives in italian and english
Klinger Natural language, linguistic processing, and speech understanding: recent research and future goals
JPH08147307A (ja) 意味知識獲得装置
Hong et al. Anaphora resolution in text animation
JP2765618B2 (ja) 言語解析装置
Narayan et al. Pre-Neural Approaches
Korzeniowski et al. Data-driven Polish poetry generator
Tariq Neologism Formation in Pakistani TV Comedy Talk Show Khabarnaak.
Albertovna Abdrakhmanova et al. Diversity of Metaphoric Terms in the Sphere of English IT Communication