JPH03259376A - 日本語長文分割支援装置 - Google Patents

日本語長文分割支援装置

Info

Publication number
JPH03259376A
JPH03259376A JP2056703A JP5670390A JPH03259376A JP H03259376 A JPH03259376 A JP H03259376A JP 2056703 A JP2056703 A JP 2056703A JP 5670390 A JP5670390 A JP 5670390A JP H03259376 A JPH03259376 A JP H03259376A
Authority
JP
Japan
Prior art keywords
sentence
clause
expression
connection
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2056703A
Other languages
English (en)
Inventor
Eiji Takeishi
武石 英二
Yoshihiko Hayashi
良彦 林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2056703A priority Critical patent/JPH03259376A/ja
Publication of JPH03259376A publication Critical patent/JPH03259376A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野1 この発明は、日本語文書処理装置に係り、特に入力され
た日本語文書中の長文の分割を支援する日本語長文分割
支援装置に関するものである。
[従来の技術1 従来の日本語長文分割に関する技術は、文字列マツチ、
文字列置き換えによって分割する技術(例えば信国;自
然言語における長文分割方式、情報処理学会第39回置
国大会1989)、または処理対象文に対して構文解説
した結果を用いて分割点を決定し分割する技術(例えば
銘木、高山、太細;標準文書処理システム−(1)構成
と特徴、情報処理学会第36回全国大会1988)が中
心であった。前者については、分割されやすい字面とそ
の置き換え部分字面をあらかじめ登録しておき、字面マ
ツチしたらマツチした字面までの前半部分で分割し、分
割された各文に対して形態素解折の処理を行い、時制、
活用形の調整を行うものである。後者については、入力
文に対して形態素解析、構文解析を行い、文のもっとも
大きな切れ目の接続助詞、連用中止で分割し、あらかじ
め登録済の接続表現を挿入するものである。
〔発明が解決しようとする課題〕
上記の従来技術において、前者については、登録した字
面以外を処理することができないため、同一の接続形式
に対して(例えば「ので」に対して、「たので」、「る
ので」、「ますので」など)相当数の字面を登録する必
要がある、複数の接続形式を含む文に対する考慮がなさ
れていないという問題がある。また、後者に対しては、
分割の対象となるような複雑な構造を持った文に対して
構文解析処理を行うと、解析多義が数多く生じるため、
処理の負担が大きい、現状の構文解析技術では正しい解
析結果を高い精度で得ることが困難であるという問題が
ある。
この発明の目的は、入力文全体の構文解析を行わずに、
複数の接続形式を含む文の分割点を特定し、分割文候補
を出力する日本語長文分割支援装置を提供することにあ
る [課題を解決するための手段1 この発明の日本語長文分割支援装置は、連用中止表現の
表現形式パターンをあらかじめ登録しである連用中止表
現パターン辞書、文間を接続するために用いられる助詞
、形式名詞などの接続表現をあらかじめ登録しである接
続表現辞書、入力文を構成する文節と前記連用中止表現
パターン辞書、接続表現辞書との照合を行い、接続形式
データを生成する接続形式抽出部、連用中止表現パター
ンごとの接続条件をあらかじめ登録しである連用中止ル
ールテーブル、連用中止表現の用法の限定を行う連用中
止用法限定ルールテーブル、前記接続形式データと前記
接続表現辞書、連用中止ルールテーブルとの照合を行い
、接続構造を解析して全ての可能な接続構造データを作
成する接続構造解析部、各接続構造データから分割点を
抽出し、文節生成部を用いて分割文の文末文節を取得し
、接続表現辞書、連用中止用法限定ルールテーブルを用
いて分割文データを生成する分割文生成部を備えたもの
である。
〔作用〕
この発明においては、入力された日本文を形態素解析し
た結果を入力し、各文節と連用中止表現パターン辞書、
接続表現辞書との照合を行うことによって接続形式を抽
出し、接続形式データリストを生成する。接続表現辞書
、連用中止ルールテーブルとの照合を行うことによって
、この接続形式データリスト中の任意の2つの接続形式
の間の係り受け関係の成否を判定し、入力文中の単文間
の接続構造を解析し、接続構造データを生成する。この
とき接続構造が一意に決定できない場合は、複数個の接
続構造データからなる接続構造データリストを生成する
。次いで、各接続構造データから後述する分割点を抽出
し、分割点と前記接続表現辞書、前記連用中止表現パタ
ーン辞書、文節生成部を用いて分割文データ構造を生成
する。
この発明によれば、3単文以上からなる復交に対しても
、後文全体の完全な構文解析を行わずに、適切な分割候
補文を生成することができる。
〔実施例1 以下、この発明の一実施例について図面により説明する
第1図はこの発明の日本語長文分割支援装置10の一実
施例のブロック図を示す。前記日本語長文分割支援装置
10は、入力部1、接続表現抽出部2、接続構造解析部
3、分割文生成部4、連用中止表現パターン辞書5、接
続表現辞書6、連用中止ルールテーブル7、連用中止用
法限定ルールテーブル8より構成される。連用中止表現
パターン辞書5は、文間の接続に用いられる連用中止表
現を連用形となっている単語別にあらかじめ登録しであ
る辞書であり、接続表現辞書6は、文間の接続に用いら
れる助詞、形式名詞などをあらかじめ登録しである辞書
であり、連用中止ルールテーブル7は、連用中止表現パ
ターン別の接続ルールをあらかじめ登録しであるテーブ
ルである。また、20は文節生成部で、公知のものを用
いつる。
ただし、以下の説明で係り受けの非交叉とは、係り受け
の関係において交叉がないこと(例えば第2図(a)の
ような係り受け関係)を意味する。第2図(b)は交叉
のある係り受け関係(b→dとc−10)を示している
。また、分割点とは文のもっとも大きな切れ目、すなわ
ち後述する接続形式間の係り受け関係において文末文節
に係る接続形式のうちのもっとも文頭に近い接続形式の
ことである。第2図(C)に分割点を説明する図を示す
。第2図(C)で表される係り受け関係を木構造で表す
と第2図(d)のようになり、分割点が°゛a”である
ことを示している。
入力部1からは、日本語長文分割支援装置10の処理対
象の日本語文に対して形態素解析の処理済の日本語文が
入力されるものとする。形態素解析は漢字と仮名でべた
書きされた日本語文に対して、単語単位への分割を行う
処理であり、この処理の過程で同時に文節も認定される
。例として、「これからFAXでこの説明書を送ります
。」について、単語分割および文節認定を示すと第3図
(a)のようになり、形態素解析の結果として得る文節
および文節を構成する単語に関する情報を、文節「送り
ます。」を例として示すと第3図(b)のようになる。
通常、日本語文書処理システムには、形態素解析の処理
機能が具備されており、その形態素解析結果が入力部1
から入力される。
接続表現抽出部2では、入力文を構成する各文節と連用
中止表現パターン辞書5、接続表現辞書6との照合を行
い、接続表現、連用中止表現を含む文節を抽出するとと
もに、各文節の品詞および活用形から埋込文の述語文節
を抽出する。抽出された文節を接続形式という。各接続
形式中の辞書情報および接続表現辞書6、連用中止表現
パターン辞書5中の情報を用いて各接続形式に対する接
続形式データを作成し、それらをまとめて接続形式デー
タリストを作成する。
接続構造解析部3では、前記接続形式データリストを構
成する各接続形式間の係り受け関係の成否を接続文節デ
ータの内部情報および連用中止ルールテーブル7との照
合によって接続構造を決定する。接続構造が一意に決定
しない場合は、非交叉条件を満たす接続構造(以下、こ
れらを接続構造の多義という)を全て求める。
分割文生成部4では、各接続構造から(接続構造に多義
がある場合は各接続構造から)分割点文節を抽出し、分
割点文節および文末文節の時制情報、常態敬体情報を文
節生成部20へ転送し、分割文の文末文節を取得する。
この取得した分割文の文末文節を分割点文節と置き換え
、接続表現辞書6または連用中止用法限定ルールテーブ
ル8から得られる接続表現を挿入することによって各分
割点に対する分割文を作成し出力する。文節生成処理は
、自立語および様相・時制情報からそれらの語順、語形
を決定し文節を生成する処理である。例えば、(自立語
=送る。様相・時制=完了・可能・丁寧)なる情報から
は、“送れました”という文節が生成される。このよう
な文節生成処理は既存の技術が利用可能であるため、方
法は問わない。
以下、2つの具体例について説明する。
第1の例では欧文を処理対象の日本文とする。
本例は、具体的な処理の流れの説明を目的とする。
■ 「プリンタを含めると、かなりのスペースを必要と
したので、十分な広さを確保しました。」 入力部1は、対象文について、形態素解析の行われた内
容を入力し、接続表現抽出部2へ転送する。
第4図<a)は、当該対象文に対する形態素解析の結果
の概要を 第4図(b)〜(d)に形態素解析に結果と
して得られる文節「含めると」、「しますので」、「確
保して下さい」に対する情報の概要を示す。
接続表現抽出部2では、入力文を構成する文節ごとに連
用中止表現パターン辞書5、接続表現辞書6の自立語条
件、付属語条件と照合し、接続形式か否かを判定し、接
続形式と判定された文節および文末文節の自立語情報、
付属語情報を抽出して接続形式データを作成し、入力文
に対する接続形式データリストを作成する。
第5図に連用中止表現パターイ辞書5の概念図を、第6
図に接続表現辞書6の概念図を示す。ただし、第5図、
第6図における「埋込文」とは各接続形式が埋込文の従
属節になり得るか否かを示す値で、−1は埋込文の従属
節になり得ないことを示し、Oは接続形式だけでは判定
できないことを示している。
第6図において接続形式「ので」の「埋込文」は−1で
あるが、これは例えば「遅刻したので叱られた回数は少
ない。」という文例において「遅刻した」は「回数が少
ない」の原因となっていると解釈でき、埋込文「叱られ
た」の原因と解釈しない。すなわち、「遅刻した」は埋
込文「叱られた」の従属節になり得ないことを示してい
る。本対象文では、文節「含める/と/」および文節「
する/ので/」が、それぞれ接続表現辞書6の形式「と
」、「ので」の自立語条件、付属語条件とマツチするの
で、接続形式データリストは第1O図(a)のようにな
る。
接続構造解析部3では、前記接続形式データリスト中の
接続形式間に係り受け関係の成否(接続構造)を判定し
、接続構造データを作成する。第7図に係り受け成否の
判定処理の概要を、第8図(a)〜(C)に連用中止ル
ールテーブル7の概念図を示す。
第7図でSl、S2は、例えば第4図(a)における「
と」、「ので」に相当し、aは接続表現辞書6または運
用中止テーブル7上の値を示す。
例えば、第10図(a)に示した当該対象文の接続形式
データリスト中の文節「含めると」と文節「したので」
の係り受け関係では、ともに埋込文、連用中止でなく、
「と」が接続表現■類、「ので」が接続表現m類である
から、分類同士を比較し、(「と」の分類)<(「ので
」の分類)なので判定として1を得る。
次に、接続構造の判定の結果を用いて、非交叉条件を満
たす全ての接続構造を求め、接続構造データとして出力
し、分割文生成部4へ転送する。
第10図(b)に当該対象文に対する接続構造の判定の
結果の概要を、第10図(C)に当該対象文に対する接
続構造データリストの概要を示す。
ただし、第10図(b)において行が係り元接続形式を
、列が係り光接続形式を表しており、1゜−1,0の値
でそれぞれ係り受け成立、係り受け不成立2判定不能を
表す。また、本対象文では接続構造は一意に決定し、第
10図(C)において(A、B)の形式は接続形式A、
Bの間に係り受け関係が成立することを示している。す
なわち、当該対象文が「と」が「ので」に、「ので」が
「文末」に係る構造をもつことを示している。
分割文生成部4では、接続構造データの各接続構造の分
割点文節を抽出し、この分割点文節と文末文節の時制情
報、常体敬体情報を文節生成部20に転送して分割文文
末文節を得る。
次に、分割点文節の接続形式が連用中止以外の場合は、
接続表現辞書6中の分割パターン情報に基づき挿入接続
表現を決定し、分割点文節の接続形式が連用中止の場合
は、分割点文節の連用中止分類1文末文節を連用中止用
法限定ルールテーブル8と照合し、挿入接続表現候補を
決定する。最後に分割点文節を分割文文末文節で置き換
え、分割した2文を出力する。当該対象文では第10図
(c)の接続構造解析結果を本構造に示すと第1○図(
d)の如くなので、分割子候補として文節「ので」が抽
出され、この文節と文末文節「確保しました。」の時制
情報「完了」と常体敬体情報「敬体」を文節生成部20
に転送することによって、分割文の文末文節「必要とし
ました。」を得る。次に接続表現辞書6中の「ので」の
分割パターン情報から順序入れ替えがないことおよび挿
入接続表現「従って」を得ることができる。当該対象文
に対する出力を第10図(e)に示す。
第2の例では、次女を処理対象文として説明する。本例
は、連用中止を含む文、埋込文を含む文および接続構造
に多義が生じる文の処理の説明を目的とする。
■「本装置は前装置をベースにし、図形なども扱えるよ
うに機能を充実させており、図形1画像データとして得
られたデータも文字データと同様の扱いができます。」 第11図(a)に当該対象文に対する形態素解析結果の
概要を、第11図(b)〜(f)に文節「シ」、文節「
扱えるように」、文節「充実させており」、文節「得ら
れた」、文節「できます。」に対して得られる情報の概
要を、第12図(a)に接続表現抽出処理の結果得られ
る接続形式データリストの概要を示す。
次に、接続構造解析部3において、第8図に示した連用
中止ルールデープル7を用いて接続形式データリスト中
の接続形式間の係り受け関係の成否を判定する。例えば
、当該対象文の文節「シ」と「扱えるように」の係り受
け関係では「シ」が連用中止表現、「ように」が接続表
現■類であるから、連用中止ルールテーブル7の第8図
(c)の運用中止×接続表現を参照し、その値が0であ
ることから判定不能であることを得る。文節「扱えるよ
うにJと文節「充実させており」の係り受け関係では「
ように」が接続表現■類、「ており」が連用中止■類で
あるから、連用中止ルールテーブル7の第8図(b)接
続表現×連用中止を参照し、その値が1であることから
係り受けを成立する。また、文節「ており」と文節「得
られた」の係り受けでは、「得られた」が埋込文になっ
ているので、「ており」の埋込文情報を参照し、その値
が−1であることから係り受け不成立を得る。第12図
(b)に当該対象文に対する接続構造の判定の結果の概
要を、第12図(c)に当該対象文に対して得られる接
続構造データリストの概要を示す。第12図(C)に示
したとおり、当該対象文では接続形式「シ」の係り先が
一意に決定せず、「扱えるように」と「充実させており
」の2通りが考えられ、ともに非交叉条件を満たすため
2通りの接続構造が得られる。
当該対象文では、第12図(c)の接続構造解析結果を
木構造に表すと第12図(d)の如くなので、得られる
分割点文節はいずれも「充実させており」であり、この
文節と文末文節「できます。」の時制情報「非完了」と
敬体常体情報「敬体」を文節生成部4に転送することに
よって、分割文の文末文節「充実させています。」を得
る。
次に、分割点文節が連用中止■類、文末文節が「できま
す」 (分割点文節と非円−述語かつ動詞)であるから
、連用中止表現用法限定ルールテーブル8を参照し、分
割パターン情報から挿入接続表現候補「従って、(そし
て、)」を得る。第9図に連用中止用法限定ルールテー
ブル8の概念図を、第12図(e)に当該対象文に対す
る出力を示す。
なお、第9図中の同一述語とは、述語文節を自立語5分
類(状態動詞、その他の動詞、形容詞、形容動詞、名詞
)、付属2分類(補助用言、その他)で分類し、自立語
分類、補助用言が一致して連用中止文節のもつ様相表現
を係り先述語文節が持つとき同一述語といい、それ以外
を非円−述語という。
〔発明の効果〕
以上説明したように、このは発明は、連用中止表現の表
現形式パターンをあらかじめ登録した連用中止表現パタ
ーン辞書と、文間の接続に用いられる表現をあらかじめ
登録した接続表現辞書と、連用中止表現の接続構造ルー
ルをあらかじめ登録した連用中止ルールテーブルと、連
用中止表現の用法限定ルールをあらかじめ登録した連用
中止用法限定ルールテーブルと、入力された日本文中の
文節と連用中止表現パターン辞書および接続表現辞書を
照合し、入力された日本文中の接続形式を抽出する接続
表現抽出部と、接続表現辞書と連用中止ルールテーブル
から入力された日本文中の接続形式間の係り受け関係を
解析する接続構造解析部と、この接続構造解析部の出力
結果から分割点文節を抽出し、分割文候補を生成する分
割文生成部とを備えたので、以下のような効果がある。
■ 接続形式の字面だけでなく、辞書情報および接続形
式の性質に基づいて分割点を決定するので、正確な分割
文候補を得ることができる。
■ 複数の接続形式によって3単文以上が接続する文に
対しても、文全体の構文解析を行わずに分割点候補を特
定し、分割文候補を出力することが可能であるため、長
文の分割作業を効率的に行うことができる。
■ また、連用中止表現を含む文に対しては、その用法
候補を出力することが可能であるため、曖昧な連用中止
表現の推敲装置としても利用することが可能である。
■ さらに、本装置を従来の構文解析技術と組み合わせ
ることによって、制度の高い構文解析装置を実現するこ
とができる。
【図面の簡単な説明】
第1図はこの発明の日本語長文分割支援装置の一実施例
を示すブロック図、第2図は係り受けの非交叉および分
割点を説明する図、第3図は形態素解析を説明する図、
第4図は処理対象文例■の形態素解析結果の概要を示す
図、第5図は連用中止表現パターン辞書の概念図、第6
図は接続表現辞書の概念図、第7図は接続構造解析部の
処理の流れ図、第8図は連用中止ルールテーブルの概念
図、第9図は連用中止用法限定ルールテーブルの概念図
、第10図は処理対象文例■に対する接続表現抽出部、
接続構造解析部2分割文生成部の処理結果の概要を示す
図、第■1図は処理対象文例■に対する形態素解析結果
の概要を示す図、第12図は処理対象文例■の接続表現
抽出部、接続構造解析部1分割文生成部の処理結果の概
要を示す図である。 図中、1は入力部、2は接続表現抽出部、3は接続構造
解析部、4は分割文生成部、5は連用中止表現パターン
辞書、6は接続表現辞書、7は連用中止ルールテーブル
、8は運用中止用法限定ルールテーブル、10は日本語
長文分割支援装置、20は文節生成部である。 (e) a 分割点 第2図 第3図 (a) これ/から/F A X/で//説明沓/を//送り/
ます/、//(注:/は単語境界を、//は文節境界を
示している。)(b) (注 −は情報なしを、 ×は不成立を示している。) 第 図 0主 ”なし”は、存在しないことが成立条件であることを示
している。)働 (τ1 は条イ午なしを不し1いる。) 図 働 図 (a)連用中止1×連用中止2 (b)接続表現×連用中止 (C)連用中止×接続表現 している。 第11図 (a) 本/装置/は//前/装置/を//ベース/に//シ/
、//図形/など/も//扱える/ように//機能/を
//充実さ/せ/ており/、//図形/、//画像/デ
ータ/として//得ら/れ/た//データ/も////
文字/データ/と//同様の//扱い/が//でき/ま
す/、//第 12 図

Claims (1)

    【特許請求の範囲】
  1. 日本文を入力して処理する文書処理システムにおいて、
    連用中止表現の表現形式パターンをあらかじめ登録した
    連用中止表現パターン辞書と、文間の接続に用いられる
    表現をあらかじめ登録した接続表現辞書と、連用中止表
    現の接続構造ルールをあらかじめ登録した連用中止ルー
    ルテーブルと、連用中止表現の用法限定ルールをあらか
    じめ登録した連用中止用法限定ルールテーブルと、前記
    入力された日本文中の文節と前記連用中止表現パターン
    辞書および前記接続表現辞書を照合し、前記入力された
    日本文中の接続形式を抽出する接続表現抽出部と、前記
    接続表現辞書と前記連用中止ルールテーブルから前記入
    力された日本文中の接続形式間の係り受け関係を解析す
    る接続構造解析部と、この接続構造解析部の出力結果か
    ら分割点文節を抽出し、分割文候補を生成する分割文生
    成部と、を備えていることを特徴とする日本語長文分割
    支援装置。
JP2056703A 1990-03-09 1990-03-09 日本語長文分割支援装置 Pending JPH03259376A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2056703A JPH03259376A (ja) 1990-03-09 1990-03-09 日本語長文分割支援装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2056703A JPH03259376A (ja) 1990-03-09 1990-03-09 日本語長文分割支援装置

Publications (1)

Publication Number Publication Date
JPH03259376A true JPH03259376A (ja) 1991-11-19

Family

ID=13034831

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2056703A Pending JPH03259376A (ja) 1990-03-09 1990-03-09 日本語長文分割支援装置

Country Status (1)

Country Link
JP (1) JPH03259376A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04281557A (ja) * 1991-03-11 1992-10-07 Agency Of Ind Science & Technol 文分割方式
JPH05216923A (ja) * 1992-02-06 1993-08-27 Agency Of Ind Science & Technol 文入れ換え機能を付加した文分割方法
JP2009015398A (ja) * 2007-06-29 2009-01-22 Fujitsu Ltd 文章分割プログラム、文章分割装置および文章分割方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04281557A (ja) * 1991-03-11 1992-10-07 Agency Of Ind Science & Technol 文分割方式
JPH05216923A (ja) * 1992-02-06 1993-08-27 Agency Of Ind Science & Technol 文入れ換え機能を付加した文分割方法
JP2009015398A (ja) * 2007-06-29 2009-01-22 Fujitsu Ltd 文章分割プログラム、文章分割装置および文章分割方法

Similar Documents

Publication Publication Date Title
Trujillo Translation engines: techniques for machine translation
US5587902A (en) Translating system for processing text with markup signs
JPS63223962A (ja) 翻訳装置
JPH02308370A (ja) 機械翻訳システム
US20220019737A1 (en) Language correction system, method therefor, and language correction model learning method of system
US5608623A (en) Special cooccurrence processing method and apparatus
Scholivet et al. Identification of ambiguous multiword expressions using sequence models and lexical resources
JPWO2008146583A1 (ja) 辞書登録システム、辞書登録方法および辞書登録プログラム
Abu Bakar et al. NUWT: Jawi-specific buckwalter corpus for Malay word tokenization
US20240160839A1 (en) Language correction system, method therefor, and language correction model learning method of system
JPH03259376A (ja) 日本語長文分割支援装置
KR100434526B1 (ko) 문맥정보및지역적문서형태를이용한문장추출방법
El-Taher et al. An Arabic CCG approach for determining constituent types from Arabic Treebank
Carter Lattice-based word identification in CLARE
Maruyama et al. A Japanese sentence analyzer
JP2003271590A (ja) 翻訳方法、翻訳装置および翻訳プログラム
Mitkov How far are we from (semi-) automatic annotation of anaphoric links in corpora?
Farokhshad et al. ViraPart: A Text Refinement Framework for Automatic Speech Recognition and Natural Language Processing Tasks in Persian
Sudana et al. E-Translator Kawi to Bahasa
Dien et al. Btl: a hybrid model for english-vietnamese machine translation
JPH04230572A (ja) 日本語文分割装置
Rodrigues et al. Arabic data science toolkit: An api for arabic language feature extraction
JPH05250403A (ja) 日本文単語解析方式
Bibak ViraPart: A Text Refinement Framework for ASR and NLP Tasks in Persian
Farokhshad et al. ViraPart: A Text Refinement Framework for ASR and NLP Tasks in Persian.