JPH05314169A

JPH05314169A - 並列データ処理装置および並列形態素抽出方法

Info

Publication number: JPH05314169A
Application number: JP4115717A
Authority: JP
Inventors: Tetsuaki Isonishi; 徹明磯西; Atsuo Ozaki; 敦夫尾崎
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1992-03-11
Filing date: 1992-05-08
Publication date: 1993-11-26

Abstract

(57)【要約】（修正有）【目的】形態素を抽出する処理を高速に実行する。【構成】ローカルメモリを有し、２次元アドレスによ
って対応付けできる要素プロセッサＰＥを多数接続した
並列データ処理装置において、マルチポートメモリをア
クセスするためのポートを要素プロセッサに１つずつ設
け、マルチポートメモリのポート数に等しい要素プロセ
ッサのポートとマルチポートメモリとを接続した。これ
により、全要素プロセッサで共通に使用するデータをマ
ルチポートメモリに格納し、マルチポートメモリのポー
ト数だけ各要素プロセッサが同時にアクセスできるよう
にした。また、ｍ文字からなる１つの日本語の入力文の
部分文字列（ｍ（ｍ＋１）／２通り）を各ＰＥが持つＰ
Ｅアドレス（ｉ，ｊ）を用いて並列に発生させ、この部
分文字列をキーワードとして全てのＰＥ又はマルチポー
トメモリに同一に格納されている単語辞書を並列に１回
の操作で検索できるようにした。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、２次元アドレスによ
り対応づけできる要素プロセッサ（ＰＥ）を多数接続し
た並列データ処理装置、およびこのような並列データ処
理装置において日本語のようにべた書きされる自然言語
を機械的に認識するために入力文の形態素抽出を並列に
行う並列形態素抽出方法に関するものである。

【０００２】

【従来の技術】近年、自然言語の機械処理は、機械翻訳
システム，ワードプロセッサの「かな漢字変換」，テキ
ストのデータベース化のための自動キーワード付けな
ど、様々な分野で実用化が進められており、これらの処
理システムでは、ユーザの入力に対する実時間の応答が
可能な高速化が特に望まれている。さらに、この自然言
語の機械処理の中で、単語辞書を検索することによって
入力文の中に存在する可能性のある全単語（これを形態
素という）を抽出する処理、いわゆる形態素抽出処理
は、全体の処理時間に対して本処理に必要な処理時間の
比率が大きいことから、最も高速化が望まれる処理の一
つである。従来の形態素抽出処理としては、「文書解析
アクセラレータ(1) −形態素抽出マシンの試作−」（福
島俊一・他、情報学会自然言語処理研究会７５−９，
１９９０年）に、次の（ａ）〜（ｄ）の４種類の方法が
示されている。（ａ）．従来の逐次型計算機により、入力文のある位置
から部分文字列を切り出して、その部分文字列に一致す
る単語を辞書から逐一読み出して照合を繰り返す逐次法
（一対一の照合）。（ｂ）．本文献により新たに提案されている入力文を構
成する全文字の同時照合、シフトレジスタによる入力文
の順送りなどを組合わせた福島らのハードウェアアルゴ
リズムによる方法。（ｃ）．共有メモリ方式の並列計算機において、入力文
から複数の部分文字列を切り出して各プロセッサに割り
当て、共有メモリに格納されている単語辞書とその部分
文字列とをプロセッサの数だけ並列に照合する方法（多
対一の照合）。（ｄ）．連想メモリなどを使用し、入力文のある位置か
ら切り出した一つの部分文字列と複数のメモリセルに分
散して格納されている単語辞書内の単語とを同時に照合
する方法（一対多の照合）。

【０００３】上記（ａ）の従来技術である（一対一の照
合）による方法（逐次法）は、汎用の計算機を使用する
ことにより、一般的に容易に実現可能であるが、部分文
字列毎に単語辞書を逐次的に検索する必要があり、高速
化のためには、一回の照合に要する単位時間を短くする
以外に方法はなく、飛躍的な高速化は望めないという問
題がある。上記（ｂ）の方法は、並列処理を多少採り入
れてはいるものの、形態素抽出用の専用ハードウェアを
新たに開発することにより高速化を図るもので、基本的
には本ハードウェアを形態素抽出以外には使用すること
ができず、汎用性に欠けるという問題がある。そこで考
えられたのが、並列計算機を利用した並列処理方式によ
り準汎用的に形態素抽出処理を高速化する上記（ｃ）お
よび（ｄ）の従来技術である。然しながら上記（ｃ）の
方法は、共有メモリ方式の並列計算機を使用しているた
め、共有メモリに格納されている単語辞書の検索のみな
らず、複数の要素プロセッサが同時に共有メモリをアク
セスする場合に、共有メモリが隘路となり、要素プロセ
ッサの数を十数台以上増やしても並列処理の効果が得ら
れず、飛躍的な高速化が望めないというのが一般的であ
る。上記（ｄ）の従来技術である多対一の照合による方
法では、連想メモリを使用しなくてもローカルメモリを
有し、２次元アドレスにより対応づけできる要素プロセ
ッサ（ＰＥ）を多数接続した並列データ処理装置でも実
現可能であり、その構成と形態素抽出方法を以下に示
す。

【０００４】図１０は、例えば、ローカルメモリを有す
る同一構成の要素プロセッサ（ＰＥ）を物理的に２次元
格子状に多数接続した並列データ処理装置において、上
記（ｄ）の方法を説明するための図である。図１０にお
いて、１は要素プロセッサ（以下、ＰＥとも言う）、２
は要素プロセッサを２次元格子状に接続した要素プロセ
ッサアレイ、３は要素プロセッサアレイ２を制御する制
御プロセッサ、４は一つの単語辞書を均等に分散させて
全ての要素プロセッサのローカルメモリに格納した単語
辞書、５は入力文、６は入力文に対応する１つの部分文
字列、７は入力文の全部分文字列、８は辞書中に存在し
たキーワード、９は１つの部分文字列をキーワードとし
て単語辞書を検索した辞書情報である。

【０００５】次に図１０を基に、入力文が与えられた時
に、単語辞書を検索することによって入力文５の中に存
在する可能性のある全単語（形態素）を抽出する、従来
の方法について説明する。（ａ）．制御プロセッサ３でｍ文字（本例では、６文
字）からなる入力文５が与えられると、６で示すような
入力文の部分文字列を生成する。この部分文字列６は入
力文がｍ文字なので全部で、すなわち全部分文字列７と
してｍ（ｍ＋１）／２通り存在する。（ｂ）．次に、ｍ（ｍ＋１）／２通りある部分文字列７
を制御プロセッサ３から要素プロセッサアレイ２の各Ｐ
Ｅ１に順番に部分文字列６（本例では「研究所」）をブ
ロードキャストする。（ｃ）．次に、全てのＰＥ１にブロードキャストされた
部分文字列「研究所」６を基に、ＰＥ１内のローカルメ
モリに分散して格納されている単語辞書４の中からキー
ワード「研究所」８を検索する。この検索時に行う部分
文字列「研究所」６と単語辞書のキーワード「研究所」
８との照合は、ＰＥの数だけ並列に行うことができる。（ｄ）．単語辞書４の中から部分文字列６に対応するキ
ーワード８が存在すれば、そのキーワード８とそれに対
応する辞書情報９とを、キーワード８が見つかったＰＥ
１から制御プロセッサ３に転送する。（ｅ）．上記（ｂ），（ｃ），（ｄ）の処理を、ｍ（ｍ
＋１）／２通りくり返すことにより、全部分文字列７の
検索をし終える。

【０００６】

【発明が解決しようとする課題】上記のような従来の並
列形態素抽出方法では以上のように処理が行われてお
り、部分文字列と単語辞書のキーワードとの照合は、Ｐ
Ｅの数だけ並列に行うことができるが、全部分文字列を
照合するためには、部分文字列の照合をｍ（ｍ＋１）／
２回行う必要があり、入力文の文字数ｍが多くなればな
るほど形態素抽出処理に時間がかかる。したがってヒュ
ーリスティック（ｈｅｕｒｉｓｔｉｃｓ）を用いて繰り
返し数を削減し、実用的な時間内で処理を終了するよう
にしているが、このため正確な形態素抽出ができず、自
然言語を認識するための機械処理全体での認識精度が悪
くなるという問題点があった。

【０００７】この発明は、かかる問題点を解決するため
になされたものであり、入力文に対してｍ（ｍ＋１）／
２通りある部分文字列と単語辞書のキーワードとの照合
を、ｍ（ｍ＋１）／２回繰り返すことなく、１回の操作
で行える並列データ処理装置および並列形態素抽出方法
を提供することを目的としている。

【０００８】

【課題を解決するための手段】本願第１の発明に係わる
並列形態素抽出方法は、キーワードにより検索すること
ができる単語辞書を全てのＰＥのローカルメモリに同一
に格納し、ローカルメモリ内の形態素抽出結果を格納す
るバッファ領域をクリアにする段階（ａ）、それぞれｍ
_a ，ｍ_b 文字からなる２つの日本語の入力文ａ，ｂが与
えられた場合に、入力文ａをＰＥ（ｉ，ｊ）（ｉ，ｊ｜
ｉ＞ｊ）のローカルメモリに、入力文ｂをＰＥ（ｉ，
ｊ）（ｉ，ｊ｜ｉ＜ｊ）のローカルメモリにブロードキ
ャストする段階（ｂ）、入力文ａ，ｂが格納されている
ＰＥをＰＥ（ｉ，ｊ）とすると、各ＰＥが所有するＰＥ
アドレス（ｉ，ｊ）を用いて、入力文ａのｊ＋１番目の
文字ａ_j+1 からｉ番目の文字ａ_i までの文字列をＰＥ
（ｉ，ｊ）（ｉ，ｊ｜ｉ＞ｊ）の全てのＰＥで並列に抽
出し、これを単語辞書を検索する部分文字列ａ_j+1,i と
し、また、入力文ｂのｉ＋１番目の文字ｂ_i+1 からｊ番
目の文字ｂ_j までの文字列をＰＥ（ｉ，ｊ）（ｉ，ｊ｜
ｉ＞ｊ）の全てのＰＥで並列に抽出し、これを単語辞書
を検索する部分文字列ｂ_i+1,j とする段階（ｃ）、上記
（ｃ）の段階で、ＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ≠ｊ）で
抽出された部分文字列ａ_j+1,i と部分文字列ｂ_i+1,j と
をキーワードとして、ローカルメモリに格納されている
単語辞書を並列に検索し、単語辞書の中にキーワードが
存在した場合には、これらのキーワードが入力文ａまた
はｂの形態素であることを示すフラグと、これらのキー
ワードに対応する辞書情報をそれぞれのＰＥ内のローカ
ルメモリのバッファ領域に格納する段階（ｄ）、を備え
たものである。

【０００９】本願第２の発明に係わる並列形態素抽出方
法は、キーワードにより検索することができる単語辞書
をデータ量が均等になるように２つに分割し、それぞれ
ＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＞ｊ）とＰＥ（ｉ，ｊ）
（ｉ，ｊ｜ｉ＜ｊ）のローカルメモリ毎に同一に格納
し、ローカルメモリ内の形態素抽出結果を格納するバッ
ファ領域をクリアにする段階（ａ）、ｍ_a 文字からなる
１つの日本語の入力文ａが与えられた場合に、ａを全て
のＰＥのローカルメモリにブロードキャストする段階
（ｂ）、各ＰＥが所有するＰＥアドレス（ｉ，ｊ）を用
いて、入力文ａが格納されているＰＥ（ｉ，ｊ）（ｉ，
ｊ｜ｉ＞ｊ）においては、ａのｊ＋１番目の文字ａ_j+1
からｉ番目の文字ａ_i までの文字列を並列に抽出し、こ
れを単語辞書を検索する部分文字列ａ_j+1,i とし、ま
た、ＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＜ｊ）においては、ａ
のｉ＋１番目の文字ａ_i+1 からｊ番目の文字ａ_j までの
文字列を並列に抽出し、これを単語辞書を検索する部分
文字列ａ_i+1,j とする段階（ｃ）、上記（ｃ）の段階
で、ＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ≠ｊ）で抽出された部
分文字列ａ_j+1,i と部分文字列ａ_i+1,j とをキーワード
として、ローカルメモリに格納されている単語辞書を並
列に検索し、単語辞書の中にキーワードが存在した場合
には、そのキーワードが入力文ａの形態素であることを
示すフラグと、そのキーワードに対応する辞書情報と
を、それぞれのＰＥ内のローカルメモリのバッファ領域
に格納する段階（ｄ）、を備えたものである。

【００１０】本願第３の発明に係わる並列データ処理装
置は、マルチポートメモリをアクセスするためのポート
を各要素プロセッサに１つずつ設け、マルチポートメモ
リのポート数に等しい数の要素プロセッサの各ポートと
マルチポートメモリとをそれぞれ接続し、各要素プロセ
ッサが指定したアドレスにより、各要素プロセッサが独
立にマルチポートメモリをアクセスする構成としたもの
である。

【００１１】本願第４の発明に係わる並列形態素抽出方
法は、本願第３の発明の並列データ処理装置を用い、キ
ーワードにより検索することができる単語辞書を全ての
マルチポートメモリに同一に格納し、ローカルメモリ内
の形態素抽出結果を格納するバッファ領域をクリアにす
る段階（ａ）、ｍ_a 文字からなる１つの日本語の入力文
ａが与えられた場合に、入力文ａをＰＥ（ｉ，ｊ）
（ｉ，ｊ｜ｉ＞ｊ）のローカルメモリにブロードキャス
トする段階（ｂ）、入力文ａが格納されているＰＥをＰ
Ｅ（ｉ，ｊ）とすると、各ＰＥが所有するＰＥアドレス
（ｉ，ｊ）を用いて、入力文ａのｊ＋１番目の文字ａ
_j+1 からｉ番目の文字ａ_i までの文字列をＰＥ（ｉ，
ｊ）（ｉ，ｊ｜ｉ＞ｊ）の全てのＰＥで並列に抽出し、
これを単語辞書を検索する部分文字列ａ_j+1,i とする段
階（ｃ）、上記（ｃ）の段階で、ＰＥ（ｉ，ｊ）（ｉ，
ｊ｜ｉ≠ｊ）で抽出された部分文字列ａ_j+1,i をキーワ
ードとして、このキーワードに対応するマルチポートメ
モリのアドレスを生成する段階（ｄ）、上記（ｄ）の段
階で生成されたマルチポートメモリのアドレスにより、
このマルチポートメモリに格納されている単語辞書を全
てのＰＥについて並列に検索し、単語辞書の中にキーワ
ードが存在した場合には、そのキーワードが入力文ａの
形態素であることを示すフラグと、このキーワードに対
応する検索結果の辞書情報とを、それぞれのＰＥ内のロ
ーカルメモリのバッファ領域に格納する段階（ｅ）、を
備えたものである。

【００１２】本願第５の発明に係わる並列形態素抽出方
法は、本願第３の発明の並列データ処理装置を用い、キ
ーワードにより検索することができる単語辞書を全ての
マルチポートメモリに同一に格納し、ローカルメモリ内
の形態素抽出結果を格納するバッファ領域をクリアにす
る段階（ａ）、それぞれｍ_a ，ｍ_b 文字からなる２つの
日本語の入力文ａ，ｂが与えられた場合に、入力文ａを
ＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＞ｊ）のローカルメモリ
に、入力文ｂをＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＜ｊ）のロ
ーカルメモリにブロードキャストする段階（ｂ）、入力
文ａ，ｂが格納されているＰＥをＰＥ（ｉ，ｊ）とする
と、各ＰＥが所有するＰＥアドレス（ｉ，ｊ）を用い
て、入力文ａのｊ＋１番目の文字ａ_j+1 からｉ番目の文
字ａ_i までの文字列をＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＞
ｊ）の全てのＰＥで並列に抽出し、これを単語辞書を検
索する部分文字列ａ_j+1,i とし、また、入力文ｂのｉ＋
１番目の文字ｂ_i+1 からｊ番目の文字ｂ_j までの文字列
をＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＞ｊ）の全てのＰＥで並
列に抽出し、これを単語辞書を検索する部分文字列ｂ
_i+1,j とする段階（ｃ）、上記（ｃ）の段階で、ＰＥ
（ｉ，ｊ）（ｉ，ｊ｜ｉ≠ｊ）で抽出された部分文字列
ａ_j+1,i と部分文字列ｂ_i+1,j とをキーワードとして、
これらのキーワードに対応するマルチポートメモリのア
ドレスを生成する段階（ｄ）、上記（ｄ）の段階で生成
されたマルチポートメモリのアドレスにより、このマル
チポートメモリに格納されている単語辞書を全てのＰＥ
について並列に検索し、単語辞書の中にキーワードが存
在した場合には、そのキーワードが入力文ａまたは入力
文ｂの形態素であることを示すフラグと、これらのキー
ワードに対応する検索結果の辞書情報とを、それぞれの
ＰＥ内のローカルメモリのバッファ領域に格納する段階
（ｅ）、を備えたものである。

【００１３】

【作用】本願第１の発明においては、２つの入力文に対
して、それぞれｍ（ｍ＋１）２通りある部分文字列と単
語辞書のキーワードとの照合を１回の操作で実行するこ
とができる。

【００１４】また、本願第２の発明においては、１つの
入力文に対して、ｍ（ｍ＋１）２通りある部分文字列と
単語辞書のキーワードとの照合を１回の操作で実行する
ことができ、且つ、単語辞書を格納するローカルメモリ
の容量を１／２に節約することができる。

【００１５】また、本願第３の発明においては、全要素
プロセッサで共通に使用するデータをマルチポートメモ
リに格納することができ、格納したデータをマルチポー
トメモリのポートの数だけ各ＰＥが同時に読み出すこと
ができる。

【００１６】また、本願第４の発明においては、２次元
アドレスにより対応づけできる要素プロセッサ（ＰＥ）
を多数接続した本願第３の発明に係わる並列データ処理
装置において、１つの入力文に対してｍ（ｍ＋１）／２
通りある部分文字列と単語辞書のキーワードとの照合を
１回の操作で実行することができる。

【００１７】さらに、本願第５発明においては、２次元
アドレスにより対応づけできる要素プロセッサ（ＰＥ）
を多数接続した本願第３の発明に係わる並列データ処理
装置において、２つの入力文に対して、それぞれｍ（ｍ
＋１）／２通りある部分文字列と単語辞書のキーワード
との照合を１回の操作で実行することができる。

【００１８】

【実施例】

実施例１．以下、この発明の一実施例を図面について説
明する。図１〜図３は、要素プロセッサ（ＰＥ）を４×
４個２次元格子状に配置した並列データ処理装置におけ
るこの発明の並列形態素抽出方法の実施例１を説明する
ための図である。図１〜図３において、１０，１１はそ
れぞれ文字数ｍが３のときの入力文ａ，ｂ、１２は各Ｐ
Ｅ毎に付されるＰＥアドレス、１３はＰＥ内のローカル
メモリ、１４は全ての単語に対する単語辞書で、全ての
ＰＥに同様に格納される。１５は形態素抽出結果を格納
するためのバッファ領域、１６はＰＥのアドレスを基に
生成された入力文ａの部分文字列ａ_j+1,i 、１７は同様
にＰＥのアドレスを基に生成された入力文ｂの部分文字
列ｂ_i+1,j 、１８はフラグで、ａまたはｂの部分文字列
をキーワードとして単語辞書を検索した結果、そのキー
ワードが辞書の中に存在したことを示す。

【００１９】次に２つの入力文の形態素抽出を同時に実
行する場合の処理について、図１〜図３を用いて説明す
る。なお、図１は後述する処理ステップ（ａ），（ｂ）
を、図２は処理ステップ（ｃ）を、図３は処理ステップ
（ｄ）を示す。ステップ（ａ）では、キーワードにより
検索することができる単語辞書１４を、全てのＰＥのロ
ーカルメモリに同一に格納すると共に、ローカルメモリ
内の形態素抽出結果を格納するバッファ領域１５をクリ
アにする。この単語辞書１４は、後述するステップ
（ｄ）の辞書検索時に単語辞書のキーワードを順を追っ
て逐次的に検索しなくても済むように、ハッシング（ｈ
ａｓｈｉｎｇ）技法により検索できる構成としておく。
次のステップ（ｂ）では、３文字からなる２つの日本語
の入力文ａ，ｂが与えられた場合に、入力文ａを（ｉ，
ｊ｜ｉ＞ｊ）を満たすＰＥ（ｉ，ｊ）のローカルメモリ
１３に、入力文ｂを（ｉ，ｊ｜ｉ＜ｊ）を満たすＰＥ
（ｉ、ｊ）のローカルメモリにそれぞれブロードキャス
トする。

【００２０】次のステップ（ｃ）では、各ＰＥが所有す
るＰＥアドレス（ｉ，ｊ）を用いて、入力文ａのｊ＋１
番目の文字ａ_j+1 からｉ番目の文字ａ_i までの文字列
を、（ｉ，ｊ｜ｉ＞ｊ）を満たす全てのＰＥで並列に１
回の操作で抽出し、これを単語辞書を検索する部分文字
列ａ_j+1,i とする。また、入力文ｂのｉ＋１番目の文字
ｂ_i+1 からｊ番目の文字ｂ_j までの文字列を、（ｉ，ｊ
｜ｉ＞ｊ）を満たす全てのＰＥで並列に１回の操作で抽
出し、これを単語辞書を検索する部分文字列ｂ_i+1,j と
する。次のステップ（ｃ）では、部分文字列ａ_j+1,i 、
ｂ_i+1,j をキーワードとして単語辞書を１回の操作によ
り全てのＰＥで並列に検索する。このとき、ステップ
（ａ）で示したハッシュ化された単語辞書を検索できる
ように、キーワードからハッシュ値を計算し、それを検
索アドレスとする。そして、単語辞書の中にキーワード
が存在した場合には、そのキーワードが入力文ａまたは
ｂの形態素であることを示すフラグ１８（論理「１」）
と、そのキーワードに対応する辞書情報９とを、それぞ
れのＰＥ内のローカルメモリのバッファ領域に格納す
る。図１〜図３に示す実施例１では、部分文字列ａ_1,ａ
_2,ａ₃ が入力文ａの、部分文字列ｂ_1,ｂ_2,ｂ₃ が入力文
ｂの形態素として抽出される。

【００２１】実施例２．図４〜図６は、この発明の並列
形態素抽出方法の実施例２を説明するための図であり、
上記実施例１では２つの入力文の形態素抽出を同時に実
行する場合を示したが、この実施例２では単語辞書をデ
ータ量が均等になるように２つに分割することにより、
格納するローカルメモリの容量を１／２に節約し、１つ
の入力文の形態素抽出を実行する。図４〜図６におい
て、図１〜図３と同一符号は同一又は相当部分を示し、
１９は２つに分割した一方の単語辞書1/2 、２０は同じ
く２つに分割したもう一方の単語辞書2/2 、２１は部分
文字列ａ_j+1,i 、２２は部分文字列ａ_i+1,j である。な
お、図４は後述する処理ステップ（ａ），（ｂ）を、図
５は処理ステップ（ｃ）を、図６は処理ステップ（ｄ）
を示す。

【００２２】ステップ（ａ）では、キーワードにより検
索することができる単語辞書を、データ量が均等になる
ように、単語辞書1/2 ，単語辞書2/2 のように２つに分
割し、それぞれＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＞ｊ）と、
ＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＜ｊ）のローカルメモリ１
３毎に同一に格納すると共に、ローカルメモリ内の形態
素抽出結果を格納するバッファ領域１５をクリアにす
る。上記実施例１と同様に、この単語辞書は、ステップ
（ｄ）の辞書検索時に単語辞書のキーワードを順を追っ
て逐次的に検索しなくても済むように、ハッシング技法
により検索できる構成とする。次のステップ（ｂ）で
は、３文字からなる１つの日本語の入力文ａが与えられ
た場合に、入力文ａを全てのＰＥのローカルメモリにブ
ロードキャストする。

【００２３】次のステップ（ｃ）では、各ＰＥが所有す
るＰＥアドレス（ｉ，ｊ）を用いて、入力文ａが格納さ
れているＰＥ（ｉ，ｊ）（ｉ，Ｊ｜ｉ＞ｊ）において
は、入力文ａのｊ＋１番目の文字ａ_j+1 からｉ番目の文
字ａ_j までの文字列を１回の操作で並列に抽出し、これ
を単語辞書1/2 を検索する部分文字列ａ_j+1,i とする。
また、ＰＥ（ｉ，ｊ）（ｉ，Ｊ｜ｉ＜ｊ）においては、
入力文ａのｉ＋１番目の文字ａ_i+1 からｊ番目の文字ａ
_j までの文字列を１回の操作で並列に抽出し、これを単
語辞書2/2 を検索する部分文字列ａ_i+1,j とする。

【００２４】次のステップ（ｄ）では、部分文字列ａ
_j+1,i ，部分文字列ａ_i+1,j をキーワードとして、単語
辞書1/2 および単語辞書2/2 を１回の操作で並列に検索
する。このとき、上述のステップ（ａ）で示したハッシ
ュ化された単語辞書を検索できるように、キーワードか
らハッシュ値を計算し、それを検索アドレスとする。そ
して、単語辞書の中にキーワードが存在した場合には、
そのキーワードが入力文ａの形態素であることを示すフ
ラグ１８（論理「１」）と、そのキーワードに対応する
辞書情報９とを、それぞれのＰＥ内のローカルメモリの
バッファ領域に格納する。実施例２では、部分文字列ａ
_1,ａ_2,ａ₃ が入力文ａ形態素として抽出される。

【００２５】実施例３．図７〜図９は、この発明の実施
例３を説明するための図であり、各図において、図１〜
図６と同一符号は同一又は相当部分を示し、３０はそれ
ぞれ８ポートのマルチポートメモリで、ＰＥのマルチポ
ートメモリ接続用ポート３１が接続され、このポート３
１を使用して各ポート独立にマルチポートメモリ３０に
メモリアクセスが行えるようになっており、このポート
３１には、メモリに位置を指定するアドレス信号線、デ
ータ信号線、制御信号線が含まれる。３２はキーワード
に対応する検索結果の辞書情報である。図７に示すこの
発明の並列データ処理装置は、例えば、マルチポートメ
モリ３０をアクセスするためのポートを、１つずつ設け
た要素プロセッサ（ＰＥ）１を４×４個２次元格子状に
配置し、２つのマルチポートメモリ３０の各８ポートメ
モリに、全ての要素プロセッサ１のポートをそれぞれ接
続し、各要素プロセッサ１が指定したアドレスにより、
各要素プロセッサが独立してマルチポートメモリ３０を
アクセスすることができるように構成したものである。

【００２６】次に、１つの入力文の形態素抽出を実行す
る場合の処理について、図７〜図９のＰＥ(1,0)、ＰＥ
(2,0)、ＰＥ(3,0)、ＰＥ(2,1)、ＰＥ(3,1)、ＰＥ(3,2) に着
目し順を追って説明する。なお、図７は後述する処理ス
テップ（ａ），（ｂ）を、図８は処理ステップ（ｃ）
を、図９は処理ステップ（ｄ），（ｅ）を示す。ステッ
プ（ａ）では、キーワード８により検索することができ
る単語辞書１４を全て２つのマルチポートメモリ３０に
同一に格納すると共に、ローカルメモリ１３内の形態素
抽出結果を格納するバッファ領域１５をクリアにする。
この単語辞書１４は、後述するステップ（ｄ）及び
（ｅ）の辞書検索時に単語辞書１４のキーワード８を順
を追って逐次的に検索しなくても済むように、ハッシン
グ技法により検索できる構成としておく。次のステップ
（ｂ）では、３文字からなる１つの日本語の入力文ａが
与えられた場合に、制御プロセッサ３から、（ｉ，ｊ｜
ｉ＞ｊ）を満たす全てのＰＥ（ｉ，ｊ）のローカルメモ
リに入力文ａをブロードキャストする。

【００２７】次のステップ（ｃ）では、各ＰＥが所有す
るＰＥアドレス（ｉ，ｊ）を用いて、入力文ａのｊ＋１
番目の文字ａ_j+1 からｉ番目の文字ａ_i までの文字列
を、（ｉ，ｊ｜ｉ＞ｊ）を満たす全てのＰＥ（ｉ，ｊ）
で並列に１回の操作で抽出し、これを単語辞書１４を検
索する部分文字列ａ_j+1,i とする。次のステップ（ｄ）
では、部分文字列ａ_j+1,i をキーワード８として、この
キーワード８に対応するマルチポートメモリ３０のアド
レスを生成する。このとき、上述のステップ（ａ）で示
したハッシュ化された単語辞書を検索できるように、キ
ーワードからハッシュ値を計算し、それをマルチポート
メモリ３０の各ポート３１に与えるアドレスとする。次
のステップ（ｅ）では、このアドレスを各ＰＥ毎にマル
チポートメモリ３０のポート３１に同時に送出し、この
マルチポートメモリ３０に格納されている単語辞書１４
を全てのＰＥについて並列に検索する。そして、単語辞
書１４の中にキーワード８が存在した場合には、そのキ
ーワード８が入力文ａの形態素であることを示すフラグ
１８（論理「１」）と、そのキーワード８に対応する検
索結果の辞書情報３２とを、それぞれのＰＥ内のローカ
ルメモリ１３のバッファ領域１５に格納する。このよう
にＰＥ(1,0)、ＰＥ(2,0)、ＰＥ(3,0)、ＰＥ(2,1)、ＰＥ(3,
1)、ＰＥ(3,2)に着目した場合、部分文字列ａ₁ 、ａ₂ ａ
₃ が入力文ａの形態素として抽出され、これらに対応す
る検索結果の辞書情報３２として、それぞれＡ₁ 、Ａ₂₃
がローカルメモリ１３のバッファ領域１５に格納され
る。

【００２８】次に、２つの入力文の形態素抽出を同時に
実行する場合の処理について、ＰＥ(1,0)、ＰＥ(2,0)、Ｐ
Ｅ(3,0)、ＰＥ(2,1)、ＰＥ(3,1)、ＰＥ(3,2)、ＰＥ(0,1)、Ｐ
Ｅ(0,2)、ＰＥ(1,2)、ＰＥ(0,3) ＰＥ(1,3) ＰＥ(2,3) に
着目し順を追って説明する。ステップ（ａ）では、キー
ワード８により検索することができる単語辞書１４を全
て（２つ）のマルチポートメモリ３０に同一に格納する
と共に、ローカルメモリ１３内の形態素抽出結果を格納
するバッファ領域１５をクリアにする。この単語辞書１
４は、後述するステップ（ｄ）及び（ｅ）の辞書検索時
に単語辞書１４のキーワード８を順を追って逐次的に検
索しなくても済むように、ハッシング技法により検索で
きる構成としておく。次のステップ（ｂ）では、それぞ
れ３文字からなる２つの日本語の入力文ａ，ｂが与えら
れた場合に、制御プロセッサ３から、（ｉ，ｊ｜ｉ＞
ｊ）を満たす全てのＰＥ（ｉ，ｊ）のローカルメモリに
入力文ａを、（ｉ，ｊ｜ｉ＜ｊ）を満たす全てのＰＥ
（ｉ，ｊ）のローカルメモリに入力文ｂを、それぞれブ
ロードキャストする。

【００２９】次のステップ（ｃ）では、各ＰＥが所有す
るＰＥアドレス（ｉ，ｊ）を用いて、入力文ａのｊ＋１
番目の文字ａ_j+1 からｉ番目の文字ａ_i までの文字列
を、（ｉ，ｊ｜ｉ＞ｊ）を満たす全てのＰＥ（ｉ，ｊ）
で並列に１回の操作で抽出し、これを単語辞書１４を検
索する部分文字列ａ_j+1,i とする。また、入力文ｂのｉ
＋１番目の文字ｂ_i+1 からｊ番目の文字ｂ_j までの文字
列を、（ｉ，ｊ｜ｉ＞ｊ）を満たす全てのＰＥ（ｉ，
ｊ）で並列に１回の操作で抽出し、これを単語辞書１４
を検索する部分文字列ｂ_i+1,j とする。次のステップ
（ｄ）では、抽出された部分文字列ａ_j+1,i 、ｂ_i+1,j
をキーワード８として、これらのキーワード８に対応す
るマルチポートメモリ３０のアドレスを生成する。この
とき、上述のステップ（ａ）で示したハッシュ化された
単語辞書を検索できるように、キーワードからハッシュ
値を計算し、それをマルチポートメモリ３０の各ポート
３１に与えるアドレスとする。次のステップ（ｅ）で
は、このアドレスを各ＰＥ毎にマルチポートメモリ３０
のポート３１に同時に送出し、マルチポートメモリ３０
に格納されている単語辞書１４を全てのＰＥについて並
列に検索する。そして、単語辞書１４の中にキーワード
８が存在した場合には、そのキーワード８が入力文ａま
たは入力文ｂの形態素であることを示すフラグ１８（論
理「１」）と、そのキーワード８に対応する検索結果の
辞書情報３２とを、それぞれのＰＥ内のローカルメモリ
１３のバッファ領域１５に格納する。このようにして、
部分文字列ａ₁ 、ａ₂ ａ₃ が入力文ａの形態素として抽
出され、これらに対応する辞書情報として、それぞれＡ
₁ 、Ａ₂₃がローカルメモリ１３のバッファ領域１５に格
納される。また、部分文字列ｂ₂ ｂ₃ 、ｂ₃ が入力文ｂ
の形態素として抽出され、これらに対応する辞書情報と
して、それぞれＢ₂₃、Ｂ₃ がローカルメモリ１３のバッ
ファ領域１５に格納される。

【００３０】上記実施例１〜３では、４×４個の要素プ
ロセッサから構成される並列データ処理装置及びそれに
おける並列形態素抽出方法を説明したが、物理的に２次
元構成の並列データ処理装置でなくとも、２次元アドレ
スにより対応づけできる要素プロセッサから構成される
並列データ処理装置であれば良い。

【００３１】上記実施例１〜３では、３文字の入力文の
形態素抽出方法を説明したが、入力文は、任意のｍ文字
で良い。

【００３２】上記実施例３では、８ポートメモリを使用
した例を示したが、２以上の任意の数のポートを持つマ
ルチポートメモリを使用した並列データ処理装置であれ
ば、実施することができる。

【００３３】

【発明の効果】以上のように、本願第１の発明の並列形
態素抽出方法では、ローカルメモリを有し２次元アドレ
スにより対応づけできる要素プロセッサ（ＰＥ）を多数
接続した並列データ処理装置において、２つの入力文に
対して、それぞれｍ（ｍ＋１）／２通りある部分文字列
と単語辞書のキーワードとの照合を、１回の操作で実行
することができ、日本語の入力文の中に存在する可能性
のある全単語、すなわち形態素を抽出する処理を高速に
実行できるという効果がある。

【００３４】また、本願第２の発明の並列形態素抽出方
法では、単語辞書を２つに分割してローカルメモリに格
納するようにしたので、１つの入力文に対して、それぞ
れｍ（ｍ＋１）／２通りある部分文字列と単語辞書のキ
ーワードとの照合を１回で実行できると共に単語辞書を
格納するローカルメモリの容量を１／２に節約して、形
態素を抽出する処理を高速に実行できるという効果があ
る。

【００３５】また、本願第３の発明の並列データ処理装
置では、全要素プロセッサで共通に使用するデータをマ
ルチポートメモリに格納し、マルチポートメモリのポー
ト数だけ各要素プロセッサが同時にメモリアクセスでき
るため、全要素プロセッサで共通に使用するデータを各
要素プロセッサのローカルメモリに同一に持つ場合と比
べ、メモリ容量がマルチポートの数だけ削減でき、デー
タのアクセス速度は変わらないという効果がある。

【００３６】また、本願第４の発明の並列形態素抽出方
法では、２次元アドレスにより対応づけできる要素プロ
セッサを多数接続した本願第３の発明に係わる並列デー
タ処理装置において、１つの入力文に対してそれぞれｍ
（ｍ＋１）／２通りある部分文字列と単語辞書のキーワ
ードとの照合を１回の操作で実行することができ、メモ
リ容量を削減しながら形態素を抽出する処理を高速に実
行できるという効果がある。

【００３７】さらに、本願第５の発明の並列形態素抽出
方法では、２次元アドレスにより対応づけできる要素プ
ロセッサを多数接続した本願第３の発明に係わる並列デ
ータ処理装置において、同時に２つの入力文に対してそ
れぞれｍ（ｍ＋１）／２通りある部分文字列と単語辞書
のキーワードとの照合を１回の操作で実行することがで
き、メモリ容量を削減しながら形態素を抽出する処理を
高速に実行できるという効果がある。

【図面の簡単な説明】

【図１】この発明の並列形態素抽出方法の実施例１を説
明するための図である。

【図２】この発明の並列形態素抽出方法の実施例１を説
明するための図である。

【図３】この発明の並列形態素抽出方法の実施例１を説
明するための図である。

【図４】この発明の並列形態素抽出方法の実施例２を説
明するための図である。

【図５】この発明の並列形態素抽出方法の実施例２を説
明するための図である。

【図６】この発明の並列形態素抽出方法の実施例２を説
明するための図である。

【図７】この発明の並列データ処理装置および並列形態
素抽出方法の実施例３を説明するための図である。

【図８】この発明の並列データ処理装置および並列形態
素抽出方法の実施例３を説明するための図である。

【図９】この発明の並列データ処理装置および並列形態
素抽出方法の実施例３を説明するための図である。

【図１０】従来の並列データ処理装置における並列形態
素抽出方法を説明するための図である。

【符号の説明】１要素プロセッサ（ＰＥ）８キーワード９辞書情報１０入力文ａ１１入力文ｂ１２ＰＥアドレス１３ローカルメモリ１４，１９，２０単語辞書１５バッファ領域１６，２１部分文字列ａ_j+1,i １７部分文字列ｂ_i+1,j １８フラグ２２部分文字列ａ_i+1,j ３０マルチポートメモリ３１ポート３２検索結果の辞書情報

─────────────────────────────────────────────────────

【手続補正書】

【提出日】平成４年９月２日

【手続補正１】

【補正対象書類名】明細書

【補正対象項目名】請求項４

【補正方法】変更

【補正内容】

【手続補正２】

【補正対象書類名】明細書

【補正対象項目名】００１３

【補正方法】変更

【補正内容】

【００１３】

【作用】本願第１の発明においては、２つの入力文に対
して、それぞれｍ（ｍ＋１）／２通りある部分文字列と
単語辞書のキーワードとの照合を１回の操作で実行する
ことができる。

【手続補正３】

【補正対象書類名】明細書

【補正対象項目名】００１４

【補正方法】変更

【補正内容】

【００１４】また、本願第２の発明においては、１つの
入力文に対して、ｍ（ｍ＋１）／２通りある部分文字列
と単語辞書のキーワードとの照合を１回の操作で実行す
ることができ、且つ、単語辞書を格納するローカルメモ
リの容量を１／２に節約することができる。

【手続補正４】

【補正対象書類名】明細書

【補正対象項目名】００２３

【補正方法】変更

【補正内容】

Claims

【特許請求の範囲】

【請求項１】ローカルメモリを有し、２次元アドレス
によって対応づけできる要素プロセッサ（以下、ＰＥと
も言う）（ｉ，ｊ）を多数接続した並列データ処理装置
における入力文の形態素抽出（日本語入力文の中に存在
する可能性のある全単語の抽出）を行う並列形態素抽出
方法において、キーワードにより検索することができる単語辞書を全て
のＰＥのローカルメモリに同一に格納し、ローカルメモ
リ内の形態素抽出結果を格納するバッファ領域をクリア
にする段階（ａ）、それぞれｍ_a ，ｍ_b 文字からなる２つの日本語の入力文
ａ，ｂが与えられた場合に、入力文ａをＰＥ（ｉ，ｊ）
（ｉ，ｊ｜ｉ＞ｊ）のローカルメモリに、入力文ｂをＰ
Ｅ（ｉ，ｊ）（ｉ，ｊ｜ｉ＜ｊ）のローカルメモリにブ
ロードキャストする段階（ｂ）、入力文ａ，ｂが格納されているＰＥをＰＥ（ｉ，ｊ）と
すると、各ＰＥが所有するＰＥアドレス（ｉ，ｊ）を用
いて、入力文ａのｊ＋１番目の文字ａ_j+1 からｉ番目の
文字ａ_i までの文字列をＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＞
ｊ）の全てのＰＥで並列に抽出し、これを単語辞書を検
索する部分文字列ａ_j+1,i とし、また、入力文ｂのｉ＋
１番目の文字ｂ_i+1 からｊ番目の文字ｂ_j までの文字列
をＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＞ｊ）の全てのＰＥで並
列に抽出し、これを単語辞書を検索する部分文字列ｂ
_i+1,j とする段階（ｃ）、上記（ｃ）の段階で、ＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ≠
ｊ）で抽出された部分文字列ａ_j+1,i と部分文字列ｂ
_i+1,j とをキーワードとして、ローカルメモリに格納さ
れている単語辞書を並列に検索し、単語辞書の中にキー
ワードが存在した場合には、これらキーワードが入力文
ａまたはｂの形態素であることを示すフラグと、これら
のキーワードに対応する辞書情報をそれぞれのＰＥ内の
ローカルメモリのバッファ領域に格納する段階（ｄ）、を備えたことを特徴とする並列形態素抽出方法。
【請求項２】ローカルメモリを有し、２次元アドレス
によって対応づけできるＰＥ（ｉ，ｊ）を多数接続した
並列データ処理装置における入力文の形態素抽出を行う
並列形態素抽出方法において、キーワードにより検索することができる単語辞書をデー
タ量が均等になるように２つに分割し、それぞれＰＥ
（ｉ，ｊ）（ｉ，ｊ｜ｉ＞ｊ）とＰＥ（ｉ，ｊ）（ｉ，
ｊ｜ｉ＜ｊ）のローカルメモリ毎に同一に格納し、ロー
カルメモリ内の形態素抽出結果を格納するバッファ領域
をクリアにする段階（ａ）、ｍ_a 文字からなる１つの日本語の入力文ａが与えられた
場合に、入力文ａを全てのＰＥのローカルメモリにブロ
ードキャストする段階（ｂ）、各ＰＥが所有するＰＥアドレス（ｉ，ｊ）を用いて、入
力文ａが格納されているＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＞
ｊ）においては、入力文ａのｊ＋１番目の文字ａ_j+1 か
らｉ番目の文字ａ_i までの文字列を並列に抽出し、これ
を単語辞書を検索する部分文字列ａ_j+1,i とし、また、
ＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＜ｊ）においては、入力文
ａのｉ＋１番目の文字ａ_i+1 からｊ番目の文字ａ_j まで
の文字列を並列に抽出し、これを単語辞書を検索する部
分文字列ａ_i+1,j とする段階（ｃ）、上記（ｃ）の段階で、ＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ≠
ｊ）で抽出された部分文字列ａ_j+1,i と部分文字列ａ
_i+1,j とをキーワードとして、ローカルメモリに格納さ
れている単語辞書を並列に検索し、単語辞書の中にキー
ワードが存在した場合には、そのキーワードが入力文ａ
の形態素であることを示すフラグと、そのキーワードに
対応する辞書情報とを、それぞれのＰＥ内のローカルメ
モリのバッファ領域に格納する段階（ｄ）、を備えたことを特徴とする並列形態素抽出方法。
【請求項３】ローカルメモリを有する要素プロセッサ
を多数接続した並列データ処理装置において、マルチポートメモリをアクセスするためのポートを各要
素プロセッサに１つずつ設け、マルチポートメモリのポ
ート数に等しい数の要素プロセッサの各ポートとマルチ
ポートメモリとをそれぞれ接続し、各要素プロセッサが
指定したアドレスにより、各要素プロセッサが独立にマ
ルチポートメモリをアクセスする構成としたことを特徴
とする並列データ処理装置。
【請求項４】各要素プロセッサがＰＥ（ｉ，ｊ）のご
とく２次元アドレスによって対応づけできる請求項第３
項記載の並列データ処理装置を用いる並列形態素抽出方
法において、キーワードにより検索することができる単語辞書を全て
のマルチポートメモリに同一に格納し、ローカルメモリ
内の形態素抽出結果を格納するバッファ領域をクリアに
する段階（ａ）、ｍ_a 文字からなる１つの日本語の入力文ａが与えられた
場合に、までの文字列ａをＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ
＞ｊ）のローカルメモリにブロードキャストする段階
（ｂ）、入力文ａが格納されているＰＥをＰＥ（ｉ，ｊ）とする
と、各ＰＥが所有するＰＥアドレス（ｉ，ｊ）を用い
て、ａのｊ＋１番目の文字ａ_j+1 からｉ番目の文字ａ_i
までの文字列をＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＞ｊ）の全
てのＰＥで並列に抽出し、これを単語辞書を検索する部
分文字列ａ_j+1,i とする段階（ｃ）、上記（ｃ）の段階で、ＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ≠
ｊ）で抽出された部分文字列ａ_j+1,i をキーワードとし
て、このキーワードに対応するマルチポートメモリのア
ドレスを生成する段階（ｄ）、上記（ｄ）の段階で生成されたマルチポートメモリのア
ドレスにより、このマルチポートメモリに格納されてい
る単語辞書を全てのＰＥについて並列に検索し、単語辞
書の中にキーワードが存在した場合には、そのキーワー
ドが入力文ａの形態素であることを示すフラグと、この
キーワードに対応する検索結果の辞書情報とを、それぞ
れのＰＥ内のローカルメモリのバッファ領域に格納する
段階（ｅ）、を備えたことを特徴とする並列形態素抽出方法。
【請求項５】各要素プロセッサがＰＥ（ｉ，ｊ）のご
とく２次元アドレスによって対応づけできる請求項第３
項記載の並列データ処理装置を用いる並列形態素抽出方
法において、キーワードにより検索することができる単語辞書を全て
のマルチポートメモリに同一に格納し、ローカルメモリ
内の形態素抽出結果を格納するバッファ領域をクリアに
する段階（ａ）、それぞれｍ_a ，ｍ_b 文字からなる２つの日本語の入力文
ａ，ｂが与えられた場合に、入力文ａをＰＥ（ｉ，ｊ）
（ｉ，ｊ｜ｉ＞ｊ）のローカルメモリに、入力文ｂをＰ
Ｅ（ｉ，ｊ）（ｉ，ｊ｜ｉ＜ｊ）のローカルメモリにブ
ロードキャストする段階（ｂ）、入力文ａ，ｂが格納されているＰＥをＰＥ（ｉ，ｊ）と
すると、各ＰＥが所有するＰＥアドレス（ｉ，ｊ）を用
いて、入力文ａのｊ＋１番目の文字ａ_j+1 からｉ番目の
文字ａ_i までの文字列をＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＞
ｊ）の全てのＰＥで並列に抽出し、これを単語辞書を検
索する部分文字列ａ_j+1,i とし、また、入力文ｂのｉ＋
１番目の文字ｂ_i+1 からｊ番目の文字ｂ_j までの文字列
をＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ＞ｊ）の全てのＰＥで並
列に抽出し、これを単語辞書を検索する部分文字列ｂ
_i+1,j とする段階（ｃ）、上記（ｃ）の段階で、ＰＥ（ｉ，ｊ）（ｉ，ｊ｜ｉ≠
ｊ）で抽出された部分文字列ａ_j+1,i と部分文字列ｂ
_i+1,j とをキーワードとして、これらのキーワードに対
応するマルチポートメモリのアドレスを生成する段階
（ｄ）、上記（ｄ）の段階で生成されたマルチポートメモリのア
ドレスにより、このマルチポートメモリに格納されてい
る単語辞書を全てのＰＥについて並列に検索し、単語辞
書の中にキーワードが存在した場合には、そのキーワー
ドが入力文ａまたは入力文ｂの形態素であることを示す
フラグと、これらのキーワードに対応する検索結果の辞
書情報とを、それぞれのＰＥ内のローカルメモリのバッ
ファ領域に格納する段階（ｅ）、を備えたことを特徴とする並列形態素抽出方法。