JPS6091478A - 単語の綴り検査方式 - Google Patents
単語の綴り検査方式Info
- Publication number
- JPS6091478A JPS6091478A JP58200259A JP20025983A JPS6091478A JP S6091478 A JPS6091478 A JP S6091478A JP 58200259 A JP58200259 A JP 58200259A JP 20025983 A JP20025983 A JP 20025983A JP S6091478 A JPS6091478 A JP S6091478A
- Authority
- JP
- Japan
- Prior art keywords
- word
- memory
- signal
- storage device
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Document Processing Apparatus (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
く技術分野〉
入力された単語が正しい綴りであるが否かを判定するに
あたっては、その入力された単語が予め特定の単語を収
録した単語辞書のなかに存在するかどうかによって判断
している。
あたっては、その入力された単語が予め特定の単語を収
録した単語辞書のなかに存在するかどうかによって判断
している。
しかるに、収録すべき単語数は多いため従来より各種の
単語辞書部の圧縮技法が開発されてきた。
単語辞書部の圧縮技法が開発されてきた。
〈発明の目的〉
本発明は、単語辞書部には基本的な単語のみを記録して
、その基本的な単語の組み合わさった単語即ち複合語若
しくは合成語は記゛録するこ々なくしたところの、該複
合語若しくは合成語の単語の綴りの検査機能を持たした
単語の綴り検査方式であり、単語辞書部の新規な圧縮方
法を提供することを目的とする。
、その基本的な単語の組み合わさった単語即ち複合語若
しくは合成語は記゛録するこ々なくしたところの、該複
合語若しくは合成語の単語の綴りの検査機能を持たした
単語の綴り検査方式であり、単語辞書部の新規な圧縮方
法を提供することを目的とする。
〈実施例〉
以下、具体的構成につき説明する。
本発明の単語の綴り検査方式の具体例を掲げておく。
例えば、単語辞書ニJmotorJ 、 JboatJ
、 [carJ。
、 [carJ。
[cycleJ の基本的な単語を収録しておき、rm
otorJと他のrboatJ 、 [carJ 、
[cycleJの合成語[motorboatl 、
j−motorc’arJ 、 [motorcycl
ejは前記単語辞書に収録しないで、もし該合成語が被
検査語として与えられたならば、該被検査語の最初の5
文字即ちrmj 、 roj 、 rtj 、 roj
、 rr、Jが単語辞書にあることを調べて、引き続
き残りの文字が該単語辞書に記録されているかを見ると
いうことにするのである。
otorJと他のrboatJ 、 [carJ 、
[cycleJの合成語[motorboatl 、
j−motorc’arJ 、 [motorcycl
ejは前記単語辞書に収録しないで、もし該合成語が被
検査語として与えられたならば、該被検査語の最初の5
文字即ちrmj 、 roj 、 rtj 、 roj
、 rr、Jが単語辞書にあることを調べて、引き続
き残りの文字が該単語辞書に記録されているかを見ると
いうことにするのである。
第1図は本発明の実施例のブロックダイヤグラムである
。
。
同図において、lは記憶装置、2はアドレスカウンタ、
3は記憶装置、4は綴り検査装置、5は信号出力装置で
ある。
3は記憶装置、4は綴り検査装置、5は信号出力装置で
ある。
各構成要素1乃至5について説明する。
■ 記憶装置1
単語を電子的に記憶する装置で、あるアドレス情報がア
ドレスカウンタ2より与えられると該アドレスに対応す
る単語の綴り情報が出力される。本実施例においては、
説明を簡略化するため被検査語は原形(活用形ではない
。)に限定した。
ドレスカウンタ2より与えられると該アドレスに対応す
る単語の綴り情報が出力される。本実施例においては、
説明を簡略化するため被検査語は原形(活用形ではない
。)に限定した。
又、アドレスカウンタ2がカウントアツプする毎に1個
の単語が出力され、その出力される単語はアルファベン
ト類の逆とする。
の単語が出力され、その出力される単語はアルファベン
ト類の逆とする。
■ アドレスカウンタ2
上記の単語記憶装置1より出力する単語のアドレスを指
示するカウンタであり、例えば[mottoJ を出力
していたとしてアドレスが1つアップすると[moto
ristJを出力させるものである。
示するカウンタであり、例えば[mottoJ を出力
していたとしてアドレスが1つアップすると[moto
ristJを出力させるものである。
このアドレスカウンタ2は綴り検査装置4よりの信号(
不一致信号)Saによりカウントアツプし、信号出力装
置5よりの信号S4によりカウントをリセットして再ス
タートする。又、前記信号S3によりカウントアツプし
た時、指示する単語が記憶装置1にもはや存在しなくな
った場合、信号(誤り信号)Ssを出力する。
不一致信号)Saによりカウントアツプし、信号出力装
置5よりの信号S4によりカウントをリセットして再ス
タートする。又、前記信号S3によりカウントアツプし
た時、指示する単語が記憶装置1にもはや存在しなくな
った場合、信号(誤り信号)Ssを出力する。
■ 記憶装置3
図示していない手段により与えられた被検査1″、j−
語を記憶する。又、信号出力装置5よりの信号(シフト
情報信号)S6により内部に記憶している被検査語を与
えられた情報に基づき左シフトし所定の頭何文字分を捨
てる。
語を記憶する。又、信号出力装置5よりの信号(シフト
情報信号)S6により内部に記憶している被検査語を与
えられた情報に基づき左シフトし所定の頭何文字分を捨
てる。
■ 綴り検査装置4
前記記憶装置1及び3より出力さ九る単語の綴りを検査
(チェック)する装置で、該記憶装置3と該記憶装置3
よりの綴り情報が完全に一致した場合に信号(一致信号
)Slを出力する。
(チェック)する装置で、該記憶装置3と該記憶装置3
よりの綴り情報が完全に一致した場合に信号(一致信号
)Slを出力する。
完全に一致していないが記憶装置1より出力される文字
列が記憶装置3より出力される頭何文字部分と一致する
場合、記憶装置1の文字列の文字数を信号出力装置5に
出力する。それ以外の場合は信号(不一致信号)Saを
出力する。
列が記憶装置3より出力される頭何文字部分と一致する
場合、記憶装置1の文字列の文字数を信号出力装置5に
出力する。それ以外の場合は信号(不一致信号)Saを
出力する。
■ 信号出力装置5
信号S2に基づいて記憶装置3をシフトすべき回数情報
を該記憶装置3に出力し、アドレスカウンタ2をリセッ
トして再スタートさせる信号S4を該アドレスカウンタ
2に出力する。
を該記憶装置3に出力し、アドレスカウンタ2をリセッ
トして再スタートさせる信号S4を該アドレスカウンタ
2に出力する。
引き続き動作例を挙げる(第2図参照)。
(イ)被検査語として[rhotoristJが記憶装
置3に与えられた場合 アドレスカウンタ2は図示していない信号によって動作
をスタートシ、最初のアドレスを指示する。記憶装置1
は最初の単語[zoundsJ(−例である。)を出力
するが、それは被検査語と一致せず、さらにそれは被検
査語の頭文字外とも一致しないため綴り検査語@4より
信号S3が出力され、アドレスカウンタ2のアドレスを
アップする。以後、同様の操作を各単語ごとに繰り返し
て記憶装置lがrmotoristJを出力した時綴り
検査装置4は信号S1を出力し被検査語である[mot
oristJが正しい綴りであることを表わす。
置3に与えられた場合 アドレスカウンタ2は図示していない信号によって動作
をスタートシ、最初のアドレスを指示する。記憶装置1
は最初の単語[zoundsJ(−例である。)を出力
するが、それは被検査語と一致せず、さらにそれは被検
査語の頭文字外とも一致しないため綴り検査語@4より
信号S3が出力され、アドレスカウンタ2のアドレスを
アップする。以後、同様の操作を各単語ごとに繰り返し
て記憶装置lがrmotoristJを出力した時綴り
検査装置4は信号S1を出力し被検査語である[mot
oristJが正しい綴りであることを表わす。
(ロ)被検査語として[motorcarJが記憶袋@
3に与えられた場合 チェックが綴り検査装置4で行なわれ、アドレスカウン
タ2が記憶装置1において「mo t o rJのアド
レスを指示した時、記憶装置lからはJmotorJ
が記憶装置3からは[motorcarJが出力される
。該記憶装置3のrmotorcarlのt字列は記憶
装置1の文字列を頭5文字に含んでいるので信号S2が
出力され、信号出力装置5より[mo t o r J
の文字数即ち5だけ左シフトする信号S6が記憶装置
3に送られる。それによって、該記憶装置3は[mot
orcarJを頭より5文字分左シフトし、その結果、
新たな被検査語として記憶装置3にrcarJが残る。
3に与えられた場合 チェックが綴り検査装置4で行なわれ、アドレスカウン
タ2が記憶装置1において「mo t o rJのアド
レスを指示した時、記憶装置lからはJmotorJ
が記憶装置3からは[motorcarJが出力される
。該記憶装置3のrmotorcarlのt字列は記憶
装置1の文字列を頭5文字に含んでいるので信号S2が
出力され、信号出力装置5より[mo t o r J
の文字数即ち5だけ左シフトする信号S6が記憶装置
3に送られる。それによって、該記憶装置3は[mot
orcarJを頭より5文字分左シフトし、その結果、
新たな被検査語として記憶装置3にrcarJが残る。
さらに、信号出力装置5によりアドレスカウンタ2はリ
セットされ再度最初からやり直される。そして、rca
rJという単語が記憶装置1より出力されると綴り検査
装置4より信号Slが出力され正しい綴りであることが
判明する。又、rcarJの単語がなければアドレスカ
ウンタ2は最終アドレスまで進み、信号S5を出して与
えられた被検査語が辞書に収録されていない単語である
ことつまり誤った綴りであることが判明する。
セットされ再度最初からやり直される。そして、rca
rJという単語が記憶装置1より出力されると綴り検査
装置4より信号Slが出力され正しい綴りであることが
判明する。又、rcarJの単語がなければアドレスカ
ウンタ2は最終アドレスまで進み、信号S5を出して与
えられた被検査語が辞書に収録されていない単語である
ことつまり誤った綴りであることが判明する。
〈効 果〉
以上の様に本発明の単語の綴り検査方式によれば、基本
的な単語の組み合わせで作られた複合語若しくは合成語
を単語辞書に収録する必要がなく(7) なるので単語辞書の規模を小さくすることができる。例
えば、三省堂の1新明解英和中辞典」に収録された単語
(見出し語数は約3,000語とあ;E)。)をそのま
ま本発明の単語の綴り検査方式に適用すれば、rgra
ndl で始まる複合語(合成語)は13語も省略でき
る。さらに他の例を掲げれば、独語ではかような複合語
(合成語)が非常に多く、三修社の「現代独和辞典」に
よれば頭部分がl’Fi1mlである複合語(合成語)
はその数が80個余りあり、それらが全て省略できるの
であり、複合語(合成語)の多い言語にとって極めて有
用である。
的な単語の組み合わせで作られた複合語若しくは合成語
を単語辞書に収録する必要がなく(7) なるので単語辞書の規模を小さくすることができる。例
えば、三省堂の1新明解英和中辞典」に収録された単語
(見出し語数は約3,000語とあ;E)。)をそのま
ま本発明の単語の綴り検査方式に適用すれば、rgra
ndl で始まる複合語(合成語)は13語も省略でき
る。さらに他の例を掲げれば、独語ではかような複合語
(合成語)が非常に多く、三修社の「現代独和辞典」に
よれば頭部分がl’Fi1mlである複合語(合成語)
はその数が80個余りあり、それらが全て省略できるの
であり、複合語(合成語)の多い言語にとって極めて有
用である。
ざらに又、英語や独語等の外国語では語尾変化をする語
が非常に多い。しかし、英語、独語の様な言語ではその
活用形式が殆どの場合最後にある単語末尾部分の文字列
によって決まるため活用に関する情報は基本的な単語に
集中するわけで、本発明の単語の綴り検査方式を用いる
と収録効率が第2図は本発明実施例の動作説明に用いる
図である。
が非常に多い。しかし、英語、独語の様な言語ではその
活用形式が殆どの場合最後にある単語末尾部分の文字列
によって決まるため活用に関する情報は基本的な単語に
集中するわけで、本発明の単語の綴り検査方式を用いる
と収録効率が第2図は本発明実施例の動作説明に用いる
図である。
1・・・記憶装置、2・アドレスカウンタ、3 ・記憶
装置、4・・・綴り検査装置、5−信号出力装置。
装置、4・・・綴り検査装置、5−信号出力装置。
Claims (1)
- 1、被検査語が単語辞書部に収録されているか否かを検
査する単語の綴り検査方式であって、被検査語の先頭か
ら所定数の文字と一致する単語が単語辞書部に収録され
ている場合、該被検査語の不一致部分を新たな被検査語
として検査して、前記被検査語の不一致部分が単語辞書
部に収録されていれば被検査語を正しい綴りとし、逆に
前記被検査語の不一致部分が単語辞書部に収録されてい
なければ被検査語を誤りの綴りとするようにしたことを
特徴とする単語の綴り検査方式。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58200259A JPS6091478A (ja) | 1983-10-25 | 1983-10-25 | 単語の綴り検査方式 |
| DE8484307349T DE3473070D1 (en) | 1983-10-25 | 1984-10-25 | Word spelling checking system |
| EP84307349A EP0145202B1 (en) | 1983-10-25 | 1984-10-25 | Word spelling checking system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58200259A JPS6091478A (ja) | 1983-10-25 | 1983-10-25 | 単語の綴り検査方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS6091478A true JPS6091478A (ja) | 1985-05-22 |
Family
ID=16421382
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58200259A Pending JPS6091478A (ja) | 1983-10-25 | 1983-10-25 | 単語の綴り検査方式 |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP0145202B1 (ja) |
| JP (1) | JPS6091478A (ja) |
| DE (1) | DE3473070D1 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4701851A (en) * | 1984-10-24 | 1987-10-20 | International Business Machines Corporation | Compound word spelling verification |
| JPS6389976A (ja) * | 1986-10-03 | 1988-04-20 | Ricoh Co Ltd | 言語解析装置 |
| US5357431A (en) * | 1992-01-27 | 1994-10-18 | Fujitsu Limited | Character string retrieval system using index and unit for making the index |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4829472A (en) * | 1986-10-20 | 1989-05-09 | Microlytics, Inc. | Spelling check module |
| NL9101285A (nl) * | 1991-07-23 | 1993-02-16 | Oce Nederland Bv | Inrichting en werkwijze voor het bepalen van gegevens van samengestelde woorden. |
| CN102298577A (zh) * | 2011-09-21 | 2011-12-28 | 深圳市万兴软件有限公司 | 一种文本编辑的拼写检测方法及其装置 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS54139355A (en) * | 1978-04-21 | 1979-10-29 | Agency Of Ind Science & Technol | Word separator |
| JPS57113187A (en) * | 1980-12-19 | 1982-07-14 | Ibm | Method of processing text |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4499553A (en) * | 1981-09-30 | 1985-02-12 | Dickinson Robert V | Locating digital coded words which are both acceptable misspellings and acceptable inflections of digital coded query words |
| US4597057A (en) * | 1981-12-31 | 1986-06-24 | System Development Corporation | System for compressed storage of 8-bit ASCII bytes using coded strings of 4 bit nibbles |
-
1983
- 1983-10-25 JP JP58200259A patent/JPS6091478A/ja active Pending
-
1984
- 1984-10-25 EP EP84307349A patent/EP0145202B1/en not_active Expired
- 1984-10-25 DE DE8484307349T patent/DE3473070D1/de not_active Expired
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS54139355A (en) * | 1978-04-21 | 1979-10-29 | Agency Of Ind Science & Technol | Word separator |
| JPS57113187A (en) * | 1980-12-19 | 1982-07-14 | Ibm | Method of processing text |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4701851A (en) * | 1984-10-24 | 1987-10-20 | International Business Machines Corporation | Compound word spelling verification |
| JPS6389976A (ja) * | 1986-10-03 | 1988-04-20 | Ricoh Co Ltd | 言語解析装置 |
| US5357431A (en) * | 1992-01-27 | 1994-10-18 | Fujitsu Limited | Character string retrieval system using index and unit for making the index |
Also Published As
| Publication number | Publication date |
|---|---|
| DE3473070D1 (en) | 1988-09-01 |
| EP0145202A2 (en) | 1985-06-19 |
| EP0145202A3 (en) | 1985-07-03 |
| EP0145202B1 (en) | 1988-07-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| James et al. | The reconstructive process in sentence memory | |
| GB1513831A (en) | Error handling apparatus | |
| Shimamura | Problems with the finding of stochastic independence as evidence for multiple memory systems | |
| JPS6091478A (ja) | 単語の綴り検査方式 | |
| CN104765635B (zh) | 一种核对apk内多国语言的方法及其系统 | |
| CN117724897A (zh) | 二进制日志文件的恢复方法、装置、设备及介质 | |
| CN109510904B (zh) | 呼叫中心外呼录音的检测方法及系统 | |
| JPH0244080B2 (ja) | ||
| CN121457412B (zh) | 一种针对连接性检查的自动化验证方法 | |
| BE1003613A6 (fr) | Procede pour produire et faire fonctionner des systemes de bases de donnees. | |
| Develin | Bouleutic Ostracism Again | |
| JPS6227834A (ja) | コンパイリングリスト出力方式 | |
| CN121396739A (zh) | 网络故障诊断方法、电子设备、存储介质及程序产品 | |
| JPS59128676A (ja) | 文字読取り装置 | |
| JPS58222376A (ja) | テ−ブルサ−チ方式 | |
| JPS61250735A (ja) | テーブル複写制御方法 | |
| CN119557926A (zh) | 数据校验方法、装置、设备、存储介质及程序产品 | |
| JPH05250211A (ja) | トレース情報出力方式 | |
| JPS59135523A (ja) | プログラマブルコントロ−ラ用のカセツトロ−ダにおける内容照合方式 | |
| FREDERICK | Cry Spy! True Stories of 20th Century Spies and Spy Catchers | |
| JPS63247844A (ja) | デ−タの部分的照合方式 | |
| Anderson | The Marston Manuscript of Juvenal | |
| JPS6326411B2 (ja) | ||
| JPS63313275A (ja) | 文章解析方式 | |
| JPH0658675B2 (ja) | 構文検査方式 |