JPH02264363A - 英単語検索装置 - Google Patents
英単語検索装置Info
- Publication number
- JPH02264363A JPH02264363A JP1085362A JP8536289A JPH02264363A JP H02264363 A JPH02264363 A JP H02264363A JP 1085362 A JP1085362 A JP 1085362A JP 8536289 A JP8536289 A JP 8536289A JP H02264363 A JPH02264363 A JP H02264363A
- Authority
- JP
- Japan
- Prior art keywords
- english
- search
- english word
- word
- symbol
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000007717 exclusion Effects 0.000 claims description 9
- 238000000034 method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
〔産業上の利用分野1
本発明は英単語検索装置における英単語入力時の柔軟性
をそれに対応する検索効率の向上に関する。
をそれに対応する検索効率の向上に関する。
従来の技術では、アルファベット以外の記号を含む英単
語入力があったら、正しい検索結果が出るとは限らなか
った。 (発明が解決しようとする課題1 英単語の中にはアルファベット以外の記号を含むものも
ある。たとえば、father−in−1aw等である
。この場合、ハイフンの認識が困難な場合は除外して認
識した方が有利であるが、たとえ認識できたとしても枝
素処理時に問題が残る。これは以下の理由による。 英単語検索においては、英和辞書中に入力した英単語が
ない場合がある。このとき検索装置としては、入力され
た英単語により近いものを検索結果として表示しなけれ
ばならない、そのため検索方法としては、入力された英
単語と英和辞書中の英単語が完全一致するかどうかを判
断する方法ではうまくいかないので、アルファベットの
前後関係を調べて、一番近いものを検索結果とする方法
がとられる。この場合、英単語がすべてアルファベット
類に並べられている必要があり、アルファベット以外の
記号が英単語中に存在するときは、この整合性は乱され
る。 本発明は前述のような問題点を解決するためになされた
もので、認識時にアルファベット以外の記号に出合った
らこれを認識せず、検索時に英和辞書中の英単語につい
てもアルファベット以外のコードは除外して検索するこ
とにより、アルファベット以外の記号を含む英単語入力
があっても正しい検索結果が得られることを目的として
いる。 1課題を解決するための手段】 本発明の検索装置は、フロッピーディスクやROMなど
の記憶装置に記憶されている英単語データを検索するた
めに、スキャナなどの画像入力装置から検索したい項目
として英単語を入力し、この英単語を認識手段により認
識する英単語検索装置において。 a)アルファベット以外の記号に出合ったら、これを認
識しない認識時特殊記号除外手段。 b)検索時に英和辞書中の英単語の中にアルファベット
以外のコードがあったらこれを除外する検索時弊文字コ
ード除外手段。 c)bによってアルファベットのみになった英単語につ
いて検索を行なう英単語検索手段を有することを特徴と
する。
語入力があったら、正しい検索結果が出るとは限らなか
った。 (発明が解決しようとする課題1 英単語の中にはアルファベット以外の記号を含むものも
ある。たとえば、father−in−1aw等である
。この場合、ハイフンの認識が困難な場合は除外して認
識した方が有利であるが、たとえ認識できたとしても枝
素処理時に問題が残る。これは以下の理由による。 英単語検索においては、英和辞書中に入力した英単語が
ない場合がある。このとき検索装置としては、入力され
た英単語により近いものを検索結果として表示しなけれ
ばならない、そのため検索方法としては、入力された英
単語と英和辞書中の英単語が完全一致するかどうかを判
断する方法ではうまくいかないので、アルファベットの
前後関係を調べて、一番近いものを検索結果とする方法
がとられる。この場合、英単語がすべてアルファベット
類に並べられている必要があり、アルファベット以外の
記号が英単語中に存在するときは、この整合性は乱され
る。 本発明は前述のような問題点を解決するためになされた
もので、認識時にアルファベット以外の記号に出合った
らこれを認識せず、検索時に英和辞書中の英単語につい
てもアルファベット以外のコードは除外して検索するこ
とにより、アルファベット以外の記号を含む英単語入力
があっても正しい検索結果が得られることを目的として
いる。 1課題を解決するための手段】 本発明の検索装置は、フロッピーディスクやROMなど
の記憶装置に記憶されている英単語データを検索するた
めに、スキャナなどの画像入力装置から検索したい項目
として英単語を入力し、この英単語を認識手段により認
識する英単語検索装置において。 a)アルファベット以外の記号に出合ったら、これを認
識しない認識時特殊記号除外手段。 b)検索時に英和辞書中の英単語の中にアルファベット
以外のコードがあったらこれを除外する検索時弊文字コ
ード除外手段。 c)bによってアルファベットのみになった英単語につ
いて検索を行なう英単語検索手段を有することを特徴と
する。
以下、この発明の一実施例を図を用いて説明する。なお
この実施例は、英単語入力によりその意味を表示する英
和辞書の場合を例にする。 第1図はこの発明の検索装置のブロック図である。(1
)はキーボードやスキャナなどの検索項目入力部である
。(2)は検索装置本体のcpuである。(3)はCR
Tや液晶デイスプレィなどの検索結果出力部である。(
4)は認識を行なうための認識プログラムROMである
。(5)’は検索を行なうための検索プログラムROM
である。 (6)は英単語の意味をデータとして持つ英和辞書であ
る。(A)はアルファベット以外の記号に出合ったら、
これを認識しない認識時特殊記号除外手段、(B)は検
索時に英和辞書中の英単語の中にアルファベット以外の
コードがあったらこれを除外する検索時弊文字コード除
外手段、(C)は(B)によってアルファベットのみに
なった英単語について検索を行う英単語検索手段である
。 第2図は、本発明の英単語検索装置における実際例を示
す図である。(7)は画像入力で。 (8)のfather−in−1awが入力され゛たと
き。 (A)の認識時特殊記号除外手段により(9)のfat
herinlawとなる0次に、(10)の英和辞書中
で、検索していき(11)のfather−in−1a
wのような非文字コードが見つかった場合は、(B)の
検索時弊文字コード除外手段によって(12)のfat
herinlawが作成される。この単語に対して(C
)の英単語検索手段を用いることによりfatheri
nlawが一致するので、(13)の検索結果表示によ
り(14)のように表示される。 第3図は検索時非文字コード除外のプログラムのフロー
チャートを示す図である。(15)は対象としている英
単語の先頭文字をセットする処理であり、(16)は、
対象としている英単語中に非文字コード存在に関わらず
1文字のみを他の領域にコピーするための、その領域に
おけるポインタを初期化する処理である。ここで言う他
の領域を以後コピー領域、ポインタをコピーポインタと
する。(17)では対象としている英単語のセットされ
た文字を読み込む処理であり、(18)でこれが文字コ
ードであるかどうかチエツクしている0文字コードなら
ば(19)の1文字書き込みによって、コピーポインタ
の示すコピー領域へ書き込まれる。その後(20)でコ
ピーポインタを更新する。(18)の結果文字コードで
ないならば、(21)の最終文字チエツクへ移る。ここ
では、現在セットされている文字が対象としている英単
語の最終文字であるかどうかチエツクしている。最終文
字ならばそのまま終了するが、最終文字でないならば、
(22)の次の文字セットを行ない(17)へ戻る。 〔発明の効果] 認識時にアルファベット以外の記号に出合ったらこれを
認識せず、検索時に英和辞書中の英単語についてもアル
ファベット以外のコードは除外して検索することにより
、アルファベット以外の記号を含む英単語入力があって
も正しい検索結果が得られることを可能にした。 第2図は本発明の英単語検索装置における実際例を示す
図である。 第3図は本発明の英単語検索装置の検索時非文字コード
除外プログラムのフローチャートを示す図である。 A・・・認識時特殊記号除外手段 B・・・検索時非文字コード除外手段 C・・・英単語検索手段 以上 出願人 セイコーエプソン株式会社 代理人 弁理士 鈴 木 喜三部(他1名)
この実施例は、英単語入力によりその意味を表示する英
和辞書の場合を例にする。 第1図はこの発明の検索装置のブロック図である。(1
)はキーボードやスキャナなどの検索項目入力部である
。(2)は検索装置本体のcpuである。(3)はCR
Tや液晶デイスプレィなどの検索結果出力部である。(
4)は認識を行なうための認識プログラムROMである
。(5)’は検索を行なうための検索プログラムROM
である。 (6)は英単語の意味をデータとして持つ英和辞書であ
る。(A)はアルファベット以外の記号に出合ったら、
これを認識しない認識時特殊記号除外手段、(B)は検
索時に英和辞書中の英単語の中にアルファベット以外の
コードがあったらこれを除外する検索時弊文字コード除
外手段、(C)は(B)によってアルファベットのみに
なった英単語について検索を行う英単語検索手段である
。 第2図は、本発明の英単語検索装置における実際例を示
す図である。(7)は画像入力で。 (8)のfather−in−1awが入力され゛たと
き。 (A)の認識時特殊記号除外手段により(9)のfat
herinlawとなる0次に、(10)の英和辞書中
で、検索していき(11)のfather−in−1a
wのような非文字コードが見つかった場合は、(B)の
検索時弊文字コード除外手段によって(12)のfat
herinlawが作成される。この単語に対して(C
)の英単語検索手段を用いることによりfatheri
nlawが一致するので、(13)の検索結果表示によ
り(14)のように表示される。 第3図は検索時非文字コード除外のプログラムのフロー
チャートを示す図である。(15)は対象としている英
単語の先頭文字をセットする処理であり、(16)は、
対象としている英単語中に非文字コード存在に関わらず
1文字のみを他の領域にコピーするための、その領域に
おけるポインタを初期化する処理である。ここで言う他
の領域を以後コピー領域、ポインタをコピーポインタと
する。(17)では対象としている英単語のセットされ
た文字を読み込む処理であり、(18)でこれが文字コ
ードであるかどうかチエツクしている0文字コードなら
ば(19)の1文字書き込みによって、コピーポインタ
の示すコピー領域へ書き込まれる。その後(20)でコ
ピーポインタを更新する。(18)の結果文字コードで
ないならば、(21)の最終文字チエツクへ移る。ここ
では、現在セットされている文字が対象としている英単
語の最終文字であるかどうかチエツクしている。最終文
字ならばそのまま終了するが、最終文字でないならば、
(22)の次の文字セットを行ない(17)へ戻る。 〔発明の効果] 認識時にアルファベット以外の記号に出合ったらこれを
認識せず、検索時に英和辞書中の英単語についてもアル
ファベット以外のコードは除外して検索することにより
、アルファベット以外の記号を含む英単語入力があって
も正しい検索結果が得られることを可能にした。 第2図は本発明の英単語検索装置における実際例を示す
図である。 第3図は本発明の英単語検索装置の検索時非文字コード
除外プログラムのフローチャートを示す図である。 A・・・認識時特殊記号除外手段 B・・・検索時非文字コード除外手段 C・・・英単語検索手段 以上 出願人 セイコーエプソン株式会社 代理人 弁理士 鈴 木 喜三部(他1名)
第1図は本発明の英単語検索装置のブロック図を示す図
である。 第1図
である。 第1図
Claims (1)
- 【特許請求の範囲】 1)フロッピーディスクやROMなどの記憶装置に記憶
されている英単語データを検索するために、スキャナな
どの画像入力装置から検索したい項目として英単語を入
力し、この英単語を認識手段により認識する英単語検索
装置において、a)アルファベット以外の記号に出合っ
たら、これを認識しない認識時特殊記号除外手段。 b)検索時に英和辞書中の英単語の中にアルファベット
以外のコードがあったらこれを除外する検索時非文字コ
ード除外手段。 c)bによってアルファベットのみになった英単語につ
いて検索を行なう英単語検索手段を有することを特徴と
する英単語検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1085362A JPH02264363A (ja) | 1989-04-04 | 1989-04-04 | 英単語検索装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1085362A JPH02264363A (ja) | 1989-04-04 | 1989-04-04 | 英単語検索装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH02264363A true JPH02264363A (ja) | 1990-10-29 |
Family
ID=13856603
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1085362A Pending JPH02264363A (ja) | 1989-04-04 | 1989-04-04 | 英単語検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH02264363A (ja) |
-
1989
- 1989-04-04 JP JP1085362A patent/JPH02264363A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5161245A (en) | Pattern recognition system having inter-pattern spacing correction | |
| JP3427692B2 (ja) | 文字認識方法および文字認識装置 | |
| US4991094A (en) | Method for language-independent text tokenization using a character categorization | |
| JPH0736882A (ja) | 辞書検索装置 | |
| KR100858545B1 (ko) | 핸드라이팅 인식용 장치 및 방법 | |
| EP0271664B1 (en) | A morphological/phonetic method for ranking word similarities | |
| JP2003331214A (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
| WO2015193879A1 (en) | Method and system for searching words in documents written in a source language as transcript of words in an origin language | |
| JPH02264363A (ja) | 英単語検索装置 | |
| JP3924899B2 (ja) | テキスト検索装置およびテキスト検索方法 | |
| JP2939945B2 (ja) | ローマ字住所認識装置 | |
| JPS62249269A (ja) | 文書処理装置 | |
| JP2005050175A (ja) | イメージデータ文書検索システム | |
| JPH02136970A (ja) | 英単語検索装置 | |
| Bandyopadhyay | Detection and correction of phonetic errors with a new orthographic dictionary | |
| JP2989387B2 (ja) | 入力文字処理装置における句点認識装置及び句点認識方法 | |
| JPH11120294A (ja) | 文字認識装置および媒体 | |
| JPH07110844A (ja) | 日本語文書処理装置 | |
| JPH03129568A (ja) | 文書処理装置 | |
| CN115310458A (zh) | 一种人名翻译方法、系统、设备及计算机可读存储介质 | |
| JPH03156589A (ja) | 誤読文字の検出,修正方法 | |
| JPH0752449B2 (ja) | 手書き入力辞書検索装置 | |
| JPS6356756A (ja) | コレクト機能付欧文作成装置 | |
| JPS6059487A (ja) | 手書文字認識装置 | |
| JPH03176786A (ja) | 手書き文字の認識装置 |