JPS6022227A - 欧文テキスト処理装置 - Google Patents

欧文テキスト処理装置

Info

Publication number
JPS6022227A
JPS6022227A JP58131455A JP13145583A JPS6022227A JP S6022227 A JPS6022227 A JP S6022227A JP 58131455 A JP58131455 A JP 58131455A JP 13145583 A JP13145583 A JP 13145583A JP S6022227 A JPS6022227 A JP S6022227A
Authority
JP
Japan
Prior art keywords
text
sentence
word
words
uppercase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58131455A
Other languages
English (en)
Inventor
Akira Sakurai
彰 桜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP58131455A priority Critical patent/JPS6022227A/ja
Publication of JPS6022227A publication Critical patent/JPS6022227A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔技術分野〕 本発明は、大文字または小文字のみから成る英文テキス
トなどを、大文字小文字混りのテキストに自動的に変換
する欧文テキスト処理装置に関する。
〔従来技術〕
文字認識装置において、文字単位で文字認識を行う場合
、0、P、Sなどの文字は大文字と小文字の識別が極め
て困難であり、誤認識する確率が高い。そこで従来は、
文字単位の認識の後処理に 。
おいて、文脈などを利用し誤認識文字の修正を行ってい
る。しかし、文字認識装置が高価になる割には、大文字
と小文字の認識エラーを十分減らすことができないとい
う問題があった。
もし、大文字または小文字のみから成る英文テキストな
どを、大文字小文字混りのテキストに自動的に変換する
手段が得られれば、文字を大文字または小文字のみとし
て認識するように文字認識装置を構成することができ、
装置価格を下げ得ると共に大文字と小文字の認識エラー
を減らせる可能性がある。また、英文テキストなどを伝
送するシステムにおいても、大文字または小文字のみか
ら成るテキストを送信し、受信側で大文字小文字混りテ
キストに変換できるから、伝送効率を改善できる可能性
がある。
〔目 的〕
本発明はこのような点に鑑みてなされたものであり、そ
の目的は、大文字または小文字のみがら成る英文テキス
トなどを大文字小文字混りテキストに自動的に変換する
欧文テキスト処理装置を提供することにある。
〔実施例〕
本発明の一実施例を第1図によって説明する。
文字認識装置、テレックス、コンピュータなどから小文
字(または大文字)のみから成るテキストが入力端子1
に入力される。単語抽出部2は入力テキストから単語を
抽出し、抽出した単語を小文字のコード列として出力す
る。抽出された単語は文字出力部3の単語メモリ4に格
納されるとともに、固有名詞検出部5に入力される。
6は固有名詞を格納した固有名詞テーブルである。固有
名詞検出部5は抽出された単語について固有名詞テーブ
ル6を検索することにより、入力テキスト中の固有名詞
の検出を行い、検出した場合に検出信号を出力する。7
は入力テキストからの文の始り(STX)を検出する文
始り検出部であり、文の始りを検出すると、検出信号を
出力する。8は入力テキストの終り(ピリオド、疑問符
、感嘆符など)を検出する交絡り検出部であり、検出す
ると検出信号を出力する。
上記固有名詞検出部5、文始り検出部7、交絡り検出部
8から出力される各検出信号はテキスト出力部3中の大
文字変換部9に入力される。この大文字変換部9は、単
語抽出部2によって抽出され単語メモリ4に格納された
単語のうち、固有名詞検出部5によって検出された固有
名詞、文始り検出部→によって文始りが検出された直後
に抽出された単語、あるいは交絡り検出部8によって交
絡りが検出された直後に抽出された単語の先頭文字のみ
を大文字に変換する。この変換後の単語が出力端10よ
りプリンタなどへ送出される。
変換例を第2図に示す。この図の(a)は入力テキスト
であり、これは(b)に示すような出力テキストに変換
される。すなわち文の先頭文字や、固有名詞の先頭文字
(第2図の円で囲んだ文字)は大文字に変換される。
本発明の他の実施例を第3図によって説明する。
この図において、1〜11は前記実施例の対応部と同一
であるので、その説明は省略し、それ以外の部分のみに
ついて以下説明する。
11はイタリック書体で印字すべき単語を登録したイタ
リック単語テーブルである。イタリック検出部12は、
出力端子10より送出される単語についてイタリック単
語テーブル11を検索し、イタリック書体で印刷すべき
単語の場合は検出信号をCGセレクタ13に与える。1
4はローマン体の文字パターンを発生するローマン体キ
ャラクタゼネレータ、15はイタリック体の文字パター
ンを発生するイタリック体キャラクタゼネレータである
。CGセレクタ13は、イタリック検出部12から検出
信号が与えられない時は、出力端子10より送出される
単語の各文字コードに対応するローマン体文字パターン
をローマン体キャラクタゼネレータ14によって発生さ
せ、それを印字バッファ16に出力するが、イタリック
検出部12より検出信号が与えられた時は、単語の各文
字コードに対応するイタリック体の文字パターンをイタ
リック体キャラクタゼネレータ15によって発生させ、
それを印字バッファ16に出力する。印字バッファ16
に得られた文字パターンデータは端子17よりプロッタ
などへ出力される。
このように本実施例によれば、特定の単語を異書体に変
換することができる。
〔効 果〕
前記各実施例に示したように、本発明によれば、大文字
または小文字のみから成る欧文テキストを大文字小文字
混りのテキストに自動的に変換することができる。従っ
て、本発明による欧文テキスト処理装置を、たとえば文
字認識装置の後処理装置として用いれば、大文字または
小文字のみ文字単位で認識するように文字認識装置を構
成することができ、安価でかつ大文字と小文字の認識エ
ラーを発生しない文字認識装置を実現できる。また、本
発明による欧文テキスト処理装置をデータ転送システム
の受信端末に設ければ、送信側端末では大文字または小
文字のみから成るテキストを転送すればよくなり、送信
端末を簡略化でき、また伝送効率を上げることができる
【図面の簡単な説明】
第1図は本発明の一実施例を示す概略ブロック図、第2
図は入力テキストと出力テキストの例を示す図、第3図
は本発明の他の実施例を示す概略ブロック図である。

Claims (1)

    【特許請求の範囲】
  1. (1)大文字または小文字のみから成る欧文の入力テキ
    ストを大文字小文字混りのテキストに変換する欧文テキ
    スト処理装置であって、入力テキストより単語を抽出す
    る単語抽出部と、入力テキストより文の始りを検出する
    文始り検出部と、入力テキストから文の終りを検出する
    文終り検出部と、固有名詞を格納した固有名詞テーブル
    と、上記単語抽出部により抽出された単語について上記
    固有名詞テーブルを検索することにより固有名詞を検出
    する固有名詞検出部と、上記単語抽出部によって抽出さ
    れた単語のうち、上記文始り検出部により文の始りが検
    出された直後に抽出された単語または上記文終り検出部
    で文の終りが検出さ九た直後に抽出された単語は、その
    先頭文字のみ大文字とし残りの文字を小文字として出力
    し、それ以外の単語は全文字を小文字として出力するテ
    キスト出力部とを有する欧文テキスト処理装置。
JP58131455A 1983-07-19 1983-07-19 欧文テキスト処理装置 Pending JPS6022227A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58131455A JPS6022227A (ja) 1983-07-19 1983-07-19 欧文テキスト処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58131455A JPS6022227A (ja) 1983-07-19 1983-07-19 欧文テキスト処理装置

Publications (1)

Publication Number Publication Date
JPS6022227A true JPS6022227A (ja) 1985-02-04

Family

ID=15058354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58131455A Pending JPS6022227A (ja) 1983-07-19 1983-07-19 欧文テキスト処理装置

Country Status (1)

Country Link
JP (1) JPS6022227A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0256671A (ja) * 1988-08-23 1990-02-26 Toshiba Corp 編集方法
JPH07271786A (ja) * 1994-10-20 1995-10-20 Casio Comput Co Ltd ワードプロセッサ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0256671A (ja) * 1988-08-23 1990-02-26 Toshiba Corp 編集方法
JPH07271786A (ja) * 1994-10-20 1995-10-20 Casio Comput Co Ltd ワードプロセッサ

Similar Documents

Publication Publication Date Title
EP0083420A2 (en) Full word coding for information processing
GB1595932A (en) Apparatus for forming hyphenated words
US4181972A (en) Means and methods for automatic hyphenating words
US4980855A (en) Information processing system with device for checking spelling of selected words extracted from mixed character data streams from electronic typewriter
JPS6022227A (ja) 欧文テキスト処理装置
JP2681663B2 (ja) 日本文訂正候補文字抽出方法
JPS6371767A (ja) 文書作成装置
KR960700473A (ko) 폰트 정보의 전송과 인출 방법(delivering and fetching font information)
JPH0575143B2 (ja)
JPS581821B2 (ja) 日本語デ−タ投入装置
Araki et al. An evaluation of a method to detect and correct erroneous characters in Japanese input through an OCR using Markov models
JPH0418038Y2 (ja)
JPH05225183A (ja) 日本文単語誤り自動検出装置
JPH09312574A (ja) 情報処理装置
JPS6315633B2 (ja)
JPS6095689A (ja) 光学的文字読取装置
JPH05244224A (ja) 電子メール装置
JPH0554145B2 (ja)
JPH05257582A (ja) 入力制御方式
JPS60134992A (ja) 文字入力装置
JPH0317845U (ja)
JPS61121159A (ja) 文字入力装置
GB2220773A (en) Apparatus for preparing dictionary data for personal dictionary
JPS58101378A (ja) 手書文書読取方法
JPS60144886A (ja) 文字認識装置における後処理方式