JPH09284446A - 情報処理装置およびデジタル複写機および情報記憶媒体 - Google Patents
情報処理装置およびデジタル複写機および情報記憶媒体Info
- Publication number
- JPH09284446A JPH09284446A JP8096356A JP9635696A JPH09284446A JP H09284446 A JPH09284446 A JP H09284446A JP 8096356 A JP8096356 A JP 8096356A JP 9635696 A JP9635696 A JP 9635696A JP H09284446 A JPH09284446 A JP H09284446A
- Authority
- JP
- Japan
- Prior art keywords
- information
- character information
- character
- word
- phrase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Editing Of Facsimile Originals (AREA)
- Accessory Devices And Overall Control Thereof (AREA)
- Dot-Matrix Printers And Others (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Facsimiles In General (AREA)
Abstract
(57)【要約】
【課題】 文章情報の特定の語句に文字情報を付与する
場合に、文章情報のレイアウトを損なうことなく多量の
文字情報を付与できるようにする。 【解決手段】 文字情報を付与する範囲を隣接する文字
情報と重複しない位置まで拡大する範囲拡大手段16を
設け、文章情報の行間を拡大しなくとも多量の文字情報
を付与できるようにした。
場合に、文章情報のレイアウトを損なうことなく多量の
文字情報を付与できるようにする。 【解決手段】 文字情報を付与する範囲を隣接する文字
情報と重複しない位置まで拡大する範囲拡大手段16を
設け、文章情報の行間を拡大しなくとも多量の文字情報
を付与できるようにした。
Description
【0001】
【発明の属する技術分野】本発明は、原本の文章情報の
語句に文字情報を並列に付与する情報処理装置およびデ
ジタル複写機および情報記憶媒体に関する。
語句に文字情報を並列に付与する情報処理装置およびデ
ジタル複写機および情報記憶媒体に関する。
【0002】
【従来の技術】現在、高機能なデジタル複写機には、英
語の読取原稿を複写する際、その単語に日本語の訳語を
付与できる製品があり、例えば、特開平4−77965号公報
等に記載されている。このようなデジタル複写機では、
単語の真下に日本語の訳語が並列に印刷されるので、文
章の大意を簡単に認識することができ、手作業で単語の
意味を調べる手間が軽減される。特に、一般的に意味が
自明な簡単な単語には訳語は付与されないので、紙面が
煩雑になることもなく英語と日本語との語句の対応関係
も明瞭である。
語の読取原稿を複写する際、その単語に日本語の訳語を
付与できる製品があり、例えば、特開平4−77965号公報
等に記載されている。このようなデジタル複写機では、
単語の真下に日本語の訳語が並列に印刷されるので、文
章の大意を簡単に認識することができ、手作業で単語の
意味を調べる手間が軽減される。特に、一般的に意味が
自明な簡単な単語には訳語は付与されないので、紙面が
煩雑になることもなく英語と日本語との語句の対応関係
も明瞭である。
【0003】
【発明が解決しようとする課題】上述のようなデジタル
複写機は、読取原稿を複写するだけで英語の文章の単語
に日本語の訳語を付与できるので、英語の文章を日本語
に翻訳する作業を良好に支援することができる。
複写機は、読取原稿を複写するだけで英語の文章の単語
に日本語の訳語を付与できるので、英語の文章を日本語
に翻訳する作業を良好に支援することができる。
【0004】しかし、上述のようなデジタル複写機で
は、英語の単語の真下に日本語の訳語を付与するため、
長い訳語や複数の訳語を付与することが困難であり、文
字情報を充分に提供することが困難である。
は、英語の単語の真下に日本語の訳語を付与するため、
長い訳語や複数の訳語を付与することが困難であり、文
字情報を充分に提供することが困難である。
【0005】このような課題を解決するため、例えば、
付与する文字情報を複数行に表記することも想定できる
が、これは原本の行間が充分に広い場合しか実現できな
い。この行間を付与する文字情報の行数に対応して拡大
することも想定できるが、これでは原本の文章のイメー
ジを損なうので好ましくない。
付与する文字情報を複数行に表記することも想定できる
が、これは原本の行間が充分に広い場合しか実現できな
い。この行間を付与する文字情報の行数に対応して拡大
することも想定できるが、これでは原本の文章のイメー
ジを損なうので好ましくない。
【0006】
【課題を解決するための手段】請求項1記載の発明の情
報処理装置は、所定のレイアウトで形成された原本の文
章情報から語句を抽出し、この語句を認識して対応する
文字情報を発生させる情報発生手段と、文字情報を原本
の文章情報の対応する一部の語句と並列な位置に付与す
る情報付与手段と、文字情報を付与する範囲を隣接する
文字情報と重複しない位置まで拡大する範囲拡大手段と
を有する。従って、所定のレイアウトで形成された原本
の文章情報から情報発生手段が語句を抽出して対応する
文字情報を発生させ、この文字情報を情報付与手段が原
本の文章情報の対応する一部の語句に並列に付与する。
このとき、文字情報の付与の範囲が隣接の文字情報と重
複しない位置まで拡大されるので、原本の語句より長い
文字情報でも、その前後に空白が存在すれば、この部分
を利用して付与される。なお、本発明で云う語句は、単
語、熟語、複合語、慣用表現、等を意味する。
報処理装置は、所定のレイアウトで形成された原本の文
章情報から語句を抽出し、この語句を認識して対応する
文字情報を発生させる情報発生手段と、文字情報を原本
の文章情報の対応する一部の語句と並列な位置に付与す
る情報付与手段と、文字情報を付与する範囲を隣接する
文字情報と重複しない位置まで拡大する範囲拡大手段と
を有する。従って、所定のレイアウトで形成された原本
の文章情報から情報発生手段が語句を抽出して対応する
文字情報を発生させ、この文字情報を情報付与手段が原
本の文章情報の対応する一部の語句に並列に付与する。
このとき、文字情報の付与の範囲が隣接の文字情報と重
複しない位置まで拡大されるので、原本の語句より長い
文字情報でも、その前後に空白が存在すれば、この部分
を利用して付与される。なお、本発明で云う語句は、単
語、熟語、複合語、慣用表現、等を意味する。
【0007】請求項2記載の発明の情報処理装置では、
請求項1記載の発明において、範囲拡大手段は、原本の
語句と付与する文字情報との中心位置か先頭位置か末尾
位置かを一致させる。従って、文字情報が原本の語句に
対して明確な位置に配置される。
請求項1記載の発明において、範囲拡大手段は、原本の
語句と付与する文字情報との中心位置か先頭位置か末尾
位置かを一致させる。従って、文字情報が原本の語句に
対して明確な位置に配置される。
【0008】請求項3記載の発明の情報処理装置では、
請求項2記載の発明において、範囲拡大手段は、隣接す
る文字情報の範囲を一定の間隔以上に離反させる。従っ
て、隣接する文字情報が連続せず、各々が明確に識別さ
れる。
請求項2記載の発明において、範囲拡大手段は、隣接す
る文字情報の範囲を一定の間隔以上に離反させる。従っ
て、隣接する文字情報が連続せず、各々が明確に識別さ
れる。
【0009】請求項4記載の発明の情報処理装置では、
請求項1記載の発明において、情報付与手段は、文字情
報を付与する語句に指標も付与する。従って、文字情報
が付与される語句に指標も付与され、この語句が明確に
識別される。
請求項1記載の発明において、情報付与手段は、文字情
報を付与する語句に指標も付与する。従って、文字情報
が付与される語句に指標も付与され、この語句が明確に
識別される。
【0010】請求項5記載の発明の情報処理装置では、
請求項1記載の発明において、情報発生手段は、各種の
文字情報が語句に対応して格納された情報対応辞書と、
この情報対応辞書から語句に対応して文字情報を検索す
る情報検索手段とを有し、この情報検索手段は、一つの
語句に対応する複数の文字情報を所定の順位で出力す
る。従って、一つの語句に対して複数の文字情報が所定
の順位で出力されるので、複数の文字情報が一つの長い
文字情報として一つの語句の拡大された範囲に付与され
る。
請求項1記載の発明において、情報発生手段は、各種の
文字情報が語句に対応して格納された情報対応辞書と、
この情報対応辞書から語句に対応して文字情報を検索す
る情報検索手段とを有し、この情報検索手段は、一つの
語句に対応する複数の文字情報を所定の順位で出力す
る。従って、一つの語句に対して複数の文字情報が所定
の順位で出力されるので、複数の文字情報が一つの長い
文字情報として一つの語句の拡大された範囲に付与され
る。
【0011】請求項6記載の発明の情報処理装置では、
請求項5記載の発明において、情報対応辞書は、一つの
語句に対応する複数の文字情報が階層構造に格納されて
おり、情報検索手段は、文字情報を階層構造に対応した
順位で出力する。従って、一つの語句に複数の文字情報
が対応していても、この複数の文字情報は階層構造に対
応して一つの語句に付与される。
請求項5記載の発明において、情報対応辞書は、一つの
語句に対応する複数の文字情報が階層構造に格納されて
おり、情報検索手段は、文字情報を階層構造に対応した
順位で出力する。従って、一つの語句に複数の文字情報
が対応していても、この複数の文字情報は階層構造に対
応して一つの語句に付与される。
【0012】請求項7記載の発明の情報処理装置では、
請求項5記載の発明において、情報対応辞書は、一つの
語句に対応する複数の文字情報が文法情報とともに格納
されており、情報検索手段は、文字情報を文法情報に対
応した順位で出力する。従って、一つの語句に複数の文
字情報が対応していても、この複数の文字情報は文法情
報に対応して一つの語句に付与される。
請求項5記載の発明において、情報対応辞書は、一つの
語句に対応する複数の文字情報が文法情報とともに格納
されており、情報検索手段は、文字情報を文法情報に対
応した順位で出力する。従って、一つの語句に複数の文
字情報が対応していても、この複数の文字情報は文法情
報に対応して一つの語句に付与される。
【0013】請求項8記載の発明の情報処理装置では、
請求項4,5または6記載の発明において、情報付与手
段は、一つの語句に対応する複数の文字情報を出力され
る順位で付与の範囲に対応して制限する。従って、一つ
の語句に対応する文字情報が複数の場合でも、これが出
力される順位で付与の範囲に対応して制限されるので、
原本の語句の拡大された範囲に複数の文字情報が適正に
制限されて付与される。
請求項4,5または6記載の発明において、情報付与手
段は、一つの語句に対応する複数の文字情報を出力され
る順位で付与の範囲に対応して制限する。従って、一つ
の語句に対応する文字情報が複数の場合でも、これが出
力される順位で付与の範囲に対応して制限されるので、
原本の語句の拡大された範囲に複数の文字情報が適正に
制限されて付与される。
【0014】請求項9記載の発明のデジタル複写機で
は、読取原稿から原本の文章情報を読取走査するイメー
ジスキャナと、文章情報のイメージの各部の位置を識別
する位置識別装置と、各部の位置に基づいて文章情報を
文字認識する文字認識装置と、請求項1,2,3,4,
5,6,7または8記載の情報処理装置と、文字情報が
対応する語句に付与された文章情報を印刷出力するプリ
ンタ装置とを有する。従って、イメージスキャナにより
原本の文章情報の読取原稿を読取走査すると、この文章
情報のイメージの各部の位置を位置識別装置が識別し、
この各部の位置に基づいて文字認識装置が文章情報を文
字認識する。この文字認識された原本の文章情報の特定
の語句に情報処理装置が文字情報を付与するので、この
文字情報が特定の語句に付与された原本の文章情報をプ
リンタ装置が印刷出力する。その場合、文字情報の付与
の範囲が隣接の文字情報と重複しない位置まで拡大され
るので、原本の語句より長い文字情報でも空白の部分を
利用して付与される。
は、読取原稿から原本の文章情報を読取走査するイメー
ジスキャナと、文章情報のイメージの各部の位置を識別
する位置識別装置と、各部の位置に基づいて文章情報を
文字認識する文字認識装置と、請求項1,2,3,4,
5,6,7または8記載の情報処理装置と、文字情報が
対応する語句に付与された文章情報を印刷出力するプリ
ンタ装置とを有する。従って、イメージスキャナにより
原本の文章情報の読取原稿を読取走査すると、この文章
情報のイメージの各部の位置を位置識別装置が識別し、
この各部の位置に基づいて文字認識装置が文章情報を文
字認識する。この文字認識された原本の文章情報の特定
の語句に情報処理装置が文字情報を付与するので、この
文字情報が特定の語句に付与された原本の文章情報をプ
リンタ装置が印刷出力する。その場合、文字情報の付与
の範囲が隣接の文字情報と重複しない位置まで拡大され
るので、原本の語句より長い文字情報でも空白の部分を
利用して付与される。
【0015】請求項10記載の発明の情報記憶媒体で
は、マイクロコンピュータを動作させるソフトウェアが
書き込まれた情報記憶媒体において、請求項1,2,
3,4,5,6,7または8記載の情報処理装置の各種
機能がソフトウェアとして書き込まれている。従って、
このような情報記憶媒体のソフトウェアにより動作する
マイクロコンピュータは、所定のレイアウトで形成され
た原本の文章情報から語句を抽出して対応する文字情報
を発生させ、この文字情報を原本の文章情報の対応する
一部の語句に並列に付与する。このとき、文字情報の付
与の範囲が隣接の文字情報と重複しない位置まで拡大さ
れるので、原本の語句より長い文字情報でも空白の部分
を利用して付与される。
は、マイクロコンピュータを動作させるソフトウェアが
書き込まれた情報記憶媒体において、請求項1,2,
3,4,5,6,7または8記載の情報処理装置の各種
機能がソフトウェアとして書き込まれている。従って、
このような情報記憶媒体のソフトウェアにより動作する
マイクロコンピュータは、所定のレイアウトで形成され
た原本の文章情報から語句を抽出して対応する文字情報
を発生させ、この文字情報を原本の文章情報の対応する
一部の語句に並列に付与する。このとき、文字情報の付
与の範囲が隣接の文字情報と重複しない位置まで拡大さ
れるので、原本の語句より長い文字情報でも空白の部分
を利用して付与される。
【0016】
【発明の実施の形態】本発明の実施の一形態を図面に基
づいて以下に説明する。まず、本実施の形態では、図1
に示すように、本発明の情報処理装置が翻訳支援装置1
として設けられており、図2に示すように、この翻訳支
援装置1が全体的にも情報処理装置であるデジタル複写
機2の一部として設けられている。
づいて以下に説明する。まず、本実施の形態では、図1
に示すように、本発明の情報処理装置が翻訳支援装置1
として設けられており、図2に示すように、この翻訳支
援装置1が全体的にも情報処理装置であるデジタル複写
機2の一部として設けられている。
【0017】このデジタル複写機2は、図2および図3
に示すように、イメージスキャナであるスキャナユニッ
ト3とプリンタ装置であるプリンタユニット4とを有し
ており、これらのユニット3,4は、バスライン5によ
りマイクロコンピュータ6に接続されている。このマイ
クロコンピュータ6には、操作パネル7が直結されてお
り、前記バスライン5には、翻訳支援装置1、位置識別
装置8、OCR(Optical Character Reader)9、I/F
(Interface)10、等も接続されている。
に示すように、イメージスキャナであるスキャナユニッ
ト3とプリンタ装置であるプリンタユニット4とを有し
ており、これらのユニット3,4は、バスライン5によ
りマイクロコンピュータ6に接続されている。このマイ
クロコンピュータ6には、操作パネル7が直結されてお
り、前記バスライン5には、翻訳支援装置1、位置識別
装置8、OCR(Optical Character Reader)9、I/F
(Interface)10、等も接続されている。
【0018】前記操作パネル7は、手動操作に対応して
各種指令を前記マイクロコンピュータ6に入力し、この
マイクロコンピュータ6は、入力指令に対応して情報処
理により各部の動作を制御する。前記スキャナユニット
3は、所定レイアウトの読取原稿から文章情報を読取走
査し、前記プリンタユニット4は、読取走査された文章
情報を印刷出力する。前記位置識別装置8は、文章情報
のイメージの各部の位置を識別し、前記OCR9は、識
別された位置に基づいて文章情報を文字認識する。前記
I/F10は、例えば、セントロニクス規格に準拠して
形成されており、ホストコンピュータ等の外部機器と各
種のデータ通信を実行する。
各種指令を前記マイクロコンピュータ6に入力し、この
マイクロコンピュータ6は、入力指令に対応して情報処
理により各部の動作を制御する。前記スキャナユニット
3は、所定レイアウトの読取原稿から文章情報を読取走
査し、前記プリンタユニット4は、読取走査された文章
情報を印刷出力する。前記位置識別装置8は、文章情報
のイメージの各部の位置を識別し、前記OCR9は、識
別された位置に基づいて文章情報を文字認識する。前記
I/F10は、例えば、セントロニクス規格に準拠して
形成されており、ホストコンピュータ等の外部機器と各
種のデータ通信を実行する。
【0019】翻訳支援装置1は、図1に示すように、情
報入力装置11、文章記憶装置12、語句抽出装置1
3、情報検索手段に相当する辞書検索装置14、情報対
応辞書15、範囲拡大手段に相当する範囲制御装置1
6、出力確認装置17、情報付与手段に相当する出力制
御装置18、情報出力装置19、を有している。
報入力装置11、文章記憶装置12、語句抽出装置1
3、情報検索手段に相当する辞書検索装置14、情報対
応辞書15、範囲拡大手段に相当する範囲制御装置1
6、出力確認装置17、情報付与手段に相当する出力制
御装置18、情報出力装置19、を有している。
【0020】前記情報入力装置11は、前記バスライン
5と前記文章記憶装置12とに接続されており、前記ス
キャナユニット3により読取原稿から読取走査されて前
記OCR9により文字認識された英語の原本の文章情報
が入力される。前記文章記憶装置12は、文章情報を一
時記憶するメモリを有しており、前記語句抽出装置13
は、一時記憶された文章情報から英語の単語や熟語を語
句として抽出する。前記情報対応辞書15は、英語の語
句に対応して日本語の文字情報が格納されており、前記
辞書検索装置14は、二分探索法やハッシュ法により、
原本の文章情報から抽出された英語の語句に対応して日
本語の文字情報を検索する。
5と前記文章記憶装置12とに接続されており、前記ス
キャナユニット3により読取原稿から読取走査されて前
記OCR9により文字認識された英語の原本の文章情報
が入力される。前記文章記憶装置12は、文章情報を一
時記憶するメモリを有しており、前記語句抽出装置13
は、一時記憶された文章情報から英語の単語や熟語を語
句として抽出する。前記情報対応辞書15は、英語の語
句に対応して日本語の文字情報が格納されており、前記
辞書検索装置14は、二分探索法やハッシュ法により、
原本の文章情報から抽出された英語の語句に対応して日
本語の文字情報を検索する。
【0021】つまり、前記情報入力装置11により入力
されて前記文章記憶装置12により一時記憶された原本
の英語の文章情報から、前記語句抽出装置13により特
定の語句が抽出されて対応する文字情報が前記辞書検索
装置14により前記情報対応辞書15により検索される
ので、ここに情報発生手段に相当する情報発生部20が
形成されている。
されて前記文章記憶装置12により一時記憶された原本
の英語の文章情報から、前記語句抽出装置13により特
定の語句が抽出されて対応する文字情報が前記辞書検索
装置14により前記情報対応辞書15により検索される
ので、ここに情報発生手段に相当する情報発生部20が
形成されている。
【0022】前記範囲制御装置16は、日本語の文字情
報を付与する範囲が、対応する原本の英語の語句の範囲
より大きくとも、隣接する文字情報と重複しない位置ま
で拡大する。このように英語の語句に付与される日本語
の文字情報の範囲が変化するので、ここでは原本の語句
と中心が一致するよう文字情報の位置が調整される。
報を付与する範囲が、対応する原本の英語の語句の範囲
より大きくとも、隣接する文字情報と重複しない位置ま
で拡大する。このように英語の語句に付与される日本語
の文字情報の範囲が変化するので、ここでは原本の語句
と中心が一致するよう文字情報の位置が調整される。
【0023】前記出力確認装置17は、隣接する文字情
報が重複しないこと等を確認し、前記出力制御装置18
は、日本語の文字情報を原本の英語の文章情報の対応す
る一部の語句に並列に付与する。前記情報出力装置19
は、日本語の文字情報が付与された英語の文章情報を前
記バスライン5に出力するので、この文章情報は印刷イ
メージとして前記プリンタユニット4に転送される。
報が重複しないこと等を確認し、前記出力制御装置18
は、日本語の文字情報を原本の英語の文章情報の対応す
る一部の語句に並列に付与する。前記情報出力装置19
は、日本語の文字情報が付与された英語の文章情報を前
記バスライン5に出力するので、この文章情報は印刷イ
メージとして前記プリンタユニット4に転送される。
【0024】このような構成において、本実施の形態の
デジタル複写機2は、従来の複写機と同様に読取原稿の
画像を複写する他、各種の動作モードに対応して各種の
情報処理も実行する。例えば、操作パネル7の手動操作
により動作モードとして通常複写モードがマイクロコン
ピュータ6に設定された場合は、スキャナユニット3に
より原本の読取原稿から所定レイアウトの文章情報を読
取走査し、この文章情報をプリンタユニット4により印
刷出力する。
デジタル複写機2は、従来の複写機と同様に読取原稿の
画像を複写する他、各種の動作モードに対応して各種の
情報処理も実行する。例えば、操作パネル7の手動操作
により動作モードとして通常複写モードがマイクロコン
ピュータ6に設定された場合は、スキャナユニット3に
より原本の読取原稿から所定レイアウトの文章情報を読
取走査し、この文章情報をプリンタユニット4により印
刷出力する。
【0025】しかし、動作モードとして単語翻訳モード
が設定された場合は、スキャナユニット3により読取原
稿から読取走査された英語の原本の文章情報をOCR9
により文字認識し、この文字認識された文章情報の特定
の語句に翻訳支援装置1により日本語の文字情報を並列
に付与し、この日本語の文字情報が特定の語句に付与さ
れた英語の文章情報をプリンタユニット4により印刷出
力する。
が設定された場合は、スキャナユニット3により読取原
稿から読取走査された英語の原本の文章情報をOCR9
により文字認識し、この文字認識された文章情報の特定
の語句に翻訳支援装置1により日本語の文字情報を並列
に付与し、この日本語の文字情報が特定の語句に付与さ
れた英語の文章情報をプリンタユニット4により印刷出
力する。
【0026】このようなデジタル複写機2の単語翻訳モ
ードの処理動作を、図6ないし図8を参考に以下に順次
詳述する。なお、ここでは図6が処理全体のメインルー
チン、図7は図6のステップS11のサブルーチン、図
8は図7のステップT3のサブルーチンである。
ードの処理動作を、図6ないし図8を参考に以下に順次
詳述する。なお、ここでは図6が処理全体のメインルー
チン、図7は図6のステップS11のサブルーチン、図
8は図7のステップT3のサブルーチンである。
【0027】まず、図6に示すように、スキャナユニッ
ト3が原本の読取原稿から英語の文章情報を読取走査す
ると(ステップS1)、この文章情報はドットマトリク
スのイメージ情報であるので、図4に示すように、位置
識別装置8は、この文章情報の各部の位置をxy座標の
数値として検出する(ステップS2)。その場合、最初
に文章が連続するゾーンが矩形に認識され、その左上と
右下との頂点のxy座標が検出されて管理され、同様
に、上述のゾーンにおける各行の範囲も矩形に認識され
て左上と右下との頂点のxy座標により管理される。
ト3が原本の読取原稿から英語の文章情報を読取走査す
ると(ステップS1)、この文章情報はドットマトリク
スのイメージ情報であるので、図4に示すように、位置
識別装置8は、この文章情報の各部の位置をxy座標の
数値として検出する(ステップS2)。その場合、最初
に文章が連続するゾーンが矩形に認識され、その左上と
右下との頂点のxy座標が検出されて管理され、同様
に、上述のゾーンにおける各行の範囲も矩形に認識され
て左上と右下との頂点のxy座標により管理される。
【0028】このように識別された各行は複数の語句が
連続する文字列からなるので、この文章情報の各行の文
字をOCR9が認識する(ステップS3)。この文字認
識により、上述のように位置検出されたゾーンや行が文
字列であることが確認されると、一面におけるゾーンの
個数と、一ゾーンにおける行数とがカウントされる(ス
テップS4)。なお、OCR9は文字間のスペースやコ
ンマ等も認識するので、これらで文字列を分割すること
により単語を判別する(ステップS5)。このように各
行において単語が判別されると、下記の表1に示すよう
に、この単語の先頭位置と末尾位置も各行におけるx座
標として管理される。
連続する文字列からなるので、この文章情報の各行の文
字をOCR9が認識する(ステップS3)。この文字認
識により、上述のように位置検出されたゾーンや行が文
字列であることが確認されると、一面におけるゾーンの
個数と、一ゾーンにおける行数とがカウントされる(ス
テップS4)。なお、OCR9は文字間のスペースやコ
ンマ等も認識するので、これらで文字列を分割すること
により単語を判別する(ステップS5)。このように各
行において単語が判別されると、下記の表1に示すよう
に、この単語の先頭位置と末尾位置も各行におけるx座
標として管理される。
【0029】
【表1】
【0030】このように文章情報の単語の文字が位置と
ともに認識されると、これらの情報とともに文章情報は
翻訳支援装置1の情報入力装置11に入力され、文章記
憶装置12により一時記憶される。そして、この文章情
報から語句抽出装置13が単語や熟語を語句として抽出
するので、下記の表2に示すように、この語句に対応す
る日本語の情報が辞書検索装置14により情報対応辞書
15から検索される(ステップS6)。
ともに認識されると、これらの情報とともに文章情報は
翻訳支援装置1の情報入力装置11に入力され、文章記
憶装置12により一時記憶される。そして、この文章情
報から語句抽出装置13が単語や熟語を語句として抽出
するので、下記の表2に示すように、この語句に対応す
る日本語の情報が辞書検索装置14により情報対応辞書
15から検索される(ステップS6)。
【0031】この場合、情報対応辞書15には、英語の
語句が検索キーとしてアルファベットの順番で格納され
ており、この語句の各々に少なくとも一つの日本語の訳
語が文字情報として登録されている。この文字情報は代
表的なものから順番に格納されており、ここでは品詞情
報や難度情報も付与されている。この難度情報は英語の
語句の難度を意味しており、ここでは日本語の文字情報
の付与要否の判断基準として設定されている。また、上
述の“Ann”等のように、情報対応辞書15に格納さ
れていない語句は未知語と判定され、日本語の文字情報
の付与対象とならない。
語句が検索キーとしてアルファベットの順番で格納され
ており、この語句の各々に少なくとも一つの日本語の訳
語が文字情報として登録されている。この文字情報は代
表的なものから順番に格納されており、ここでは品詞情
報や難度情報も付与されている。この難度情報は英語の
語句の難度を意味しており、ここでは日本語の文字情報
の付与要否の判断基準として設定されている。また、上
述の“Ann”等のように、情報対応辞書15に格納さ
れていない語句は未知語と判定され、日本語の文字情報
の付与対象とならない。
【0032】
【表2】
【0033】このように原本の文章情報の英語の語句に
対応して日本語の文字情報が検索されると、ここでは難
度情報が“1”以上の語句が文字情報の付与対象として
選択されるので、例えば、第一ゾーンの二行からは“ce
rtainly,wife,fickle,married”の四語が選択される
(ステップS7)。このように日本語の文字情報を付与
する英語の語句が文章情報から選択されると、原本の文
章情報の各行において、文字情報を付与する語句の個数
がカウントされ、これが各行の語句数として設定され
る。これらの語句に付与できる訳語の個数が情報対応辞
書15から検出されてカウントされ、これが各語句の訳
語数として設定される(ステップS8)。
対応して日本語の文字情報が検索されると、ここでは難
度情報が“1”以上の語句が文字情報の付与対象として
選択されるので、例えば、第一ゾーンの二行からは“ce
rtainly,wife,fickle,married”の四語が選択される
(ステップS7)。このように日本語の文字情報を付与
する英語の語句が文章情報から選択されると、原本の文
章情報の各行において、文字情報を付与する語句の個数
がカウントされ、これが各行の語句数として設定され
る。これらの語句に付与できる訳語の個数が情報対応辞
書15から検出されてカウントされ、これが各語句の訳
語数として設定される(ステップS8)。
【0034】つぎに、語句に文字情報を付与するために
範囲を調整する作業が、範囲制御装置16により一面の
全部のゾーンで順番に実行される(ステップS9〜S1
2)。より詳細には、原本の文章情報の各行において、
文字情報を付与する語句の個数がカウントされ、これが
各行の語句数として設定される。これらの語句に付与で
きる訳語の個数が情報対応辞書15から検出されてカウ
ントされ、これが各語句の訳語数として設定される(ス
テップS8)。つぎに、一面のゾーンの個数を示すゾー
ン番号が“0”に初期化されてから(ステップS9)、
これに“1”が加算され(ステップS10)、このゾー
ン番号のゾーンにおいて語句に文字情報を付与する処理
が実行される(ステップS11)。この処理が完了する
と、ゾーン番号とゾーン数とが比較され(ステップS1
2)、ゾーン番号がゾーン数に一致するまで上述のよう
な処理が繰り返される(ステップS10〜S12)。
範囲を調整する作業が、範囲制御装置16により一面の
全部のゾーンで順番に実行される(ステップS9〜S1
2)。より詳細には、原本の文章情報の各行において、
文字情報を付与する語句の個数がカウントされ、これが
各行の語句数として設定される。これらの語句に付与で
きる訳語の個数が情報対応辞書15から検出されてカウ
ントされ、これが各語句の訳語数として設定される(ス
テップS8)。つぎに、一面のゾーンの個数を示すゾー
ン番号が“0”に初期化されてから(ステップS9)、
これに“1”が加算され(ステップS10)、このゾー
ン番号のゾーンにおいて語句に文字情報を付与する処理
が実行される(ステップS11)。この処理が完了する
と、ゾーン番号とゾーン数とが比較され(ステップS1
2)、ゾーン番号がゾーン数に一致するまで上述のよう
な処理が繰り返される(ステップS10〜S12)。
【0035】上述のようにゾーン番号のゾーンにおいて
語句に文字情報を付与する場合(ステップS11)、図
7に示すように、各ゾーンでは各行毎に処理が実行され
るので、そのゾーンの第一行から最終行まで一行毎に処
理が繰り返される(ステップT1〜T4)。このように
処理を実行する一行において語句に文字情報を付与する
場合(ステップT3)、図8に示すように、各行毎に語
句の各々に複数の訳語が文字情報として順番に追加され
(ステップE3)、この順次拡大される文字情報の中心
位置が語句の中心位置に一致され(ステップE6)、こ
の文字情報の付与の範囲が適正であることが出力確認装
置17により確認される(ステップE8〜E11)。
語句に文字情報を付与する場合(ステップS11)、図
7に示すように、各ゾーンでは各行毎に処理が実行され
るので、そのゾーンの第一行から最終行まで一行毎に処
理が繰り返される(ステップT1〜T4)。このように
処理を実行する一行において語句に文字情報を付与する
場合(ステップT3)、図8に示すように、各行毎に語
句の各々に複数の訳語が文字情報として順番に追加され
(ステップE3)、この順次拡大される文字情報の中心
位置が語句の中心位置に一致され(ステップE6)、こ
の文字情報の付与の範囲が適正であることが出力確認装
置17により確認される(ステップE8〜E11)。
【0036】より詳細には、ここでは文字情報のフォン
トが固定的に設定されているので、文字情報の長さが文
字の個数と横幅との乗算により算出される。語句の中心
位置は先頭位置と末尾位置とのx座標の平均値として算
出され、この語句の中心位置から文字情報の半分の長さ
を減算した数値が先頭位置、加算した数値が末尾位置と
して算出される(ステップE7)。
トが固定的に設定されているので、文字情報の長さが文
字の個数と横幅との乗算により算出される。語句の中心
位置は先頭位置と末尾位置とのx座標の平均値として算
出され、この語句の中心位置から文字情報の半分の長さ
を減算した数値が先頭位置、加算した数値が末尾位置と
して算出される(ステップE7)。
【0037】最初に一行の語句の各々に一つの訳語が文
字情報として付与され、文字情報の先頭位置の数値が行
頭位置の数値より大きいことにより、文字情報が文章の
行頭から突出しないことが確認される(ステップE
8)。同様に、文字情報の末尾位置の数値が行末位置の
数値より小さいことにより、文字情報が文章の行末から
突出しないことが確認され(ステップE9)、ある文字
情報の末尾位置の数値より次の文字情報の先頭位置の数
値が小さいことにより、これらの文字情報が重複しない
ことが確認される(ステップE11)。
字情報として付与され、文字情報の先頭位置の数値が行
頭位置の数値より大きいことにより、文字情報が文章の
行頭から突出しないことが確認される(ステップE
8)。同様に、文字情報の末尾位置の数値が行末位置の
数値より小さいことにより、文字情報が文章の行末から
突出しないことが確認され(ステップE9)、ある文字
情報の末尾位置の数値より次の文字情報の先頭位置の数
値が小さいことにより、これらの文字情報が重複しない
ことが確認される(ステップE11)。
【0038】例えば、第一ゾーンは二行からなり、処理
対象の語句として第一行目には“certainly,wife,fic
kle ”の三語が存在するので、各々に第一の訳語を文字
情報として設定し、その中心位置を一致させると、下記
の表3のようになり、文字情報の付与の範囲が各々適正
であることが確認される。なお、ここでは文字の横幅を
“20”として計算している。
対象の語句として第一行目には“certainly,wife,fic
kle ”の三語が存在するので、各々に第一の訳語を文字
情報として設定し、その中心位置を一致させると、下記
の表3のようになり、文字情報の付与の範囲が各々適正
であることが確認される。なお、ここでは文字の横幅を
“20”として計算している。
【0039】
【表3】
【0040】このような確認が完了すると、文字情報に
二番目の訳語が追加されてから上述のような確認が実行
され、以下同様に文字情報が順次拡大される。このと
き、複数の訳語はデリミッタマーク“;”を介して連設
されるので、これを考慮して文字情報の付与の範囲が算
出される。例えば、上述の第一行目の三つの語句の各々
に第一・第二の訳語で文字情報を付与する場合、下記の
表4のようになる。なお、ここではデリミッタマークの
横幅を“10”として計算している。
二番目の訳語が追加されてから上述のような確認が実行
され、以下同様に文字情報が順次拡大される。このと
き、複数の訳語はデリミッタマーク“;”を介して連設
されるので、これを考慮して文字情報の付与の範囲が算
出される。例えば、上述の第一行目の三つの語句の各々
に第一・第二の訳語で文字情報を付与する場合、下記の
表4のようになる。なお、ここではデリミッタマークの
横幅を“10”として計算している。
【0041】
【表4】
【0042】この場合、三番目の語句“fickle”の文字
情報の末尾位置“1198”が、ゾーンの末尾位置“1185”
を超過しているので、この文字情報はゾーンから後方に
突出することになり、その付与範囲が不適と判定され
る。このため、語句“fickle”の文字情報として二番目
の訳語“浮気な”は採用されず、これは一番目の訳語
“気まぐれな”のみとして確定され、この語句に対する
処理は完了する(ステップE14)。以下同様に、下記
の表5に示すように、その文字情報の範囲が不適となる
か、文字情報として全部の訳語が使用されるまで(ステ
ップE15)、各語句で処理が繰り返される(ステップ
E16)。
情報の末尾位置“1198”が、ゾーンの末尾位置“1185”
を超過しているので、この文字情報はゾーンから後方に
突出することになり、その付与範囲が不適と判定され
る。このため、語句“fickle”の文字情報として二番目
の訳語“浮気な”は採用されず、これは一番目の訳語
“気まぐれな”のみとして確定され、この語句に対する
処理は完了する(ステップE14)。以下同様に、下記
の表5に示すように、その文字情報の範囲が不適となる
か、文字情報として全部の訳語が使用されるまで(ステ
ップE15)、各語句で処理が繰り返される(ステップ
E16)。
【0043】
【表5】
【0044】上述のような処理により、下記の表6に示
すように、第一ゾーンの第一行目の複数の語句の各々
に、文字情報が適正な範囲で付与されることになる。
すように、第一ゾーンの第一行目の複数の語句の各々
に、文字情報が適正な範囲で付与されることになる。
【0045】
【表6】
【0046】このように文章情報の一行の処理が完了す
ると、出力制御装置18により実際に文字情報が文章情
報の対応する語句の下方に並列に付与される。このよう
に第一行目の文章情報を生成した翻訳支援装置1は第二
行目の処理を実行し、下記の表7に示すように、第二行
目の語句の文字情報も確定されると、これを文章情報の
第二行目に付与してプリンタユニット4に出力する。
ると、出力制御装置18により実際に文字情報が文章情
報の対応する語句の下方に並列に付与される。このよう
に第一行目の文章情報を生成した翻訳支援装置1は第二
行目の処理を実行し、下記の表7に示すように、第二行
目の語句の文字情報も確定されると、これを文章情報の
第二行目に付与してプリンタユニット4に出力する。
【0047】
【表7】
【0048】上述のような処理により文字情報が特定の
語句に並列に付与された一面の文章情報が完成すると、
これが情報出力装置19によりプリンタユニット4に出
力される。このプリンタユニット4は、図6に示すよう
に、入力された文章情報を印刷出力するので(ステップ
S13)、図5(a)に示すように、その印刷画像は英
語の原本の文章情報の一部の語句の下部に日本語の訳語
が文字情報として表記されたものとなる。
語句に並列に付与された一面の文章情報が完成すると、
これが情報出力装置19によりプリンタユニット4に出
力される。このプリンタユニット4は、図6に示すよう
に、入力された文章情報を印刷出力するので(ステップ
S13)、図5(a)に示すように、その印刷画像は英
語の原本の文章情報の一部の語句の下部に日本語の訳語
が文字情報として表記されたものとなる。
【0049】このため、本実施の形態のデジタル複写機
2は、英語の読取原稿を複写するだけで、難度の高い単
語に訳語が付与された複写原稿を獲得することができる
ので、英語の内容を簡易に確認することができる。その
場合、訳語は難度の高い語句のみ付与されるので、紙面
が煩雑とならず視認性が良好に維持される。このように
訳語を付与する語句を一部に制限することにより、付与
する訳語の両側には空白が存在する。
2は、英語の読取原稿を複写するだけで、難度の高い単
語に訳語が付与された複写原稿を獲得することができる
ので、英語の内容を簡易に確認することができる。その
場合、訳語は難度の高い語句のみ付与されるので、紙面
が煩雑とならず視認性が良好に維持される。このように
訳語を付与する語句を一部に制限することにより、付与
する訳語の両側には空白が存在する。
【0050】そして、本実施の形態のデジタル複写機2
では、英語の語句に付与する日本語の文字情報が長い場
合でも、この文字情報を付与する範囲を両側の空白を利
用して拡大するので、原本の語句に多量の文字情報を充
分に付与することができる。このように文字情報の範囲
を拡大しても、隣接する文字情報は重複せず、文字情報
が行頭や行末から突出することもないので、文字情報を
個々に明確に読み取ることができ、文章情報のレイアウ
トのイメージが損なわれることもない。
では、英語の語句に付与する日本語の文字情報が長い場
合でも、この文字情報を付与する範囲を両側の空白を利
用して拡大するので、原本の語句に多量の文字情報を充
分に付与することができる。このように文字情報の範囲
を拡大しても、隣接する文字情報は重複せず、文字情報
が行頭や行末から突出することもないので、文字情報を
個々に明確に読み取ることができ、文章情報のレイアウ
トのイメージが損なわれることもない。
【0051】このような制限のもとで、文字情報を形成
する訳語が順次増加されるので、英語の語句に日本語の
訳語を最大限まで付与することができる。特に、文字情
報を形成する複数の訳語を情報対応辞書15の格納の順
番で増加させるので、この情報対応辞書15に訳語を重
要な順番に格納しておけば、重要な訳語を優先的に文字
情報に設定することができる。このように文字情報の範
囲を拡大すると、これが語句の範囲を超過することにな
るが、語句と文字情報とは中心位置が一致しているので
対応関係が明確である。
する訳語が順次増加されるので、英語の語句に日本語の
訳語を最大限まで付与することができる。特に、文字情
報を形成する複数の訳語を情報対応辞書15の格納の順
番で増加させるので、この情報対応辞書15に訳語を重
要な順番に格納しておけば、重要な訳語を優先的に文字
情報に設定することができる。このように文字情報の範
囲を拡大すると、これが語句の範囲を超過することにな
るが、語句と文字情報とは中心位置が一致しているので
対応関係が明確である。
【0052】なお、本発明は上記形態に限定されるもの
ではなく、各種の変形を許容する。例えば、上記形態で
は文字情報を各行の先頭や末尾から突出させないことを
例示したが、これをゾーンの先頭や末尾とすることも可
能である。その場合、一ゾーンの各行の長さが相違して
も、そのゾーンから突出しなければ行から文字情報を突
出させることができるので、図5(b)に示すように、
短い行の末尾の語句に長い文字情報を付与することがで
き、これにより文章情報のレイアウトのイメージを損な
うこともない。
ではなく、各種の変形を許容する。例えば、上記形態で
は文字情報を各行の先頭や末尾から突出させないことを
例示したが、これをゾーンの先頭や末尾とすることも可
能である。その場合、一ゾーンの各行の長さが相違して
も、そのゾーンから突出しなければ行から文字情報を突
出させることができるので、図5(b)に示すように、
短い行の末尾の語句に長い文字情報を付与することがで
き、これにより文章情報のレイアウトのイメージを損な
うこともない。
【0053】さらに、上記形態では文字情報を両側に拡
大することで、文章情報のレイアウトを変化させること
なく語句に多量の文字情報を一行で付与することを例示
したが、この文字情報の行数を複数とすることも可能で
あり、所望により文章情報の行間を拡大することも可能
である。
大することで、文章情報のレイアウトを変化させること
なく語句に多量の文字情報を一行で付与することを例示
したが、この文字情報の行数を複数とすることも可能で
あり、所望により文章情報の行間を拡大することも可能
である。
【0054】また、上記形態では原本の語句と付与する
文字情報との対応関係を明確にするため、語句と文字情
報との中心位置を一致させることを例示したが、図5
(b)に示すように、語句に指標としてアンダーライン
やハッチング等を付与することにより、より良好に語句
と文字情報との関係を明確にすることも可能である。特
に、文字情報を付与する語句が熟語等の場合、これには
特定の指標を付与することが好ましい。
文字情報との対応関係を明確にするため、語句と文字情
報との中心位置を一致させることを例示したが、図5
(b)に示すように、語句に指標としてアンダーライン
やハッチング等を付与することにより、より良好に語句
と文字情報との関係を明確にすることも可能である。特
に、文字情報を付与する語句が熟語等の場合、これには
特定の指標を付与することが好ましい。
【0055】さらに、語句と文字情報との先頭位置や末
尾位置を一致させることも可能であり、これらを混在さ
せることもできる。その場合、例えば、行頭の語句では
文字情報を先頭位置に一致させ、行末の語句では文字情
報を末尾位置に一致させれば、行頭や行末の語句にも多
量の文字情報を良好に付与することができる。このよう
な場合、語句と文字情報との対応関係が不明確となる懸
念があるので、上述のように語句に指標としてアンダー
ライン等を付与することが好ましい。
尾位置を一致させることも可能であり、これらを混在さ
せることもできる。その場合、例えば、行頭の語句では
文字情報を先頭位置に一致させ、行末の語句では文字情
報を末尾位置に一致させれば、行頭や行末の語句にも多
量の文字情報を良好に付与することができる。このよう
な場合、語句と文字情報との対応関係が不明確となる懸
念があるので、上述のように語句に指標としてアンダー
ライン等を付与することが好ましい。
【0056】さらに、上記形態では隣接する文字情報を
重複させないことを例示したが、隣接する文字情報が連
続すると識別が困難となるので、これが問題となる場合
には、隣接する文字情報の範囲を一定の間隔以上に離反
させることが好ましい。これは前述のように隣接する文
字情報の重複を確認する場合に、文字情報の横幅に一定
の数値を加算すれば良く、これにより隣接する文字情報
が連続しないので各々を明確に識別することができる。
重複させないことを例示したが、隣接する文字情報が連
続すると識別が困難となるので、これが問題となる場合
には、隣接する文字情報の範囲を一定の間隔以上に離反
させることが好ましい。これは前述のように隣接する文
字情報の重複を確認する場合に、文字情報の横幅に一定
の数値を加算すれば良く、これにより隣接する文字情報
が連続しないので各々を明確に識別することができる。
【0057】また、上記形態では英語の語句に文字情報
として訳語を付与することを例示したが、この文字情報
に品詞情報などの文法情報を追加することも可能であ
る。さらに、このような文法情報に基づいて訳語を階層
構造で情報対応辞書15に格納しておき、この階層構造
に対応した順位で文字情報を形成することも可能であ
る。
として訳語を付与することを例示したが、この文字情報
に品詞情報などの文法情報を追加することも可能であ
る。さらに、このような文法情報に基づいて訳語を階層
構造で情報対応辞書15に格納しておき、この階層構造
に対応した順位で文字情報を形成することも可能であ
る。
【0058】より具体的には、上記形態では情報対応辞
書15の格納の順番で複数の訳語を順次増加させたが、
これを各品詞から一つずつ順番に増加させるようにす
る。例えば、“marry ”なる語句の文字情報を訳語の格
納の順番で形成すると、前述の表7のようになるが、各
品詞毎に一つずつ訳語を増加させて文字情報を形成する
と、下記の表8のようになる。
書15の格納の順番で複数の訳語を順次増加させたが、
これを各品詞から一つずつ順番に増加させるようにす
る。例えば、“marry ”なる語句の文字情報を訳語の格
納の順番で形成すると、前述の表7のようになるが、各
品詞毎に一つずつ訳語を増加させて文字情報を形成する
と、下記の表8のようになる。
【0059】
【表8】
【0060】つまり、表2に示すように、“marry ”な
る語句の訳語は、動詞と形容詞と名詞との順番で格納さ
れており、動詞と形容詞との訳語は複数である。この場
合、訳語の格納の順番で文字情報を形成するならば、最
初に動詞の一番目の訳語“結婚する[させる]”が選択
され、次に動詞の二番目の訳語が選択される。しかし、
各品詞毎に一つずつ訳語を増加させる場合は、最初に動
詞の一番目の訳語が選択されるが、次に選択される訳語
は動詞の二番目でなく形容詞の一番目となり、次は名詞
の訳語が選択される。
る語句の訳語は、動詞と形容詞と名詞との順番で格納さ
れており、動詞と形容詞との訳語は複数である。この場
合、訳語の格納の順番で文字情報を形成するならば、最
初に動詞の一番目の訳語“結婚する[させる]”が選択
され、次に動詞の二番目の訳語が選択される。しかし、
各品詞毎に一つずつ訳語を増加させる場合は、最初に動
詞の一番目の訳語が選択されるが、次に選択される訳語
は動詞の二番目でなく形容詞の一番目となり、次は名詞
の訳語が選択される。
【0061】この場合、英語の語句に多数の品詞の訳語
が文字情報として付与されるので、文章情報における語
句の品詞を翻訳支援装置1が認識できなくとも、語句に
適正な文字情報を付与することができる。この際、文章
情報における語句の品詞を連設確率により判定し、これ
に基づいて品詞の優先順位を設定して文字情報を生成す
れば、より適正な文字情報を語句に付与することができ
る。このように品詞に基づいて複数の訳語で文字情報を
生成する場合に、各行の表9に示すように、複数の訳語
の各々に品詞を示す識別情報を付加することも可能であ
る。
が文字情報として付与されるので、文章情報における語
句の品詞を翻訳支援装置1が認識できなくとも、語句に
適正な文字情報を付与することができる。この際、文章
情報における語句の品詞を連設確率により判定し、これ
に基づいて品詞の優先順位を設定して文字情報を生成す
れば、より適正な文字情報を語句に付与することができ
る。このように品詞に基づいて複数の訳語で文字情報を
生成する場合に、各行の表9に示すように、複数の訳語
の各々に品詞を示す識別情報を付加することも可能であ
る。
【0062】
【表9】
【0063】同様な処理により、情報対応辞書15に文
字情報を格納する階層構造を多義性に基づいて設定する
ことも可能である。例えば、“leave ”なる語句の複数
の訳語に、語源の相違による多義性の順位を〜とし
て設定すると、下記の表9のようになる。
字情報を格納する階層構造を多義性に基づいて設定する
ことも可能である。例えば、“leave ”なる語句の複数
の訳語に、語源の相違による多義性の順位を〜とし
て設定すると、下記の表9のようになる。
【0064】
【表10】
【0065】このような多義性に基づいて文字情報を形
成する訳語を順番に増加させる場合、最初にの一番目
の訳語が選択され、次にの二番目の訳語が選択される
ことなく、の一番目の訳語が選択される。このように
訳語の多義性に基づいて文字情報を形成すると、下記の
表10に示すように、語句には多義の文字情報を付与す
ることができる。
成する訳語を順番に増加させる場合、最初にの一番目
の訳語が選択され、次にの二番目の訳語が選択される
ことなく、の一番目の訳語が選択される。このように
訳語の多義性に基づいて文字情報を形成すると、下記の
表10に示すように、語句には多義の文字情報を付与す
ることができる。
【0066】
【表11】
【0067】さらに、上記形態では英語の原本の文章情
報に日本語の訳語を文字情報として付与することを例示
したが、このような原本や文字情報も各種形態に設定す
ることができ、例えば、日本語の原本の文章情報に用語
解説を文字情報として付与することや、日本語の原本の
文章情報に振仮名を文字情報として付与することも可能
である。
報に日本語の訳語を文字情報として付与することを例示
したが、このような原本や文字情報も各種形態に設定す
ることができ、例えば、日本語の原本の文章情報に用語
解説を文字情報として付与することや、日本語の原本の
文章情報に振仮名を文字情報として付与することも可能
である。
【0068】また、上記形態では翻訳支援装置1をデジ
タル複写機2の一部として例示したが、翻訳支援装置1
を単独の装置として設けることも可能である。例えば、
ホストコンピュータからテキストデータを文章情報とし
て翻訳支援装置1に送信し、文字情報が付与された文章
情報をディスプレイに表示するようなことも可能であ
る。
タル複写機2の一部として例示したが、翻訳支援装置1
を単独の装置として設けることも可能である。例えば、
ホストコンピュータからテキストデータを文章情報とし
て翻訳支援装置1に送信し、文字情報が付与された文章
情報をディスプレイに表示するようなことも可能であ
る。
【0069】また、上述のような翻訳支援装置1は、各
種装置8〜19の各々を固有のハードウェアとして製作
することでも実現できるが、各種装置8〜19の機能を
ソフトウェアとして情報記憶媒体に書き込み、これでマ
イクロコンピュータを動作させることでも実現すること
ができる。同様に、各種装置8〜19の一部をハードウ
ェアで製作し、他の一部をソフトウェアとして情報記憶
媒体に書き込むことも可能である。
種装置8〜19の各々を固有のハードウェアとして製作
することでも実現できるが、各種装置8〜19の機能を
ソフトウェアとして情報記憶媒体に書き込み、これでマ
イクロコンピュータを動作させることでも実現すること
ができる。同様に、各種装置8〜19の一部をハードウ
ェアで製作し、他の一部をソフトウェアとして情報記憶
媒体に書き込むことも可能である。
【0070】より具体的には、情報記憶媒体に、原本の
文章情報から語句を抽出して対応する文字情報を発生さ
せること、文字情報を原本の文章情報の対応する語句に
並列に付与すること、文字情報を付与する範囲を隣接す
る文字情報と重複しない位置まで拡大すること、等をソ
フトウェアとして書き込む。このように翻訳支援装置1
の各種機能をソフトウェアとして書き込んだ情報記憶媒
体は、単体の製品として取り扱うことも可能であり、例
えば、RAM(Random Access Memory)、ROM(Read On
ly Memory)、CD−ROM(Compact Disk-ROM)、FD(F
loppy Disk)等の形態で供給することができる。
文章情報から語句を抽出して対応する文字情報を発生さ
せること、文字情報を原本の文章情報の対応する語句に
並列に付与すること、文字情報を付与する範囲を隣接す
る文字情報と重複しない位置まで拡大すること、等をソ
フトウェアとして書き込む。このように翻訳支援装置1
の各種機能をソフトウェアとして書き込んだ情報記憶媒
体は、単体の製品として取り扱うことも可能であり、例
えば、RAM(Random Access Memory)、ROM(Read On
ly Memory)、CD−ROM(Compact Disk-ROM)、FD(F
loppy Disk)等の形態で供給することができる。
【0071】
【発明の効果】請求項1記載の発明の情報処理装置は、
所定のレイアウトで形成された原本の文章情報から語句
を抽出し、この語句を認識して対応する文字情報を発生
させる情報発生手段と、文字情報を原本の文章情報の対
応する一部の語句と並列な位置に付与する情報付与手段
と、文字情報を付与する範囲を隣接する文字情報と重複
しない位置まで拡大する範囲拡大手段とを有することに
より、文字情報の付与の範囲を隣接の文字情報と重複し
ない位置まで拡大することができるので、原本の語句に
多量の文字情報を付与することができる。
所定のレイアウトで形成された原本の文章情報から語句
を抽出し、この語句を認識して対応する文字情報を発生
させる情報発生手段と、文字情報を原本の文章情報の対
応する一部の語句と並列な位置に付与する情報付与手段
と、文字情報を付与する範囲を隣接する文字情報と重複
しない位置まで拡大する範囲拡大手段とを有することに
より、文字情報の付与の範囲を隣接の文字情報と重複し
ない位置まで拡大することができるので、原本の語句に
多量の文字情報を付与することができる。
【0072】請求項2記載の発明の情報処理装置では、
範囲拡大手段は、原本の語句と付与する文字情報との中
心位置か先頭位置か末尾位置かを一致させることによ
り、原本の語句より文字情報の範囲を拡大しても、語句
と文字情報との対応関係を明確にすることができる。
範囲拡大手段は、原本の語句と付与する文字情報との中
心位置か先頭位置か末尾位置かを一致させることによ
り、原本の語句より文字情報の範囲を拡大しても、語句
と文字情報との対応関係を明確にすることができる。
【0073】請求項3記載の発明の情報処理装置では、
範囲拡大手段は、隣接する文字情報の範囲を一定の間隔
以上に離反させることにより、隣接する文字情報が連続
しないので、各々を明確に識別することができる。
範囲拡大手段は、隣接する文字情報の範囲を一定の間隔
以上に離反させることにより、隣接する文字情報が連続
しないので、各々を明確に識別することができる。
【0074】請求項4記載の発明の情報処理装置では、
情報付与手段は、文字情報を付与する語句に指標も付与
することにより、原本の語句より文字情報の範囲を拡大
しても、語句と文字情報との対応関係を明確にすること
ができる。
情報付与手段は、文字情報を付与する語句に指標も付与
することにより、原本の語句より文字情報の範囲を拡大
しても、語句と文字情報との対応関係を明確にすること
ができる。
【0075】請求項5記載の発明の情報処理装置では、
情報発生手段は、各種の文字情報が語句に対応して格納
された情報対応辞書と、この情報対応辞書から語句に対
応して文字情報を検索する情報検索手段とを有し、この
情報検索手段は、一つの語句に対応する複数の文字情報
を所定の順位で出力することにより、一つの語句に付与
する文字情報を所定の順位で増加させることができるの
で、多量の文字情報を適正な内容で付与することができ
る。
情報発生手段は、各種の文字情報が語句に対応して格納
された情報対応辞書と、この情報対応辞書から語句に対
応して文字情報を検索する情報検索手段とを有し、この
情報検索手段は、一つの語句に対応する複数の文字情報
を所定の順位で出力することにより、一つの語句に付与
する文字情報を所定の順位で増加させることができるの
で、多量の文字情報を適正な内容で付与することができ
る。
【0076】請求項6記載の発明の情報処理装置では、
情報対応辞書は、一つの語句に対応する複数の文字情報
が階層構造に格納されており、情報検索手段は、文字情
報を階層構造に対応した順位で出力することにより、一
つの語句に付与する文字情報を階層構造に対応した順位
で増加させることができるので、多量の文字情報を適正
な内容で付与することができる。
情報対応辞書は、一つの語句に対応する複数の文字情報
が階層構造に格納されており、情報検索手段は、文字情
報を階層構造に対応した順位で出力することにより、一
つの語句に付与する文字情報を階層構造に対応した順位
で増加させることができるので、多量の文字情報を適正
な内容で付与することができる。
【0077】請求項7記載の発明の情報処理装置では、
情報対応辞書は、一つの語句に対応する複数の文字情報
が文法情報とともに格納されており、情報検索手段は、
文字情報を文法情報に対応した順位で出力することによ
り、一つの語句に付与する文字情報を階層構造に対応し
た順位で増加させることができるので、多量の文字情報
を適正な内容で付与することができる。
情報対応辞書は、一つの語句に対応する複数の文字情報
が文法情報とともに格納されており、情報検索手段は、
文字情報を文法情報に対応した順位で出力することによ
り、一つの語句に付与する文字情報を階層構造に対応し
た順位で増加させることができるので、多量の文字情報
を適正な内容で付与することができる。
【0078】請求項8記載の発明の情報処理装置では、
情報付与手段は、一つの語句に対応する複数の文字情報
を出力される順位で付与の範囲に対応して制限すること
により、原本の語句に最大限の文字情報を付与すること
ができる。
情報付与手段は、一つの語句に対応する複数の文字情報
を出力される順位で付与の範囲に対応して制限すること
により、原本の語句に最大限の文字情報を付与すること
ができる。
【0079】請求項9記載の発明のデジタル複写機で
は、読取原稿から原本の文章情報を読取走査するイメー
ジスキャナと、文章情報のイメージの各部の位置を識別
する位置識別装置と、各部の位置に基づいて文章情報を
文字認識する文字認識装置と、請求項1,2,3,4,
5,6,7または8記載の情報処理装置と、文字情報が
対応する語句に付与された文章情報を印刷出力するプリ
ンタ装置とを有することにより、原本の読取原稿を複写
すれば特定の語句に文字情報が付与されるので、原本の
文章情報の認識を良好に支援することができ、特に、文
字情報の付与の範囲が隣接の文字情報と重複しない位置
まで拡大されるので、原本の語句に多量の文字情報が付
与される。
は、読取原稿から原本の文章情報を読取走査するイメー
ジスキャナと、文章情報のイメージの各部の位置を識別
する位置識別装置と、各部の位置に基づいて文章情報を
文字認識する文字認識装置と、請求項1,2,3,4,
5,6,7または8記載の情報処理装置と、文字情報が
対応する語句に付与された文章情報を印刷出力するプリ
ンタ装置とを有することにより、原本の読取原稿を複写
すれば特定の語句に文字情報が付与されるので、原本の
文章情報の認識を良好に支援することができ、特に、文
字情報の付与の範囲が隣接の文字情報と重複しない位置
まで拡大されるので、原本の語句に多量の文字情報が付
与される。
【0080】請求項10記載の発明の情報記憶媒体は、
請求項1,2,3,4,5,6,7または8記載の情報
処理装置の各種機能がソフトウェアとして書き込まれて
いることにより、このソフトウェアによりマイクロコン
ピュータを動作させれば、請求項1,2,3,4,5,
6,7または8記載の情報処理装置を簡易に実現するこ
とができる。
請求項1,2,3,4,5,6,7または8記載の情報
処理装置の各種機能がソフトウェアとして書き込まれて
いることにより、このソフトウェアによりマイクロコン
ピュータを動作させれば、請求項1,2,3,4,5,
6,7または8記載の情報処理装置を簡易に実現するこ
とができる。
【図1】本発明のデジタル複写機の一部である情報処理
装置の実施の形態を示すブロック図である。
装置の実施の形態を示すブロック図である。
【図2】本発明の情報処理装置を一部とするデジタル複
写機の実施の形態を示すブロック図である。
写機の実施の形態を示すブロック図である。
【図3】デジタル複写機の外観を示す正面図である。
【図4】原本の文章情報の各部の位置を識別した状態を
示す模式図である。
示す模式図である。
【図5】文章情報に文字情報を付与した状態を示す模式
図である。
図である。
【図6】デジタル複写機の処理動作のメインルーチンを
示すフローチャートである。
示すフローチャートである。
【図7】一ゾーンの処理動作のサブルーチンを示すフロ
ーチャートである。
ーチャートである。
【図8】一行の処理動作のサブルーチンを示すフローチ
ャートである。
ャートである。
1 情報処理装置 2 デジタル複写機 3 イメージスキャナ 4 プリンタ装置 8 位置識別装置 9 文字認識装置 14 情報検索手段 15 情報対応辞書 16 範囲拡大手段 18 情報付与手段 20 情報発生手段
Claims (10)
- 【請求項1】 所定のレイアウトで形成された原本の文
章情報から語句を抽出し、この語句を認識して対応する
文字情報を発生させる情報発生手段と、文字情報を原本
の文章情報の対応する一部の語句と並列な位置に付与す
る情報付与手段と、文字情報を付与する範囲を隣接する
文字情報と重複しない位置まで拡大する範囲拡大手段
と、を有することを特徴とする情報処理装置。 - 【請求項2】 範囲拡大手段は、原本の語句と付与する
文字情報との中心位置か先頭位置か末尾位置かを一致さ
せることを特徴とする請求項1記載の情報処理装置。 - 【請求項3】 範囲拡大手段は、隣接する文字情報の範
囲を一定の間隔以上に離反させることを特徴とする請求
項2記載の情報処理装置。 - 【請求項4】 情報付与手段は、文字情報を付与する語
句に指標も付与することを特徴とする請求項1記載の情
報処理装置。 - 【請求項5】 情報発生手段は、各種の文字情報が語句
に対応して格納された情報対応辞書と、この情報対応辞
書から語句に対応して文字情報を検索する情報検索手段
とを有し、この情報検索手段は、一つの語句に対応する
複数の文字情報を所定の順位で出力することを特徴とす
る請求項1記載の情報処理装置。 - 【請求項6】 情報対応辞書は、一つの語句に対応する
複数の文字情報が階層構造に格納されており、情報検索
手段は、文字情報を階層構造に対応した順位で出力する
ことを特徴とする請求項5記載の情報処理装置。 - 【請求項7】 情報対応辞書は、一つの語句に対応する
複数の文字情報が文法情報とともに格納されており、情
報検索手段は、文字情報を文法情報に対応した順位で出
力することを特徴とする請求項5記載の情報処理装置。 - 【請求項8】 情報付与手段は、一つの語句に対応する
複数の文字情報を出力される順位で付与の範囲に対応し
て制限することを特徴とする請求項4,5または6記載
の情報処理装置。 - 【請求項9】 読取原稿から原本の文章情報を読取走査
するイメージスキャナと、文章情報のイメージの各部の
位置を識別する位置識別装置と、各部の位置に基づいて
文章情報を文字認識する文字認識装置と、請求項1,
2,3,4,5,6,7または8記載の情報処理装置
と、文字情報が対応する語句に付与された文章情報を印
刷出力するプリンタ装置と、を有することを特徴とする
デジタル複写機。 - 【請求項10】 マイクロコンピュータを動作させるソ
フトウェアが書き込まれた情報記憶媒体において、請求
項1,2,3,4,5,6,7または8記載の情報処理
装置の各種機能がソフトウェアとして書き込まれている
ことを特徴とする情報記憶媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8096356A JPH09284446A (ja) | 1996-04-18 | 1996-04-18 | 情報処理装置およびデジタル複写機および情報記憶媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP8096356A JPH09284446A (ja) | 1996-04-18 | 1996-04-18 | 情報処理装置およびデジタル複写機および情報記憶媒体 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH09284446A true JPH09284446A (ja) | 1997-10-31 |
Family
ID=14162724
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP8096356A Pending JPH09284446A (ja) | 1996-04-18 | 1996-04-18 | 情報処理装置およびデジタル複写機および情報記憶媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH09284446A (ja) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009294788A (ja) * | 2008-06-03 | 2009-12-17 | Ricoh Co Ltd | 情報処理装置、情報処理方法、制御プログラム及び記録媒体 |
| JP2011100356A (ja) * | 2009-11-06 | 2011-05-19 | Sharp Corp | 文書画像生成装置、文書画像生成方法及びコンピュータプログラム |
| US8073678B2 (en) | 2005-03-22 | 2011-12-06 | Fuji Xerox Co., Ltd. | Translation device, translation method, and storage medium |
| JP2012058947A (ja) * | 2010-09-08 | 2012-03-22 | Sharp Corp | 翻訳装置、翻訳方法、コンピュータプログラムおよび記録媒体 |
| JP2012089031A (ja) * | 2010-10-21 | 2012-05-10 | Sharp Corp | 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体 |
| JP2015210611A (ja) * | 2014-04-25 | 2015-11-24 | 京セラドキュメントソリューションズ株式会社 | 文書管理装置および文書管理プログラム |
-
1996
- 1996-04-18 JP JP8096356A patent/JPH09284446A/ja active Pending
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8073678B2 (en) | 2005-03-22 | 2011-12-06 | Fuji Xerox Co., Ltd. | Translation device, translation method, and storage medium |
| JP2009294788A (ja) * | 2008-06-03 | 2009-12-17 | Ricoh Co Ltd | 情報処理装置、情報処理方法、制御プログラム及び記録媒体 |
| JP2011100356A (ja) * | 2009-11-06 | 2011-05-19 | Sharp Corp | 文書画像生成装置、文書画像生成方法及びコンピュータプログラム |
| US8503786B2 (en) | 2009-11-06 | 2013-08-06 | Sharp Kabushiki Kaisha | Document image generation apparatus, document image generation method and recording medium |
| JP2012058947A (ja) * | 2010-09-08 | 2012-03-22 | Sharp Corp | 翻訳装置、翻訳方法、コンピュータプログラムおよび記録媒体 |
| CN102402504A (zh) * | 2010-09-08 | 2012-04-04 | 夏普株式会社 | 翻译装置以及翻译方法 |
| US8626487B2 (en) | 2010-09-08 | 2014-01-07 | Sharp Kabushiki Kaisha | Translation apparatus, translation method, computer program, and recording medium |
| JP2012089031A (ja) * | 2010-10-21 | 2012-05-10 | Sharp Corp | 文書生成装置、文書生成方法、コンピュータプログラムおよび記録媒体 |
| JP2015210611A (ja) * | 2014-04-25 | 2015-11-24 | 京セラドキュメントソリューションズ株式会社 | 文書管理装置および文書管理プログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0370774B1 (en) | Machine translation system | |
| US5241674A (en) | Electronic dictionary system with automatic extraction and recognition of letter pattern series to speed up the dictionary lookup operation | |
| US4831529A (en) | Machine translation system | |
| JP2000200291A (ja) | 選択された文字列をテキスト内で自動検出する方法 | |
| EP0247395A2 (en) | Machine translation system | |
| KR20040005671A (ko) | 문자인식 장치 및 방법 | |
| JPH09284446A (ja) | 情報処理装置およびデジタル複写機および情報記憶媒体 | |
| JP2848729B2 (ja) | 翻訳方法および翻訳装置 | |
| JPH0442704B2 (ja) | ||
| JPH0696288A (ja) | 文字認識装置及び機械翻訳装置 | |
| JP2006276903A (ja) | 文書処理装置 | |
| JP2763227B2 (ja) | 書式決定方法 | |
| JP2928515B2 (ja) | 訳語出力装置 | |
| JP3147245B2 (ja) | 文書処理装置及び文書処理方法 | |
| JP2680500B2 (ja) | 文書レイアウト方法 | |
| JP3424942B2 (ja) | 対訳画像形成装置 | |
| JP2682570B2 (ja) | 文書レイアウト方法 | |
| JPH07104865B2 (ja) | 文切り装置 | |
| JPH07262317A (ja) | 文書処理装置 | |
| JP2924955B2 (ja) | 翻訳方法および翻訳装置 | |
| JP2680501B2 (ja) | 文書出力方法 | |
| JP3204517B2 (ja) | 未知語認定方法 | |
| JPH04107679A (ja) | 機械翻訳装置 | |
| JPH10293811A (ja) | 文書認識装置及び方法並びにプログラム記憶媒体 | |
| JPS63244257A (ja) | 文書作成システム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040316 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040513 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040706 |