JPH05298065A - データ変換処理方式 - Google Patents
データ変換処理方式Info
- Publication number
- JPH05298065A JPH05298065A JP4128135A JP12813592A JPH05298065A JP H05298065 A JPH05298065 A JP H05298065A JP 4128135 A JP4128135 A JP 4128135A JP 12813592 A JP12813592 A JP 12813592A JP H05298065 A JPH05298065 A JP H05298065A
- Authority
- JP
- Japan
- Prior art keywords
- data
- byte character
- byte
- character code
- field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】 1バイト系の文字データと2バイト系の文字
データの混在するフィールドの編集が容易にできるデー
タ変換処理方式を得る。 【構成】 データ形式変換部1において、原データファ
イル2のレコードを原データ入力手段3で入力し、デー
タ変換手段4でフィールド単位にデータの内容を調べ1
バイト系の文字データが存在するか調べる。もし、1バ
イト系の文字コードが存在するならばその文字に対応す
る2バイト系の文字コードに変換する。1レコード分の
データ変換が終了したら中間ファイル出力手段5で中間
ファイル6に出力される。データ編集処理部7におい
て、中間ファイル6から変換されたレコードを中間ファ
イル入力手段8で入力する。入力されたレコードはその
まま編集可能な形式であるので、次のデータ編集手段9
で表示可能な形式に編集され、出力手段10で出力装置
11に表示されたり,印字される。
データの混在するフィールドの編集が容易にできるデー
タ変換処理方式を得る。 【構成】 データ形式変換部1において、原データファ
イル2のレコードを原データ入力手段3で入力し、デー
タ変換手段4でフィールド単位にデータの内容を調べ1
バイト系の文字データが存在するか調べる。もし、1バ
イト系の文字コードが存在するならばその文字に対応す
る2バイト系の文字コードに変換する。1レコード分の
データ変換が終了したら中間ファイル出力手段5で中間
ファイル6に出力される。データ編集処理部7におい
て、中間ファイル6から変換されたレコードを中間ファ
イル入力手段8で入力する。入力されたレコードはその
まま編集可能な形式であるので、次のデータ編集手段9
で表示可能な形式に編集され、出力手段10で出力装置
11に表示されたり,印字される。
Description
【0001】
【産業上の利用分野】この発明は、コンピュータ等のデ
ータ処理装置において、一つのフィールドの中に1バイ
ト系の文字コードと2バイト系の文字コードが混在する
データを処理し易くするためのデータ変換処理方式に関
するものである。
ータ処理装置において、一つのフィールドの中に1バイ
ト系の文字コードと2バイト系の文字コードが混在する
データを処理し易くするためのデータ変換処理方式に関
するものである。
【0002】
【従来の技術】図9は、例えば特開昭63−25454
2号公報に示された従来の混在フィールド制御方式のブ
ロック構成図であり、図において、1はデータ形式変換
部、2は原データファイル、3は原データ入力手段、5
1はデータ内容判別手段、52はビットマップ作成手
段、5は中間ファイル出力手段、6は中間ファイル、7
はデータ編集処理部、8は中間ファイル入力手段、53
はビットマップ解析手段、54はデータ展開手段、9は
データ編集手段、10は出力手段、11は出力装置であ
る。
2号公報に示された従来の混在フィールド制御方式のブ
ロック構成図であり、図において、1はデータ形式変換
部、2は原データファイル、3は原データ入力手段、5
1はデータ内容判別手段、52はビットマップ作成手
段、5は中間ファイル出力手段、6は中間ファイル、7
はデータ編集処理部、8は中間ファイル入力手段、53
はビットマップ解析手段、54はデータ展開手段、9は
データ編集手段、10は出力手段、11は出力装置であ
る。
【0003】次に動作について説明する。原データファ
イル2には、一つのフィールドに1バイト系の文字デー
タと2バイト系の文字データとが混在するレコード群が
記憶されている。このとき2バイト系の文字データに
は、データ自身にシフトコードであるシフトイン,シフ
トアウトを付加した形式で格納されている。
イル2には、一つのフィールドに1バイト系の文字デー
タと2バイト系の文字データとが混在するレコード群が
記憶されている。このとき2バイト系の文字データに
は、データ自身にシフトコードであるシフトイン,シフ
トアウトを付加した形式で格納されている。
【0004】まず、原データ入力手段3で原データファ
イル2からレコードを入力する。読み込まれた1レコー
ドをデータ内容判別手段51でフィールド単位にデータ
の内容を調べ、2バイト系コードデータの存在を判別す
る。その結果から、ビットマップ作成手段52で2バイ
ト系の文字コードの位置に対応するビットマップ上のビ
ットを立てる。
イル2からレコードを入力する。読み込まれた1レコー
ドをデータ内容判別手段51でフィールド単位にデータ
の内容を調べ、2バイト系コードデータの存在を判別す
る。その結果から、ビットマップ作成手段52で2バイ
ト系の文字コードの位置に対応するビットマップ上のビ
ットを立てる。
【0005】図10は、ビットマップが1ビットである
ときに、フィールド中の2バイト系の文字データの位置
を相対的に表している関係図である。図10におけるフ
ィールド内の混在データ例55は、1バイト系の文字デ
ータである“A”,“B”,“C”,“D”と、2バイ
ト系の文字データである“日本”とが混在している1フ
ィールドの例である。これに対してビットマップ例56
では、上記混在フィールドの1バイトに対して1ビット
が相対的に対応付けられていて、混在データ例55の中
の2バイト系文字データ“日本”の文字の位置に対応し
たビットが“1”(ONの状態)となっている。
ときに、フィールド中の2バイト系の文字データの位置
を相対的に表している関係図である。図10におけるフ
ィールド内の混在データ例55は、1バイト系の文字デ
ータである“A”,“B”,“C”,“D”と、2バイ
ト系の文字データである“日本”とが混在している1フ
ィールドの例である。これに対してビットマップ例56
では、上記混在フィールドの1バイトに対して1ビット
が相対的に対応付けられていて、混在データ例55の中
の2バイト系文字データ“日本”の文字の位置に対応し
たビットが“1”(ONの状態)となっている。
【0006】次に、ビットマップ作成手段52によって
作成されたビットマップは、1バイト系文字データと2
バイト系文字データとが含まれるフィールドの直後に付
加されて、中間ファイル6へ中間ファイル出力手段5に
よって格納される。このとき、混在データであることを
意味する記号(本例では“M”)にデータ属性を変換す
る。
作成されたビットマップは、1バイト系文字データと2
バイト系文字データとが含まれるフィールドの直後に付
加されて、中間ファイル6へ中間ファイル出力手段5に
よって格納される。このとき、混在データであることを
意味する記号(本例では“M”)にデータ属性を変換す
る。
【0007】図11は、ビットマップが付加され、デー
タ属性定義が変換された内部表現形式のレコードの実例
を示す説明図である。図11において、内部表現形式レ
コード例57は、図10で示した混在データ例がデータ
属性58の“M”と、ビットマップ59が付加された形
のレコードとを含むデータに変換された実例である。
タ属性定義が変換された内部表現形式のレコードの実例
を示す説明図である。図11において、内部表現形式レ
コード例57は、図10で示した混在データ例がデータ
属性58の“M”と、ビットマップ59が付加された形
のレコードとを含むデータに変換された実例である。
【0008】以上のように、1バイト系文字データと2
バイト系文字データとが混在する原データを内部表現形
式に変換し、中間ファイル6へ格納するのがデータ形式
変換部1である。
バイト系文字データとが混在する原データを内部表現形
式に変換し、中間ファイル6へ格納するのがデータ形式
変換部1である。
【0009】次に、中間ファイル6に格納された内部表
現形式レコードを出力装置へ表示したり,印字するため
の手段としてのデータ編集処理部7について説明する。
データ編集処理部7では、中間ファイル6を中間ファイ
ル入力手段8で入力し、ビットマップ解析手段53でビ
ットマップを解析し、2バイト系文字データの位置を求
める。データ展開手段54では、ビットマップ解析手段
53によって得られた2バイト系の文字データの位置を
もとにフィールドのデータを分解し、2バイト系の文字
データの前後にシフトコードを付加する。
現形式レコードを出力装置へ表示したり,印字するため
の手段としてのデータ編集処理部7について説明する。
データ編集処理部7では、中間ファイル6を中間ファイ
ル入力手段8で入力し、ビットマップ解析手段53でビ
ットマップを解析し、2バイト系文字データの位置を求
める。データ展開手段54では、ビットマップ解析手段
53によって得られた2バイト系の文字データの位置を
もとにフィールドのデータを分解し、2バイト系の文字
データの前後にシフトコードを付加する。
【0010】以上のようにして、すべての2バイト系コ
ードデータにシフトコードが付加されると、データ編集
手段9は表示可能な形式にレコードを編集し、出力手段
10で出力装置11へ表示したり,印字する。
ードデータにシフトコードが付加されると、データ編集
手段9は表示可能な形式にレコードを編集し、出力手段
10で出力装置11へ表示したり,印字する。
【0011】
【発明が解決しようとする課題】従来方式は以上のよう
に成されていたので、ビットマップを解析する処理が余
分に必要となり、従来からあるデータ編集処理をそのま
ま使うことはできない。また、このような混在データの
扱いが困難なのはデータを編集する作業であるが、デー
タ編集手段にデータが渡って来る段階で2バイト系の文
字データにシフトコードが付加されているため、ここで
の問題点は解決されていない。
に成されていたので、ビットマップを解析する処理が余
分に必要となり、従来からあるデータ編集処理をそのま
ま使うことはできない。また、このような混在データの
扱いが困難なのはデータを編集する作業であるが、デー
タ編集手段にデータが渡って来る段階で2バイト系の文
字データにシフトコードが付加されているため、ここで
の問題点は解決されていない。
【0012】上記の問題点を図で説明する。図8は1バ
イト系の文字データと2バイト系の文字データの混在す
るフィールドを2等分する処理を示した説明図である。
図において、45は1バイト系の文字コードと2バイト
系の文字コードとが混在しているフィールドの例であ
る。この例ではシフトイン,シフトアウトをそれぞれ2
バイトとした。46は2等分したデータの前半部分を格
納するフィールドである。47は2等分したデータの後
半部分を格納するフィールドである。
イト系の文字データと2バイト系の文字データの混在す
るフィールドを2等分する処理を示した説明図である。
図において、45は1バイト系の文字コードと2バイト
系の文字コードとが混在しているフィールドの例であ
る。この例ではシフトイン,シフトアウトをそれぞれ2
バイトとした。46は2等分したデータの前半部分を格
納するフィールドである。47は2等分したデータの後
半部分を格納するフィールドである。
【0013】混在フィールド45の内容を2等分して前
半部分フィールド46と後半部分フィールド47にそれ
ぞれ格納する処理である。このときに問題になるのは、
2等分するときの境界が2バイト系文字データにかかっ
てしまうことがあることである。混在フィールド45の
2等分する境界は2バイト系文字コードである“漢”に
かかっている。ここでデータを分けると“漢”のデータ
が壊れてしまう。ここでは“漢”を前半部分に振り分け
ることで回避している。
半部分フィールド46と後半部分フィールド47にそれ
ぞれ格納する処理である。このときに問題になるのは、
2等分するときの境界が2バイト系文字データにかかっ
てしまうことがあることである。混在フィールド45の
2等分する境界は2バイト系文字コードである“漢”に
かかっている。ここでデータを分けると“漢”のデータ
が壊れてしまう。ここでは“漢”を前半部分に振り分け
ることで回避している。
【0014】また、2等分するときの境界が1バイト系
文字データになるか2バイト系文字データになるかで、
前半部分フィールド46の終端と後半部分フィールド4
7の始端の処理が変わってくる。図8では2等分した境
界が2バイト系文字データであり、2バイト系の文字コ
ードで終了しているため、前半部分フィールド46の終
端と後半部分フィールド47の始端にそれぞれシフトア
ウト,シフトインを付加している。境界が1バイト系文
字データならばシフトコードを付加する必要はない。上
記の境界の文字コードの判断を行うためには、混在フィ
ールド45の先頭から文字データを解析する必要がある
ためプログラムの作成上大きな困難がともなっていた。
文字データになるか2バイト系文字データになるかで、
前半部分フィールド46の終端と後半部分フィールド4
7の始端の処理が変わってくる。図8では2等分した境
界が2バイト系文字データであり、2バイト系の文字コ
ードで終了しているため、前半部分フィールド46の終
端と後半部分フィールド47の始端にそれぞれシフトア
ウト,シフトインを付加している。境界が1バイト系文
字データならばシフトコードを付加する必要はない。上
記の境界の文字コードの判断を行うためには、混在フィ
ールド45の先頭から文字データを解析する必要がある
ためプログラムの作成上大きな困難がともなっていた。
【0015】この発明は上記のような問題点を解決する
ためになされたもので、1バイト系の文字データと2バ
イト系の文字データの混在するフィールドの編集が容易
にできるようにしたデータ変換処理方式を提供すること
を目的とする。
ためになされたもので、1バイト系の文字データと2バ
イト系の文字データの混在するフィールドの編集が容易
にできるようにしたデータ変換処理方式を提供すること
を目的とする。
【0016】
【課題を解決するための手段】この発明に係るデータ変
換処理方式は、一つのフィールドの中に1バイト系の文
字コードと2バイト系の文字コードが混在するデータを
処理するデータ処理装置において、1バイト系の文字コ
ードに基づき、その文字に対応する2バイト系の文字コ
ードが参照可能なテーブルを有し、このテーブルを用い
て1バイト系の文字コードを2バイト系の文字コードに
変換する変換手段を備え、一つのフィールドの中に1バ
イト系の文字コードと2バイト系の文字コードが混在す
る場合に、1バイト系の文字を対応する2バイト系の文
字に置き換えるようにしたものである。
換処理方式は、一つのフィールドの中に1バイト系の文
字コードと2バイト系の文字コードが混在するデータを
処理するデータ処理装置において、1バイト系の文字コ
ードに基づき、その文字に対応する2バイト系の文字コ
ードが参照可能なテーブルを有し、このテーブルを用い
て1バイト系の文字コードを2バイト系の文字コードに
変換する変換手段を備え、一つのフィールドの中に1バ
イト系の文字コードと2バイト系の文字コードが混在す
る場合に、1バイト系の文字を対応する2バイト系の文
字に置き換えるようにしたものである。
【0017】さらに、この発明に係るデータ変換処理方
式は、1バイト系のかな文字コードに濁点,半濁点のコ
ードが続く場合、上記1バイト系のかな文字に対応する
2バイト系の文字コードに所定の定数を加算して、1バ
イト系のかな文字とそれに続く濁点,半濁点を対応する
2バイト系の濁音,半濁音の文字に置き換えるようにし
たものである。
式は、1バイト系のかな文字コードに濁点,半濁点のコ
ードが続く場合、上記1バイト系のかな文字に対応する
2バイト系の文字コードに所定の定数を加算して、1バ
イト系のかな文字とそれに続く濁点,半濁点を対応する
2バイト系の濁音,半濁音の文字に置き換えるようにし
たものである。
【0018】
【作用】この発明においては、1バイト系の文字コード
をそれに対応する2バイト系の文字コードに対応させる
テーブルを有し、1バイト系の文字を2バイト系の文字
に変換する。これにより、1バイト系の文字データと2
バイト系の文字データの混在するフィールドの内容を2
バイト系の文字コードに統一することができる。
をそれに対応する2バイト系の文字コードに対応させる
テーブルを有し、1バイト系の文字を2バイト系の文字
に変換する。これにより、1バイト系の文字データと2
バイト系の文字データの混在するフィールドの内容を2
バイト系の文字コードに統一することができる。
【0019】また、1バイト系のかな文字に濁点,半濁
点が続く場合、該当する2バイト系の文字コードに定数
を加算し、濁音,半濁音の2バイト系の文字に変換す
る。このように、濁点,半濁点の付いている1バイト系
のかな文字データを濁点,半濁点付きの2バイト系文字
コードに変換することで、フィールドに格納できるデー
タ長をできるだけ長くすることができる。
点が続く場合、該当する2バイト系の文字コードに定数
を加算し、濁音,半濁音の2バイト系の文字に変換す
る。このように、濁点,半濁点の付いている1バイト系
のかな文字データを濁点,半濁点付きの2バイト系文字
コードに変換することで、フィールドに格納できるデー
タ長をできるだけ長くすることができる。
【0020】
実施例1.図1はこの発明の一実施例を示すデータ変換
処理方式のブロック構成図である。図において、1はデ
ータの形式を変換するデータ形式変換部、2は従来の1
バイト系文字コードと2バイト系文字コードとが混在す
るフィールドからなるレコード群が格納されている原デ
ータファイル、3は原データファイル2のレコードを入
力する原データ入力手段、4は入力した1バイト系文字
コードと2バイト系文字コードとが混在するフィールド
を変換するデータ変換手段、5は変換したデータを中間
ファイルに出力する中間ファイル出力手段、6は変換後
のレコード群が格納される中間ファイル、7はデータを
出力装置に出力するデータ編集処理部、8は中間ファイ
ル6のレコードを入力する中間ファイル入力手段、9は
入力したレコード内のフィールドを編集するデータ編集
手段、10は編集されたデータを出力装置に出力する出
力手段、11は実際にフィールドの内容を表示したり,
印字する出力装置である。
処理方式のブロック構成図である。図において、1はデ
ータの形式を変換するデータ形式変換部、2は従来の1
バイト系文字コードと2バイト系文字コードとが混在す
るフィールドからなるレコード群が格納されている原デ
ータファイル、3は原データファイル2のレコードを入
力する原データ入力手段、4は入力した1バイト系文字
コードと2バイト系文字コードとが混在するフィールド
を変換するデータ変換手段、5は変換したデータを中間
ファイルに出力する中間ファイル出力手段、6は変換後
のレコード群が格納される中間ファイル、7はデータを
出力装置に出力するデータ編集処理部、8は中間ファイ
ル6のレコードを入力する中間ファイル入力手段、9は
入力したレコード内のフィールドを編集するデータ編集
手段、10は編集されたデータを出力装置に出力する出
力手段、11は実際にフィールドの内容を表示したり,
印字する出力装置である。
【0021】次に動作について説明する。まず、データ
の形式を変換するデータ形式変換部1について説明す
る。原データファイル2のレコードを原データ入力手段
3で入力する。入力されたレコードはデータ変換手段4
でフィールド単位にデータの内容を調べ、1バイト系の
文字データが存在するか調べる。もし、1バイト系の文
字コードが存在するならばその文字に対応する2バイト
系の文字コードに変換する。同時にその1バイト系の文
字コードの前後に存在するシフトコードは除去すること
ができる。このようにしてデータ変換手段4で1レコー
ド分のデータ変換が終了したら、中間データ出力手段5
で中間ファイル6に出力される。この一連の処理を原デ
ータファイル2のレコード数分繰り返すことで中間ファ
イル6を作り上げる。
の形式を変換するデータ形式変換部1について説明す
る。原データファイル2のレコードを原データ入力手段
3で入力する。入力されたレコードはデータ変換手段4
でフィールド単位にデータの内容を調べ、1バイト系の
文字データが存在するか調べる。もし、1バイト系の文
字コードが存在するならばその文字に対応する2バイト
系の文字コードに変換する。同時にその1バイト系の文
字コードの前後に存在するシフトコードは除去すること
ができる。このようにしてデータ変換手段4で1レコー
ド分のデータ変換が終了したら、中間データ出力手段5
で中間ファイル6に出力される。この一連の処理を原デ
ータファイル2のレコード数分繰り返すことで中間ファ
イル6を作り上げる。
【0022】ここで、データ変換手段4の動作を図2の
フローチャートにて詳細に説明する。図において、12
から30は本文中で説明する処理ステップに対応してい
る。
フローチャートにて詳細に説明する。図において、12
から30は本文中で説明する処理ステップに対応してい
る。
【0023】また、図3はデータ変換手段4で用いるデ
ータであり、図において、31は原データ入力手段3が
入力したレコードが格納されるメモリ上のバッフアであ
り、ここではバッフアAとしている。32はデータ変換
手段4で変換されたレコードが格納されるメモリ上のバ
ッフアであり、ここではバッフアBとしている。33は
バッフアA31のポインタでアドレス値がセットでき
る。このポインタはバッフアAの任意の場所の内容を参
照/更新することができ、このポインタをポインタAと
する。34はバッフアB32のポインタであり、ここで
はポインタBとする。
ータであり、図において、31は原データ入力手段3が
入力したレコードが格納されるメモリ上のバッフアであ
り、ここではバッフアAとしている。32はデータ変換
手段4で変換されたレコードが格納されるメモリ上のバ
ッフアであり、ここではバッフアBとしている。33は
バッフアA31のポインタでアドレス値がセットでき
る。このポインタはバッフアAの任意の場所の内容を参
照/更新することができ、このポインタをポインタAと
する。34はバッフアB32のポインタであり、ここで
はポインタBとする。
【0024】また、図4は1バイト系の文字コードを2
バイト系の文字コードに変換するデータ変換テーブルで
ある。データ変換テーブル35は2バイトの要素が25
6個あるテーブルでそれぞれの要素には1バイト系の文
字コードに対応する2バイト系の文字コードが格納され
ており、その順番は1バイト系の文字コードの値の順番
に並んでいる。1バイト系の文字コードに対応する2バ
イト系の文字を参照するには、1バイト系の文字コード
の値に2を乗じる。データ変換テーブル35の先頭から
その値分先に格納されている2バイトのデータがその1
バイト系の文字コードに対応する2バイト系の文字コー
ドになる。
バイト系の文字コードに変換するデータ変換テーブルで
ある。データ変換テーブル35は2バイトの要素が25
6個あるテーブルでそれぞれの要素には1バイト系の文
字コードに対応する2バイト系の文字コードが格納され
ており、その順番は1バイト系の文字コードの値の順番
に並んでいる。1バイト系の文字コードに対応する2バ
イト系の文字を参照するには、1バイト系の文字コード
の値に2を乗じる。データ変換テーブル35の先頭から
その値分先に格納されている2バイトのデータがその1
バイト系の文字コードに対応する2バイト系の文字コー
ドになる。
【0025】また、図には記述していないが、ここでは
ポインタA33が指している文字コードが1バイト系の
文字コードか2バイト系の文字コードかを記憶するため
の標識(フラグ)を用いる。この標識はポインタA33
が指している文字コードが1バイト系の文字コードなら
ばOFFになり、2バイト系の文字コードならばONに
なる。この標識をフラグAとする。
ポインタA33が指している文字コードが1バイト系の
文字コードか2バイト系の文字コードかを記憶するため
の標識(フラグ)を用いる。この標識はポインタA33
が指している文字コードが1バイト系の文字コードなら
ばOFFになり、2バイト系の文字コードならばONに
なる。この標識をフラグAとする。
【0026】図2のフローチャートを説明する。図1の
原データ入力手段3により原データファイル2のレコー
ドがバッフアA31に読み込まれている。まずポインタ
A33,ポインタB34に初期値をセットする(ステッ
プ12)。この初期値はそれぞれバッフアA31,バッ
フアB32の先頭アドレスである。次にバッフアB32
の内容をクリアする(ステップ13)。次にフラグAの
初期値をセットする。ここでは、バッフアA31に読み
込まれたフィールドの先頭は常に1バイト系の文字コー
ドから始まることになっているので、フラグAはOFF
の状態にしておく(ステップ14)。また、バッフアB
32にセットされる変換後のフィールドは、必ず2バイ
ト系の文字データから始まるので、変換後のデータバッ
フアの先頭にはシフトインコードをセットする(ステッ
プ15)。ポインタB34をシフトインコードの長さ
(ここでは2バイト)分進める(ステップ16)。次
に、ポインタA33の指しているバッフアA31のフィ
ールドの文字データを調べていく(ステップ17)。こ
の時シフトインがあれば、そこからは2バイト系の文字
コードになるのでフラグAをONにする(ステップ1
8)。逆にシフトアウトがあれば、そこからは1バイト
系の文字コードになるのでフラグAをOFFにする(ス
テップ19)。シフトイン,シフトアウトのときにはバ
ッフアB32にはデータをセットせず、ポインタA33
を次の文字に進めるためにポインタA33に2を加える
(ステップ20)。シフトイン,シフトアウト以外のと
きはフラグAの状態を判断する(ステップ21)。フラ
グAがONならば2バイト系の文字コードなので、その
データ2バイト分をそのままセットする(ステップ2
2)。そして、ポインタA33を次の文字に進めるため
ポインタA33に2を加える(ステップ23)。フラグ
AがOFFならば1バイト系の文字コードなので、ポイ
ンタA33の指している文字コードの値をもとに変換テ
ーブル35から対応する2バイト系の文字コードを取り
出し、ポインタB34の指しているバッフアB32の場
所に2バイト分セットする(ステップ24)。ポインタ
A33を次の文字に進めるためポインタA33に1を加
える(ステップ25)。そして、ポインタB34をバッ
フアB32の次の場所に進めるためにポインタB34に
2を加える(ステップ26)。以上の動作を一つのフィ
ールドのデータが終わるまで繰り返す(ステップ2
7)。一つのフィールドの変換が終了したら、ポインタ
B34の指している場所にシフトアウトをセットする
(ステップ28)。そしてポインタB34をシフトアウ
トの長さ(ここでは2バイト)分進める(ステップ2
9)。以上のステップ14からステップ29までの処理
をフィールドの数分繰り返し、1レコード分のデータの
変換を行う(ステップ30)。
原データ入力手段3により原データファイル2のレコー
ドがバッフアA31に読み込まれている。まずポインタ
A33,ポインタB34に初期値をセットする(ステッ
プ12)。この初期値はそれぞれバッフアA31,バッ
フアB32の先頭アドレスである。次にバッフアB32
の内容をクリアする(ステップ13)。次にフラグAの
初期値をセットする。ここでは、バッフアA31に読み
込まれたフィールドの先頭は常に1バイト系の文字コー
ドから始まることになっているので、フラグAはOFF
の状態にしておく(ステップ14)。また、バッフアB
32にセットされる変換後のフィールドは、必ず2バイ
ト系の文字データから始まるので、変換後のデータバッ
フアの先頭にはシフトインコードをセットする(ステッ
プ15)。ポインタB34をシフトインコードの長さ
(ここでは2バイト)分進める(ステップ16)。次
に、ポインタA33の指しているバッフアA31のフィ
ールドの文字データを調べていく(ステップ17)。こ
の時シフトインがあれば、そこからは2バイト系の文字
コードになるのでフラグAをONにする(ステップ1
8)。逆にシフトアウトがあれば、そこからは1バイト
系の文字コードになるのでフラグAをOFFにする(ス
テップ19)。シフトイン,シフトアウトのときにはバ
ッフアB32にはデータをセットせず、ポインタA33
を次の文字に進めるためにポインタA33に2を加える
(ステップ20)。シフトイン,シフトアウト以外のと
きはフラグAの状態を判断する(ステップ21)。フラ
グAがONならば2バイト系の文字コードなので、その
データ2バイト分をそのままセットする(ステップ2
2)。そして、ポインタA33を次の文字に進めるため
ポインタA33に2を加える(ステップ23)。フラグ
AがOFFならば1バイト系の文字コードなので、ポイ
ンタA33の指している文字コードの値をもとに変換テ
ーブル35から対応する2バイト系の文字コードを取り
出し、ポインタB34の指しているバッフアB32の場
所に2バイト分セットする(ステップ24)。ポインタ
A33を次の文字に進めるためポインタA33に1を加
える(ステップ25)。そして、ポインタB34をバッ
フアB32の次の場所に進めるためにポインタB34に
2を加える(ステップ26)。以上の動作を一つのフィ
ールドのデータが終わるまで繰り返す(ステップ2
7)。一つのフィールドの変換が終了したら、ポインタ
B34の指している場所にシフトアウトをセットする
(ステップ28)。そしてポインタB34をシフトアウ
トの長さ(ここでは2バイト)分進める(ステップ2
9)。以上のステップ14からステップ29までの処理
をフィールドの数分繰り返し、1レコード分のデータの
変換を行う(ステップ30)。
【0027】次に、以上のようにしてデータ形式変換部
1で出力された中間ファイル6のレコードの内容を出力
するデータ編集処理部7について説明する。中間ファイ
ル6から、変換されたレコードを中間ファイル入力手段
8で入力する。入力されたレコードはそのまま編集可能
な形式であるので、次のデータ編集手段9で表示可能な
形式に編集され、出力手段10で出力装置11に表示さ
れたり、印字される。
1で出力された中間ファイル6のレコードの内容を出力
するデータ編集処理部7について説明する。中間ファイ
ル6から、変換されたレコードを中間ファイル入力手段
8で入力する。入力されたレコードはそのまま編集可能
な形式であるので、次のデータ編集手段9で表示可能な
形式に編集され、出力手段10で出力装置11に表示さ
れたり、印字される。
【0028】実施例2.実施例1では1バイト系の文字
をそのまま2バイト系の文字に変換していた。これだ
と、1バイト系の文字の長さがそのまま2倍になってし
まう。本実施例では、1バイト系のかな文字に濁点,半
濁点が付いているものに注目し、これを濁音,半濁音の
2バイト系の文字に変換する。図5は、実施例1で使用
したフローチャートに濁点,半濁点の処理を追加したも
のである。図において、36から41は追加された処理
ステップであり、本文中で説明する処理ステップに対応
している。また、21,24,25,26は図2のフロ
ーチャートで同じ番号の処理ステップに対応している。
をそのまま2バイト系の文字に変換していた。これだ
と、1バイト系の文字の長さがそのまま2倍になってし
まう。本実施例では、1バイト系のかな文字に濁点,半
濁点が付いているものに注目し、これを濁音,半濁音の
2バイト系の文字に変換する。図5は、実施例1で使用
したフローチャートに濁点,半濁点の処理を追加したも
のである。図において、36から41は追加された処理
ステップであり、本文中で説明する処理ステップに対応
している。また、21,24,25,26は図2のフロ
ーチャートで同じ番号の処理ステップに対応している。
【0029】次に動作について説明する。フラグAの状
態を判断し(ステップ21)、フラグAがOFFならば
1バイト系の文字コードの変換を行う(ステップ2
4)。このときポインタA33の指している1バイト系
の文字コードを調べる(ステップ36)。その文字が、
かなのカ行,サ行,タ行であるならば、ポインタA33
の指している次の文字が濁点かを判定する(ステップ3
7)。濁点ならばポインタB34が指している2バイト
系の文字コードに対して第1の定数を加える(ステップ
38)。また、ポインタA33の指している1バイト系
の文字がかなのハ行である時、ポインタA33の指して
いる次の文字が濁点か,半濁点かを判定する(ステップ
39)。濁点ならば、ポインタB34が指している2バ
イト系の文字コードに対して第1の定数を加える(ステ
ップ38)。半濁点ならば、ポインタB34が指してい
る2バイト系の文字コードに対して第2の定数を加える
(ステップ40)。このときの定数は、2バイト系の文
字コードがJISの漢字コード(JIS X0208)
であるならば、濁点の時は1、半濁点の時は2とする。
これは、JISの漢字コードではかなの文字コードが
“清音”,“濁音”,“半濁音”の順にコードが定義し
てあることを利用している。そして、上記の濁点,半濁
点の処理が行われたならばポインタA33に2を加える
(ステップ41)。濁点,半濁点の処理が行われていな
いならばポインタA33に1を加える(ステップ2
5)。そして、ポインタB34に2を加える(ステップ
26)。
態を判断し(ステップ21)、フラグAがOFFならば
1バイト系の文字コードの変換を行う(ステップ2
4)。このときポインタA33の指している1バイト系
の文字コードを調べる(ステップ36)。その文字が、
かなのカ行,サ行,タ行であるならば、ポインタA33
の指している次の文字が濁点かを判定する(ステップ3
7)。濁点ならばポインタB34が指している2バイト
系の文字コードに対して第1の定数を加える(ステップ
38)。また、ポインタA33の指している1バイト系
の文字がかなのハ行である時、ポインタA33の指して
いる次の文字が濁点か,半濁点かを判定する(ステップ
39)。濁点ならば、ポインタB34が指している2バ
イト系の文字コードに対して第1の定数を加える(ステ
ップ38)。半濁点ならば、ポインタB34が指してい
る2バイト系の文字コードに対して第2の定数を加える
(ステップ40)。このときの定数は、2バイト系の文
字コードがJISの漢字コード(JIS X0208)
であるならば、濁点の時は1、半濁点の時は2とする。
これは、JISの漢字コードではかなの文字コードが
“清音”,“濁音”,“半濁音”の順にコードが定義し
てあることを利用している。そして、上記の濁点,半濁
点の処理が行われたならばポインタA33に2を加える
(ステップ41)。濁点,半濁点の処理が行われていな
いならばポインタA33に1を加える(ステップ2
5)。そして、ポインタB34に2を加える(ステップ
26)。
【0030】実施例3.実施例1では1バイト系のかな
文字を2バイト系のかな文字に変換する場合に全てカタ
カナ文字に変換していた。これは1バイト系のかな文字
としてカタカナしか存在しないためである。2バイト系
のかな文字にはカタカナ,ひらがなの両方が定義されて
いる。そこで、本実施例では1バイト系のかな文字を2
バイト系のひらがな文字に変換する。図6は実施例1で
使用したフローチャートにひらがな変換を追加したもの
である。図において、42から44は追加された処理ス
テップであり、本文中で説明する処理ステップに対応し
ている。また、21,24,25,26は図2のフロー
チャートで同じ番号の処理ステップに対応している。
文字を2バイト系のかな文字に変換する場合に全てカタ
カナ文字に変換していた。これは1バイト系のかな文字
としてカタカナしか存在しないためである。2バイト系
のかな文字にはカタカナ,ひらがなの両方が定義されて
いる。そこで、本実施例では1バイト系のかな文字を2
バイト系のひらがな文字に変換する。図6は実施例1で
使用したフローチャートにひらがな変換を追加したもの
である。図において、42から44は追加された処理ス
テップであり、本文中で説明する処理ステップに対応し
ている。また、21,24,25,26は図2のフロー
チャートで同じ番号の処理ステップに対応している。
【0031】また、図には記述していないが、外部から
の指示によりON/OFFする標識(フラグ)を用い
る。この標識はカタカナに変換するときにはOFFにな
り、ひらがなに変換するときにはONになる。この標識
をフラグBとする。
の指示によりON/OFFする標識(フラグ)を用い
る。この標識はカタカナに変換するときにはOFFにな
り、ひらがなに変換するときにはONになる。この標識
をフラグBとする。
【0032】次に動作について説明する。フラグAの状
態を判断し(ステップ21)、フラグAがOFFならば
1バイト系の文字コードの変換を行う(ステップ2
4)。ポインタA33を次の文字に進めるためポインタ
A33に1を加える(ステップ25)。つぎにフラグB
の状態を判断する(ステップ42)。フラグBがONな
らばポインタB34が指している2バイト系の文字コー
ドがかな文字の範囲かを判定する(ステップ43)。か
な文字ならばポインタB34が指している2バイト系の
文字コードの値から定数を減ずる(ステップ44)。こ
のときの定数は、2バイト系の文字コードがJISの漢
字コード(JIS X0208)であるならばカタカナ
とひらがなの2バイト系文字コードの差であり、どの文
字でも同一の値となる。これはJISの漢字コードで
は、カタカナとひらがなが一定の値を隔てて同一の並び
になっているからである。そしてポインタB34に2を
加える(ステップ26)。
態を判断し(ステップ21)、フラグAがOFFならば
1バイト系の文字コードの変換を行う(ステップ2
4)。ポインタA33を次の文字に進めるためポインタ
A33に1を加える(ステップ25)。つぎにフラグB
の状態を判断する(ステップ42)。フラグBがONな
らばポインタB34が指している2バイト系の文字コー
ドがかな文字の範囲かを判定する(ステップ43)。か
な文字ならばポインタB34が指している2バイト系の
文字コードの値から定数を減ずる(ステップ44)。こ
のときの定数は、2バイト系の文字コードがJISの漢
字コード(JIS X0208)であるならばカタカナ
とひらがなの2バイト系文字コードの差であり、どの文
字でも同一の値となる。これはJISの漢字コードで
は、カタカナとひらがなが一定の値を隔てて同一の並び
になっているからである。そしてポインタB34に2を
加える(ステップ26)。
【0033】以上のように、このデータ変換処理方式に
よれば、従来扱いにくかった1バイト系の文字コードと
2バイト系の文字コードが混在しているフィールドが、
全て2バイト系の文字コードに統一されるため、フィー
ルドの編集の作業の負担が軽くなる。これを図7で説明
する。
よれば、従来扱いにくかった1バイト系の文字コードと
2バイト系の文字コードが混在しているフィールドが、
全て2バイト系の文字コードに統一されるため、フィー
ルドの編集の作業の負担が軽くなる。これを図7で説明
する。
【0034】図7は、フィールドを2等分する処理を説
明する説明図である。図において、48は本発明による
データ変換処理方式により、1バイト系の文字コードが
2バイト系の文字コードに統一されたフィールドの例で
ある。49は2等分したデータの前半部分を格納するフ
ィールドである。50は2等分したデータの後半部分を
格納するフィールドである。フィールド48の内容を2
等分して前半部分フィールド49と後半部分フィールド
50にそれぞれ格納する処理である。このときの処理は
元のフィールド48のデータを単純に2等分する。そし
て、前半部分のデータは必ず2バイト系の文字コードで
終了しているので、前半部分フィールド49の最後にシ
フトアウトを付加する。また、後半部分では必ず2バイ
ト系の文字コードで始まっているため、後半部分フィー
ルド50の先頭にシフトインを付加する。このシフトコ
ードを付加する処理は固定的に行える。また、2等分さ
れる境界は必ず文字の切れ目となるため内部の文字コー
ドを判定する必要が全く無い。また、図8の混在フィー
ルド45と比較するとフィールドの長さが長くなってし
まうが、本発明の実施例2の濁点,半濁点の処理を行え
ばフィールドが長くなるのを抑えることができる。
明する説明図である。図において、48は本発明による
データ変換処理方式により、1バイト系の文字コードが
2バイト系の文字コードに統一されたフィールドの例で
ある。49は2等分したデータの前半部分を格納するフ
ィールドである。50は2等分したデータの後半部分を
格納するフィールドである。フィールド48の内容を2
等分して前半部分フィールド49と後半部分フィールド
50にそれぞれ格納する処理である。このときの処理は
元のフィールド48のデータを単純に2等分する。そし
て、前半部分のデータは必ず2バイト系の文字コードで
終了しているので、前半部分フィールド49の最後にシ
フトアウトを付加する。また、後半部分では必ず2バイ
ト系の文字コードで始まっているため、後半部分フィー
ルド50の先頭にシフトインを付加する。このシフトコ
ードを付加する処理は固定的に行える。また、2等分さ
れる境界は必ず文字の切れ目となるため内部の文字コー
ドを判定する必要が全く無い。また、図8の混在フィー
ルド45と比較するとフィールドの長さが長くなってし
まうが、本発明の実施例2の濁点,半濁点の処理を行え
ばフィールドが長くなるのを抑えることができる。
【0035】また、実施例ではふれていないが、フィー
ルド48では必ず2バイト系の文字コードになることが
明らかなためシフトイン,シフトアウトは無くてもよい
ので、フィールドの長さをより短くすることができる。
ルド48では必ず2バイト系の文字コードになることが
明らかなためシフトイン,シフトアウトは無くてもよい
ので、フィールドの長さをより短くすることができる。
【0036】また、実施例3のように、外部からカタカ
ナの文字をひらがなの文字に変換する指示を与えられる
ことにより、2バイト系の文字コードから定数を減算す
ることで、ひらがなの2バイト系の文字に変換すること
も可能である。
ナの文字をひらがなの文字に変換する指示を与えられる
ことにより、2バイト系の文字コードから定数を減算す
ることで、ひらがなの2バイト系の文字に変換すること
も可能である。
【0037】また、実施例では原データファイル2を入
力し、それを中間ファイル6として出力するようにして
いるが、原データファイル2を入力し、データ変換手段
4においてデータ変換後、それをそのままデータ編集手
段9に渡して出力手段10から出力装置11に出力して
もよい。
力し、それを中間ファイル6として出力するようにして
いるが、原データファイル2を入力し、データ変換手段
4においてデータ変換後、それをそのままデータ編集手
段9に渡して出力手段10から出力装置11に出力して
もよい。
【0038】
【発明の効果】以上のように、この発明によれば、一つ
のフィールドの中に1バイト系の文字コードと2バイト
系の文字コードが混在するデータを処理するデータ処理
装置において、1バイト系の文字コードに基づき、その
文字に対応する2バイト系の文字コードが参照可能なテ
ーブルを有し、このテーブルを用いて1バイト系の文字
コードを2バイト系の文字コードに変換する変換手段を
備え、一つのフィールドの中に1バイト系の文字コード
と2バイト系の文字コードが混在する場合に、1バイト
系の文字を対応する2バイト系の文字に置き換えるよう
にしたので、従来扱いにくかった1バイト系の文字コー
ドと2バイト系の文字コードが混在しているフィールド
が、全て2バイト系の文字コードに統一されるため、フ
ィールドの編集の作業の負担が軽くなるという効果があ
る。
のフィールドの中に1バイト系の文字コードと2バイト
系の文字コードが混在するデータを処理するデータ処理
装置において、1バイト系の文字コードに基づき、その
文字に対応する2バイト系の文字コードが参照可能なテ
ーブルを有し、このテーブルを用いて1バイト系の文字
コードを2バイト系の文字コードに変換する変換手段を
備え、一つのフィールドの中に1バイト系の文字コード
と2バイト系の文字コードが混在する場合に、1バイト
系の文字を対応する2バイト系の文字に置き換えるよう
にしたので、従来扱いにくかった1バイト系の文字コー
ドと2バイト系の文字コードが混在しているフィールド
が、全て2バイト系の文字コードに統一されるため、フ
ィールドの編集の作業の負担が軽くなるという効果があ
る。
【0039】さらに、1バイト系のかな文字コードに濁
点,半濁点のコードが続く場合、上記1バイト系のかな
文字に対応する2バイト系の文字コードに所定の定数を
加算して、1バイト系のかな文字とそれに続く濁点,半
濁点を対応する2バイト系の濁音,半濁音の文字に置き
換えるようにすることにより、フィールドが長くなるの
を抑えることができ、フィールドに格納できるデータ長
をできるだけ長くすることができる効果がある。
点,半濁点のコードが続く場合、上記1バイト系のかな
文字に対応する2バイト系の文字コードに所定の定数を
加算して、1バイト系のかな文字とそれに続く濁点,半
濁点を対応する2バイト系の濁音,半濁音の文字に置き
換えるようにすることにより、フィールドが長くなるの
を抑えることができ、フィールドに格納できるデータ長
をできるだけ長くすることができる効果がある。
【図1】この発明の一実施例によるデータ変換処理方式
のブロック構成図である。
のブロック構成図である。
【図2】データ変換手段の動作を示すフローチャートで
ある。
ある。
【図3】データ変換手段で用いるデータを示す図であ
る。
る。
【図4】1バイト系の文字コードを2バイト系の文字コ
ードに変換するデータ変換テーブルを示す図である。
ードに変換するデータ変換テーブルを示す図である。
【図5】この発明の一実施例による濁点,半濁点の処理
を示すフローチャートである。
を示すフローチャートである。
【図6】この発明の一実施例によるひらがな変換の処理
を示すフローチャートである。
を示すフローチャートである。
【図7】2バイト系文字コードに統一されたフィールド
を2等分する処理を説明する説明図である。
を2等分する処理を説明する説明図である。
【図8】1バイト系文字データと2バイト系文字データ
の混在するフィールドを2等分する処理を説明する説明
図である。
の混在するフィールドを2等分する処理を説明する説明
図である。
【図9】従来の混在フィールド制御方式のブロック構成
図である。
図である。
【図10】従来例においてビットマップが1ビットであ
るときに、フィールド中の2バイト系の文字データの位
置を相対的に表している関係図である。
るときに、フィールド中の2バイト系の文字データの位
置を相対的に表している関係図である。
【図11】従来例においてビットマップが付加され、デ
ータ属性定義が変換された内部表現形式のレコードの実
例を示す説明図である。
ータ属性定義が変換された内部表現形式のレコードの実
例を示す説明図である。
1 データ形式変換部 2 原データファイル 3 原データ入力手段 4 データ変換手段 5 中間ファイル出力手段 6 中間ファイル 7 データ編集処理部 8 中間ファイル入力手段 9 データ編集手段 10 出力手段 11 出力装置 31 バッフアA 32 バッフアB 33 ポインタA 34 ポインタB 35 データ変換テーブル
Claims (2)
- 【請求項1】 一つのフィールドの中に1バイト系の文
字コードと2バイト系の文字コードが混在するデータを
処理するデータ処理装置において、1バイト系の文字コ
ードに基づき、その文字に対応する2バイト系の文字コ
ードが参照可能なテーブルを有し、このテーブルを用い
て1バイト系の文字コードを2バイト系の文字コードに
変換する変換手段を備え、一つのフィールドの中に1バ
イト系の文字コードと2バイト系の文字コードが混在す
る場合に、1バイト系の文字を対応する2バイト系の文
字に置き換えることを特徴とするデータ変換処理方式。 - 【請求項2】 一つのフィールドの中に1バイト系の文
字コードと2バイト系の文字コードが混在するデータを
処理するデータ処理装置において、1バイト系の文字コ
ードに基づき、その文字に対応する2バイト系の文字コ
ードが参照可能なテーブルを有し、このテーブルを用い
て1バイト系の文字コードを2バイト系の文字コードに
変換する変換手段を備え、一つのフィールドの中に1バ
イト系の文字コードと2バイト系の文字コードが混在す
る場合に、1バイト系の文字を対応する2バイト系の文
字に置き換えるとともに、1バイト系のかな文字コード
に濁点,半濁点のコードが続く場合、上記1バイト系の
かな文字に対応する2バイト系の文字コードに所定の定
数を加算して、1バイト系のかな文字とそれに続く濁
点,半濁点を対応する2バイト系の濁音,半濁音の文字
に置き換えることを特徴とするデータ変換処理方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4128135A JPH05298065A (ja) | 1992-04-21 | 1992-04-21 | データ変換処理方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4128135A JPH05298065A (ja) | 1992-04-21 | 1992-04-21 | データ変換処理方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH05298065A true JPH05298065A (ja) | 1993-11-12 |
Family
ID=14977274
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4128135A Pending JPH05298065A (ja) | 1992-04-21 | 1992-04-21 | データ変換処理方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH05298065A (ja) |
-
1992
- 1992-04-21 JP JP4128135A patent/JPH05298065A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7315867B2 (en) | Document processing apparatus, document processing method, document processing program, and recording medium | |
| EP0268069B1 (en) | Method of forming a message file in a computer | |
| JPH0242071B2 (ja) | ||
| JPH05298065A (ja) | データ変換処理方式 | |
| JPH0962659A (ja) | 印刷装置 | |
| JPS63254542A (ja) | 混在フイ−ルド制御方式 | |
| JPS62257570A (ja) | 仮名漢字変換装置 | |
| JPH05158757A (ja) | ダンプ出力方法 | |
| JPH0721189A (ja) | 翻訳支援装置 | |
| JPS6231375B2 (ja) | ||
| JPH10143496A (ja) | 文書作成装置及び外字の入出力方法 | |
| JPH09223136A (ja) | 文字検査方法および検査文字出力装置 | |
| JPH08137885A (ja) | 多国語文書処理装置 | |
| JPH01142860A (ja) | 日本語端末における半角文字出力方式 | |
| JPH0895975A (ja) | 論理構造化文書の生成方法 | |
| JPH07200546A (ja) | 文書確認方法 | |
| JPH07287713A (ja) | 情報検索装置 | |
| JPH06203031A (ja) | 文字入力装置 | |
| JPH04113453A (ja) | 文書処理方法及び装置 | |
| JP2000089926A (ja) | 印刷ファイル出力装置 | |
| JPS62232019A (ja) | 英数字・日本語混在情報の入力方式 | |
| JPH07141051A (ja) | ネットワーク構成定義文リスト編集方式 | |
| JPH08339371A (ja) | 文書出力装置及び文字修飾方法 | |
| JPH10324039A (ja) | 印刷フォーマットを対話的に変更する方法及びプリンタエミュレータ | |
| JPH01277961A (ja) | 文字変換方式 |