JP2019185403A - レセプト情報・特定健診等情報データベースにおける患者突合方法及び装置 - Google Patents
レセプト情報・特定健診等情報データベースにおける患者突合方法及び装置 Download PDFInfo
- Publication number
- JP2019185403A JP2019185403A JP2018075685A JP2018075685A JP2019185403A JP 2019185403 A JP2019185403 A JP 2019185403A JP 2018075685 A JP2018075685 A JP 2018075685A JP 2018075685 A JP2018075685 A JP 2018075685A JP 2019185403 A JP2019185403 A JP 2019185403A
- Authority
- JP
- Japan
- Prior art keywords
- receipt
- hash value
- month
- same
- patient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
【課題】NDB等のレセプト情報データベースにおける名寄せの効率及び正確性を向上させる患者突合方法及び装置を提供する。【解決手段】保険者番号に基づく第1のハッシュ値と氏名に基づく第2のハッシュ値を有するレセプト情報データベースにおけるデータを突合して患者の名寄せを行う。まず、調剤レセプト以外のレセプト、調剤レセプトを分けて用いて、第1のハッシュ値と第2のハッシュ値及び診療年月を抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致に基づいてレセプトを連結し、同一患者の名寄せ用中間テーブルを生成する。次に、同一患者の中間テーブルを診療年月の時系列に沿って統合し、同一患者における第1のハッシュ値の対応テーブルを生成する。そして、対応テーブルにおいて複数種の第1のハッシュ値が存在する場合、ユニークな第1のハッシュ値に置き換えた名寄せテーブルを生成する。【選択図】図1
Description
本発明は、レセプト情報・特定健診等情報データベース(NDB)におけるレセプトデータ及び特定健診等のデータを突合して患者の名寄せを行う技術に関するものである。
レセプト情報・特定健診等情報データベース(NDB)とは、診療報酬請求のために、病院等から審査支払機関及び保険者に送信される電子レセプトデータ、及び保険者の保有する特定健診等のデータを、匿名化処理を経て格納・構築したデータベースであり、国民皆保険制度を採る我が国における保険診療の悉皆データである。NDBは平成21年4月〜平成28年12月診療分で、約128億8,400万件(平成29年3月末時点)のレセプトデータが蓄積されるなど、世界最大級の健康関連データベースであり、これを有効に活用することで各種の臨床研究、政策研究が強力に推進できると期待されている。
しかし現状は、疾患別、地域別等の部分的な活用に留まっており、成果が十分に上がっているとは言いがたい。その理由として、NDBの巨大なサイズと並び、診療報酬請求のために設定されているレセプトの構造がそのままでは研究目的での利用に適さない形式となっていることが主因として挙げられる。その中でも、後述する「名寄せ」は大きな問題点である。
各医療機関は、患者ごとに、毎月、診療報酬を請求するので、レセプトデータは、1人の患者に対し、医療機関単位、1か月単位で送信されている。患者が複数月に渡って受診したり、同一月に複数の医療機関を受診したりすることは頻繁にあるため、同一患者の複数レセプトをつなぎ合わせる「名寄せ」作業を行わなければ、個人単位での分析を行うことはできない。そのため、NDBには、名寄せを可能とする個人紐付け用の匿名変数として、「ID1」と「ID2」が用意されている。ID1は保険者番号、被保険者証等記号・番号、生年月日、性別から個人情報保護のためにハッシュ関数を用いてハッシュ化された英数字列であり、ID2は氏名、生年月日、性別から同様にハッシュ関数を用いてハッシュ化された英数字列である。
ここで、ハッシュ関数とは、与えられたデータから一定長の疑似乱数(ハッシュ値)を生成するものであり、異なるデータから同じハッシュ値を生成することは極めて困難であるとされている。また生成された値(ハッシュ値)から元データを再現することはできないため、データの匿名化に有用とされている。しかしながら、保険者番号、記号・番号、生年月日、性別及び氏名といった個人情報を基にハッシュ値を生成するため、1つのハッシュ値を生成するだけでは、保険者番号や氏名といった個人情報に変化があった場合に突合が困難となる。そのため、NDBでは「ID1」と「ID2」の2つのハッシュ値が用意され、これらのハッシュ値を基に突合する構造となっている。
ところが、同一患者でも、就職・転職等で保険者は変化し、医療機関での表記ゆれ(例えば、“渡辺”と“渡邉”)や結婚・離婚等で氏名表記は変化するため、ID1、ID2ともに容易に変わり得ることが分かっている。下記表1は、別人物にも拘らずIDが同じとなる場合をまとめた表である。
上記表1に示すように、別人物にも拘らずIDが同じとなる場合としては、ID1もID2も同じである場合、ID1が異なるがID2が同じである場合及びID1が同じでID2が異なる場合が考えられる。
まず、ID1もID2も同じである場合とは、別人物同士で同一のID1、ID2が生成された場合である(X1)。ID1が異なるがID2が同じである場合とは、別人物同士で同一のID2が生成された場合(Y1)や、同姓同名・同一生年月日で、同じ性別だった場合(Y2)のことである。ID1が同じでID2が異なる場合とは、別人物同士で同一のID1が生成された場合(Z1)や、同性・同一生年月日の複産(双子等)の場合(Z2)のことである。なお、平成26年の人口動態調査によれば、複産全体は1年間に1万件発生している。
下記表2は、表1とは異なり、同一人物にも拘らずIDが合わない場合をまとめた表である。
まず、ID1もID2も同じである場合とは、別人物同士で同一のID1、ID2が生成された場合である(X1)。ID1が異なるがID2が同じである場合とは、別人物同士で同一のID2が生成された場合(Y1)や、同姓同名・同一生年月日で、同じ性別だった場合(Y2)のことである。ID1が同じでID2が異なる場合とは、別人物同士で同一のID1が生成された場合(Z1)や、同性・同一生年月日の複産(双子等)の場合(Z2)のことである。なお、平成26年の人口動態調査によれば、複産全体は1年間に1万件発生している。
下記表2は、表1とは異なり、同一人物にも拘らずIDが合わない場合をまとめた表である。
上記表2に示すように、同一人物にも拘らずIDが合わない場合としては、ID1は変わるがID2は不変である場合、ID1は不変であるがID2が変わる場合及びID1もID2も変わる場合が考えられる。
まず、ID1は変わるがID2は不変である場合としては、就職・転職(A1−1)、離職(A1−2)、定年(A1−3)、就職・転職等で扶養が外れる(A1−4)、扶養者の婚姻・離婚による保険変更(A2−1)、養子縁組による扶養者変更に伴う保険変更(A2−2)、扶養者の変更(A2−3)、国保加入者における居住地変更(A3)、後期高齢者制度への加入(A4)又は保険証番号が流出した患者(A5)といった場合が考えられる。ID1は不変であるがID2が変わる場合としては、養子による改姓(B1)、結婚・離婚による改姓(B2−1)、扶養者の結婚・離婚等による改姓(B2−2)、氏名変更(B3)、記入ミス・氏名等の記載ゆれ(B4)又は国籍取得に伴う氏名変更(B5)といった場合が考えられる。
まず、ID1は変わるがID2は不変である場合としては、就職・転職(A1−1)、離職(A1−2)、定年(A1−3)、就職・転職等で扶養が外れる(A1−4)、扶養者の婚姻・離婚による保険変更(A2−1)、養子縁組による扶養者変更に伴う保険変更(A2−2)、扶養者の変更(A2−3)、国保加入者における居住地変更(A3)、後期高齢者制度への加入(A4)又は保険証番号が流出した患者(A5)といった場合が考えられる。ID1は不変であるがID2が変わる場合としては、養子による改姓(B1)、結婚・離婚による改姓(B2−1)、扶養者の結婚・離婚等による改姓(B2−2)、氏名変更(B3)、記入ミス・氏名等の記載ゆれ(B4)又は国籍取得に伴う氏名変更(B5)といった場合が考えられる。
次に、ID1もID2も変わる場合としては、まず、上記の“A”と“B”を掛け合わせた場合が考えられる。例えば、結婚に伴う退社・改姓(A1−2*B2−1)、離婚に伴う就職・改姓(A1−1*B2−1)又は養子による改姓・保険者変更(A2−2*B1)といった場合が考えられる。また“A”と“B”を掛け合わせた場合以外としては、性転換(C3)の場合が考えられる。
同一人物にも拘らずIDが合わない場合については、例えば、就職・転職(A1−1)、離職(A1−2)又は定年(A1−3)の何れかによりID1が変わった人は、厚生労働省「平成26年雇用動向調査結果の概況」によると1年間に約713万人存在することが分かっている。就職・転職等で扶養が外れる(A1−4)人は1年間に約800万人、平成26年の総務省統計局人口推計によると後期高齢者制度への加入(A4)によりID1が変わる人が約122万人存在することが分かっている。また、2014年度時点での法務省戸籍統計によると、1年間の婚姻数は約65万組であるので、それに近い数の改姓が行われていることも推測できる。このように、同一人物にも拘らずIDが合わない場合は非常に多く存在することが分かる。
そのため、就職・転職等の前と後で、1人の患者による受診を異なる2人の患者の受診と認識する等の可能性が生じ、NDBを用いた患者数の推計や患者1人あたりの推計値は大きな誤差を含むと考えられる。この問題を解決するためには、NDBに一生涯不変の個人IDを付与する必要があるが、その実現に向けては議論が緒に就いたばかりである。また、不変IDの導入が実現しても過去データについては現行のID1とID2を用いるほかない。
なお、NDBの患者突合性を高める動きとして、ID3を付与する動きがある。しかし、ID3は特定健診のID1において前述の表記ゆれ(全角半角の違い、頭に0が付与されているか否か)を改善し、特定健診等のデータとレセプトのデータの患者突合性を改善するものである。したがって、ID3を使用しても名寄せを行う必要性に変わりはない。
なお、NDBの患者突合性を高める動きとして、ID3を付与する動きがある。しかし、ID3は特定健診のID1において前述の表記ゆれ(全角半角の違い、頭に0が付与されているか否か)を改善し、特定健診等のデータとレセプトのデータの患者突合性を改善するものである。したがって、ID3を使用しても名寄せを行う必要性に変わりはない。
レセプトデータ及び健診データの名寄せについては、健診データとレセプトデータとを突合できる健康管理システムが知られている(特許文献1を参照)。
これは、健診データベースと、レセプトデータベースと、対応付け手段と、健診データ取込手段と、レセプトデータ取込手段と、第1の連結キー取得手段と、健診データ追加手段と、第2の連結キー取得手段と、レセプトデータ追加手段とを備えるシステムである。これによれば、外部から健診データを取り込んだ場合には、対応付けられた個人情報に基づいてレセプトデータベースから連結キーを取得し、その連結キーを付与して取り込んだ健診データを健診データベースに追加登録し、一方、外部からレセプトデータを取り込んだ場合は、対応付けられた個人情報に基づいて健診データベースから連結キーを取得し、その連結キーを付与して取り込んだレセプトデータをレセプトデータベースに追加登録することができる。その結果、健診データとレセプトデータとを突合することができる。
しかしながら、上記特許文献1に開示された健康管理システムは、就職・転職や氏名の表記ゆれ等により、個人紐付け用の匿名変数が容易に変わってしまうという問題を解決するものではない。
これは、健診データベースと、レセプトデータベースと、対応付け手段と、健診データ取込手段と、レセプトデータ取込手段と、第1の連結キー取得手段と、健診データ追加手段と、第2の連結キー取得手段と、レセプトデータ追加手段とを備えるシステムである。これによれば、外部から健診データを取り込んだ場合には、対応付けられた個人情報に基づいてレセプトデータベースから連結キーを取得し、その連結キーを付与して取り込んだ健診データを健診データベースに追加登録し、一方、外部からレセプトデータを取り込んだ場合は、対応付けられた個人情報に基づいて健診データベースから連結キーを取得し、その連結キーを付与して取り込んだレセプトデータをレセプトデータベースに追加登録することができる。その結果、健診データとレセプトデータとを突合することができる。
しかしながら、上記特許文献1に開示された健康管理システムは、就職・転職や氏名の表記ゆれ等により、個人紐付け用の匿名変数が容易に変わってしまうという問題を解決するものではない。
かかる状況に鑑みて、本発明は、NDB等のレセプト情報データベースにおける名寄せの効率及び正確性を向上させる患者突合方法及び装置を提供することを目的とする。
上記課題を解決すべく、本発明の患者突合方法は、保険者番号に基づく第1のハッシュ値と氏名に基づく第2のハッシュ値の少なくとも2つの検索キーを有するレセプト情報データベースの突合方法であって、下記1)〜4)のステップを備え、データベースにおけるデータを突合して患者の名寄せを行う。
1)調剤レセプト以外のレセプトを用いて、第1のハッシュ値と第2のハッシュ値及び診療年月を少なくとも抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致に基づいてレセプトを連結し、同一患者の第1の名寄せ用中間テーブルを生成する。
2)調剤レセプトを用いて、第1のハッシュ値と第2のハッシュ値及び診療年月を少なくとも抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致に基づいてレセプトを連結し、同一患者の第2の名寄せ用中間テーブルを生成する。
3)同一患者の第1の名寄せ用中間テーブルと第2の名寄せ用中間テーブルを診療年月の時系列に沿って統合し、同一患者における第1のハッシュ値の対応テーブルを生成する。
4)対応テーブルにおいて複数種の第1のハッシュ値が存在する場合には、複数種の第1のハッシュ値をユニークな第1のハッシュ値に置き換えた名寄せテーブルを生成する。
1)調剤レセプト以外のレセプトを用いて、第1のハッシュ値と第2のハッシュ値及び診療年月を少なくとも抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致に基づいてレセプトを連結し、同一患者の第1の名寄せ用中間テーブルを生成する。
2)調剤レセプトを用いて、第1のハッシュ値と第2のハッシュ値及び診療年月を少なくとも抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致に基づいてレセプトを連結し、同一患者の第2の名寄せ用中間テーブルを生成する。
3)同一患者の第1の名寄せ用中間テーブルと第2の名寄せ用中間テーブルを診療年月の時系列に沿って統合し、同一患者における第1のハッシュ値の対応テーブルを生成する。
4)対応テーブルにおいて複数種の第1のハッシュ値が存在する場合には、複数種の第1のハッシュ値をユニークな第1のハッシュ値に置き換えた名寄せテーブルを生成する。
1)のステップにおいて、第1のハッシュ値と第2のハッシュ値及び診療年月以外に転帰区分を抽出することが好ましく、さらに転帰区分としては“死亡転帰”を抽出することが好ましい。調剤レセプトをそれ以外のレセプトと分けて用いるのは、外来では、医師が発行する処方箋に基づき院外の薬局で調剤が行われることが多く、医科入院外と調剤についてはペアでレセプトが発生することが多いため、一括処理を行うと患者の紐づけ情報が多対多となり、純正なマッチングが困難になるからである。
なお、調剤レセプトとそれ以外のレセプトを分けずに、一緒に処理することも可能である。かかる場合には、1)のステップにおいて、調剤レセプトを含めた処理を行い、2)のステップを省略する。また、その場合、3)のステップにおいては、第1の名寄せ用中間テーブルと第2の名寄せ用中間テーブルの統合は行わず、第1の名寄せ用中間テーブルのみを基に、同一患者における第1のハッシュ値の対応テーブルを生成する。
なお、調剤レセプトとそれ以外のレセプトを分けずに、一緒に処理することも可能である。かかる場合には、1)のステップにおいて、調剤レセプトを含めた処理を行い、2)のステップを省略する。また、その場合、3)のステップにおいては、第1の名寄せ用中間テーブルと第2の名寄せ用中間テーブルの統合は行わず、第1の名寄せ用中間テーブルのみを基に、同一患者における第1のハッシュ値の対応テーブルを生成する。
上記1)、2)の第1及び第2の名寄せ用中間テーブル生成ステップにおいて、具体的には、下記5),6)のステップを行う。
5)第1のハッシュ値と第2のハッシュ値の両方が一致する場合、同一患者のレセプトとして連結し、最初のレセプト発生月から最終のレセプト発生月まで、又は、最初のレセプト発生月から転帰区分にて死亡転帰が示される当該月まで、を1つのレセプトグループとして連結する。
6)それぞれのレセプトグループにおいて、第1のハッシュ値又は第2のハッシュ値の何れかのみ一致する場合、最終のレセプト発生月を連結対象とするレセプトグループの連結候補を、第1のハッシュ値が一致、最も時系列的に近い、同年月を除き期間がオーバーラップしない、又は、同じ第1若しくは第2のハッシュ値の候補の最初のレセプト発生月が同一ではない、の少なくとも何れかを満足する最初のレセプト発生月を連結対象とするレセプトグループと連結する。
ここで、レセプトグループとは、2つ以上のレセプトが紐付けされたものだけではなく、他のレセプトと紐付けされていない1つのレセプトも含む意味で用いている。
5)第1のハッシュ値と第2のハッシュ値の両方が一致する場合、同一患者のレセプトとして連結し、最初のレセプト発生月から最終のレセプト発生月まで、又は、最初のレセプト発生月から転帰区分にて死亡転帰が示される当該月まで、を1つのレセプトグループとして連結する。
6)それぞれのレセプトグループにおいて、第1のハッシュ値又は第2のハッシュ値の何れかのみ一致する場合、最終のレセプト発生月を連結対象とするレセプトグループの連結候補を、第1のハッシュ値が一致、最も時系列的に近い、同年月を除き期間がオーバーラップしない、又は、同じ第1若しくは第2のハッシュ値の候補の最初のレセプト発生月が同一ではない、の少なくとも何れかを満足する最初のレセプト発生月を連結対象とするレセプトグループと連結する。
ここで、レセプトグループとは、2つ以上のレセプトが紐付けされたものだけではなく、他のレセプトと紐付けされていない1つのレセプトも含む意味で用いている。
第1のハッシュ値が一致するものを優先して連結するのは、第2のハッシュ値については、同姓同名・同一生年月日・同性患者が同一IDとなってしまうが、第1のハッシュ値では、同じ扶養に入っている同性の双子等を除き、別人が同一IDとなる頻度が比較的少ないからである。最も時系列的に近いものを優先して連結するのは、時系列的に近いものの方がより同一人物である可能性が高いからである。
同年月を除き期間がオーバーラップしないものを連結するのは、期間がオーバーラップする場合には、同一人物でない可能性が高いからである。また、同年月を除くのは、就職や結婚などの事由が発生した月においては、同一人について複数の異なる第1又は第2のハッシュ値が存在することとなるからである。
同年月を除き期間がオーバーラップしないものを連結するのは、期間がオーバーラップする場合には、同一人物でない可能性が高いからである。また、同年月を除くのは、就職や結婚などの事由が発生した月においては、同一人について複数の異なる第1又は第2のハッシュ値が存在することとなるからである。
また、資格喪失したレセプトについては、審査支払機関を経由し保険者でチェックを行い再審査請求となるため、3か月間程度は新旧の第1のハッシュ値が並存し得ることとなる。そこで、第2のハッシュ値の一致に基づいてレセプトを連結する際には、同年月だけではなく、最終のレセプト発生月の前月及び前々月についてオーバーラップするものであっても連結してもよい。かかる場合においても、最終のレセプト発生月以降に最初のレセプト発生月を有するレセプトグループの方が、最終のレセプト発生月の前月又は前々月に最初のレセプト発生月を有するレセプトグループよりも同一人物である可能性は高いと考えられるため、最終のレセプト発生月以降、前月、前々月の順に優先して連結を行うことが好ましい。
同じ第1若しくは第2のハッシュ値の候補の最初のレセプト発生月が同一ではないものを連結するのは、最初のレセプト発生月が同一である場合には、どちらのレセプトグループと連結すべきかの判断が困難であるからである。
同じ第1若しくは第2のハッシュ値の候補の最初のレセプト発生月が同一ではないものを連結するのは、最初のレセプト発生月が同一である場合には、どちらのレセプトグループと連結すべきかの判断が困難であるからである。
上記6)において、それぞれのレセプトグループにおいて、第1のハッシュ値又は第2のハッシュ値の何れかのみ一致する場合、最終のレセプト発生月を連結対象とするレセプトグループの連結候補を、第1のハッシュ値が一致、最も時系列的に近い、同年月を除き期間がオーバーラップしない、及び、同じ第1若しくは第2のハッシュ値の候補の最初のレセプト発生月が同一ではない、の全てを満足するレセプトグループと連結するのがより好ましい。
また、死亡転帰が示されるレセプトグループでは、その最終月から3か月を超えた最初のレセプト発生月を有する他のレセプトグループとは連結しないことが好ましい。死亡転帰が示されるレセプトグループであっても、患者の死亡直後では、紐付けすべきレセプトも存在するが、3か月を超えた場合には、紐付けする必要はないと考えられるからである。
また、レセプト情報における医療機関所在地、診療開始年月日、傷病名、又は、患者の年齢階級の少なくとも何れかが一致するレセプトグループと連結することでもよい。例えば、同じハッシュ値であったとしても、遠く離れた土地でまったく異なる病名で受診した患者は別人物と考えるのが妥当であるし、異なるハッシュ値であったとしても、受診地や年齢階級、病名が一致する患者は同一人物である可能性が高まるからである。
なお、ここで一致とは、厳密な一致を要求するものではなく、近似した情報を含めてもよい。例えば、医療機関所在地の一致とは、同一の市区町村であることとしてもよいし、より広く同一の都道府県であることとしてもよい。また、傷病名が表現が異なるが実質的に同一の疾病である場合なども一致と判断できる。
なお、ここで一致とは、厳密な一致を要求するものではなく、近似した情報を含めてもよい。例えば、医療機関所在地の一致とは、同一の市区町村であることとしてもよいし、より広く同一の都道府県であることとしてもよい。また、傷病名が表現が異なるが実質的に同一の疾病である場合なども一致と判断できる。
本発明の患者突合プログラムは、上記の患者突合方法における各ステップを、コンピュータに実行させるプログラムである。
本発明の患者突合装置は、保険者番号に基づく第1のハッシュ値と氏名に基づく第2のハッシュ値の少なくとも2つの検索キーを有するレセプト情報データベースの突合を行う装置であって、下記a)〜d)の手段を備え、データベースにおけるデータを突合して患者の名寄せを行う。
a)調剤レセプト以外のレセプトを入力し、第1のハッシュ値と第2のハッシュ値及び診療年月を少なくとも抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致を判断し、該判断に基づいて同一患者のレセプトを連結し、第1の名寄せ用中間テーブルを生成する第1の名寄せ用中間テーブル生成手段。
b)調剤レセプトを入力し、第1のハッシュ値と第2のハッシュ値及び診療年月を少なくとも抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致を判断し、該判断に基づいて同一患者のレセプトを連結し、第2の名寄せ用中間テーブルを生成する第2の名寄せ用中間テーブル生成手段。
c)同一患者の第1の名寄せ用中間テーブルと第2の名寄せ用中間テーブルを診療年月の時系列に沿って統合し、同一患者における第1のハッシュ値の対応テーブルを生成する対応テーブル生成手段。
d)対応テーブルにおいて複数種の第1のハッシュ値が存在する場合には、複数種の第1のハッシュ値をユニークな第1のハッシュ値に置き換えた名寄せテーブルを生成する名寄せテーブル生成手段。
a)調剤レセプト以外のレセプトを入力し、第1のハッシュ値と第2のハッシュ値及び診療年月を少なくとも抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致を判断し、該判断に基づいて同一患者のレセプトを連結し、第1の名寄せ用中間テーブルを生成する第1の名寄せ用中間テーブル生成手段。
b)調剤レセプトを入力し、第1のハッシュ値と第2のハッシュ値及び診療年月を少なくとも抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致を判断し、該判断に基づいて同一患者のレセプトを連結し、第2の名寄せ用中間テーブルを生成する第2の名寄せ用中間テーブル生成手段。
c)同一患者の第1の名寄せ用中間テーブルと第2の名寄せ用中間テーブルを診療年月の時系列に沿って統合し、同一患者における第1のハッシュ値の対応テーブルを生成する対応テーブル生成手段。
d)対応テーブルにおいて複数種の第1のハッシュ値が存在する場合には、複数種の第1のハッシュ値をユニークな第1のハッシュ値に置き換えた名寄せテーブルを生成する名寄せテーブル生成手段。
本発明によれば、NDB等のレセプト情報データベースにおける名寄せの効率及び正確性を向上できるといった効果がある。また、これにより、「ある薬の処方数」だけではなく、「薬を飲んでいる患者の数」や「それらの患者が受けている医療行為の全体像」を臨床的に意味のある正確さで集計できるといった効果がある。
以下、本発明の実施形態の一例を、図面を参照しながら詳細に説明していく。なお、本発明の範囲は、以下の実施例や図示例に限定されるものではなく、幾多の変更及び変形が可能である。
本実施例では、平成25年4月〜平成26年3月の計12か月分の医科入院レセプト、医科入院外レセプト、DPCレセプト、調剤レセプト全体を対象としている。DPCとは、平成15年に導入された診断群分類に基づく入院医療費の1日あたり包括支払い制度であり、DPC対象の入院で発生するレセプトの内、包括支払いに関連するレセプトがDPCレセプトとなる。したがって、包括支払いに関連のない入院レセプトは医科入院レセプトとなる。これらのレセプトデータを使用して、複数月に渡るID等の変化を観察し、ID1、ID2のほか、診療年月、転帰区分を利用し作成した患者突合方法について説明する。
外来では、医師が発行する処方箋に基づき院外の薬局で調剤が行われることが多く、医科入院外と調剤についてはペアでレセプトが発生することが多い。そのため、一括処理を行うと患者の紐付け情報が多対多となり、純正なマッチングが困難になる。そこで、本実施例は、DPC及び医科(入院/入院外)レセプトを用いた第1の名寄せ用中間テーブルと調剤レセプトを用いた第2の名寄せ用中間テーブルを別々に生成し、両者を突合して名寄せを完成させる仕組みとなっている。
なお、本実施例とは異なり、第1の名寄せ用中間テーブルの生成に、特定健診等のデータを用いてもよい。
外来では、医師が発行する処方箋に基づき院外の薬局で調剤が行われることが多く、医科入院外と調剤についてはペアでレセプトが発生することが多い。そのため、一括処理を行うと患者の紐付け情報が多対多となり、純正なマッチングが困難になる。そこで、本実施例は、DPC及び医科(入院/入院外)レセプトを用いた第1の名寄せ用中間テーブルと調剤レセプトを用いた第2の名寄せ用中間テーブルを別々に生成し、両者を突合して名寄せを完成させる仕組みとなっている。
なお、本実施例とは異なり、第1の名寄せ用中間テーブルの生成に、特定健診等のデータを用いてもよい。
図1は、実施例1の患者突合方法のフロー図を示している。図1に示すように、まず、医科入院レセプト、医科入院外レセプト及びDPCレセプトを用いて、第1の名寄せ用中間テーブルを生成する(ステップS01)。次に、調剤レセプトを用いて、第2の名寄せ用中間テーブルを生成する(ステップS02)。第1の名寄せ用中間テーブルと第2の名寄せ用中間テーブルを統合する(ステップS03)。最後に、名寄せテーブルを生成する(ステップS04)。
(第1の名寄せ用中間テーブル生成について)
図2は、第1の名寄せ用中間テーブル生成フロー図を示している。図1では名寄せテーブル生成の全体フローを示したが、図2では、個別のレセプトに着目して以下、説明を行う。図2に示すように、第1の名寄せ用中間テーブル生成においては、医科入院レセプト、医科入院外レセプト及びDPCレセプトからID1、ID2、診療年月、転帰区分を抽出する(ステップS11)。なおDPCレセプトとは、DPC入院の総括対象医科入院レセプト、DPC入院のDPCレセプト、及び、DPC入院の総括対象DPCレセプトのことを指している。また、ステップS11で示した転帰区分については死亡情報を抽出している。後述するが、レセプトデータに死亡転帰が示されている場合は、その月から3か月以内のレセプトデータのみを紐付け、3か月を超えたレセプトデータについては紐付けを行わない。
図2は、第1の名寄せ用中間テーブル生成フロー図を示している。図1では名寄せテーブル生成の全体フローを示したが、図2では、個別のレセプトに着目して以下、説明を行う。図2に示すように、第1の名寄せ用中間テーブル生成においては、医科入院レセプト、医科入院外レセプト及びDPCレセプトからID1、ID2、診療年月、転帰区分を抽出する(ステップS11)。なおDPCレセプトとは、DPC入院の総括対象医科入院レセプト、DPC入院のDPCレセプト、及び、DPC入院の総括対象DPCレセプトのことを指している。また、ステップS11で示した転帰区分については死亡情報を抽出している。後述するが、レセプトデータに死亡転帰が示されている場合は、その月から3か月以内のレセプトデータのみを紐付け、3か月を超えたレセプトデータについては紐付けを行わない。
抽出されたデータを基に、まず、複数月に渡ってID1及びID2が同じ患者は同一人物とする(ステップS12)。図3は、ID1及びID2が同一の場合のグラフを示している。図3に示すように、レセプトグループAは、ID1が“130”、ID2が“479”で共通するレセプトをグループ化している。レセプトグループAでは、2015年4月、6月、10〜12月について共通のID1及びID2となっているが、診察にかからなかった月も含め、1つのグループとしている。このように紐付けたグループにおける最初のレセプト発生月及び最終のレセプト発生月について、他のレセプトグループと比較する。
レセプトグループ同士の比較は、ID1とID2の内、ID1を優先して行う。図4は、ID1とID2の紐付けの優先順位を示すグラフである。図4に示すように、レセプトグループBのID1は“130”であり、レセプトグループAと共通である。また、レセプトグループBのID2は“479”であり、レセプトグループCと共通である。年月についてみると、レセプトグループAの最初のレセプト発生月は2016年2月で、レセプトグループCの最初のレセプト発生月は2015年12月であり、レセプトグループBの最終のレセプト発生月である2015年10月とより近いのはレセプトグループCであるといえる。
しかしながら、ID1とID2のどちらにも紐付け可能な場合は、ID1を優先する。これは、ID2では同姓同名・同一生年月日・同性患者が同一IDとなってしまうが,ID1では、同じ扶養に入っている同性の双子等を除き、別人が同一IDとなる頻度が比較的少ないからである。
したがって、ID1を共通とするレセプトグループが存在する(ステップS13)場合には、ID1を共通とするレセプトグループ同士を紐付けする(ステップS14)。その後、ID2を共通とするレセプトグループが存在するかの判断を行い(ステップS15)、ID2を共通とするレセプトグループが存在する場合には、ID2を共通とするレセプトグループ同士を紐付けする(ステップS16)。
しかしながら、ID1とID2のどちらにも紐付け可能な場合は、ID1を優先する。これは、ID2では同姓同名・同一生年月日・同性患者が同一IDとなってしまうが,ID1では、同じ扶養に入っている同性の双子等を除き、別人が同一IDとなる頻度が比較的少ないからである。
したがって、ID1を共通とするレセプトグループが存在する(ステップS13)場合には、ID1を共通とするレセプトグループ同士を紐付けする(ステップS14)。その後、ID2を共通とするレセプトグループが存在するかの判断を行い(ステップS15)、ID2を共通とするレセプトグループが存在する場合には、ID2を共通とするレセプトグループ同士を紐付けする(ステップS16)。
(ID1を共通とするレセプトグループ同士の紐付けについて)
図5は、ID1を共通とするレセプトグループ同士の紐付けフロー図を示している。図5に示すように、まず、最初のレセプト発生月が先のレセプトグループの最終のレセプト発生月と同年月以降である、後のレセプトグループを抽出する(ステップS21)。図6は、紐付けにおける最終のレセプト発生月と最初のレセプト発生月の関係を示すグラフである。図6に示すように、レセプトグループAのID1とレセプトグループBのID1はいずれも“130”であり共通している。そして、レセプトグループAの最終のレセプト発生月は2015年の10月であり、レセプトグループBの最初のレセプト発生月も2015年の10月であるため、後のレセプトグループであるレセプトグループBは、最初のレセプト発生月が先のレセプトグループであるレセプトグループAの最終のレセプト発生月と同年月となり、紐付け可能となる。これとは異なり、例えば、レセプトグループBの最初のレセプト発生月が2015年の9月であるような場合には、上記条件を充たさず、紐付けは行わないこととなる。
図5は、ID1を共通とするレセプトグループ同士の紐付けフロー図を示している。図5に示すように、まず、最初のレセプト発生月が先のレセプトグループの最終のレセプト発生月と同年月以降である、後のレセプトグループを抽出する(ステップS21)。図6は、紐付けにおける最終のレセプト発生月と最初のレセプト発生月の関係を示すグラフである。図6に示すように、レセプトグループAのID1とレセプトグループBのID1はいずれも“130”であり共通している。そして、レセプトグループAの最終のレセプト発生月は2015年の10月であり、レセプトグループBの最初のレセプト発生月も2015年の10月であるため、後のレセプトグループであるレセプトグループBは、最初のレセプト発生月が先のレセプトグループであるレセプトグループAの最終のレセプト発生月と同年月となり、紐付け可能となる。これとは異なり、例えば、レセプトグループBの最初のレセプト発生月が2015年の9月であるような場合には、上記条件を充たさず、紐付けは行わないこととなる。
次に、抽出された後のレセプトグループが複数存在しないかにつき判断がなされ(ステップS22)、1つしか存在しない場合には、該レセプトグループを選択する(ステップS23)。これに対して、抽出された後のレセプトグループが複数存在する場合には、後のレセプトグループ同士の最初のレセプト発生月は異なるかの判断がなされる(ステップS24)。
ここで、後のレセプトグループ同士の最初のレセプト発生月は同一である場合には紐付けはなされない(ステップS28)。図7は、最初のレセプト発生月が同一である場合を示すグラフである。図7に示すように、レセプトグループA、B及びCのID1は、いずれも“130”であり共通している。しかしながら、レセプトグループAの最終のレセプト発生月に対するレセプトグループB及びCの最初のレセプト発生月はいずれも2016年1月であり、最初のレセプト発生月が同一であるといえる。したがって、レセプトグループAは、B又はCのいずれとも紐付けはなされないこととなる。
ここで、後のレセプトグループ同士の最初のレセプト発生月は同一である場合には紐付けはなされない(ステップS28)。図7は、最初のレセプト発生月が同一である場合を示すグラフである。図7に示すように、レセプトグループA、B及びCのID1は、いずれも“130”であり共通している。しかしながら、レセプトグループAの最終のレセプト発生月に対するレセプトグループB及びCの最初のレセプト発生月はいずれも2016年1月であり、最初のレセプト発生月が同一であるといえる。したがって、レセプトグループAは、B又はCのいずれとも紐付けはなされないこととなる。
図5のステップS24において、後のレセプトグループ同士の最初のレセプト発生月が異なる場合には、先のレセプトグループの最終のレセプト発生月に最も近い最初のレセプト発生月を有する後のレセプトグループを選択する(ステップS25)。図8は、最初のレセプト発生月が異なる場合の紐付けの優先順位を示すグラフである。図8に示すように、レセプトグループA、B及びCのID1は、いずれも“260”であり共通している。しかしながら、レセプトグループAの最終のレセプト発生月2015年3月に対して、レセプトグループBの最初のレセプト発生月は2015年5月、レセプトグループCの最初のレセプト発生月は2016年1月となっている。このような場合には、レセプトグループAは、レセプトグループAの最終のレセプト発生月2015年3月により近い最初のレセプト発生月を有するレセプトグループBと紐付けすることとなる。
図5のステップS23及びステップS25において、後のレセプトグループが選択された場合でも、先のレセプトグループの転帰区分に死亡転帰が示されている場合には、先のレセプトグループの最終のレセプト発生月から3か月を超えた最初のレセプト発生月を有する後のレセプトグループ(ステップS26)については、紐付けがなされない(ステップS28)。
これに対して、先のレセプトグループの転帰区分に死亡転帰が示されていない場合、又は、死亡転帰が示されているが、選択された後のレセプトグループが、先のレセプトグループの最終のレセプト発生月から3か月以内の最初のレセプト発生月を有する場合には、紐付けがなされる(ステップS27)。
図9は、死亡転帰から3か月を超えた最初のレセプト発生月を有する場合を示すグラフである。図9に示すように、レセプトグループA及びBのID1はいずれも“863”で共通している。しかしながら、レセプトグループAには、図示しないが最終のレセプト発生月である2015年10月のレセプトに死亡転帰が示されている。そして、レセプトグループBの最初のレセプト発生月は2016年2月であり、死亡転帰が示されたレセプトグループであるレセプトグループAの最終のレセプト発生月から3か月を超えている。したがって、レセプトグループAとBは紐付けされないこととなる。
これに対して、先のレセプトグループの転帰区分に死亡転帰が示されていない場合、又は、死亡転帰が示されているが、選択された後のレセプトグループが、先のレセプトグループの最終のレセプト発生月から3か月以内の最初のレセプト発生月を有する場合には、紐付けがなされる(ステップS27)。
図9は、死亡転帰から3か月を超えた最初のレセプト発生月を有する場合を示すグラフである。図9に示すように、レセプトグループA及びBのID1はいずれも“863”で共通している。しかしながら、レセプトグループAには、図示しないが最終のレセプト発生月である2015年10月のレセプトに死亡転帰が示されている。そして、レセプトグループBの最初のレセプト発生月は2016年2月であり、死亡転帰が示されたレセプトグループであるレセプトグループAの最終のレセプト発生月から3か月を超えている。したがって、レセプトグループAとBは紐付けされないこととなる。
(ID2を共通とするレセプトグループ同士の紐付けについて)
図2に示すように、ID1の紐付け(ステップS14)の後、ID1についての途切れの前後で同一のID2を有するレセプトグループが存在する場合(ステップS15)には、紐付けを行う(ステップS16)。
ID2を共通とするレセプト同士の紐付けは、資格喪失したレセプトが存在することを考慮したアルゴリズムで処理を行う。なぜなら資格喪失したレセプトについては審査支払機関を経由し保険者でチェックを行い再審査請求となるため、3か月間程度は新旧のID1が併存しうるからである。具体的な処理について、図10を参照しながら説明する。
図2に示すように、ID1の紐付け(ステップS14)の後、ID1についての途切れの前後で同一のID2を有するレセプトグループが存在する場合(ステップS15)には、紐付けを行う(ステップS16)。
ID2を共通とするレセプト同士の紐付けは、資格喪失したレセプトが存在することを考慮したアルゴリズムで処理を行う。なぜなら資格喪失したレセプトについては審査支払機関を経由し保険者でチェックを行い再審査請求となるため、3か月間程度は新旧のID1が併存しうるからである。具体的な処理について、図10を参照しながら説明する。
図10は、ID2を共通とするレセプトグループ同士の紐付けフロー図を示している。図10に示すように、まず、ID1が途切れた年月以降の、共通のID2を有するレセプトグループの内、最もID1が途切れた年月に近いものを探索する(ステップS301)。
ステップS301における探索により、ID1が途切れた年月以降のレセプトグループが検出されなかった場合(ステップS302)は、ID1が途切れた年月の前月において、共通のID2を有するレセプトグループを探索する(ステップS303)。図11は、ID1が途切れた年月の前月に最初のレセプト発生月が存在する場合のグラフである。図11に示すように、レセプトグループAとレセプトグループBのID2はいずれも“479”であり共通している。そして、レセプトグループBの最初のレセプト発生月は、レセプトグループAの最終のレセプト発生月の前月となっている。したがって、図11に示すような場合には、レセプトグループAとレセプトグループBを紐付けし得ることとなる。
ステップS301における探索により、ID1が途切れた年月以降のレセプトグループが検出されなかった場合(ステップS302)は、ID1が途切れた年月の前月において、共通のID2を有するレセプトグループを探索する(ステップS303)。図11は、ID1が途切れた年月の前月に最初のレセプト発生月が存在する場合のグラフである。図11に示すように、レセプトグループAとレセプトグループBのID2はいずれも“479”であり共通している。そして、レセプトグループBの最初のレセプト発生月は、レセプトグループAの最終のレセプト発生月の前月となっている。したがって、図11に示すような場合には、レセプトグループAとレセプトグループBを紐付けし得ることとなる。
ステップS303における探索により、ID1が途切れた年月の前月において、共通のID2を有するレセプトグループが検出されなかった場合(ステップS304)は、ID1が途切れた年月の前々月において、共通のID2を有するレセプトグループを探索する(ステップS305)。図12は、ID1が途切れた年月の前々月に最初のレセプト発生月が存在する場合のグラフである。図12に示すように、レセプトグループAとレセプトグループBのID2はいずれも“479”であり共通している。そして、レセプトグループBの最初のレセプト発生月は、レセプトグループAの最終のレセプト発生月の前々月となっている。したがって、図12に示すような場合には、レセプトグループAとレセプトグループBを紐付けし得ることとなる。
上記ステップS302においてID1が途切れた年月に近いレセプトグループが検出された場合であっても、先のレセプトグループの死亡転帰から3か月を超えた最初のレセプト発生月を有する後のレセプトグループである場合(ステップS307)には、紐付けはなされない(ステップS310)。
これに対して、先のレセプトグループの死亡転帰から3か月を超えた最初のレセプト発生月を有する後のレセプトグループではない場合、又は、ステップS304若しくはステップS306のいずれかにおいて共通のID2を有するレセプトグループが検出された場合には、最初のレセプト発生月が同一である複数のレセプトグループが検出されたかの判断(ステップS308)がなされる。ここで、最初のレセプト発生月が同一である複数のレセプトグループが検出された場合には紐付けはなされない(ステップS311)。これに対して、最初のレセプト発生月が同一である複数のレセプトグループが検出されなかった場合は、ID1が途切れた年月に近いレセプトグループを紐付けする(ステップS309)。
これに対して、先のレセプトグループの死亡転帰から3か月を超えた最初のレセプト発生月を有する後のレセプトグループではない場合、又は、ステップS304若しくはステップS306のいずれかにおいて共通のID2を有するレセプトグループが検出された場合には、最初のレセプト発生月が同一である複数のレセプトグループが検出されたかの判断(ステップS308)がなされる。ここで、最初のレセプト発生月が同一である複数のレセプトグループが検出された場合には紐付けはなされない(ステップS311)。これに対して、最初のレセプト発生月が同一である複数のレセプトグループが検出されなかった場合は、ID1が途切れた年月に近いレセプトグループを紐付けする(ステップS309)。
(第2の名寄せ用中間テーブル生成について)
図1に示す第2の名寄せ用中間テーブルの生成(ステップS02)について図13を参照しながら説明する。図13は、第2の名寄せ用中間テーブル生成フロー図を示している。図13に示すように、まず、調剤レセプトからID1、ID2、診療年月を抽出する(ステップS41)。次に、ID1が同一のレセプトを同一人物のものとしてグループ化する(ステップS42)。ID2を共通とするレセプトグループが存在する場合(ステップS43)には、ID2を共通とするレセプトグループと紐付けを行う(ステップS44)。
なお、ステップS44における紐付けは、図10に示す第1の名寄せ用中間テーブル生成において、ID2を共通とするレセプトグループ同士の紐付けを行う場合と同様の方法により行う。
図1に示す第2の名寄せ用中間テーブルの生成(ステップS02)について図13を参照しながら説明する。図13は、第2の名寄せ用中間テーブル生成フロー図を示している。図13に示すように、まず、調剤レセプトからID1、ID2、診療年月を抽出する(ステップS41)。次に、ID1が同一のレセプトを同一人物のものとしてグループ化する(ステップS42)。ID2を共通とするレセプトグループが存在する場合(ステップS43)には、ID2を共通とするレセプトグループと紐付けを行う(ステップS44)。
なお、ステップS44における紐付けは、図10に示す第1の名寄せ用中間テーブル生成において、ID2を共通とするレセプトグループ同士の紐付けを行う場合と同様の方法により行う。
(第1の名寄せ用中間テーブルと第2の名寄せ用中間テーブルの統合について)
図1に示すように、ステップS01において生成した第1の名寄せ用中間テーブルとステップS02において生成した第2の名寄せ用中間テーブルは、ステップS03において統合される。
図14は、名寄せ用中間テーブルの統合フロー図を示している。図14に示すように、第1の名寄せ用中間テーブルと第2の名寄せ用中間テーブルを統合し、実際には同一人物であるID1同士の一対一対応表を生成する(ステップS51)。下記表3は先出ID1と後出ID1の一対一対応表を表している。ここで、「先出ID1」とは、医科、DPC、調剤を問わず、一番目に出現したID1のことであり、「後出ID1」は二番目以降に出てきたID1のことである。
図1に示すように、ステップS01において生成した第1の名寄せ用中間テーブルとステップS02において生成した第2の名寄せ用中間テーブルは、ステップS03において統合される。
図14は、名寄せ用中間テーブルの統合フロー図を示している。図14に示すように、第1の名寄せ用中間テーブルと第2の名寄せ用中間テーブルを統合し、実際には同一人物であるID1同士の一対一対応表を生成する(ステップS51)。下記表3は先出ID1と後出ID1の一対一対応表を表している。ここで、「先出ID1」とは、医科、DPC、調剤を問わず、一番目に出現したID1のことであり、「後出ID1」は二番目以降に出てきたID1のことである。
上記表3に示す先出ID1と後出ID1は、いずれも英数字は異なるがID2が共通することにより、同一人物と考えられるものである。表3では問題とはならないが、先出ID1と後出ID1が入れ替わったものが表示されている場合には、循環参照が問題となる。
図15は循環参照の例を示すグラフである。図15に示すように、レセプトグループAのID1は“135”であり、レセプトグループBのID1は、“512”であるため、ID1は異なるが、レセプトグループA及びレセプトグループBのID2はいずれも“479”で共通している。しかしながら、レセプトグループA及びレセプトグループBは、いずれも診療年月が2015年4月のみの1つのレセプトからなるレセプトグループであるため、一対一対応表を作成する際には、レセプトグループAを先出ID1として、レセプトグループBを後出ID1とすることもできるし、逆に、レセプトグループBを先出ID1として、レセプトグループAを後出ID1とすることも可能である。仮にどちらも入力すると、統合の際に互いが互いを参照するという循環参照が生じてしまうため、この不都合を回避する必要がある。
そこで、循環参照が発生する場合(ステップS52)には、対応セットの一方を削除する(ステップS53)。
図15は循環参照の例を示すグラフである。図15に示すように、レセプトグループAのID1は“135”であり、レセプトグループBのID1は、“512”であるため、ID1は異なるが、レセプトグループA及びレセプトグループBのID2はいずれも“479”で共通している。しかしながら、レセプトグループA及びレセプトグループBは、いずれも診療年月が2015年4月のみの1つのレセプトからなるレセプトグループであるため、一対一対応表を作成する際には、レセプトグループAを先出ID1として、レセプトグループBを後出ID1とすることもできるし、逆に、レセプトグループBを先出ID1として、レセプトグループAを後出ID1とすることも可能である。仮にどちらも入力すると、統合の際に互いが互いを参照するという循環参照が生じてしまうため、この不都合を回避する必要がある。
そこで、循環参照が発生する場合(ステップS52)には、対応セットの一方を削除する(ステップS53)。
(名寄せテーブル生成について)
図16は、名寄せテーブル生成フロー図を示している。図16に示すように、上述の一対一対応表を利用し、後出ID1を先出ID1に置き換える(ステップS61)。これにより、同一人物の複数のID1が一種類に統合される。置き換えられたID1が別の対応セットの後出ID1であることもあるため、その場合は、さらに先出ID1へと置き換える。このように、全ての置き換えが完了していなければ(ステップS62)、再度、後出ID1を先出ID1に置き換える(ステップS61)。この作業を後出ID1がなくなるまで繰り返す。全ての置き換えが完了し、最終的に残ったID1を新しい名寄せ変数“ID0”とする(ステップS63)。
なお、本実施例では、先出ID1をID0に使用しているが、後出ID1をID0に使用することでも構わない。
図16は、名寄せテーブル生成フロー図を示している。図16に示すように、上述の一対一対応表を利用し、後出ID1を先出ID1に置き換える(ステップS61)。これにより、同一人物の複数のID1が一種類に統合される。置き換えられたID1が別の対応セットの後出ID1であることもあるため、その場合は、さらに先出ID1へと置き換える。このように、全ての置き換えが完了していなければ(ステップS62)、再度、後出ID1を先出ID1に置き換える(ステップS61)。この作業を後出ID1がなくなるまで繰り返す。全ての置き換えが完了し、最終的に残ったID1を新しい名寄せ変数“ID0”とする(ステップS63)。
なお、本実施例では、先出ID1をID0に使用しているが、後出ID1をID0に使用することでも構わない。
具体的に、上記表3で説明する。まず、時系列的に新しいレセプトグループcから後出ID1を先出ID1に置き換える。先出ID1が“78wmdjfg”、後出ID1が“Ajdke783”であるレセプトグループcにおいては、後出ID1“Ajdke783”は先出ID1“78wmdjfg”に置き換えられる。また、レセプトグループcの置き換え前の後出ID1“Ajdke783”は、レセプトグループbの先出ID1“Ajdke783”と同一である。“Ajdke783”は“78wmdjfg”に置き換えられたため、レセプトグループbの後出ID1“ue8k22ue”を先出ID1“Ajdke783”に置き換える際には、“78wmdjfg”に置き換えられる。同様に、レセプトグループbの置き換え前の後出ID1“ue8k22ue”は、レセプトグループaの先出ID1“ue8k22ue”と同一であるため、レセプトグループaの後出ID1“p8d89jss”を先出ID1“ue8k22ue”に置き換える際には、“78wmdjfg”に置き換えられる。後出ID1がなくなるまで繰り返し、全ての置き換えが完了し、最終的に残ったID1は“78wmdjfg”になる。下記表4は、生成が完了した名寄せテーブルを表している。
上記表4に示すように、レセプトグループ(a〜c)の全てについて、ID0“78wmdjfg”が設定されている。本実施例では3回目の更新により名寄せテーブルの生成が完了しているが、実際にはより多数の置き換えが行われる場合も存在する。また、このID0には、単回受診等で名寄せ対象とならなかったため元々のID1がそのまま残存したものも含まれる。
なお、レセプトグループにおける先出ID1と後出ID1については、古い方から新しい方に向かう時系列に沿った先後関係(古い・・・先;新しい・・・後)であっても、新しい方から古い方に向かう時系列に沿った先後関係(新しい・・・先;古い・・・後)であってもよい。
また、複数のレセプトグループの名寄せの順番については、特に限定されるものではなく、例えば、時系列に沿って古いレセプトを含むレセプトグループから処理してもよいし、或は、新しいレセプトを含むレセプトグループから処理してもよい。
また、複数のレセプトグループの名寄せの順番については、特に限定されるものではなく、例えば、時系列に沿って古いレセプトを含むレセプトグループから処理してもよいし、或は、新しいレセプトを含むレセプトグループから処理してもよい。
(ID0の妥当性について)
図17は、ID0とID1の名寄せ精度の比較グラフであり、具体的には、平成25年度の1年分の患者(DPC、医科入院、医科入院外、調剤)を対象に、ID0にて名寄せを実施し、従来のID1による名寄せ患者数及び平成25年10月の推計人口と比較した性年齢階級別の結果を示している。なお、(1)は男性、(2)は女性についての結果を示している。図17(1)及び(2)に示すように、男女とも、ID0による性年齢階級別患者数はID1による患者数を下回っており、追加名寄せ率(ID1名寄せに比してID0名寄せで同一人物の特定に追加的に成功した割合)は男性で6.2%、女性で7.1%であった。ID1により名寄せされた患者数は、0〜9歳や75〜79歳、90歳以上、男性の85〜89歳、女性の25〜29歳において推計人口を大きく上回っていた。一方、ID0により名寄せされた患者数は、男性の85歳以上や女性の90歳以上で推計人口を大きく上回ったが、それ以外の性年齢階級ではおおむね推計人口の範囲内に収まった。
図17は、ID0とID1の名寄せ精度の比較グラフであり、具体的には、平成25年度の1年分の患者(DPC、医科入院、医科入院外、調剤)を対象に、ID0にて名寄せを実施し、従来のID1による名寄せ患者数及び平成25年10月の推計人口と比較した性年齢階級別の結果を示している。なお、(1)は男性、(2)は女性についての結果を示している。図17(1)及び(2)に示すように、男女とも、ID0による性年齢階級別患者数はID1による患者数を下回っており、追加名寄せ率(ID1名寄せに比してID0名寄せで同一人物の特定に追加的に成功した割合)は男性で6.2%、女性で7.1%であった。ID1により名寄せされた患者数は、0〜9歳や75〜79歳、90歳以上、男性の85〜89歳、女性の25〜29歳において推計人口を大きく上回っていた。一方、ID0により名寄せされた患者数は、男性の85歳以上や女性の90歳以上で推計人口を大きく上回ったが、それ以外の性年齢階級ではおおむね推計人口の範囲内に収まった。
図18は、患者突合装置の説明図を示している。図18に示すように、コンピュータ3には、患者突合装置4及び通信手段45が備えられている。コンピュータ3とサーバ5は、通信手段45により、ネットワーク6を介して有線又は無線で接続されている。また、サーバ5にはNDBが設けられている。
患者突合装置4には、第1の名寄せ用中間テーブル生成手段41、第2の名寄せ用中間テーブル生成手段42、対応テーブル生成手段43及び名寄せテーブル生成手段44が設けられている。
患者突合装置4には、第1の名寄せ用中間テーブル生成手段41、第2の名寄せ用中間テーブル生成手段42、対応テーブル生成手段43及び名寄せテーブル生成手段44が設けられている。
患者突合装置4を稼動する際には、コンピュータ4は、通信手段45を用いて、サーバ5からデータを受信する。コンピュータ4は、受信したデータを使用して、第1の名寄せ用中間テーブル生成手段41により第1の名寄せ用中間テーブルを生成する。次に、第2の名寄せ用中間テーブル生成手段42により第2の名寄せ用中間テーブルを生成する。生成したテーブルを対応テーブル生成手段43により統合する。統合したテーブルを基に、名寄せテーブル生成手段44により名寄せテーブルを生成する。
完成した名寄せテーブルは、通信手段45により、ネットワーク6を介してサーバに送信される。これにより、サーバ5におけるNDBは、より名寄せ精度の向上したデータベースとして利用可能となる。
サーバ5におけるNDBは日々新しい情報に更新されるため、上記のような、患者突合装置4の稼動は、一度だけではなく、定期的に行うことが望ましい。頻繁に患者突合装置4を稼動することで、より名寄せ精度の向上したデータベースとすることが可能である。
完成した名寄せテーブルは、通信手段45により、ネットワーク6を介してサーバに送信される。これにより、サーバ5におけるNDBは、より名寄せ精度の向上したデータベースとして利用可能となる。
サーバ5におけるNDBは日々新しい情報に更新されるため、上記のような、患者突合装置4の稼動は、一度だけではなく、定期的に行うことが望ましい。頻繁に患者突合装置4を稼動することで、より名寄せ精度の向上したデータベースとすることが可能である。
本発明は、レセプト情報データ等の効果的な活用を支援するツールとして有用である。
3 コンピュータ
4 患者突合装置
5 サーバ
6 ネットワーク
41 第1の名寄せ用中間テーブル生成手段
42 第2の名寄せ用中間テーブル生成手段
43 対応テーブル生成手段
44 名寄せテーブル生成手段
45 通信手段
4 患者突合装置
5 サーバ
6 ネットワーク
41 第1の名寄せ用中間テーブル生成手段
42 第2の名寄せ用中間テーブル生成手段
43 対応テーブル生成手段
44 名寄せテーブル生成手段
45 通信手段
Claims (7)
- 保険者番号に基づく第1のハッシュ値と氏名に基づく第2のハッシュ値の少なくとも2つの検索キーを有するレセプト情報データベースの突合方法であって、
1)調剤レセプト以外のレセプトを用いて、第1のハッシュ値と第2のハッシュ値及び診療年月を少なくとも抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致に基づいてレセプトを連結し、同一患者の第1の名寄せ用中間テーブルを生成するステップと、
2)調剤レセプトを用いて、第1のハッシュ値と第2のハッシュ値及び診療年月を少なくとも抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致に基づいてレセプトを連結し、同一患者の第2の名寄せ用中間テーブルを生成するステップと、
3)同一患者の第1の名寄せ用中間テーブルと第2の名寄せ用中間テーブルを診療年月の時系列に沿って統合し、同一患者における第1のハッシュ値の対応テーブルを生成するステップと、
4)前記対応テーブルにおいて複数種の第1のハッシュ値が存在する場合には、複数種の第1のハッシュ値をユニークな第1のハッシュ値に置き換えた名寄せテーブルを生成するステップ、
を備え、前記データベースにおけるデータを突合して患者の名寄せを行うことを特徴とする患者突合方法。 - 第1及び第2の名寄せ用中間テーブル生成ステップにおいて、
第1のハッシュ値と第2のハッシュ値の両方が一致する場合、同一患者のレセプトとして連結し、最初のレセプト発生月から最終のレセプト発生月まで、又は、最初のレセプト発生月から転帰区分にて死亡転帰が示される当該月まで、を1つのレセプトグループとして連結するステップと、
それぞれのレセプトグループにおいて、第1のハッシュ値又は第2のハッシュ値の何れかのみ一致する場合、最終のレセプト発生月を連結対象とするレセプトグループの連結候補を、第1のハッシュ値が一致、最も時系列的に近い、同年月を除き期間がオーバーラップしない、又は、同じ第1若しくは第2のハッシュ値の候補の最初のレセプト発生月が同一ではない、の少なくとも何れかを満足する最初のレセプト発生月を連結対象とするレセプトグループと連結するステップ、
を備えることを特徴とする請求項1に記載の患者突合方法。 - 第1及び第2の名寄せ用中間テーブル生成ステップにおいて、
第1のハッシュ値と第2のハッシュ値の両方が一致する場合、同一患者のレセプトとして連結し、最初のレセプト発生月から最終のレセプト発生月まで、又は、最初のレセプト発生月から転帰区分にて死亡転帰が示される当該月まで、を1つのレセプトグループとして連結するステップと、
それぞれのレセプトグループにおいて、第1のハッシュ値又は第2のハッシュ値の何れかのみ一致する場合、最終のレセプト発生月を連結対象とするレセプトグループの連結候補を、第1のハッシュ値が一致、最も時系列的に近い、同年月を除き期間がオーバーラップしない、及び、同じ第1若しくは第2のハッシュ値の候補の最初のレセプト発生月が同一ではない、の全てを満足するレセプトグループと連結するステップ、
を備えることを特徴とする請求項1に記載の患者突合方法。 - 死亡転帰が示されるレセプトグループは、その最終月から3か月を超えた最初のレセプト発生月を有する他のレセプトグループとは連結しないことを特徴とする請求項2又は3に記載の患者突合方法。
- レセプト情報における医療機関所在地、診療開始年月日、傷病名、又は、患者の年齢階級の少なくとも何れかが一致するレセプトグループと連結することを特徴とする請求項2〜4の何れかに記載の患者突合方法。
- 請求項1〜5の何れかの患者突合方法における各ステップを、コンピュータに実行させる患者突合プログラム。
- 保険者番号に基づく第1のハッシュ値と氏名に基づく第2のハッシュ値の少なくとも2つの検索キーを有するレセプト情報データベースの突合を行う装置であって、
1)調剤レセプト以外のレセプトを入力し、第1のハッシュ値と第2のハッシュ値及び診療年月を少なくとも抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致を判断し、該判断に基づいて同一患者のレセプトを連結し、第1の名寄せ用中間テーブルを生成する第1の名寄せ用中間テーブル生成手段と、
2)調剤レセプトを入力し、第1のハッシュ値と第2のハッシュ値及び診療年月を少なくとも抽出し、診療年月の複数月にわたる第1のハッシュ値と第2のハッシュ値の少なくとも何れかの一致を判断し、該判断に基づいて同一患者のレセプトを連結し、第2の名寄せ用中間テーブルを生成する第2の名寄せ用中間テーブル生成手段と、
3)同一患者の第1の名寄せ用中間テーブルと第2の名寄せ用中間テーブルを診療年月の時系列に沿って統合し、同一患者における第1のハッシュ値の対応テーブルを生成する対応テーブル生成手段と、
4)前記対応テーブルにおいて複数種の第1のハッシュ値が存在する場合には、複数種の第1のハッシュ値をユニークな第1のハッシュ値に置き換えた名寄せテーブルを生成する名寄せテーブル生成手段、
を備え、前記データベースにおけるデータを突合して患者の名寄せを行うことを特徴とする患者突合装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018075685A JP2019185403A (ja) | 2018-04-10 | 2018-04-10 | レセプト情報・特定健診等情報データベースにおける患者突合方法及び装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018075685A JP2019185403A (ja) | 2018-04-10 | 2018-04-10 | レセプト情報・特定健診等情報データベースにおける患者突合方法及び装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2019185403A true JP2019185403A (ja) | 2019-10-24 |
Family
ID=68341336
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018075685A Pending JP2019185403A (ja) | 2018-04-10 | 2018-04-10 | レセプト情報・特定健診等情報データベースにおける患者突合方法及び装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2019185403A (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2022190778A1 (ja) * | 2021-03-09 | 2022-09-15 | レメディ・アンド・カンパニー株式会社 | 匿名医療情報管理システム |
| JP7236514B1 (ja) | 2021-09-22 | 2023-03-09 | 株式会社エム・エイチ・アイ | 情報提供システム、情報提供方法 |
| JP2023519551A (ja) * | 2020-04-03 | 2023-05-11 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 実体の複数の一意の識別子のための多値主キー |
-
2018
- 2018-04-10 JP JP2018075685A patent/JP2019185403A/ja active Pending
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2023519551A (ja) * | 2020-04-03 | 2023-05-11 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 実体の複数の一意の識別子のための多値主キー |
| JP7573639B2 (ja) | 2020-04-03 | 2024-10-25 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 実体の複数の一意の識別子のための多値主キー |
| WO2022190778A1 (ja) * | 2021-03-09 | 2022-09-15 | レメディ・アンド・カンパニー株式会社 | 匿名医療情報管理システム |
| JP7236514B1 (ja) | 2021-09-22 | 2023-03-09 | 株式会社エム・エイチ・アイ | 情報提供システム、情報提供方法 |
| JP2023045791A (ja) * | 2021-09-22 | 2023-04-03 | 株式会社エム・エイチ・アイ | 情報提供システム、情報提供方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7624027B1 (en) | Method and system for automated medical records processing | |
| US9141758B2 (en) | System and method for encrypting provider identifiers on medical service claim transactions | |
| US20130304506A1 (en) | System and method for managing health risks | |
| CA2884949C (en) | Systems and methods for verifying correlation of diagnosis and medication as part of qualifying program eligibility verification | |
| US20200013491A1 (en) | Interoperable Record Matching Process | |
| US7685002B2 (en) | Method and system for processing medical billing records | |
| Jönsen et al. | Total cost and cost predictors in systemic lupus erythematosus–8-years follow-up of a Swedish inception cohort | |
| JP2022190131A (ja) | 医療情報提供システム、サーバ、医療情報提供装置、医療情報提供媒体、医療情報提供方法及びプログラム | |
| Erickson et al. | Automatic address validation and health record review to identify homeless Social Security disability applicants | |
| Rabkin et al. | Nurse-led HIV services and quality of care at health facilities in Kenya, 2014–2016 | |
| JP2019185403A (ja) | レセプト情報・特定健診等情報データベースにおける患者突合方法及び装置 | |
| Leonhard et al. | Analysis of reimbursement of genetic counseling services at a single institution in a state requiring licensure | |
| Lewer et al. | Data resource: the Kent integrated dataset (KID) | |
| Withy et al. | Hawai ‘i physician workforce assessment 2020 | |
| US20150051915A1 (en) | Systems and methods for allocating payments across multiple healthcare accounts | |
| JP5433814B1 (ja) | 電子レセプトデータ変換システム及び電子レセプトデータ変換プログラム | |
| US20160378922A1 (en) | Methods and apparatuses for electronically documenting a visit of a patient | |
| Frederiksen et al. | The limitations of using Medicaid administrative data in abortion research | |
| JP6104674B2 (ja) | 匿名情報配信システム、匿名情報配信方法及び匿名情報配信プログラム | |
| US20220374548A1 (en) | Generating a compliance report of data processing activity | |
| Bogale et al. | Knowledge and practice of women with HIV on cervical cancer prevention and control and their attributes to utilize the screening services in Ethiopia: a cross sectional study | |
| Pollack et al. | Housing assistance among patients with cancer: SEER-Medicare US Department of Housing and Urban Development data linkage | |
| JP7085167B2 (ja) | 保険金支払支援システム、プログラム及び記録媒体 | |
| Adadey et al. | Incidence and mortality of cancer in the Volta Region of Ghana | |
| JP7224763B2 (ja) | 医療経営支援システム、医療経営支援方法、および医療経営支援プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20180424 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180615 |