以下に、心血管イベントの評価方法の実施形態(第1実施形態)、ならびに心血管イベント評価装置、心血管イベント評価方法、心血管イベント評価プログラム、記録媒体、心血管イベント評価システムおよび情報通信端末装置の実施形態(第2実施形態)を、図面に基づいて詳細に説明する。なお、本発明はこれらの実施形態により限定されるものではない。
[第1実施形態]
[1−1.第1実施形態の概要]
ここでは、第1実施形態の概要について図1を参照して説明する。図1は第1実施形態の基本原理を示す原理構成図である。
まず、評価対象(例えば動物やヒト(例えば糖尿病患者など)などの個体)から採取した血液(例えば血漿、血清などを含む)中のアミノ酸の濃度値に関するアミノ酸濃度データを取得する(ステップS11)。なお、ステップS11では、例えば、アミノ酸濃度測定を行う企業等が測定したアミノ酸濃度データを取得してもよく、また、評価対象から採取した血液から、例えば以下の(A)または(B)などの測定方法でアミノ酸濃度データを測定することでアミノ酸濃度データを取得してもよい。ここで、アミノ酸濃度の単位は、例えばモル濃度や重量濃度、これらの濃度に任意の定数を加減乗除することで得られるものでもよい。
(A)採取した血液サンプルを遠心することにより血液から血清を分離した。全ての血清サンプルは、アミノ酸濃度の測定時まで−80℃で凍結保存した。アミノ酸濃度測定時には、アセトニトリルを添加し除蛋白処理を行った後、標識試薬(3−アミノピリジル−N−ヒドロキシスクシンイミジルカルバメート)を用いてプレカラム誘導体化を行い、そして、液体クロマトグラフ質量分析計(LC/MS/MS)によりアミノ酸濃度を分析した(国際公開第2003/069328号、国際公開第2005/116629号を参照)。
(B)採取した血液サンプルを遠心することにより血液から血清を分離した。全ての血清サンプルは、アミノ酸濃度の測定時まで−80℃で凍結保存した。アミノ酸濃度測定時には、スルホサリチル酸を添加し除蛋白処理を行った後、ニンヒドリン試薬を用いたポストカラム誘導体化法を原理としたアミノ酸分析計によりアミノ酸濃度を分析した。
つぎに、ステップS11で取得したアミノ酸濃度データに基づいて、評価対象につき心血管イベントの将来の状態を評価(予測)する(ステップS12)。
以上、第1実施形態によれば、評価対象から採取した血液中のアミノ酸の濃度値に関するアミノ酸濃度データを取得し、取得した評価対象のアミノ酸濃度データに基づいて、評価対象につき心血管イベントの将来の状態を評価する(要するに、評価対象につき心血管イベントの将来の状態を評価するための情報を提供する)。これにより、血液中のアミノ酸の濃度を利用して心血管イベントの将来の状態を精度よく評価することができる(要するに、心血管イベントの将来の状態を評価するための精度のよい情報を提供することができる)。
ここで、ステップS12を実行する前に、ステップS11で取得したアミノ酸濃度データから欠損値や外れ値などのデータを除去してもよい。これにより、心血管イベントの将来の状態をさらに精度よく評価することができる。
また、ステップS12では、ステップS11で取得したアミノ酸濃度データに含まれるEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つの濃度値に基づいて、評価対象につき心血管イベントの将来の状態を評価してもよい。これにより、血液中のアミノ酸の濃度のうち心血管イベントの将来の状態の評価に有用なアミノ酸の濃度を利用して心血管イベントの将来の状態を精度よく評価することができる。
具体的には、アミノ酸濃度データに含まれるEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つの濃度値に基づいて、評価対象が将来、心血管イベントを発症するかを評価してもよい。例えば、評価対象が将来、心血管イベントを発症するか否かを判別したり、また、将来、心血管イベントを発症する可能性の程度を考慮して定義された複数の区分(ランク)のうちのどれか1つに評価対象を分類したりしてもよい。これにより、血液中のアミノ酸の濃度のうち、心血管イベントの将来の発症に関する評価に有用なアミノ酸の濃度を利用して、当該評価を精度よく行うことができる。
また、濃度値の取り得る範囲が所定範囲(例えば0.0から1.0までの範囲、0.0から10.0までの範囲、0.0から100.0までの範囲、又は−10.0から10.0までの範囲、など)に収まるように、例えば、濃度値に対して任意の値を加減乗除したり、また、濃度値を所定の変換手法(例えば、指数変換、対数変換、角変換、平方根変換、プロビット変換、又は逆数変換など)で変換したり、また、濃度値に対してこれらの計算を組み合わせて行ったりすることで、濃度値を変換してもよい。例えば、濃度値を指数としネイピア数を底とする指数関数の値(具体的には、将来、心血管イベントを発症する確率pを定義したときの自然対数ln(p/(1−p))が濃度値と等しいとした場合におけるp/(1−p)の値)をさらに算出してもよく、また、算出した指数関数の値を1と当該値との和で割った値(具体的には、確率pの値)をさらに算出してもよい。
また、特定の条件のときの変換後の値が特定の値となるように、濃度値を変換してもよい。例えば、特異度が80%のときの変換後の値が5.0となり且つ特異度が95%のときの変換後の値が8.0となるように濃度値を変換してもよい。
また、ステップS12では、ステップS11で取得したアミノ酸濃度データ、およびアミノ酸の濃度を変数として含む予め設定された多変量判別式に基づいて、当該多変量判別式の値である判別値を算出してもよく、さらに、算出した判別値に基づいて、評価対象につき心血管イベントの将来の状態を評価してもよい。これにより、アミノ酸の濃度を変数として含む多変量判別式を利用して、評価対象の心血管イベントの将来の状態を反映した判別値を得ることができたり、さらには、アミノ酸の濃度を変数として含む多変量判別式で得られる判別値を利用して、心血管イベントの将来の状態を精度よく評価することができたりする。
なお、多変量判別式は、ロジスティック回帰式、分数式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式、Cox比例ハザードモデル式のいずれか1つでもよい。これにより、心血管イベントの将来の状態の評価に有用な多変量判別式で得られる判別値を利用して、心血管イベントの将来の状態を精度よく評価することができる。
また、ステップS12では、ステップS11で取得したアミノ酸濃度データに含まれるEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つの濃度値、およびEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値に基づいて、評価対象につき心血管イベントの将来の状態を評価してもよい。これにより、心血管イベントの将来の状態の評価に有用な多変量判別式で得られる判別値を利用して、心血管イベントの将来の状態を精度よく評価することができる。
具体的には、アミノ酸濃度データに含まれるEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つの濃度値、およびEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値に基づいて、評価対象が将来、心血管イベントを発症するかを評価してもよい。例えば、評価対象が将来、心血管イベントを発症するか否かを判別したり、また、将来、心血管イベントを発症する可能性の程度を考慮して定義された複数の区分(ランク)のうちのどれか1つに評価対象を分類したりしてもよい。これにより、心血管イベントの将来の発症に関する評価に有用な多変量判別式で得られる判別値を利用して、当該評価を精度よく行うことができる。
なお、心血管イベントの将来の発症に関する評価で用いられる多変量判別式は、EtOHNH2,Hypro,Glu,3−MeHis,Tyr,Trpを変数として含むロジスティック回帰式、Ser,Thr,Lys,Arg,Trpを変数として含むロジスティック回帰式、EtOHNH2,Hypro,Leu,Glu,3−MeHis,Trpを変数として含む線形判別式、Pro,Thr,Orn,Arg,Trpを変数として含む線形判別式、EtOHNH2,Hypro,Glu,3−MeHis,Tyr,Trpを変数として含むCox比例ハザードモデル式、またはPro,Thr,Lys,Cit,Trpを変数として含むCox比例ハザードモデル式でもよい。これにより、心血管イベントの将来の発症に関する評価に特に有用な多変量判別式で得られる判別値を利用して、当該評価をさらに精度よく行うことができる。
また、判別値の取り得る範囲が所定範囲(例えば0.0から1.0までの範囲、0.0から10.0までの範囲、0.0から100.0までの範囲、又は−10.0から10.0までの範囲、など)に収まるように、例えば、判別値に対して任意の値を加減乗除したり、また、判別値を所定の変換手法(例えば、指数変換、対数変換、角変換、平方根変換、プロビット変換、又は逆数変換など)で変換したり、また、判別値に対してこれらの計算を組み合わせて行ったりすることで、判別値を変換してもよい。例えば、判別値を指数としネイピア数を底とする指数関数の値(具体的には、将来、心血管イベントを発症する確率pを定義したときの自然対数ln(p/(1−p))が判別値と等しいとした場合におけるp/(1−p)の値)をさらに算出してもよく、また、算出した指数関数の値を1と当該値との和で割った値(具体的には、確率pの値)をさらに算出してもよい。
また、特定の条件のときの変換後の値が特定の値となるように、判別値を変換してもよい。例えば、特異度が80%のときの変換後の値が5.0となり且つ特異度が95%のときの変換後の値が8.0となるように判別値を変換してもよい。
なお、本明細書における判別値は、多変量判別式の値そのものであってもよく、多変量判別式の値を変換した後の値であってもよい。
ここで、上記した各多変量判別式は、例えば、本出願人による国際出願である国際公開第2004/052191号に記載の方法または本出願人による国際出願である国際公開第2006/098192号に記載の方法で作成してもよい。なお、これら方法で得られた多変量判別式であれば、入力データとしてのアミノ酸濃度データにおけるアミノ酸濃度の単位に因らず、当該多変量判別式を心血管イベントの将来の状態の評価に好適に用いることができる。
また、多変量判別式とは、一般に多変量解析で用いられる式の形式を意味し、例えば分数式、重回帰式、多重ロジスティック回帰式、線形判別関数、マハラノビス距離、正準判別関数、サポートベクターマシン、決定木、Cox比例ハザードモデルなどを包含する。また、異なる形式の多変量判別式の和で示されるような式も含まれる。また、重回帰式、多重ロジスティック回帰式、正準判別関数においては各変数に係数および定数項が付加されるが、この場合の係数および定数項は、好ましくは実数であること、より好ましくはデータから判別を行うために得られた係数および定数項の99%信頼区間の範囲に属する値、さらに好ましくはデータから判別を行うために得られた係数および定数項の95%信頼区間の範囲に属する値であればかまわない。また、各係数の値、及びその信頼区間は、それを実数倍したものでもよく、定数項の値、及びその信頼区間は、それに任意の実定数を加減乗除したものでもよい。ロジスティック回帰、線形判別、重回帰分析などの表示式を指標に用いる場合、表示式の線形変換(定数の加算、定数倍)や単調増加(減少)の変換(例えばlogit変換など)は判別性能を変えるものではなく同等であるので、表示式はそれらを含むものである。
なお、分数式とは、当該分数式の分子がアミノ酸A,B,C,・・・の和で表わされ及び/又は当該分数式の分母がアミノ酸a,b,c,・・・の和で表わされるものである。また、分数式には、このような構成の分数式α,β,γ,・・・の和(例えばα+βのようなもの)も含まれる。また、分数式には、分割された分数式も含まれる。なお、分子や分母に用いられるアミノ酸にはそれぞれ適当な係数がついてもかまわない。また、分子や分母に用いられるアミノ酸は重複してもかまわない。また、各分数式に適当な係数がついてもかまわない。また、各変数の係数の値や定数項の値は、実数であればかまわない。分数式で、分子の変数と分母の変数を入れ替えた組み合わせは、目的変数との相関の正負の符号は概して逆転するが、それらの相関性は保たれるので、判別性では同等と見なせるので、分子の変数と分母の変数を入れ替えた組み合わせも、包含するものである。
そして、第1実施形態では、心血管イベントの将来の状態を評価する際、アミノ酸の濃度以外に、他の生体情報(例えば、年齢、AER(尿中アルブミン排泄率)、BNP(脳性ナトリウム利尿ペプチド)など)をさらに用いてもかまわない。また、第1実施形態では、心血管イベントの将来の状態を評価する際、多変量判別式における変数として、アミノ酸の濃度以外に、他の生体情報(例えば、年齢、AER(尿中アルブミン排泄率)、BNP(脳性ナトリウム利尿ペプチド)など)をさらに用いてもかまわない。
なお、ステップS11を実行する前に、評価対象に1つまたは複数の物質から成る所望の物質群を投与し、当該評価対象から血液を採取しておき、ステップS11で、当該採取した血液からアミノ酸濃度データを取得する場合には、ステップS12での評価結果(例えば、心血管イベントの将来の発症に関する判別結果・分類結果)に基づいて、当該投与した物質群が、将来の心血管イベント(心血管イベントの将来の発症)を予防させるまたは心血管イベントの将来の状態を改善させるものであるか否かを判定してもよい。これにより、血液中のアミノ酸の濃度を利用して心血管イベントの将来の状態を精度よく評価することができる心血管イベントの評価方法を用いて、将来の心血管イベントを予防させる又は心血管イベントの将来の状態を改善させる物質を精度よく探索することができる。例えば、ステップS11を実行する前に、ヒトに投与可能な既存の薬物・アミノ酸・食品・サプリメントを適宜組み合わせたもの(例えば、将来の心血管イベントの予防または改善に効果があること知られている薬物(例えば、ACE(アンジオテンシン変換酵素)阻害剤、ARB(アンジオテンシンII受容体拮抗薬)など)・サプリメント(例えば、低タンパク食、ポリフェノールなど)などを適宜組み合わせたもの)を、所定の期間(例えば1日から12ヶ月の範囲)にわたり、所定量ずつ所定の頻度・タイミング(例えば1日3回・食後)で、所定の投与方法(例えば経口投与)により投与してもよい。ここで、投与方法や用量、剤形は、病状に応じて適宜組み合わせてもよい。なお、剤形は、公知の技術に基づいて決めてもよい。また、用量は、特に定めは無いが、例えば有効成分として1ugから100gを含有した形態で与えてもよい。
そして、この判定結果が「予防させるまたは改善させる」というものであった場合には、当該投与した物質群が将来の心血管イベントを予防させるまたは心血管イベントの将来の状態を改善させるものとして探索されてもよい。なお、この探索方法によって探索された物質として、例えば、「EtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つを含むアミノ酸群」が挙げられる。
また、「EtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つを含むアミノ酸群」の濃度値や各多変量判別式の判別値を正常化させる物質を、第1実施形態の心血管イベントの評価方法や第2実施形態の心血管イベント評価装置を用いて選択することができる。
また、「予防させる又は改善させる物質を探索する」とは、将来の心血管イベントの予防・改善に有効な新規物質を見出すことのみならず、公知物質の将来の心血管イベントの予防・改善用途を新規に見出すことや、将来の心血管イベントの予防・改善に有効性を期待できる既存の薬剤・サプリメント等を組み合わせた新規組成物を見出すことや、上記した適切な用法・用量・組み合わせを見出し、それをキットとすることや、食事・運動等も含めた予防・治療メニューを提示することや、当該予防・治療メニューの効果をモニタリングし、必要に応じて個人ごとにメニューの変更を提示すること等が含まれる。
[1−2.第1実施形態の具体例]
ここでは、第1実施形態の具体例について図2を参照して説明する。図2は、第1実施形態にかかる心血管イベントの評価方法の一例を示すフローチャートである。
まず、動物やヒト(例えば糖尿病患者など)などの個体から採取した血液中のアミノ酸の濃度値に関するアミノ酸濃度データを取得する(ステップSA11)。なお、ステップSA11では、例えば、アミノ酸濃度測定を行う企業等が測定したアミノ酸濃度データを取得してもよく、また、個体から採取した血液から例えば上述した(A)または(B)などの測定方法でアミノ酸濃度データを測定することでアミノ酸濃度データを取得してもよい。
つぎに、ステップSA11で取得した個体のアミノ酸濃度データから欠損値や外れ値などのデータを除去する(ステップSA12)。
つぎに、ステップSA12で欠損値や外れ値などのデータが除去された個体のアミノ酸濃度データに基づいて、個体が将来、心血管イベントを発症するか否かを判別する(ステップSA13)。具体的には、以下の(11A)または(11B)の2群判別を実行する。
(11A)アミノ酸濃度データに含まれるEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つの濃度値と予め設定された閾値(カットオフ値)とを比較することで、個体が将来、心血管イベントを発症するか否かを判別する。
(11B)アミノ酸濃度データに含まれるEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つの濃度値、およびEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体が将来、心血管イベントを発症するか否かを判別する。
[第2実施形態]
[2−1.第2実施形態の概要]
ここでは、第2実施形態の概要について図3を参照して説明する。図3は第2実施形態の基本原理を示す原理構成図である。
まず、制御部は、アミノ酸の濃度値に関する予め取得した評価対象(例えば動物やヒト(例えば糖尿病患者など)などの個体)のアミノ酸濃度データ、およびアミノ酸の濃度を変数として含む記憶部に記憶された多変量判別式に基づいて、当該多変量判別式の値である判別値を算出する(ステップS21)。
つぎに、制御部は、ステップS21で算出した判別値に基づいて、評価対象につき心血管イベントの将来の状態を評価(予測)する(ステップS22)。
以上、第2実施形態によれば、評価対象のアミノ酸濃度データ、およびアミノ酸の濃度を変数として含む多変量判別式に基づいて、当該多変量判別式の値である判別値(要するに、評価対象の心血管イベントの将来の状態を反映した判別値)を算出し、算出した判別値に基づいて、評価対象につき心血管イベントの将来の状態を評価する(要するに、評価対象につき心血管イベントの将来の状態を評価するための情報を提供する)。これにより、アミノ酸の濃度を変数として含む多変量判別式を利用して、評価対象の心血管イベントの将来の状態を反映した判別値を得ることができたり、さらには、アミノ酸の濃度を変数として含む多変量判別式で得られる判別値を利用して、心血管イベントの将来の状態を精度よく評価することができたりする(要するに、心血管イベントの将来の状態を評価するための精度のよい情報を提供することができる)。
なお、多変量判別式は、ロジスティック回帰式、分数式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式、Cox比例ハザードモデル式のいずれか1つでもよい。これにより、心血管イベントの将来の状態の評価に有用な多変量判別式で得られる判別値を利用して、心血管イベントの将来の状態を精度よく評価することができる。
また、ステップS21では、アミノ酸濃度データに含まれるEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つの濃度値、およびEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップS22では、ステップS21で算出した判別値に基づいて、評価対象につき心血管イベントの将来の状態を評価してもよい。これにより、心血管イベントの将来の状態の評価に有用な多変量判別式で得られる判別値を利用して、心血管イベントの将来の状態を精度よく評価することができる。
具体的には、ステップS21では、アミノ酸濃度データに含まれるEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つの濃度値、およびEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出し、ステップS22では、ステップS21で算出した判別値に基づいて、評価対象が将来、心血管イベントを発症するかを評価してもよい。例えば、評価対象が将来、心血管イベントを発症するか否かを判別したり、また、将来、心血管イベントを発症する可能性の程度を考慮して定義された複数の区分(ランク)のうちのどれか1つに評価対象を分類したりしてもよい。これにより、心血管イベントの将来の発症に関する評価に有用な多変量判別式で得られる判別値を利用して、当該評価を精度よく行うことができる。
なお、心血管イベントの将来の発症に関する評価で用いられる多変量判別式は、EtOHNH2,Hypro,Glu,3−MeHis,Tyr,Trpを変数として含むロジスティック回帰式、Ser,Thr,Lys,Arg,Trpを変数として含むロジスティック回帰式、EtOHNH2,Hypro,Leu,Glu,3−MeHis,Trpを変数として含む線形判別式、Pro,Thr,Orn,Arg,Trpを変数として含む線形判別式、EtOHNH2,Hypro,Glu,3−MeHis,Tyr,Trpを変数として含むCox比例ハザードモデル式、またはPro,Thr,Lys,Cit,Trpを変数として含むCox比例ハザードモデル式でもよい。これにより、心血管イベントの将来の発症に関する評価に特に有用な多変量判別式で得られる判別値を利用して、当該評価をさらに精度よく行うことができる。
また、判別値の取り得る範囲が所定範囲(例えば0.0から1.0までの範囲、0.0から10.0までの範囲、0.0から100.0までの範囲、又は−10.0から10.0までの範囲、など)に収まるように、例えば、判別値に対して任意の値を加減乗除したり、また、判別値を所定の変換手法(例えば、指数変換、対数変換、角変換、平方根変換、プロビット変換、又は逆数変換など)で変換したり、また、判別値に対してこれらの計算を組み合わせて行ったりすることで、判別値を変換してもよい。例えば、判別値を指数としネイピア数を底とする指数関数の値(具体的には、将来、心血管イベントを発症する確率pを定義したときの自然対数ln(p/(1−p))が判別値と等しいとした場合におけるp/(1−p)の値)をさらに算出してもよく、また、算出した指数関数の値を1と当該値との和で割った値(具体的には、確率pの値)をさらに算出してもよい。
また、特定の条件のときの変換後の値が特定の値となるように、判別値を変換してもよい。例えば、特異度が80%のときの変換後の値が5.0となり且つ特異度が95%のときの変換後の値が8.0となるように判別値を変換してもよい。
なお、本明細書における判別値は、多変量判別式の値そのものであってもよく、多変量判別式の値を変換した後の値であってもよい。
ここで、上記した各多変量判別式は、例えば、本出願人による国際出願である国際公開第2004/052191号に記載の方法または本出願人による国際出願である国際公開第2006/098192号に記載の方法で作成してもよい。なお、これら方法で得られた多変量判別式であれば、入力データとしてのアミノ酸濃度データにおけるアミノ酸濃度の単位に因らず、当該多変量判別式を心血管イベントの将来の状態の評価に好適に用いることができる。
また、多変量判別式とは、一般に多変量解析で用いられる式の形式を意味し、例えば分数式、重回帰式、多重ロジスティック回帰式、線形判別関数、マハラノビス距離、正準判別関数、サポートベクターマシン、決定木、Cox比例ハザードモデルなどを包含する。また、異なる形式の多変量判別式の和で示されるような式も含まれる。また、重回帰式、多重ロジスティック回帰式、正準判別関数においては各変数に係数および定数項が付加されるが、この場合の係数および定数項は、好ましくは実数であること、より好ましくはデータから判別を行うために得られた係数および定数項の99%信頼区間の範囲に属する値、さらに好ましくはデータから判別を行うために得られた係数および定数項の95%信頼区間の範囲に属する値であればかまわない。また、各係数の値、及びその信頼区間は、それを実数倍したものでもよく、定数項の値、及びその信頼区間は、それに任意の実定数を加減乗除したものでもよい。ロジスティック回帰、線形判別、重回帰分析などの表示式を指標に用いる場合、表示式の線形変換(定数の加算、定数倍)や単調増加(減少)の変換(例えばlogit変換など)は判別性能を変えるものではなく同等であるので、表示式はそれらを含むものである。
なお、分数式とは、当該分数式の分子がアミノ酸A,B,C,・・・の和で表わされ及び/又は当該分数式の分母がアミノ酸a,b,c,・・・の和で表わされるものである。また、分数式には、このような構成の分数式α,β,γ,・・・の和(例えばα+βのようなもの)も含まれる。また、分数式には、分割された分数式も含まれる。なお、分子や分母に用いられるアミノ酸にはそれぞれ適当な係数がついてもかまわない。また、分子や分母に用いられるアミノ酸は重複してもかまわない。また、各分数式に適当な係数がついてもかまわない。また、各変数の係数の値や定数項の値は、実数であればかまわない。分数式で、分子の変数と分母の変数を入れ替えた組み合わせは、目的変数との相関の正負の符号は概して逆転するが、それらの相関性は保たれるので、判別性では同等と見なせるので、分子の変数と分母の変数を入れ替えた組み合わせも、包含するものである。
そして、第2実施形態では、心血管イベントの将来の状態を評価する際、アミノ酸の濃度以外に、他の生体情報(例えば、年齢、AER(尿中アルブミン排泄率)、BNP(脳性ナトリウム利尿ペプチド)など)をさらに用いてもかまわない。また、第2実施形態では、心血管イベントの将来の状態を評価する際、多変量判別式における変数として、アミノ酸の濃度以外に、他の生体情報(例えば、年齢、AER(尿中アルブミン排泄率)、BNP(脳性ナトリウム利尿ペプチド)など)をさらに用いてもかまわない。
ここで、多変量判別式作成処理(工程1〜工程4)の概要について詳細に説明する。なお、ここで説明する処理はあくまでも一例であり、多変量判別式の作成方法はこれに限定されない。
まず、制御部は、アミノ酸濃度データと心血管イベントの将来の状態を表す指標に関する心血管イベント状態指標データとを含む記憶部に記憶された心血管イベント状態情報から所定の式作成手法に基づいて、多変量判別式の候補である候補多変量判別式(例えば、y=a1x1+a2x2+・・・+anxn、y:心血管イベント状態指標データ、xi:アミノ酸濃度データ、ai:定数、i=1,2,・・・,n)を作成する(工程1)。なお、事前に、心血管イベント状態情報から欠損値や外れ値などを持つデータを除去してもよい。
なお、工程1において、心血管イベント状態情報から、複数の異なる式作成手法(主成分分析や判別分析、サポートベクターマシン、重回帰分析、ロジスティック回帰分析、k−means法、クラスター解析、決定木、Cox比例ハザードモデルなどの多変量解析に関するものを含む。)を併用して複数の候補多変量判別式を作成してもよい。具体的には、多数の健常群および心血管イベント群から得た血液を分析して得たアミノ酸濃度データおよび心血管イベント状態指標データから構成される多変量データである心血管イベント状態情報に対して、複数の異なるアルゴリズムを利用して複数群の候補多変量判別式を同時並行的に作成してもよい。例えば、異なるアルゴリズムを利用して判別分析およびロジスティック回帰分析を同時に行い、2つの異なる候補多変量判別式を作成してもよい。また、主成分分析を行って作成した候補多変量判別式を利用して心血管イベント状態情報を変換し、変換した心血管イベント状態情報に対して判別分析を行うことで候補多変量判別式を作成してもよい。これにより、最終的に、診断条件に合った適切な多変量判別式を作成することができる。
ここで、主成分分析を用いて作成した候補多変量判別式は、全てのアミノ酸濃度データの分散を最大にするような各アミノ酸変数を含む一次式である。また、判別分析を用いて作成した候補多変量判別式は、各群内の分散の和の全てのアミノ酸濃度データの分散に対する比を最小にするような各アミノ酸変数を含む高次式(指数や対数を含む)である。また、サポートベクターマシンを用いて作成した候補多変量判別式は、群間の境界を最大にするような各アミノ酸変数を含む高次式(カーネル関数を含む)である。また、重回帰分析を用いて作成した候補多変量判別式は、全てのアミノ酸濃度データからの距離の和を最小にするような各アミノ酸変数を含む高次式である。ロジスティック回帰分析を用いて作成した候補多変量判別式は、確率の対数オッズを表す線形モデルであり、その確率の尤度を最大にするような各アミノ酸変数を含む一次式である。また、k−means法とは、各アミノ酸濃度データのk個近傍を探索し、近傍点の属する群の中で一番多いものをそのデータの所属群と定義し、入力されたアミノ酸濃度データの属する群と定義された群とが最も合致するようなアミノ酸変数を選択する手法である。また、クラスター解析とは、全てのアミノ酸濃度データの中で最も近い距離にある点同士をクラスタリング(群化)する手法である。また、決定木とは、アミノ酸変数に序列をつけて、序列が上位であるアミノ酸変数の取りうるパターンからアミノ酸濃度データの群を予測する手法である。また、Cox比例ハザードモデルとは、生存時間およびイベント時間ならびに打ち切りを考慮しながら、生存またはイベントに対してアミノ酸変数が与える影響を予測する手法である。
多変量判別式作成処理の説明に戻り、制御部は、工程1で作成した候補多変量判別式を、所定の検証手法に基づいて検証(相互検証)する(工程2)。候補多変量判別式の検証は、工程1で作成した各候補多変量判別式に対して行う。
なお、工程2において、ブートストラップ法やホールドアウト法、N−フォールド法、リーブワンアウト法などのうち少なくとも1つに基づいて候補多変量判別式の判別率や感度、特異度、情報量基準、ROC_AUC(受信者特性曲線の曲線下面積)などのうち少なくとも1つに関して検証してもよい。これにより、心血管イベント状態情報や診断条件を考慮した予測性または頑健性の高い候補多変量判別式を作成することができる。
ここで、判別率とは、全入力データの中で、本実施形態で評価した心血管イベントの将来の状態が正しい割合である。また、感度とは、入力データに記載された心血管イベントの将来の状態になっているものの中で、本実施形態で評価した心血管イベントの将来の状態が正しい割合である。また、特異度とは、入力データに記載された心血管イベントの将来の状態が正常になっているものの中で、本実施形態で評価した心血管イベントの将来の状態が正しい割合である。また、情報量基準とは、工程1で作成した候補多変量判別式のアミノ酸変数の数と、本実施形態で評価した心血管イベントの将来の状態および入力データに記載された心血管イベントの将来の状態の差異と、を足し合わせたものである。また、ROC_AUC(受信者特性曲線の曲線下面積)は、2次元座標上に(x,y)=(1−特異度,感度)をプロットして作成される曲線である受信者特性曲線(ROC)の曲線下面積として定義され、ROC_AUCの値は完全な判別では1となり、この値が1に近いほど判別性が高いことを示す。また、予測性とは、候補多変量判別式の検証を繰り返すことで得られた判別率や感度、特異性を平均したものである。また、頑健性とは、候補多変量判別式の検証を繰り返すことで得られた判別率や感度、特異性の分散である。
多変量判別式作成処理の説明に戻り、制御部は、所定の変数選択手法に基づいて候補多変量判別式の変数を選択することで、候補多変量判別式を作成する際に用いる心血管イベント状態情報に含まれるアミノ酸濃度データの組み合わせを選択する(工程3)。アミノ酸変数の選択は、工程1で作成した各候補多変量判別式に対して行ってもよい。これにより、候補多変量判別式のアミノ酸変数を適切に選択することができる。そして、工程3で選択したアミノ酸濃度データを含む心血管イベント状態情報を用いて再び工程1を実行する。
なお、工程3において、工程2での検証結果からステップワイズ法、ベストパス法、近傍探索法、遺伝的アルゴリズムのうち少なくとも1つに基づいて候補多変量判別式のアミノ酸変数を選択してもよい。
ここで、ベストパス法とは、候補多変量判別式に含まれるアミノ酸変数を1つずつ順次減らしていき、候補多変量判別式が与える評価指標を最適化することでアミノ酸変数を選択する方法である。
多変量判別式作成処理の説明に戻り、制御部は、上述した工程1、工程2および工程3を繰り返し実行し、これにより蓄積した検証結果に基づいて、複数の候補多変量判別式の中から多変量判別式として採用する候補多変量判別式を選出することで、多変量判別式を作成する(工程4)。なお、候補多変量判別式の選出には、例えば、同じ式作成手法で作成した候補多変量判別式の中から最適なものを選出する場合と、すべての候補多変量判別式の中から最適なものを選出する場合とがある。
以上、説明したように、多変量判別式作成処理では、心血管イベント状態情報に基づいて、候補多変量判別式の作成、候補多変量判別式の検証および候補多変量判別式の変数の選択に関する処理を一連の流れで体系化(システム化)して実行することにより、心血管イベントの将来の状態の評価に最適な多変量判別式を作成することができる。換言すると、多変量判別式作成処理では、アミノ酸濃度を多変量の統計解析に用い、最適でロバストな変数の組を選択するために変数選択法とクロスバリデーションとを組み合わせて、診断性能の高い多変量判別式を抽出する。多変量判別式としては、ロジスティック回帰、線形判別、サポートベクターマシン、マハラノビス距離法、重回帰分析、クラスター解析、Cox比例ハザードモデルなどを用いることができる。
[2−2.第2実施形態の構成]
ここでは、第2実施形態にかかる心血管イベント評価システム(以下では本システムと記す場合がある。)の構成について、図4から図20を参照して説明する。なお、本システムはあくまでも一例であり、本発明はこれに限定されない。
まず、本システムの全体構成について図4および図5を参照して説明する。図4は本システムの全体構成の一例を示す図である。また、図5は本システムの全体構成の他の一例を示す図である。本システムは、図4に示すように、評価対象につき心血管イベントの将来の状態を評価する心血管イベント評価装置100と、アミノ酸の濃度値に関する評価対象のアミノ酸濃度データを提供するクライアント装置200(本発明の情報通信端末装置に相当)とを、ネットワーク300を介して通信可能に接続して構成されている。
なお、本システムは、図5に示すように、心血管イベント評価装置100やクライアント装置200の他に、心血管イベント評価装置100で多変量判別式を作成する際に用いる心血管イベント状態情報や、心血管イベントの将来の状態の評価を行うために用いる多変量判別式などを格納したデータベース装置400を、ネットワーク300を介して通信可能に接続して構成されてもよい。これにより、ネットワーク300を介して、心血管イベント評価装置100からクライアント装置200やデータベース装置400へ、あるいはクライアント装置200やデータベース装置400から心血管イベント評価装置100へ、心血管イベントの将来の状態に関する情報などが提供される。ここで、心血管イベントの将来の状態に関する情報とは、ヒトを含む生物の心血管イベントの将来の状態に関する特定の項目について測定した値に関する情報である。また、心血管イベントの将来の状態に関する情報は、心血管イベント評価装置100やクライアント装置200や他の装置(例えば各種の計測装置等)で生成され、主にデータベース装置400に蓄積される。
つぎに、本システムの心血管イベント評価装置100の構成について図6から図18を参照して説明する。図6は、本システムの心血管イベント評価装置100の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
心血管イベント評価装置100は、当該心血管イベント評価装置を統括的に制御するCPU等の制御部102と、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して当該心血管イベント評価装置をネットワーク300に通信可能に接続する通信インターフェース部104と、各種のデータベースやテーブルやファイルなどを格納する記憶部106と、入力装置112や出力装置114に接続する入出力インターフェース部108と、で構成されており、これら各部は任意の通信路を介して通信可能に接続されている。ここで、心血管イベント評価装置100は、各種の分析装置(例えばアミノ酸アナライザー等)と同一筐体で構成されてもよい。
記憶部106は、ストレージ手段であり、例えば、RAM・ROM等のメモリ装置や、ハードディスクのような固定ディスク装置、フレキシブルディスク、光ディスク等を用いることができる。記憶部106には、OS(Operating System)と協働してCPUに命令を与え各種処理を行うためのコンピュータプログラムが記録されている。記憶部106は、図示の如く、利用者情報ファイル106aと、アミノ酸濃度データファイル106bと、心血管イベント状態情報ファイル106cと、指定心血管イベント状態情報ファイル106dと、多変量判別式関連情報データベース106eと、判別値ファイル106fと、評価結果ファイル106gと、を格納する。
利用者情報ファイル106aは、利用者に関する利用者情報を格納する。図7は、利用者情報ファイル106aに格納される情報の一例を示す図である。利用者情報ファイル106aに格納される情報は、図7に示すように、利用者を一意に識別するための利用者IDと、利用者が正当な者であるか否かの認証を行うための利用者パスワードと、利用者の氏名と、利用者の所属する所属先を一意に識別するための所属先IDと、利用者の所属する所属先の部門を一意に識別するための部門IDと、部門名と、利用者の電子メールアドレスと、を相互に関連付けて構成されている。
図6に戻り、アミノ酸濃度データファイル106bは、アミノ酸の濃度値に関するアミノ酸濃度データを格納する。図8は、アミノ酸濃度データファイル106bに格納される情報の一例を示す図である。アミノ酸濃度データファイル106bに格納される情報は、図8に示すように、評価対象である個体(サンプル)を一意に識別するための個体番号と、アミノ酸濃度データとを相互に関連付けて構成されている。ここで、図8では、アミノ酸濃度データを数値、すなわち連続尺度として扱っているが、アミノ酸濃度データは名義尺度や順序尺度でもよい。なお、名義尺度や順序尺度の場合は、それぞれの状態に対して任意の数値を与えることで解析してもよい。また、アミノ酸濃度データに、他の生体情報(例えば、年齢、AER(尿中アルブミン排泄率)、BNP(脳性ナトリウム利尿ペプチド)など)を組み合わせてもよい。
図6に戻り、心血管イベント状態情報ファイル106cは、多変量判別式を作成する際に用いる心血管イベント状態情報を格納する。図9は、心血管イベント状態情報ファイル106cに格納される情報の一例を示す図である。心血管イベント状態情報ファイル106cに格納される情報は、図9に示すように、個体番号と、心血管イベントの将来の状態を表す指標(指標T1、指標T2、指標T3・・・)に関する心血管イベント状態指標データ(T)と、アミノ酸濃度データと、を相互に関連付けて構成されている。ここで、図9では、心血管イベント状態指標データおよびアミノ酸濃度データを数値(すなわち連続尺度)として扱っているが、心血管イベント状態指標データおよびアミノ酸濃度データは名義尺度や順序尺度でもよい。なお、名義尺度や順序尺度の場合は、それぞれの状態に対して任意の数値を与えることで解析してもよい。また、心血管イベント状態指標データは、心血管イベントの将来の状態のマーカーとなる既知の単一の状態指標であり、数値データを用いてもよい。
図6に戻り、指定心血管イベント状態情報ファイル106dは、後述する心血管イベント状態情報指定部102gで指定した心血管イベント状態情報を格納する。図10は、指定心血管イベント状態情報ファイル106dに格納される情報の一例を示す図である。指定心血管イベント状態情報ファイル106dに格納される情報は、図10に示すように、個体番号と、指定した心血管イベント状態指標データと、指定したアミノ酸濃度データと、を相互に関連付けて構成されている。
図6に戻り、多変量判別式関連情報データベース106eは、後述する候補多変量判別式作成部102h1で作成した候補多変量判別式を格納する候補多変量判別式ファイル106e1と、後述する候補多変量判別式検証部102h2での検証結果を格納する検証結果ファイル106e2と、後述する変数選択部102h3で選択したアミノ酸濃度データの組み合わせを含む心血管イベント状態情報を格納する選択心血管イベント状態情報ファイル106e3と、後述する多変量判別式作成部102hで作成した多変量判別式を格納する多変量判別式ファイル106e4と、で構成される。
候補多変量判別式ファイル106e1は、後述する候補多変量判別式作成部102h1で作成した候補多変量判別式を格納する。図11は、候補多変量判別式ファイル106e1に格納される情報の一例を示す図である。候補多変量判別式ファイル106e1に格納される情報は、図11に示すように、ランクと、候補多変量判別式(図11では、F1(Gly,Leu,Phe,・・・)やF2(Gly,Leu,Phe,・・・)、F3(Gly,Leu,Phe,・・・)など)とを相互に関連付けて構成されている。
図6に戻り、検証結果ファイル106e2は、後述する候補多変量判別式検証部102h2での検証結果を格納する。図12は、検証結果ファイル106e2に格納される情報の一例を示す図である。検証結果ファイル106e2に格納される情報は、図12に示すように、ランクと、候補多変量判別式(図12では、Fk(Gly,Leu,Phe,・・・)やFm(Gly,Leu,Phe,・・・)、Fl(Gly,Leu,Phe,・・・)など)と、各候補多変量判別式の検証結果(例えば各候補多変量判別式の評価値)と、を相互に関連付けて構成されている。
図6に戻り、選択心血管イベント状態情報ファイル106e3は、後述する変数選択部102h3で選択した変数に対応するアミノ酸濃度データの組み合わせを含む心血管イベント状態情報を格納する。図13は、選択心血管イベント状態情報ファイル106e3に格納される情報の一例を示す図である。選択心血管イベント状態情報ファイル106e3に格納される情報は、図13に示すように、個体番号と、後述する心血管イベント状態情報指定部102gで指定した心血管イベント状態指標データと、後述する変数選択部102h3で選択したアミノ酸濃度データと、を相互に関連付けて構成されている。
図6に戻り、多変量判別式ファイル106e4は、後述する多変量判別式作成部102hで作成した多変量判別式を格納する。図14は、多変量判別式ファイル106e4に格納される情報の一例を示す図である。多変量判別式ファイル106e4に格納される情報は、図14に示すように、ランクと、多変量判別式(図14では、Fp(Phe,・・・)やFp(Gly,Leu,Phe)、Fk(Gly,Leu,Phe,・・・)など)と、各式作成手法に対応する閾値と、各多変量判別式の検証結果(例えば各多変量判別式の評価値)と、を相互に関連付けて構成されている。
図6に戻り、判別値ファイル106fは、後述する判別値算出部102iで算出した判別値を格納する。図15は、判別値ファイル106fに格納される情報の一例を示す図である。判別値ファイル106fに格納される情報は、図15に示すように、評価対象である個体(サンプル)を一意に識別するための個体番号と、ランク(多変量判別式を一意に識別するための番号)と、判別値と、を相互に関連付けて構成されている。
図6に戻り、評価結果ファイル106gは、後述する判別値基準評価部102jでの評価結果(具体的には、後述する判別値基準判別部102j1での判別結果・分類結果)を格納する。図16は、評価結果ファイル106gに格納される情報の一例を示す図である。評価結果ファイル106gに格納される情報は、評価対象である個体(サンプル)を一意に識別するための個体番号と、予め取得した評価対象のアミノ酸濃度データと、多変量判別式で算出した判別値と、心血管イベントの将来の状態の評価に関する評価結果と、を相互に関連付けて構成されている。
図6に戻り、記憶部106には、上述した情報以外にその他情報として、Webサイトをクライアント装置200に提供するための各種のWebデータや、CGIプログラム等が記録されている。Webデータとしては後述する各種のWebページを表示するためのデータ等があり、これらデータは例えばHTMLやXMLで記述されたテキストファイルとして形成されている。また、Webデータを作成するための部品用のファイルや作業用のファイルやその他一時的なファイル等も記憶部106に記憶される。記憶部106には、必要に応じて、クライアント装置200に送信するための音声をWAVE形式やAIFF形式の如き音声ファイルで格納したり、静止画や動画をJPEG形式やMPEG2形式の如き画像ファイルで格納したりすることができる。
通信インターフェース部104は、心血管イベント評価装置100とネットワーク300(またはルータ等の通信装置)との間における通信を媒介する。すなわち、通信インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
入出力インターフェース部108は、入力装置112や出力装置114に接続する。ここで、出力装置114には、モニタ(家庭用テレビを含む)の他、スピーカやプリンタを用いることができる(なお、以下では、出力装置114をモニタ114として記載する場合がある。)。入力装置112には、キーボードやマウスやマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。
制御部102は、OS(Operating System)等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、これらのプログラムに基づいて種々の情報処理を実行する。制御部102は、図示の如く、大別して、要求解釈部102aと閲覧処理部102bと認証処理部102cと電子メール生成部102dとWebページ生成部102eと受信部102fと心血管イベント状態情報指定部102gと多変量判別式作成部102hと判別値算出部102iと判別値基準評価部102jと結果出力部102kと送信部102mとを備えている。制御部102は、データベース装置400から送信された心血管イベント状態情報やクライアント装置200から送信されたアミノ酸濃度データに対して、欠損値のあるデータの除去・外れ値の多いデータの除去・欠損値のあるデータの多い変数の除去などのデータ処理も行う。
要求解釈部102aは、クライアント装置200やデータベース装置400からの要求内容を解釈し、その解釈結果に応じて制御部102の各部に処理を受け渡す。閲覧処理部102bは、クライアント装置200からの各種画面の閲覧要求を受けて、これら画面のWebデータの生成や送信を行なう。認証処理部102cは、クライアント装置200やデータベース装置400からの認証要求を受けて、認証判断を行う。電子メール生成部102dは、各種の情報を含んだ電子メールを生成する。Webページ生成部102eは、利用者がクライアント装置200で閲覧するWebページを生成する。
受信部102fは、クライアント装置200やデータベース装置400から送信された情報(具体的には、アミノ酸濃度データや心血管イベント状態情報、多変量判別式など)を、ネットワーク300を介して受信する。心血管イベント状態情報指定部102gは、多変量判別式を作成するにあたり、対象とする心血管イベント状態指標データおよびアミノ酸濃度データを指定する。
多変量判別式作成部102hは、受信部102fで受信した心血管イベント状態情報や心血管イベント状態情報指定部102gで指定した心血管イベント状態情報に基づいて多変量判別式を作成する。具体的には、多変量判別式作成部102hは、心血管イベント状態情報から、候補多変量判別式作成部102h1、候補多変量判別式検証部102h2および変数選択部102h3を繰り返し実行させることにより蓄積された検証結果に基づいて、複数の候補多変量判別式の中から多変量判別式として採用する候補多変量判別式を選出することで、多変量判別式を作成する。
なお、多変量判別式が予め記憶部106の所定の記憶領域に格納されている場合には、多変量判別式作成部102hは、記憶部106から所望の多変量判別式を選択することで、多変量判別式を作成してもよい。また、多変量判別式作成部102hは、多変量判別式を予め格納した他のコンピュータ装置(例えばデータベース装置400)から所望の多変量判別式を選択しダウンロードすることで、多変量判別式を作成してもよい。
ここで、多変量判別式作成部102hの構成について図17を参照して説明する。図17は、多変量判別式作成部102hの構成を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。多変量判別式作成部102hは、候補多変量判別式作成部102h1と、候補多変量判別式検証部102h2と、変数選択部102h3と、をさらに備えている。候補多変量判別式作成部102h1は、心血管イベント状態情報から所定の式作成手法に基づいて多変量判別式の候補である候補多変量判別式を作成する。なお、候補多変量判別式作成部102h1は、心血管イベント状態情報から、複数の異なる式作成手法を併用して複数の候補多変量判別式を作成してもよい。候補多変量判別式検証部102h2は、候補多変量判別式作成部102h1で作成した候補多変量判別式を所定の検証手法に基づいて検証する。なお、候補多変量判別式検証部102h2は、ブートストラップ法、ホールドアウト法、N−フォールド法、リーブワンアウト法のうち少なくとも1つに基づいて候補多変量判別式の判別率、感度、特異度、情報量基準、ROC_AUC(受信者特性曲線の曲線下面積)のうち少なくとも1つに関して検証してもよい。変数選択部102h3は、所定の変数選択手法に基づいて候補多変量判別式の変数を選択することで、候補多変量判別式を作成する際に用いる心血管イベント状態情報に含まれるアミノ酸濃度データの組み合わせを選択する。なお、変数選択部102h3は、検証結果からステップワイズ法、ベストパス法、近傍探索法、遺伝的アルゴリズムのうち少なくとも1つに基づいて候補多変量判別式の変数を選択してもよい。
図6に戻り、判別値算出部102iは、多変量判別式作成部102hで作成した多変量判別式、および受信部102fで受信した評価対象のアミノ酸濃度データに基づいて、当該多変量判別式の値である判別値を算出する。なお、多変量判別式は、ロジスティック回帰式、分数式、線形判別式、重回帰式、サポートベクターマシンで作成された式、マハラノビス距離法で作成された式、正準判別分析で作成された式、決定木で作成された式、Cox比例ハザードモデル式のいずれか1つでもよい。
判別値算出部102iは、アミノ酸濃度データに含まれるEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つの濃度値、およびEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出してもよい。
具体的には、判別値基準評価部102jで評価対象が将来、心血管イベントを発症するかを評価する(例えば、後述する判別値基準判別部102j1で、評価対象が将来、心血管イベントを発症するか否かを判別したり、また、将来、心血管イベントを発症する可能性の程度を考慮して定義された複数の区分(ランク)のうちのどれか1つに評価対象を分類したりする)場合には、判別値算出部102iは、アミノ酸濃度データに含まれるEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つの濃度値、およびEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出してもよい。なお、心血管イベントの将来の発症に関する評価で用いられる多変量判別式は、EtOHNH2,Hypro,Glu,3−MeHis,Tyr,Trpを変数として含むロジスティック回帰式、Ser,Thr,Lys,Arg,Trpを変数として含むロジスティック回帰式、EtOHNH2,Hypro,Leu,Glu,3−MeHis,Trpを変数として含む線形判別式、Pro,Thr,Orn,Arg,Trpを変数として含む線形判別式、EtOHNH2,Hypro,Glu,3−MeHis,Tyr,Trpを変数として含むCox比例ハザードモデル式、またはPro,Thr,Lys,Cit,Trpを変数として含むCox比例ハザードモデル式でもよい。
判別値基準評価部102jは、判別値算出部102iで算出した判別値に基づいて、評価対象につき心血管イベントの将来の状態を評価(予測)する。判別値基準評価部102jは、例えば、評価対象が将来、心血管イベントを発症するかを評価する。判別値基準評価部102jは、判別値基準判別部102j1をさらに備えている。ここで、判別値基準評価部102jの構成について図18を参照して説明する。図18は、判別値基準評価部102jの構成を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
判別値基準判別部102j1は、判別値に基づいて、評価対象が将来、心血管イベントを発症するか否かを判別したり、また、将来、心血管イベントを発症する可能性の程度を考慮して定義された複数の区分(ランク)のうちのどれか1つに評価対象を分類したりする。具体的には、判別値基準判別部102j1は、判別値と予め設定された閾値(カットオフ値)とを比較することで、評価対象が将来、心血管イベントを発症するか否かを判別したり、また、将来、心血管イベントを発症する可能性の程度を考慮して定義された複数の区分(ランク)のうちのどれか1つに評価対象を分類したりする。
図6に戻り、結果出力部102kは、制御部102の各処理部での処理結果(判別値基準評価部102jでの評価結果(具体的には判別値基準判別部102j1での判別結果または分類結果)を含む)等を出力装置114に出力する。
送信部102mは、評価対象のアミノ酸濃度データの送信元のクライアント装置200に対して、例えば、判別値、評価結果(例えば判別結果、分類結果など)などを送信したり、データベース装置400に対して、例えば、心血管イベント評価装置100で作成した多変量判別式や評価結果(例えば、判別結果、分類結果など)などを送信したりする。
つぎに、本システムのクライアント装置200の構成について図19を参照して説明する。図19は、本システムのクライアント装置200の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
クライアント装置200は、制御部210とROM220とHD230とRAM240と入力装置250と出力装置260と入出力IF270と通信IF280とで構成されており、これら各部は任意の通信路を介して通信可能に接続されている。
制御部210は、Webブラウザ211、電子メーラ212、受信部213、送信部214を備えている。Webブラウザ211は、Webデータを解釈し、解釈したWebデータを後述するモニタ261に表示するブラウズ処理を行う。なお、Webブラウザ211には、ストリーム映像の受信・表示・フィードバック等を行う機能を備えたストリームプレイヤ等の各種のソフトウェアをプラグインしてもよい。電子メーラ212は、所定の通信規約(例えば、SMTP(Simple Mail Transfer Protocol)やPOP3(Post Office Protocol version 3)等)に従って電子メールの送受信を行う。受信部213(本発明の結果取得手段の一例に相当)は、通信IF280を介して、心血管イベント評価装置100から送信された、判別値、評価結果(例えば判別結果、分類結果など)などの各種情報を受信する。要するに、クライアント装置は、判別値や評価結果などの各種情報を取得する機能を有する。送信部214は、通信IF280を介して、評価対象のアミノ酸濃度データなどの各種情報を心血管イベント評価装置100へ送信する。
入力装置250はキーボードやマウスやマイク等である。なお、後述するモニタ261もマウスと協働してポインティングデバイス機能を実現する。出力装置260は、通信IF280を介して受信した情報を出力する出力手段であり、モニタ(家庭用テレビを含む)261およびプリンタ262を含む。この他、出力装置260にスピーカ等を設けてもよい。入出力IF270は入力装置250や出力装置260に接続する。
通信IF280は、クライアント装置200とネットワーク300(またはルータ等の通信装置)とを通信可能に接続する。換言すると、クライアント装置200は、モデムやTAやルータなどの通信装置および電話回線を介して、または専用線を介してネットワーク300に接続される。これにより、クライアント装置200は、所定の通信規約に従って心血管イベント評価装置100にアクセスすることができる。
ここで、プリンタ・モニタ・イメージスキャナ等の周辺装置を必要に応じて接続した情報処理装置(例えば、既知のパーソナルコンピュータ・ワークステーション・家庭用ゲーム装置・インターネットTV・PHS端末・携帯端末・移動体通信端末・PDA等の情報処理端末など)に、Webデータのブラウジング機能や電子メール機能を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより、クライアント装置200を実現してもよい。
また、クライアント装置200の制御部210は、制御部210で行う処理の全部または任意の一部を、CPUおよび当該CPUにて解釈して実行するプログラムで実現してもよい。ROM220またはHD230には、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。当該コンピュータプログラムは、RAM240にロードされることで実行され、CPUと協働して制御部210を構成する。また、当該コンピュータプログラムは、クライアント装置200と任意のネットワークを介して接続されるアプリケーションプログラムサーバに記録されてもよく、クライアント装置200は、必要に応じてその全部または一部をダウンロードしてもよい。また、制御部210で行う処理の全部または任意の一部を、ワイヤードロジック等によるハードウェアで実現してもよい。
つぎに、本システムのネットワーク300について図4、図5を参照して説明する。ネットワーク300は、心血管イベント評価装置100とクライアント装置200とデータベース装置400とを相互に通信可能に接続する機能を有し、例えばインターネットやイントラネットやLAN(有線/無線の双方を含む)等である。なお、ネットワーク300は、VANや、パソコン通信網や、公衆電話網(アナログ/デジタルの双方を含む)や、専用回線網(アナログ/デジタルの双方を含む)や、CATV網や、携帯回線交換網または携帯パケット交換網(IMT2000方式、GSM(登録商標)方式またはPDC/PDC−P方式等を含む)や、無線呼出網や、Bluetooth(登録商標)等の局所無線網や、PHS網や、衛星通信網(CS、BSまたはISDB等を含む)等でもよい。
つぎに、本システムのデータベース装置400の構成について図20を参照して説明する。図20は、本システムのデータベース装置400の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
データベース装置400は、心血管イベント評価装置100または当該データベース装置で多変量判別式を作成する際に用いる心血管イベント状態情報や、心血管イベント評価装置100で作成した多変量判別式、心血管イベント評価装置100での評価結果などを格納する機能を有する。図20に示すように、データベース装置400は、当該データベース装置を統括的に制御するCPU等の制御部402と、ルータ等の通信装置および専用線等の有線または無線の通信回路を介して当該データベース装置をネットワーク300に通信可能に接続する通信インターフェース部404と、各種のデータベースやテーブルやファイル(例えばWebページ用ファイル)などを格納する記憶部406と、入力装置412や出力装置414に接続する入出力インターフェース部408と、で構成されており、これら各部は任意の通信路を介して通信可能に接続されている。
記憶部406は、ストレージ手段であり、例えば、RAM・ROM等のメモリ装置や、ハードディスクのような固定ディスク装置や、フレキシブルディスクや、光ディスク等を用いることができる。記憶部406には、各種処理に用いる各種プログラム等を格納する。通信インターフェース部404は、データベース装置400とネットワーク300(またはルータ等の通信装置)との間における通信を媒介する。すなわち、通信インターフェース部404は、他の端末と通信回線を介してデータを通信する機能を有する。入出力インターフェース部408は、入力装置412や出力装置414に接続する。ここで、出力装置414には、モニタ(家庭用テレビを含む)の他、スピーカやプリンタを用いることができる(なお、以下で、出力装置414をモニタ414として記載する場合がある。)。また、入力装置412には、キーボードやマウスやマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。
制御部402は、OS(Operating System)等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、これらのプログラムに基づいて種々の情報処理を実行する。制御部402は、図示の如く、大別して、要求解釈部402aと閲覧処理部402bと認証処理部402cと電子メール生成部402dとWebページ生成部402eと送信部402fとを備えている。
要求解釈部402aは、心血管イベント評価装置100からの要求内容を解釈し、その解釈結果に応じて制御部402の各部に処理を受け渡す。閲覧処理部402bは、心血管イベント評価装置100からの各種画面の閲覧要求を受けて、これら画面のWebデータの生成や送信を行う。認証処理部402cは、心血管イベント評価装置100からの認証要求を受けて、認証判断を行う。電子メール生成部402dは、各種の情報を含んだ電子メールを生成する。Webページ生成部402eは、利用者がクライアント装置200で閲覧するWebページを生成する。送信部402fは、心血管イベント状態情報や多変量判別式などの各種情報を、心血管イベント評価装置100へ送信する。
[2−3.第2実施形態の具体例]
ここでは、第2実施形態の具体例について図21を参照して説明する。図21は、第2実施形態にかかる心血管イベント評価サービス処理の一例を示すフローチャートである。
なお、本処理で用いるアミノ酸濃度データは、例えば動物やヒト(例えば糖尿病患者など)などの個体から予め採取した血液(例えば血漿、血清などを含む)を、以下の(A)または(B)などの測定方法で専門業者が分析又は独自に分析して得たアミノ酸の濃度値に関するものである。ここで、アミノ酸濃度の単位は、例えばモル濃度や重量濃度、これらの濃度に任意の定数を加減乗除することで得られるものでもよい。
(A)採取した血液サンプルを遠心することにより血液から血清を分離した。全ての血清サンプルは、アミノ酸濃度の測定時まで−80℃で凍結保存した。アミノ酸濃度測定時には、アセトニトリルを添加し除蛋白処理を行った後、標識試薬(3−アミノピリジル−N−ヒドロキシスクシンイミジルカルバメート)を用いてプレカラム誘導体化を行い、そして、液体クロマトグラフ質量分析計(LC/MS/MS)によりアミノ酸濃度を分析した(国際公開第2003/069328号、国際公開第2005/116629号を参照)。
(B)採取した血液サンプルを遠心することにより血液から血清を分離した。全ての血清サンプルは、アミノ酸濃度の測定時まで−80℃で凍結保存した。アミノ酸濃度測定時には、スルホサリチル酸を添加し除蛋白処理を行った後、ニンヒドリン試薬を用いたポストカラム誘導体化法を原理としたアミノ酸分析計によりアミノ酸濃度を分析した。
まず、Webブラウザ211を表示した画面上で利用者が入力装置250を介して心血管イベント評価装置100が提供するWebサイトのアドレス(URLなど)を指定すると、クライアント装置200は心血管イベント評価装置100へアクセスする。具体的には、利用者がクライアント装置200のWebブラウザ211の画面更新を指示すると、Webブラウザ211は、心血管イベント評価装置100が提供するWebサイトのアドレスを所定の通信規約で心血管イベント評価装置100へ送信することで、アミノ酸濃度データ送信画面に対応するWebページの送信要求を、当該アドレスに基づくルーティングで心血管イベント評価装置100へ行う。
つぎに、心血管イベント評価装置100は、要求解釈部102aで、クライアント装置200からの送信を受け、当該送信の内容を解析し、解析結果に応じて制御部102の各部に処理を移す。具体的には、送信の内容がアミノ酸濃度データ送信画面に対応するWebページの送信要求であった場合、心血管イベント評価装置100は、主として閲覧処理部102bで、記憶部106の所定の記憶領域に格納されている当該Webページを表示するためのWebデータを取得し、取得したWebデータをクライアント装置200へ送信する。より具体的には、利用者からアミノ酸濃度データ送信画面に対応するWebページの送信要求があった場合、心血管イベント評価装置100は、まず、制御部102で、利用者IDや利用者パスワードの入力を利用者に対して求める。そして、利用者IDやパスワードが入力されると、心血管イベント評価装置100は、認証処理部102cで、入力された利用者IDやパスワードと利用者情報ファイル106aに格納されている利用者IDや利用者パスワードとの認証判断を行う。そして、心血管イベント評価装置100は、認証可の場合にのみ、閲覧処理部102bで、アミノ酸濃度データ送信画面に対応するWebページを表示するためのWebデータをクライアント装置200へ送信する。なお、クライアント装置200の特定は、クライアント装置200から送信要求と共に送信されたIPアドレスで行う。
つぎに、クライアント装置200は、心血管イベント評価装置100から送信されたWebデータ(アミノ酸濃度データ送信画面に対応するWebページを表示するためのもの)を受信部213で受信し、受信したWebデータをWebブラウザ211で解釈し、モニタ261にアミノ酸濃度データ送信画面を表示する。
つぎに、モニタ261に表示されたアミノ酸濃度データ送信画面に対し利用者が入力装置250を介して個体のアミノ酸濃度データなどを入力・選択すると、クライアント装置200は、送信部214で、入力情報や選択事項を特定するための識別子を心血管イベント評価装置100へ送信することで、個体のアミノ酸濃度データを心血管イベント評価装置100へ送信する(ステップSA21)。なお、ステップSA21におけるアミノ酸濃度データの送信は、FTP等の既存のファイル転送技術等により実現してもよい。
つぎに、心血管イベント評価装置100は、要求解釈部102aで、クライアント装置200から送信された識別子を解釈することによりクライアント装置200の要求内容を解釈し、心血管イベントの将来の状態の評価用の多変量判別式(具体的には、心血管イベントの将来の発症に関する2群判別用の多変量判別式)の送信要求をデータベース装置400へ行う。
つぎに、データベース装置400は、要求解釈部402aで、心血管イベント評価装置100からの送信要求を解釈し、記憶部406の所定の記憶領域に格納した多変量判別式(例えばアップデートされた最新のもの)を心血管イベント評価装置100へ送信する(ステップSA22)。
具体的には、ステップSA26にて、個体が将来、心血管イベントを発症するか否かを判別する場合には、ステップSA22では、EtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つを変数として含む多変量判別式を心血管イベント評価装置100へ送信する。
つぎに、心血管イベント評価装置100は、受信部102fで、クライアント装置200から送信された個体のアミノ酸濃度データおよびデータベース装置400から送信された多変量判別式を受信し、受信したアミノ酸濃度データをアミノ酸濃度データファイル106bの所定の記憶領域に格納すると共に、受信した多変量判別式を多変量判別式ファイル106e4の所定の記憶領域に格納する(ステップSA23)。
つぎに、心血管イベント評価装置100は、制御部102で、ステップSA23で受信した個体のアミノ酸濃度データから欠損値や外れ値などのデータを除去する(ステップSA24)。
つぎに、心血管イベント評価装置100は、判別値算出部102iで、ステップSA24で欠損値や外れ値などのデータが除去された個体のアミノ酸濃度データ、およびステップSA23で受信した多変量判別式に基づいて、判別値を算出する(ステップSA25)。
具体的には、ステップSA23にて、EtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つを変数として含む多変量判別式が受信された場合には、心血管イベント評価装置100は、判別値算出部102iで、アミノ酸濃度データに含まれるEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つの濃度値、およびEtOHNH2,Sar,Ala,β−AIBA,Ser,Pro,Thr,Hypro,Ile,Leu,Orn,Asp,Lys,Glu,His,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysのうち少なくとも1つを変数として含む多変量判別式に基づいて、判別値を算出する。
つぎに、心血管イベント評価装置100は、判別値基準判別部102j1で、ステップSA25で算出した判別値に基づいて、個体が将来、心血管イベントを発症するか否かを判別し、その判別結果を評価結果ファイル106gの所定の記憶領域に格納する(ステップSA26)。具体的には、ステップSA25で算出した判別値と予め設定された閾値(カットオフ値)とを比較することで、個体が将来、心血管イベントを発症するか否かを判別する。
つぎに、心血管イベント評価装置100は、送信部102mで、ステップSA26で得た判別結果(ステップSA25で算出した判別値を含めてもよい)を、アミノ酸濃度データの送信元のクライアント装置200とデータベース装置400とへ送信する(ステップSA27)。具体的には、まず、心血管イベント評価装置100は、Webページ生成部102eで、判別結果を表示するためのWebページを作成し、作成したWebページに対応するWebデータを記憶部106の所定の記憶領域に格納する。ついで、利用者がクライアント装置200のWebブラウザ211に入力装置250を介して所定のURLを入力し上述した認証を経た後、クライアント装置200は、当該Webページの閲覧要求を心血管イベント評価装置100へ送信する。ついで、心血管イベント評価装置100は、閲覧処理部102bで、クライアント装置200から送信された閲覧要求を解釈し、判別結果を表示するためのWebページに対応するWebデータを記憶部106の所定の記憶領域から読み出す。そして、心血管イベント評価装置100は、送信部102mで、読み出したWebデータをクライアント装置200へ送信すると共に、当該Webデータ又は判別結果をデータベース装置400へ送信する。
ここで、ステップSA27において、心血管イベント評価装置100は、制御部102で、判別結果を電子メールで利用者のクライアント装置200へ通知してもよい。具体的には、まず、心血管イベント評価装置100は、電子メール生成部102dで、利用者IDなどを基にして利用者情報ファイル106aに格納されている利用者情報を送信タイミングに従って参照し、利用者の電子メールアドレスを取得する。ついで、心血管イベント評価装置100は、電子メール生成部102dで、取得した電子メールアドレスを宛て先とし利用者の氏名および判別結果を含む電子メールに関するデータを生成する。ついで、心血管イベント評価装置100は、送信部102mで、生成した当該データを利用者のクライアント装置200へ送信する。
また、ステップSA27において、心血管イベント評価装置100は、FTP等の既存のファイル転送技術等で、判別結果を利用者のクライアント装置200へ送信してもよい。
図21の説明に戻り、データベース装置400は、制御部402で、心血管イベント評価装置100から送信された判別結果またはWebデータを受信し、受信した判別結果またはWebデータを記憶部406の所定の記憶領域に保存(蓄積)する(ステップSA28)。
また、クライアント装置200は、受信部213で、心血管イベント評価装置100から送信されたWebデータを受信し、受信したWebデータをWebブラウザ211で解釈し、個体の判別結果が記されたWebページの画面をモニタ261に表示する(ステップSA29)。なお、判別結果が心血管イベント評価装置100から電子メールで送信された場合には、クライアント装置200は、電子メーラ212の公知の機能で、心血管イベント評価装置100から送信された電子メールを任意のタイミングで受信し、受信した電子メールをモニタ261に表示する。
以上により、利用者は、モニタ261に表示されたWebページを閲覧することで、上記2群判別に関する判別結果を確認することができる。なお、利用者は、モニタ261に表示されたWebページの表示内容をプリンタ262で印刷してもよい。
また、判別結果が心血管イベント評価装置100から電子メールで送信された場合には、利用者は、モニタ261に表示された電子メールを閲覧することで、上記2群判別に関する判別結果を確認することができる。利用者は、モニタ261に表示された電子メールの表示内容をプリンタ262で印刷してもよい。
これにて、心血管イベント評価サービス処理の説明を終了する。
[2−4.他の実施形態]
本発明にかかる心血管イベント評価装置、心血管イベント評価方法、心血管イベント評価プログラム、記録媒体、心血管イベント評価システム、および情報通信端末装置は、上述した第2実施形態以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。
また、第2実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
このほか、上記文献中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。
また、心血管イベント評価装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
例えば、心血管イベント評価装置100が備える処理機能、特に制御部102にて行われる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、情報処理装置に本発明にかかる心血管イベント評価方法を実行させるためのプログラム化された命令を含む一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じて心血管イベント評価装置100に機械的に読み取られる。すなわち、ROMまたはHDDなどの記憶部106などには、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御部を構成する。
また、このコンピュータプログラムは、心血管イベント評価装置100に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
また、本発明にかかる心血管イベント評価プログラムを、一時的でないコンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、USBメモリ、SDカード、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM(登録商標)、CD−ROM、MO、DVD、および、Blu−ray Disc等の任意の「可搬用の物理媒体」を含むものとする。
また、「プログラム」とは、任意の言語または記述方法にて記述されたデータ処理方法であり、ソースコードまたはバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施形態に示した各装置において記録媒体を読み取るための具体的な構成および読み取り手順ならびに読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
記憶部106に格納される各種のデータベース等は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および、ウェブページ用ファイル等を格納する。
また、心血管イベント評価装置100は、既知のパーソナルコンピュータまたはワークステーション等の情報処理装置として構成してもよく、また、任意の周辺装置が接続された当該情報処理装置として構成してもよい。また、心血管イベント評価装置100は、当該情報処理装置に本発明の心血管イベント評価方法を実現させるソフトウェア(プログラムまたはデータ等を含む)を実装することにより実現してもよい。
更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じてまたは機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。
最後に、心血管イベント評価装置100で行う多変量判別式作成処理の一例について図22を参照して詳細に説明する。なお、ここで説明する処理はあくまでも一例であり、多変量判別式の作成方法はこれに限定されない。図22は多変量判別式作成処理の一例を示すフローチャートである。なお、当該多変量判別式作成処理は、心血管イベント状態情報を管理するデータベース装置400で行ってもよい。
なお、本説明では、心血管イベント評価装置100は、データベース装置400から事前に取得した心血管イベント状態情報を、心血管イベント状態情報ファイル106cの所定の記憶領域に格納しているものとする。また、心血管イベント評価装置100は、心血管イベント状態情報指定部102gで事前に指定した心血管イベント状態指標データおよびアミノ酸濃度データを含む心血管イベント状態情報を、指定心血管イベント状態情報ファイル106dの所定の記憶領域に格納しているものとする。
まず、多変量判別式作成部102hは、候補多変量判別式作成部102h1で、指定心血管イベント状態情報ファイル106dの所定の記憶領域に格納されている心血管イベント状態情報から所定の式作成手法に基づいて候補多変量判別式を作成し、作成した候補多変量判別式を候補多変量判別式ファイル106e1の所定の記憶領域に格納する(ステップSB21)。具体的には、まず、多変量判別式作成部102hは、候補多変量判別式作成部102h1で、複数の異なる式作成手法(主成分分析や判別分析、サポートベクターマシン、重回帰分析、ロジスティック回帰分析、k−means法、クラスター解析、決定木、Cox比例ハザードモデルなどの多変量解析に関するものを含む。)の中から所望のものを1つ選択し、選択した式作成手法に基づいて、作成する候補多変量判別式の形(式の形)を決定する。つぎに、多変量判別式作成部102hは、候補多変量判別式作成部102h1で、心血管イベント状態情報に基づいて、選択した式選択手法に対応する種々(例えば平均や分散など)の計算を実行する。つぎに、多変量判別式作成部102hは、候補多変量判別式作成部102h1で、計算結果および決定した候補多変量判別式のパラメータを決定する。これにより、選択した式作成手法に基づいて候補多変量判別式が作成される。なお、複数の異なる式作成手法を併用して候補多変量判別式を同時並行(並列)的に作成する場合は、選択した式作成手法ごとに上記の処理を並行して実行すればよい。また、複数の異なる式作成手法を併用して候補多変量判別式を直列的に作成する場合は、例えば、主成分分析を行って作成した候補多変量判別式を利用して心血管イベント状態情報を変換し、変換した心血管イベント状態情報に対して判別分析を行うことで候補多変量判別式を作成してもよい。
つぎに、多変量判別式作成部102hは、候補多変量判別式検証部102h2で、ステップSB21で作成した候補多変量判別式を所定の検証手法に基づいて検証(相互検証)し、検証結果を検証結果ファイル106e2の所定の記憶領域に格納する(ステップSB22)。具体的には、多変量判別式作成部102hは、候補多変量判別式検証部102h2で、指定心血管イベント状態情報ファイル106dの所定の記憶領域に格納されている心血管イベント状態情報に基づいて候補多変量判別式を検証する際に用いる検証用データを作成し、作成した検証用データに基づいて候補多変量判別式を検証する。なお、ステップSB21で複数の異なる式作成手法を併用して候補多変量判別式を複数作成した場合には、多変量判別式作成部102hは、候補多変量判別式検証部102h2で、各式作成手法に対応する候補多変量判別式ごとに所定の検証手法に基づいて検証する。ここで、ステップSB22において、ブートストラップ法やホールドアウト法、N−フォールド法、リーブワンアウト法などのうち少なくとも1つに基づいて候補多変量判別式の判別率や感度、特異度、情報量基準、ROC_AUC(受信者特性曲線の曲線下面積)などのうち少なくとも1つに関して検証してもよい。これにより、心血管イベント状態情報や診断条件を考慮した予測性または頑健性の高い候補指標式を選択することができる。
つぎに、多変量判別式作成部102hは、変数選択部102h3で、所定の変数選択手法に基づいて、候補多変量判別式の変数を選択することで、候補多変量判別式を作成する際に用いる心血管イベント状態情報に含まれるアミノ酸濃度データの組み合わせを選択し、選択したアミノ酸濃度データの組み合わせを含む心血管イベント状態情報を選択心血管イベント状態情報ファイル106e3の所定の記憶領域に格納する(ステップSB23)。なお、ステップSB21で複数の異なる式作成手法を併用して候補多変量判別式を複数作成し、ステップSB22で各式作成手法に対応する候補多変量判別式ごとに所定の検証手法に基づいて検証した場合には、ステップSB23において、多変量判別式作成部102hは、変数選択部102h3で、候補多変量判別式ごとに所定の変数選択手法に基づいて候補多変量判別式の変数を選択してもよい。ここで、ステップSB23において、検証結果からステップワイズ法、ベストパス法、近傍探索法、遺伝的アルゴリズムのうち少なくとも1つに基づいて候補多変量判別式の変数を選択してもよい。なお、ベストパス法とは、候補多変量判別式に含まれる変数を1つずつ順次減らしていき、候補多変量判別式が与える評価指標を最適化することで変数を選択する方法である。また、ステップSB23において、多変量判別式作成部102hは、変数選択部102h3で、指定心血管イベント状態情報ファイル106dの所定の記憶領域に格納されている心血管イベント状態情報に基づいてアミノ酸濃度データの組み合わせを選択してもよい。
つぎに、多変量判別式作成部102hは、指定心血管イベント状態情報ファイル106dの所定の記憶領域に格納されている心血管イベント状態情報に含まれるアミノ酸濃度データの全ての組み合わせが終了したか否かを判定し、判定結果が「終了」であった場合(ステップSB24:Yes)には次のステップ(ステップSB25)へ進み、判定結果が「終了」でなかった場合(ステップSB24:No)にはステップSB21へ戻る。なお、多変量判別式作成部102hは、予め設定した回数が終了したか否かを判定し、判定結果が「終了」であった場合には(ステップSB24:Yes)次のステップ(ステップSB25)へ進み、判定結果が「終了」でなかった場合(ステップSB24:No)にはステップSB21へ戻ってもよい。また、多変量判別式作成部102hは、ステップSB23で選択したアミノ酸濃度データの組み合わせが、指定心血管イベント状態情報ファイル106dの所定の記憶領域に格納されている心血管イベント状態情報に含まれるアミノ酸濃度データの組み合わせまたは前回のステップSB23で選択したアミノ酸濃度データの組み合わせと同じであるか否かを判定し、判定結果が「同じ」であった場合(ステップSB24:Yes)には次のステップ(ステップSB25)へ進み、判定結果が「同じ」でなかった場合(ステップSB24:No)にはステップSB21へ戻ってもよい。また、多変量判別式作成部102hは、検証結果が具体的には各候補多変量判別式に関する評価値である場合には、当該評価値と各式作成手法に対応する所定の閾値との比較結果に基づいて、ステップSB25へ進むかステップSB21へ戻るかを判定してもよい。
つぎに、多変量判別式作成部102hは、検証結果に基づいて、複数の候補多変量判別式の中から多変量判別式として採用する候補多変量判別式を選出することで多変量判別式を決定し、決定した多変量判別式(選出した候補多変量判別式)を多変量判別式ファイル106e4の所定の記憶領域に格納する(ステップSB25)。ここで、ステップSB25において、例えば、同じ式作成手法で作成した候補多変量判別式の中から最適なものを選出する場合と、すべての候補多変量判別式の中から最適なものを選出する場合とがある。
これにて、多変量判別式作成処理の説明を終了する。
糖尿病患者392人から採取された血清中のアミノ酸濃度の測定を、上述した実施形態で説明した(A)の測定方法で行った。アミノ酸濃度を測定してから10年以内に心血管イベントを発症した糖尿病患者を心血管イベント発症者とした。392人の糖尿病患者を、心血管イベント発症者と心血管イベント非発症者の2群に分類した。心血管イベント発症者および心血管イベント非発症者はそれぞれ、64名および328名であった。64名の心血管イベント発症者の内訳は、心筋梗塞11名、狭心症29名、心不全5名、脳虚血1名、脳梗塞12名、脳出血5名、内頚動脈狭窄症1名である。各アミノ酸について将来の心血管イベント発症群と心血管イベント非発症群の判別能をROC_AUC(受信者特性曲線の曲線下面積)で評価した。
ノンパラメトリックの仮定のもとで帰無仮説を「ROC_AUC=0.5」とした場合の検定でROC_AUCが有意(p<0.05)であったアミノ酸は、β−AIBA,3−MeHis,Cit,Trp,Cysであった。これらのアミノ酸の内、β−AIBA,3−MeHis,Cit,Cysは将来の心血管イベント発症群で有意に増加し、一方、Trpは将来の心血管イベント発症群で有意に減少した。
つぎに、同じアミノ酸濃度データを用いて、心血管イベント発症の有無、およびアミノ酸濃度測定時から心血管イベント発症までの年数(心血管イベント非発症者の場合はアミノ酸濃度測定時から最終観察年までの年数)をもとに、アミノ酸について将来の心血管イベント発症と心血管イベント非発症の判別能を、単変量Cox比例ハザードモデルで評価した。その結果、将来の心血管イベント発症予測因子として有意(p<0.05)であったアミノ酸はβ−AIBA,3−MeHis,Cit,Trp,Cysであった。
実施例1で測定したものと同じアミノ酸濃度データを用いて、実施例1で記述した将来の心血管イベント発症の診断に有効な、血清中のアミノ酸濃度を変数に持つ将来の心血管イベント発症を判別するための多変量判別式(多変量関数)を求めた。
まず、多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める変数の組み合わせを31種類のアミノ酸から探索し、そしてクロスバリデーションとしてLeave−One−Out法を採用して、将来の心血管イベント発症の良好な判別能を持つロジスティック回帰式の探索を鋭意実施した。
ここで、31種類のアミノ酸は、EtOHNH2,Gly,Sar,Ala,β−AIBA,α−ABA,Ser,Pro,Val,Thr,Tau,Hypro,Ile,Leu,Asn,Orn,Asp,Gln,Lys,Glu,Met,His,α−AAA,Phe,1−MeHis,3−MeHis,Arg,Cit,Tyr,Trp,Cysである(以下同様。)。
ROC_AUCで評価した判別能が同等に良好なロジスティック回帰式の一覧を、図23から図26に示す。ここで、図23から図26には、ロジスティック回帰式に含まれる変数の組み合わせ、クロスバリデーション有りでのROC_AUC値、およびクロスバリデーション無しでのROC_AUC値が示されている。図23から図26に含まれる式における変数の出現頻度を多い順に10位まで列挙すると、EtOHNH2,3−MeHis,Glu,Hypro,Trp,Leu,Tyr,Sar,Ile,Pheである。
なお、判別能が同等に良好なロジスティック回帰式のうち、例えば、変数の組「EtOHNH2,Hypro,Glu,3−MeHis,Tyr,Trp」を持つ指標式「(−0.1452)+(−0.2230)EtOHNH2+(−0.04637)Hypro+(0.01303)Glu+(0.3524)3−MeHis+(0.01250)Tyr+(−0.03093)Trp」の判別能はROC_AUC=0.725、感度=0.703,特異度=0.710と良好なものであった。なお、上記感度及び特異度は、感度と特異度の平均が最も高くなる最高判別点をカットオフ値とした場合の値である。
ロジスティック回帰式に含める変数の組み合わせを19種類のアミノ酸から探索し、そしてクロスバリデーションとしてLeave−One−Out法を採用して、将来の心血管イベント発症の良好な判別能を持つロジスティック回帰式の探索を鋭意実施した。
ここで、19種類のアミノ酸は、Gly,Ala,Ser,Pro,Val,Thr,Ile,Leu,Asn,Orn,Gln,Lys,Met,His,Phe,Arg,Cit,Tyr,Trpである(以下同様。)。
ROC_AUCで評価した判別能が同等に良好なロジスティック回帰式の一覧を、図27から図30に示す。ここで、図27から図30には、ロジスティック回帰式に含まれる変数の組み合わせ、クロスバリデーション有りでのROC_AUC値、およびクロスバリデーション無しでのROC_AUC値が示されている。図27から図30に含まれる式における変数の出現頻度を多い順に10位まで列挙すると、Trp,Thr,Lys,Cit,Arg,Ser,Orn,Pro,Ala,Hisである。
なお、判別能が同等に良好なロジスティック回帰式のうち、例えば、変数の組「Ser,Thr,Lys,Arg,Trp」を持つ指標式「(0.3452)+(−0.009171)Ser+(−0.01119)Thr+(0.006555)Lys+(0.01067)Arg+(−0.03345)Trp」の判別能はROC_AUC=0.662、感度=0.656,特異度=0.659と良好なものであった。なお、上記感度及び特異度は、感度と特異度の平均が最も高くなる最高判別点をカットオフ値とした場合の値である。
つぎに、多変量判別式として線形判別式を用いた。線形判別式に含める変数の組み合わせを31種類のアミノ酸から探索し、そしてクロスバリデーションとしてブートストラップ法を採用して、将来の心血管イベント発症の良好な判別能を持つ線形判別式の探索を鋭意実施した。
ROC_AUCで評価した判別能が同等に良好な線形判別式の一覧を、図31から図34に示す。ここで、図31から図34には、線形判別式、クロスバリデーション有りでのROC_AUC値の平均値、およびクロスバリデーション無しでのROC_AUC値が示されている。図31から図34に含まれる式における変数の出現頻度を多い順に10位まで列挙すると、3−MeHis,EtOHNH2,Glu,Trp,Hypro,Leu,Tyr,1−MeHis,Ile,Aspである。
なお、判別能が同等に良好な線形判別式のうち、例えば、変数の組「EtOHNH2,Hypro,Leu,Glu,3−MeHis,Trp」を持つ指標式「(−0.1491)+(−0.0434)EtOHNH2+(−0.0099)Hypro+(−0.0016)Leu+(0.0046)Glu+(0.1117)3−MeHis+(−0.0052)Trp」の判別能は、ROC_AUC=0.713,感度=0.594,特異度=0.817と良好なものであった。なお、上記感度及び特異度は、感度と特異度の平均が最も高くなる最高判別点をカットオフ値とした場合の値である。
線形判別式に含める変数の組み合わせを19種類のアミノ酸から探索し、そしてクロスバリデーションとしてブートストラップ法を採用して、将来の心血管イベント発症の良好な判別能を持つ線形判別式の探索を鋭意実施した。
ROC_AUCで評価した判別能が同等に良好な線形判別式の一覧を、図35から図38に示す。ここで、図35から図38には、線形判別式、クロスバリデーション有りでのROC_AUC値の平均値、およびクロスバリデーション無しでのROC_AUC値が示されている。図35から図38に含まれる式における変数の出現頻度を多い順に10位まで列挙すると、Trp,Thr,Arg,Pro,Lys,Orn,Cit,Ser,His,Alaである。
なお、判別能が同等に良好な線形判別式のうち、例えば、変数の組「Pro,Thr,Orn,Arg,Trp」を持つ指標式「(−0.5164)+(0.0018)Pro+(−0.0040)Thr+(0.0038)Orn+(0.0026)Arg+(−0.0074)Trp」の判別能は、ROC_AUC=0.666,感度=0.641,特異度=0.637と良好なものであった。なお、上記感度及び特異度は、感度と特異度の平均が最も高くなる最高判別点をカットオフ値とした場合の値である。
つぎに、多変量判別式としてCox比例ハザードモデルを用いた。Cox比例ハザードモデルに含める変数の組み合わせを31種類のアミノ酸から探索し、将来の心血管イベント発症の良好な判別能を持つCox比例ハザードモデル式の探索を鋭意実施した。
ROC_AUCで評価した判別能が同等に良好なCox比例ハザードモデル式の一覧を、図39から図42に示す。ここで、図39から図42には、Cox比例ハザードモデル式、クロスバリデーション有りでのROC_AUC値の平均値、およびクロスバリデーション無しでのROC_AUC値が示されている。図39から図42に含まれる式における変数の出現頻度を多い順に10位まで列挙すると、3−MeHis,EtOHNH2,Glu,Trp,Hypro,Leu,Tyr,Sar,Phe,β−AIBAである。
なお、判別能が同等に良好なCox比例ハザードモデル式のうち、例えば、変数の組「EtOHNH2,Hypro,Glu,3−MeHis,Tyr,Trp」を持つ指標式「(−0.1263)EtOHNH2+(−0.0296)Hypro+(0.0080)Glu+(0.2112)3−MeHis+(0.0095)Tyr+(−0.0280)Trp」の判別能は、ROC_AUC=0.718,感度=0.641,特異度=0.726と良好なものであった。なお、上記感度及び特異度は、感度と特異度の平均が最も高くなる最高判別点をカットオフ値とした場合の値である。
Cox比例ハザードモデル式に含める変数の組み合わせを19種類のアミノ酸から探索し、将来の心血管イベント発症の良好な判別能を持つCox比例ハザードモデル式の探索を鋭意実施した。
ROC_AUCで評価した判別能が同等に良好なCox比例ハザードモデル式の一覧を、図43から図46に示す。ここで、図43から図46には、Cox比例ハザードモデル式、クロスバリデーション有りでのROC_AUC値の平均値、およびクロスバリデーション無しでのROC_AUC値が示されている。図43から図46に含まれる式における変数の出現頻度を多い順に10位まで列挙すると、Trp,Thr,Lys,Cit,Ser,Arg,Pro,Orn,Ala,Hisである。
なお、判別能が同等に良好なCox比例ハザードモデル式のうち、例えば、変数の組「Pro,Thr,Lys,Cit,Trp」を持つ指標式「(0.0042)Pro+(−0.0133)Thr+(0.0075)Lys+(0.0137)Cit+(−0.0279)Trp」の判別能は、ROC_AUC=0.662,感度=0.797,特異度=0.500と良好なものであった。なお、上記感度及び特異度は、感度と特異度の平均が最も高くなる最高判別点をカットオフ値とした場合の値である。