JP7066385B2 - 情報処理方法、情報処理装置、情報処理システム及びプログラム - Google Patents

情報処理方法、情報処理装置、情報処理システム及びプログラム Download PDF

Info

Publication number
JP7066385B2
JP7066385B2 JP2017228150A JP2017228150A JP7066385B2 JP 7066385 B2 JP7066385 B2 JP 7066385B2 JP 2017228150 A JP2017228150 A JP 2017228150A JP 2017228150 A JP2017228150 A JP 2017228150A JP 7066385 B2 JP7066385 B2 JP 7066385B2
Authority
JP
Japan
Prior art keywords
data group
label
medical data
machine learning
medical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017228150A
Other languages
English (en)
Other versions
JP2019101485A (ja
Inventor
将実 川岸
裕之 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017228150A priority Critical patent/JP7066385B2/ja
Publication of JP2019101485A publication Critical patent/JP2019101485A/ja
Application granted granted Critical
Publication of JP7066385B2 publication Critical patent/JP7066385B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Apparatus For Radiation Diagnosis (AREA)

Description

本明細書の開示は、情報処理方法、情報処理装置、情報処理システム及びプログラムに関する。
あるデータを用いて機械学習した結果を利用して、他のデータに有効な機械学習を効率的に行う転移学習の技術が知られている(非特許文献1)。
特許文献1には、同一のデータに付与された異なるラベルを用いて、第1のラベルを分類するように学習した分類器を基に、第2のラベルを分類する分類器に転移学習する技術が記載されている。
特開2017-084320号公報
Pan SJ and Yang Q,「A survey on transfer learning」,IEEE Transactions on Knowledge and Data Engineering,22(10),pp.1345-1349,2010
医療分野のように、データの分野によっては付与されるラベルの量が異なる場合がある。例えば、第1のラベルを年齢、第2のラベルを血液検査値とすると、第1のラベルは全例に付与されるが、第2のラベルは血液検査を行った例にのみ付与される。特許文献1は、ラベルの種別でデータ数が異なる場合については開示していない。
本発明の実施形態に係る情報処理方法は、第1のラベルと第2のラベルとのうち、前記第1のラベルのみが付与された第1の医用データ群と、前記第1のラベルと前記第2のラベルとのうち、前記第2のラベルのみが付与された第2の医用データ群とを取得する取得工程と、前記第1の医用データ群に基づいて第1の機械学習を行う第1の学習工程と、前記第1の機械学習におけるパラメータと前記第2の医用データ群とに基づいて第2の機械学習を行う第2の学習工程と、を有することを特徴とする。
本発明の実施形態にかかる情報処理方法によれば、データ群ごとに異なる種別のラベルが付与されている場合であっても、第1のラベルに係る機械学習の結果に基づいて、第2のラベルに係る機械学習を適切に行うことができる。
情報処理装置の機能構成の一例を示す図である。 情報処理装置のハードウェア構成の一例を示す図である。 情報処理装置の処理の一例を示すフローチャートである。 第1の機械学習と第2の機械学習の例を示す図である。 情報処理装置の機能構成の他の一例を示す図である。 情報処理装置の処理の他の一例を示すフローチャートである。
以下、本発明を実施するための形態について図面を用いて説明する。
<実施形態1>
医療分野において、医用画像から医師の診断の補助となるような情報を推論して提示する診断支援装置の開発が進められている。当該推論のために、医用画像とそのラベルに基づく機械学習が行われる場合がある。機械学習には多数の学習用データが求められるが、診断に用いられる様々な情報のうち、推論の対象となる情報のラベルを含むデータを多数入手できない場合がある。実施形態1は、推論の対象となる情報のラベルを含むデータが少数である場合にも、精度良く機械学習を行えるようにすることを目的とする。
実施形態1における情報処理装置は、多数のデータから構築された第1のラベルを分類する分類器を転移させて、少数のデータを用いて第2のラベルを分類する分類器を構築する。
以下では、学習に用いる医用画像は胸部X線CT画像とし、第1のラベルと第2のラベルとして医用情報を用いるものとする。第1のラベル及び第2のラベルはそれぞれ、医用画像の被検体の状態を表す医用情報である。より具体的には、第1のラベルとして肺結節の診断名を、第2のラベルとして肺結節の画像所見を用いるものとする。
図1は、実施形態1における情報処理装置100の機能構成の一例を示す図である。情報処理装置100は本発明の実施形態に係る情報処理方法を実行する装置の一例である。本実施形態における情報処理装置100は、記憶部200は学習に用いる医用画像と、ラベルとなる当該医用画像に関する診断名や画像所見等の医用情報を保持している。記憶部200は、PACSや電子カルテ、読影レポートから抽出された情報を保持する。あるいは、記憶部200はPACSや電子カルテ、読影レポートでもよく、記憶部200は情報処理装置100からの要求に従い、必要となる情報を情報処理装置100に出力する。
情報処理装置100は、取得部102と、選択部104と、第1の機械学習部106と、第2の機械学習部108とを含む。取得部102は記憶部200に要求を行い、医用画像と診断名(第1のラベル)の組を複数有する第1の医用データ群と、医用画像と画像所見(第2のラベル)の組を複数有する第2の医用データ群を取得する。選択部104は第1のラベルと第2のラベルとが付与されたデータの少なくとも一部を第3の医用データ群として選択する。第1の機械学習部106は、第1の医用データ群に基づいて診断名を分類する第1の機械学習を行う。第2の機械学習部108は、第1の機械学習の結果に基づいて、第2の医用データ群と第3の医用データ群に基づいて画像所見を分類する第2の機械学習を行う。
なお、図1に示した情報処理装置100の各部の少なくとも一部は独立した装置として実現してもよい。また、夫々の機能を実現するソフトウェアとして実現してもよい。本実施形態では、各部はそれぞれソフトウェアにより実現されているものとする。
図2は、情報処理装置100のハードウェア構成の一例を示す図である。CPU1001は、主として各構成要素の動作を制御する。主メモリ1002は、CPU1001が実行する制御プログラムを格納したり、CPU1001によるプログラム実行時の作業領域を提供したりする。磁気ディスク1003は、オペレーティングシステム(OS)、周辺機器のデバイスドライバ、後述する処理等を行うためのプログラムを含む各種アプリケーションソフトを実現するためのプログラムを格納する。CPU1001が主メモリ1002、磁気ディスク1003等に格納されているプログラムを実行することにより、図1に示した情報処理装置100の機能(ソフトウェア)及び後述するフローチャートにおける処理が実現される。
表示メモリ1004は、表示用データを一時記憶する。モニタ1005は、例えばCRTモニタや液晶モニタ等であり、表示メモリ1004からのデータに基づいて画像やテキスト等の表示を行う。マウス1006及びキーボード1007は、ユーザによるポインティング入力及び文字等の入力を夫々行う。上記各構成要素は、共通バス1008により互いに通信可能に接続されている。
CPU1001はプロセッサの一例である。情報処理装置100は、CPU1001に加えて、GPUやFPGA(Field-Programmable Gate Array)の少なくともいずれかを有していてもよい。主メモリ1002、磁気ディスク1003はメモリの一例である。情報処理装置100は、メモリとしてSSD(Solid State Drive)を有していてもよい。
次に、図3のフローチャートを用いて、情報処理装置100が行う全体の処理を説明する。図3は、情報処理装置100が行う処理の一例を示すフローチャートである。本実施形態では、CPU1001が主メモリ1002に格納されている各部の機能を実現するプログラムを実行することにより図3に示す処理が実現される。
なお、本実施形態では、第1の機械学習で用いるデータ(第1の医用データ群)と第2の機械学習で用いるデータ(第2の医用データ群と第3の医用データ群の和)でデータが重複しないようにする。これは、第1の機械学習と第2の機械学習の関係が独立ではないため、データが重複したことによる機械学習への影響を避けるためである。なお、本実施形態では第1の機械学習と第2の機械学習とで学習用データに重複がないようにする場合を例に説明するが、後述の変形例等に示すように、重複があってもよい。
ステップS310において、取得部102は、記憶部200に要求を行い第1の医用データ群と第2の医用データ群を取得する。本実施形態では、第1の医用データ群として診断名が付与された複数の医用画像と、第2の医用データ群として画像所見の一つである全体形状が付与された複数の医用画像を取得する。ただし本実施形態では、第1の医用データ群は画像所見が付与されたデータを含まないこととする。診断名と全体形状の両方が付与された医用画像を、後述の第3の医用データ群とする。具体的には、取得部102は記憶部200に、診断名が付与された複数の医用画像と、全体形状の画像所見が付与された複数の医用画像とを要求する。取得部102は、記憶部200から取得したこれらのデータ群のうち、診断名が付与され、全体形状の画像所見が付与されていない複数の医用画像を第1の医用データ群として取得する。取得部102は、記憶部200から取得したこれらのデータ群のうち、全体形状の画像所見が付与され、診断名が付与されていない複数の医用画像を第2の医用データ群として取得する。すなわち、第1のラベル(たとえば診断名)と第2のラベル(たとえば画像所見)とのうち、第1のラベルのみが付与されたデータ群が第1の医用データ群である。当該第1のラベルと当該第2のラベルとのうち、第2のラベルのみが付与されたデータ群が第2の医用データ群である。ステップS310は、第1の医用データ群と第2の医用データ群とを取得する取得工程の一例である。
ここで、診断名としては原発性肺癌、癌の肺転移、良性結節の3つのうちいずれかが付与されているものとする。画像所見とは医用画像の特徴を表現するものであり、たとえば文言で表現される。全体形状としては球形、楔形、不整形、平面状の4つのうちいずれかが付与されているものとする。また、第1の医用データ群のデータ数は第2の医用データ群のデータ数よりも多い(例えば5倍以上存在する)ものとする。
第1の医用データ群及び第2の医用データ群について示した数量は一例であり、必ずしもこの条件を満たす必要はない。第1の医用データ群及び第2の医用データ群についての数量の一例を示したが、第1の医用データ群と第3の医用データ群の和と、第2の医用データ群と第3の医用データ群の和とのデータ数ととらえてもよい。また、第1のラベルを有するデータのデータ数と第2のラベルを有するデータのデータ数との関係は、例えば前者が少数で後者が多数であってもよいし、両者が同程度の数であってもよい。
ステップS320において、選択部104は、ステップS310で記憶部200から取得したデータ群のうち、診断名と全体形状の画像所見とが付与された複数の医用画像を第3の医用データ群として選択する。本実施形態では、診断名と全体形状の画像所見とがともに付与された全てのデータを第3の医用データ群として選択するものとする。すなわち第1のラベル(たとえば診断名)と第2のラベル(たとえば画像所見)とが付与されたデータ群が第3の医用データ群である。ステップS320の処理とステップS310の処理を統合して取得部102が行ってもよい。
ステップS330において、第1の機械学習部106は、ステップS310で取得した第1の医用データ群に基づいて、診断名を分類する第1の機械学習を行う。第1の機械学習は深層畳み込みニューラルネットワーク(DCNN:Deep Convolutional Neural Network)の学習をするものとする。DCNNは一般に入力層と複数の畳み込み層と全結合層、出力層から構成される。以下では、全層数をNで示し、出力層をN番目の層とする。ステップS330は、第1の医用データ群に基づいて第1の機械学習を行う第1の学習工程の一例である。
ステップS340において、第2の機械学習部108は、ステップS310で取得した第2の医用データ群と、ステップS320で選択した第3の医用データ群に基づいて、第2の機械学習を行う。第2の機械学習は、ステップS330で行った第1の機械学習結果に基づいて、画像所見を分類する機械学習である。第1の機械学習結果とは、たとえば第1の機械学習で学習されたパラメータや、当該パラメータに基づいて算出される出力値のことであり、以下では第1の機械学習におけるパラメータと称する。本実施形態では、第2の医用データ群と第3の医用データ群の和のデータを用いて、第1の機械学習結果をfine―tuningすることにより第2の機械学習を行うものとする。すなわち第2の機械学習部108は、第2の機械学習においてDCNNの学習を行う。DCNNにおけるfine-tuningとは、第1のラベルを有するデータで学習したモデルの出力層を第2のラベルに適合するように入れ替え、学習済みのモデルのパラメータを初期値として、第2のラベルを有するデータで再学習を実施する手法のことを指す。この手法を用いると、初期値なしで学習を行うのに対して、少ないデータ数で同等の性能を達成することができる。ステップS340は、第1の機械学習におけるパラメータと前記第2の医用データ群とに基づいて第2の機械学習を行う第2の学習工程の一例である。
なお、機械学習の手法はDCNNに限定されない。第1の機械学習部106及び第2の機械学習部108は、ベイジアンネットワーク、サポートベクターマシン、ランダムフォレストなどの手法を用いて機械学習を行ってもよい。
図4は本実施形態におけるデータ群の関係とfine―tuningの例を示した図である。全データ中の2つの円はそれぞれ、診断名が付与された複数の医用画像の集合(左)と、全体形状の画像所見が付与された複数の医用画像の集合(右)を表す。第1の医用データ群410(図4中の濃色部分)と第2の医用データ群420(図4中の淡色部分)はステップS310で取得した夫々のデータ群の模式図である。第3の医用データ群430はステップS320で選択されたデータ群であり、診断名と、全体形状の画像所見とが付与された複数の医用画像のデータ群である。
第1の機械学習部106は、第1の医用データ群410(図4中の濃色部分)で第1の機械学習を行う(ステップS330)。第2の機械学習部108は第1の機械学習部106と出力層(第N層)以外は同一のモデル構造を有し、第1の機械学習結果における第1層から第N-1層までのパラメータ440を初期値として有する。この時、第1の機械学習部の出力層450が診断名(第1のラベル)となっているのに対し、第2の機械学習部の出力層460は全体形状(第2のラベル)に置き換わっている。そして、第2の医用データ群と第3の医用データ群の和(図4中の淡色部分と図4中の斜線部分。すなわち右側の円で表されるデータ群)のデータで第2の機械学習を行う(ステップS340)。第1の機械学習結果を基に第2の機械学習を行うため、有効な第2の機械学習に必要なデータ数を抑えることができる。
実施形態1においては全体形状の画像所見が付与されたデータ群を用いて第2の機械学習を行う場合を例に説明するが、第2の機械学習は異なるそれぞれの画像所見ごとに行われてよい。すなわち、1つの機械学習(第1の機械学習)におけるパラメータを用いて、複数の転移学習(第2の機械学習)が行われてもよい。前述のように医用データ群においては、多数の種別の画像所見が用いられる一方、それぞれの画像所見が付与されたデータ群の数が少ない場合がある。1つの機械学習のパラメータに基づいて複数の転移学習を行うことは医用データ群を用いて機械学習を行う場合に特に有効である。
例えば、第1の医用データ群のデータ数が9000、第2の医用データ群のデータ数が500、第3の医用データ群のデータ数が1000である場合を考える。ラベルが重複しているデータ(第3の医用データ群)を機械学習に使わないようにすると、第1の機械学習に用いる学習データのデータ数は9000、第2の機械学習に用いる学習データのデータ数は500となる。一方で、本実施形態の処理を行うと、第1の機械学習に用いる学習データの数は変わらず9000、第2の機械学習に用いる学習データのデータ数は1500となる。したがって、第2の機械学習に用いる学習データは、第1の機械学習に用いる学習データとラベルが重複しているデータを除く場合に比べて、データ数が3倍になる。一般に、機械学習ではデータ数が多いほど精度の高い学習ができるので、重複したデータを両者の機械学習に使わない場合に比べ、第2の機械学習の精度に正の影響が出ることが期待できる。
本実施形態では、第1のラベルと第2のラベルとのうち第1のラベルのみが付与された第1の医用データ群で第1の機械学習を行う。また、第1のラベルと第2のラベルとのうち第2のラベルのみが付与された第2の医用データ群と、第1のラベルと第2のラベルとが付与された第3の医用データ群とで第2の機械学習を行う。ラベル(第1のラベル、第2のラベル)が重複したデータを第2の機械学習のみに用いることで第2の機械学習に対するデータ数を増加させることができ、第1の機械学習に基づく第2の機械学習を適切に行うことが出来る。本実施形態の手法は、特に第2の医用データ群のデータ数が少ない場合に有効である。
(実施形態1の変形例1)
実施形態1では、ステップS320において、記憶部200から取得したデータのうち、診断名と全体形状の画像所見とがともに付与されているデータを第3の医用データ群として選択していた。変形例1では、第1の医用データ群の一部に第2のラベルを付与することで第3の医用データ群を作成してもよい。あるいは、第1の医用データ群の一部に第2のラベルを付与し、第3の医用データ群に追加するようにしてもよい。なお、この処理は、情報処理装置100が不図示の付与部112を有し、付与部112が第1の医用データ群の一部に第2のラベルを付与することにより行われる。また別の例では、選択部104は第1のラベルと第2のラベルとをともに付与されているデータ群の一部のデータ群を第3の医用データ群として選択してもよい。
例えば、第1の医用データ群のデータ数が9500、第2の医用データ群のデータ数が5000、初期の第3の医用データ群のデータ数が500である場合を考える。この場合、本実施形態の処理を適用すると、第1の機械学習に用いる学習データのデータ数は9500、第2の機械学習に用いる学習データのデータ数は1000となる。ここで、初期の第1の医用データ群9500のデータから500のデータを選択して第2のラベルを付与し、第3の医用データ群に追加した場合を考える。この場合、第1の機械学習に用いる学習データのデータ数は9000、第2の機械学習に用いる学習データのデータ数は1500となる。つまり、処理を行う前と比べて、第1の機械学習に用いる学習データのデータ数は約95%、第2の機械学習に用いる学習データのデータ数は150%となる。機械学習において、学習データのデータ数が95%になってもほぼ負の影響が出ないと考えられるのに対して、150%になった場合は大きく正の影響が出ることが期待できる。
したがって、本変形例によれば、第2の医用データ群のデータ数が少ない場合でも、データを増やすことで第2の機械学習に対するデータ数を確保することができるため、第1の機械学習に基づく第2の機械学習を適切に行うことができる。
(実施形態1の変形例2)
実施形態1では、ステップS340において、第1の機械学習結果を転移(fine-tuning)させることで第2の機械学習を行っていた。しかし、第2のラベルが付与されたデータ群のデータ数が所定値より多い場合には、第1の機械学習結果を転移するよりも通常の機械学習の方が高精度になることがあるため、転移を行わずに通常の機械学習を行うようにしてもよい。すなわち、第1の機械学習と第2の機械学習を独立に行うようにしてもよい。
例えば、第1のラベルが付与されたデータ群のデータ数に対する、第2のラベルが付与されたデータ群のデータ数の比率が0.5を超える場合は第1の機械学習結果を転移するよりも通常の機械学習が高精度になると判断する。もちろんこの比率は一例であり、他の値であっても構わない。また、比率を用いない他の方法により判断しても構わない。
本変形例によれば、第1の機械学習結果を転移するよりも通常の機械学習が高精度になると判断した場合は転移を行わないことで、第2の機械学習をより適切に行うことができる。本変形例は特にデータを継続的に収集する場合に有効である。
(実施形態1の変形例3)
実施形態1では、ステップS330とステップS340において、第1の機械学習と第2の機械学習で同一の手法を用いて機械学習を行っていたが、第1の機械学習と第2の機械学習で異なる手法を用いてもよい。例えば、第1の機械学習はDCNNを用い、第2の機械学習は、DCNNの中間出力(第1の機械学習結果)を入力とするサポートベクターマシンを学習するようにしてもよい。もちろんこれらは一例であり、他の方法であっても構わない。
本変形例によれば、第1の機械学習と第2の機械学習の夫々で最適な手法を用いることで、第1の機械学習に基づく第2の機械学習をより適切に行うことができる。
(実施形態1の変形例4)
実施形態1では、ステップS320において第3の医用データ群を選択していた。しかし、これに限らず、第1のラベルが付与されたデータ群と第2のラベルが付与されたデータ群とで重複するデータが無いことが判明しているような場合には、ステップS320において第3の医用データ群を選択しなくてもよい。そして、第1の医用データ群と第2の医用データ群のみでステップS330とステップS340における学習を行うようにしてもよい。
本変形例によれば、第1の医用データ群と第2の医用データ群で重複するデータが無い場合でも第1の機械学習に基づく第2の機械学習を適切に行うことができる。特に、第1の医用データ群と第2の医用データ群を異なるデータソースから取得する場合に有効である。
<実施形態2>
実施形態2における情報処理装置500は、第3の医用データ群のデータ数に基づき、第1の機械学習と第2の機械学習で第3の医用データ群を学習に用いるかどうかを判定する。
図5は、実施形態2における情報処理装置500の機能構成の一例を示す図である。なお、図1と同一の符号が付与された構成部については、実施形態1との差異部分のみ説明する。
情報処理装置500は、取得部102と、選択部104と、判定部510と、第1の機械学習部506と、第2の機械学習部508とを備える。判定部510は、第3の医用データ群のデータ数に基づき、第1の機械学習部506と第2の機械学習部508において、第3の医用データ群を学習に用いるかどうかを判定する。第1の機械学習部506は、判定に基づき決定されたデータで診断名を分類する第1の機械学習を行う。第2の機械学習部508は、第1の機械学習の結果に基づいて、判定に基づき決定されたデータで画像所見を分類する第2の機械学習を行う。
本実施形態における情報処理装置500のハードウェア構成は、第一の実施形態における図2と同様である。
次に、図6のフローチャートを用いて、情報処理装置500が行う全体の処理を説明する。なお、図3と同一の符号が付与された処理については第一の実施形態との差異部分のみ説明する。
ステップS610及びステップS620の処理は第一の実施形態におけるステップS310及びステップS320の処理と同様である。
ステップS625において、判定部510は、ステップS620で選択した第3の医用データ群のデータ数に基づいて、ステップS630とステップS640の第1の機械学習と第2の機械学習において第3の医用データ群を用いるかどうかを判定する。
本実施形態において判定部510は、第3の医用データ群のデータ数が所定値より多い場合には第1の機械学習では第3の医用データ群を用いないと判定し、第2の機械学習では第3の医用データ群を用いると判定する。すなわち、ステップS630とステップS640では実施形態1と同様の処理を行う。
判定部510は、第3の医用データ群のデータ数が所定値以下の場合には、ステップS630とステップS640で第3の医用データ群を用いないと判定するものとする。なお、この場合には第3の医用データ群は第1の機械学習手段と第2の機械学習手段の評価用データとして用いる。評価データを同一とすることで、第1の機械学習の精度と第2の機械学習の精度を同時に考慮した機械学習を行うことが出来る。
ステップS630において、第1の機械学習部506は、ステップS610で取得した第1の医用データ群に基づいて、診断名を分類する第1の機械学習を行う。なお、機械学習は実施形態1と同様にDCNNで行うものとし、説明は省略する。
ステップS640において、第2の機械学習部508は、ステップS610で取得した第2の医用データ群と、ステップS620で選択した第3の医用データ群に基づいて、ステップS630で行った第1の機械学習結果に基づき、画像所見を分類する第2の機械学習を行う。本実施形態では、ステップS625で第3の医用データ群を用いると判定された場合には実施形態1と同様に第2の医用データ群と第3の医用データ群の和のデータで学習を行う。一方、ステップS625で第3の医用データ群を用いないと判定された場合には、第2の医用データ群で学習を行う。なお、第2の機械学習は実施形態1と同様に、DCNNを用いて第1の機械学習結果をfine-tuningすることにより行うものとし、説明は省略する。
本実施形態では、第3の医用データ群のデータ数に基づき、第1の機械学習と第2の機械学習で第3の医用データ群を学習に用いるかどうかを判定する。第3の医用データ群の状態に応じて学習に用いるデータを柔軟に扱うことが出来るので、第1の機械学習に基づく第2の機械学習を適切に行うことが出来る。
(実施形態2の変形例1)
実施形態2では、ステップS625において、第3の医用データ群のデータ数に基づき、第1の機械学習と第2の機械学習で第3の医用データ群を学習に用いるかどうかを判定していた。しかし、第1の医用データ群のデータ数と第2の医用データ群のデータ数も考慮するようにしてもよい。より具体的には、第1の医用データ群のデータ数(|D1|)と第2の医用データ群のデータ数(|D2|)と第3の医用データ群のデータ数(|D3|)の比率に基づいて判定を行う。
例えば判定部510は、|D3|が第1の所定値以下の場合には、第1の機械学習と第2の機械学習で第3の医用データ群を用いないと判定する。
判定部510は、|D3|が第1の所定値より大きい場合には、以下のように比率に基づいて判定を行う。|D3|/|D1|が第2の所定値以下で、|D3|/|D2|が第2の所定値より大きい場合には、第1の医用データ群に対する第3の医用データ群の割合が小さく、第2の医用データ群に対する第3の医用データ群の割合が大きいことを示す。この場合、第3の医用データ群を用いないことによる第1の機械学習への影響は小さいと考えられる。一方で、第3の医用データ群を用いず第2の医用データ群のみで学習を行うことによる第2の機械学習への影響が大きいと考えられる。判定部510は、第1の機械学習では第3の医用データ群を用いないと判定し、第2の機械学習では第3の医用データ群を用いると判定する。この場合、第2のラベルを有するデータの数を増加させることができ、第2の機械学習をより適切に行うことができる。
|D3|/|D1|が第2の所定値以下で、|D3|/|D2|が第2の所定値以下の場合には、第1の医用データ群及び第2の医用データ群に対する第3の医用データ群の割合が小さいことを示す。この場合、第3の医用データ群を用いないことによる第1の機械学習及び第2の機械学習への影響は小さいと考えられる。したがって、判定部510は第1の機械学習と第2の機械学習両方で第3の医用データ群を用いないと判定する。このとき、上述のように第3の医用データ群を評価データとして用いてもよい。
|D3|/|D1|が第2の所定値より大きく、|D3|/|D2|が第2の所定値より大きい場合は、第1の医用データ群及び第2の医用データ群に対する第3の医用データ群の割合が大きいことを示す。この場合、第3の医用データ群を用いないことによる第1の機械学習及び第2の機械学習への影響は大きいと考えられる。ここで、第1の機械学習と第2の機械学習とで重複したデータを用いて学習を行うことによる、それぞれの機械学習への影響よりも、学習に用いるデータ数が低下することによるそれぞれの機械学習への影響が大きいと考えられる。したがって判定部510は、第1の機械学習と第2の機械学習両方で第3の医用データ群を用いると判定する。
|D3|/|D1|が第2の所定値より大きく、|D3|/|D2|が第2の所定値以下の場合は、第1の医用データ群に対する第3の医用データ群の割合が大きく、第2の医用データ群に対する第3の医用データ群の割合が小さいことを示す。すなわち、|D1|<|D2|であるので判定部510は、第1の機械学習と第2の機械学習両方で第3の医用データ群を用いると共に、実施形態1の変形例2と同様に第2の機械学習は第1の機械学習結果を転移せず、通常の機械学習を行うと判定する。
すなわちステップS625は、第3の医用データ群のデータ数に基づいて、第3の医用データ群を第1の機械学習及び第2の機械学習の少なくともいずれか一方に用いるか否かを判定する判定工程の一例である。
本変形例によれば、第3の医用データ群に加えて第1の医用データ群と第2の医用データ群の状態に応じて学習に用いるデータを判定することができるので、第1の機械学習に基づく第2の機械学習をより適切に行うことができる。
(その他の実施形態)
上述の実施形態では、胸部X線CT画像における肺結節に関する学習を行う場合を例に説明したが、本発明はこれに限らない。また、対象とする医用画像は、CT装置、デジタルラジオグラフィ、MRI(Magnetic Resonance Imaging)装置、SPECT(Single Photon Emission CT)装置、PET(Positron Emission Tomography)装置、超音波診断装置、眼底カメラ、光音響装置といった撮影装置の少なくともいずれかを用いて取得された医用画像でもよい。対象とする病変は肺結節影に限らず、被検体のいかなる部位の病変であってよい。また、学習の対象は医療に限られず、例えば学習に用いる画像をカメラで撮影された画像とし、第1のラベルを画像のシーン、第2のラベルを画像中のオブジェクト(空、木など)の状態としてもよい。
上述の実施形態では、第2のラベルとして全体形状の画像所見を用いる例を説明したが、本発明はこれに限らない。たとえば第2のラベルは任意の画像所見であってよい。画像所見は、たとえば病変の全体の形状を示す全体形状、病変の大きさ、解剖学的構造の状態を示す所見(たとえば気管支透瞭像に関する所見)、病変の詳細な形状を示す所見(たとえば病変の切れ込み形状に関する所見、棘状突起に関する所見)等が挙げられる。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
上述の各実施形態における情報処理装置は、単体の装置として実現してもよいし、複数の装置を互いに通信可能に組合せて上述の処理を実行する形態としてもよく、いずれも本発明の実施形態に含まれる。共通のサーバ装置あるいはサーバ群で、上述の処理を実行することとしてもよい。情報処理装置及び情報処理システムを構成する複数の装置は所定の通信レートで通信可能であればよく、また同一の施設内あるいは同一の国に存在することを要しない。
本発明の実施形態には、前述した実施形態の機能を実現するソフトウェアのプログラムを、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムのコードを読みだして実行するという形態を含む。
したがって、実施形態に係る処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明の実施形態の一つである。また、コンピュータが読みだしたプログラムに含まれる指示に基づき、コンピュータで稼働しているOSなどが、実際の処理の一部又は全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
上述の実施形態を適宜組み合わせた形態も、本発明の実施形態に含まれる。
100 情報処理装置
102 取得部
104 選択部
106 第1の機械学習部
108 第2の機械学習部
510 判定部
512 付与部

Claims (22)

  1. 第1のラベルと第2のラベルとのうち、前記第1のラベルのみが付与された第1の医用データ群と、前記第1のラベルと前記第2のラベルとのうち、前記第2のラベルのみが付与された第2の医用データ群と、前記第1のラベルと前記第2のラベルとが付与された第3の医用データ群と、を取得する取得工程と、
    前記第1の医用データ群に基づいて第1の機械学習を行う第1の学習工程と、
    前記第1の機械学習におけるパラメータと前記第2の医用データ群とに基づいて第2の機械学習を行う第2の学習工程と、前記第3の医用データ群のデータ数に基づいて、前記第3の医用データ群をさらに前記第1の機械学習および前記第2の機械学習の少なくとも一方に用いる工程と、
    を有することを特徴とする情報処理方法。
  2. 前記第2の学習工程は、前記第3の医用データ群のデータ数に基づいて前記第2の機械学習を行うことを特徴とする請求項に記載の情報処理方法。
  3. 前記第1の学習工程は、前記第3の医用データ群のデータ数に基づいて前記第1の機械学習を行う事を特徴とする請求項又は請求項のいずれか1項に記載の情報処理方法。
  4. 前記取得工程は、前記第1の医用データ群に含まれるデータに前記第2のラベルを付与することにより前記第3の医用データ群を取得することを特徴とする請求項乃至請求項のいずれか1項に記載の情報処理方法。
  5. 前記第2の学習工程は、前記第3の医用データ群のデータ数が第1の所定値より大きい場合に、前記第3の医用データ群を前記第2の機械学習に用いることを特徴とする請求項2に記載の情報処理方法
  6. 前記第2の学習工程は、前記第3の医用データ群のデータ数が前記第1の所定値より大きく、前記第1の医用データ群のデータ数に対する前記第3の医用データ群のデータ数の割合が第2の所定値以下で、前記第2の医用データ群のデータ数に対する前記第3の医用データ群のデータ数の割合が第2の所定値より大きい場合に、前記第3の医用データ群を前記第2の機械学習に用いることを特徴とする請求項5に記載の情報処理方法
  7. 前記第3の医用データ群のデータ数が第1の所定値より大きく、
    前記第1の医用データ群のデータ数に対する前記第3の医用データ群のデータ数の割合と前記第2の医用データ群のデータ数に対する前記第3の医用データ群のデータ数の割合が第2の所定値より大きい場合には、前記第1の学習工程および前記第2の学習工程に、前記第3の医用データ群を用いることを特徴とする請求項5に記載の情報処理方法
  8. 前記第3の医用データ群のデータ数に基づいて、前記第3の医用データ群を前記第1の機械学習及び前記第2の機械学習の少なくともいずれか一方に用いるか否かを判定する判定工程をさらに有することを特徴とする請求項乃至請求項のいずれか1項に記載の情報処理方法。
  9. 前記判定工程は、前記第1の医用データ群のデータ数に対する前記第3の医用データ群のデータ数の割合と、前記第2の医用データ群のデータ数に対する前記第3の医用データ群のデータ数の割合と、に基づいて前記第3の医用データ群を前記第1の機械学習及び前記第2の機械学習の少なくともいずれか一方に用いるか否かを判定することを特徴とする請求項に記載の情報処理方法。
  10. 前記判定工程において前記第3の医用データ群を前記第1の機械学習及び第2の機械学習のいずれにおいても用いないと判定された場合、前記第1の学習工程及び前記第2の学習工程の少なくともいずれかの工程において、前記第3の医用データ群は機械学習の評価用データとして用いられることを特徴とする請求項8又は請求項のいずれか1項に記載の情報処理方法。
  11. 第1のラベルと第2のラベルとのうち、前記第1のラベルのみが付与された第1の医用データ群と、前記第1のラベルと前記第2のラベルとのうち、前記第2のラベルのみが付与された第2の医用データ群と、前記第1のラベルと前記第2のラベルとが付与された第3の医用データ群と、を取得する取得工程と、
    前記第2の医用データ群のデータ数が所定数より多いか否かを判定する判定工程と、
    前記第1の医用データ群に基づいて第1の機械学習を行う第1の学習工程と、
    前記第2のデータ数が所定数より多い場合に、前記第2の医用データ群に基づいて第2の機械学習を行い、
    前記第2のデータ数が所定数以下の場合に、前記第1の機械学習におけるパラメータと前記第2の医用データ群とに基づいて第2の機械学習を行う第2の学習工程と、
    前記第3の医用データ群のデータ数に基づいて、前記第3の医用データ群をさらに前記第1の機械学習および前記第2の機械学習の少なくとも一方に用いる工程と、
    を有することを特徴とする情報処理方法。
  12. 前記取得工程は前記第1のラベルと前記第2のラベルとが付与された第3の医用データ群をさらに取得し、
    前記判定工程は、前記第1の医用データ群のデータ数に対する前記第3の医用データ群のデータ数の割合と、前記第2の医用データ群のデータ数に対する前記第3の医用データ群のデータ数の割合と、に基づいて前記第3の医用データ群を前記第1の機械学習及び前記第2の機械学習の少なくともいずれか一方に用いるか否かを判定することを特徴とする請求項11に記載の情報処理方法。
  13. 前記第1のラベルおよび前記第2のラベルはそれぞれ、医用画像の被検体の状態を表す医用情報であることを特徴とする請求項1乃至請求項1のいずれか1項に記載の情報処理方法。
  14. 前記第1のラベルは診断名であり、前記第2のラベルは医用画像の特徴を表す画像所見であることを特徴とする、請求項1乃至請求項1のいずれか1項に記載の情報処理方法。
  15. 第1のラベルと第2のラベルとのうち、前記第1のラベルのみが付与された第1の医用データ群と、前記第1のラベルと前記第2のラベルとのうち、前記第2のラベルのみが付与された第2の医用データ群と、前記第1のラベルと前記第2のラベルとが付与された第3の医用データ群と、を取得する取得手段と、
    前記第1の医用データ群に基づいて第1の機械学習を行う第1の学習手段と、
    前記第1の機械学習におけるパラメータと前記第2の医用データ群とに基づいて第2の機械学習を行う第2の学習手段と、を有し、
    前記第3の医用データ群のデータ数に基づいて、前記第3の医用データ群をさらに前記第1の機械学習および前記第2の機械学習の少なくとも一方に用いることを特徴とする情報処理装置。
  16. 前記第2の学習手段は前記第3の医用データ群をさらに用いて前記第2の機械学習を行うことを特徴とする請求項1に記載の情報処理装置。
  17. 前記第1の学習手段によって生成された第1の推論器に基づいて、前記第1のラベルに関する推論を行う第1の推論手段と、
    記第の学習手段によって生成された第2の推論器に基づいて、前記第2のラベルに関する推論を行う第2の推論手段と、
    を有することを特徴とする請求項15又は請求項16に記載の情報処理装置。
  18. 前記第2の推論器は、前記第1のラベルと前記第2のラベルとが付与された第3の医用データ群を学習用データとして機械学習された推論器であることを特徴とする請求項1に記載の情報処理装置。
  19. 前記第1のラベルは診断名であり、前記第2のラベルは医用画像の特徴を表す画像所見であることを特徴とする請求項17又は請求項1に記載の情報処理装置。
  20. 第1のラベルと第2のラベルとのうち、前記第1のラベルのみが付与された第1の医用データ群と、前記第1のラベルと前記第2のラベルとのうち、前記第2のラベルのみが付与された第2の医用データ群と、前記第1のラベルと前記第2のラベルとが付与された第3の医用データ群と、を取得する取得手段と、
    前記第1の医用データ群に基づいて第1の機械学習を行う第1の学習手段と、
    前記第1の機械学習におけるパラメータと前記第2の医用データ群とに基づいて第2の機械学習を行う第2の学習手段と、を有し、
    前記第3の医用データ群のデータ数に基づいて、前記第3の医用データ群をさらに前記第1の機械学習および前記第2の機械学習の少なくとも一方に用いることを特徴とする情報処理システム。
  21. 医用画像と、前記医用画像に付与された医用情報とを含むデータを記憶する記憶手段と、
    前記記憶されているデータであって、第1のラベルと第2のラベルとのうち、前記第1のラベルのみが付与されたデータである第1の医用データ群に基づいて第1の機械学習を行う第1の学習手段と、
    前記記憶されているデータであって、前記第1のラベルと前記第2のラベルとのうち、前記第2のラベルのみが付与されたデータである第2の医用データ群と、前記第1の機械学習におけるパラメータとに基づいて第2の機械学習を行う第2の学習手段と、を有し、
    第1のラベルと第2のラベルとが付与された第3の医用データ群のデータ数に基づいて、前記第3の医用データ群をさらに前記第1の機械学習および前記第2の機械学習の少なくとも一方に用いることを特徴とする情報処理システム。
  22. 請求項1乃至請求項1のいずれか1項に記載の情報処理方法をコンピュータに実行させるためのプログラム。
JP2017228150A 2017-11-28 2017-11-28 情報処理方法、情報処理装置、情報処理システム及びプログラム Active JP7066385B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017228150A JP7066385B2 (ja) 2017-11-28 2017-11-28 情報処理方法、情報処理装置、情報処理システム及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017228150A JP7066385B2 (ja) 2017-11-28 2017-11-28 情報処理方法、情報処理装置、情報処理システム及びプログラム

Publications (2)

Publication Number Publication Date
JP2019101485A JP2019101485A (ja) 2019-06-24
JP7066385B2 true JP7066385B2 (ja) 2022-05-13

Family

ID=66973612

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017228150A Active JP7066385B2 (ja) 2017-11-28 2017-11-28 情報処理方法、情報処理装置、情報処理システム及びプログラム

Country Status (1)

Country Link
JP (1) JP7066385B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7315809B2 (ja) * 2019-10-08 2023-07-27 公立大学法人会津大学 大腸内視鏡検査補助装置、大腸内視鏡検査補助方法及び大腸内視鏡検査補助プログラム
CN112825143A (zh) * 2019-11-20 2021-05-21 北京眼神智能科技有限公司 深度卷积神经网络压缩方法、装置、存储介质及设备
JP2021103373A (ja) * 2019-12-24 2021-07-15 東芝デジタルソリューションズ株式会社 需要予測装置、需要予測方法、およびプログラム
JP7135025B2 (ja) 2020-04-20 2022-09-12 株式会社東芝 情報処理装置、情報処理方法およびプログラム
CN111539947B (zh) * 2020-04-30 2024-03-29 上海商汤智能科技有限公司 图像检测方法及相关模型的训练方法和相关装置、设备
JP7290606B2 (ja) * 2020-06-09 2023-06-13 Kddi株式会社 機械学習装置、機械学習方法及び機械学習プログラム
JP7715978B2 (ja) * 2021-03-31 2025-07-31 富士通株式会社 画像識別プログラム、画像識別方法、画像識別装置および情報処理システム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016143094A (ja) 2015-01-29 2016-08-08 パナソニックIpマネジメント株式会社 転移学習装置、転移学習システム、転移学習方法およびプログラム
WO2017106645A1 (en) 2015-12-18 2017-06-22 The Regents Of The University Of California Interpretation and quantification of emergency features on head computed tomography
JP2017199383A (ja) 2017-05-24 2017-11-02 ヤフー株式会社 モデル

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016143094A (ja) 2015-01-29 2016-08-08 パナソニックIpマネジメント株式会社 転移学習装置、転移学習システム、転移学習方法およびプログラム
WO2017106645A1 (en) 2015-12-18 2017-06-22 The Regents Of The University Of California Interpretation and quantification of emergency features on head computed tomography
JP2017199383A (ja) 2017-05-24 2017-11-02 ヤフー株式会社 モデル

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Hak Gu Kim ほか,Modality-bridge Transfer Learning for Medical Image Classification,[オンライン],2017年08月10日,[検索日 2021.12.28], インターネット: <URL: https://arxiv.org/abs/1708.03111>

Also Published As

Publication number Publication date
JP2019101485A (ja) 2019-06-24

Similar Documents

Publication Publication Date Title
JP7066385B2 (ja) 情報処理方法、情報処理装置、情報処理システム及びプログラム
Huang et al. PENet—a scalable deep-learning model for automated diagnosis of pulmonary embolism using volumetric CT imaging
Sander et al. Automatic segmentation with detection of local segmentation failures in cardiac MRI
Perslev et al. One network to segment them all: A general, lightweight system for accurate 3d medical image segmentation
JP7374202B2 (ja) 機械学習システムおよび方法、統合サーバ、プログラムならびに推論モデルの作成方法
US10853449B1 (en) Report formatting for automated or assisted analysis of medical imaging data and medical diagnosis
Bien et al. Deep-learning-assisted diagnosis for knee magnetic resonance imaging: development and retrospective validation of MRNet
CN108784655B (zh) 针对医疗患者的快速评估和后果分析
US10692602B1 (en) Structuring free text medical reports with forced taxonomies
CN119156637A (zh) 动态多模态分割选择和融合
AU2021289232A1 (en) Systems and methods for automated analysis of medical images
JP7058988B2 (ja) 情報処理装置、情報処理方法およびプログラム
US11734819B2 (en) Deep learning modeling using health screening images
JP6362061B2 (ja) 診断支援システム、その作動方法、およびプログラム
JP7339270B2 (ja) 医用画像処理装置、方法およびプログラム
Wang et al. Automatic creation of annotations for chest radiographs based on the positional information extracted from radiographic image reports
US11515033B2 (en) Augmented inspector interface with targeted, context-driven algorithms
Hoebers et al. Artificial intelligence research in radiation oncology: a practical guide for the clinician on concepts and methods
JPWO2019208130A1 (ja) 医療文書作成支援装置、方法およびプログラム、学習済みモデル、並びに学習装置、方法およびプログラム
Malik et al. Stacked deep model‐based classification of the multiclass brain hemorrhages in CT scans
US11244754B2 (en) Artificial neural network combining sensory signal classification and image generation
JP7013145B2 (ja) 情報処理装置、情報処理システム、情報処理装置の作動方法及びプログラム
JP7170868B2 (ja) 学習装置、方法およびプログラム、医用画像処理装置、方法およびプログラム、並びに判別器
WO2023032437A1 (ja) 造影状態判別装置、造影状態判別方法、及びプログラム
Nwaiwu et al. Emerging multifaceted application of artificial intelligence in chest radiography: a narrative review

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201117

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211124

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220427

R151 Written notification of patent or utility model registration

Ref document number: 7066385

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151