JP7778334B2 - 内視鏡用診断プログラム、内視鏡用診断装置、内視鏡用診断装置の制御方法および内視鏡診断用学習済みモデル生成プログラム - Google Patents

内視鏡用診断プログラム、内視鏡用診断装置、内視鏡用診断装置の制御方法および内視鏡診断用学習済みモデル生成プログラム

Info

Publication number
JP7778334B2
JP7778334B2 JP2025502773A JP2025502773A JP7778334B2 JP 7778334 B2 JP7778334 B2 JP 7778334B2 JP 2025502773 A JP2025502773 A JP 2025502773A JP 2025502773 A JP2025502773 A JP 2025502773A JP 7778334 B2 JP7778334 B2 JP 7778334B2
Authority
JP
Japan
Prior art keywords
diagnostic
images
image
endoscopic
trained model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2025502773A
Other languages
English (en)
Other versions
JPWO2024177117A5 (ja
JPWO2024177117A1 (ja
Inventor
幹浩 藤谷
健太郎 盛一
勝祥 安藤
裕基 佐藤
克朗 榎本
正人 森
雄斗 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asahikawa Medical University
SUNCREER CO.,LTD.
Original Assignee
Asahikawa Medical University
SUNCREER CO.,LTD.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asahikawa Medical University, SUNCREER CO.,LTD. filed Critical Asahikawa Medical University
Publication of JPWO2024177117A1 publication Critical patent/JPWO2024177117A1/ja
Publication of JPWO2024177117A5 publication Critical patent/JPWO2024177117A5/ja
Application granted granted Critical
Publication of JP7778334B2 publication Critical patent/JP7778334B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00004Operational features of endoscopes characterised by electronic signal processing
    • A61B1/00009Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope
    • A61B1/000094Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope extracting biological structures
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00004Operational features of endoscopes characterised by electronic signal processing
    • A61B1/00009Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope
    • A61B1/000095Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope for image enhancement
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/00002Operational features of endoscopes
    • A61B1/00004Operational features of endoscopes characterised by electronic signal processing
    • A61B1/00009Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope
    • A61B1/000096Operational features of endoscopes characterised by electronic signal processing of image signals during a use of endoscope using artificial intelligence
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • G06T7/0014Biomedical image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10068Endoscopic image
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30028Colon; Small intestine
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30092Stomach; Gastric
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Surgery (AREA)
  • Medical Informatics (AREA)
  • Radiology & Medical Imaging (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Optics & Photonics (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Endoscopes (AREA)
  • Image Analysis (AREA)

Description

本発明は、内視鏡装置で撮影された内視鏡画像により病変の有無を診断するための、内視鏡用診断プログラム、内視鏡用診断装置、内視鏡用診断装置の制御方法および内視鏡診断用学習済みモデル生成プログラムに関するものである。
潰瘍性大腸炎は、大腸の粘膜に慢性的な炎症が生じる病気であり、発症すると発熱、腹痛、下痢、血便(便に血液が混ざる)などの症状が現れる難病の1つである。重症化すると、発熱、体重減少、貧血など全身にさまざまな症状が引き起こされる。よって、早期に発見し適切な処置を行う必要がある。
潰瘍性大腸炎の診断には、一般的に内視鏡装置が用いられる。医師は、照明光を診断対象部位に照射し、内視鏡装置で撮影された内視鏡画像を見て炎症や潰瘍の有無を診断する。しかしながら、このような目視による診断は医師の技量や経験が大きく影響する。また、初期の潰瘍性大腸炎で正常な組織との見分けがつかなかったり、炎症にもキャンピロバクター腸炎など他の感染性腸炎などがあるため、専門医であっても正確な診断が困難である。
そこで、内視鏡画像による診断をより正確に行える装置の開発が進められている。例えば、特開2022-60540号公報では、特定のスペクトル光(いわゆる狭帯域光)を診断対象部位に照射し、撮影した画像を用いて病変の有無や種類、進行度などを識別することのできる内視鏡装置が提案されている(特許文献1)。
特開2022-60540号公報
しかしながら、特許文献1に記載された発明においては、特定のスペクトル光を用いるために高額な装置となっており一般には広く普及していない。
ところで、特定のスペクトルに限定しない、照明光(例えば白色光)により撮影することのできる内視鏡装置は、一般的に広く普及している。よって、これまでに特定のスペクトルに限定しない光、特に白色光により撮影された内視鏡画像は大量に蓄積されている。
また、近年では、AI技術の進歩により、画像を機械学習させて、画像内の異常などを検知することができるようになっている。このため、これまでに蓄積された内視鏡画像を機械学習させることで、病変の有無などを自動的に診断できる装置の開発が期待されている。
しかし、内視鏡画像は、撮影した機種によって色調や画質が異なる。そのため、内視鏡画像は大量に蓄積されているものの、異なる内視鏡装置で撮影された画像全てを用いて機械学習をさせても高い精度の診断はできていない。
機種毎に機械学習させることも可能であるが、機械学習させる画像の数は減ってしまう。また、内視鏡装置を入れ替える毎に機械学習させ直す必要があり、入れ替え直後には画像の枚数も少ないため高い精度が期待できない。さらに、ある程度の枚数が蓄積されて機械学習させた頃には、また新たな内視鏡装置へ入れ替える時期がきて、一からやり直さなければならないという悪循環に陥ってしまう。
本発明は、以上のような問題点を解決するためになされたものであって、これまでに蓄積された内視鏡画像を活用し、内視鏡装置の機種を限定することなく病変の有無を診断することのできる、内視鏡用診断プログラム、内視鏡用診断装置、内視鏡用診断装置の制御方法および内視鏡診断用学習済みモデル生成プログラムを提供することを目的としている。
本発明に係る内視鏡用診断プログラムは、異なる内視鏡装置で撮影された画像を用いて病変の有無を診断できるようにするという課題を解決するために、内視鏡装置で撮影された内視鏡画像に基づいて病変の有無を診断する内視鏡用診断プログラムであって、内視鏡装置で撮影された診断対象部位の診断用画像を取得する診断用画像取得部と、事前に内視鏡装置で撮影された診断対象部位の画像の色調である基準色調に合わせて前記診断用画像を色調補正する色調補正部と、前記基準色調によって色調補正した複数枚の学習用画像を機械学習させて生成した学習済みモデルに対して、補正後の前記診断用画像を入力し、その出力結果から病変の有無を診断処理する病変有無診断部としてコンピュータを機能させる。
また、本発明の一態様として、画像間の画質を一定の範囲にして診断精度をより高めるという課題を解決するために、前記色調補正部が、前記診断用画像を前記色調補正するとともに高画質化処理を行い、前記病変有無診断部が、前記色調補正部と同じ前記色調補正および前記高画質化処理を行った前記学習用画像を機械学習させて生成された前記学習済みモデルによって病変の有無を診断処理するようにしてもよい。
さらに、本発明の一態様として、大量に蓄積されている病変の映り込んでいない画像を用いて病変の有無を診断できるようにするという課題を解決するために、前記病変有無診断部が、画像の異常検知アルゴリズムに、前記基準色調で補正されかつ病変の映り込んでいない複数枚の前記学習用画像を機械学習させて生成された学習済みモデルに対して、補正後の前記診断用画像を入力し、その出力結果として前記診断用画像の異常が検出されたときに病変があると診断するようにしてもよい。
また、本発明の一態様として、病変の映り込みの有無にかかわらず蓄積されている画像を用いて病変の有無を診断できるようにするという課題を解決するために、前記病変有無診断部が、画像の特徴量を検知するアルゴリズムに、前記基準色調で補正されかつ病変の映り込んでいない複数枚の前記学習用画像と、前記基準色調で補正されかつ病変の映り込んでいる複数枚の前記学習用画像とを機械学習させて生成された学習済みモデルに対して、補正後の前記診断用画像を入力し、その出力結果として前記診断用画像の特徴量が所定の値以上と判別されたときに病変があると診断し、前記診断用画像の特徴量が前記所定の値未満と判別されたときに病変がないと診断するようにしてもよい。
本発明に係る内視鏡用診断装置は、異なる内視鏡装置で撮影された画像を用いて病変の有無を診断できるようにするという課題を解決するために、内視鏡装置で撮影された内視鏡画像に基づいて病変の有無を診断する内視鏡用診断装置であって、内視鏡装置で撮影された診断対象部位の診断用画像を取得する診断用画像取得部と、事前に内視鏡装置で撮影された診断対象部位の画像の色調である基準色調に合わせて前記診断用画像を色調補正する色調補正部と、前記基準色調によって色調補正した複数枚の学習用画像を機械学習させて生成した学習済みモデルに対して、補正後の前記診断用画像を入力し、その出力結果から病変の有無の診断処理する病変有無診断部とを有する。
本発明に係る内視鏡用診断装置の制御方法は、異なる内視鏡装置で撮影された画像を用いて病変の有無を診断できるようにするという課題を解決するために、内視鏡装置で撮影された内視鏡画像に基づいて病変の有無を診断する内視鏡用診断装置の制御方法であって、内視鏡装置で撮影された診断対象部位の診断用画像を取得する診断用画像取得ステップと、事前に内視鏡装置で撮影された診断対象部位の画像の色調である基準色調に合わせて前記診断用画像を色調補正する色調補正ステップと、前記基準色調によって色調補正した複数枚の学習用画像を機械学習させて生成した学習済みモデルに対して、補正後の前記診断用画像を入力し、その出力結果から病変の有無の診断処理する病変有無診断ステップとを有する。
本発明に係る内視鏡診断用学習済みモデル生成プログラムは、異なる内視鏡装置で撮影された画像を用いて病変の有無を診断可能な学習済みモデルを生成するという課題を解決するために、内視鏡装置で撮影された内視鏡画像に基づき病変の有無を診断する内視鏡用診断で用いられる学習済みモデルを生成する内視鏡診断用学習済みモデル生成プログラムであって、内視鏡装置で撮影された診断対象部位の複数枚の学習用画像を取得する学習用画像取得部と、事前に内視鏡装置で撮影された診断対象部位の画像の色調である基準色調に合わせて前記各学習用画像を色調補正する色調補正部と、機械学習アルゴリズムを用いて複数の学習済みモデルを生成する学習済みモデル生成部と、生成された前記各学習済みモデルに病変の有無が検証済みである検証用の画像を入力して正答率の最も高い前記学習済みモデルを内視鏡診断に用いる学習済みモデルに決定する学習済みモデル決定部としてコンピュータを機能させる。
また、本発明の一態様として、病変の映り込んでいる学習用画像を用いる場合の診断精度を向上させるという課題を解決するために、前記色調補正部は、前記学習用画像に病変の映り込んでいる場合には、前記病変の存在範囲以外の範囲に前記基準色調による色調補正を実行するようにしてもよい。
さらに、本発明の一態様として、擬似的に学習用画像を増やし、診断精度をより向上させるという課題を解決するために、前記色調補正部により補正された前記学習用画像を任意のアフィン変換させるアフィン変換部としてコンピュータを機能させるとともに、前記学習済みモデル生成部は、前記色調補正部により補正された前記学習用画像とともに前記アフィン変換部により変換された前記学習用画像を機械学習させて学習済みモデルを生成するようにしてもよい。
本発明によれば、これまでに蓄積された内視鏡画像を活用し、内視鏡装置の機種を限定することなく病変の有無を診断することができる。
本発明に係る内視鏡用診断装置の第一実施形態を示すブロック図である。 本第一実施形態の内視鏡診断用学習済みモデル生成プログラムの処理フローを示すフローチャート図である。 本第一実施形態の内視鏡用診断プログラムの処理フローを示すフローチャート図である。 実施例1における学習済みモデルの生成および診断精度の検証に用いた層化5分割交差検証の学習用画像(訓練データ)およびテストデータの組み合わせを示す模式図である。
以下、本発明に係る内視鏡用診断プログラム、内視鏡用診断装置、内視鏡用診断装置の制御方法および内視鏡診断用学習済みモデル生成プログラムの第一実施形態について図面を用いて説明する。
内視鏡用診断装置1は、内視鏡装置20で撮影された内視鏡画像を入力することで、自動的に病変の有無を診断するものであり、本第一実施形態では、図1に示すように、主として、表示手段2と、入力手段3と、記憶手段5および演算処理手段6を備えたコンピュータ4とにより構成されている。内視鏡用診断装置1は、内視鏡装置20と画像データを受信可能な状態で接続されている。
本第一実施形態の内視鏡用診断装置1は、内視鏡診断用学習済みモデル生成プログラム10aによって内視鏡診断用学習済みモデルを生成する機能を兼ね備えている。
また、内視鏡装置20は、一般的な医療用の内視鏡カメラ21を備えた装置であって、照明光(例えば白色光)で撮影された内視鏡画像を出力し、内視鏡用診断装置1に送信できるように接続されている。
なお、本第一実施形態では、内視鏡用診断装置1と内視鏡装置20とを別装置として構成しているが、内視鏡用診断装置1および内視鏡装置20を一体化した装置として構成してもよい。
以下、内視鏡用診断装置1の各構成について詳細に説明する。
表示手段2は、液晶ディスプレイ等で構成されており、ユーザに各種の情報を表示するものであり、例えば、演算条件などを入力するための入力画像や、演算処理により診断された診断結果等を表示する。
入力手段3は、マウスやキーボード等で構成されており、ユーザによる各種の選択や指示を入力するものであり、本実施形態では、演算条件などの入力に用いられる。
なお、本第一実施形態では、表示手段2および入力手段3をそれぞれ別個に有しているが、この構成に限定されるものではなく、タッチパネルのように表示機能および入力機能を兼ね備えた表示入力手段により構成してもよい。
コンピュータ4は、内視鏡用診断プログラム1aおよび内視鏡診断用学習済みモデル生成プログラム10aを実行処理するための装置であり、本実施形態では、図1に示すように、記憶手段5および演算処理手段6を備えている。また、コンピュータ4は、図示しないが、演算処理手段6等への給電を行う電源装置やLAN(Local area network)、Wi-Fi(Wireless Fidelity)およびBluetoothなどの通信手段などを備えている。
記憶手段5は、各種のデータを記憶するとともに、演算処理手段6が演算処理を行う際のワーキングエリアとして機能するものである。本実施形態において、記憶手段5は、ハードディスク、ROM(Read Only Memory)、RAM(Random Access Memory)、フラッシュメモリ等で構成されており、図1に示すように、プログラム記憶部51と、機械学習に用いる学習用画像を記憶する学習用画像記憶部52と、色調補正に用いられる基準色調を記憶する基準色調記憶部53と、内視鏡診断用学習済みモデル生成プログラム10aによって生成された学習済みモデルを記憶する学習済みモデル記憶部54と、診断に用いる診断用画像を記憶する診断用画像記憶部55とを有する。
プログラム記憶部51には、内視鏡装置20で撮影された内視鏡画像を取得して病変の有無を診断するための内視鏡用診断プログラム1aと、この内視鏡用診断プログラム1aで用いられる学習済みモデルを生成する内視鏡診断用学習済みモデル生成プログラム10aとがインストールされている。そして、演算処理手段6が内視鏡用診断プログラム1aおよび内視鏡診断用学習済みモデル生成プログラム10aを実行することにより、コンピュータ4を後述する各構成部として機能させるようになっている。
なお、内視鏡用診断プログラム1aおよび内視鏡診断用学習済みモデル生成プログラム10aの利用形態は、上記構成に限られるものではない。例えば、CD-ROMやDVD-ROM等のように、コンピュータ4で読み取り可能な非一時的な記録媒体に内視鏡用診断プログラム1aおよび内視鏡診断用学習済みモデル生成プログラム10aを記憶させておき、当該記録媒体から直接読み出して実行してもよい。また、外部サーバ等からクラウドコンピューティング方式やASP(Application Service Provider)方式で内視鏡用診断プログラム1aおよび内視鏡診断用学習済みモデル生成プログラム10aを利用してもよい。
学習用画像記憶部52は、内視鏡診断用学習済みモデル生成プログラム10aによって内視鏡診断用の学習済みモデルを生成するための学習用画像を記憶する記憶エリアであり、本第一実施形態では、これまでに複数種の内視鏡装置により白色光を含む様々な照明光で撮影されて蓄積されてきた複数枚の学習用画像(生画像)、後述する色調補正部62により補正された補正後の学習用画像(色調補正画像)及び補正後の学習用画像をアフィン変換した後の学習用画像(アフィン変換画像)を記憶するようになっている。
また、本第一実施形態における学習用画像は、複数種の内視鏡装置で撮影された診断対象部位の画像であり、予め病変の映り込んでいないことが確認されている画像を用いている。学習用画像を撮影する際に用いたれる照明光は、特に限定されるものでは無いが、本第一実施形態では、特定のスペクトル光に限定されていない、いわゆる白色光により撮影された画像である。
基準色調記憶部53は、色調補正する際の基準となる基準色調を記憶する記憶エリアである。本第一実施形態における基準色調は、事前に任意の内視鏡装置で撮影された画像を解析して取得されたRGB値などに基づく色分布である。色分布の取得には、既存のプログラムコードやオリジナルのプログラムコードを用いることができる。既存のプログラムコードとしては、Hue analysisやK-means clustering、Color histograms、Convolutional neural networks、Principal component analysis、Self-organizing maps、Gaussian Mixture Models、Support Vector Machines、Decision Trees、OpenCV、matplotlibなどに基づく技術を用いることができる。また、画像処理ソフトウエアにおける色相分析ツールを利用することもできる。
なお、基準色調は、RGB値などに基づく色分布のみに限定されるものではなく、色の濃淡や明暗(コントラスト)、強弱(明るさ)などに基づく数値を用いることもできる。
学習済みモデル記憶部54は、内視鏡診断用学習済みモデル生成プログラム10aによって生成された学習済みモデルを記憶する記憶エリアである。本第一実施形態では、学習済みモデル生成部64によって生成された複数の学習済みモデル(候補モデル)及び学習済みモデル決定部65により決定された内視鏡診断に用いる学習済みモデル(診断モデル)を記憶するようになっている。
診断用画像記憶部55は、病変の有無を診断したい診断用画像を記憶する記憶エリアであり、本第一実施形態では、内視鏡装置20から取得された診断用画像(生画像)及び色調補正部67により補正された補正後の診断用画像(色調補正画像)を記憶するようになっている。内視鏡装置20から取得された診断用画像(生画像)は内視鏡カメラ21によりリアルタイムに撮影された画像でもよく、内視鏡カメラ21により予め撮影された画像でもよい。また、診断用画像を撮影する際に用いたれる照明光は、特に限定されるものでは無いが、本第一実施形態では、特定のスペクトル光に限定されていない、いわゆる白色光により撮影された画像を用いている。
演算処理手段6は、CPU(Central Processing Unit)等で構成されており、プログラム記憶部51にインストールされた内視鏡診断用学習済みモデル生成プログラム10aを実行することにより、学習用画像取得部61、色調補正部62、アフィン変換部63、学習済みモデル生成部64および学習済みモデル決定部65として機能するとともに、内視鏡用診断プログラム1aを実行することにより、診断用画像取得部66、色調補正部67および病変有無診断部68として機能するようになっている。
学習用画像取得部61は、内視鏡装置で撮影された診断対象部位の複数枚の学習用画像を取得するものであり、本第一実施形態では、学習用画像記憶部52に記憶されている学習用画像(生画像)、補正後の学習用画像(色調補正画像)及びアフィン変換した後の学習用画像(アフィン変換画像)を適宜取得するようになっている
色調補正部62は、学習用画像取得部61が取得したこれまでに蓄積されてきた学習用画像(生画像)の色調補正を行い、補正後の学習用画像(色調補正画像)を学習用画像記憶部52に記憶させるものである。
本第一実施形態における色調補正部62は、基準色調記憶部53から基準色調を取得して各学習用画像を前記基準色調に色調補正するとともに、前記各学習用画像の高画質化処理を実行する。
色調補正は、例えば、基準色調として記憶した色分布を学習用画像の近似する色に当てはめて行う。このような色調補正を行うことで、学習用画像同士の平滑化を行い、機種によって異なる色調や画質の画像を一緒に学習できるようにしている。これにより、これまでに蓄積された画像を有効に利用することができる。このような色調補正には、既存のプログラムコードやオリジナルのプログラムコードを用いることができる。既存のプログラムコードとしては、Histogram Equalization、Retinex Algorithm、Deep Learning Networks、Color Transfer、Automatic white balance、Gamma Correction、Gamma Correction、Color Space Conversion、Style Transferなどが利用できる。また、画像処理ソフトウエアにおける色相補正ツールを利用することもできる。
また、高画質化処理は、例えば、ノイズ除去、画像の平滑化、ぼかし除去、モスキートノイズ補正、シャープ化、類似色の改善、色収差補正および拡大などを実行する。このような高画質化処理により、学習済みモデルの生成を速める(収束化を促進させる)ことができるとともに、画像間の画質を統一化することで生成された学習済みモデルを用いた診断精度も高めることができる。これら高画質化処理については、既存のプログラムコードやオリジナルのプログラムコードを用いることができる。既存のプログラムコードとしてはESRGAN、CUGAN、Cycle GAN、TecoGAN、pix2pix、Super-Resolution Convolutional Neural Network、SRGAN、CodeFormerなどが利用できる。また、画像処理ソフトウエアにおけるノイズ処理ツールやシャープ化ツールなどを利用することもできる。
なお、色調補正部62による色調補正と高画質化処理の実行順は限定されるものでは無く、いずれを先に実行してもよい。
アフィン変換部63は、学習用画像記憶部52から補正後の学習用画像を取得し、アフィン変換を実行し、そのアフィン変換した学習用画像をアフィン変換前の学習用画像とは別の学習用画像として学習用画像記憶部52に記憶させるものである。
アフィン変換は、画像を回転、拡大・縮小、平行移動、スキューなどの変換するものである。これにより、実際に撮影することなく、撮影角度や内視鏡カメラ先端と診断対象部位との距離および位置の違う画像を擬似的に生成することができる。また、別の画像として記憶させることで、機械学習させる画像数を増やし学習済みモデルの診断精度を高めることができる。
本第一実施形態におけるアフィン変換部63は、回転角度や拡大・縮小比率、平行移動量、せん断(スキュー)角度を任意に設定できるようになっている。
そして、アフィン変換された各学習用画像は、アフィン変換前の学習用画像とは異なる識別番号や名前を付けることにより、別の学習用画像として学習用画像記憶部52に記憶される。
学習済みモデル生成部64は、複数枚の学習用画像を機械学習させて学習済みモデルを生成するものである。本第一実施形態では、学習用画像として、予め画像内に病変の映り込んでいないことが分かっている画像(正常な画像)のみを用いる。一般的に、蓄積されている画像は、病変の映り込んだ異常な画像に比べて、病変の映り込んでいない正常な画像が多いため、多くの画像を機械学習させることができる。
そこで、学習済みモデル生成部64は、画像の異常検知に用いられる機械学習アルゴリズムを用いて学習済みモデルを生成し、画像に異常がある場合に検知できるようにしている。例えば、パッチコア(Patchcore)などの画像の異常検知に用いられる機械学習アルゴリズムに、複数枚の学習用画像(正常な画像)を訓練データとして機械学習させて、正常な画像(正常データ)の特徴量群(メモリーバンク)を生成する。そして、1枚の学習用画像(訓練データ)を繰り返し学習させる回数(エポック数)などを変えて、複数の学習済みモデル(候補モデル)を生成する。画像の異常検知に用いられる機械学習アルゴリズムとして、パッチコア(Patchcore)以外では、AutoEncodingモデルやAttention-guidance、SPADE、PaDiMなどに基づくアルゴリズムを用いることができる。
また、学習済みモデル生成部64では、学習の収束速度や学習結果の安定性を高めるため、ノーマライズを行ってもよい。例えば、ノーマライズとして、変換後の画素値 = (変換前の画素値-平均値)/((標準偏差)のような式を用いて画素値の変換を行う。また、平均値や標準偏差には、従来手法の学習で使用されている値を使うこともできる。本第一実施形態では、平均値=[0.485, 0.456, 0.405]、 標準偏差=[0.229, 0.224, 0.225]を使用している。
学習済みモデル決定部65は、学習済みモデル生成部64で生成された学習済みモデルを検証データで確認しながら訓練で学習済みモデルを作成し、検証データで正答率の高いモデルを内視鏡用診断プログラム1aで用いる学習済みモデル(診断モデル)に決定し、その学習済みモデル(診断モデル)を学習済みモデル記憶部54に記憶させるものである。
本第一実施形態における学習済みモデル決定部65は、学習済みモデル生成部64で生成された複数の学習済みモデル(候補モデル)ごとに、病変の有無が検証済みである検証用の画像を入力し、出力として得た結果が検証用の画像に合致するかどうか(正解か否か)を確認する。そして、確認した出力結果の正答率の最も高い前記学習済みモデル(候補モデル)を内視鏡診断に用いる学習済みモデル(診断モデル)に決定する。
次に、内視鏡用診断プログラム1aにより実行される各部について説明する。
診断用画像取得部66は、内視鏡装置20で撮影された診断対象部位の診断用画像を取得するものである。診断用画像は内視鏡装置20から直接取得することもでき、診断用画像記憶部55に記憶された診断用画像を取得することもできる。
色調補正部67は、内視鏡装置20または診断用画像記憶部55から取得された診断用画像(生画像)の色調補正を行い、補正後の診断用画像(色調補正画像)を診断用画像記憶部55に記憶させるものである。
ここで実行させる色調補正は、基準色調などに基づき学習済みモデルの生成に用いた学習用画像の色調補正と同じ色調補正を行う。このように診断用画像に対し、学習済みモデルの生成と同じ色調補正をすることで、学習用画像や機種により異なる画質および色調を統一化し、診断精度を高めている。
病変有無診断部68は、学習済みモデル記憶部54に記憶されている学習済みモデルに、色調補正部67により補正した補正後の診断用画像を入力し、その出力結果から病変の有無を診断するものである。本第一実施形態では、出力結果として診断用画像の特徴量が50%以上と出力されたときは、その画像は異常と判別し病変があると診断し、その診断結果を出力する。一方、出力結果として診断用画像の特徴量が50%未満と出力されたときは、その画像は正常と判別し病変がないと診断し、その診断結果を出力する。
次に、本第一実施形態の内視鏡用診断装置1、内視鏡用診断プログラム1a、内視鏡診断用学習済みモデル生成プログラム10aの各構成の作用について、内視鏡用診断装置の制御方法とともに説明する。
内視鏡診断用学習済みモデル生成プログラム10aでは、図2に示すように、学習用画像取得部61が学習用画像記憶部52に記憶されている内視鏡装置で撮影された複数枚の学習用画像(生画像)を取得する(学習用画像取得ステップ:S1)。このとき取得される学習用画像(生画像)には、異なる機種の内視鏡装置で撮影された画像が含まれていてもよい。
次に、色調補正部62が、基準色調記憶部53に記憶された基準色調を取得し、各学習用画像を前記基準色調に合わせて色調補正する(色調補正ステップ:S2)。学習用画像に異なる機種の内視鏡装置で撮影された画像が含まれている場合は、この処理で学習用画像同士の色調および画質が平滑化される。色調補正部62は、色調補正した補正後の学習用画像を学習用画像記憶部52に記憶させる。
次に、アフィン変換部63が、学習用画像記憶部52に記憶されている補正後の学習用画像を取得し、任意のアフィン変換をして別の学習用画像として学習用画像記憶部52に記憶させる(アフィン変換ステップ:S3)。これにより実際に撮影することなく、撮影角度や内視鏡カメラ先端と診断対象部位との距離および位置の違う画像を擬似的に生成することができるとともに、機械学習させる画像数を増やすことができる。
次に、学習済みモデル生成部64が、補正後およびアフィン変換後の複数枚の学習用画像を取得し、取得した各学習用画像を機械学習アルゴリズムに学習させて複数の学習済みモデルを生成する(学習済みモデル生成ステップ:S4)。具体的には、画像の異常検知に用いられる機械学習アルゴリズムであるパッチコア(Patchcore)に、複数枚の学習用画像を訓練データとして機械学習させて、正常な画像の特徴量群を生成する。そして、1枚の学習用画像を繰り返し学習させる回数を変えて、複数の学習済みモデル(候補モデル)を生成する。
そして、学習済みモデル決定部65が、生成された複数の学習済みモデルに、病変の有無が検証済みである検証用の画像を入力し、正答率の最も高い前記学習済みモデルを内視鏡診断に用いる学習済みモデルに決定する(学習済みモデル決定ステップ:S5)。具体的には、学習済みモデル生成部64で生成された各学習済みモデル(候補モデル)ごとに、病変の有無が検証済みである検証用の画像として病変の映り込んだ画像(異常な画像)を入力し、出力として異常な画像として出力されたか否かを確認し、異常な画像であるとして出力した正答率の最も高い前記学習済みモデル(候補モデル)を内視鏡診断に用いる学習済みモデル(診断モデル)に決定する。そして、内視鏡診断に用いるものとして決定した学習済みモデルを学習済みモデル記憶部54に記憶させる。
これで、内視鏡診断用学習済みモデル生成プログラム10aの実行を終了させる。内視鏡診断用学習済みモデル生成プログラム10aの実行は次の内視鏡用診断プログラム1aによる病変の有無の診断よりも先に予め終了させておくのがよい。
次に、内視鏡用診断プログラム1aによって病変の有無を診断する。
まず、図3に示すように、診断用画像取得部66が、内視鏡装置20または診断用画像記憶部55から診断対象部位を撮影した診断用画像(生画像)を取得する(診断用画像取得ステップ:SS1)。このとき取得される診断用画像(生画像)は、学習済みモデルの生成に用いた学習用画像を撮影した内視鏡装置とは異なる機種の内視鏡装置でもよい。
次に、色調補正部67が、基準色調記憶部53に記憶された基準色調を取得し、診断用画像に学習用画像と同じ色調補正(高画質化処理を含む)をする(色調補正ステップ:SS2)。学習済みモデルの生成に用いた学習用画像と同じ色調補正を行うことで、学習用画像との色調および画質が統一化され、学習用画像とは異なる機種の内視鏡装置20で撮影された画像でも精度の高い診断処理が可能となる。
そして、病変有無診断部68が、学習済みモデル記憶部54に記憶された学習済みモデルに補正後の診断用画像を入力し、出力結果から病変の有無を診断する(病変有無診断ステップ:SS3、SS4)。具体的には、学習済みモデルに補正後の診断用画像を入力し診断用画像の特徴量を出力する(SS3)。そして、出力結果として診断用画像の特徴量が50%以上と出力されたときは(SS4:YES)、その画像は異常と判別し病変があると診断し、その結果を表示手段2等に出力する。一方、出力結果として診断用画像の特徴量が50%未満と出力されたときは(SS4:NO)、その画像は正常と判別し病変がないと診断し、その結果を表示手段2等に出力する。
以上で診断を終了する。なお、診断結果は、表示手段2に表示するものに限定されるものではなく、プリンター等の出力手段によって外部に出力してもよい。
以上のような本第一実施形態によれば、以下の作用効果を奏することができる。
1.これまでに蓄積されている学習用画像に対して色調補正や高画質化処理を行うことにより、画像同士の色調および画質を平滑化し、学習済みモデルによる診断精度を高めることができる。
2.学習済みモデルを生成するアルゴリズムに、異常検知アルゴリズムを用いることで、学習用画像に病変の映り込んでいない画像を用いることができるため、機械学習させる画像の枚数を多くすることができ、診断精度を高めることができる。
および
3.学習用画像をアフィン変換することで、実際に撮影することなく撮影角度や内視鏡カメラ先端と診断対象部位との距離および位置の違う画像を擬似的に生成することができ、かつそれらを別の画像として記憶させることで機械学習させる画像数を増やし、学習済みモデルの診断精度を高めることができる。
4.診断用画像に学習用画像と同じ色調補正や高画質化処理を行うことで、学習済みモデルの生成に用いた学習用画像と学習用画像の色調および画質が統一化されるため、学習済みモデルによる診断精度を高めることができる。
次に、本発明に係る内視鏡用診断プログラム、内視鏡用診断装置、内視鏡用診断装置の制御方法および内視鏡診断用学習済みモデル生成プログラムの第二実施形態について図面を用いて説明する。なお、前述した第一実施形態で説明した構成と同一または相当する構成については同一の符号を付して再度の説明を省略する。
本第二実施形態は、学習用画像に病変の映り込んでいない画像のみならず、病変の映り込んでいる画像も用いるものである。病変の映り込んでいる画像も用いることでこれまでに蓄積された画像をより有効に活用することができる。
本第二実施形態では、学習用画像に病変の映り込んでいる画像である場合、色調補正部62は、病変の存在範囲以外の範囲に基準色調による色調補正を実行する。病変の存在範囲(異常な範囲)と病変の存在範囲以外の範囲(正常な範囲)とを分けて色調補正することで、機械学習時の異常な範囲と正常な範囲との識別をし易くするとともに、正常な範囲には基準色調による統一した色調補正することで、異なる色調および画質の画像同士の平滑化を行い、生成される学習済みモデルの診断精度を高めることができる。
病変の存在範囲(異常な範囲)と病変の存在範囲以外の範囲(正常な範囲)との範囲分けについては、画像内の境界を自動検出する既存のプログラムを用いた範囲分けや、ペン入力などによる手動での範囲分けなどで行う。全ての範囲に色調補正するよりも範囲分けの手間はあるが、異常な範囲と正常な範囲との識別をし易くなるため診断の精度向上が可能になる。
また、本第二実施形態における学習済みモデル生成部64は、両画像に対応するため、画像の特徴量を検知するアルゴリズムに補正後の学習用画像(アフィン変換後の学習用画像を含む)を機械学習させて学習済みモデルを生成する。画像から特徴量を取得するアルゴリズムとしては、SIFT(Scale-Invariant Feature Transform)、SURE(Speed Up Robust Feature)
ORB(Oriented FAST and Rotated BRIDF)、CNN(Covolutional Neural Network)などに基づくアルゴリズムを用いることができる。
そして、本第二実施形態における病変有無診断部68は、生成された学習済みモデルに診断画像を入力して、診断用画像の特徴量が所定の値以上と判別されたときに病変が有ると診断し、その結果を表示手段2等に出力する。一方、診断用画像の特徴量が前記所定の値未満と判別されたときに病変がないと診断し、その結果を表示手段2等に出力する。
これにより、本第二実施形態では、病変の映り込みの有無にかかわらず蓄積されている画像を用いて病変の有無を診断できるようになり、これまでに蓄積された画像をより有効に活用することができる作用効果を奏する。
実施例1では、本発明に係る内視鏡用診断プログラムを作成し、内視鏡装置で撮影された診断用画像(内視鏡画像)を用いて病変の有無の診断精度について検証を行った。
<内視鏡装置>
本実施例1の検証に用いた内視鏡装置は、オリンパス社製のCF-H290ECI、オリンパス社製のCF-FH260AZI、富士フイルム社製のEC-L600ZP7の3機種である。
<診断用画像>
本実施例1の検証に用いた診断用画像は、診断対象部位として大腸内部を撮影した画像である。各画像は、予め医師により、炎症や潰瘍など病変が映り混んでいない正常な状態の大腸の画像(以下、「正常画像」とする。)と、病変が映り混んでいる異常な状態の大腸の画像(以下、「異常画像」とする。)との選別が行われている。
以下において、オリンパス社製のCF-H290ECIで撮影された診断用画像は「オリンパス290画像」、オリンパス社製のCF-FH260AZIで撮影された診断用画像は「オリンパス260画像」、富士フイルム社製のEC-L600ZP7で撮影された診断用画像は「フジ600画像」とする。
<色調補正に使用したソフトウエア>
本実施例1の検証において、診断用画像を色調補正するための基準色調の決定および前記基準色調に基づく診断用画像の色調補正には、Adobe社製の画像処理ソフトウエアであるPhotoshop(登録商標)を用いた。
<基準色調(基準画像)の決定>
本実施例1において基準色調(基準画像)は、以下の手順で決定した。
手順1)1つの内視鏡装置で撮影された診断用画像における正常画像からランダムに5枚を抽出する。
手順2)手順1で抽出した5枚の診断用画像から代表画像として1枚を選出する。
手順3)手順2で選出した代表画像に対して、他の4枚の画像をソース画像とする「カラーの補正」(Photoshopの機能)を実行する。
手順4)手順3で実行後の代表画像を、基準色調(基準画像)に決定して保存する。
手順2における代表画像の選出方法は任意であるが、本実施例1では、最も管腔が中心に捉えられている画像を代表画像とした。
また、手順3では(1)輝度、(2)カラーの適応度および(3)フェードを0から100の間で任意に設定可能であるが、本実施例1では、それぞれ(1)100、(2)100,(3)0(デフォルト設定値)とした。
本実施例1では、「オリンパス290画像」を用いて決定された基準画像を「オリンパス基準画像」、「フジ600画像」を用いて決定された基準画像を「フジ基準画像」とした。
<基準色調に基づく色調補正(学習用画像の作成)>
本実施例1における色調補正は、診断用画像に対して基準画像をソース画像とする「カラーの補正」を実行することで行う。例えば、「フジ600画像」に対して「オリンパス基準画像」に合わせた色調補正を行う場合は、「オリンパス基準画像」をソース画像として「フジ600画像」に「カラーの補正」を実行する。このとき(1)輝度、(2)カラーの適応度および(3)フェードは、手順3と同様に、それぞれ(1)100、(2)100,(3)0(デフォルト設定値)とした。
<学習済みモデルの生成>
本実施例1では、学習済みモデルの生成に、画像の異常検知に用いられる機械学習アルゴリズムであるパッチコア(Patchcore)を用いた。具体的には、検証する画像のデータセットを学習用画像(訓練データ)とテストデータに分けてパッチコアにより機械学習させ、学習済みモデルを生成した。
ただし、データセットのどのデータを学習用画像とし、どのデータをテストデータとするかによって、生成される学習済みモデルの診断精度に誤差が生じることが考えられる。そこで、本実施例1では、層化k分割交差検証という方法を採用した。
この層化k分割交差検証は、図4に示すように、データセット(画像データ群)を複数個の画像データ群に分割し、その内の1つの画像データ群を診断用画像、その他の画像データ群を学習用画像として、それぞれ分割した個数分の学習済みモデルの生成および診断精度の検証し、その平均値を求める方法である。検証にはk倍の時間がかかるものの、分割方法による診断精度に誤差を抑制することができる。本実施例1ではk=5の層化5分割交差検証とした。
<診断精度の検証方法>
診断精度は、生成した学習済みモデルに診断用画像を入力することで、診断用画像が正常画像か異常画像かの判別を行う。本実施例1では、層化5分割交差検証により生成された5つの学習済みモデルそれぞれによって、診断用画像(検証データ:学習済みモデルの生成に用いた学習用画像およびテストデータの全て)の判別を行い、それぞれの正答率と5つの正答率の平均正答率とを算出した。
以下、検証結果について説明する。
<オリンパス290画像による検証結果>
まず、オリンパス290画像を用いた検証を行った。検証に用いたオリンパス290画像は、異常画像が151枚、正常画像が136枚の合計287枚である。
下記表1は、オリンパス290画像を用いた層化5分割交差検証の結果を表にしたものである。この表は、左から1番目が分割番号、2番目が学習データ(学習用画像およびテストデータ)による損失関数Loss、3番目が学習データによる正答率、4番目が診断用画像(検証データ)による損失係数Loss、5番目が診断用画像の正答率を示す。
[表1]
表1に示すように、分割番号ごとの診断用画像(検証データ)における正答率は、約0.72~約0.82であり、それらの平均正答率は0.791であった。
<オリンパス260画像による検証結果>
次に、オリンパス260画像を用いた検証について説明する。検証に用いたオリンパス260画像は、異常画像が108枚、正常画像が131枚の合計239枚であった。下記表2に検証結果を示す。
[表2]
表2に示すように、分割番号ごとの診断用画像(検証データ)における正答率は、約0.58~約0.77であり、平均正答率は0.695であった。オリンパス290画像の場合に比べて、分割番号ごとの正答率のばらつきが大きく、平均正答率も低かった。
<フジ600画像による検証結果>
次に、フジ600画像を用いた検証について説明する。検証に用いたフジ600画像は、異常画像が108枚、正常画像が124枚の合計232枚であった。下記表3に検証結果を示す。
[表3]
表3に示すように、分割番号ごとの診断用画像(検証データ)における正答率は、約0.65~約0.87であり、平均正答率は0.764であった。オリンパス290画像の場合に比べて、分割番号ごとの正答率のばらつきが大きいものの、平均正答率は0.76と比較的高かった。
以上の結果をまとめると、機種ごとに撮影された画像を用いた診断結果の平均正答率は、オリンパス290画像>フジ600画像>オリンパス260画像の順で高かった。本実施例1では、色調補正を行う基準色調(基準画像)を平均正答率の高かったものから選択し、前述の通り「オリンパス290画像」を用いた「オリンパス基準画像」と「フジ600画像」を用いた「フジ基準画像」とした。
<オリンパス290画像およびオリンパス260画像を用いた検証>
次に、機種の異なる内視鏡装置によって撮影された画像を一緒に用いた場合について検証する。
まず、オリンパス290画像とオリンパス260画像を用いた検証を行った。オリンパス290画像とオリンパス260画像(色調補正なし)とを足し合わせたものをデータセットとして層化5分割交差検証を行った。
検証に用いたオリンパス290画像は、異常画像が152枚、正常画像が137枚の合計289枚、オリンパス260画像は、異常画像が109枚、正常画像が133枚の合計242枚である。よって、両画像を足し合わせると、異常画像が261枚、正常画像が270枚の合計が631枚であった。
オリンパス290画像とオリンパス260画像(色調補正なし)とを足し合わせたデータセットに基づく検証結果を下記表4に示す。
[表4]
表4に示すように、分割番号ごとの診断用画像(検証データ)における正答率は、約0.74~約0.86であり、平均正答率は0.813であった。
オリンパス290画像を単独で検証したときの平均正答率は0.791であったことと比較すると、平均正答率0.813となり精度は向上した。これはオリンパス290画像を単独で検証したときに比べて、機械学習させるデータ数が2倍程度増えたことにより、学習済みモデルの精度が向上したものと考えられる。一方、分割番号ごとの診断用画像(検証データ)における正答率は、約0.74~約0.86であり、ややばらつきが見られた。
<オリンパス290画像および色調補正したオリンパス260画像を用いた検証>
次に、色調補正による有効性を確かめるため、オリンパス290画像と、このオリンパス290画像の色調に合わせて色調補正したオリンパス260画像とを足し合わせたものをデータセットとして層化5分割交差検証を行った。
検証に用いたオリンパス290画像およびオリンパス260画像の画像数は、表4の結果に基づく検証のものと同じである。一方、オリンパス260画像は、オリンパス290画像の色調に合わせるため、全ての画像に対してオリンパス基準画像をソース画像とする色調補正を行った。
オリンパス290画像と色調補正したオリンパス260画像とを足し合わせたデータセットに基づく検証結果を下記表5に示す。
[表5]
表5に示すように、分割番号ごとの診断用画像(検証データ)における正答率は、約0.81~約0.84であり、正答率にばらつきが少なかった。色調補正により色調を合わせたことで、どこのデータで学習させても均一な学習済みモデルを生成することができたものと考えられる。
また、平均正答率は0.827となり、オリンパス260画像を色調補正しなかった場合の平均正答率0.813に比べて、精度は向上した。
よって、機種の異なる内視鏡装置で撮影した内視鏡画像同士を一緒に用いた場合、一方の機種に色調を合わせる色調補正を行うことで、色調補正を行わない場合よりも診断精度の向上を確認することができた。
<フジ600画像、オリンパス290画像(色調補正なし)およびオリンパス260画像(色調補正なし)を用いた検証>
次に、製造メーカーの異なる内視鏡装置で撮影した内視鏡画像同士の組み合わせによる検証を行った。
検証に用いたフジ600画像は、異常画像が109枚、正常画像が125枚の合計234枚、オリンパス290画像は、異常画像が152枚、正常画像が137枚の合計289枚、オリンパス260画像は、異常画像が109枚、正常画像が133枚の合計242枚である。よって、全ての画像を足し合わせると、異常画像が370枚、正常画像が395枚の合計が765枚であった。
これらフジ600画像、オリンパス290画像(色調補正なし)およびオリンパス260画像(色調補正なし)を足し合わせたものをデータセットとして層化5分割交差検証を行った。検証結果を下記表6に示す。
[表6]
表6に示すように、診断用画像(検証データ)による平均正答率は0.815となり、フジ600画像のみを用いた場合の平均正答率0.764より精度が向上した。この精度の向上は、オリンパス290画像とオリンパス260画像(色調補正なし)とを足し合わせた場合と同様、機械学習させるデータ数が3倍程度増えたことにより、学習済みモデルの精度が向上したものと考えられる。
<フジ600画像、色調補正したオリンパス290画像および色調補正したオリンパス260画像を用いた検証>
次に、色調補正による有効性を確かめるため、フジ600画像、色調補正したオリンパス290画像および色調補正したオリンパス260画像を足し合わせたものをデータセットとし、層化5分割交差検証を行った。検証結果を下記表7に示す。
[表7]
表7に示すように、診断用画像(検証データ)による平均正答率は0.821となり、フジ600画像のみを用いた場合の平均正答率0.764、色調補正しなかった場合の平均正答率0.815より精度が向上した。
<フジ600画像および色調補正したオリンパス290画像を用いた検証>
また、フジ600画像およびフジ基準画像に基づき色調補正したオリンパス290画像を足し合わせたものをデータセットとした層化5分割交差検証も行った。検証結果を下記表8に示す。
[表8]
表8に示すように、分割番号ごとの診断用画像(検証データ)における正答率は、全て0.8以上であり、平均正答率も0.843で高い正答率だった。
<フジ600画像および色調補正したオリンパス260画像を用いた検証>
さらに、フジ600画像およびフジ基準画像に基づき色調補正したオリンパス260画像を足し合わせたものをデータセットとした層化5分割交差検証も行ったが、下記表9に示すように、平均正答率も0.845と、高い正答率が得られた。
[表9]
以上より、本発明によれば、内視鏡装置のメーカーや機種にかかわらず、これまでに蓄積されている診断用画像や学習用画像に対して色調補正を行うことにより、画像同士の色調が平滑化され、学習済みモデルによる診断精度を高めることができることが確認できた。
<正常画像のみを用いた学習済みモデルの検証>
機械学習をさせる学習用画像として集めることのできる画像は、病変の映り込んでいない正常画像が多くなる可能性が考えられる。そこで、正常画像のみを学習用データに用いて生成された学習済みモデルについて検証した。
検証に用いた画像は、フジ600画像の正常画像が115枚、オリンパス290画像の正常画像が131枚、オリンパス260画像の正常画像が125枚の合計371枚である。
ここでは(1)フジ600画像、オリンパス290画像およびオリンパス260画像の正常画像を足し合わせたデータセットを機械学習させた場合の学習済みモデルの精度、(2)フジ600画像、色調補正されたオリンパス290画像および色調補正されたオリンパス260画像の正常画像を足し合わせたデータセットを機械学習させた場合の学習済みモデルの精度、(3)フジ600画像の正常画像のみを機械学習させた場合の学習済みモデルの精度、(4)オリンパス260画の正常画像のみを機械学習させた場合の学習済みモデルの精度、(5)オリンパス290画の正常画像のみを機械学習させた場合の学習済みモデルの精度について検証した。
精度の検証を評価する指標として、平均正答率とともに、機械学習における二値分類問題に対する評価指標指標の一つであるAUROC(Area Under the ROC Curve)と、二値分類問題の評価指標の一つであって適合率(Precision)と再現率(Recall)の調和平均からなるF値(F-mesure)を合わせて算出した。AUROCは0~1の範囲の値を取り、1に近いほどモデルの予測性能が高いことを示す。また、F値はは0~1の範囲の値を取り、1に近いほど適合率(Precision)と再現率(Recall)を両立できるバランスのとれた機械学習モデルであることを示す。それぞれの検証結果を下記表10に示す。
[表10]
表10に示すように、(1)の全ての正常画像を足し合わせた場合に比べて、(2)のフジ基準画像に合わせて色調補正を行った場合の方が、AUROC、F値および平均正答率全てにおいて高い値が得られた。また、(5)のオリンパス290画の正常画像のみを機械学習させた場合の学習済みモデルにおける平均正答率については、(2)の色調補正を行った場合の結果よりも精度が高い結果となったものの、それ以外については全て(2)の色調補正を行った場合の精度が高いという結果が得られた。
以上より、機種やメーカーの異なる内視鏡装置で撮影した内視鏡画像同士における正常画像のみを機械学習させた学習済みモデルについても、色調補正で色調を合わせることで精度を向上させることが確認できた。よって、将来的に、学習用画像として集めることのできる画像として病変の映り込んでいない正常画像が多くなったとしても、病変の有無の診断に用いられる学習済みモデルの精度を向上することができることが確認できた。
なお、本発明に係る内視鏡用診断プログラム、内視鏡用診断装置、内視鏡用診断装置の制御方法および内視鏡診断用学習済みモデル生成プログラムは、前述した各実施形態に限定されるものではなく、適宜変更することができる。例えば、学習済みモデル生成部64は、アンサンブル学習させることにより生成される学習済みモデルの診断精度をより高めてもよい。また、色調補正部62,67は、学習用画像および診断用画像の画像サイズが異なる場合には、画像を統一したサイズに合わせる処理を実行してもよい。
1 内視鏡用診断装置
1a 内視鏡用診断プログラム
2 表示手段
3 入力手段
4 コンピュータ
5 記憶手段
6 演算処理手段
10a 内視鏡診断用学習済みモデル生成プログラム
20 内視鏡装置
21 内視鏡カメラ
51 プログラム記憶部
52 学習用画像記憶部
53 基準色調記憶部
54 学習済みモデル記憶部
55 診断用画像記憶部
61 学習用画像取得部
62 色調補正部
63 アフィン変換部
64 学習済みモデル生成部
65 学習済みモデル決定部
66 診断用画像取得部
67 色調補正部
68 病変有無診断部

Claims (9)

  1. 内視鏡装置で撮影された内視鏡画像に基づいて病変の有無を診断する内視鏡用診断プログラムであって、
    内視鏡装置で撮影された診断対象部位の診断用画像を取得する診断用画像取得部と、
    事前に内視鏡装置で撮影された診断対象部位の画像を解析して得られた基準色調を取得するとともに、その取得した前記基準色調に合わせて前記診断用画像を色調補正する色調補正部と、
    複数種の内視鏡装置によって診断対象部位を撮影した複数枚の学習用画像であって、前記基準色調によって色調補正した複数枚の前記学習用画像を機械学習させて生成した学習済みモデルに対して、補正後の前記診断用画像を入力し、その出力結果から病変の有無を診断処理する病変有無診断部
    としてコンピュータを機能させる、前記内視鏡用診断プログラム。
  2. 前記色調補正部が、前記診断用画像を前記色調補正するとともに高画質化処理を行い、
    前記病変有無診断部が、前記色調補正部と同じ前記色調補正および前記高画質化処理を行った前記学習用画像を機械学習させて生成された前記学習済みモデルによって病変の有無を診断処理する、請求項1に記載の内視鏡用診断プログラム。
  3. 前記病変有無診断部が、画像の異常検知アルゴリズムに、前記基準色調で補正されかつ病変の映り込んでいない複数枚の前記学習用画像を機械学習させて生成された学習済みモデルに対して、補正後の前記診断用画像を入力し、その出力結果として前記診断用画像の異常が検出されたときに病変があると診断する、請求項1に記載の内視鏡用診断プログラム。
  4. 前記病変有無診断部が、画像の特徴量を検知するアルゴリズムに、前記基準色調で補正されかつ病変の映り込んでいない複数枚の前記学習用画像と、前記基準色調で補正されかつ病変の映り込んでいる複数枚の前記学習用画像とを機械学習させて生成された学習済みモデルに対して、補正後の前記診断用画像を入力し、その出力結果として前記診断用画像の特徴量が所定の値以上と判別されたときに病変があると診断し、前記診断用画像の特徴量が前記所定の値未満と判別されたときに病変がないと診断する、請求項1に記載の内視鏡用診断プログラム。
  5. 内視鏡装置で撮影された内視鏡画像に基づいて病変の有無を診断する内視鏡用診断装置であって、
    内視鏡装置で撮影された診断対象部位の診断用画像を取得する診断用画像取得部と、
    事前に内視鏡装置で撮影された診断対象部位の画像を解析して得られた基準色調を取得するとともに、その取得した前記基準色調に合わせて前記診断用画像を色調補正する色調補正部と、
    複数種の内視鏡装置によって診断対象部位を撮影した複数枚の学習用画像であって、前記基準色調によって色調補正した複数枚の前記学習用画像を機械学習させて生成した学習済みモデルに対して、補正後の前記診断用画像を入力し、その出力結果から病変の有無の診断処理する病変有無診断部
    とを有する、前記内視鏡用診断装置。
  6. 内視鏡装置で撮影された内視鏡画像に基づいて病変の有無を診断する内視鏡用診断装置の制御方法であって、
    内視鏡装置で撮影された診断対象部位の診断用画像を取得する診断用画像取得ステップと、
    事前に内視鏡装置で撮影された診断対象部位の画像を解析して得られた基準色調を取得するとともに、その取得した前記基準色調に合わせて前記診断用画像を色調補正する色調補正ステップと、
    複数種の内視鏡装置によって診断対象部位を撮影した複数枚の学習用画像であって、前記基準色調によって色調補正した複数枚の前記学習用画像を機械学習させて生成した学習済みモデルに対して、補正後の前記診断用画像を入力し、その出力結果から病変の有無の診断処理する病変有無診断ステップ
    とを有する前記内視鏡用診断装置の制御方法。
  7. 内視鏡装置で撮影された内視鏡画像に基づき病変の有無を診断する内視鏡用診断で用いられる学習済みモデルを生成する内視鏡診断用学習済みモデル生成プログラムであって、
    複数種の内視鏡装置で撮影された診断対象部位の複数枚の学習用画像を取得する学習用画像取得部と、
    事前に内視鏡装置で撮影された診断対象部位の画像を解析して得られた基準色調を取得するとともに、その取得した前記基準色調に合わせて前記各学習用画像を色調補正する色調補正部と、
    前記色調補正部により色調補正された前記各学習用画像を、機械学習アルゴリズムを用いて機械学習させて複数の学習済みモデルを生成する学習済みモデル生成部と、
    生成された前記各学習済みモデルに病変の有無が検証済みである検証用の画像を入力して正答率の最も高い前記学習済みモデルを内視鏡診断に用いる学習済みモデルに決定する学習済みモデル決定部
    としてコンピュータを機能させる、前記内視鏡診断用学習済みモデル生成プログラム。
  8. 前記色調補正部は、前記学習用画像に病変の映り込んでいる場合には、前記病変の存在範囲以外の範囲に前記基準色調による色調補正を実行する、請求項7に記載の内視鏡診断用学習済みモデル生成プログラム。
  9. 前記色調補正部により補正された前記学習用画像を任意のアフィン変換させるアフィン変換部としてコンピュータを機能させるとともに、
    前記学習済みモデル生成部は、前記色調補正部により補正された前記学習用画像とともに前記アフィン変換部により変換された前記学習用画像を機械学習させて学習済みモデルを生成する、請求項7に記載の内視鏡診断用学習済みモデル生成プログラム。
JP2025502773A 2023-02-24 2024-02-21 内視鏡用診断プログラム、内視鏡用診断装置、内視鏡用診断装置の制御方法および内視鏡診断用学習済みモデル生成プログラム Active JP7778334B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2023027308 2023-02-24
JP2023027308 2023-02-24
PCT/JP2024/006367 WO2024177117A1 (ja) 2023-02-24 2024-02-21 内視鏡用診断プログラム、内視鏡用診断装置、内視鏡用診断装置の制御方法および内視鏡診断用学習済みモデル生成プログラム

Publications (3)

Publication Number Publication Date
JPWO2024177117A1 JPWO2024177117A1 (ja) 2024-08-29
JPWO2024177117A5 JPWO2024177117A5 (ja) 2025-11-11
JP7778334B2 true JP7778334B2 (ja) 2025-12-02

Family

ID=92500873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2025502773A Active JP7778334B2 (ja) 2023-02-24 2024-02-21 内視鏡用診断プログラム、内視鏡用診断装置、内視鏡用診断装置の制御方法および内視鏡診断用学習済みモデル生成プログラム

Country Status (4)

Country Link
US (1) US20260053332A1 (ja)
EP (1) EP4670614A1 (ja)
JP (1) JP7778334B2 (ja)
WO (1) WO2024177117A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020141995A (ja) 2019-03-08 2020-09-10 富士フイルム株式会社 内視鏡画像学習装置、方法及びプログラム、内視鏡画像認識装置
JP2022162028A (ja) 2018-06-12 2022-10-21 富士フイルム株式会社 内視鏡画像処理装置、内視鏡システム、内視鏡画像処理装置の作動方法、内視鏡画像処理プログラム及び記憶媒体

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3698702B1 (en) 2017-10-17 2023-06-07 FUJIFILM Corporation Medical image processing device and endoscope device

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022162028A (ja) 2018-06-12 2022-10-21 富士フイルム株式会社 内視鏡画像処理装置、内視鏡システム、内視鏡画像処理装置の作動方法、内視鏡画像処理プログラム及び記憶媒体
JP2020141995A (ja) 2019-03-08 2020-09-10 富士フイルム株式会社 内視鏡画像学習装置、方法及びプログラム、内視鏡画像認識装置

Also Published As

Publication number Publication date
US20260053332A1 (en) 2026-02-26
WO2024177117A1 (ja) 2024-08-29
JPWO2024177117A1 (ja) 2024-08-29
EP4670614A1 (en) 2025-12-31

Similar Documents

Publication Publication Date Title
JP7593921B2 (ja) 腸の病理学のための画像スコアリング
JP2021536057A (ja) 医療画像に対する病変の検出及び位置決め方法、装置、デバイス、及び記憶媒体
CN110070531B (zh) 用于检测眼底图片的模型训练方法、眼底图片的检测方法及装置
CN108021916A (zh) 基于注意力机制的深度学习糖尿病视网膜病变分类方法
US20210012487A1 (en) Deep Learning-Based Medical Image Quality Evaluation and Virtual Clinical Trial
WO2020066257A1 (ja) 分類装置、分類方法、プログラム、ならびに、情報記録媒体
JP6810212B2 (ja) 画像識別方法及び画像識別装置
CN117095815B (zh) 基于磁共振图像和病理全景扫描切片预测带有同源重组缺陷的前列腺癌患者的系统
CN110956628A (zh) 图片等级分类方法、装置、计算机设备和存储介质
CN117953970B (zh) 一种基于高光谱图像的肺癌多基因检测方法及系统
CN112862745A (zh) 基于人工神经网络的组织病变识别的训练方法及训练系统
CN118823421A (zh) 基于图像增强的消化道炎症识别方法及系统
JP2025063333A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
Mencattini et al. Uncertainty-based feature selection for improved adequacy of dermoscopic image classification
CN111784637B (zh) 一种预后特征可视化方法、系统、设备和存储介质
US20230093471A1 (en) Methods and systems for predicting rates of progression of age-related macular degeneration
JP7778334B2 (ja) 内視鏡用診断プログラム、内視鏡用診断装置、内視鏡用診断装置の制御方法および内視鏡診断用学習済みモデル生成プログラム
CN118799624A (zh) 一种基于深度学习的眼底图像病灶识别方法及相关设备
WO2024206542A1 (en) Systems and methods for enhancing retinal color fundus images for retinopathy analysis
JP7767745B2 (ja) 学習装置、学習システム、機械学習モデルの学習方法及びプログラム
JP2023091759A (ja) 医用画像処理装置及び医用画像処理方法
JP7443929B2 (ja) 医療診断支援装置、医療診断支援プログラム、および医療診断支援方法
Tyagi et al. Detecting Diabetic Retinopathy using ResNet50 and Explainable AI
Fadillah et al. The Combination of Contrast Stretching and Histogram Equalization Methods to Optimizing Radiology Image Quality
TWI921190B (zh) 用於眼底影像的影像處理系統及影像處理方法

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A5211

Effective date: 20250822

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20250828

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20250828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20250822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20251105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20251111

R150 Certificate of patent or registration of utility model

Ref document number: 7778334

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150