WO2019231102A1 - 피검체의 안저 영상을 분류하는 방법 및 이를 이용한 장치 - Google Patents
피검체의 안저 영상을 분류하는 방법 및 이를 이용한 장치 Download PDFInfo
- Publication number
- WO2019231102A1 WO2019231102A1 PCT/KR2019/004288 KR2019004288W WO2019231102A1 WO 2019231102 A1 WO2019231102 A1 WO 2019231102A1 KR 2019004288 W KR2019004288 W KR 2019004288W WO 2019231102 A1 WO2019231102 A1 WO 2019231102A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- fundus image
- computing device
- classification
- present
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/40—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mechanical, radiation or invasive therapies, e.g. surgery, laser therapy, dialysis or acupuncture
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H30/00—ICT specially adapted for the handling or processing of medical images
- G16H30/20—ICT specially adapted for the handling or processing of medical images for handling medical images, e.g. DICOM, HL7 or PACS
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B3/00—Apparatus for testing the eyes; Instruments for examining the eyes
- A61B3/10—Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions
- A61B3/12—Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions for looking at the eye fundus, e.g. ophthalmoscopes
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B3/00—Apparatus for testing the eyes; Instruments for examining the eyes
- A61B3/10—Objective types, i.e. instruments for examining the eyes independent of the patients' perceptions or reactions
- A61B3/14—Arrangements specially adapted for eye photography
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10088—Magnetic resonance imaging [MRI]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10104—Positron emission tomography [PET]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10108—Single photon emission computed tomography [SPECT]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10116—X-ray image
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10132—Ultrasound image
- G06T2207/10136—3D ultrasound image
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20112—Image segmentation details
- G06T2207/20132—Image cropping
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30041—Eye; Retina; Ophthalmic
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Definitions
- the present invention relates to a method for classifying a fundus image and an apparatus using the same. Specifically, according to the method according to the present invention, a computing device obtains a fundus image of the subject, generates classification information of the fundus image, generates a reading based on the classification information, and provides the reading to an external entity. do.
- the fundus image is an image used by ophthalmologists to specify abnormal lesions for diagnosing a disease.
- multiplication neural networks have left a number of successful cases, aimed only at the accurate diagnosis of certain diseases, such as diabetic retinopathy and diabetic macular edema, and have proven their diagnosis.
- Appropriate lesion visualization and localization are disadvantageous.
- the neural network architecture can be trained with regional annotations that allow for better localization and classification in some findings.
- DR diabetic retinopathy
- CNNs convolutional neural networks
- DME diabetic macular edema
- Patent Document 1 KR10-1848321 B
- Patent Document 2 KR10-1848322 B
- the present invention not only accurately detects whether the image is readable, normal or abnormal, and abnormal from the fundus image, but also automatically generates a reading based on the finding to provide convenience in the medical field. The purpose.
- the present invention aims to enable regional guidance so that neural networks can learn correct patterns for findings instead of deflections in the image.
- a method for classifying a fundus image of a subject comprising: (a) a computing device acquiring or interworking with the fundus image of the subject; Assisting another device to obtain; (b) supporting, by the computing device, generating or generating classification information of the fundus image; (c) supporting, by the computing device, generating or generating a readout based on the classification information; And (d) supporting, by the computing device, providing or providing the read to an external entity.
- a computer program stored on a machine-readable non-transitory recording medium comprising instructions implemented to perform a method according to the invention.
- a computing device for classifying a fundus image of a subject
- the apparatus comprising: a communication unit for acquiring a fundus image of the subject; And (i) generating classification information of the fundus image; (ii) generating a readout based on the classification information; And (iii) a processor that performs a process of providing the readout to an external entity or enables another device to be interworked through the communication unit.
- the convenience is provided by automatically generating a reading based on findings calculated from the fundus image.
- Such an effect according to an embodiment of the present invention can be applied not only to the fundus image but also widely to two-dimensional or three-dimensional images of various formats (modality).
- the X-ray image which is conventionally used in hospitals
- the method of the present invention can be used as it is in a system such as an ultrasound image, a CT image, an MRI image, and of course, the method of the present invention is not dependent on a specific type of image or platform.
- FIG. 1 is a conceptual diagram schematically illustrating an exemplary configuration of a computing device for performing a method of classifying a fundus image of a subject (hereinafter, referred to as a "fungus image classification method") according to the present invention.
- FIG. 2 is an exemplary block diagram illustrating hardware or software components of a computing device performing a fundus image classification method in accordance with the present invention.
- FIG. 3 is a flowchart illustrating a fundus image classification method according to the present invention.
- FIG. 4 is a diagram illustrating an example of a user interface that may be used in the fundus image classification method of the present invention.
- FIG. 5 is a diagram illustrating an example of a user interface that allows an external entity to refer to a readout generated according to the fundus image classification method of the present invention.
- FIG. 6 is a diagram illustrating an example of a neural network architecture according to an embodiment of the present invention.
- FIG. 7 is a table showing the results of comparing the performance of the neural network architecture provided according to an embodiment of the present invention with the conventional architecture.
- FIG. 8 is an exemplary diagram qualitatively comparing the performance of the neural network architecture provided according to an embodiment of the present invention with the conventional architecture.
- image refers to multidimensional data composed of discrete image elements (e.g., pixels in a two-dimensional image), in other words, (e.g., the term refers to a visually visible object (eg, a file corresponding to a pixel output of a CT, MRI detector, etc.) or a digital representation of that object (as shown on a video screen).
- image elements e.g., pixels in a two-dimensional image
- the term refers to a visually visible object (eg, a file corresponding to a pixel output of a CT, MRI detector, etc.) or a digital representation of that object (as shown on a video screen).
- an "image” may be a subject collected by computed tomography (CT), magnetic resonance imaging (MRI), ultrasound or any other medical imaging system known in the art. It may be a medical image of a subject.
- CT computed tomography
- MRI magnetic resonance imaging
- ultrasound ultrasound
- the image is not necessarily provided in a medical context, but may be provided in a non-medical context, for example X-ray imaging for security screening.
- image formats used in various embodiments of the present invention may be MRI, CT, positron emission tomography (PET), PET- It will be appreciated that the invention includes CT, SPECT, SPECT-CT, MR-PET, 3D ultrasound images, and the like, but is not limited to the examples listed.
- DICOM Digital Imaging and Communications in Medicine
- ACR American Academy of Radiology
- NEMA American Electrical Industry Association
- 'PACS Picture Archiving and Communication System
- MRI Magnetic resonance Imaging
- 'PACS Picture Archiving and Communication System
- 'localization' and variations thereof are intended to refer to the identification, specification or specification of a location.
- 'localize an area' refers to specifying the location of that area.
- the present invention encompasses all possible combinations of the embodiments indicated in this disclosure. It is to be understood that the various embodiments of the invention are different, but need not be mutually exclusive. For example, specific shapes, structures, and characteristics described herein may be implemented in other embodiments without departing from the spirit and scope of the invention with respect to one embodiment. In addition, it is to be understood that the location or arrangement of individual components within each disclosed embodiment may be changed without departing from the spirit and scope of the invention. The following detailed description, therefore, is not to be taken in a limiting sense, and the scope of the present invention, if properly described, is defined only by the appended claims, along with the full range of equivalents to which such claims are entitled. Like reference numerals in the drawings refer to the same or similar functions throughout the several aspects.
- such areas may include macular area, optic nerve papillary area, optic nerve papillary area, lateral (temporal) area, superotemporal area, inferotemporal area, superonasal area and hyponasal area ( inferonasal) region.
- FIG. 1 is a conceptual diagram schematically illustrating an exemplary configuration of a computing device for performing a fundus image classification method according to the present invention.
- the computing device 100 includes a communication unit 110 and a processor 120, and directly or indirectly with an external computing device (not shown) through the communication unit 110. Can communicate with each other.
- the computing device 100 may comprise typical computer hardware (eg, a computer processor, memory, storage, input and output devices, devices that may include components of other existing computing devices; routers, switches, etc.).
- Electronic communication devices eg, electronic communication devices; electronic information storage systems such as network-attached storage (NAS) and storage area networks (SANs) and computer software (ie, enabling computing devices to function in a particular manner). Combination of instructions) to achieve the desired system performance.
- NAS network-attached storage
- SANs storage area networks
- computer software ie, enabling computing devices to function in a particular manner. Combination of instructions
- the communication unit 110 of such a computing device may transmit and receive a request and a response with another computing device to which the computing device is interworked.
- the request and response may be made by the same transmission control protocol (TCP) session.
- TCP transmission control protocol
- the present invention is not limited thereto, and may be transmitted and received as, for example, a user datagram protocol (UDP) datagram.
- the communication unit 110 may include a keyboard, a mouse, other external input devices, a printer, a display, and other external output devices for receiving commands or instructions.
- the processor 120 of the computing device may include a micro processing unit (MPU), a central processing unit (CPU), a graphics processing unit (GPU), a neural processing unit (NPU) or a tensor processing unit (TPU), and a cache memory. ), And a hardware configuration such as a data bus.
- the operating system may further include a software configuration of an application performing a specific purpose.
- FIG. 2 is an exemplary block diagram illustrating hardware or software components of a computing device performing a fundus image classification method in accordance with the present invention.
- the computing device 100 may include an image acquisition module 210 as a component thereof.
- the image acquisition module 210 is configured to acquire a medical image to which the method according to the present invention is applied.
- the image reading module 220 is used to read the fundus image obtained by the image obtaining module 210.
- the individual modules illustrated in FIG. 2 may be implemented by, for example, the communication unit 110 or the processor 120 included in the computing device 100, or by interworking with the communication unit 110 and the processor 120. The technician will understand.
- the fundus image may be obtained from, for example, an external image storage system such as a photographing device or a medical image storage transmission system (PACS) interlocked through the communication unit 110, but is not limited thereto.
- the fundus image may be captured by the (medical) imaging device and transmitted to the PACS according to the DICOM standard and then acquired by the image acquisition module 210 of the computing device 100.
- the fundus image and the labeling information on the fundus image may be obtained together, and the fundus image and the labeling information are included in the image reading module 220 at the time of learning. Is used to pre-train the image reading model.
- the labeling information may include information about the findings on the fundus image and a region corresponding to the findings, and may also include additional information such as the macular and the location of the optic nerve papilla.
- the image reading model after the training is completed can generate the classification information of the fundus image in the image reading module 220 and transfer it to the reading generation module 230 and the result storage and output module 240, the reading generation module 230 may generate a reading based on the classification information, and the result storage and output module 240 may output the classification result of the fundus image through a predetermined output device, for example, a user interface displayed on a display. can be provided to (entity).
- a readout editing module 250 capable of editing the previously generated readout may be further provided.
- the external entity includes a user, an administrator of the computing device 100, a medical staff in charge of a subject displayed on the fundus image, and the like.
- the classification that is, the determination (reading) of the fundus image may be performed. It is to be understood that any subject that is needed is included.
- FIG. 2 Specific functions and effects of the respective components shown in FIG. 2 will be described later in detail.
- the components illustrated in FIG. 2 are illustrated as being realized in one computing device for convenience of description, the computing device 100 performing the method of the present invention may be configured such that a plurality of devices are interworked with each other. It will be understood that it may be covered by the claims appended hereto.
- FIG. 3 is a flowchart illustrating an example of a fundus image classification method according to the present invention
- FIG. 4 conceptually illustrates an example of a user interface that may be used in the fundus image classification method of the present invention.
- an image acquisition module 210 implemented by the computing device 100 acquires a fundus image of a subject or a communication unit of the computing device 100.
- a step S100 of supporting other devices (not shown) interworking through the operation 110 is obtained.
- the fundus image classification method further includes a step (S200) of supporting an image reading module 220 implemented by the computing device 100 to generate or generate classification information of the fundus image.
- the classification information corresponds to the finding of the fundus image, and visualization information supporting the classification information may be generated together.
- This visualization information may be provided as an activation map to be described later.
- step (S200) specifically, the image reading module 220 determines whether or not to read the fundus image, or supports the other device through the communication unit 110 to determine (S220) ).
- the fundus image 405 and whether the fundus image is readable can be displayed through a user interface provided to perform the method according to the present invention.
- an unreadable classification may be generated as the classification information, for example, such as an indication 412 of "Ungradable" illustrated in FIG. have.
- a subject ID (422), age (424), sex (Sex; 426) and fundus image of a subject
- Information of a subject (patient) including at least one of binocular classification information (428) may be provided to the user.
- a list 430 of a plurality of subjects may be provided together, and a predetermined interface element such as an “Analyze” button 440 of FIG. 4 may be provided to perform step S200 with a simple operation. It may be.
- the image reading module 220 may determine whether the fundus image is normal or abnormal and determine whether the fundus image is normal or abnormal. And calculating from the fundus image or supporting the other device to calculate (S240).
- a normal classification may be generated as the classification information. For example, as shown in FIG. 4, if the fundus image is normal, it may be displayed as “Normal” or highlighted 414.
- step S200 if the fundus image is abnormal, the image reading module 220 generates the read result information on the individual findings detected in the fundus image as the classification information together with the confidence level of the individual findings. It further includes the step (S260) of supporting the other device to generate.
- step S260 The position for the individual findings in step S260 can be calculated as an activation map to be described in detail below, as illustrated by reference numeral 450 in FIG. 4.
- FIG. 4 when the fundus image is abnormal (416), a list of individual findings detected is represented by Hemorrhage (460a), HardExudate (460b), Cotton Wool Patch (460c), and the like.
- the position where the hemorrhage is displayed may be highlighted.
- the active map 450 corresponding to the selected finding is also shown in the figure.
- the present invention is not limited to such a display method, and various methods of displaying a list of individual findings and an active map may be used.
- a predetermined interface element 455 may be further provided on the user interface as shown by way of example in FIG. 4 so as to show or hide a partition line that separates the region (eg, by a toggle). .
- certain interface elements 456 may be further provided on the user interface to show and hide the entire active map.
- step S260 the positions of the macular and optic nerve papilla in the fundus image may be automatically detected as disclosed in Korean Patent Nos. 10-1848321 and 10-1848322 to refer to the generation of individual findings. have.
- an exemplary neural network architecture having superior performance as compared to a conventional neural network as a neural network designed to detect the location of the macula and the optic nerve papilla will be described in detail later.
- the image reading module 220 divides the area of the fundus image (for example, into eight areas) or causes the other device to divide the reference. Can be supported.
- the reading generation module 230 implemented by the computing device 100 generates a reading based on the classification information. It further includes the step (S300) for supporting the other device to generate.
- the 'reading sentence' is a term intended to include not only a form of a sentence but also a form in which information is briefly listed as a word.
- step S300 the reading indicating the position of the individual findings may be generated or the other device may be generated based on the divided region.
- the readout is an initial value of at least one set of (i) a basic readout provided to correspond when the ocular fundus image is normal, or (ii) corresponding to an individual finding when the ocular fundus image is abnormal. It can be generated as a selective read which is a result selected based on the classification information among a plurality of read choices.
- an example of the readout 470 of the fundus image is shown, for example, the type of abnormal finding found in the fundus image, the name of the individual finding (eg, 'hemorrhage', 'hard exudate', etc.). At least one or more of the name of the region (eg, 'macular', 'temporal', etc.) where the confidence level and the individual findings are observed may be included in the information of the reading.
- the types of abnormal findings included in the reading may include 'retinal abnormalities', 'glaucomatous abnormalities', 'optic nerve abnormalities', and individual findings may include bleeding, hard exudates, cotton plaques, drusen and drusinoid deposits. It may include, but is not limited to, water (drusen & drusenoid deposits), retinal pigmentary change, macular hole, vascular abnormality, membrane, fluid accumulation, chroioretinal atrophy / scar, There may be choroidal lesions, myelinated nerve fibers, RNFL defects, galucomatous disc changes, non-glaucomatous disc changes, other findings or artifacts.
- the fundus image classification method may then provide a result storage and output module 240 implemented by the computing device 100 to provide the readout to an external entity.
- the method may further include a step (S400) of supporting the other device to provide.
- a reference (“refer”) 490 button may be provided as such in the exemplary interface of FIG. 4.
- FIG. 5 is a diagram illustrating an example of a user interface provided to allow an external entity to refer to a readout generated according to the fundus image classification method of the present invention.
- a user interface that allows an expert in each field to request reading results information and readings that are the result of the method of the present invention as an external entity, for example, as a list of external entities. , Specialty, name, title, affiliation, reference count, reference count, etc. may be provided on the user interface.
- the reading editing module 250 implemented by the computing device 100 may be predetermined.
- Providing a user interface may further include the step (S500) of supporting the user to edit or modify the reading through the user interface.
- the reading editing module 250 may modify the reading in response to the correction input or support the other device to correct it.
- the readout may be modified accordingly.
- a predetermined interface element eg, check buttons 462a, 462b, 462c as illustrated in FIG. 4
- a clear (“clear”) button for deleting the entire contents of the reading as in the example of FIG. 4, storing the contents of the currently provided reading and viewing the next subject.
- a save and next view subject button (“save &next"; 484) button may be provided to perform the method of the invention. It goes without saying that a separate deletion element 474 may be provided for deleting the content of the individual findings contained in the reading.
- a graphical user interface includes one or more display images generated by a display processor, which includes a processor Or user interaction with other devices and associated data acquisition and processing functions.
- the GUI also includes an executable procedure or executable application.
- the executable procedure or executable application causes the display processor to generate signals representing the GUI display images according to a condition. These signals are transmitted to a display device displaying images for viewing by the user.
- the processor manipulates the GUI display images in response to signals received from input devices under the control of an executable procedure or an executable application. In this manner, a user may understand that the user may interact with the display image using input devices, thereby enabling user interaction with the processor or other device.
- the user referred to in the present invention may not only refer to the singular but may also refer to a plurality of users for the purpose of obtaining abundant and overlapping medical images and their related data. In actual use, the purpose may be to secure the integrity of the fundus image.
- classifiers may be used as the reading model of the image reading module 220 used in the method according to the present invention, for example, a deep learning model, a random forest, a Bayesian image acquisition module, or the like.
- the following describes an exemplary neural network architecture used by the inventors as a readout model with reference to FIG. 6.
- Exemplary neural network architecture of the present invention is a diagram illustrating an example of a neural network architecture according to an embodiment of the present invention.
- the residual layer or the residual unit refers to feature maps in which an input layer is added to an output layer in ⁇ synthesis product, batch-norm, ReLU ⁇ x 2.
- the layers become deeper, it is advantageous to monotonically increase the number of layers constituting each of the convolution blocks 610, 620, and 630. If the number is the same or less, the performance tends to be lowered when they have the same parameters. Meanwhile, in the example of FIG. 6, the total number of convolutional blocks is illustrated as three, but more than that.
- the first four or more reduction layers of different sizes are concatenated with average pooling to utilize both low and high level features. That is, according to the neural network architecture of the embodiment, a feature of extracting a feature through a plurality of composite products and then compressing the information by adjusting the size (for example, average pooling) to match the resolutions equally and concatenation in the depth direction by varying levels Features can be extracted.
- reduction layers of reference numerals 612, 622, and 632 are combined with reference numerals 652, 654, and 656, respectively, by adjusting the resolution, and the reduction layers of reference numeral 640 are coupled thereto.
- the combined feature maps then have a dilation rate of 1, 2, 4, 8 (findings for large size), an expansion rate of 1, 2, 4 (findings for medium size), or 1 , Atrous-pyramid-pooled (660) with an expansion rate of 2 (findings for small size).
- This is effectively to double the receptive fields. That is, atlas pyramid pooling has been employed to combine features into accommodation fields of various sizes.
- the next layer of the atlas pooling layer is the composite product of stride 2, which reduces the feature to twice the resolution.
- the last layer 680 is a 1x1 convolutional layer, which computes the 1x1 convolution of the previous layer 670, which is a linear combination of previous feature maps, such as in a class activation map (CAM).
- CAM class activation map
- the activity map 690a by the inventor is different from the CAM, in that an additional loss function guides the activity to appear only in the desired areas.
- the last layer can be between 8x8 and 32x32, so that the size in the actual fundus image corresponding to 1x1 matches the significant lesion identification size.
- the 1 ⁇ 1 convolutional layer is global average pooled (GAP) on one side and normalized with a sigmoid function to yield a classification result, that is, a prediction value considering the presence.
- GAP global average pooled
- the 1 ⁇ 1 product layer becomes the active map normalized through sigmoid on the other. Therefore, the activity map is directly related to the prediction in the neural network architecture according to the present invention and no external computation is required for visualization.
- An objective function according to an embodiment of the present invention is as follows. Fundus image Given this, the presence of the target findings in that image I Encoded with a probability of existence It is output from this neural network. When K images are given as mini-batch, the binary cross entropy for the classification loss in FIG. 6 is given by Equation 1 below.
- the total loss value is obtained by combining a classification loss using a loss function such as binary classification entropy and a guide loss multiplied by lambda, a hyperparameter for compromise with this classification loss, as shown in Equation 3 below.
- [lambda] is a value for balancing two objective functions.
- the inventors have separated annotations into training sets and test sets based on the expertise of the annotators for the purpose of measuring the performance of the neural network architecture.
- the training set was annotated by 27 licensed ophthalmologists
- the test set was annotated by 16 certified retinal specialists and 9 certified glaucoma specialists.
- Each fundus image was annotated by a total of three ophthalmologists, and the total amount of images included in the training and test sets was 66,473 and 15,451, respectively.
- the training set was divided into 90% of the derivation set and 10% of the verification set.
- the model of an exemplary neural network architecture in accordance with the present invention has been optimized with this set of derivations until the verification loss is stagnated and exacerbated.
- the model with the lowest verification loss was tested with the test set considered gold standards.
- the present inventors determined that there was no target finding when all of the ophthalmologists did not annotate, and that the target finding was present when two or more of three ophthalmologists annotated. The union of annotated areas was provided as regional clues during training.
- AU-ROC area under receiver operating characteristic curve
- AIR sensitivity and activity in regional cues
- the aim was to measure the effect of the guidance loss by comparing the results in terms of.
- AIR is defined as the sum of the activities within the regional clues divided by the sum of all the activities. AIR was measured for both true and false negatives in the classification when regional cues were available.
- the original color fundus images used in the experiment were cropped to center the fundus area, removing the black background, and resized to 512x512 for neural network input. Preferably it may be readjusted to a size between 256x256 and 1024x1024.
- the pixel values of the pixels that make up the image are divided by 255 so that they are in the [0,1] range. No other preprocessing is required.
- it may be meaningful to control only a range of pixel values without any preprocessing in the case of red-green-blue (RGB).
- FIG. 7 is a table showing the results of comparing the performance of the neural network architecture provided according to an embodiment of the present invention with the conventional architecture.
- Figure 7 summarizes the results of comparing the performance between the model with guide loss introduced and the model without guide loss as a table.
- the inventors were able to confirm the positive effects of intraocular loss on AIR of TP (true positive) and FN (false negative) across all findings. This is desirable, as the neural network can pay attention to the regional cues for classification, so the neural network tends to learn less of the dataset biases. Also, the difference in AIR between the two models is larger in the case of TP than in FN. This is reasonable because FN consists of cases where neural networks are difficult to classify, whereas TP can be classified relatively easily with high confidence.
- FIG. 8 is an exemplary diagram qualitatively comparing the performance of the neural network architecture provided according to an embodiment of the present invention with the conventional architecture.
- FIG. 8 compares the activity maps of a neural network with and without a guide loss.
- the active maps are upscaled by double linear interpolation, blurred with a 32x32 Gaussian filter for natural visualization, and normalized to [0, 1].
- the neural network produces a more accurate activity map when trained with regional cues.
- the activity maps derived by the present invention provide significant information about the location of the findings that may be beneficial to the clinician, even if they were not markedly divided by pixel and in some cases a small number of false positives appeared. Without loss of guidance, the active maps spread far larger than the periphery of the lesion and often highlight unrelated areas.
- the present invention utilizes the regional information on the findings in the fundus images for localization and classification, in all the embodiments and modifications thereof. Because of the effective labeling to collect regional annotations on findings, a neural network architecture could be proposed to localize lesions and classify the findings. Medical workflows in the medical field may be improved.
- Activity performed automatically is performed in response to one or more executable instructions or device operation without direct initiation by the user of the action. .
- the hardware may include a general purpose computer and / or a dedicated computing device or a particular aspect or component of a particular computing device or a specific computing device.
- the processes may be realized by one or more microprocessors, microcontrollers, embedded microcontrollers, programmable digital signal processors or other programmable devices having internal and / or external memory.
- the processes may be configured to process an application specific integrated circuit (ASIC), a programmable gate array, a programmable array logic (PAL), or electronic signals. It can be implemented in any other device or combination of devices that are present.
- ASIC application specific integrated circuit
- PAL programmable array logic
- the objects of the technical solution of the present invention or the portions contributing to the prior art can be embodied in the form of program instructions that can be executed by various computer components and recorded in a machine-readable recording medium.
- the machine-readable recording medium may include program instructions, data files, data structures, etc. alone or in combination.
- the program instructions recorded on the machine-readable recording medium may be those specially designed and configured for the present invention, or may be known and available to those skilled in the computer software arts.
- Examples of machine-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tape, optical recording media such as CD-ROMs, DVDs, Blu-rays, and magnetic-optical media such as floptical disks.
- magnetic-optical media and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like.
- program instructions include, but are not limited to storing and compiling or interpreting for execution on any one of the foregoing devices, as well as on a machine capable of executing a heterogeneous combination of a processor, processor architecture or combinations of different hardware and software, or any other program instructions.
- a structural programming language such as C
- an object-oriented programming language such as C ++
- a high or low level programming language asssembly, hardware description languages and database programming languages and technologies
- machine code This includes not only bytecode, but also high-level language code that can be executed by a computer using an interpreter.
- the methods and combinations described above when the methods and combinations described above are performed by one or more computing devices, the methods and combinations of methods can be implemented as executable code that performs each step.
- the method may be practiced as systems that perform the steps, and the methods may be distributed in various ways across the devices or all the functions may be integrated into one dedicated, standalone device or other hardware.
- the means for performing the steps associated with the processes described above may include any hardware and / or software described above. All such sequential combinations and combinations are intended to fall within the scope of this disclosure.
- the hardware device may be configured to operate as one or more software modules to perform a process according to the present invention, and vice versa.
- the hardware device may include a processor, such as an MPU, CPU, GPU, TPU, coupled with a memory, such as a ROM / RAM for storing program instructions, and configured to execute the instructions stored in the memory, the external device and the signal It may include a communication unit that can send and receive.
- the hardware device may include a keyboard, a mouse, and other external input devices for receiving instructions written by developers.
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Quality & Reliability (AREA)
- Surgery (AREA)
- Urology & Nephrology (AREA)
- Eye Examination Apparatus (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Ophthalmology & Optometry (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Molecular Biology (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
Abstract
본 발명은 안저 영상을 분류하는 방법 및 이를 이용한 장치에 관한 것이다. 구체적으로, 본 발명에 따른 방법에 의하면, 컴퓨팅 장치가, 상기 피검체의 안저 영상을 획득하고, 안저 영상의 분류 정보를 생성하며, 분류 정보에 기초하여 판독문을 생성하고, 판독문을 외부 엔티티에 제공한다.
Description
본 발명은 안저 영상을 분류하는 방법 및 이를 이용한 장치에 관한 것이다. 구체적으로, 본 발명에 따른 방법에 의하면, 컴퓨팅 장치가, 상기 피검체의 안저 영상을 획득하고, 안저 영상의 분류 정보를 생성하며, 분류 정보에 기초하여 판독문을 생성하고, 판독문을 외부 엔티티에 제공한다.
안저 영상은 질환을 진단하기 위한 비정상 병변들을 특정하기 위하여 안과의들이 이용하는 영상이다. 근래에 합성곱 신경망이 많은 성공적 사례를 남기고 있는데, 이는 당뇨망막병증(diabetic retinopathy) 및 당뇨황반부종(diabetic macular edema)과 같은 특정 질환의 정확한 진단을 목표로 하는 것에 불과하고, 그 진단 내용을 입증하는 적절한 병변 시각화 및 국소화(localization; 영상에서 관련 영역을 특정하는 것)는 제공되지 않는 단점이 있다. 본 개시서에서는 개별 소견의 내용을 분류할 수 있고, 동시에 병변들을 국소화할 수 있는 합성곱 신경망의 아키텍처를 제공하고자 한다. 본 발명자에 따르면, 그 신경망 아키텍처는 몇몇 소견들에서 더 나은 국소화 및 분류를 가능하게 하는 영역 주석(regional annotations)으로써 훈련될 수 있다.
안저 영상은 안구의 상태에 관한 시각적 단서를 풍부하게 제공한다. 분석에 있어서 안과의는 그 영상으로부터 소견(findings)이라 지칭되는 비정상적인 시각적 특징들을 찾고, 그 발견된 소견들에 기초하여 의학적 지식을 활용, 진단 내용을 결정한다. 예를 들어, 당뇨망막병증 (DR)의 중증도(severity)는 관련 소견들의 존재 및 범위에 의하여 임상적으로 판정된다{미세동맥류(microaneurysm), 출혈(hemorrhage), 경성삼출물(hard exudate) 및 면화반(cotton wool patch), 기타 등등}.
요즘 들어, 합성곱 신경망(convolutional neural network; CNN)이 DR 및 당뇨황반부종 (DME)를 진단하는 데 있어 직업 안과의의 수준에 도달하였다. 그런데, 문헌들에서 나타나는 CNN은 진단 내용을 직접 도출해내도록 훈련되었는데, 이는 실제 안과의가 진단하는 것과는 상이한 방식이다. 판정에 기여하는 소견들을 시각화하기 위한 여러 연구가 있었지만, 개별 소견들이 서로 구분되지 않았다.
종전에는 핸드크래프티드 특징 추출기(hand-crafted feature-extractors)를 이용한 분할 방법들이 출혈, 경성삼출물, 드루젠 침착물(drusen deposits) 및 면화반의 검출을 위하여 제안되었다. 그런데 경험적(heuristic) 특징-추출기들에는 표적 소견들의 시각적 속성들을 고려하는 인간 설계자의 편견이 담겨있어서 예측불가한 패턴들은 잘 검출되지 않는 등 실세계 적용에서는 그 성능이 심각하게 제한되었다. 분할 또는 검출을 위한 CNN은 성능을 향상시킬 수 있겠지만, 병변에 대한 수동적인 주석 달기는 굉장히 노동집약적인 것으로서, 특히 영상들에서 그 병변들이 분산되어 있을 때 더 그러하다. 따라서 데이터 수집의 절차가 매우 값비싸진다.
본 개시서에서는 안저 영상으로부터 소견에 관한 영역 주석을 수집할 수 있는 보다 저렴하고 효과적인 접근법을 제안하는 동시에, 표적 소견의 존재를 분류하고 병변들을 국소화할 수 있는 CNN 아키텍처를 제안하고자 한다.
선행기술문헌
(특허문헌 1) KR10-1848321 B
(특허문헌 2) KR10-1848322 B
본 발명은 안저 영상으로부터 영상의 판독 가능 여부, 정상 또는 비정상 여부 및 비정상에 대한 소견을 정확하게 가려낼 수 있을 뿐만 아니라 그 소견에 기초하여 판독문을 자동으로 생성하여 의료 현장에서의 편의를 제공하는 것을 일 목적으로 한다.
또한 본 발명은 영역적 단서를 통한 안내를 이용한 훈련을 통하여 소견에 대한 병변을 더 정확하게 국소화할 수 있을 뿐만 아니라 분류 성능도 향상시키는 것을 다른 목적으로 한다.
이를 위하여 본 발명은 영상에서의 편향 대신에 소견들에 대한 올바른 패턴들을 신경망으로 하여금 학습할 수 있도록 영역적 안내를 가능하게 하는 것을 목적으로 한다.
상기한 바와 같은 본 발명의 목적을 달성하고, 후술하는 본 발명의 특징적인 효과를 실현하기 위한 본 발명의 특징적인 구성은 하기와 같다.
본 발명의 일 태양(aspect)에 따르면, 피검체의 안저 영상을 분류하는 방법이 제공되는바, 그 방법은, (a) 컴퓨팅 장치가, 상기 피검체의 안저 영상을 획득하거나 상기 컴퓨팅 장치에 연동되는 타 장치로 하여금 획득하도록 지원하는 단계; (b) 상기 컴퓨팅 장치가, 상기 안저 영상의 분류 정보를 생성하거나 생성하도록 지원하는 단계; (c) 상기 컴퓨팅 장치가, 상기 분류 정보에 기초하여 판독문을 생성하거나 생성하도록 지원하는 단계; 및 (d) 상기 컴퓨팅 장치가, 상기 판독문을 외부 엔티티(entity)에 제공하거나 제공하도록 지원하는 단계를 포함한다.
본 발명의 다른 태양에 따르면, 본 발명에 따른 방법을 수행하도록 구현된 명령어(instructions)를 포함하는, 기계 판독 가능한 비일시적 기록 매체에 저장된, 컴퓨터 프로그램도 제공된다.
본 발명의 또 다른 태양에 따르면, 피검체의 안저 영상을 분류하는 컴퓨팅 장치가 제공되는바, 그 장치는, 상기 피검체의 안저 영상을 획득하는 통신부; 및 (i) 상기 안저 영상의 분류 정보를 생성하는 프로세스; (ii) 상기 분류 정보에 기초하여 판독문을 생성하는 프로세스; 및 (iii) 상기 판독문을 외부 엔티티(entity)에 제공하는 프로세스를 수행하거나 상기 통신부를 통하여 연동되는 타 장치로 하여금 수행하도록 지원하는 프로세서를 포함한다.
본 발명에 의하면, 안저 영상으로부터 산출한 소견에 기초하여 판독문을 자동으로 생성함으로써 편의가 제공되는 효과가 있다.
본 발명의 일 실시 예에 의하면, 영역적 단서를 통한 안내를 이용한 훈련으로써 신경망의 분류 성능이 향상되는 효과가 있다.
이와 같은 본 발명의 실시 예에 따른 효과는 안저 영상뿐만 아니라 널리 다양한 형식(modality)의 2차원 영상 또는 3차원 영상들에 적용될 수 있으며, 특히 종래에 병원에서 이용하고 있는 X-선 영상은 물론, 초음파 영상, CT 영상, MRI 영상 등의 시스템에도 그대로 활용될 수 있는바, 본 발명의 방법이 특정 형식의 영상이나 플랫폼에 종속되지 않음은 물론이다.
본 발명의 실시 예의 설명에 이용되기 위하여 첨부된 아래 도면들은 본 발명의 실시 예들 중 단지 일부일 뿐이며, 본 발명이 속한 기술분야의 통상의 기술자에게 있어서는 신규한 발명에 이르는 노력 없이도 이 도면들에 기초하여 다른 도면들이 얻어질 수 있다.
도 1은 본 발명에 따라 피검체의 안저 영상을 분류하는 방법(이하 "안저 영상 분류 방법"이라 함)을 수행하는 컴퓨팅 장치의 예시적 구성을 개략적으로 도시한 개념도이다.
도 2는 본 발명에 따른 안저 영상 분류 방법을 수행하는 컴퓨팅 장치의 하드웨어 또는 소프트웨어 구성요소를 도시한 예시적 블록도이다.
도 3은 본 발명에 따른 안저 영상 분류 방법을 예시적으로 나타낸 흐름도이다.
도 4는 본 발명의 안저 영상 분류 방법에 이용될 수 있는 사용자 인터페이스의 예시를 나타낸 도면이다.
도 5는 본 발명의 안저 영상 분류 방법에 따라 생성된 판독문을 외부 엔티티가 참조하게 할 수 있는 사용자 인터페이스의 일 예시를 나타낸 도면이다.
도 6은 본 발명의 일 실시 예에 따른 신경망 아키텍처의 일 예시를 나타낸 도면이다.
도 7은 본 발명의 일 실시 예에 따라 제공되는 신경망 아키텍처의 성능을 종래 방식에 따른 아키텍처와 비교한 결과를 나타낸 표이다.
도 8은 본 발명의 일 실시 예에 따라 제공되는 신경망 아키텍처의 성능을 종래 방식에 따른 아키텍처와 정성적으로 비교한 예시적 도면이다.
후술하는 본 발명에 대한 상세한 설명은, 본 발명의 목적들, 기술적 해법들 및 장점들을 분명하게 하기 위하여 본 발명이 실시될 수 있는 특정 실시 예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시 예는 통상의 기술자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다.
본 발명의 상세한 설명 및 청구항들에 걸쳐 이용된 "영상" 또는 "영상 데이터"라는 용어는 이산적 영상 요소들(예컨대, 2차원 영상에 있어서는 픽셀)로 구성된 다차원 데이터를 지칭하며, 달리 말하자면, (예컨대, 비디오 화면에 표시된) 눈으로 볼 수 있는 대상 또는 (예컨대, CT, MRI 검출기 등의 픽셀 출력에 대응되는 파일과 같은) 그 대상의 디지털 표현물을 지칭하는 용어이다.
예를 들어 "영상"은 전산화 단층 촬영(CT; computed tomography), 자기 공명 영상(MRI; magnetic resonance imaging), 초음파 또는 본 발명의 기술분야에서 공지된 임의의 다른 의료 영상 시스템의 의하여 수집된 피검체(subject)의 의료 영상일 수 있다. 영상이 반드시 의료적 맥락에서 제공되어야 하는 것은 아니고 비의료적 맥락에서 제공될 수도 있는바, 예를 들어 보안 검색용 X선 촬영 등이 있을 수 있다.
설명의 편의를 위하여 제시된 도면에서는 예시적인 일부의 영상 형식(modality)이 도시되어 있으나 통상의 기술자는 본 발명의 다양한 실시 예에서 이용되는 영상 형식들이 MRI, CT, PET(positron emission tomography), PET-CT, SPECT, SPECT-CT, MR-PET, 3D 초음파 영상 등등을 포함하나 예시적으로 열거된 형식에 한정되지 않는다는 점을 이해할 수 있을 것이다.
본 발명의 상세한 설명 및 청구항들에 걸쳐 'DICOM(Digital Imaging and Communications in Medicine; 의료용 디지털 영상 및 통신)' 표준은 의료용 기기에서 디지털 영상 표현과 통신에 이용되는 여러 가지 표준을 총칭하는 용어인바, DICOM 표준은 미국 방사선 의학회(ACR)와 미국 전기 공업회(NEMA)에서 구성한 연합 위원회에서 발표한다.
또한, 본 발명의 상세한 설명 및 청구항들에 걸쳐 '의료영상 저장 전송 시스템(PACS; Picture Archiving and Communication System)'은 DICOM 표준에 맞게 저장, 가공, 전송하는 시스템을 지칭하는 용어이며, X선, CT, MRI와 같은 디지털 의료영상 장비를 이용하여 획득된 의료영상 이미지는 DICOM 형식으로 저장되고 네트워크를 통하여 병원 내외의 단말로 전송이 가능하며, 이에는 판독 결과 및 진료 기록이 추가될 수 있다.
그리고 본 발명의 상세한 설명 및 청구항들에 있어 '국소화(localization)'라는 단어 및 그 변형은 위치의 파악, 특정 내지 구체화를 지칭하도록 의도된 것이다. 예를 들어 '영역을 국소화하다'는 그 영역의 위치를 구체화하는 것을 지칭한다.
그리고 본 발명의 상세한 설명 및 청구항들에 걸쳐, '포함하다'라는 단어 및 그 변형은 다른 기술적 특징들, 부가물들, 구성요소들 또는 단계들을 제외하는 것으로 의도된 것이 아니다. 또한, '하나' 또는 '한'은 하나 이상의 의미로 쓰인 것이며, '또 다른'은 적어도 두 번째 이상으로 한정된다.
통상의 기술자에게 본 발명의 다른 목적들, 장점들 및 특성들이 일부는 본 설명서로부터, 그리고 일부는 본 발명의 실시로부터 드러날 것이다. 아래의 예시 및 도면은 실례로서 제공되며, 본 발명을 한정하는 것으로 의도된 것이 아니다. 따라서, 특정 구조나 기능에 관하여 본 개시서에 개시된 상세 사항들은 한정하는 의미로 해석되어서는 아니되고, 단지 통상의 기술자가 실질적으로 적합한 임의의 상세 구조들로써 본 발명을 다양하게 실시하도록 지침을 제공하는 대표적인 기초 자료로 해석되어야 할 것이다.
더욱이 본 발명은 본 개시서에 표시된 실시 예들의 모든 가능한 조합들을 망라한다. 본 발명의 다양한 실시 예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시 예에 관련하여 본 발명의 사상 및 범위를 벗어나지 않으면서 다른 실시 예로 구현될 수 있다. 또한, 각각의 개시된 실시 예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 사상 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.
본 개시서에서 달리 표시되거나 분명히 문맥에 모순되지 않는 한, 단수로 지칭된 항목은, 그 문맥에서 달리 요구되지 않는 한, 복수의 것을 아우른다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
이제부터 설명하는 본 발명에 따른 방법의 검증에 이용된 황반 중심(macular-centered) 영상들에 대한 소견의 영역 주석은 대한민국 등록특허 제10-1848321호 및 제10-1848322호에 개시된 것과 같은 데이터 수집 시스템을 이용하여 수집되었다. 주석자(annotator)는 소정의 인터페이스를 통하여 소견의 유형을 선택하고 이에 대응되는 영역들을 선택할 수 있다. 안구가 정상인 경우에는 영상에 어떠한 소견의 주석도 달리지 않는다. 전술한 등록특허들에 개시된 내용과 같이 영상은 8개의 영역들로 분할될 수 있는바, 그 각각이 안구의 해부학적 구조 및 소견들의 영역적 특성들을 반영하고 있다. 예를 들어, 그러한 영역들은 황반 영역, 시신경 유두 상측 영역, 시신경 유두 하측 영역, 외측(temporal) 영역, 상외측(superotemporal) 영역, 하외측(inferotemporal) 영역, 상비측(superonasal) 영역 및 하비측(inferonasal) 영역를 포함할 수 있다.
도 1은 본 발명에 따른 안저 영상 분류 방법을 수행하는 컴퓨팅 장치의 예시적 구성을 개략적으로 도시한 개념도이다.
도 1을 참조하면, 본 발명의 일 실시 예에 따른 컴퓨팅 장치(100)는, 통신부(110) 및 프로세서(120)를 포함하며, 상기 통신부(110)를 통하여 외부 컴퓨팅 장치(미도시)와 직간접적으로 통신할 수 있다.
구체적으로, 상기 컴퓨팅 장치(100)는, 전형적인 컴퓨터 하드웨어(예컨대, 컴퓨터 프로세서, 메모리, 스토리지, 입력 장치 및 출력 장치, 기타 기존의 컴퓨팅 장치의 구성요소들을 포함할 수 있는 장치; 라우터, 스위치 등과 같은 전자 통신 장치; 네트워크 부착 스토리지(NAS; network-attached storage) 및 스토리지 영역 네트워크(SAN; storage area network)와 같은 전자 정보 스토리지 시스템)와 컴퓨터 소프트웨어(즉, 컴퓨팅 장치로 하여금 특정의 방식으로 기능하게 하는 명령어들)의 조합을 이용하여 원하는 시스템 성능을 달성하는 것일 수 있다.
이와 같은 컴퓨팅 장치의 통신부(110)는 연동되는 타 컴퓨팅 장치와 요청과 응답을 송수신할 수 있는바, 일 예시로서 그러한 요청과 응답은 동일한 TCP(transmission control protocol) 세션(session)에 의하여 이루어질 수 있지만, 이에 한정되지는 않는바, 예컨대 UDP(user datagram protocol) 데이터그램(datagram)으로서 송수신될 수도 있을 것이다. 덧붙여, 넓은 의미에서 상기 통신부(110)는 명령어 또는 지시 등을 전달받기 위한 키보드, 마우스, 기타 외부 입력장치, 프린터, 디스플레이, 기타 외부 출력장치를 포함할 수 있다.
또한, 컴퓨팅 장치의 프로세서(120)는 MPU(micro processing unit), CPU(central processing unit), GPU(graphics processing unit), NPU(neural processing unit) 또는 TPU(tensor processing unit), 캐시 메모리(cache memory), 데이터 버스(data bus) 등의 하드웨어 구성을 포함할 수 있다. 또한, 운영체제, 특정 목적을 수행하는 애플리케이션의 소프트웨어 구성을 더 포함할 수도 있다.
도 2는 본 발명에 따른 안저 영상 분류 방법을 수행하는 컴퓨팅 장치의 하드웨어 또는 소프트웨어 구성요소를 도시한 예시적 블록도이다.
도 2를 참조하여 본 발명에 따른 방법 및 장치의 구성을 간략히 개관하면, 컴퓨팅 장치(100)는 그 구성요소로서 영상 획득 모듈(210)을 포함할 수 있다. 이 영상 획득 모듈(210)은 본 발명에 따른 방법이 적용되는 의료 영상을 획득하도록 구성된다. 영상 판독 모듈(220)은 상기 영상 획득 모듈(210)에 의하여 획득된 안저 영상을 판독하는 데 이용된다.
도 2에 도시된 개별 모듈들은, 예컨대, 컴퓨팅 장치(100)에 포함된 통신부(110)나 프로세서(120), 또는 상기 통신부(110) 및 프로세서(120)의 연동에 의하여 구현될 수 있음은 통상의 기술자가 이해할 수 있을 것이다.
안저 영상은, 예를 들어, 통신부(110)를 통하여 연동되는 촬영 기기 또는 의료영상 저장 전송 시스템(PACS)과 같은 외부 영상 저장 시스템으로부터 획득되는 것일 수 있으나 이에 한정되지는 않는다. 예를 들어, 안저 영상은 (의료) 영상 촬영 기기에 의하여 촬영되어 DICOM 표준에 따라 PACS에 전송된 후 컴퓨팅 장치(100)의 영상 획득 모듈(210)에 의하여 획득될 수 있다.
영상 판독 모듈(220)의 모델에 대한 학습을 위하여, 안저 영상과 함께 그 안저 영상에 대한 레이블링 정보가 함께 획득될 수 있는데, 학습시에 이 안저 영상 및 레이블링 정보는 영상 판독 모듈(220)에 포함된 영상 판독 모델을 미리 훈련하는 데 이용된다. 레이블링 정보는, 안저 영상에 나타난 소견 및 그 소견에 해당되는 영역에 관한 정보를 포함할 수 있으며, 황반, 시신경 유두의 위치 등의 부가 정보도 포함할 수 있다.
이와 같은 훈련이 종료된 영상 판독 모델은 영상 판독 모듈(220)에서 안저 영상의 분류 정보를 생성하여 이를 판독문 생성 모듈(230) 및 결과 저장 및 출력 모듈(240)에 전달할 수 있는바, 판독문 생성 모듈(230)은, 그 분류 정보에 기초하여 판독문을 생성할 수 있으며, 결과 저장 및 출력 모듈(240)은 소정의 출력 장치, 예컨대 디스플레이에 표시된 사용자 인터페이스를 통하여 상기 안저 영상에 대한 분류 결과를 외부 엔티티(entity)에 제공할 수 있다. 사용자의 편의를 위하여 앞서 생성된 판독문의 편집이 가능한 판독문 편집 모듈(250)이 추가로 제공될 수도 있다.
여기에서 외부 엔티티라고 함은, 상기 컴퓨팅 장치(100)의 사용자, 관리자, 상기 안저 영상에 나타난 피검체를 담당하는 담당 의료진 등을 포함하나, 이 이외에도 그 안저 영상의 분류, 즉 판정(판독)을 필요로 하는 주체라면 어느 주체라도 포함되는 것으로 이해되어야 할 것이다.
도 2에 나타난 각각의 구성요소들의 구체적인 기능 및 효과에 관하여는 상세히 후술하기로 한다. 도 2에 나타난 구성요소들은 설명의 편의상 하나의 컴퓨팅 장치에서 실현되는 것으로 예시되었으나, 본 발명의 방법을 수행하는 컴퓨팅 장치(100)는 복수개의 장치들이 서로 연동되도록 구성될 수도 있으며, 이는 본 개시서에 첨부된 청구범위에 의하여 망라될 수 있다는 점이 이해될 것이다.
이제 본 발명에 따른 안저 영상 분류 방법의 일 실시 예를 도 3, 도 4 및 도 5를 참조하여 더 구체적으로 설명하기로 한다.
도 3은 본 발명에 따른 안저 영상 분류 방법을 예시적으로 나타낸 흐름도이며 도 4는 본 발명의 안저 영상 분류 방법에 이용될 수 있는 사용자 인터페이스의 예시를 개념적으로 나타낸 도면이다.
도 3을 참조하면, 본 발명에 따른 안저 영상 분류 방법은, 우선, 컴퓨팅 장치(100)에 의하여 구현되는 영상 획득 모듈(210)이, 피검체의 안저 영상을 획득하거나 컴퓨팅 장치(100)의 통신부(110)를 통하여 연동되는 타 장치(미도시)로 하여금 획득하도록 지원하는 단계(S100)를 포함한다.
다음으로, 본 발명에 따른 안저 영상 분류 방법은, 컴퓨팅 장치(100)에 의하여 구현되는 영상 판독 모듈(220)이, 상기 안저 영상의 분류 정보를 생성하거나 생성하도록 지원하는 단계(S200)를 더 포함한다. 여기에서 분류 정보는 안저 영상에 대한 소견에 해당하는데, 이 분류 정보를 지지하는 시각화 정보가 함께 생성될 수도 있다. 이 시각화 정보는 후술할 활성 맵(activation map)으로서 제공될 수도 있다.
일 실시예에서, 단계(S200)는, 구체적으로, 영상 판독 모듈(220)이, 상기 안저 영상의 판독 가능 여부를 판정하거나 통신부(110)를 통하여 상기 타 장치로 하여금 판정하도록 지원하는 단계(S220)를 포함한다.
도 4에 예시적으로 도시된 바와 같이, 본 발명에 따른 방법을 수행하기 위하여 제공되는 사용자 인터페이스를 통하여 안저 영상(405) 및 그 안저 영상에 대한 판독 가능 여부가 표시될 수 있다.
단계(S220)에서, 안저 영상이 판독 불가능하면, 판독 불가능 분류가 상기 분류 정보로서 생성될 수 있는데, 예를 들어, 도 4에 예시된 "Ungradable(판독 불가능)"의 표시(412)와 같을 수 있다.
도 4에 예시적으로 도시된 것을 참조하면, 사용자, 즉, 판독자의 편의를 위하여 피검체의 식별번호(Patient ID; 422), 나이(Age; 424), 성별(Sex; 426) 및 안저 영상의 양안 구분 정보(Laterality; 428) 중 적어도 하나를 포함하는 피검체(환자)의 정보가 사용자에게 제공될 수 있다. 또한, 다수의 피검체에 관한 목록(430)이 함께 제공될 수 있으며, 간단한 조작만으로 단계(S200)를 수행할 수 있도록 도 4의 "Analyze" 버튼(440)과 같은 소정의 인터페이스 요소가 제공될 수도 있다.
그리고, 단계(S200)는, 안저 영상이 판독 가능하면, 영상 판독 모듈(220)이, 상기 안저 영상이 정상인지 비정상인지를 판별한 정상 여부 정보를 상기 정상 여부 정보에 대한 신뢰 수준(confidential level)과 함께 상기 안저 영상으로부터 산출하거나 상기 타 장치로 하여금 산출하도록 지원하는 단계(S240)를 더 포함한다.
단계(S240)에서 안저 영상이 정상이면, 정상 분류가 상기 분류 정보로서 생성될 수 있다. 예를 들어, 도 4에 도시된 바와 같이, 안저 영상이 정상이면, "Normal(정상)"으로 표시하거나 이를 강조 표시(414)할 수 있다.
그 후, 단계(S200)는, 안저 영상이 비정상이면, 영상 판독 모듈(220)이, 안저 영상에서 검출되는 개별 소견에 대한 판독 결과 정보를 상기 개별 소견의 신뢰 수준과 함께 상기 분류 정보로서 생성하거나 상기 타 장치로 하여금 생성하도록 지원하는 단계(S260)를 더 포함한다.
단계(S260)에서 그 개별 소견에 대한 위치는 하기에서 그 산출 방식이 상술될 활성 맵(activation map)으로서 산출될 수 있는바, 도 4에서 참조부호 450으로 예시된 바와 같다.
이 도 4에는, 안저 영상이 비정상(Abnormal; 416)인 때에, 검출되는 개별 소견들의 목록이 Hemorrhage(460a), HardExudate(460b), Cotton Wool Patch(460c) 등으로 나타나 있으며, 선택된 개별 소견(예컨대, 도 4의 예시에서는 Hemorrhage)이 나타난 위치가 강조 표시될 수 있다. 예를 들어, 도면에는 선택된 소견에 대응되는 활성 맵(450)도 예시적으로 나타나 있다. 다만, 이와 같은 표시의 방식에 한정되지 않는바, 개별 소견들의 목록과 활성 맵을 표시하는 다양한 방식이 이용될 수 있음은 물론이다.
또한, 도 4에 예시적으로 도시된 바와 같이 사용자 인터페이스 상에 {예컨대, 토글(toggle)에 의하여} 영역을 구분하는 구획선을 표시하거나 숨길 수 있도록 소정의 인터페이스 요소(455)가 더 제공될 수 있다.
뿐만 아니라, 활성 맵 전체를 나타내고 숨길 수 있도록 사용자 인터페이스 상에 소정의 인터페이스 요소(456; 미도시)가 더 제공될 수도 있다.
상기 검출되는 개별 소견들의 목록(460a 내지 460c)이 표시되는 때에 그 개별 소견들이 나타난 영역의 정보(예컨대, "Macular"(황반 영역), "Temporal"(외측 영역))가 함께 표시될 수도 있으며, {예컨대, 토글에 의하여} 개별 소견 각각에 대한 활성 맵을 나타내고 숨길 수 있는 인터페이스 요소(457; 미도시)가 제공될 수 있음은 물론이다.
그리고, 검출되지 않는 개별 소견들의 목록(460d)도 도 4에 예시된 바와 같이 제공될 수도 있을 것이다.
한편, 단계(S260)에서는 개별 소견의 생성에 참조하기 위하여 대한민국 등록특허 제10-1848321호 및 제10-1848322호에 개시된 것과 같이 상기 안저 영상에서의 황반 및 시신경 유두의 위치가 자동으로 탐지될 수 있다. 덧붙여 황반 및 시신경 유두의 위치를 탐지하기 위하여 안출된 신경망 아키텍처로서 종래의 신경망에 비하여 우수한 성능을 가지는 예시적 신경망 아키텍처는 상세히 후술하기로 한다. 단계(S260)에서, 황반 및 시신경 유두의 위치가 탐지되면, 영상 판독 모듈(220)은, 이를 참조로 하여 상기 안저 영상의 영역을 (예컨대, 8개 영역으로) 분할하거나 상기 타 장치로 하여금 분할하도록 지원할 수 있다.
다시 도 3을 참조하면, 본 발명에 따른 안저 영상 분류 방법은, 단계(S200) 후에, 컴퓨팅 장치(100)에 의하여 구현되는 판독문 생성 모듈(230)이, 상기 분류 정보에 기초하여 판독문을 생성하거나 상기 타 장치로 하여금 생성하도록 지원하는 단계(S300)를 더 포함한다. 본 개시서에서 '판독문'은 문장의 형태로 표현된 것은 물론 간략하게 정보를 단어로 나열한 형태도 포함하는 것으로 의도된 용어이다.
앞서 단계(S260)가 수행된 실시 예에서는, 단계(S300)에서, 상기 분할된 영역에 기초하여 상기 개별 소견에 대한 위치를 나타내는 상기 판독문을 생성하거나 상기 타 장치로 하여금 생성하도록 지원할 수 있다.
여기에서 판독문은 그 초기값으로서, (i) 안저 영상이 정상인 경우에 대응되도록 제공되는 기본 판독문, 또는 (ii) 안저 영상이 비정상인 경우에 개별 소견에 대응되도록 제공되는 적어도 한 세트(set)의 복수개의 판독문 선택지 중에서 상기 분류 정보에 기초하여 선택된 결과인 선택형 판독문으로서 생성될 수 있다.
도 4를 참조하면, 안저 영상의 판독문(470)의 예시가 나타나 있는데, 예컨대, 안저 영상에서 발견되는 비정상 소견의 유형, 개별 소견의 명칭(예를 들어, 'hemorrhage', 'hard exudate' 등등), 그 신뢰 수준, 그 개별 소견이 관찰되는 영역의 명칭(예를 들어, 'macular', 'temporal' 등등) 중 적어도 하나 이상이 판독문의 정보에 포함될 수 있다.
예를 들어, 판독문에 포함되는 비정상 소견의 유형에는 '망막 이상', '녹내장 이상', '시신경 이상' 이 포함될 수 있고, 개별 소견에는 출혈, 경성삼출물, 면화반, 드루젠 및 드루제노이드 침착물(drusen & drusenoid deposits), 망막색소변화(retinal pigmentary change)이 포함될 수 있으나, 이에 한정되지 않으며, 황반원공(macular hole), 혈관 비정상(vascular abnormality), membrane, fluid accumulation, chroioretinal atrophy/scar, 맥락막 병변(choroidal lesion), 유수신경섬유(myelinated nerve fiber), 망막신경섬유층결손(RNFL defect), galucomatous disc change, non-glaucomatous disc change, 기타 소견 또는 아티팩트(artifact) 등이 있을 수 있다.
단계(S300)에서 판독문이 생성되면, 본 발명에 따른 안저 영상 분류 방법은, 그 다음, 컴퓨팅 장치(100)에 의하여 구현되는 결과 저장 및 출력 모듈(240)이, 상기 판독문을 외부 엔티티에 제공하거나 상기 타 장치로 하여금 제공하도록 지원하는 단계(S400)를 더 포함하는바, 예컨대, 이와 같은 참조를 위하여 도 4의 예시적 인터페이스에서와 같이 참조("refer"; 490) 버튼이 제공될 수도 있다.
도 5는 본 발명의 안저 영상 분류 방법에 따라 생성된 판독문을 외부 엔티티가 참조하게 할 수 있도록 제공되는 사용자 인터페이스의 일 예시를 나타낸 도면이다. 도 5을 참조하면, 각 분야의 전문가로 하여금 외부 엔티티로서 본 발명의 방법에 따른 결과인 판독 결과 정보와 판독문을 참조하도록 요청할 수 있게 하는 사용자 인터페이스가 예시되어 있는바, 예컨대, 외부 엔티티의 일람으로서, 전문 분야, 성명, 직위, 소속, 참조 가능한 횟수, 참조한 횟수 등등이 사용자 인터페이스 상에 제공될 수 있을 것이다.
한편, 생성된 판독문은 수정 혹은 편집되어야 할 필요성도 있을 것이므로, 본 발명에 따른 안저 영상 분류 방법은, 단계(S400) 후에, 컴퓨팅 장치(100)에 의하여 구현되는 판독문 편집 모듈(250)이 소정의 사용자 인터페이스를 제공함으로써 그 사용자 인터페이스를 통하여 사용자로 하여금 상기 판독문을 편집 또는 수정할 수 있도록 지원하는 단계(S500)를 더 포함할 수 있다. 단계(S500)에서는 수정 입력이 획득되면, 판독문 편집 모듈(250)이 그 수정 입력에 응하여 상기 판독문을 수정하거나 상기 타 장치로 하여금 수정하도록 지원할 수 있다.
예를 들어, 개별 소견이 판독문에 반영되거나 반영되지 않도록 선택할 수 있는 소정의 인터페이스 요소{예컨대, 도 4에 예시된 바와 같은 체크 버튼(462a, 462b, 462c)}의 조작이 상기 수정 입력으로서 획득되면, 이에 따라 상기 판독문이 수정될 수 있다.
그리고, 예를 들어, 검출되지 않은 개별 소견들의 목록(460d)에 포함된 개별 소견에 관련한 조작(예컨대, 도 4에서와 같이 희미하게 표시된 개별 소견의 명칭을 클릭하는 조작 등)에 의하여, 검출되지 않은 개별 소견들의 목록에 포함되었던 개별 소견을 검출된 것으로 전환하는 것이 가능할 수 있다.
또한, 예를 들어, 상기 수정 입력을 위하여 도 4의 예시에서와 같이 판독문의 내용 전체를 삭제하기 위한 삭제("clear"; 482) 버튼, 현재 제공된 판독문의 내용을 저장하고 다음 피검체에 대하여 본 발명의 방법을 수행하기 위한 저장 및 다음 피검체 열람 버튼("save&next"; 484) 버튼이 제공될 수도 있다. 판독문에 포함된 개별 소견에 관한 내용을 삭제하기 위한 개별 삭제 요소(474)가 제공될 수도 있음은 물론이다.
본 개시서에서 이용되는 사용자 인터페이스의 일 예시로서, 그래픽 사용자 인터페이스(graphical user interface; GUI)는 디스플레이 프로세서(display processor)에 의하여 생성된 하나 이상의 디스플레이 영상들(display images)을 포함하는바, 이는 프로세서 또는 다른 장치와의 사용자 상호작용(user interaction) 및 연관된 데이터 획득 및 프로세싱 기능들을 가능하게 하는 것이다. 또한 상기 GUI는 실행 가능한 프로시저 또는 실행 가능한 애플리케이션을 포함한다. 상기 실행 가능한 프로시저 또는 실행 가능한 애플리케이션은 조건에 따라 상기 디스플레이 프로세서로 하여금 상기 GUI 디스플레이 영상들을 표현하는 신호들을 생성한다. 이 신호들은 상기 사용자가 보기 위한 영상들 디스플레이하는 디스플레이 장치에 전달된다. 상기 프로세서는 실행 가능한 프로시저 또는 실행 가능한 애플리케이션의 제어 하에 입력 장치들로부터 수신된 신호들에 응하여 상기 GUI 디스플레이 영상들을 조작(manipulate)한다. 이러한 방식으로, 사용자는 입력 장치들을 이용하여 상기 디스플레이 영상과 상호작용할 수 있는바, 상기 프로세서 또는 다른 장치와의 사용자 상호작용이 가능해짐을 통상의 기술자는 이해할 수 있을 것이다.
본 발명에서 언급되는 사용자는 단수만을 지칭하는 것이 아니라 의료 영상 및 그 관련 데이터를 풍부하고 중첩적으로 획득하기 위한 목적으로 복수의 사용자를 지칭할 수도 있는바, 이에는 안저 영상의 학습 또는 임상에서의 실제 사용에 있어서 안저 영상의 무결성(integrity)을 확보하기 위한 목적이 있을 수 있다.
본 발명에 따른 방법에 이용되는 영상 판독 모듈(220)의 판독 모델로는 다양한 종류의 분류기(classifier)가 이용될 수 있는데, 예컨대, 딥 러닝 모델, 랜덤 포레스트, 베이지안 영상 획득 모듈 등일 수 있다. 아래에서는 본 발명자들에 의하여 판독 모델로 이용된 예시적 신경망 아키텍처를 도 6을 참조하여 설명한다.
본 발명의 예시적 신경망 아키텍처. 도 6은 본 발명의 일 실시 예에 따른 신경망 아키텍처의 일 예시를 나타낸 도면이다.
도 6에 도시된 바와 같이 본 발명의 일 실시 예에 따른 신경망 아키텍처는 레지듀얼 층(residual layer; 612, 622, 632, 640, 658, 670)(residual unit 후의 특징 맵들), 리덕션 층(reduction layer; 614, 616, 624, 626, 628, 633, 634, 635, 636){스트라이드 2의 3x3 합성곱, 배치-노름(batch-norm), ReLU 후의 특징 맵들}, 평균 풀링 층(652, 654, 656), 아트러스 피라미드 풀링 층(atrous pyramid pooling layer; 660) 및 1x1 합성곱(깊이=1; 680) 층을 포함할 수 있다. 여기에서 레지듀얼 층 혹은 레지듀얼 유닛(residual unit)은 {합성곱, 배치-노름(batch-norm), ReLU} x 2에 입력층이 출력층에 더해진 특징 맵들을 지칭한다.
층이 깊어질수록 합성곱 블록(convolution block; 610, 620, 630) 각각을 이루는 층 개수가 단조 증가하도록 하는 것이 유리하다. 개수가 같거나 더 적은 경우에는 동일 파라미터를 가지는 때에 성능이 낮아지는 경향이 있다. 한편, 도 6의 예에서는 합성곱 블록의 총 개수가 3개인 것으로 도시되었으나 그보다 많은 개수도 무방하다.
높이 및 폭이 절반이 되면 층들의 깊이는 두 배가 된다. 상이한 크기를 가진 첫 4개 또는 그 이상의 리덕션 층들은 평균 풀링과 결합(concatenation)되어 저수준 특징과 고수준 특징을 모두 활용한다. 즉, 실시 예의 신경망 아키텍처에 의하면 복수의 합성곱을 거쳐 특징을 추출한 후에 크기를 조절하면서 정보를 압축하는 연산(예컨대, 평균 풀링)으로 해상도를 동일하게 맞춰주어 깊이 방향으로 결합(concatenation)함으로써 다양한 수준의 특징들을 추출할 수 있다. 도 6의 예시를 참조하면, 참조부호 612, 622, 632의 리덕션 층은 해상도를 조절하여 각각 참조부호 652, 654, 656으로 결합되고, 여기에 참조부호 640의 리덕션 층이 결합된다.
그 후, 결합된 특징 맵들은 1, 2, 4, 8(큰 크기에 대한 소견들)의 확장률(dilation rate), 1, 2, 4(중간 크기에 대한 소견들)의 확장률, 또는 1, 2(작은 크기에 대한 소견들)의 확장률로 아트러스-피라미드-풀링(atrous-pyramid-pooled; 660)된다. 이는 효과적으로 2배로 수용 필드(receptive fields)를 키워나가기 위한 것이다. 즉, 아트러스 피라미드 풀링은 다양한 크기의 수용 필드로 특징들을 결합하기 위하여 채용되었다. 아트러스 풀링 층의 다음 층은 스트라이드 2의 합성곱으로 해상도를 2배 줄여 특징을 뽑아낸다.
마지막 층(680)은 1x1 합성곱 층으로서, 직전 층(670)의 1x1 합성곱을 연산하는바, 이는 분류 활성 맵(CAM; class activation map)에서와 같은 이전 특징 맵들의 선형 결합이라는 점이 주목된다. 시그모이드 함수로써 상기 층의 값들은 (0, 1)로 정규화되고, 따라서 후속의 층은 정규화된 활성 맵으로 간주될 수 있다. 본 발명자에 의한 활성 맵(690a)은 CAM과는 상이한데, 추가적인 손실 함수가 바람직한 영역들에서만 활성이 나타나도록 안내한다는 점에서 그러하다.
본 발명자에 의한 실험에서는 16x16 크기의 특징들을 결합하는 것이 가장 정확한 활성 맵(activation map)을 보여주었다. 바람직하게는 마지막 층은 8x8에서 32x32 사이의 크기가 될 수 있는데, 이는 1x1에 대응되는 실제 안저 영상에서의 크기가 유의미한 병변 식별 크기와 일치하도록 하기 위한 것이다.
또한, 1x1 합성곱 층은 한 쪽으로는 전역 평균-풀링(GAP; global average pooling)되고 시그모이드 함수로써 정규화됨으로써 분류 결과(classification result), 즉, 존재 여부를 고려하는 예측값이 산출된다. 1x1 합성곱 층은 다른 한 쪽으로는 시그모이드를 통하여 정규화된 활성 맵으로 된다. 따라서 활성 맵은 본 발명에 따른 신경망 아키텍처에서의 예측에 직접적으로 연관되며 시각화를 위한 외부의 별도 연산이 요구되지 않는다.
의료 영상에 있어 작은 병변 영역의 경우에는 활성 맵에서 같은 위치에 위양성으로서 활성이 생성되는 경우{편향(bias)이 나타남}가 있는데, 이를 방지하기 위하여 전역 평균-풀링(GAP) 전에 최대 풀링처럼 지정된 구역 내의 활성 값의 최댓값에 관한 비감소함수값을 출력하는 연산을 시행할 수 있다.
본 발명의 실시 예에 따른 목적 함수는 다음과 같다. 안저 영상 이 주어지면, 그 영상 I에서의 표적 소견의 존재는 로 인코딩되고, 존재 확률 이 신경망으로부터 출력된다. K개의 이미지가 미니 배치(mini-batch)로서 주어지는 때에, 도 6의 분류 손실에 대한 이진 교차 엔트로피는 아래 수학식 1과 같이 주어진다.
마지막 특징 맵들이 의 크기를 가지는 때에, 표적 소견 에 대한 영역 마스크(region mask; 690b)가 레이블로서 주어지고, 활성 맵()이 신경망으로부터 생성된다. 크기 k의 미니 매치를 가지고 도 6에서의 안내 손실(guidance loss)은 다음 수학식 2와 같이 주어진다.
여기에서 이고, 이며, 과 는 에 대하여 Mi 및 Ai의 l 번째 픽셀에서의 값이다. 인 때에 수치적인 안정성(numerical stability)을 위하여 로그의 안쪽에 이 추가된다는 점이 주목된다. 간명하게 설명하면, 안내 손실은 마스크의 값이 0인 영역들에서의 어떠한 활성도 억제하며, 마스크 내부의 활성에 대하여는 어떠한 영향도 미치지 않는다. 수학식 2에서 대신에 를 이용하여도 무방하다. 안내 손실은 마스크의 값이 0일 때 나오는 활성 값을 줄여주는 역할을 한다. W 값의 역전파 계산식은 이전 층의 출력값을 out이라고 했을 때, (1-a)*out인바, 각 픽셀의 활성 값인 a 값이 작을수록 커진다. 이는 분류 손실이 패턴을 찾아나가는 과정에서 변두리에 발생하는 아티팩트(artifact)를 제거하는 효과를 지닌다.
그렇다면, 전체의 손실값은 예컨대 이진 분류 엔트로피 등의 손실 함수를 이용한 분류 손실과, 이 분류 손실과의 절충용 하이퍼 파라미터인 λ를 곱한 안내 손실을 결합함으로써 얻어지는바, 아래 수학식 3과 같다.
다시 말하자면, λ는 2개의 목적 함수들의 균형을 잡기 위한 값이다.
성능의 검증을 위한 본 발명의 예시적 신경망 아키텍처의 구현례. 본 발명자들은 DR 및 DME (출혈, 경성삼출물, 드루젠, 면화반(CWP)), 황반원공(macular hole), membrane 및 망막신경섬유층결손(retinal nerve fiber layer defect; RNFL defect)와 연관된 임상적으로 중요한 소견들의 결과를 선택적으로 보이기로 하였다.
본 발명자들은 신경망 아키텍처의 성능을 측정하기 위한 용도로 주석자들의 전문지식에 기초하여 주석들을 훈련 세트와 테스트 세트로 분리하였다. 훈련 세트는 면허가 있는 27명의 안과의에 의하여 그 주석이 제공되었으며, 테스트 세트는 16명의 공인된 망막 전문가 및 9명의 공인된 녹내장 전문가에 의하여 그 주석이 제공되었다. 각각의 안저 영상은 총 3명의 안과의에 의하여 주석 처리되었으며, 훈련 세트와 테스트 세트에 포함된 영상의 총량은 각각 66,473과 15,451이었다.
훈련 세트는 도출 세트(derivation set) 90%와 검증 세트 10%로 나뉘었다. 본 발명에 따른 예시적 신경망 아키텍처의 모델은 검증 손실이 정체(stagnate)되고 악화(exacerbate)될 때까지 상기 도출 세트를 가지고 최적화되었다. 가장 낮은 검증 손실을 가지는 모델이 골드 스탠더드(gold standards)로 간주된 테스트 세트를 가지고 테스트되었다. 본 발명자들은 안과의 모두가 주석을 달지 않은 때에는 표적 소견이 없는 것으로 정하고, 안과의 3명 중 2명 이상이 주석을 단 경우에는 표적 소견이 존재하는 것으로 정하였다. 주석이 달린 영역들의 합집합은 훈련 중에 영역적 단서로서 제공되었다.
본 발명자들은 영역적 안내가 제공되거나 제공되지 않은 본 발명의 예시적 CNN 아키텍처들을 실험하고, AU-ROC(Area Under Receiver Operating Characteristic curve), 특이도, 민감도 및 영역적 단서에서의 활성(AIR)의 측면에서 그 결과들을 비교함으로써 상기 안내 손실의 효과를 측정하는 것을 목표로 하였다. AIR은 상기 영역적 단서들 내부의 활성들의 합산값을 모든 활성들의 합산값으로 나눈 값으로 정의된다. AIR은 영역적 단서들이 가용한 경우에 분류시 진양성 및 위음성 둘 모두에 대하여 측정되었다. 본 발명자들은 도 6에 예시적으로 도시된 신경망 아키텍처를 이용하여 수학식 3에서의 λ 값을 변경함으로써 영역적 안내가 있거나 없는 신경망을 구현하였다(λ=0인 때에는 영역적 안내가 없음).
실험에 쓰인 원본 컬러 안저 영상들은 안저(fundus) 부위가 중심에 오도록 절단(cropped)되어 검은 배경이 제거되었으며, 신경망 입력을 위한 512x512의 크기로 재조정되었다. 바람직하게는 256x256 내지 1024x1024 사이의 크기로 재조정될 수 있을 것이다. 영상을 이루는 픽셀들의 픽셀 값들은 255로 나누어서 [0,1] 범위로 오게 만드는데, 다른 전처리는 하지 않아도 무방하다. 충분히 많은 데이터가 주어진 상황에서 학습을 진행할 때에는 RGB(red-green-blue)의 경우 전처리를 전혀 하지 않고 픽셀 값의 범위만 제어(control)하는 것이 의미 있을 수 있다.
그 재조정된 영상들은 아핀 변환{뒤집기, 크기 변경, 회전, 평행이동, 전단(shear)}에 의하여 무작위적으로 데이터 확대(data-augmented)되었고, 그 강도(intensity)는 무작위적으로 스케일 조정(re-scaled)되었다. 가중치 및 편향치(biases)들은 사비에르 초기화(Xavier initialization)를 이용하여 초기화되었다. 본 발명자들은 최적화기(optimizer)로서, nestrov 모멘텀이 0.9이고 감쇠하는 학습률(decaying learning rate)를 가진 SGD를 이용하였다. 배치 크기는 작은 배치 크기가 일반화에 더 좋다는 추천에 따라 32로 정하였다. 또한 수학식 2에서 ε=10-3로 두어 수치적 안정성을 도모하였으며, 수학식 3에서 λ=1로 두어 분류 손실 및 안내 손실을 동일하게 취급하였다.
한편, 512x512 이상의 크기를 가진 영상에 대하여는 연속적인 스트라이드 2의 합성곱을 통하여 해상도를 절반으로 줄이는 것이 바람직한바, 이는 효율적인 계산을 하기 위한 것이다.
다만, 통상의 기술자들은 이와 같은 예시적 신경망에 나타난 구체적인 수치에 본 발명이 한정되지 않는다는 점을 이해할 수 있을 것이다.
본 발명의 예시적 신경망 아키텍처의 구현례에 의한 실험 결과. 도 7은 본 발명의 일 실시 예에 따라 제공되는 신경망 아키텍처의 성능을 종래 방식에 따른 아키텍처와 비교한 결과를 나타낸 표이다.
도 7에는 안내 손실이 도입된 모델과 안내 손실이 없는 모델 간의 성능을 비교한 결과가 표로서 요약되어 있다. 본 발명자은 모든 소견들에 걸쳐 TP (진양성) 및 FN (위음성)의 AIR에 대한 안내 손실의 긍정적 영향을 확인할 수 있었다. 이는 바람직한데, 신경망이 분류를 위한 영역적 단서 안에 주의를 기울일 수 있다는 점에서 그러하며, 따라서 신경망은 데이터세트의 편향들을 덜 학습하려는 경향을 보인다. 또한, FN보다 TP의 경우에 2개의 모델 간의 AIR의 차이가 더 크다. 이는 FN이 신경망의 분류가 어려운 경우들로 구성되는 반면 TP는 높은 신뢰도(confidence)로 상대적으로 쉽게 분류될 수 있기 때문에 합리적이다.
AU-ROC에 대하여는, 황반원공 및 망막신경섬유층결손에서만 현저한 개선이 이루어졌다. 이들 소견이 특정 영역들에서 관찰되므로 영역적 단서들에 의하여 가장 큰 이점이 나타나는 것은 흥미롭게 눈여겨 볼 만하다. 이는 분류에 중요한 영역들에 신경망이 주의를 기울일 수 있도록 안내됨으로써 학습이 더 쉬워진다는 것으로 설명될 수 있다. 한편, 출혈, 경성삼출물 및 드루젠 과 같은 광범위한 면적에 걸쳐 분산된 소견들은 분류에 있어서 영역적 단서의 이점을 거의 누리지 못할 수 있다. 본 발명자는 이들 소견들이 넓은 영역적 단서를 가져 안내가 다소 잉여적인데, 병변이 작으면 안내가 더 중요해질 것이라고 짐작한다. AU-ROC가 더 높은 때에는 민감도도 더 높고, 특이도가 더 낮은 것으로 관측된다. 그런데 황반원공 및 망막신경섬유층결손에 대해서는 현저한 차이가 보인다.
도 8은 본 발명의 일 실시 예에 따라 제공되는 신경망 아키텍처의 성능을 종래 방식에 따른 아키텍처와 정성적으로 비교한 예시적 도면이다.
도 8에는 안내 손실이 있는(with) 신경망과 없는(without) 신경망의 활성 맵들이 서로 비교되어 있다. 원본 영상 위에 중첩되기 전에 활성 맵들은 이중 선형 보간에 의하여 업스케일(upscaled)되고, 자연스러운 시각화를 위하여 32x32 가우시안 필터로써 블러링(blurred)되며, [0, 1]로 정규화된다. 도면에 명확하게 나타난 바와 같이 영역적 단서를 가지고 훈련되는 때에 신경망이 더 정확한 활성 맵을 생성한다. 픽셀별로 분할될 정도로 두드러지게 분할되지 않았고 몇몇 경우에 있어서는 소수의 위양성이 나타났더라도 본 발명에 의하여 도출된 활성 맵들은 임상의에게 유익하게 이용될 수 있는 소견의 위치에 관한 유의미한 정보를 제공한다. 안내 손실 없이는 활성 맵들은 병변의 주변부보다 훨씬 크게 퍼지고 종종 관련 없는 구역들을 강조한다.
전술한 바와 같이 본 발명은 그 모든 실시 예 및 변형례에 걸쳐, 국소화 및 분류를 위하여 안저 영상들에서의 소견에 관한 영역적 정보를 활용하고 있다. 소견들에 관한 영역적 주석을 수집할 수 있는 효과적인 레이블링이 가능해졌으므로 병변들의 국소화와 함께 소견들을 분류할 수 있는 신경망 아키텍처가 제안될 수 있었으며, 이로써 의료진 등의 사용자가 안저 영상 등의 의료 영상을 이용하는 의료 현장에서의 의료 워크플로가 개선될 수 있을 것이다.
위 실시 예의 설명에 기초하여 해당 기술분야의 통상의 기술자는, 본 발명의 방법 및/또는 프로세스들, 그리고 그 단계들이 하드웨어, 소프트웨어 또는 특정 용례에 적합한 하드웨어 및 소프트웨어의 임의의 조합으로 실현될 수 있다는 점을 명확하게 이해할 수 있다.
위에서 설명된 기능들 및 프로세스 단계들은 자동으로 수행되거나 전부 또는 일부 사용자 명령(user command)에 대한 응답으로서 수행될 수 있다. 자동으로 수행되는 (단계를 포함하는) 작용(activity)은 상기 작용의 사용자에 의한 직접 개시(direct initiation) 없이 하나 이상의 실행 가능한 명령어들(instructions) 또는 장치 작동(device operation)에 대한 응답으로서 수행된다.
상기 하드웨어는 범용 컴퓨터 및/또는 전용 컴퓨팅 장치 또는 특정 컴퓨팅 장치 또는 특정 컴퓨팅 장치의 특별한 모습 또는 구성요소를 포함할 수 있다. 상기 프로세스들은 내부 및/또는 외부 메모리를 가지는, 하나 이상의 마이크로프로세서, 마이크로컨트롤러, 임베디드 마이크로컨트롤러, 프로그래머블 디지털 신호 프로세서 또는 기타 프로그래머블 장치에 의하여 실현될 수 있다. 게다가, 혹은 대안으로서, 상기 프로세스들은 주문형 집적회로(application specific integrated circuit; ASIC), 프로그래머블 게이트 어레이(programmable gate array), 프로그래머블 어레이 로직(Programmable Array Logic; PAL) 또는 전자 신호들을 처리하기 위해 구성될 수 있는 임의의 다른 장치 또는 장치들의 조합으로 실시될 수 있다. 더욱이 본 발명의 기술적 해법의 대상물 또는 선행 기술들에 기여하는 부분들은 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 기계 판독 가능한 기록 매체에 기록될 수 있다. 상기 기계 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 기계 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 분야의 통상의 기술자에게 공지되어 사용 가능한 것일 수도 있다. 기계 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD, Blu-ray와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령어의 예에는, 전술한 장치들 중 어느 하나뿐만 아니라 프로세서, 프로세서 아키텍처 또는 상이한 하드웨어 및 소프트웨어의 조합들의 이종 조합, 또는 다른 어떤 프로그램 명령어들을 실행할 수 있는 기계 상에서 실행되기 위하여 저장 및 컴파일 또는 인터프리트될 수 있는, C와 같은 구조적 프로그래밍 언어, C++ 같은 객체지향적 프로그래밍 언어 또는 고급 또는 저급 프로그래밍 언어(어셈블리어, 하드웨어 기술 언어들 및 데이터베이스 프로그래밍 언어 및 기술들)를 사용하여 만들어질 수 있는바, 기계어 코드, 바이트코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 이에 포함된다.
따라서 본 발명에 따른 일 태양에서는, 앞서 설명된 방법 및 그 조합들이 하나 이상의 컴퓨팅 장치들에 의하여 수행될 때, 그 방법 및 방법의 조합들이 각 단계들을 수행하는 실행 가능한 코드로서 실시될 수 있다. 다른 일 태양에서는, 상기 방법은 상기 단계들을 수행하는 시스템들로서 실시될 수 있고, 방법들은 장치들에 걸쳐 여러 가지 방법으로 분산되거나 모든 기능들이 하나의 전용, 독립형 장치 또는 다른 하드웨어에 통합될 수 있다. 또 다른 일 태양에서는, 위에서 설명한 프로세스들과 연관된 단계들을 수행하는 수단들은 앞서 설명한 임의의 하드웨어 및/또는 소프트웨어를 포함할 수 있다. 그러한 모든 순차 결합 및 조합들은 본 개시서의 범위 내에 속하도록 의도된 것이다.
예를 들어, 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다. 상기 하드웨어 장치는, 프로그램 명령어를 저장하기 위한 ROM/RAM 등과 같은 메모리와 결합되고 상기 메모리에 저장된 명령어들을 실행하도록 구성되는 MPU, CPU, GPU, TPU와 같은 프로세서를 포함할 수 있으며, 외부 장치와 신호를 주고 받을 수 있는 통신부를 포함할 수 있다. 덧붙여, 상기 하드웨어 장치는 개발자들에 의하여 작성된 명령어들을 전달받기 위한 키보드, 마우스, 기타 외부 입력장치를 포함할 수 있다.
이상에서 본 발명이 구체적인 구성요소 등과 같은 특정 사항들과 한정된 실시 예 및 도면에 의해 설명되었으나, 첨부된 도면들의 시스템 및 프로세스들은 배타적인 것이 아니다. 다른 시스템들, 프로세스들 및 메뉴들이 동일한 목적을 달성하기 위하여 본 발명의 원리에 따라 도출될 수 있다. 비록 본 발명이 특정 실시 예들을 참조하여 설명되었지만, 본 개시서에서 도시되고 설명된 실시 예들 및 변형례들이 설명을 위한 목적만을 가진 것임이 이해될 것이다. 본 발명의 보호범위에서 일탈됨 없이 본 개시서의 설계에 대한 변경물이 통상의 기술자에 의하여 구현될 수 있을 것이다. 본 개시서에서 설명된 바와 같이 다양한 시스템들, 부수 시스템들, 에이전트들(agents), 관리자들(managers) 및 프로세스들이 하드웨어 구성요소, 소프트웨어 구성요소 및/또는 그것들의 조합을 이용하여 구현될 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시 예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등하게 또는 등가적으로 변형된 모든 것들은 본 발명의 사상의 범주에 속한다고 할 것이다.
그와 같이 균등하게 또는 등가적으로 변형된 것에는, 예컨대 본 발명에 따른 방법을 실시한 것과 동일한 결과를 낼 수 있는, 논리적으로 동치(logically equivalent)인 방법이 포함될 것인바, 본 발명의 진의 및 범위는 전술한 예시들에 의하여 제한되어서는 아니되며, 법률에 의하여 허용 가능한 가장 넓은 의미로 이해되어야 한다.
Claims (10)
- 피검체의 안저 영상을 분류하는 방법에 있어서,(a) 컴퓨팅 장치가, 상기 피검체의 안저 영상을 획득하거나 상기 컴퓨팅 장치에 연동되는 타 장치로 하여금 획득하도록 지원하는 단계;(b) 상기 컴퓨팅 장치가, 상기 안저 영상의 분류 정보를 생성하거나 생성하도록 지원하는 단계;(c) 상기 컴퓨팅 장치가, 상기 분류 정보에 기초하여 판독문을 생성하거나 생성하도록 지원하는 단계; 및(d) 상기 컴퓨팅 장치가, 상기 판독문을 외부 엔티티(entity)에 제공하거나 제공하도록 지원하는 단계를 포함하는 안저 영상 분류 방법.
- 제1항에 있어서,상기 분류 정보는 상기 분류 정보를 지지하는 시각화 정보와 함께 생성되는 것을 특징으로 하는 안저 영상 분류 방법.
- 제1항에 있어서,상기 (b) 단계는,(b1) 상기 컴퓨팅 장치가, 상기 안저 영상의 판독 가능 여부를 판정하거나 판정하도록 지원하는 단계;(b2) 상기 안저 영상이 판독 가능하면, 상기 컴퓨팅 장치가, 상기 안저 영상으로부터 상기 안저 영상이 정상인지 비정상인지를 판별한 정상 여부 정보를 상기 정상 여부 정보에 대한 신뢰 수준(confidential level)과 함께 산출하거나 산출하도록 지원하는 단계; 및(b3) 상기 안저 영상이 비정상이면, 상기 컴퓨팅 장치가, 상기 안저 영상에서 검출되는 개별 소견에 대한 판독 결과 정보를 상기 개별 소견의 신뢰 수준과 함께 상기 분류 정보로서 생성하거나 생성하도록 지원하는 단계를 포함하는 안저 영상 분류 방법.
- 제3항에 있어서,상기 (b3) 단계에서,상기 개별 소견에 대한 위치가 활성 맵으로서 산출되는 것을 특징으로 하는 안저 영상 분류 방법.
- 제3항에 있어서,상기 (b3) 단계에서,상기 안저 영상에서 황반 및 시신경 유두의 위치가 자동으로 탐지되는 것을 특징으로 하는 안저 영상 분류 방법.
- 제5항에 있어서,상기 (b3) 단계에서,상기 컴퓨팅 장치가, 탐지된 상기 황반 및 상기 시신경 유두의 위치를 참조로 하여 상기 안저 영상의 영역을 분할하거나 분할하도록 지원하는 것을 특징으로 하는 안저 영상 분류 방법.
- 제6항에 있어서,상기 (c) 단계에서,상기 분할된 영역에 기초하여 상기 개별 소견에 대한 위치를 나타내는 상기 판독문을 생성하거나 생성하도록 지원하는 것을 특징으로 하는 안저 영상 분류 방법.
- 제1항에 있어서,(e) 상기 컴퓨팅 장치가, 소정의 인터페이스를 제공함으로써 상기 인터페이스를 통하여 상기 컴퓨팅 장치의 사용자로 하여금 상기 판독문을 편집 또는 수정할 수 있도록 지원하는 단계를 더 포함하는 안저 영상 분류 방법.
- 컴퓨팅 장치로 하여금, 제1항 내지 제8항 중 어느 한 항의 방법을 수행하도록 구현된 명령어(instructions)를 포함하는, 기계 판독 가능한 비일시적 기록 매체에 저장된, 컴퓨터 프로그램.
- 피검체의 안저 영상을 분류하는 컴퓨팅 장치에 있어서,상기 피검체의 안저 영상을 획득하는 통신부; 및(i) 상기 안저 영상의 분류 정보를 생성하는 프로세스; (ii) 상기 분류 정보에 기초하여 판독문을 생성하는 프로세스; 및 (iii) 상기 판독문을 외부 엔티티(entity)에 제공하는 프로세스를 수행하거나 상기 통신부를 통하여 연동되는 타 장치로 하여금 수행하도록 지원하는 프로세서를 포함하는 안저 영상 분류 장치.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US17/059,868 US12008748B2 (en) | 2018-05-31 | 2019-04-10 | Method for classifying fundus image of subject and device using same |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR20180062475 | 2018-05-31 | ||
| KR10-2018-0062475 | 2018-05-31 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2019231102A1 true WO2019231102A1 (ko) | 2019-12-05 |
Family
ID=68698657
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/KR2019/004288 Ceased WO2019231102A1 (ko) | 2018-05-31 | 2019-04-10 | 피검체의 안저 영상을 분류하는 방법 및 이를 이용한 장치 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US12008748B2 (ko) |
| WO (1) | WO2019231102A1 (ko) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11132799B2 (en) * | 2018-04-13 | 2021-09-28 | Bozhon Precision Industry Technology Co., Ltd. | Method and system for classifying diabetic retina images based on deep learning |
| CN114359588A (zh) * | 2021-12-03 | 2022-04-15 | 深圳大学 | 类激活图生成方法、神经网络可解释方法及相关装置 |
| CN115496954A (zh) * | 2022-11-03 | 2022-12-20 | 中国医学科学院阜外医院 | 眼底图像分类模型构建方法、设备及介质 |
| EP4198886A4 (en) * | 2020-08-17 | 2024-02-14 | Casio Computer Co., Ltd. | FEATURE SET DETECTION DEVICE, SIMILAR IMAGE SEARCH DEVICE, DISPLAY DEVICE, FEATURE SET DETECTION METHOD, SIMILAR IMAGE SEARCH METHOD, DISPLAY METHOD AND PROGRAM |
| CN120126204A (zh) * | 2025-05-14 | 2025-06-10 | 中南大学 | 基于多模态数据的新生儿眼底图像分类方法及成像方法 |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108846355B (zh) * | 2018-06-11 | 2020-04-28 | 腾讯科技(深圳)有限公司 | 图像处理方法、人脸识别方法、装置和计算机设备 |
| US11113577B1 (en) * | 2020-02-27 | 2021-09-07 | GE Precision Healthcare LLC | Systems and methods for detecting laterality of a medical image |
| TWI817121B (zh) * | 2021-05-14 | 2023-10-01 | 宏碁智醫股份有限公司 | 分類老年性黃斑部退化的程度的分類方法和分類裝置 |
| WO2023017875A1 (ko) * | 2021-08-12 | 2023-02-16 | 고려대학교 산학협력단 | 안저영상을 기초로 생체 계측치를 예측하는 장치 및 방법 |
| CN113887662B (zh) * | 2021-10-26 | 2024-11-08 | 北京理工大学重庆创新中心 | 一种基于残差网络的图像分类方法、装置、设备及介质 |
| KR20240159874A (ko) * | 2022-03-21 | 2024-11-07 | 주식회사 타이로스코프 | 학습된 모델을 이용한 질병 진단 방법 및 이를 수행하는 시스템 |
| US12514563B2 (en) * | 2022-11-04 | 2026-01-06 | Deep Breathe Inc. | System and method for detecting pneumothorax |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20130000576A (ko) * | 2011-06-23 | 2013-01-03 | 주식회사 인피니트헬스케어 | 안구검진 단말 및 방법 |
| KR20140108417A (ko) * | 2013-02-27 | 2014-09-11 | 김민준 | 영상정보를 이용한 건강 진단 시스템 |
| KR20150094080A (ko) * | 2014-02-10 | 2015-08-19 | 동명대학교산학협력단 | 의료용 영상 진단 장치 |
| KR101848322B1 (ko) * | 2017-10-27 | 2018-04-20 | 주식회사 뷰노 | 피검체에 대한 안저 영상의 소견 및 진단 정보의 생성을 위하여 판독을 지원하는 방법 및 이를 이용한 장치 |
| KR20180057420A (ko) * | 2016-11-22 | 2018-05-30 | 주식회사 루닛 | 약한 지도 학습 방식의 객체 인식 방법 및 장치 |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2008150840A1 (en) * | 2007-05-29 | 2008-12-11 | University Of Iowa Research Foundation | Methods and systems for determining optimal features for classifying patterns or objects in images |
| US10722115B2 (en) * | 2015-08-20 | 2020-07-28 | Ohio University | Devices and methods for classifying diabetic and macular degeneration |
| US11200665B2 (en) * | 2017-08-02 | 2021-12-14 | Shanghai Sixth People's Hospital | Fundus image processing method, computer apparatus, and storage medium |
| WO2019083129A1 (ko) * | 2017-10-27 | 2019-05-02 | 주식회사 뷰노 | 피검체에 대한 안저 영상의 판독을 지원하는 방법 및 이를 이용한 장치 |
| KR101848321B1 (ko) | 2017-10-27 | 2018-04-20 | 주식회사 뷰노 | 피검체에 대한 안저 영상의 판독을 지원하는 방법 및 이를 이용한 장치 |
| CN108596895B (zh) * | 2018-04-26 | 2020-07-28 | 上海鹰瞳医疗科技有限公司 | 基于机器学习的眼底图像检测方法、装置及系统 |
-
2019
- 2019-04-10 US US17/059,868 patent/US12008748B2/en active Active
- 2019-04-10 WO PCT/KR2019/004288 patent/WO2019231102A1/ko not_active Ceased
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20130000576A (ko) * | 2011-06-23 | 2013-01-03 | 주식회사 인피니트헬스케어 | 안구검진 단말 및 방법 |
| KR20140108417A (ko) * | 2013-02-27 | 2014-09-11 | 김민준 | 영상정보를 이용한 건강 진단 시스템 |
| KR20150094080A (ko) * | 2014-02-10 | 2015-08-19 | 동명대학교산학협력단 | 의료용 영상 진단 장치 |
| KR20180057420A (ko) * | 2016-11-22 | 2018-05-30 | 주식회사 루닛 | 약한 지도 학습 방식의 객체 인식 방법 및 장치 |
| KR101848322B1 (ko) * | 2017-10-27 | 2018-04-20 | 주식회사 뷰노 | 피검체에 대한 안저 영상의 소견 및 진단 정보의 생성을 위하여 판독을 지원하는 방법 및 이를 이용한 장치 |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11132799B2 (en) * | 2018-04-13 | 2021-09-28 | Bozhon Precision Industry Technology Co., Ltd. | Method and system for classifying diabetic retina images based on deep learning |
| EP4198886A4 (en) * | 2020-08-17 | 2024-02-14 | Casio Computer Co., Ltd. | FEATURE SET DETECTION DEVICE, SIMILAR IMAGE SEARCH DEVICE, DISPLAY DEVICE, FEATURE SET DETECTION METHOD, SIMILAR IMAGE SEARCH METHOD, DISPLAY METHOD AND PROGRAM |
| US12548286B2 (en) | 2020-08-17 | 2026-02-10 | Casio Computer Co., Ltd. | Feature amount acquisition device, similar image search device, display device, feature amount acquisition method, similar image search method, display method, and program |
| CN114359588A (zh) * | 2021-12-03 | 2022-04-15 | 深圳大学 | 类激活图生成方法、神经网络可解释方法及相关装置 |
| CN115496954A (zh) * | 2022-11-03 | 2022-12-20 | 中国医学科学院阜外医院 | 眼底图像分类模型构建方法、设备及介质 |
| CN120126204A (zh) * | 2025-05-14 | 2025-06-10 | 中南大学 | 基于多模态数据的新生儿眼底图像分类方法及成像方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| US12008748B2 (en) | 2024-06-11 |
| US20210219839A1 (en) | 2021-07-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| WO2019231102A1 (ko) | 피검체의 안저 영상을 분류하는 방법 및 이를 이용한 장치 | |
| WO2019231104A1 (ko) | 심층 신경망을 이용하여 영상을 분류하는 방법 및 이를 이용한 장치 | |
| CN113962311B (zh) | 知识数据和人工智能驱动的眼科多病种识别系统 | |
| KR101953752B1 (ko) | 심층 신경망을 이용하여 영상의 분류 및 국소화를 수행하는 방법 및 이를 이용한 장치 | |
| US8908946B2 (en) | Information processing apparatus and its control method and data processing system | |
| JP7525248B2 (ja) | 医用情報処理装置及び医用情報処理プログラム | |
| Derwin et al. | A novel automated system of discriminating Microaneurysms in fundus images | |
| KR20190105210A (ko) | 통합 의료 진단 서비스 제공 시스템 및 그 방법 | |
| JP6719421B2 (ja) | 学習データ生成支援装置および学習データ生成支援方法並びに学習データ生成支援プログラム | |
| US20110066635A1 (en) | Medical image information display apparatus, medical image information display method, and recording medium on which medical image information display program is recorded | |
| WO2019083129A1 (ko) | 피검체에 대한 안저 영상의 판독을 지원하는 방법 및 이를 이용한 장치 | |
| KR102015224B1 (ko) | 딥러닝 기반의 뇌출혈 및 뇌종양 병변 진단 방법 및 장치 | |
| WO2014030092A1 (en) | Automatic detection and retrieval of prior annotations relevant for an imaging study for efficient viewing and reporting | |
| CN110662476B (zh) | 信息处理装置、控制方法和程序 | |
| CN114420299B (zh) | 基于眼动测试的认知功能筛查方法、系统、设备和介质 | |
| WO2020231007A2 (ko) | 의료기계 학습 시스템 | |
| KR101919847B1 (ko) | 동일 피사체에 대하여 시간 간격을 두고 촬영된 영상 간에 동일 관심구역을 자동으로 검출하는 방법 및 이를 이용한 장치 | |
| CN116848588A (zh) | 医学图像中的健康状况特征的自动标注 | |
| KR102222509B1 (ko) | 의료 영상에 관한 판단을 보조하는 방법 및 이를 이용한 장치 | |
| WO2022045652A1 (ko) | 안질환 시야 손상 예후 예측 시스템 및 방법과 이를 위한 컴퓨터 프로그램 | |
| Li et al. | A weakly supervised deep learning approach for leakage detection in fluorescein angiography images | |
| KR102234139B1 (ko) | 심층 신경망을 이용하여 영상을 분류하는 방법 및 이를 이용한 장치 | |
| CN114913366B (zh) | 可解释性老年黄斑变性分类方法、装置及存储介质 | |
| JP2021020054A (ja) | 医用画像処理装置、方法及びプログラム | |
| WO2020130121A1 (ja) | 眼科診断装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 19811103 Country of ref document: EP Kind code of ref document: A1 |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| 122 | Ep: pct application non-entry in european phase |
Ref document number: 19811103 Country of ref document: EP Kind code of ref document: A1 |

