JP7699791B2 - Aiプロセッサ - Google Patents

Aiプロセッサ Download PDF

Info

Publication number
JP7699791B2
JP7699791B2 JP2020194733A JP2020194733A JP7699791B2 JP 7699791 B2 JP7699791 B2 JP 7699791B2 JP 2020194733 A JP2020194733 A JP 2020194733A JP 2020194733 A JP2020194733 A JP 2020194733A JP 7699791 B2 JP7699791 B2 JP 7699791B2
Authority
JP
Japan
Prior art keywords
mapping
cores
solutions
processor
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020194733A
Other languages
English (en)
Other versions
JP2022083341A (ja
Inventor
アブダラ アブデラゼク ベン
ホアン フアンクン
ナム カイン ダン
ソン ジャンニン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Aizu
Original Assignee
University of Aizu
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Aizu filed Critical University of Aizu
Priority to JP2020194733A priority Critical patent/JP7699791B2/ja
Publication of JP2022083341A publication Critical patent/JP2022083341A/ja
Application granted granted Critical
Publication of JP7699791B2 publication Critical patent/JP7699791B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Apparatus For Radiation Diagnosis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、AIプロセッサに関する。
昨今、SARS-CoV2ウイルス(以下、新型コロナウイルス)によって引き起こされるCOVID-19(以下、新型コロナウイルス感染症とも呼ぶ)が流行している。この新型コロナウイルスに感染しているか否かの検査を行うための標準的な方法は、例えば、患者由来の採取サンプルを使用する逆転写ポリメラーゼ連鎖反応(RT-PCR:Reverse Transcription Polymerase Chain Reaction)であり、60(%)から97(%)程度の感度を有している。また、新型コロナウイルスに感染しているか否かの検査を行うための別の方法としては、例えば、患者の肺を撮影したX線画像の解析があり、80(%)から90(%)程度の精度を有している。
ここで、上記のようなX線画像の解析が行われる場合、医師は、患者のX線画像を手動で1枚ずつ診断する必要があり、非効率的な診断処置の原因となっている。
そこで、各病院では、例えば、患者が新型コロナウイルスに感染しているか否かの診断や患者が肺炎になっているか否かの診断を機械学習モデル(以下、診断モデルとも呼ぶ)に行わせることによって、多くの患者についての効率的な診断処置を行う場合がある。
米国特許出願公開20200026992A1号明細書
Kun-Chih (Jimmy) Chen, Ting-Yi Wang, "NN-Noxim: High-Level Cycle-Accurate NoC-based Neural Networks Simulator", 2018 11th International Workshop on Network on Chip Architectures (NoCArc). Xiaoxiao Liu, Wei Wen, Xuehai Qian, Hai Li, Yiran Chen, "Neu-NoC: A High-efficient Interconnection Network for Accelerated Neuromorphic Systems", 2018 23rd Asia and South Pacific Design Automation Conference (ASP-DAC) Kun-Chih (Jimmy) Chen, Masoumeh Ebrahimi, Ting-Yi Wang, Yuch-Chi Yang, "NoC-based DNN Accelerator: A Future Design Paradigm", NOCS ’19, October 17-18, 2019, New York, NY, USA.
しかしながら、上記のような診断モデルを用いた診断は、診断モデルを実行するコンピュータの性能によって効率性が大きく異なる。そのため、病院等の医療現場では、例えば、上記のような診断モデルを用いた診断をより効率的に行うことが可能なAI(Artificial Intelligence)プロセッサの開発が求められている。
そこで、本発明の目的は、診断モデルを用いた診断をより効率的に行うAIプロセッサを提供することにある。
本発明の一態様におけるAIプロセッサは、複数の演算コアを有し、前記複数の演算コアの少なくともいずれかが、畳み込み層と全結合層とを有するCNN(Convolutional Neural Network)の機械学習モデルに含まれる複数のニューロンのそれぞれに対応付けられた計算プログラムを分割して前記複数の演算コアのそれぞれに割り当てるマッピング処理を実行し、前記複数の演算コアのそれぞれが、前記マッピング処理によって割り当てられた前記計算プログラムを実行し、前記マッピング処理では、前記複数の演算コア間における通信コストが所定の閾値以下になるように、遺伝的アルゴリズムによって前記計算プログラムを前記複数の演算コアに割り当てる。
本発明の一態様によれば、診断モデルを用いた診断をより効率的に行うことが可能になる。
図1は、従来の情報処理システム200の構成について説明する図である。 図2は、本実施の形態における情報処理システム100の構成について説明する図である。 図3は、本実施の形態におけるユーザインターフェースの例について説明する図である。 図4は、本実施の形態におけるユーザインターフェースの例について説明する図である。 図5は、本実施の形態におけるユーザインターフェースの例について説明する図である。 図6は、診断モデルMDの具体例について説明する図である。 図7は、診断モデルMDにおける更新処理について説明する図である。。 図8は、本実施の形態におけるAIプロセッサPRの具体例を説明する図である。 図9は、本実施の形態におけるマッピング処理について説明する図である。 図10は、本実施の形態におけるマッピング処理について説明する図である。 図11は、本実施の形態におけるマッピング処理について説明する図である。 図12は、本実施の形態におけるマッピング処理について説明する図である。 図13は、本実施の形態におけるマッピング処理について説明する図である。 図14は、本実施の形態におけるマッピング処理について説明する図である。 図15は、本実施の形態におけるマッピング処理について説明する図である。 図16は、本実施の形態におけるマッピング処理について説明する図である。 図17は、本実施の形態におけるマッピング処理について説明する図である。 図18は、本実施の形態におけるマッピング処理について説明する図である。 図19は、本実施の形態におけるマッピング処理について説明する図である。 図20は、本実施の形態におけるマッピング処理について説明する図である。 図21は、本実施の形態におけるマッピング処理について説明する図である。
以下、図面を参照して本発明の実施の形態について説明する。各実施の形態は、本発明のより良い理解のために準備されている。ただし、かかる実施の形態は、本発明の技術的範囲を限定するものではない。また、本発明の範囲は、特許請求の範囲及びこれと同等のものを網羅している。
[従来の情報処理システム]
初めに、従来の情報処理システム200について説明を行う。図1は、従来の情報処理システム200の構成について説明する図である。なお、以下、3つの病院(病院11、病院12及び病院1n)が存在する場合について説明を行うが、3つ以外の数の病院が存在するものであってもよい。
図1に示す情報処理システム200において、病院11では、医師が患者のX線画像21を分析することによって診断を行う。そして、医師は、例えば、病院11に設定された情報処理装置(図示しない)を用いることにより、各患者が新型コロナウイルス感染症に感染しているか否かの診断結果(例えば、感染者数、各感染者の重篤度及び死者数等)を示す患者情報31を定期的に生成し、生成した患者情報31を政府の情報処理装置4に送信する。
同様に、図1に示す例において、病院12では、医師が患者のX線画像22についての診断結果を示す患者情報32を生成し、生成した患者情報32を政府の情報処理装置4に送信する。また、病院1nでは、医師が患者のX線画像2nについての診断結果を示す患者情報3nを生成し、生成した患者情報3nを政府の情報処理装置4に送信する。
ここで、情報処理システム200では、病院11、病院12及び病院1nのそれぞれが他の病院と協調することができない。この場合、各医師は、X線画像についての診断を効率的に行うことができない。
[本実施の形態における情報処理システム]
次に、本実施の形態における情報処理システム100について説明を行う。図2は、本実施の形態における情報処理システム100の構成について説明する図である。また、図3から図5は、本実施の形態におけるユーザインターフェースの例について説明する図である。
図2に示す情報処理システム100において、病院11では、患者の携帯端末51から送信されたX線画像を病院11に設置された診断システム61に入力する。検知システム61は、例えば、携帯端末51から送信されたX線画像が新型コロナウイルスに感染した患者の画像である否かを判定する診断モデルを実行する情報処理装置である。そして、診断システム61は、携帯端末51から送信されたX線画像についての診断結果を携帯端末51に送信する。
同様に、図2に示す例において、病院12に設置された診断システム62では、携帯端末52から送信されたX線画像についての診断を行い、その診断結果を携帯端末52に送信する。また、病院1nに設置された診断システム6nでは、携帯端末5nから送信されたX線画像についての診断を行い、その診断結果を携帯端末5nに送信する。
これにより、病院11、病院12及び病院1nでは、X線画像についての診断に伴う医師の負担を軽減させることが可能になる。また、病院11、病院12及び病院1nでは、X線画像についての誤った診断の発生を防止することが可能になる。また、各医師は、例えば、図3に示すユーザインターフェースU1を閲覧することにより、各患者の診断状況をリアルタイムで確認することが可能になる。
また、病院11、病院12及び病院1nでは、診断モデルによる診断を行うことでX線画像についての診断を迅速に行うことが可能になり、携帯端末51、携帯端末52及び携帯端末5nに対して診断結果を迅速に通知することが可能になる。そのため、各患者は、例えば、図4に示すユーザインターフェースU2を閲覧することにより、X線画像についての診断結果を迅速に確認することが可能になる。
そして、診断システム61は、診断モデルによる診断結果(例えば、感染者数、各感染者の重篤度及び死者数等)を示す患者情報をリアルタイムに生成し、生成した患者情報を政府の情報処理装置4に送信する。
同様に、図2に示す例において、診断システム62及び診断システム6nのそれぞれは、診断モデルによる診断結果を示す患者情報をリアルタイムに生成して政府の情報処理装置4に送信する。
具体的に、診断システム61、診断システム62及び診断システム6nのそれぞれは、例えば、クラウドサーバ7に対して患者情報を送信する。そして、クラウドサーバ7は、例えば、診断システム61、診断システム62及び診断システム6nからリアルタイム情報8を生成し、生成したリアルタイム情報8を政府の情報処理装置4に送信する。
これにより、病院11、病院12及び病院1nは、政府の情報処理装置4に対して、最新の患者情報を迅速に送信することが可能になる。そのため、政府の担当者は、例えば、図5に示すユーザインターフェースU3を閲覧することにより、各患者についての診断結果を迅速に確認することが可能になる。
[診断モデルの具体例]
次に、診断システム61、診断システム62及び診断システム6nにおいて実行される診断モデルMDの具体例について説明を行う。図6は、診断モデルMDの具体例について説明する図である。
図6に示す診断モデルMDでは、入力層からX線画像が入力された場合、X線画像が新型コロナウイルスに感染していないこと(肺炎になっていないこと)を示すカテゴリーである「Normal」、または、X線画像が新型コロナウイルスに感染している疑いがあること(肺炎になっている疑いがあること)を示すカテゴリーである「Suspect」を出力する。
具体的に、図6に示す診断モデルMDは、例えば、ソフトマックス関数を用いることによってX線画像の分類を行う。また、図6に示す診断モデルMDは、例えば、以下の式(1)で表されるクロスエントロピー損失を損失関数Eとして用いる。
Figure 0007699791000001
式(1)においてw及びbは、診断モデルMDにおけるパラメータであり、y及びy´のそれぞれは、実際のラベル(正解のラベル)及び予測されたラベルをそれぞれ示す。図6に示す診断モデルMDでは、式(1)を利用することによって、実際のラベルと予測されたラベルとの間における損失関数Eを算出する。そして、診断モデルMDでは、確率的勾配縮小アルゴリズムや逆伝搬アルゴリズムを用いた損失関数Eの最小化が行われ、さらに、パラメータの最適化が行われる。
[診断モデルの更新]
次に、診断モデルMDの更新を行う処理(以下、更新処理とも呼ぶ)について説明を行う。図7は、診断モデルMDにおける更新処理について説明する図である。具体的に、図7(A)は、更新処理を説明するフローチャート図である。また、図7(B)は、更新処理の実行時における情報の送受信を説明する図である。なお、以下、図2で説明した診断システム61とクラウドサーバ7との間において行われる更新処理について説明を行う。
診断システム61は、病院11の患者から送信されたX線画像を含むデータセットを用いることによって、病院11における診断モデルMDの生成を予め行う。そして、診断システム61は、生成した診断モデルMDについてのパラメータ(例えば、以下の式(2)に示す勾配∇gL)をクラウドサーバ7に送信する(S1)。
Figure 0007699791000002
続いて、クラウドサーバ7は、例えば、診断システム61、診断システム62及び診断システム6nのそれぞれからパラメータを受信したことに応じて、受信したパラメータのそれぞれからグローバルパラメータ(例えば、以下の式(3)に示すグローバル勾配∇gG)を算出する(S2)。
さらに、クラウドサーバ7は、算出したグローバルパラメータを診断システム61、診断システム62及び診断システム6nのそれぞれに送信する(S3)。
Figure 0007699791000003
その後、診断システム61は、クラウドサーバ7から送信されたグローバルパラメータを受信したことに応じて、以下の式(4)及び式(5)に示すように、病院11における診断モデルMDのパラメータを更新する(S4)。
Figure 0007699791000004
Figure 0007699791000005
式(4)及び式(5)において、Wr及びbrのそれぞれは、r回目に行われたS1からS4の処理(r番目のトレーニングラウンド)における重み及びバイアスをそれぞれ示している。また、式(4)及び(5)において、ηは学習率を示している。
すなわち、情報処理システム100では、フェデレーテッドモデルラーニング(FML:Federated Model Laerning)によって、各病院の診断モデルMD(診断モデルMDのパラメータ)の生成を行う。
これにより、情報処理システム100は、各病院の患者についての個人情報を含むデータセットを他の病院等の外部に送信することなく、各病院の診断モデルMDの精度を高めることが可能になる。そのため、各病院の診断モデルMDは、各患者のプライバシーを守りつつ、新型コロナウイルスの診断を精度良く行うことが可能になる。
なお、S1からS4の処理は、各病院の診断モデルMDのそれぞれの判定精度が必要な条件を上回るまで繰り返し行われるものであってよい。
また、各病院の診断モデルMDは、例えば、診断システム61、診断システム62及び診断システム6n以外のコンピュータ(例えば、後述する図8に示すホストコンピュータHC)において生成されるものであってもよい。
[診断モデルのマッピング]
次に、従来のAIプロセッサ(以下、AIチップとも呼ぶ)PRに対する診断モデルMDのマッピングを行う処理(以下、マッピング処理とも呼ぶ)について説明を行う。
AIプロセッサPRは、例えば、診断システム61、診断システム62及び診断システム6nに搭載されたプロセッサである。そして、AIプロセッサPRに対する診断モデルMDのマッピングが行われる場合、AIプロセッサPRでは、例えば、診断モデルMDを構成するニューロンを複数のグループにクラスタリングした後、AIプロセッサPRに含まれる複数の演算コアのそれぞれに対する各グループのマッピングを行う。
しかしながら、従来のマッピング処理では、複数の演算コア間における通信コストについて考慮されていない場合がある。そのため、従来のマッピング処理では、マッピング処理が必要な時間内に終了しない場合があった。
また、ニューロンのクラスタリングと複数の演算コアへのマッピングは、一般的に、どちらもNP困難な問題であり、多項式時間において最適に解決することができない場合がある。
そこで、本実施の形態におけるAIプロセッサPRでは、遺伝的アルゴリズムを用いることにより、複数の演算コア間における通信コストを抑えるように、診断モデルMDの各層を構成するニューロンのマッピングを行う。
[本実施の形態におけるAIプロセッサの具体例]
次に、本実施の形態におけるAIプロセッサPRの具体例について説明を行う。図8は、本実施の形態におけるAIプロセッサPRの具体例を説明する図である。以下、診断モデルMDがホストコンピュータHCにおいて生成されるものとして説明を行う。
図8に示すAIプロセッサPRは、15個の演算コアを有している。具体的に、図8に示すAIプロセッサPRは、畳み込み層と対応付けられた10個の演算コアCと、全結合層と対応付けられた3個の演算コアFを有している。また、各演算コアは、それぞれルータRと接続している。なお、以下、AIプロセッサPRが15個の演算コアを有している場合について説明を行うが、AIプロセッサPRは、これ以外の数の演算コアを有するものであってもよい。
また、図8に示すAIプロセッサPRは、プーリング層やアクティベーション機能と対応付けられた1個の演算コアUと、各演算コアに対して重み係数を送信する1個の演算コアI/Oを有している。なお、演算コアI/Oは、例えば、他のAIプロセッサPRとの間の通信(チップ間通信)や各AIプロセッサPRの制御を行うホストコンピュータHCとの通信を行うものであってもよい。
また、図8に示すAIプロセッサPRは、AIプロセッサPRに対する入力を記憶するオンチップメモリM(以下、単にメモリMとも呼ぶ)を有する。演算コアC等の各演算コアは、メモリMから入力をロードして処理を実行する。そして、各演算コアは、次の層に対応する処理の実行を可能とするために、処理の実行に伴う各演算コアの出力をメモリMに記憶する。
さらに、図8に示すAIプロセッサPRは、演算コア及びメモリMのそれぞれに対応するルータRと、External DRAM(Dynamaic Ramdom Access Memory)とを有する。
[本実施の形態におけるマッピング処理]
次に、本実施の形態におけるマッピング処理について説明を行う。図9は、本実施の形態におけるマッピング処理について説明するフローチャート図である。図10から図21は、本実施の形態におけるマッピング処理について説明する図である。
AIプロセッサPRの演算コアUは、診断モデルMD(ニューラルネットワーク)を構成するニューロンについてのN個のマッピング解をランダムに決定する(S11)。
具体的に、AIプロセッサPRがそれぞれ8個のニューロンと対応付けることが可能な4個の演算コアを有しており、かつ、診断モデルMDを構成するニューロンの数が30個である場合、マッピング解の組合せは、32個のニューロンにおいて30個のニューロンを配置する組合せである496通りになる。そのため、演算コアUは、この場合、その496通りのうちのN通りに対応するN個のマッピング解をランダムに決定する。
以下、AIプロセッサPRがそれぞれ8個のニューロンと対応付けることが可能な4個の演算コアを有しており、かつ、診断モデルMDを構成するニューロンの数が30個であるものとして説明を行う。さらに、診断モデルMDが10個のニューロンからなる層L1、層L2及び層L3をそれぞれ有するニューラルネットワークであるものとして説明を行う。
[マッピング結果の具体例]
次に、本実施の形態におけるマッピング結果の具体例について説明を行う。図10は、各演算コアにマッピングされたニューロンの数を示す図である。また、図11は、各演算コアにマッピングされたニューロンの識別情報を示す図である。
図10及び図11に示す例は、1行目1列目の演算コアと対応付けられているニューロンが、層L1に対応する3つのニューロン(ニューロン2、3及び5)と、層L2に対応する2つのニューロン(ニューロン11及び12)と、層L3に対応する3つのニューロン(ニューロン22、23及び28)とであることを示している。
また、図10及び図11に示す例は、1行目2列目の演算コアと対応付けられているニューロンが、層L1に対応する3つのニューロン(ニューロン6、7及び8)と、層L2に対応する1つのニューロン(ニューロン13)と、層L3に対応する3つのニューロン(ニューロン21、29及び30)とであることを示している。なお、図10及び図11に示す例は、1行目2列目の演算コアにおいてさらに対応可能なニューロンの数(F)が1であることを示している。
また、図10及び図11に示す例は、2行目1列目の演算コアと対応付けられているニューロンが、層L1に対応する2つのニューロン(ニューロン1及び4)と、層L2に対応する3つのニューロン(ニューロン15、17及び19)と、層L3に対応する3つのニューロン(ニューロン24、25及び26)とであることを示している。
また、図10及び図11に示す例は、2行目2列目の演算コアと対応付けられているニューロンが、層L1に対応する2つのニューロン(ニューロン9及び10)と、層L2に対応する4つのニューロン(ニューロン14、16、18及び20)と、層L3に対応する1つのニューロン(ニューロン27)とであることを示している。なお、図10及び図11に示す例は、2行目2列目の演算コアにおいてさらに対応可能なニューロンの数(F)が1であることを示している。
図9に戻り、演算コアUは、S11の処理で決定したN個のマッピング解から不適切なマッピング解を削除する(S12)。
具体的に、演算コアUは、例えば、図12に示すように、9個のニューロンと対応付けられた演算コア(1行目1列目の演算コア)が存在するマッピング解を削除する。また、演算コアUは、例えば、図13に示すように、同一のニューロン(ニューロン8)が複数の演算コアと対応付けられたマッピング解を削除する。
そして、演算コアUは、S12の処理で削除されなかったマッピング解のそれぞれに対応する通信コストを算出する(S13)。
具体的に、各マッピング解の通信コストは、以下の式(6)によって表現される。
Figure 0007699791000006
式(6)において、di,jは、ニューロンiとニューロンjとの間の距離を示しており、ci,jは、ニューロンiとニューロンjとの間の接続状況を示している。
具体的に、di,jは、例えば、ニューロンiと対応付けられている演算コアとニューロンjと対応付けられている演算コアとの間に存在するルータRの数に1を加算した値である。また、ci,jは、例えば、ニューロンiとニューロンjとが直接接続している場合に1になり、ニューロンiとニューロンjとが直接接続していない場合に0になる。
さらに具体的に、図11で説明した例において、ニューロン1及びニューロン2は、それぞれ層L1と対応付けられている。そのため、この場合、d1,2は1になり、c1,2は0になる。また、図11で説明した例において、ニューロン1は、層L1と対応付けられており、ニューロン14は、層L2と対応付けられている。そのため、この場合、d1,14は4になり、c1,2は1になる。
続いて、演算コアUは、S12の処理で削除されなかったマッピング解のうち、S13の処理で算出した通信コストが条件を満たすM個のマッピング解を特定する(S14)。
具体的に、演算コアUは、例えば、S12の処理で削除されなかったマッピング解から、S13の処理で算出した通信コストが高い順にM個のマッピング解を特定する。
その後、演算コアUは、S14の処理で特定したM個のマッピング解を交差(クロスオーバー)させることによってN-M個の新たなマッピング解を決定する(S15)。
具体的に、演算コアUは、例えば、図14及び図15に示す親1及び親2がS14の処理で特定したM個のマッピング解に含まれている場合、図16に示すように、親1及び親2のそれぞれの割合を50(%)とした新たな子孫を作成する。
さらに具体的に、図14に示す例において、親1の場合の1行目1列目の演算コアには、層L1に対応する3つのニューロンと、層L2に対応する2つのニューロンと、層L3に対応する3つのニューロンとが対応付けられている。また、図15に示す例において、親2の場合の1行目1列目の演算コアには、層L1に対応する1つのニューロンと、層L2に対応する4つのニューロンと、層L3に対応する3つのニューロンとが対応付けられている。そのため、この場合、新たな子孫の場合の1行目1列目の演算コアには、図16に示すように、層L1に対応する2(3*0.5+1*0.5)つのニューロンと、層L2に対応する3(4*0.5+2*0.5)つのニューロンと、層L3に対応する3(3*0.5+3*0.5)つのニューロンとが対応付けられる。
なお、例えば、図17に示すように、各演算コアと対応付けられたニューロンの数に小数が含まれている場合、演算コアUは、図18に示すように、各演算コアと対応付けられたニューロンの数のそれぞれが整数になるように調整を行うものであってもよい。
図9に戻り、演算コアUは、N個のマッピング解(S14の処理で特定したM個のマッピング解とS15の処理で決定したN-M個の新たなマッピング解との合計)において突然変異を発生させる(S16)。
具体的に、演算コアUは、図19に示すように、例えば、図18に示す複数の演算コアから1行目1列目の演算コアと2行目2列目の演算コアとを特定し、さらに、診断モデルMDを構成する複数の層から層L1と層L2とを特定する。そして、演算コアUは、例えば、特定した1行目1列目の演算コアにおける層L1に対応付けられたニューロンの数である2と、2行目2列目の演算コアにおける層L2に対応付けられたニューロンの数である3とのうちの最小値である2を特定する。その後、演算コアUは、例えば、1行目1列目の演算コアにおける層L1に対応付けられたニューロンの数である2から、最小値として特定した値である2を減算し、さらに、1行目1列目の演算コアにおける層L2に対応付けられたニューロンの数である3に対して、最小値として特定した値である2を加算する。
同様に、演算コアUは、例えば、2行目2列目の演算コアにおける層L2に対応付けられたニューロンの数である3から2を減算し、さらに、2行目2列目の演算コアにおける層L1に対応付けられたニューロンの数である4に対して2を加算する。
そして、演算コアUは、例えば、S12の処理と同様に、S16の処理が行われた後のN個のマッピング解が制約を満たしているか否かを判定する。その結果、制約を満たしていないマッピング解が存在した場合、演算コアUは、存在したマッピング解を削除する。さらに、演算コアUは、S13の処理と同様に、削除されなかったマッピング解の通信コストを算出する(S17)。
その後、S17の処理で算出した通信コストのうちの最適なコスト(最小のコスト)が予め定められた条件を満たしているか否かを判定する(S18)。
その結果、S17の処理で算出した通信コストのうちの最適なコストが予め定められた条件を満たしていると判定した場合、演算コアUは、マッピング処理を終了(正常終了)する。
一方、S17の処理で算出した通信コストのうちの最適なコストが予め定められた条件を満たしていないと判定した場合、演算コアUは、例えば、S12以降の処理の実行回数(すなわち、世代数)が予め定められた所定回数に到達したか否かを判定する(S19)。
その結果、S12以降の処理の実行回数が予め定められた所定回数に到達していないと判定した場合、演算コアUは、例えば、S12以降の処理を再度行う。
一方、S12以降の処理の実行回数が予め定められた所定回数に到達していると判定した場合、演算コアUは、例えば、ニューロンのマッピングを終了(異常終了)する。
このように、本実施の形態におけるAIプロセッサPRは、複数の演算コアを有し、複数の演算コアの少なくともいずれかが、畳み込み層と全結合層とを有する診断モデルMDに含まれる複数のニューロンのそれぞれに対応付けられた計算プログラムを分割して複数の演算コアのそれぞれに割り当てるマッピング処理を実行する。
そして、本実施の形態におけるAIプロセッサは、複数の演算コアのそれぞれが、マッピング処理によって割り当てられた計算プログラムを実行する。
具体的に、本実施の形態におけるマッピング処理では、複数のコア間における通信コストが所定の閾値以下になるように、遺伝的アルゴリズムによって計算プログラムを複数の演算コアに割り当てる。
さらに具体的に、演算コアUは、マッピング処理が正常終了した場合、マッピング処理の結果を示すマッピングテーブル(図示しない)を生成する。続いて、演算コアUは、ホストコンピュータHCから診断モデルMDのパラメータをダウンロードする。さらに、演算コアUは、マッピングテーブルを参照し、診断モデルMDのパラメータを演算コアC及び演算コアFのそれぞれに送信する。また、演算コアUは、マッピングテーブルを各ルータRに対しても送信する。
その後、演算コアUは、例えば、入力データ(例えば、患者のX線画像)が入力された場合、マッピングテーブルを参照し、入力データを最初の層に含まれるニューロンに対応する演算コアのそれぞれに送信する。そして、各ルータRは、最初の層に対応する処理が完了したことに応じて、最初の層からの出力データを次の層に含まれるニューロンに対応する演算コアに送信する。さらに、各ルータRは、最後の層に対応する処理が完了するまでの間、処理対象の層の次の層に含まれるニューロンに対応する演算コアに対する送信を繰り返し行う。そして、各ルータRは、最後の層からの出力データ(診断モデルMDの出力データ)をDRAMに格納する。
すなわち、本実施の形態におけるAIプロセッサPRは、従来の方法よりも簡易なアルゴリズムであって、かつ、予測可能な時間内に結果を得ることが可能なアルゴリズムである遺伝的アルゴリズムを用いることによってマッピング処理を行う。
これにより、本実施の形態におけるAIプロセッサPRは、各ニューロンの演算コアへのマッピングが行われる際の通信コストを抑えることが可能になる。そのため、本実施の形態におけるAIプロセッサPRは、診断モデルを用いた診断をより効率的に行うことが可能になる。
4:情報処理装置
7:クラウドサーバ
8:リアルタイム情報
11:病院
12:病院
1n:病院
51:携帯端末
52:携帯端末
5n:携帯端末
61:診断システム
62:診断システム
6n:診断システム
100:情報処理システム
MD:診断モデル
PR:AIプロセッサ

Claims (5)

  1. 複数の演算コアを有し、
    前記複数の演算コアの少なくともいずれかが、畳み込み層と全結合層とを有するCNN(Convolutional Neural Network)の機械学習モデルに含まれる複数のニューロンのそれぞれに対応付けられた計算プログラムを分割して前記複数の演算コアのそれぞれに割り当てるマッピング処理を実行し、
    前記複数の演算コアのそれぞれが、前記マッピング処理によって割り当てられた前記計算プログラムを実行し、
    前記マッピング処理では、前記複数の演算コア間における通信コストが所定の閾値以下になるように、遺伝的アルゴリズムによって前記計算プログラムを前記複数の演算コアに割り当て、さらに、
    前記機械学習モデルにおけるパラメータと他の機械学習モデルにおけるパラメータとから生成されたグローバルパラメータを用いることによって、前記機械学習モデルにおけるパラメータを更新し、
    前記機械学習モデルは、個人情報を含む画像データの入力に伴って前記個人情報に対応する人物が所定の状態にあるか否かについての情報を出力する機械学習モデルであり、
    前記マッピング処理では、前記複数の演算コアに含まれる第1演算コアが、前記マッピング処理の結果を示すマッピングテーブルを生成し、
    前記機械学習モデルにおけるパラメータを更新する処理では、前記第1演算コアが、前記マッピングテーブルを参照し、前記複数の演算コアのうちの複数の他の演算コアに対して前記機械学習モデルにおけるパラメータを送信することによって、前記機械学習モデルにおけるパラメータを更新する、
    ことを特徴とするAIプロセッサ。
  2. 請求項1において、
    前記画像データは、患者が映る画像データであり、
    前記機械学習モデルは、前記画像データの入力に伴って前記患者が前記所定の状態にあるか否かについての情報を出力する機械学習モデルである、
    ことを特徴とするAIプロセッサ。
  3. 請求項1において、
    前記CNNは、プーリング層をさらに有する、
    ことを特徴とするAIプロセッサ。
  4. 請求項1において、
    前記マッピング処理では、
    前記計算プログラムについての前記複数の演算コアに対するN個のマッピング解をランダムに生成し、
    前記N個のマッピング解のそれぞれを採用した場合における前記通信コストを算出し、
    前記N個のマッピング解から、算出した前記通信コストが小さい順にM個のマッピング解を特定し、
    前記M個のマッピング解を交差させることによってN-M個の新たなマッピング解を生成し、
    前記M個のマッピング解と前記N-M個の新たなマッピング解とを含むN個の新たなマッピング解において突然変異を発生させ、
    前記突然変異を発生させた前記N個の新たなマッピング解のそれぞれを採用した場合における前記通信コストを再度算出し、
    前記N個の新たなマッピング解のうち、再度算出した前記通信コストが最小である特定のマッピング解を特定し、
    前記特定のマッピング解の前記通信コストが前記所定の閾値以下であるか否かを判定し、
    前記特定のマッピング解の前記通信コストが前記所定の閾値以下であると判定した場合、前記計算プログラムを前記特定のマッピング解に従って前記複数の演算コアに割り当てる、
    ことを特徴とするAIプロセッサ。
  5. 請求項4において、
    前記マッピング処理では、
    前記特定のマッピング解の前記通信コストが前記所定の閾値以下でないと判定した場合、前記N個の新たなマッピング解について、前記通信コストを算出する処理と、前記M個のマッピング解を特定する処理と、前記N-M個の新たなマッピング解を生成する処理と、前記突然変異を発生させる処理と、前記通信コストを再度算出する処理と、前記特定のマッピング解を特定する処理と、前記通信コストが所定の閾値であるか否かを判定する処理とを再度行う、
    ことを特徴とするAIプロセッサ。
JP2020194733A 2020-11-24 2020-11-24 Aiプロセッサ Active JP7699791B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020194733A JP7699791B2 (ja) 2020-11-24 2020-11-24 Aiプロセッサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020194733A JP7699791B2 (ja) 2020-11-24 2020-11-24 Aiプロセッサ

Publications (2)

Publication Number Publication Date
JP2022083341A JP2022083341A (ja) 2022-06-03
JP7699791B2 true JP7699791B2 (ja) 2025-06-30

Family

ID=81802216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020194733A Active JP7699791B2 (ja) 2020-11-24 2020-11-24 Aiプロセッサ

Country Status (1)

Country Link
JP (1) JP7699791B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115952835A (zh) * 2023-01-19 2023-04-11 安谋科技(中国)有限公司 数据处理方法、可读介质和电子设备

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058520A (ja) 2001-08-09 2003-02-28 Mitsubishi Heavy Ind Ltd コンピュータの配置方法
JP2004185271A (ja) 2002-12-03 2004-07-02 Fujitsu Ltd プログラム分割方法とそれを実施するプログラム
WO2019220692A1 (ja) 2018-05-15 2019-11-21 三菱電機株式会社 演算装置
WO2020053887A1 (en) 2018-09-11 2020-03-19 Remidio Innovative Solutions Pvt. Ltd. Distributed training of systems for medical image analysis
US20200089534A1 (en) 2017-08-21 2020-03-19 Shanghai Cambricon Information Technology Co., Ltd Data sharing system and data sharing method therefor
JP2020046821A (ja) 2018-09-18 2020-03-26 株式会社東芝 ニューラルネットワーク装置
CN111652863A (zh) 2020-05-27 2020-09-11 刘君茹 一种医学影像检测方法、装置、设备和存储介质
JP2020160564A (ja) 2019-03-25 2020-10-01 株式会社エヌエスアイテクス ニューラルネットワークの演算装置
WO2020225879A1 (ja) 2019-05-08 2020-11-12 日本電気株式会社 演算装置および演算割当方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003058520A (ja) 2001-08-09 2003-02-28 Mitsubishi Heavy Ind Ltd コンピュータの配置方法
JP2004185271A (ja) 2002-12-03 2004-07-02 Fujitsu Ltd プログラム分割方法とそれを実施するプログラム
US20200089534A1 (en) 2017-08-21 2020-03-19 Shanghai Cambricon Information Technology Co., Ltd Data sharing system and data sharing method therefor
WO2019220692A1 (ja) 2018-05-15 2019-11-21 三菱電機株式会社 演算装置
WO2020053887A1 (en) 2018-09-11 2020-03-19 Remidio Innovative Solutions Pvt. Ltd. Distributed training of systems for medical image analysis
JP2020046821A (ja) 2018-09-18 2020-03-26 株式会社東芝 ニューラルネットワーク装置
JP2020160564A (ja) 2019-03-25 2020-10-01 株式会社エヌエスアイテクス ニューラルネットワークの演算装置
WO2020225879A1 (ja) 2019-05-08 2020-11-12 日本電気株式会社 演算装置および演算割当方法
CN111652863A (zh) 2020-05-27 2020-09-11 刘君茹 一种医学影像检测方法、装置、设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
榑林亮介 ほか,"データ駆動プロセッサによる実時間処理のためのプログラム割当手法",電子情報通信学会論文誌,Vol. J86-D-I,No. 10,2003年10月,p. 721-732

Also Published As

Publication number Publication date
JP2022083341A (ja) 2022-06-03

Similar Documents

Publication Publication Date Title
CN110111885B (zh) 属性预测方法、装置、计算机设备及计算机可读存储介质
Osman et al. SOM-LWL method for identification of COVID-19 on chest X-rays
Shi et al. Exam: an explainable attention-based model for covid-19 automatic diagnosis
CN120030602B (zh) 一种基于联邦学习的口腔医疗隐私数据脱敏方法及系统
Ahmed et al. An integrated deep learning and belief rule base intelligent system to predict survival of COVID-19 patient under uncertainty
Ying et al. Self-learning fuzzy automaton with input and output fuzzy sets for system modelling
JP7699791B2 (ja) Aiプロセッサ
CN115222715A (zh) 基于人工智能的甲状腺结节辅助诊断方法及相关设备
Santosh et al. CheXNet for the evidence of Covid-19 using 2.3 K positive chest X-rays
Gao et al. A collaborative multimodal learning-based framework for COVID-19 diagnosis
CN116130072A (zh) 科室推荐方法、装置、设备及存储介质
CN116543917A (zh) 一种针对异构时间序列数据的信息挖掘方法
Hussain et al. Detection and prediction of monkey pox disease by enhanced convolutional neural network approach
Laouarem et al. A deep learning model for CXR-based COVID-19 detection
Sun et al. Phylogenetic-informed graph deep learning to classify dynamic transmission clusters in infectious disease epidemics
Alzamli et al. Machine Learning Techniques in Service of COVID-19: Data Augmentation Based on Multi-Exposure Image FusionTowards Anomaly Prediction
CN118333162A (zh) 混合局部文本实体因果结构学习方法、装置和电子设备
Alameady et al. Deep convolutional neural network classified the pneumonia and coronavirus diseases (covid-19) by softmax nonlinearity function
CN109872812A (zh) 一种基于卷积神经网络的虚拟医生诊断系统及方法
Naveen et al. COVID salvation: A theoretical model for Predicting coronavirus from chest radiology imagery
Karthigeyan et al. QCVNET-Leveraging Quantum Technology in Convolutional Neural Networks for Improved Cardiovascular Disease Prediction
Al Sayed et al. Integrating Neutrosophic Theory for Improved Decision-Making in Wireless Body Area Networks: Enhancing Accuracy and Efficiency in Health Monitoring.
Hafiyyan et al. Implementation of The Naïve Bayes Algorithm For Diagnosing Lung Disesase In An Expert System Concept
Rani et al. Detection of COVID-19 CoronaVirus using ResNet deep learning technique
Tasmi et al. Pactdet-an artificially intelligent approach to detect pulmonary illnesses: Pneumonia, asthma, covid-19, and tuberculosis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231031

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250304

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250513

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250611

R150 Certificate of patent or registration of utility model

Ref document number: 7699791

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150