JP7305656B2 - 確率分布をモデル化するためのシステムおよび方法 - Google Patents
確率分布をモデル化するためのシステムおよび方法 Download PDFInfo
- Publication number
- JP7305656B2 JP7305656B2 JP2020539258A JP2020539258A JP7305656B2 JP 7305656 B2 JP7305656 B2 JP 7305656B2 JP 2020539258 A JP2020539258 A JP 2020539258A JP 2020539258 A JP2020539258 A JP 2020539258A JP 7305656 B2 JP7305656 B2 JP 7305656B2
- Authority
- JP
- Japan
- Prior art keywords
- layer
- rbm
- data
- hidden
- visible
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0475—Generative networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/094—Adversarial learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Complex Calculations (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Image Generation (AREA)
Description
本願は、2018年1月17日に出願され、「Systems and Methods for Modeling Probability Distributions」と題された、米国仮特許出願第62/618,440号、および2019年1月15日に出願され、「Simulating Biological and Health Systems with Restricted Boltzmann Machines」と題された、米国仮特許出願第62/792,648号の利益および優先権を主張する。米国仮特許出願第62/618,440号および第62/792,648号の開示は、それらの全体として参照することによって本明細書に組み込まれる。
本発明は、例えば、以下を提供する。
(項目1)
制限ボルツマンマシン(RBM)を訓練するための方法であって、前記方法は、
可視値の第1のセットから、RBMの隠れ層内の隠れ値のセットを生成することと、
前記隠れ値の生成されたセットに基づいて、前記RBMの可視層内の可視値の第2のセットを生成することと、
前記可視値の第1のセットおよび前記可視値の生成されたセットのうちの少なくとも1つに基づいて、尤度勾配のセットを算出することと、
前記隠れ値のセットおよび前記可視値のセットのうちの少なくとも1つに基づく敵対モデルを使用して、敵対勾配のセットを算出することと、
前記尤度勾配のセットおよび前記敵対勾配のセットに基づいて、複合勾配のセットを算出することと、
前記複合勾配のセットに基づいて、前記RBMを更新することと
を含む、方法。
(項目2)
前記RBMの可視層は、異なるデータタイプのための複数の副層から成る複合層を備える、項目1に記載の方法。
(項目3)
前記複数の副層は、ベルヌーイ層、イジング層、ワンホット層、フォンミーゼスフィッシャー層、ガウス層、ReLU層、クリップされたReLU層、スチューデント-t層、序数層、指数関数層、および複合層のうちの少なくとも1つを備える、項目1に記載の方法。
(項目4)
前記RBMは、深層ボルツマンマシン(DBM)であり、前記隠れ層は、複数の隠れ層のうちの1つである、項目1に記載の方法。
(項目5)
前記RBMは、第1のRBMであり、前記隠れ層は、前記複数の隠れ層のうちの第1の隠れ層であり、前記方法はさらに、
前記第1のRBMから前記隠れ層をサンプリングすることと、
前記第1のRBMからの前記可視層および前記隠れ層をベクトルにスタックすることと、
第2のRBMを訓練することであって、前記ベクトルは、前記第2のRBMの可視層である、ことと、
前記第1および第2のRBMからの加重を前記DBMにコピーすることによって、前記DBMを生成することと
を含む、項目4に記載の方法。
(項目6)
患者の表現型ベクトルを受信することと、
前記RBMを使用し、疾患の時間進行を生成することと、
前記生成された時間進行に基づいて、前記患者を治療することと
をさらに含む、項目1に記載の方法。
(項目7)
前記可視層および前記隠れ層は、第1の時間インスタンスのためのものであり、前記隠れ層はさらに、異なる第2の時間インスタンスからのデータを組み込む第2の隠れ層に接続される、項目1に記載の方法。
(項目8)
前記可視層は、複数の異なる時間インスタンスのためのデータを備える複合層である、項目1に記載の方法。
(項目9)
前記尤度勾配のセットを算出することは、ギブスサンプリングを実施することを含む、項目1に記載の方法。
(項目10)
前記複合勾配のセットは、前記尤度勾配のセットおよび前記敵対勾配のセットの加重平均である、項目1に記載の方法。
(項目11)
前記敵対モデルを訓練することをさらに含み、前記敵対モデルを訓練することは、
真正データに基づいて、データサンプルを引き出することと、
前記RBMに基づいて、架空のサンプルを引き出すことと、
前記データサンプルと前記架空のサンプルとを区別する前記敵対モデルの能力に基づいて、前記敵対モデルを訓練することと
によって行われる、項目1に記載の方法。
(項目12)
前記敵対モデルを訓練することは、特定のサンプルが真正データまたは前記RBMのいずれかから引き出される確率を測定することを含む、項目1に記載の方法。
(項目13)
前記敵対モデルは、完全接続分類子、ロジスティック回帰モデル、最近傍分類子、およびランダムフォレストのうちの1つである、項目1に記載の方法。
(項目14)
前記RBMを使用し、標的集団のサンプルのセットを生成することをさらに含む、項目1に記載の方法。
(項目15)
尤度勾配のセットを算出することは、モンテカルロ推定値および平均場推定値の凸結合を算出することを含む、項目1に記載の方法。
(項目16)
尤度勾配のセットを算出することは、
複数のサンプルを初期化することと、
前記複数のサンプルのうちのサンプル毎に逆温度を初期化することと、
前記複数のサンプルのうちのサンプル毎に、
自己相関されたガンマ分布からサンプリングすることによって、前記逆温度を更新することと、
ギブスサンプリングを使用して、前記サンプルを更新することと
を含む、項目1に記載の方法。
(項目17)
制限ボルツマンマシン(RBM)を訓練するためのプロセッサ命令を含有する非一過性の機械可読媒体であって、プロセッサによる前記命令の実行は、前記プロセッサに、
可視値の第1のセットから、RBMの隠れ層内の隠れ値のセットを生成することと、
前記隠れ値の生成されたセットに基づいて、前記RBMの可視層内の可視値の第2のセットを生成することと、
前記可視値の第1のセットおよび前記可視値の生成されたセットのうちの少なくとも1つに基づいて、尤度勾配のセットを算出することと、
前記隠れ値のセットおよび前記可視値のセットのうちの少なくとも1つに基づく敵対モデルを使用して、敵対勾配のセットを算出することと、
前記尤度勾配のセットおよび前記敵対勾配のセットに基づいて、複合勾配のセットを算出することと、
前記複合勾配のセットに基づいて、前記RBMを更新することと
を含むプロセスを実施させる、非一過性の機械可読媒体。
(項目18)
前記RBMの可視層は、異なるデータタイプのための複数の副層から成る複合層を備える、項目17に記載の非一過性の機械可読媒体。
(項目19)
前記RBMは、深層ボルツマンマシン(DBM)であり、前記隠れ層は、複数の隠れ層のうちの1つである、項目17に記載の非一過性の機械可読媒体。
(項目20)
前記RBMは、第1のRBMであり、前記隠れ層は、前記複数の隠れ層のうちの第1の隠れ層であり、前記プロセスはさらに、
前記第1のRBMから前記隠れ層をサンプリングすることと、
前記第1のRBMからの前記可視層および前記隠れ層をベクトルにスタックすることと、
第2のRBMを訓練することであって、前記ベクトルは、前記第2のRBMの可視層である、ことと、
前記第1および第2のRBMからの加重を前記DBMにコピーすることによって、前記DBMを生成することと
を含む、項目19に記載の非一過性の機械可読媒体。
ここで図面を参照すると、本発明のいくつかの実施形態による、確率分布をモデル化するためのデータの収集および分布を提供するシステムが、図1に示される。ネットワーク100は、通信ネットワーク160を含む。通信ネットワーク160は、ネットワーク160に接続されるデバイスが、他の接続されたデバイスと通信することを可能にする、インターネット等のネットワークである。サーバシステム110、140、および170は、ネットワーク160に接続される。サーバシステム110、140、および170はそれぞれ、ネットワーク160を経由してクラウドサービスをユーザに提供するプロセスを実行する内部ネットワークを介して、相互に通信可能に接続される、1つ以上のサーバのグループである。本議論の目的のために、クラウドサービスは、ネットワークを経由してデータおよび/または実行可能アプリケーションをデバイスに提供するように、1つ以上のサーバシステムによって実行される、1つ以上のアプリケーションである。サーバシステム110、140、および170は、内部ネットワーク内に3つのサーバをそれぞれ有して示される。しかしながら、サーバシステム110、140、および170は、任意の数のサーバを含んでもよく、任意の付加的な数のサーバシステムが、クラウドサービスを提供するようにネットワーク160に接続されてもよい。本発明の種々の実施形態によると、本発明の実施形態による、複雑な確率分布をモデル化するシステムおよび方法を使用するネットワークが、ネットワーク160を経由して通信する単一のサーバシステムおよび/またはサーバシステムのグループ上で実行されているプロセス(またはプロセスのセット)によって提供されてもよい。
前方KLダイバージェンス、すなわち、DKL(pdata||pθ)を最小限にするように訓練されるモデルは、データ分布のサポートを網羅するようにモデル分布を拡散する傾向がある。拡散分布の実施例が、図6に図示される。具体的には、図6は、双峰分布610およびRBM分布620によって学習される極めて良好な平滑化拡散分布を図示する。RBMは、そのような良好な近似を生成することができるが、より細かく、より複雑な分布に直面したときに苦戦し得る。
多くの従来の機械学習技法では、教師付き学習が、標識データの大規模セットについてモデルを訓練し、予測および分類を行うために使用される。しかしながら、多くの場合、標識データのそのような大規模サンプルを収集することは実行可能または可能ではない。多くの場合、データは、容易に標識されることができない、または単純に、教師付き学習モデルを有意義に訓練するためにイベントの十分なサンプルが存在しない。例えば、臨床試験は、多くの場合、そのような標識データを収集する際に困難に直面する。臨床試験は、典型的には、3つの主要相を通して進む。第I相では、治療薬が、その安全性を査定するように健康なボランティアに投与される。第II相では、治療薬が、安全性および有効性の初期推定値を取得するように、約100人の患者に投与される。最終的に、第III相では、治療薬が、薬物の有効性を厳密に調査するように、数百人から数千人の患者に投与される。第II相の前に、望ましい適応に関して治験薬の効果についての人体内データがなく、教師付き学習を不可能にする。第II相の後に、治験薬の効果についてのある程度の人体内データが存在するが、サンプルサイズは、極めて限定され、教師付き学習技法を無効にする。比較のために、第II相臨床試験が、100~200人の患者を有し得る一方で、コンピュータビジョンにおける機械学習の典型的アプリケーションは、何百万もの標識画像を使用し得る。限定されたデータを用いた多くの状況と同様に、多くの重要な問題に関する大規模標識データセットの欠如は、健康情報学が、教師なし学習のための方法に大いに依拠しなければならないことを含意する。
制限ボルツマンマシン(RBM)
ここで、E(v,h)は、エネルギー関数と呼ばれ、
は、分配関数と呼ばれる。多くの実施形態では、プロセスは、積分作用素
を使用し、標準積分または離散セット内の要素の全てにわたる総和の両方を表す。
またはベクトル表記法では、
である。可視単位は、加重Wを通して隠れ単位と相互作用することに留意されたい。しかしながら、可視・可視または隠れ・隠れ相互作用は、存在しない。
および
同様に、条件付きモーメントを算出することも、容易である。
および
しかしながら、同時分布から統計を算出することは、概して非常に困難である。結果として、同時分布からの統計は、マルコフ連鎖モンテカルロ(MCMC)等のランダムサンプリングプロセスを使用して、推定される必要がある。
を最大限にすることによって訓練されることができる。ここで、
は、観察されたサンプルの全てにわたる平均を表す。モデルθのあるパラメータに関する対数尤度の導関数は、以下である。
RBMの標準公式化では、3つのパラメータa、b、およびWが存在する。導関数は、以下である。
従来的ボルツマンマシンの使用で生じる1つの課題は、多くのRBMが、2進単位を使用する一方で、処理されるべきデータの多くは、種々の異なる形態で現れ得ることである。本制限を克服するために、本発明のいくつかの実施形態は、一般化RBMを使用する。本発明のいくつかの実施形態による、一般化RBMが、図7に図示される。図7の実施例は、可視層710および隠れ層720を伴う一般化RBM700を示す。可視層710は、種々のタイプ(すなわち、連続、カテゴリ別、および2進数)のいくつかのノードから成る複合層である。可視層710のノードは、隠れ層720のノードに接続される。本発明のいくつかの実施形態による、一般化RBMの隠れ層は、複合可視層へのコンパイルされた入力に基づいて、個人(例えば、臨床試験における患者)の低次元表現として動作する。
式中、a(・)およびb(・)は、恣意的関数であり、σ>0およびε>0は、それぞれ、可視および隠れ層のスケールパラメータである。異なる関数(層タイプと呼ばれる)が、異なるタイプのデータを表すために使用される。種々のタイプのデータをモデル化するために使用される層タイプの実施例が、下記に説明される。
が球体の性質を満たすため、xi∈[0,1]およびΣixi=1である分数データをモデル化するために特に有用である。バイアス関数は、a(v)=aTvであり、スケールパラメータは、σi=1に設定される。
である、データを表す。バイアス関数は、
である。場所
およびスケールσi、すなわち、層のパラメータは両方とも、概して、訓練可能である。実践では、これは、対数σiの観点からモデルをパラメータ化し、スケールパラメータが正に留まることを確実にすることに役立つ。
を伴って
である、データを表す。ボルツマンマシンとの関連で、ReLU層は、本質的に、片側切断ガウス層である。バイアス関数は、ドメイン
にわたって
である。場所
およびスケールσi、すなわち、層のパラメータが両方とも、概して、訓練可能である一方で、
は、典型的には、訓練の前に規定される。実践では、これは、対数σiの観点からモデルをパラメータ化し、スケールパラメータが正に留まることを確実にすることに役立つ。
を伴って
である、データを表す。ボルツマンマシンとの関連で、クリップされたReLU層は、本質的に、両側切断ガウス層である。バイアス関数は、ドメイン
にわたって
である。場所
およびスケールσi、すなわち、層のパラメータが両方とも、概して、訓練可能である一方で、
は、典型的には、訓練の前に規定される。実践では、これは、対数σiの観点からモデルをパラメータ化し、スケールパラメータが正に留まることを確実にすることに役立つ。
、分散を制御するスケールパラメータvi、およびテールの厚さを制御する自由度パラメータdiを有する。層は、分散
を引き出し、次いで、
としてエネルギーをとることによって定義される。
である、データを表す。バイアス関数は、a(v)=aTvであり、スケールパラメータは、σi=1に設定される。指数関数層は、接続された隠れ単位の全ての値に関して
であるため、いくつかの制約を有することに留意されたい。典型的には、これは、指数関数層に接続され得る層のタイプを限定し、加重の全てが正であることを確実にすることを要求する。
本発明のいくつかの実施形態による、スキーマが、図8に概念的に図示される。一般化RBMの異なる層の説明を伴うスキーマが、図8に図示される。スキーマは、個人による面倒な前処理を要求することなく、モデルが特定のタイプのデータを取り扱うように調整されることを可能にする。異なる層は、不完全および/または不規則であり得る、異なるタイプの異種データを可能にする。
深層学習は、モデルが一連の変換を通してデータを処理する、機械学習へのアプローチを指す。目標は、予備知識を使用して特徴を作成するように研究者に要求するのではなく、モデルが適切な特徴を構築することを学習することを可能にすることである。
式中、前のRBMの出力が、次のRBMの入力として使用される。本前方の層毎の方法でDBMを訓練するときに、データ分布から情報を入手し、モデルの深層の中に伝搬することは、困難であり得る。結果として、2~3を上回る隠れ層を伴うDBMを訓練することは、概して困難である。
多くの問題(例えば、患者軌道をモデル化すること)は、時系列を生成する能力を要求する。すなわち、一連の状態
を生成するためである。本発明の多数の実施形態による、2つのアプローチが、下記に説明される。
ADBMのエネルギー関数は、以下である。
簡単にするため、これは、最後の隠れ層をその前の値と接続する、単一の自己回帰接続を用いて図示されている。しかしながら、当業者は、本モデルが複数の時間遅延または層の間の異時点間接続を含むように拡張され得ることを認識するであろう。
の時系列を考慮されたい。同時確率分布は、積
に因数分解されることができる。いくつかの実施形態では、本モデルは、2つのDBMから構築されることができる。最初に、非時間依存性DBM、すなわち、p0が、データの全てについて訓練されることができる。次に、時間依存性DBMは、隣接する時点[v(t),v(t-1)]の全てを継合することによって生成される複合層について訓練されることができる。本実施例では、第2のDBMは、p(v(t)|v(t-1))およびp(v(t-1)|v(t))の両方を算出することを可能にし、前方および後方予測の両方を可能にする、同時分布p(v(t),v(t-1))を説明する。
RBMの性能を改良するための複数の経路が存在する。これらは、正則化、新規の最適化アルゴリズム、代替目的関数、および改良された勾配推定量への新しいアプローチを含む。本発明のいくつかの実施形態による、システムおよび方法は、代替目的関数および改良された勾配推定量を実装する。
RBMのための敵対目的
したがって、ディスクリミネータダイバージェンスは、以下のように記述され、
最適なディスクリミネータが、モデル分布から引き出されるサンプルをデータ分布に由来するものとして不正確に分類するであろう確率を測定することを示すことができる。
として定義されるf-ダイバージェンスのクラスに属する。ディスクリミネータダイバージェンスを定義する関数は、以下であり、
要求に応じて、f(1)=0を伴って凸状である。ディスクリミネータダイバージェンスは、逆KLダイバージェンスの上限を定めることが、示され得る。
であるように、ディスクリミネータをトリックにかけることができるジェネレータは、低いディスクリミネータダイバージェンスを有するであろう。ディスクリミネータダイバージェンスは、逆KLダイバージェンスを密接に反映し、データの確率を過大評価するモデルを著しく弱化させる。
クリティックからの敵対項
からの寄与を含む。本発明のいくつかの実施形態による、敵対項は、以下のように定義されることができ、
式中、T(v,h)は、クリティック関数である。いくつかの実施形態では、敵は、RBMと同一のアーキテクチャおよび加重を使用し、可視単位を隠れ単位アクティブ化に符号化する。RBMからサンプリングされるデータおよび架空の粒子の両方に関して算出される、これらの隠れ単位アクティブ化は、データおよびモデル分布の間の距離を推定するためにクリティックによって使用される。
の関数として近似されることができる。関数g(.)は、殆どのGANのように、ニューラルネットワークによって、またはランダムフォレストまたは最近傍分類子等のより単純なアルゴリズムを使用して、実装され得る。いくつかの実施形態では、最適なディスクリミネータへの単純な近似は、分類子が可視単位ではなくRBMジェネレータの隠れ単位アクティビティに作用し得るため、十分であり得る。したがって、最適なクリティックは、最近傍方法を使用して近似されることができる。
内のpdf p(x)を伴う未知の確率分布からの同様に独立して分配されたサンプルであると仮定されたい。種々の実施形態では、p(x)は、k-最近傍推定値に基づいて、恣意的な点xにおいて推定される。具体的には、本発明のいくつかの実施形態による、方法は、ある正の整数kを固定し、X内のxへのk個の最近傍を算出する。次いで、dkが、xと最近傍のうちの最も遠いものとの間の距離であるように定義され、密度p(x)が、半径dkの球上の一様な分布の密度であるように推定される。すなわち、以下である。
本距離は、もはや適切なメトリックの性質の全てを満たし得ない。X={v1,…,v2N}を、正確に半分がpθから、半分がpdから引き出される、サンプルの集合とする。あるkを固定し、X内のk個の最近傍を算出し、dkによって、最も遠いものまでの距離を表す。次いで、分母が、上記に説明されるように推定される。jを、pθと対照的にpdに由来する最近傍の数とする。分子が、次いで、分母の密度のj/kのみを伴う同一サイズの球上で一様であるものとして推定されることができ、最近傍クリティックがTNN(v):=j/kであるように定義されることを可能にする。多くの実施形態では、最近傍は、訓練データセットからのサンプルのミニバッチと組み合わせられる、モデルからのサンプルのキャッシュされたミニバッチから算出されることができる。
式中、εは、逆の距離を正則化する小さいパラメータである。
対数尤度および敵対項の勾配は両方とも、モデル分布に関する期待値を伴う。残念ながら、これらの期待値は、正確に算出されることができない。結果として、期待値は、モンテカルロ方法または他の近似を使用して、近似されることができる。これらの近似勾配の正確度は、結果として生じるモデルの有用性に有意な影響を及ぼし得る。本発明のある実施形態による、近似勾配の正確度を改良することへの異なるアプローチが、下記に説明される。
勾配のモンテカルロ推定値は、バイアスをかけられていないという利点を有する。すなわち、
に伴って
である。しかしながら、推定値は、Nが小さいときに高い分散を有し得る。他方では、Thouless-Andersen-Palmer(TAP)拡張から導出されるもの等の平均場推定値は、分析的であり、ゼロ分散を有するが、制御することが困難であり得るバイアスを有する。f(ω)=ωfMC+(1-ω)fMFを、モンテカルロ推定値fMCおよび平均場推定値fMFの凸結合から生成される推定値とする。fの平均二乗誤差が、MSE[f]=Bias2[f]+Var[f]=(1-ω)2Bias2[fMF]+ω2Var[fMC]であるように、Bias2[f]=(1-ω)2Bias2[fMF]およびVar[f]=ω2Var[fMC]であることを示すことは、容易である。したがって、概して、ωの値を選定し、結合推定量の平均二乗誤差を最小限にすることができる。
確率分布からサンプルを引き出すことは、本発明の多くの実施形態による、モデルを訓練するための多くのプロセスの重要な構成要素である。これは、多くの場合、多くの1次元分布のための単純な関数呼び出しを用いて行われることができる。しかしながら、ボルツマンマシンからのランダムサンプリングは、はるかに複雑である。
ボルツマンマシンの原分布は、β=1を設定することによって復元される。
したがって、βを減少させることは、遠隔構成の間で移行するために要求されるギブスサンプリングステップの数を減少させるであろう。
すなわち、個々の患者の健康転帰の確率を予測することのみが可能であり得るが、本能力は、大規模集団内のその健康転帰を伴う患者の数を精密に予測することを可能にする。例えば、健康リスクを予測することは、集団に保険を掛けるコストを正確に推定することを可能にする。同様に、患者が特定の治療薬に応答するであろう尤度を予測することは、臨床試験における肯定的転帰の確率を推定することを可能にする。
患者軌道をシミュレートする
である。実施例の多くは、離散時間ステップ(例えば、1ヶ月)を用いて説明されるが、当業者は、これが必要ではなく、種々の他の時間ステップも、本発明の種々の実施形態に従って採用され得ることを認識するであろう。本発明のいくつかの実施形態では、患者軌道をシミュレートするためのモデルは、離散時間ステップ(例えば、1ヶ月)を使用する。本発明のいくつかの実施形態による、時間ステップの長さは、治療の頻度にほぼ合致するように選択されるであろう。本発明の多くの実施形態による、患者軌道のためのモデルは、軌道に沿った全ての点の同時確率分布p(v0,…,vT)を説明する。そのようなモデルは、条件付き確率分布p(vτ,…,vT|v0,…,vτ-1)からサンプリングすることによって予測に使用されることができる。多くの実施形態では、モデルは、条件付き分布を表すことを容易にし、異種データセットに適合されることができるため、ボルツマンマシンであるが、当業者は、本明細書に説明されるプロセスの多くが他のアーキテクチャにも適用され得ることを認識するであろう。
臨床決定支援システムは、情報を患者、医師、または他の介護者に提供し、患者処置についての選択肢を誘導することに役立つ。シミュレートされた患者軌道は、処置の選択肢を知らせ得る、患者の将来の健康への洞察を提供する。例えば、軽度の認識機能障害がある患者を考慮されたい。医師または介護者は、患者の症状がアルツハイマー病に進行する、または患者が他の認知または心理学的体系を呈し始めるリスクを把握することから利益を得るであろう。ある実施形態では、シミュレートされた患者軌道に基づくシステムが、これらのリスクを予想し、処置選択肢を誘導することができる。患者の集団にわたってそのような予測を集約することはまた、集団レベルリスクを推定することに役立ち、患者の大集団への介護者として作用する高齢者介護施設等の組織による、長期的計画を可能にすることができる。
の形態で入力され、ボルツマンマシンを使用し、確率分布
からの軌道をシミュレートすることができる。次いで、これらのシミュレートされた軌道は、種々の将来の時間における具体的転帰(例えば、アルツハイマーの診断)と関連付けられるリスクを理解するように分析されることができる。ある場合には、治療情報を伴うデータについて訓練されるモデルは、治療選択肢を説明する変数を含有するであろう。そのようなモデルは、異なる治療が条件とされるシミュレートされた転帰リスクを比較することによって、異なる治療選択肢が患者の将来のリスクを変化させるであろう様子を査定するために、使用され得る。多くの実施形態では、介護者または医師が、治療選択肢および/またはシミュレートされた軌道に基づいて、患者を治療することができる。
無作為化臨床試験(RCT)は、治療有効性を査定する際の証拠の至適基準である。RCTでは、各患者が、2つの研究群のうちの1つ、すなわち、患者が実験的治療を用いて治療される治療群、および患者がダミー治療および/または現在の標準の処置を受容するプラセボ群に無作為に割り当てられる。試験の終わりに、治療群内の患者が、プラセボ群内の患者がダミー治療に応答したよりも肯定的に新しい治療に応答した可能性が高かったかどうかを決定するように、統計的分析が、実施される。
従来的に、米国内の医療は、個別報酬基準で提供されてきた。しかしながら、価値に基づいた処置に向けた移行が現在進行中である。医薬品との関連で、価値に基づいた処置は、薬物の費用が、錠剤あたりの単純な費用ではなく、それが効果的である程度に基づくであろうことを意味する。結果として、政府および他の支払人は、代替治療の有効性を比較することができる必要がある。
ヒトゲノムは、相互作用の非常に複雑なネットワークに関与する2万を上回る遺伝子をコードする。遺伝的相互作用の本ネットワークは、非常に複雑であるため、遺伝子型を表現型に結び付ける機構的モデルを開発することは面倒である。したがって、ゲノム情報から表現型を予測することを目標とする研究は、機械学習方法を使用する必要がある。
を使用して、遺伝子発現ベクトルの分布を説明する。本発明の多くの実施形態による、モデルは、標識を伴わずに訓練されることができ、したがって、いくつかの実施形態では、大規模データセットが、多くの異なる研究を組み合わせることによってコンパイルされることができる。いくつかの実施形態では、事前訓練されたDBMが、
を算出することによって、未加工遺伝子発現値のベクトルを特徴の低次元ベクトルに変換するために使用されることができる。本発明のある実施形態による、これらの低次元特徴は、次いで、所与の治療薬に関する薬物応答の予測因子を構築するために、より単純な教師付き学習アルゴリズムへの入力として使用されることができる。
遺伝子の活性または発現の変化が人体内に及ぼすであろう影響を予測することは、薬物設計および薬物開発の両方にとって重要である。例えば、化合物が人体内に及ぼすであろう影響を予測し得る場合には、創薬のための高スループット計算スクリーンを実施し得る。同様に、治験薬物が異なるタイプの患者に及ぼすであろう影響を予測し得る場合には、人体内の薬物の作用についての直接データがなくても、第II相臨床試験のための患者選択を最適化し得る。
を算出することを伴う。
から行われることができる。
を、yが与えられたエネルギーxを定義しているものとする。DBMでは、これはまた、隠れ層の全てにわたって積分することを伴う。ある実施形態では、遺伝子相互作用の局所測定値が、xにおいて評価される
の導関数から算出されることができる。
Claims (20)
- 制限ボルツマンマシン(RBM)を訓練するための方法であって、前記方法は、
可視値の第1のセットから、RBMの隠れ層内の隠れ値のセットを生成することと、
前記隠れ値の生成されたセットに基づいて、前記RBMの可視層内の可視値の第2のセットを生成することと、
前記可視値の第1のセットおよび前記可視値の生成されたセットのうちの少なくとも1つに基づいて、尤度勾配のセットを算出することと、
前記隠れ値のセットおよび前記可視値のセットのうちの少なくとも1つに基づく敵対モデルを使用して、敵対勾配のセットを算出することと、
前記尤度勾配のセットおよび前記敵対勾配のセットに基づいて、複合勾配のセットを算出することと、
前記複合勾配のセットに基づいて、前記RBMを更新することと
を含む、方法。 - 前記RBMの可視層は、異なるデータタイプのための複数の副層から成る複合層を備える、請求項1に記載の方法。
- 前記複数の副層は、ベルヌーイ層、イジング層、ワンホット層、フォンミーゼスフィッシャー層、ガウス層、ReLU層、クリップされたReLU層、スチューデント-t層、序数層、指数関数層、および複合層のうちの少なくとも1つを備える、請求項2に記載の方法。
- 前記RBMは、深層ボルツマンマシン(DBM)であり、前記隠れ層は、複数の隠れ層のうちの1つである、請求項1に記載の方法。
- 前記RBMは、第1のRBMであり、前記隠れ層は、前記複数の隠れ層のうちの第1の隠れ層であり、前記方法は、
前記第1のRBMから前記隠れ層をサンプリングすることと、
前記第1のRBMからの前記可視層および前記隠れ層をベクトルにスタックすることと、
第2のRBMを訓練することであって、前記ベクトルは、前記第2のRBMの可視層である、ことと、
前記第1および第2のRBMからの加重を前記DBMにコピーすることによって、前記DBMを生成することと
をさらに含む、請求項4に記載の方法。 - 患者の表現型ベクトルを受信することと、
前記RBMを使用し、疾患の時間進行を生成することと
をさらに含む、請求項1に記載の方法。 - 前記可視層および前記隠れ層は、第1の時間インスタンスのためのものであり、前記隠れ層は、異なる第2の時間インスタンスからのデータを組み込む第2の隠れ層にさらに接続される、請求項1に記載の方法。
- 前記可視層は、複数の異なる時間インスタンスのためのデータを備える複合層である、請求項1に記載の方法。
- 前記尤度勾配のセットを算出することは、ギブスサンプリングを実施することを含む、請求項1に記載の方法。
- 前記複合勾配のセットは、前記尤度勾配のセットおよび前記敵対勾配のセットの加重平均である、請求項1に記載の方法。
- 前記敵対モデルを訓練することをさらに含み、前記敵対モデルを訓練することは、
真正データに基づいて、データサンプルを引き出することと、
前記RBMに基づいて、架空のサンプルを引き出すことと、
前記データサンプルと前記架空のサンプルとを区別する前記敵対モデルの能力に基づいて、前記敵対モデルを訓練することと
によって行われる、請求項1に記載の方法。 - 前記敵対モデルを訓練することは、特定のサンプルが真正データまたは前記RBMのいずれかから引き出される確率を測定することを含む、請求項1に記載の方法。
- 前記敵対モデルは、完全接続分類子、ロジスティック回帰モデル、最近傍分類子、およびランダムフォレストのうちの1つである、請求項1に記載の方法。
- 前記RBMを使用し、標的集団のサンプルのセットを生成することをさらに含む、請求項1に記載の方法。
- 尤度勾配のセットを算出することは、モンテカルロ推定値および平均場推定値の凸結合を算出することを含む、請求項1に記載の方法。
- 尤度勾配のセットを算出することは、
複数のサンプルを初期化することと、
前記複数のサンプルのうちのサンプル毎に逆温度を初期化することと、
前記複数のサンプルのうちのサンプル毎に、
自己相関されたガンマ分布からサンプリングすることによって、前記逆温度を更新することと、
ギブスサンプリングを使用して、前記サンプルを更新することと
を含む、請求項1に記載の方法。 - 制限ボルツマンマシン(RBM)を訓練するためのプロセッサ命令を含有する非一過性の機械可読媒体であって、プロセッサによる前記命令の実行は、前記プロセッサに、
可視値の第1のセットから、RBMの隠れ層内の隠れ値のセットを生成することと、
前記隠れ値の生成されたセットに基づいて、前記RBMの可視層内の可視値の第2のセットを生成することと、
前記可視値の第1のセットおよび前記可視値の生成されたセットのうちの少なくとも1つに基づいて、尤度勾配のセットを算出することと、
前記隠れ値のセットおよび前記可視値のセットのうちの少なくとも1つに基づく敵対モデルを使用して、敵対勾配のセットを算出することと、
前記尤度勾配のセットおよび前記敵対勾配のセットに基づいて、複合勾配のセットを算出することと、
前記複合勾配のセットに基づいて、前記RBMを更新することと
を含むプロセスを実施させる、非一過性の機械可読媒体。 - 前記RBMの可視層は、異なるデータタイプのための複数の副層から成る複合層を備える、請求項17に記載の非一過性の機械可読媒体。
- 前記RBMは、深層ボルツマンマシン(DBM)であり、前記隠れ層は、複数の隠れ層のうちの1つである、請求項17に記載の非一過性の機械可読媒体。
- 前記RBMは、第1のRBMであり、前記隠れ層は、前記複数の隠れ層のうちの第1の隠れ層であり、前記プロセスは、
前記第1のRBMから前記隠れ層をサンプリングすることと、
前記第1のRBMからの前記可視層および前記隠れ層をベクトルにスタックすることと、
第2のRBMを訓練することであって、前記ベクトルは、前記第2のRBMの可視層である、ことと、
前記第1および第2のRBMからの加重を前記DBMにコピーすることによって、前記DBMを生成することと
をさらに含む、請求項19に記載の非一過性の機械可読媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021185425A JP2022031730A (ja) | 2018-01-17 | 2021-11-15 | 確率分布をモデル化するためのシステムおよび方法 |
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201862618440P | 2018-01-17 | 2018-01-17 | |
| US62/618,440 | 2018-01-17 | ||
| US201962792648P | 2019-01-15 | 2019-01-15 | |
| US62/792,648 | 2019-01-15 | ||
| PCT/US2019/013870 WO2019143737A1 (en) | 2018-01-17 | 2019-01-16 | Systems and methods for modeling probability distributions |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021185425A Division JP2022031730A (ja) | 2018-01-17 | 2021-11-15 | 確率分布をモデル化するためのシステムおよび方法 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2021511584A JP2021511584A (ja) | 2021-05-06 |
| JP2021511584A5 JP2021511584A5 (ja) | 2021-12-23 |
| JP7305656B2 true JP7305656B2 (ja) | 2023-07-10 |
Family
ID=67214040
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020539258A Active JP7305656B2 (ja) | 2018-01-17 | 2019-01-16 | 確率分布をモデル化するためのシステムおよび方法 |
| JP2021185425A Withdrawn JP2022031730A (ja) | 2018-01-17 | 2021-11-15 | 確率分布をモデル化するためのシステムおよび方法 |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021185425A Withdrawn JP2022031730A (ja) | 2018-01-17 | 2021-11-15 | 確率分布をモデル化するためのシステムおよび方法 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US11636309B2 (ja) |
| EP (1) | EP3740908A4 (ja) |
| JP (2) | JP7305656B2 (ja) |
| CN (1) | CN111758108A (ja) |
| CA (1) | CA3088204A1 (ja) |
| WO (1) | WO2019143737A1 (ja) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11868900B1 (en) | 2023-02-22 | 2024-01-09 | Unlearn.AI, Inc. | Systems and methods for training predictive models that ignore missing features |
| US12008478B2 (en) | 2019-10-18 | 2024-06-11 | Unlearn.AI, Inc. | Systems and methods for training generative models using summary statistics and other constraints |
| US12020789B1 (en) | 2023-02-17 | 2024-06-25 | Unlearn.AI, Inc. | Systems and methods enabling baseline prediction correction |
| US12051487B2 (en) | 2019-08-23 | 2024-07-30 | Unlearn.Al, Inc. | Systems and methods for supplementing data with generative models |
Families Citing this family (26)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7305656B2 (ja) | 2018-01-17 | 2023-07-10 | アンラーン.エーアイ, インコーポレイテッド | 確率分布をモデル化するためのシステムおよび方法 |
| US20210073669A1 (en) * | 2019-09-06 | 2021-03-11 | American Express Travel Related Services Company | Generating training data for machine-learning models |
| EP4042298A4 (en) | 2019-10-09 | 2024-02-07 | Cornell University | Quantum computing based hybrid solution strategies for large-scale discrete-continuous optimization problems |
| EP3809334A1 (en) * | 2019-10-17 | 2021-04-21 | Siemens Aktiengesellschaft | Evaluation framework for time series data |
| CN110751291B (zh) * | 2019-10-29 | 2021-02-12 | 支付宝(杭州)信息技术有限公司 | 实现安全防御的多方联合训练神经网络的方法及装置 |
| WO2021257128A2 (en) * | 2020-02-14 | 2021-12-23 | Cornell University | Quantum computing based deep learning for detection, diagnosis and other applications |
| CN111563721B (zh) * | 2020-04-21 | 2023-07-11 | 上海爱数信息技术股份有限公司 | 一种适用于不同标签分布场合的邮件分类方法 |
| EP3902314B1 (en) * | 2020-04-21 | 2022-10-12 | Rohde & Schwarz GmbH & Co. KG | Method of training a test system for mobile network testing, test system as well as method of mobile testing |
| JP7614598B2 (ja) * | 2020-04-21 | 2025-01-16 | 国立大学法人横浜国立大学 | ベクトル場情報生成装置、状態判定支援システム、状態予測システム、ベクトル場情報生成方法およびプログラム |
| US12265909B2 (en) * | 2020-06-01 | 2025-04-01 | Salesforce, Inc. | Systems and methods for a k-nearest neighbor based mechanism of natural language processing models |
| US11076824B1 (en) * | 2020-08-07 | 2021-08-03 | Shenzhen Keya Medical Technology Corporation | Method and system for diagnosis of COVID-19 using artificial intelligence |
| US12106026B2 (en) | 2021-01-05 | 2024-10-01 | Capital One Services, Llc | Extensible agents in agent-based generative models |
| US11847390B2 (en) * | 2021-01-05 | 2023-12-19 | Capital One Services, Llc | Generation of synthetic data using agent-based simulations |
| US12566950B2 (en) | 2021-01-05 | 2026-03-03 | Capital One Services, Llc | Generation of secure synthetic data based on true-source datasets |
| JP7835772B2 (ja) * | 2021-02-22 | 2026-03-25 | ベーリンガー インゲルハイム インターナショナル ゲゼルシャフト ミット ベシュレンクテル ハフツング | 薬剤の治療効果を測定するためのシステム及び方法 |
| US12374092B2 (en) * | 2021-03-01 | 2025-07-29 | Robert Bosch Gmbh | Image analysis model comprising an integer coupling layer |
| US11282609B1 (en) * | 2021-06-13 | 2022-03-22 | Chorus Health Inc. | Modular data system for processing multimodal data and enabling parallel recommendation system processing |
| US20230044078A1 (en) * | 2021-07-30 | 2023-02-09 | Google Llc | Unified Sample Reweighting Framework for Learning with Noisy Data and for Learning Difficult Examples or Groups |
| CN113449205B (zh) * | 2021-08-30 | 2021-11-09 | 四川省人工智能研究院(宜宾) | 一种基于元数据增强的推荐方法及系统 |
| JP7638201B2 (ja) * | 2021-12-02 | 2025-03-03 | 株式会社日立製作所 | 意思決定支援装置、意思決定支援方法、および意思決定支援プログラム |
| JP7798188B2 (ja) * | 2022-06-03 | 2026-01-14 | 日本電気株式会社 | 最適化装置、最適化方法、およびプログラム |
| WO2024107461A1 (en) * | 2022-11-16 | 2024-05-23 | Unlearn.AI, Inc. | Systems and methods for supplementing data with generative models |
| EP4627586A1 (en) * | 2022-12-02 | 2025-10-08 | Valo Health, Inc. | System and method for predicting and optimizing clinical trial outcomes |
| CN115936008B (zh) * | 2022-12-23 | 2023-10-31 | 中国电子产业工程有限公司 | 一种文本建模模型的训练方法、文本建模方法及装置 |
| CN116738180B (zh) * | 2023-06-29 | 2026-04-21 | 中国人民解放军军事科学院国防科技创新研究院 | 基于受限玻尔兹曼机的智能化水平等级评估方法及系统 |
| JP2025176999A (ja) * | 2024-05-22 | 2025-12-05 | 富士通株式会社 | 学習プログラム、学習方法、および情報処理装置 |
Family Cites Families (39)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9342657B2 (en) | 2003-03-24 | 2016-05-17 | Nien-Chih Wei | Methods for predicting an individual's clinical treatment outcome from sampling a group of patient's biological profiles |
| WO2006084196A2 (en) | 2005-02-04 | 2006-08-10 | Entelos, Inc. | Method for defining virtual patient populations |
| CA2628108C (en) | 2005-11-10 | 2020-01-07 | Certara Usa, Inc. | Method and apparatus for computer modeling the human brain for predicting drug effects |
| US20080082359A1 (en) | 2006-09-29 | 2008-04-03 | Searete Llc, A Limited Liability Corporation Of State Of Delaware | Computational systems for biomedical data |
| WO2008157834A1 (en) | 2007-06-21 | 2008-12-24 | University Of South Florida | Materials and methods for diagnosis of asthma |
| US8224665B2 (en) | 2008-06-26 | 2012-07-17 | Archimedes, Inc. | Estimating healthcare outcomes for individuals |
| CH699891A2 (de) | 2008-11-12 | 2010-05-14 | Prof Dr Rene Spiegel | Methode zur Durchführung klinischer Studien und Methode zur Etablierung eines Prognosemodells für klinische Studien. |
| US8630966B2 (en) | 2009-01-27 | 2014-01-14 | Salk Institute For Biological Studies | Temporally dynamic artificial neural networks |
| US20150010610A1 (en) | 2010-02-18 | 2015-01-08 | Osiris Therapeutics, Inc. | Immunocompatible amniotic membrane products |
| US10172567B2 (en) | 2011-06-01 | 2019-01-08 | Drexel University | System and method of detecting and predicting seizures |
| US10176299B2 (en) | 2011-11-11 | 2019-01-08 | Rutgers, The State University Of New Jersey | Methods for the diagnosis and treatment of neurological disorders |
| US9367666B2 (en) | 2012-07-13 | 2016-06-14 | Medical Care Corporation | Mapping cognitive to functional ability |
| EP3007771B1 (en) | 2013-06-12 | 2017-09-06 | University Health Network | Method and system for automated quality assurance and automated treatment planning in radiation therapy |
| CN105765083B (zh) | 2013-09-27 | 2021-05-04 | 加利福尼亚大学董事会 | 基于表观遗传学标记物来估计组织和细胞类型的年龄的方法 |
| EP3234874B1 (en) | 2014-12-18 | 2025-04-02 | Fresenius Medical Care Holdings, Inc. | System and method of conducting in silico clinical trials |
| WO2016145379A1 (en) * | 2015-03-12 | 2016-09-15 | William Marsh Rice University | Automated Compilation of Probabilistic Task Description into Executable Neural Network Specification |
| US10726954B2 (en) | 2015-04-22 | 2020-07-28 | Reciprocal Labs Corporation | Predictive modeling of respiratory disease risk and events |
| GB201506824D0 (en) | 2015-04-22 | 2015-06-03 | Trailreach Ltd | TrailReach Multitrial |
| US10923234B2 (en) | 2016-03-30 | 2021-02-16 | Jacob Barhak | Analysis and verification of models derived from clinical trials data extracted from a database |
| US10398389B1 (en) | 2016-04-11 | 2019-09-03 | Pricewaterhousecoopers Llp | System and method for physiological health simulation |
| US10282588B2 (en) | 2016-06-09 | 2019-05-07 | Siemens Healthcare Gmbh | Image-based tumor phenotyping with machine learning from synthetic data |
| US10387765B2 (en) * | 2016-06-23 | 2019-08-20 | Siemens Healthcare Gmbh | Image correction using a deep generative machine-learning model |
| CN109716346A (zh) | 2016-07-18 | 2019-05-03 | 河谷生物组学有限责任公司 | 分布式机器学习系统、装置和方法 |
| US20180315505A1 (en) | 2017-04-27 | 2018-11-01 | Siemens Healthcare Gmbh | Optimization of clinical decision making |
| US10650929B1 (en) | 2017-06-06 | 2020-05-12 | PathAI, Inc. | Systems and methods for training a model to predict survival time for a patient |
| EP3652751A1 (en) | 2017-07-12 | 2020-05-20 | Fresenius Medical Care Holdings, Inc. | Techniques for conducting virtual clinical trials |
| JP7305656B2 (ja) | 2018-01-17 | 2023-07-10 | アンラーン.エーアイ, インコーポレイテッド | 確率分布をモデル化するためのシステムおよび方法 |
| WO2019144116A1 (en) | 2018-01-22 | 2019-07-25 | Cancer Commons | Platforms for conducting virtual trials |
| EP3732689A4 (en) | 2018-02-21 | 2021-03-10 | Klaritos, Inc. | METHODS FOR CONDUCTING CLINICAL TRIALS |
| US11010365B2 (en) | 2018-03-29 | 2021-05-18 | International Business Machines Corporation | Missing value imputation using adaptive ordering and clustering analysis |
| US10818398B2 (en) | 2018-07-27 | 2020-10-27 | University Of Miami | System and method for AI-based eye condition determinations |
| US20200357490A1 (en) | 2019-05-07 | 2020-11-12 | International Business Machines Corporation | System for creating a virtual clinical trial from electronic medical records |
| US20220157413A1 (en) | 2019-08-23 | 2022-05-19 | Unlearn.AI, Inc. | Systems and Methods for Designing Augmented Randomized Trials |
| US12051487B2 (en) | 2019-08-23 | 2024-07-30 | Unlearn.Al, Inc. | Systems and methods for supplementing data with generative models |
| US12008478B2 (en) | 2019-10-18 | 2024-06-11 | Unlearn.AI, Inc. | Systems and methods for training generative models using summary statistics and other constraints |
| US20210353203A1 (en) | 2020-05-13 | 2021-11-18 | Rce Technologies, Inc. | Diagnostics for detection of ischemic heart disease |
| WO2022101809A1 (en) | 2020-11-10 | 2022-05-19 | University Of Southern California | Noninvasive heart failure detection |
| WO2022120350A2 (en) | 2020-12-01 | 2022-06-09 | Unlearn.AI, Inc. | Methods and systems to account for uncertainties from missing covariates in generative model predictions |
| WO2022187064A1 (en) | 2021-03-01 | 2022-09-09 | Evelo Biosciences, Inc. | Compositions and methods of treating inflammation using prevotella histicola |
-
2019
- 2019-01-16 JP JP2020539258A patent/JP7305656B2/ja active Active
- 2019-01-16 EP EP19741291.9A patent/EP3740908A4/en not_active Withdrawn
- 2019-01-16 US US16/249,854 patent/US11636309B2/en active Active
- 2019-01-16 CN CN201980014482.7A patent/CN111758108A/zh active Pending
- 2019-01-16 WO PCT/US2019/013870 patent/WO2019143737A1/en not_active Ceased
- 2019-01-16 CA CA3088204A patent/CA3088204A1/en active Pending
-
2021
- 2021-11-15 JP JP2021185425A patent/JP2022031730A/ja not_active Withdrawn
Non-Patent Citations (3)
| Title |
|---|
| ARICI, Tarik, et al.,Associative Adversarial Networks,arXiv,2016年11月18日,[online] [検索日:2022.12.21] <URL: https://arxiv.org/abs/1611.06953> |
| HINTON, Geoffrey ,A Practical Guide to Training Restricted Boltzmann Machines,2010年,[online] [検索日:2022.12.21] <URL: http://www.cs.toronto.edu/~hinton/absps/guideTR.pdf> |
| KIM, Taesup, et al.,Deep Directed Generative Models with Energy-Based Probability Estimation,arXiv,2016年06月10日,[online] [検索日:2022.12.21] <URL: https://arxiv.org/abs/1606.03439> |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US12051487B2 (en) | 2019-08-23 | 2024-07-30 | Unlearn.Al, Inc. | Systems and methods for supplementing data with generative models |
| US12008478B2 (en) | 2019-10-18 | 2024-06-11 | Unlearn.AI, Inc. | Systems and methods for training generative models using summary statistics and other constraints |
| US12020789B1 (en) | 2023-02-17 | 2024-06-25 | Unlearn.AI, Inc. | Systems and methods enabling baseline prediction correction |
| US11868900B1 (en) | 2023-02-22 | 2024-01-09 | Unlearn.AI, Inc. | Systems and methods for training predictive models that ignore missing features |
| US11966850B1 (en) | 2023-02-22 | 2024-04-23 | Unlearn.AI, Inc. | Systems and methods for training predictive models that ignore missing features |
Also Published As
| Publication number | Publication date |
|---|---|
| EP3740908A1 (en) | 2020-11-25 |
| EP3740908A4 (en) | 2021-10-20 |
| CA3088204A1 (en) | 2019-07-25 |
| JP2021511584A (ja) | 2021-05-06 |
| US11636309B2 (en) | 2023-04-25 |
| JP2022031730A (ja) | 2022-02-22 |
| WO2019143737A1 (en) | 2019-07-25 |
| US20190220733A1 (en) | 2019-07-18 |
| WO2019143737A8 (en) | 2023-03-23 |
| CN111758108A (zh) | 2020-10-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7305656B2 (ja) | 確率分布をモデル化するためのシステムおよび方法 | |
| Christo et al. | Feature selection and instance selection from clinical datasets using co-operative co-evolution and classification using random forest | |
| Ramchandran et al. | Longitudinal variational autoencoder | |
| CN116364299B (zh) | 一种基于异构信息网络的疾病诊疗路径聚类方法及系统 | |
| Rairikar et al. | Heart disease prediction using data mining techniques | |
| Dayhoff et al. | Artificial neural networks: opening the black box | |
| Lu et al. | A method for optimal detection of lung cancer based on deep learning optimized by marine predators algorithm | |
| JP2019512758A (ja) | マルチモーダル生成機械学習のためのシステムおよび方法 | |
| US20240303544A1 (en) | Graph database techniques for machine learning | |
| Khazaal et al. | Predicting coronary artery disease utilizing support vector machines: optimizing predictive model | |
| Dhaygude et al. | Knowledge‐based deep learning system for classifying Alzheimer's disease for multi‐task learning | |
| Kokala et al. | Bone cancer prediction using regression algorithms and machine learning approaches | |
| Kavitha et al. | An efficient boruta-based feature selection and classification of gene expression data | |
| Islam et al. | Feature selection, clustering, and iomt on biomedical engineering for covid-19 pandemic: A comprehensive review | |
| Evirgen et al. | Prediction and diagnosis of diabetic retinopathy using data mining technique | |
| Nahian et al. | Common human diseases prediction using machine learning based on survey data | |
| Ali et al. | MACHINE LEARNING IN EARLY GENETIC DETECTION OF MULTIPLE SCLEROSIS DISEASE: ASurvey | |
| RU2723674C1 (ru) | Способ прогнозирования диагноза на основе обработки данных, содержащих медицинские знания | |
| Chaudhuri et al. | A case study on disease diagnosis using gene expression data classification with feature selection: Application of data science techniques in health care | |
| US20240169187A1 (en) | Systems and Methods for Supplementing Data With Generative Models | |
| Chattopadhyay et al. | Towards developing intelligent autonomous systems in psychiatry: its present state and future possibilities | |
| Sundin et al. | Improving drug sensitivity predictions in precision medicine through active expert knowledge elicitation | |
| Emer | Variable Selection and Classification for Longitudinal Binary Data Through Three-Step Sparse Boosting | |
| Nwosu | Deep Learning Models For Biomedical Data Analysis | |
| Zhou et al. | Analysis on Computer-Aided Diagnosis of Breast Tumors Based on GA-SVM |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211115 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211115 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221124 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221226 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230224 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230614 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230628 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7305656 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R154 | Certificate of patent or utility model (reissue) |
Free format text: JAPANESE INTERMEDIATE CODE: R154 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |


































































