JP7183385B2 - ノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラム - Google Patents

ノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラム Download PDF

Info

Publication number
JP7183385B2
JP7183385B2 JP2021505770A JP2021505770A JP7183385B2 JP 7183385 B2 JP7183385 B2 JP 7183385B2 JP 2021505770 A JP2021505770 A JP 2021505770A JP 2021505770 A JP2021505770 A JP 2021505770A JP 7183385 B2 JP7183385 B2 JP 7183385B2
Authority
JP
Japan
Prior art keywords
node
target
subset
neighbor
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021505770A
Other languages
English (en)
Other versions
JP2021533474A (ja
Inventor
ホアン,ウェンビン
ルゥォン,ユィ
ホアン,ジュンジョウ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2021533474A publication Critical patent/JP2021533474A/ja
Application granted granted Critical
Publication of JP7183385B2 publication Critical patent/JP7183385B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2323Non-hierarchical techniques based on graph theory, e.g. minimum spanning trees [MST] or graph cuts
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24143Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本願は、2018年11月15日に提出した出願番号が201811361409.0、発明名称が「ノード分類方法、モデル訓練方法及び装置」の中国特許出願の優先権を主張し、その全内容が引用により本願に組み込まれる。
本願はインターネットの技術分野に関し、特にノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラムに関する。
機械学習技術の発展に伴い、ピクチャ分類タスクは目覚ましい進歩を遂げ、関連技術は自動運転、セキュリティ及びゲーム等の多くのシーンに適用されている。ピクチャと同様に、グラフも一般的なデータであり、例えば、ソーシャルネットワーク、ナレッジグラフ及び薬物の分子構造等が挙げられる。
関連技術では、大規模グラフに対して、グラフノード情報を統合するために、専用の反復計算を設定する必要がある。図1に示すように、図1は関連技術におけるグラフノード分類向けのグラフ畳み込みニューラルネットワーク(graph convolutional networks、GCN)分類モデルの模式図であり、図示するように、vはノードであり、aは2つのノードを連結するエッジであり、入力層の各ノードに対して特徴ベクトルの計算を行うと、グラフ情報全体を更新でき、第1層の情報を得て、softmax関数を用いて第1層の情報中の各ノードに対してノードタイプを予測する。
大規模グラフの場合、数千万ひいては数億のノード数が含まれ、数十億の連結エッジが含まれていることが多い。しかしながら、各ノードの特徴情報を更新するために、GCNは1回の特徴情報計算では各ノードをトラバーサルする必要があり、その結果、計算コストが高すぎ、計算リソースが過剰に消費されてしまう。
本願の実施例はノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラムを提供し、GCNが1回の特徴情報計算では各ノードをトラバーサルする必要があり、その結果、計算コストが高すぎ、計算リソースが過剰に消費されてしまう問題を解決することができる。
一態様によれば、コンピュータ機器に適用するノード分類方法を提供し、
ターゲットノードセット中の分類対象ノードを取得するステップであって、前記分類対象ノードは前記ターゲットノードセット中の少なくとも1つのノードを含み、且つ前記分類対象ノードの数は前記ターゲットノードセット中のノードの数よりも小さいステップと、
前記ターゲットノードセットから前記分類対象ノードのネイバー(neighbor)ノードセットを取得するステップであって、前記ネイバーノードセットは少なくとも1つのネイバーノードを含み、前記ネイバーノードと前記分類対象ノードは関連付け関係を有するステップと、
ノード分類モデルによって、前記ネイバーノードセットに応じて前記分類対象ノードのターゲット特徴情報を抽出するステップと、
前記ターゲット特徴情報に応じて前記分類対象ノードの分類結果を決定するステップであって、前記ノード分類モデルは少なくとも1つのサンプルノードサブセットによって訓練されたモデルであり、前記サンプルノードサブセットはサンプルノードセットのサブセットであり、前記サンプルノードセット中のノードはノードタイプがマークされているステップと、を含む。
別の態様によれば、コンピュータ機器に適用するモデル訓練方法を提供し、
ターゲットノードタイプがマークされているサンプルノードセットから、ターゲットノードサブセット及び前記ターゲットノードサブセットに対応するネイバーノードサブセットを取得するステップであって、前記ネイバーノードサブセット中のネイバーノードと前記ターゲットノードサブセット中のターゲットノードは関連付け関係を有するステップと、
前記ネイバーノードサブセットに合わせてノード分類モデルによって前記ターゲットノードサブセットのノード特徴サブセットを抽出するステップであって、前記ノード特徴サブセットは前記ターゲットノードのノード特徴ベクトルを含むステップと、
前記ノード特徴サブセットに応じて前記ターゲットノードに対してタイプ予測を行い、予測タイプ確率サブセットを得るステップと、
前記予測タイプ確率サブセット及び前記ターゲットノードの前記ターゲットノードタイプに応じて前記ノード分類モデルのターゲットモデルパラメータを訓練するステップと、を含む。
別の態様によれば、コンピュータ機器に適用するノード分類装置を提供し、
ターゲットノードセット中の分類対象ノードを取得することに用いられる取得モジュールであって、さらに前記ターゲットノードセットから前記分類対象ノードのネイバーノードセットを取得することに用いられ、前記ネイバーノードセットは少なくとも1つのネイバーノードを含み、前記ネイバーノードと前記分類対象ノードは関連付け関係を有する取得モジュールと、
ノード分類モデルによって、前記ネイバーノードセットに応じて前記分類対象ノードのターゲット特徴情報を抽出することに用いられる抽出モジュールと、
前記ターゲット特徴情報に応じて前記分類対象ノードの分類結果を決定することに用いられる決定モジュールであって、前記ノード分類モデルは少なくとも1つのサンプルノードサブセットによって訓練されたモデルであり、前記サンプルノードサブセットはサンプルノードセットのサブセットであり、前記サンプルノードセット中のノードはノードタイプがマークされている決定モジュールと、を備える。
別の態様によれば、コンピュータ機器に適用するモデル訓練装置を提供し、
ターゲットノードタイプがマークされているサンプルノードセットから、ターゲットノードサブセット及び前記ターゲットノードサブセットに対応するネイバーノードサブセットを取得することに用いられる取得モジュールであって、前記ネイバーノードサブセット中のネイバーノードと前記ターゲットノードサブセット中のターゲットノードは関連付け関係を有する取得モジュールと、
前記ネイバーノードサブセットに合わせてノード分類モデルによって前記ターゲットノードサブセットのノード特徴サブセットを抽出することに用いられる抽出モジュールであって、前記ノード特徴サブセットは前記ターゲットノードのノード特徴ベクトルを含む抽出モジュールと、
前記ノード特徴サブセットに応じて前記ターゲットノードに対してタイプ予測を行い、予測タイプ確率サブセットを得ることに用いられる予測モジュールと、
前記予測タイプ確率サブセット及び前記ターゲットノードの前記ターゲットノードタイプに応じて前記ノード分類モデルのターゲットモデルパラメータを訓練することに用いられる訓練モジュールと、を備える。
別の態様によれば、コンピュータ機器を提供し、プロセッサ及びメモリを備え、前記メモリは少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットを記憶し、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットが前記プロセッサによって読み込んで実行されると、上記本願の実施例のいずれかに記載のノード分類方法又はモデル訓練方法を実現する。
別の態様によれば、コンピュータ可読記憶媒体を提供し、前記記憶媒体は少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットを記憶し、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットが前記プロセッサによって読み込んで実行されると、上記本願の実施例のいずれかに記載のノード分類方法又はモデル訓練方法を実現する。
別の態様によれば、コンピュータプログラム製品を提供し、前記コンピュータプログラム製品がコンピュータによって実行されると、コンピュータに如上記本願の実施例のいずれかに記載のノード分類方法又はモデル訓練方法を実行させる。
以上の技術的解決手段からわかるように、本願の実施例は次の利点を有する。
本願の実施例では、ノード分類過程においてノードに対して特徴更新を行う際に、ターゲットノードセットから分類対象ノードを選択し、該分類対象ノードのネイバーノードセットに応じて該分類対象ノードのノード特徴を決定し、それによってノード特徴に応じてノード分類結果を取得し、上記のようにして、大規模グラフの場合、毎回グラフ中の一部のノードを反復計算すればよく、グラフ中の各ノードをトラバーサルする必要がなく、計算オーバーヘッドを大幅に削減させるとともに、計算リソースを節約する。
本願の実施例の技術的解決手段をより明確に説明するために、以下、実施例の説明に必要な図面を簡単に説明し、明らかなように、以下説明される図面は単に本願のいくつかの実施例であり、当業者は創造的な努力をせずに、これらの図面に基づいてほかの図面を想到し得る。
関連技術におけるグラフノード分類向けのグラフ畳み込みニューラルネットワーク分類モデルの模式図である。 本願の実施例における大規模グラフの模式図である。 本願の実施例におけるノード分類システムのアーキテクチャ模式図である。 本願の実施例におけるノード分類方法の実施例の模式図である。 本願の実施例におけるモデル訓練方法の実施例の模式図である。 本願の実施例におけるグラフのノードをサンプリングする実施例の模式図である。 本願の実施例におけるグラフノードに対してモデル訓練を行う模式的なフローチャートである。 本願の実施例における予測タイプ確率サブセット及びターゲットノードのターゲットノードタイプに応じてノード分類モデルのターゲットモデルパラメータを訓練するフローチャートである。 本願の実施例におけるグラフノードに対してモデル訓練を行う模式的なフローチャートである。 本願の例示的な実施例に係るノード分類装置の構造ブロック図である。 本願の例示的な実施例に係るモデル訓練装置の構造ブロック図である。 本願の実施例におけるサーバの構造模式図である。
本願の実施例はノード分類方法、モデル訓練方法及び装置を提供し、大規模グラフの場合、一部のノードのみに基づいて訓練を行うことができ、毎回グラフ中の一部のノードを反復計算すればよく、グラフ中の各ノードをトラバーサルする必要がなく、計算オーバーヘッドを大幅に削減させるとともに、計算リソースを節約する。
本願の明細書、特許請求の範囲及び上記図面における用語「第1」、「第2」、「第3」、「第4」等(存在する場合)は類似する対象を区別することに用いられ、特定の順序又は順番を示すものではない。理解されるように、ここで説明される本願の実施例が例えば、ここで図示又は説明される順序以外の順序で実施できるように、このように使用されるデータは適切な場合、相互に交換されてもよい。また、用語「含む」、「有する」及びそれらの任意の変形は、非排他的な包含をカバーすることを意図し、例えば、一連のステップ又はユニットを含むプロセス、方法、システム、製品又は機器は明確にリストされるそれらのステップ又はユニットに限定されず、明確にリストされていない又はこれらのプロセス、方法、製品又は機器に固有のほかのステップ又はユニットを含んでもよい。
理解されるように、本願の実施例は主に大規模グラフに適用され、大規模グラフノード向けの分類及び学習を行うことができる。グラフとは、多くのノードを相互に連結して形成されるデータ構造であり、図2に示すように、図2は本願の実施例における大規模グラフの模式図であり、図示するように、各ノードは1つのメンバーを示し、2つのノード間の連結線は連結エッジと呼ばれ、該連結エッジは連結される2つのノードに対応する2つのメンバーが互いに知っていることを示すことに用いられ、A1で指示されるメンバーは同一のクラスに属し、A2で指示されるメンバーは同一のクラスに属し、A3で指示されるメンバーは同一のクラスに属し、A4で指示されるメンバーは同一のクラスに属する。
選択可能に、ノードは通常、人又は組織を指し、ノード間の連結(エッジ)は、多くの場合、特定の社会的関係(例えば、親族関係や取引行為等)を示す。ノードごとに、1つの特徴ベクトルが付与されてもよく、例えば、
Figure 0007183385000001
ノードの特徴ベクトルは
Figure 0007183385000002
であり、該ノードの属性を記述することに用いられる。各エッジは重み値
Figure 0007183385000003
を有してもよく、連結の緊密さを記述することに用いられ、重み値
Figure 0007183385000004
が大きいほど、ノード間が緊密に関連付けられることを示す。各エッジは向きを有してもよく、連結の方向性を示すことに用いられる。選択可能に、本願の実施例におけるグラフの連結エッジは方向性を限定しない。
実際の応用では、ユーザー推薦、友達分類及びネットワークセキュリティシステムの監視等の機能を実現するために、さらにグラフ中のノード間の分類を行う必要がある。即ち、ノードの特徴ベクトル及びノード間の連結関係に応じて、類似するノードを同一タイプに分けるタスクはグラフノード分類と呼ばれ、即ち、ノード
Figure 0007183385000005
をタイプ
Figure 0007183385000006
に分ける。例えば、ソーシャル類アプリケーションプログラム(大規模なグラフ)では、ユーザー画像及びユーザーの友達関係に応じて、ユーザーを、例えば、バスケットボール愛好者、サッカー愛好者又はバレーボール愛好者等の様々なスポーツの愛好者に分けることができる。
理解できるように、本願は適用範囲が広く、上記いくつかのシーンに加えて、支払いネットワークにおける不正ユーザー(例えば、マルチや賭博等)の捕獲(捕捉)に適用されてもよく、友達分類、関係マイニング及び商品推薦等のシーンに適用されてもよく、ここでは限定しない。
理解されるように、本願の実施例で説明されるノード分類システムは図3に示され、図3は本願の実施例におけるノード分類システムのアーキテクチャ模式図であり、ノード分類方法及びモデル訓練方法はいずれもサーバ310に配置されており、サーバ310は大量の端末機器320から送信される情報を受信し、1つの端末機器320が1つのユーザーに対応するとすると、各ユーザーは1つのノードを示し、該ユーザーの情報(例えば、ソーシャル情報)はノード情報を示す。サーバは大量のノードに対応するノード情報を収集して1つの大規模グラフを形成する。理解できるように、図3に示されるサーバ310は1台のサーバであってもよく、複数のサーバを集積したシステムであってもよい。端末機器320はスマートフォン、タブレットコンピュータ、パーソナルコンピュータ(personal computer、PC)、ノートブックコンピュータ及びパームトップコンピュータを含むが、これらに限定されず、ここでは単に例示的なものであり、本願を限定しないと理解すべきである。
上記説明と組み合わせて、本願におけるノード分類方法を説明し、図4に示すように、本願の例示的な実施例に係るノード分類方法のフローチャートであり、該方法が図3に示されるサーバ310に適用されることを例として説明し、該方法は、ステップ101~104を含む。
ステップ101では、ターゲットノードセット中の分類対象ノードを取得する。
選択可能に、該分類対象ノードはターゲットノードセット中の少なくとも1つのノードを含み、且つ分類対象ノードの数はターゲットノードセット中のノードの数よりも小さい。
選択可能に、ターゲットノードセットからノードの一部を分類対象ノードとして選択する。
本実施例では、サーバは、まず、分類対象のノードを取得する必要があり、1つのノードはグラフ中の1つのユーザーに対応し、従って、該分類対象ノードは分類を必要とするターゲットユーザーとみなされてもよい。
ステップ102では、ターゲットノードセットから分類対象ノードのネイバーノードセットを取得し、ネイバーノードセットは少なくとも1つのネイバーノードを含み、ネイバーノードと分類対象ノードは関連付け関係を有する。
本実施例では、サーバが分類対象ノードを取得した後、該分類対象ノードに応じて、それに関連付けられる少なくとも1つのネイバーノードを取得でき、これらのネイバーノードは1つのネイバーノードセットを形成する。分類対象ノードがターゲットユーザーであることを例として、該ターゲットユーザーに関連付けられるネイバーノードは通常、該ターゲットユーザーの友達であってもよい。
理解できるように、ネイバーノードは、分類対象ノードと直接関連付けを有する(即ち、分類対象ノードとネイバーノードがエッジを有する)ノードに加えて、分類対象ノードと間接関連付けを有するノードであってもよく、ここでは限定しない。
選択可能に、該分類対象ノードのネイバーノードセット中のネイバーノードは、少なくとも2つの分類対象ノードと関連付け関係を有するノード、又は、n個の分類対象ノードと関連付け関係を有するノードであり、nは正の整数である。
選択可能に、ネイバーノードセットを決定する際に、まず、分類対象ノードに応じて、ターゲットノードセット中の各候補ネイバーノードの第1候補確率を計算し、各候補ネイバーノードの第1候補確率に応じてネイバーノードセットを決定する。分類対象ノードと第u個の候補ネイバーノードとの間の連結エッジ重み、及び分類対象ノードとターゲットノードセット中のノードとの連結エッジ重みによって、第u個の候補ネイバーノードの第1候補確率を決定し、uは正の整数である。
選択可能に、該候補ネイバーノードの第1候補確率の計算方式は以下の式1を参照する。
Figure 0007183385000007
ただし、
Figure 0007183385000008
は第
Figure 0007183385000009
個の候補ネイバーノードの第1候補確率、
Figure 0007183385000010
はターゲットノードセット中の第
Figure 0007183385000011
個のノード、
Figure 0007183385000012
は分類対象ノード、
Figure 0007183385000013
は分類対象ノードのノード数、
Figure 0007183385000014
はターゲットノードセットのノード数、
Figure 0007183385000015
は1~
Figure 0007183385000016
の整数、
Figure 0007183385000017
は1~
Figure 0007183385000018
の整数、
Figure 0007183385000019
は第
Figure 0007183385000020
個の分類対象ノードと第
Figure 0007183385000021
個の候補ネイバーノードとの間の連結エッジ重み、
Figure 0007183385000022
は第
Figure 0007183385000023
個の分類対象ノードとターゲットノードセット中の第
Figure 0007183385000024
個のノードとの間の連結エッジ重みを示す。
本実施例では、まず、大規模グラフに対応するターゲットノードセットから分類対象ノードを取得し、その後、毎回該部分の分類対象ノードのみを更新すると同時に、この部分の分類対象ノードに応じて特定数の共通関連付けノード(即ち、ネイバーノードセット)を収集して情報統合を行う。
分類対象ノードがターゲットユーザーであることを例として、該ターゲットユーザーに関連付けられるネイバーノードは通常、該ターゲットユーザーの友達であってもよい。理解できるように、ネイバーノードは、分類対象ノードと直接関連付けを有する(即ち、分類対象ノードとネイバーノードが連結エッジを有する)ノードに加えて、ターゲットノードと間接関連付けを有するノードであってもよく、ここでは限定しない。
ステップ103では、ノード分類モデルによって、ネイバーノードセットに応じて分類対象ノードのターゲット特徴情報を抽出する。
本実施例では、サーバはネイバーノードセットによって分類対象ノードの特徴を強化してもよく、それによって該分類対象ノードに対応するターゲット特徴情報を得る。
具体的には、以下の式2を用いて分類対象ノードのターゲット特徴情報を得ることができる。
Figure 0007183385000025
ただし、
Figure 0007183385000026
は分類対象ノード、
Figure 0007183385000027
は分類対象ノードのターゲット特徴情報(即ち、特徴ベクトル)、
Figure 0007183385000028
はネイバーノードセット中のノード数、
Figure 0007183385000029
は1~
Figure 0007183385000030
の整数、
Figure 0007183385000031
は第n個のネイバーノード、
Figure 0007183385000032
は第n個のネイバーノードの多次元特徴ベクトル、
Figure 0007183385000033
は分類対象ノードと第n個のネイバーノードとの連結エッジ重み、
Figure 0007183385000034
はノード分類モデルのモデルパラメータを示す。
以上からわかるように、分類対象ノードのターゲット特徴情報を更新するために、該分類対象ノードに対応するネイバーノードを1つのモデルパラメータと乗算し、さらに合計してターゲット特徴情報を得て、それによって更新後のターゲット特徴情報はそのすべてのネイバーノードの特徴を統合し、且つ情報量を豊か(enrich)にする。
ステップ104では、ターゲット特徴情報に応じて分類対象ノードの分類結果を決定し、ノード分類モデルは少なくとも1つのサンプルノードサブセットに応じて訓練されたモデルであり、該サンプルノードサブセットはサンプルノードセットのサブセットであり、サンプルノードセット中のノードはノードタイプがマークされている。
本実施例では、ノード分類モデルがターゲット特徴情報を計算した後、該ターゲット特徴情報に応じて、該分類対象ノードに対応する分類結果を出力し、例えば、出力される分類結果は分類対象ノードが異常ノードに属することであり、又は、出力される分類結果は分類対象ノードがバスケットボール愛好者ノードに属することである。
ノード分類モデルは少なくとも1つのサンプルノードサブセットに応じて訓練されたものであり、各サンプルノードサブセットのノード数はサンプルノードセットのノード数よりも小さく、つまり、ノード分類モデルはノードの一部に基づいて訓練され、毎回ノードの一部を反復計算し、反復回数が閾値に達するまで繰り返す。機械学習では、分類モデルとは、入力データに対して特定の情報統合を行った後、対応するタイプを出力するものである。分類モデルは1組のモデルパラメータを含み、これらのモデルパラメータは訓練によって最適化調整することができる。
なお、実際の応用では、機械学習方法は、多くの場合、複数回の反復によって各ノードのモデルパラメータを更新する必要があり、毎回、反復はターゲットノードセットからサンプリングされる分類対象ノードのみを対象として行われる。毎回、反復がごく一部のデータのみを使用するが、複数回の反復を経て(毎回反復してサンプリングされる分類対象ノードは異なる)、ターゲットノードセット中のすべてのノードをトラバーサルすることができる。
本願の実施例では、ノード分類方法を提供し、ノード分類過程においてノードに対して特徴更新を行う際に、ターゲットノードセットから分類対象ノードを選択し、該分類対象ノードのネイバーノードセットに応じて該分類対象ノードのノード特徴を決定し、それによってノード特徴に応じてノード分類結果を取得し、上記のようにして、大規模グラフの場合、毎回グラフ中の一部のノードを反復計算すればよく、グラフ中の各ノードをトラバーサルする必要がなく、計算オーバーヘッドを大幅に削減させるとともに、計算リソースを節約する。
上記ノード分類モデルについて、該ノード分類モデルの訓練プロセスを説明し、図5は本願の例示的な実施例に係るモデル訓練方法のフローチャートであり、該方法が図3に示されるサーバ310に適用されることを例として説明し、図5に示すように、該方法はステップ201~204を含む。
ステップ201では、ターゲットノードタイプがマークされているサンプルノードセットから、ターゲットノードサブセット及びターゲットノードサブセットに対応するネイバーノードサブセットを取得し、ネイバーノードサブセット中のネイバーノードとターゲットノードサブセット中のターゲットノードは関連付け関係を有する。
本実施例では、まず、大規模グラフに対応するサンプルノードセットからサンプルノードセットを取得し、その後、毎回ノードの一部(即ち、ターゲットノードサブセット)のみを更新すると同時に、この部分のノード(ターゲットノードサブセット)応じて特定数の共通関連付けノード(即ち、ネイバーノードサブセット)を収集して情報統合を行う。
理解の便宜上、図6に示すように、図6は本願の実施例におけるグラフのノードをサンプリングする実施例の模式図であり、図示するように、サンプルノードセットから10個のノードを含むサンプルノードサブセットを取得し、サンプルノードサブセットは2個のターゲットノード(即ち、図中のノードM及びノードN)を含み、ターゲットノードに応じて、それに関連付けられる8個のネイバーノード(即ち、図中の水玉模様付きノード)を取得し、図6中の白色ノードはサンプルノードセット中のノードに属するが、今回の訓練の対象として選択されていない。
ターゲットノードがターゲットユーザーであることを例として、該ターゲットユーザーに関連付けられるネイバーノードは通常、該ターゲットユーザーの友達であってもよい。理解できるように、ネイバーノードは、ターゲットノードと直接関連付けを有する(即ち、ターゲットノードとネイバーノードがエッジを有する)ノードに加えて、ターゲットノードと間接関連付けを有するノードであってもよく、ここでは限定しない。
選択可能に、このターゲットノードサブセット及びネイバーノードサブセットを取得する方式は、サンプルノードセットからターゲットノードサブセットを取得し、ターゲットノードサブセットに応じてサンプルノードセット中の各候補ネイバーノードの第2候補確率を計算するステップと、選択対象ネイバーノードの第2候補確率に応じてネイバーノードサブセットを決定するステップと、を含む。ターゲットノードサブセット中のターゲットノードと第u個の選択対象ネイバーノードとの間の連結エッジ重み、及びターゲットノードとサンプルノードセット中のノードとの連結エッジ重みによって、第u個の選択対象ネイバーノードの第2候補確率を決定し、uは正の整数である。選択可能に、該選択対象ネイバーノードの選択方式は、上記ステップ102で示される式1を参照すればよく、本実施例では重複説明を省略する。
選択可能に、ターゲットノードに関連付けられるノードは多い可能性があり、このとき、ターゲットノードサブセットに応じてサンプルノードセット中の各選択対象ネイバーノードの確率を計算し、その後、確率が大きい選択対象ネイバーノードをネイバーノードサブセットとして選択する必要がある。
なお、訓練するごとに、選択されるターゲットノードは重複しないが、選択されるネイバーノードは重複する可能性がある。ターゲットノードをサンプリングする際に、ランダムに選択され、極端な条件では、サンプリングされるターゲットノードの共有ネイバーが非常に少なく、このとき、非共有ネイバーノードをネイバーノードとしてもよい。
ステップ202では、ネイバーノードサブセットに合わせて、ノード分類モデルによってターゲットノードサブセットのノード特徴サブセットを抽出し、ノード特徴サブセットはターゲットノードのノード特徴ベクトルを含む。
本実施例では、サーバはターゲットノードサブセット及びネイバーノードサブセットに応じて、ネイバーノードサブセットを利用してターゲットノードサブセット中の各ターゲットノードの特徴を更新し、各ターゲットノードは1つのノード特徴ベクトルに対応し、この場合、各ターゲットノードのノード特徴ベクトルはノード特徴サブセットを形成する。
ステップ203では、ノード特徴サブセットに応じてターゲットノードに対してタイプ予測を行い、予測タイプ確率サブセットを得る。
本実施例では、サーバはターゲットノードサブセット及びノード特徴サブセットを取得した後、各ターゲットノード及びそれに対応するノード特徴ベクトルに応じて、各ターゲットノードの予測タイプ確率を計算し、各ターゲットノードの予測タイプ確率は1つの予測タイプ確率サブセットを形成する。
予測タイプ確率はターゲットノードが特定のタイプであると予測される確率を示すことに用いられ、従って、予測時、通常、確率が最も大きいタイプを該ターゲットノードのタイプとして選択する。
ステップ204では、予測タイプ確率サブセット及びターゲットノードのターゲットノードタイプに応じて、ノード分類モデルのターゲットモデルパラメータを訓練する。
本実施例では、サーバは予測タイプ確率サブセットとターゲットノードタイプとの差に応じて、該ノード分類モデルのターゲットモデルパラメータを調整する。
該ターゲットモデルパラメータは、初期化値、つまり予め定義された1つのパラメータに対応してもよく、又は、該ターゲットモデルパラメータは前回サンプリングされたノードから計算されるモデルパラメータであってもよい。ここでは、各ターゲットノードの予測タイプ確率を利用して第1ターゲットモデルパラメータを最適化し、それによって実際のモデルにさらに近いターゲットモデルパラメータを取得することに相当する。
本実施例では、最後に、サーバは今回訓練された第2モデルパラメータを利用して訓練してノード分類モデルを得る。
なお、実際の応用では、機械学習方法は、多くの場合、複数回の反復によってモデルパラメータを訓練する必要があり、毎回、反復はサンプリングされる小さいノードセットのみを使用する。毎回、反復がごく一部のデータのみを使用するが、複数回の反復を経て(毎回反復用のデータは異なり、即ち、毎回反復訓練用のサンプリングされるターゲットノードは異なり、ネイバーノードも完全に同じではない)、グラフ中のすべてのノードをトラバーサルすることができる。
本願の実施例では、大規模グラフに基づくモデル訓練方法を提供し、まず、サーバはサンプルノードセットからサンプルノードサブセットを取得し、その後、サンプルノードサブセットに応じてノード特性ベクトルサブセットを決定し、サーバはさらにターゲットノードサブセット及びノード特性ベクトルサブセットに応じて予測タイプ確率サブセットを決定し、予測タイプ確率サブセットは少なくとも1つの予測タイプ確率を含み、予測タイプ確率とターゲットノードは対応付け関係を有し、最後に、予測タイプ確率サブセット及び第1モデルパラメータに応じて第2モデルパラメータを決定し、第2モデルパラメータに応じて訓練してノード分類モデルを得る。上記のようにして、大規模グラフの場合、一部のノードのみに基づいて訓練を行うことができ、毎回グラフ中の一部のノードを反復計算すればよく、グラフ中の各ノードをトラバーサルする必要がなく、計算オーバーヘッドを大幅に削減させるとともに、計算リソースを節約する。
選択可能に、上記図5に対応する実施例をもとに、本願の実施例に係るモデル訓練方法の選択可能な実施例では、ネイバーノードサブセットに合わせて、ノード分類モデルによってターゲットノードサブセットのノード特徴サブセットを抽出し、即ち、上記ステップ202は以下のステップ2021~ステップ2022をさらに含んでもよく、図7に示される。
ステップ2021では、ノード分類モデルのターゲットモデルパラメータを決定し、該ターゲットモデルパラメータは訓練対象のモデルパラメータである。
ステップ2022では、ターゲットモデルパラメータ及びネイバーノードサブセットに応じて、ターゲットノードサブセットのノード特徴サブセットを抽出する。
選択可能に、ターゲットモデルパラメータ及びネイバーノードサブセットに応じてノード特徴サブセットを計算する時、第i個のターゲットノードに対して、該第i個のターゲットノードとネイバーノードとの間の連結エッジ重み、ネイバーノードの特徴ベクトル及びターゲットモデルパラメータに応じて、第i個のターゲットノードのノード特徴を決定し、iは正の整数であり、例示的には、該計算プロセスは式3を参照する。
Figure 0007183385000035
ただし、
Figure 0007183385000036
は第
Figure 0007183385000037
個のターゲットノード、
Figure 0007183385000038
は第
Figure 0007183385000039
個のターゲットノードのノード特徴、
Figure 0007183385000040
はターゲットノードサブセットのノード数、
Figure 0007183385000041
は1~
Figure 0007183385000042
の整数、
Figure 0007183385000043
は第
Figure 0007183385000044
個のネイバーノード、
Figure 0007183385000045
は第
Figure 0007183385000046
個のネイバーノードの特徴ベクトル、
Figure 0007183385000047
は第
Figure 0007183385000048
個のターゲットノードと第
Figure 0007183385000049
個のネイバーノードとの連結エッジ重み、
Figure 0007183385000050
はターゲットモデルパラメータを示す。
選択可能に、上記図5に対応する実施例をもとに、本願の実施例に係るモデル訓練方法の選択可能な実施例では、予測タイプ確率サブセット及びターゲットノードのターゲットノードタイプに応じてノード分類モデルのターゲットモデルパラメータを訓練し、即ち、上記ステップ204は以下のステップ2041~ステップ2043をさらに含んでもよく、図8に示される。
ステップ2041では、予測タイプ確率サブセット及びターゲットノードのターゲットノードタイプに応じてターゲット損失値を決定する。
選択可能に、該ターゲット損失値は損失関数又はコスト関数によって計算された数値であり、損失関数又はコスト関数はいずれも予測誤差の程度を測定することができる。つまり、1つのアルゴリズムが良好なアルゴリズムであるか否かを評価するには、1つの損失関数を予め定義する必要があり、それによってこのアルゴリズムが最適であるか否かを判断し、後続では連続的に最適化して勾配降下を求め、損失関数を最小化する。
選択可能に、該ターゲット損失値の計算方式は以下の式4を参照する。
Figure 0007183385000051
ただし、
Figure 0007183385000052
はターゲット損失値、
Figure 0007183385000053
はターゲットノードサブセットのノード数、
Figure 0007183385000054
は1~
Figure 0007183385000055
の整数、
Figure 0007183385000056
は第
Figure 0007183385000057
個のターゲットノード、
Figure 0007183385000058
は第
Figure 0007183385000059
個のターゲットノードの
Figure 0007183385000060
次元特徴ベクトル、
Figure 0007183385000061
は第
Figure 0007183385000062
個のターゲットノードの第
Figure 0007183385000063
次元特徴ベクトル、
Figure 0007183385000064
は指数関数、
Figure 0007183385000065

Figure 0007183385000066
の第
Figure 0007183385000067
個の成分、
Figure 0007183385000068
は第
Figure 0007183385000069
個のターゲットノードの実際タイプ情報、
Figure 0007183385000070
は第
Figure 0007183385000071
個のターゲットノードの第
Figure 0007183385000072
個の予測タイプ確率が実際タイプ情報に等しい確率を示す。
選択可能に、第i個のターゲットノードの予測タイプ確率の計算方式は以下の式5を参照する。
Figure 0007183385000073
選択可能に、予測時、最大確率に対応するタイプを該ターゲットノードのタイプとして選択し、即ち、
Figure 0007183385000074
であり、
ただし、
Figure 0007183385000075
は第
Figure 0007183385000076
個のターゲットノードの予測タイプを示す。
ステップ2042では、ターゲット損失値に応じてモデルパラメータ勾配を決定する。
選択可能に、該モデルパラメータ勾配の計算方式は以下の式6を参照する。
Figure 0007183385000077
ただし、
Figure 0007183385000078
はモデルパラメータ勾配を示し、各
Figure 0007183385000079
の計算方式は以下の式7を参照する。
Figure 0007183385000080
ただし、
Figure 0007183385000081
はターゲット損失、
Figure 0007183385000082
は第
Figure 0007183385000083
次元特徴ベクトルの勾配、
Figure 0007183385000084
は第
Figure 0007183385000085
個のターゲットノードの特徴ベクトルの次元数、
Figure 0007183385000086
はターゲットノードサブセットのノード数、
Figure 0007183385000087
は1~
Figure 0007183385000088
の整数、
Figure 0007183385000089
は1~
Figure 0007183385000090
の整数、
Figure 0007183385000091
は第
Figure 0007183385000092
個のターゲットノードの第
Figure 0007183385000093
次元特徴ベクトル、
Figure 0007183385000094
は第
Figure 0007183385000095
個のターゲットノードの実際タイプ情報、
Figure 0007183385000096
は判断関数、
Figure 0007183385000097
は第
Figure 0007183385000098
個のネイバーノード、
Figure 0007183385000099
は第
Figure 0007183385000100
個のネイバーノードの特徴ベクトル、
Figure 0007183385000101
は指数関数を示す。
選択可能に、該モデルパラメータ勾配の導出プロセスは以下の通りである。
Figure 0007183385000102
ステップ2043では、モデルパラメータ勾配に応じてターゲットモデルパラメータを訓練する。
選択可能に、モデルパラメータ勾配と所定の学習率との積を、ターゲットモデルパラメータの調整差として、該調整差でターゲットモデルパラメータを調整する。
選択可能に、該ターゲットモデルパラメータの調整方式は以下の式8を参照する。
Figure 0007183385000103
ただし、
Figure 0007183385000104
は調整後のターゲットモデルパラメータ、
Figure 0007183385000105
は調整前のモデルパラメータ、
Figure 0007183385000106
は所定の学習率、
Figure 0007183385000107
はモデルパラメータ勾配を示す。
選択可能に、モデル訓練過程では、通常、訓練の回数に応じて、動的に変化する学習率を設定でき、例えば、最初に、モデル訓練を行う時、学習率を0.01~0.001に制御し、所定の回数だけ反復すると、学習率が徐々に減衰し、訓練終了直前、学習率の減衰が通常100倍以上になる。
学習率は主にモデルの学習進度を制御することに用いられ、データセットのサイズに応じて適切な学習率を選択でき、二乗誤差を使用する場合及びコスト関数とする場合、データ量の増加に伴い、学習率は適宜より小さい値に設定されるべきである。
異なる反復では異なる学習率を選択し、最初の反復では、学習率はやや大きく、終了直前、学習率はやや小さい。毎回反復後、推定されるモデルパラメータを使用して誤差関数の値を確認し、前回の反復に比べてエラー率が減少すると、学習率を大きくし、前回の反復に比べて、エラー率が増加すると、前回の反復の値を再設定すべきであり、且つ学習率をこの前の50%まで小さくする。従って、これは学習率の適応調整の方法である。
なお、本実施例における学習率
Figure 0007183385000108
は0.01に設定されてもよく、実際の応用では、学習率
Figure 0007183385000109
はさらに0.00001、0.0001、0.001、0.003、0.03、0.1、0.3、1、3又は10等に設定されてもよく、ここでは限定しない。
選択可能に、本願の実施例では、ターゲットモデルパラメータを訓練する方法を提供し、即ち、サーバは予測タイプ確率サブセット及び実際タイプ情報サブセットに応じてターゲット損失を計算し、その後、ターゲット損失に応じてモデルパラメータ勾配を決定し、最後に、モデルパラメータ勾配に合わせてモデルパラメータを調整する。上記のようにして、確率的勾配降下を採用して各サンプルによってパラメータを1回反復更新し、サンプル全体をトラバーサルせずに最適解を見つけることができ、それによってアルゴリズムの収束速度を大幅に向上させ、また、各サンプルの損失関数を最小化し、毎回の反復結果は必ずしもグローバル最適解ではないが、常にこの方向に展開されるため、最終結果は常にグローバル最適解に近い。
説明の便宜上、図9に示すように、図9は本願の実施例におけるグラフノードに対してモデル訓練を行う模式的なフローチャートであり、図示するように、具体的にはステップS1~S13を含む。
ステップS1では、モデル訓練のプロセスを開始する。
ステップS2では、反復カウンタt=1とし、サンプリングされるノード数b=128を設定し、反復カウンタはプログラムが何回反復されるかを記録し、t=1の場合、プログラムは第1回の反復を開始し、即ち、ステップS2~ステップS10を実行し、その後、反復回数を1増やし、反復カウンタによって記録される反復回数が10に達するか否かを判断し、NOであると、さらに第2回の反復を行う。
ステップS3では、反復カウンタによって記録される反復回数が10よりも大きいか否かを判断し、反復回数が10よりも大きいと、ステップS12に進み、一方、反復回数が10以下であると、ステップS4に進み、即ち、1回の反復計算を開始する。
ステップS4では、サンプルノードセットから128個のターゲットノードをサンプリングし、即ち

Figure 0007183385000110
である。
ステップS5では、上記式1を利用して128個のネイバーノード

Figure 0007183385000111
を収集する。
ステップS6では、上記式3を利用して128個のターゲットノードの特徴ベクトル

Figure 0007183385000112
を収集する。
ステップS7では、上記式5を利用してターゲットノードの予測タイプ


Figure 0007183385000113
を得る。
ステップS8では、交差エントロピーに応じて予測タイプと実際タイプの損失値を比較する。
ステップS9では、上記式7を利用してモデルパラメータの勾配を計算する。
ステップS10では、上記式8を利用してモデルパラメータを更新する。
ステップS11では、反復カウンタの値を1増やし、即ち、t=t+1である。
ステップS12では、tが10よりも大きいことを満たすと、モデルパラメータを出力する。
ステップS13では、モデル訓練のプロセスが終了する。
本願に係るモデル訓練方法に基づいて、実際のソーシャルネットワークに対して試験を行ったが、該ネットワークは合計で31965個のノード及び11606919本のエッジを有し、各ノードの特徴次元数は602であり、該ネットワークはタイプ数が合計で41である。2つのノード間に連結エッジを有する場合、重みを1とし、一方、2つのノード間に連結エッジがない場合、重みを0とする。モデル訓練を実現するために、ノード数が152410の訓練セットを構築し、訓練セット中のノードタイプは既知である。
また、さらにノード数が55334のテストセットを構築し、分類モデルの予測精度をテストすることに用いられる。現在、予測精度を採用して分類モデルの予測能力を評価する。
Figure 0007183385000114
ただし、
Figure 0007183385000115
はテストセット中のタイプ予測が正確なノード数を示し、
Figure 0007183385000116
は予測能力を示し、
Figure 0007183385000117
が大きいほど、予測能力が高い。また、さらにモデルの毎回の訓練時間を比較することによって実行速度を評価してもよい。
次に、本願の実施例で採用される方法を、従来の解決手段で採用されるGCNと比較し、表1に示すように、同様な実験条件における比較は以下の通りである。
Figure 0007183385000118
以上からわかるように、本願の実施例で採用される方法に対応する予測精度はGCNに非常に近いが、実行時間が大幅に減少した。従って、サンプリングに基づく仮定アルゴリズムによって、毎回のノード特徴の更新を小さいノードサブセットで行うだけでよく、実際実行速度を大幅に向上させ、メモリを削減させる。実際のソーシャルネットワークデータにおいて、得られる予測精度がGCNに近いが、速度が約50倍向上した。
図10は本願の例示的な実施例に係るノード分類装置の構造ブロック図であり、該装置がコンピュータ機器に適用されることを例として、図10に示すように、該装置は、取得モジュール1010、抽出モジュール1020及び決定モジュール1030を備え、
取得モジュール1010は、ターゲットノードセット中の分類対象ノードを取得することに用いられ、
前記取得モジュール1010はさらに、前記ターゲットノードセットから前記分類対象ノードのネイバーノードセットを取得することに用いられ、前記ネイバーノードセットは少なくとも1つのネイバーノードを含み、前記ネイバーノードと前記分類対象ノードは関連付け関係を有し、
抽出モジュール1020は、ノード分類モデルによって、前記ネイバーノードセットに応じて前記分類対象ノードのターゲット特徴情報を抽出することに用いられ、
決定モジュール1030は、前記ターゲット特徴情報に応じて前記分類対象ノードの分類結果を決定することに用いられ、前記ノード分類モデルは少なくとも1つのサンプルノードサブセットによって訓練されたモデルであり、前記サンプルノードサブセットはサンプルノードセットのサブセットであり、前記サンプルノードセット中のノードはノードタイプがマークされている。
選択可能な実施例では、前記取得モジュール1010はさらに、前記分類対象ノードに応じて前記ターゲットノードセット中の各候補ネイバーノードの第1候補確率を計算し、各前記候補ネイバーノードの前記第1候補確率に応じて前記ネイバーノードセットを決定することに用いられる。
選択可能な実施例では、前記取得モジュール1010はさらに、前記分類対象ノードと第u個の前記候補ネイバーノードとの間の連結エッジ重み、及び前記分類対象ノードと前記ターゲットノードセット中のノードとの連結エッジ重みによって、第u個の前記選択対象ネイバーノードの前記第1候補確率を決定することに用いられ、uは正の整数である。
以上のように、本実施例に係るノード分類装置は、ノード分類過程においてノードに対して特徴更新を行う際に、ターゲットノードセットから分類対象ノードを選択し、該分類対象ノードのネイバーノードセットに応じて該分類対象ノードのノード特徴を決定し、それによってノード特徴に応じてノード分類結果を取得し、上記のようにして、大規模グラフの場合、毎回グラフ中の一部のノードを反復計算すればよく、グラフ中の各ノードをトラバーサルする必要がなく、計算オーバーヘッドを大幅に削減させるとともに、計算リソースを節約する。
図11は本願の例示的な実施例に係るモデル訓練装置の構造ブロック図であり、該装置がコンピュータ機器に適用されることを例として、図11に示すように、該装置は、取得モジュール1110、抽出モジュール1120、予測モジュール1130及び訓練モジュール1140を備え、
取得モジュール1110は、ターゲットノードタイプがマークされているサンプルノードセットから、ターゲットノードサブセット及び前記ターゲットノードサブセットに対応するネイバーノードサブセットを取得することに用いられ、前記ネイバーノードサブセット中のネイバーノードと前記ターゲットノードサブセット中のターゲットノードは関連付け関係を有し、
抽出モジュール1120は、前記ネイバーノードサブセットに合わせてノード分類モデルによって前記ターゲットノードサブセットのノード特徴サブセットを抽出することに用いられ、前記ノード特徴サブセットは前記ターゲットノードのノード特徴ベクトルを含み、
予測モジュール1130は、前記ノード特徴サブセットに応じて前記ターゲットノードに対してタイプ予測を行い、予測タイプ確率サブセットを得ることに用いられ、
訓練モジュール1140は、前記予測タイプ確率サブセット及び前記ターゲットノードの前記ターゲットノードタイプに応じて前記ノード分類モデルのターゲットモデルパラメータを訓練することに用いられる。
選択可能な実施例では、前記取得モジュール1110はさらに、前記サンプルノードセットから前記ターゲットノードサブセットを取得し、前記ターゲットノードサブセットに応じて前記サンプルノードセット中の選択対象ネイバーノードの第2候補確率を計算し、前記選択対象ネイバーノードの前記第2候補確率に応じて前記ネイバーノードサブセットを決定することに用いられる。
選択可能な実施例では、前記取得モジュール1110はさらに、前記ターゲットノードサブセット中の前記ターゲットノードと第u個の前記選択対象ネイバーノードとの間の連結エッジ重み、及び前記ターゲットノードと前記サンプルノードセット中のノードとの連結エッジ重みによって、第u個の前記選択対象ネイバーノードの前記第2候補確率を決定することに用いられ、uは正の整数である。
選択可能な実施例では、前記抽出モジュール1120はさらに、前記ノード分類モデルのターゲットモデルパラメータを決定することに用いられ、前記ターゲットモデルパラメータは訓練対象のモデルパラメータであり、前記ターゲットモデルパラメータ及び前記ネイバーノードサブセットに応じて前記ターゲットノードサブセットのノード特徴サブセットを抽出することに用いられる。
選択可能な実施例では、前記抽出モジュール1120はさらに、第i個の前記ターゲットノードと前記ネイバーノードとの間の連結エッジ重み、前記ネイバーノードの特徴ベクトル及び前記ターゲットモデルパラメータに応じて、第i個の前記ターゲットノードのノード特徴を決定することに用いられ、iは正の整数である。
選択可能な実施例では、前記訓練モジュール1140はさらに、前記予測タイプ確率サブセット及び前記ターゲットノードの前記ターゲットノードタイプに応じてターゲット損失値を決定し、前記ターゲット損失値に応じて前記モデルパラメータ勾配を決定し、前記モデルパラメータ勾配に応じて前記ターゲットモデルパラメータを訓練することに用いられる。
選択可能な実施例では、前記訓練モジュール1140はさらに、前記モデルパラメータ勾配と所定の学習率との積を前記ターゲットモデルパラメータの調整差とし、前記調整差で前記ターゲットモデルパラメータを調整することに用いられる。
以上のように、本実施例に係るモデル訓練装置は、ノード分類過程においてノードに対して特徴更新を行う際に、ターゲットノードセットから分類対象ノードを選択し、該分類対象ノードのネイバーノードセットに応じて該分類対象ノードのノード特徴を決定し、それによってノード特徴に応じてノード分類結果を取得し、上記のようにして、大規模グラフの場合、毎回グラフ中の一部のノードを反復計算すればよく、グラフ中の各ノードをトラバーサルする必要がなく、計算オーバーヘッドを大幅に削減させるとともに、計算リソースを節約する。
図12は本願の例示的な実施例に係るサーバの構造模式図である。該サーバは図3に示されるサーバ310であってもよい。具体的には、
サーバ1200は中央処理装置(CPU、Central Processing Unit)1201と、ランダムアクセスメモリ(RAM、Random Access Memory)1202及び読み出し専用メモリ(ROM、Read Only Memory)1203を含むシステムメモリ1204と、システムメモリ1204と中央処理装置1201とを接続するシステムバス1205と、を備える。サーバ1200は、コンピュータ内の各デバイス間で情報を伝送するのを助ける基本的な入力/出力システム(I/Oシステム、Input Output System)1206と、オペレーティングシステム1213、アプリケーションプログラム1214及びほかのプログラムモジュール1215を記憶することに用いられる大容量記憶装置1207と、をさらに備える。
基本的な入力/出力システム1206は、情報を表示することに用いられるディスプレイ1208と、例えば、マウス、キーボードのような、ユーザーが情報を入力することに用いられる入力機器1209と、を備える。ディスプレイ1208及び入力機器1209はいずれもシステムバス1205に接続される入力出力コントローラ1210によって中央処理装置1201に接続される。基本的な入力/出力システム1206は、キーボード、マウス、又は電子スタイラス等の複数のほかの機器からの入力を受信して処理することに用いられる入力出力コントローラ1210をさらに備えてもよい。同様に、入力出力コントローラ1210はさらにディスプレイスクリーン、プリンタ又はほかのタイプの出力機器への出力を提供する。
大容量記憶装置1207はシステムバス1205に接続される大容量記憶コントローラ(図示せず)によって、中央処理装置1201に接続される。大容量記憶装置1207及びそれに関連付けられるコンピュータ可読媒体はサーバ1200に不揮発性記憶を提供する。つまり、大容量記憶装置1207は、例えば、ハードディスク又は読み出し専用のコンパクトディスク(CD-ROM、Compact Disc Read Only Memory)ドライブのようなコンピュータ可読媒体(図示せず)を含んでもよい。
一般性を失うことなく、コンピュータ可読媒体はコンピュータ記憶媒体及び通信媒体を含んでもよい。コンピュータ記憶媒体は、例えば、コンピュータ可読命令、データ構造、プログラムモジュール又はほかのデータ等の情報を記憶することに用いられ任意の方法又は技術で実現される揮発性及び不揮発性、取り外し可能及び取り外し不能な媒体を含む。コンピュータ記憶媒体はRAM、ROM、可消去可能プログラマブル読み出し専用メモリ(EPROM、Erasable Programmable Read Only Memory)、電気的消去可能プログラマブル読み出し専用メモリ(EEPROM、Electrically Erasable Programmable Read Only Memory)、フラッシュメモリ又はほかのソリッドステートメモリ技術、CD-ROM、デジタル多用途ディスク(DVD、Digital Versatile Disc)又はほかの光学記憶、テープカセット、磁気テープ、磁気ディスク記憶又はほかの磁気記憶装置を含む。勿論、当業者であれば、コンピュータ記憶媒体は上記のものに限定されないと理解できる。上記システムメモリ1204及び大容量記憶装置1207はメモリと総称されてもよい。
本願の各実施例によれば、サーバ1200はさらに、例えばインターネット等のネットワークによってネットワークにおける遠隔コンピュータに接続されて動作してもよい。即ち、サーバ1200はシステムバス1205に接続されるネットワークインターフェースユニット1211によってネットワーク1212に接続されてもよく、又は、ネットワークインターフェースユニット1211を使用してほかのタイプのネットワーク又は遠隔コンピュータシステム(図示せず)に接続されてもよい。
上記メモリは1つ以上のプログラムをさらに含んでもよく、1つ以上のプログラムはメモリに記憶され、CPUによって実行されるように構成される。
本願の実施例はコンピュータ機器をさらに提供し、該コンピュータ機器はプロセッサ及びメモリを備え、該メモリは少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットを記憶し、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットがプロセッサによって読み込んで実行されると、上記各方法の実施例に係るノード分類方法又はモデル訓練方法を実現する。
本願の実施例はコンピュータ可読記憶媒体をさらに提供し、該コンピュータ可読記憶媒体は少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットを記憶し、少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットがプロセッサによって読み込んで実行されると、上記各方法の実施例に係るノード分類方法又はモデル訓練方法を実現する。
理解されるように、本明細書に記載の「複数」とは2つ以上である。「及び/又は」は関連対象の関連関係を説明するものであり、3種の関係が存在することを示し、例えば、A及び/又はBの場合、Aのみが存在すること、AとBが同時に存在すること、及びBのみが存在することを示す。文字「/」は、一般には、前後の関連対象が「又は」の関係を有することを示す。
当業者が理解できるように、上記実施例のステップの全部又は一部は、ハードウェアによって実現されてもよく、プログラムによって関連ハードウェアに命令を出して実現されてもよく、上記プログラムはコンピュータ可読記憶媒体に記憶されてもよく、上記記憶媒体は読み出し専用メモリ、磁気ディスク又は光ディスク等であってもよい。
以上、本願の選択可能な実施例を説明したが、本願を限定するものではない。本願の趣旨及び原則を逸脱せずに行われる任意の変更、同等置換や改良等はすべて本願の保護範囲に属する。

Claims (18)

  1. コンピュータ機器が実行するノード分類方法であって、
    ターゲットノードセット中の分類対象ノードを取得するステップであって、前記分類対象ノードは前記ターゲットノードセット中の少なくとも1つのノードを含み、且つ前記分類対象ノードの数は前記ターゲットノードセット中のノードの数よりも小さいステップと、
    前記ターゲットノードセットから前記分類対象ノードのネイバーノードセットを取得するステップであって、前記ネイバーノードセットは少なくとも1つのネイバーノードを含み、前記ネイバーノードと前記分類対象ノードは関連付け関係を有するステップと、
    ノード分類モデルによって、前記ネイバーノードセットに応じて前記分類対象ノードのターゲット特徴情報を抽出するステップと、
    前記ターゲット特徴情報に応じて前記分類対象ノードの分類結果を決定するステップであって、前記ノード分類モデルは少なくとも1つのサンプルノードサブセットによって訓練されたモデルであり、前記サンプルノードサブセットはサンプルノードセットのサブセットであり、前記サンプルノードセット中のノードはノードタイプがマークされているステップと、を含み、
    前記ターゲットノードセットから前記分類対象ノードのネイバーノードセットを取得する前記ステップは、
    前記分類対象ノードに応じて前記ターゲットノードセット中の各候補ネイバーノードの第1候補確率を計算するステップと、
    各前記候補ネイバーノードの前記第1候補確率に応じて前記ネイバーノードセットを決定するステップと、を含むことを特徴とするノード分類方法。
  2. 前記分類対象ノードに応じて前記ターゲットノードセット中の各候補ネイバーノードの第1候補確率を計算する前記ステップは、
    前記分類対象ノードとu番目の前記候補ネイバーノードとの間の連結エッジ重み、及び前記分類対象ノードと前記ターゲットノードセット中のノードとの連結エッジ重みによって、u番目の選択対象ネイバーノードの前記第1候補確率を決定するステップであって、uは正の整数であるステップを含むことを特徴とする請求項に記載のノード分類方法。
  3. コンピュータ機器が実行するモデル訓練方法であって、
    ターゲットノードタイプがマークされているサンプルノードセットから、ターゲットノードサブセット及び前記ターゲットノードサブセットに対応するネイバーノードサブセットを取得するステップであって、前記ネイバーノードサブセット中のネイバーノードと前記ターゲットノードサブセット中のターゲットノードは関連付け関係を有するステップと、
    前記ネイバーノードサブセットに合わせてノード分類モデルによって前記ターゲットノードサブセットのノード特徴サブセットを抽出するステップであって、前記ノード特徴サブセットは前記ターゲットノードのノード特徴ベクトルを含むステップと、
    前記ノード特徴サブセットに応じて前記ターゲットノードに対してタイプ予測を行い、予測タイプ確率サブセットを得るステップと、
    前記予測タイプ確率サブセット及び前記ターゲットノードの前記ターゲットノードタイプに応じて前記ノード分類モデルのターゲットモデルパラメータを訓練するステップと、を含み、
    ターゲットノードタイプがマークされているサンプルノードセットから、ターゲットノードサブセット及び前記ターゲットノードサブセットに対応するネイバーノードサブセットを取得する前記ステップは、
    前記サンプルノードセットから前記ターゲットノードサブセットを取得するステップと、
    前記ターゲットノードサブセットに応じて前記サンプルノードセット中の選択対象ネイバーノードの第2候補確率を計算するステップと、
    前記選択対象ネイバーノードの前記第2候補確率に応じて前記ネイバーノードサブセットを決定するステップと、を含むことを特徴とするモデル訓練方法。
  4. 前記ターゲットノードサブセットに応じて前記サンプルノードセット中の選択対象ネイバーノードの第2候補確率を計算する前記ステップは、
    前記ターゲットノードサブセット中の前記ターゲットノードとu番目の前記選択対象ネイバーノードとの間の連結エッジ重み、及び前記ターゲットノードと前記サンプルノードセット中のノードとの連結エッジ重みによって、u番目の前記選択対象ネイバーノードの前記第2候補確率を決定するステップであって、uは正の整数であるステップを含むことを特徴とする請求項に記載のモデル訓練方法。
  5. 前記ネイバーノードサブセットに合わせてノード分類モデルによって前記ターゲットノードサブセットのノード特徴サブセットを抽出する前記ステップは、
    前記ノード分類モデルのターゲットモデルパラメータを決定するステップであって、前記ターゲットモデルパラメータは訓練対象のモデルパラメータであるステップと、
    前記ターゲットモデルパラメータ及び前記ネイバーノードサブセットに応じて前記ターゲットノードサブセットのノード特徴サブセットを抽出するステップと、を含むことを特徴とする請求項に記載のモデル訓練方法。
  6. 前記ターゲットモデルパラメータ及び前記ネイバーノードサブセットに応じて前記ターゲットノードサブセットのノード特徴サブセットを抽出する前記ステップは、
    i番目の前記ターゲットノードと前記ネイバーノードとの間の連結エッジ重み、前記ネイバーノードの特徴ベクトル及び前記ターゲットモデルパラメータに応じて、i番目の前記ターゲットノードのノード特徴を決定するステップであって、iは正の整数であるステップを含むことを特徴とする請求項に記載のモデル訓練方法。
  7. 前記予測タイプ確率サブセット及び前記ターゲットノードの前記ターゲットノードタイプに応じて前記ノード分類モデルのターゲットモデルパラメータを訓練する前記ステップは、
    前記予測タイプ確率サブセット及び前記ターゲットノードの前記ターゲットノードタイプに応じてターゲット損失値を決定するステップと、
    前記ターゲット損失値に応じてモデルパラメータ勾配を決定するステップと、
    前記モデルパラメータ勾配に応じて前記ターゲットモデルパラメータを訓練するステップと、を含むことを特徴とする請求項のいずれか一項に記載のモデル訓練方法。
  8. 前記モデルパラメータ勾配に応じて前記ターゲットモデルパラメータを訓練する前記ステップは、
    前記モデルパラメータ勾配と所定の学習率との積を前記ターゲットモデルパラメータの調整差とするステップと、
    前記調整差で前記ターゲットモデルパラメータを調整するステップと、を含むことを特徴とする請求項に記載のモデル訓練方法。
  9. コンピュータ機器に適用するノード分類装置であって、
    ターゲットノードセット中の分類対象ノードを取得することに用いられ、さらに前記ターゲットノードセットから前記分類対象ノードのネイバーノードセットを取得することに用いられる取得モジュールであって、前記ネイバーノードセットは少なくとも1つのネイバーノードを含み、前記ネイバーノードと前記分類対象ノードは関連付け関係を有する取得モジュールと、
    ノード分類モデルによって、前記ネイバーノードセットに応じて前記分類対象ノードのターゲット特徴情報を抽出することに用いられる抽出モジュールと、
    前記ターゲット特徴情報に応じて前記分類対象ノードの分類結果を決定することに用いられる決定モジュールであって、前記ノード分類モデルは少なくとも1つのサンプルノードサブセットによって訓練されたモデルであり、前記サンプルノードサブセットはサンプルノードセットのサブセットであり、前記サンプルノードセット中のノードはノードタイプがマークされている決定モジュールと、を備え
    前記取得モジュールはさらに、前記分類対象ノードに応じて前記ターゲットノードセット中の各候補ネイバーノードの第1候補確率を計算し、各前記候補ネイバーノードの前記第1候補確率に応じて前記ネイバーノードセットを決定することに用いられることを特徴とするノード分類装置。
  10. 前記取得モジュールはさらに、前記分類対象ノードとu番目の前記候補ネイバーノードとの間の連結エッジ重み、及び前記分類対象ノードと前記ターゲットノードセット中のノードとの連結エッジ重みによって、u番目の選択対象ネイバーノードの前記第1候補確率を決定することに用いられ、uは正の整数であることを特徴とする請求項に記載のノード分類装置。
  11. コンピュータ機器に適用するモデル訓練装置であって、
    ターゲットノードタイプがマークされているサンプルノードセットから、ターゲットノードサブセット及び前記ターゲットノードサブセットに対応するネイバーノードサブセットを取得することに用いられる取得モジュールであって、前記ネイバーノードサブセット中のネイバーノードと前記ターゲットノードサブセット中のターゲットノードは関連付け関係を有する取得モジュールと、
    前記ネイバーノードサブセットに合わせてノード分類モデルによって前記ターゲットノードサブセットのノード特徴サブセットを抽出することに用いられる抽出モジュールであって、前記ノード特徴サブセットは前記ターゲットノードのノード特徴ベクトルを含む抽出モジュールと、
    前記ノード特徴サブセットに応じて前記ターゲットノードに対してタイプ予測を行い、予測タイプ確率サブセットを得ることに用いられる予測モジュールと、
    前記予測タイプ確率サブセット及び前記ターゲットノードの前記ターゲットノードタイプに応じて前記ノード分類モデルのターゲットモデルパラメータを訓練することに用いられる訓練モジュールと、を備え
    前記取得モジュールはさらに、前記サンプルノードセットから前記ターゲットノードサブセットを取得し、前記ターゲットノードサブセットに応じて前記サンプルノードセット中の選択対象ネイバーノードの第2候補確率を計算し、前記選択対象ネイバーノードの前記第2候補確率に応じて前記ネイバーノードサブセットを決定することに用いられることを特徴とするモデル訓練装置。
  12. 前記取得モジュールはさらに、前記ターゲットノードサブセット中の前記ターゲットノードとu番目の前記選択対象ネイバーノードとの間の連結エッジ重み、及び前記ターゲットノードと前記サンプルノードセット中のノードとの連結エッジ重みによって、u番目の前記選択対象ネイバーノードの前記第2候補確率を決定することに用いられ、uは正の整数であることを特徴とする請求項11に記載のモデル訓練装置。
  13. 前記抽出モジュールはさらに、前記ノード分類モデルのターゲットモデルパラメータを決定することに用いられ、前記ターゲットモデルパラメータは訓練対象のモデルパラメータであり、前記ターゲットモデルパラメータ及び前記ネイバーノードサブセットに応じて前記ターゲットノードサブセットのノード特徴サブセットを抽出することに用いられることを特徴とする請求項11に記載のモデル訓練装置。
  14. 前記抽出モジュールはさらに、i番目の前記ターゲットノードと前記ネイバーノードとの間の連結エッジ重み、前記ネイバーノードの特徴ベクトル及び前記ターゲットモデルパラメータに応じて、i番目の前記ターゲットノードのノード特徴を決定することに用いられ、iは正の整数であることを特徴とする請求項13に記載のモデル訓練装置。
  15. 前記訓練モジュールはさらに、前記予測タイプ確率サブセット及び前記ターゲットノードの前記ターゲットノードタイプに応じてターゲット損失値を決定し、前記ターゲット損失値に応じてモデルパラメータ勾配を決定し、前記モデルパラメータ勾配に応じて前記ターゲットモデルパラメータを訓練することに用いられることを特徴とする請求項1114のいずれか一項に記載のモデル訓練装置。
  16. 前記訓練モジュールはさらに、前記モデルパラメータ勾配と所定の学習率との積を前記ターゲットモデルパラメータの調整差とし、前記調整差で前記ターゲットモデルパラメータを調整することに用いられることを特徴とする請求項15に記載のモデル訓練装置。
  17. コンピュータ機器であって、プロセッサ及びメモリを備え、前記メモリは少なくとも1つの命令、少なくとも1つのプログラム、コードセット又は命令セットを記憶し、前記少なくとも1つの命令、前記少なくとも1つのプログラム、前記コードセット又は命令セットが前記プロセッサによって読み込んで実行されると、請求項1又は2に記載のノード分類方法又は請求項のいずれか一項に記載のモデル訓練方法を実現することを特徴とするコンピュータ機器。
  18. コンピュータに請求項1又は2に記載のノード分類方法又は請求項のいずれか一項に記載のモデル訓練方法を実現することを特徴とするコンピュータプログラム。
JP2021505770A 2018-11-15 2019-11-11 ノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラム Active JP7183385B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201811361409.0A CN109460793B (zh) 2018-11-15 2018-11-15 一种节点分类的方法、模型训练的方法及装置
CN201811361409.0 2018-11-15
PCT/CN2019/117173 WO2020098606A1 (zh) 2018-11-15 2019-11-11 节点分类方法、模型训练方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
JP2021533474A JP2021533474A (ja) 2021-12-02
JP7183385B2 true JP7183385B2 (ja) 2022-12-05

Family

ID=65610518

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021505770A Active JP7183385B2 (ja) 2018-11-15 2019-11-11 ノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラム

Country Status (5)

Country Link
US (1) US11853882B2 (ja)
EP (1) EP3882820A4 (ja)
JP (1) JP7183385B2 (ja)
CN (1) CN109460793B (ja)
WO (1) WO2020098606A1 (ja)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109460793B (zh) 2018-11-15 2023-07-18 腾讯科技(深圳)有限公司 一种节点分类的方法、模型训练的方法及装置
CN110188422B (zh) * 2019-05-16 2022-12-20 深圳前海微众银行股份有限公司 一种基于网络数据提取节点的特征向量的方法及装置
CN112132305B (zh) * 2019-06-25 2024-12-17 腾讯科技(深圳)有限公司 节点类别确定方法、相关装置、设备及存储介质
JP7114528B2 (ja) * 2019-07-08 2022-08-08 株式会社東芝 推論装置、学習装置、推論方法及び学習方法
CN110659723B (zh) * 2019-09-03 2023-09-19 腾讯科技(深圳)有限公司 基于人工智能的数据处理方法、装置、介质及电子设备
CN110705629A (zh) * 2019-09-27 2020-01-17 北京市商汤科技开发有限公司 数据处理方法及相关装置
CN110956643A (zh) * 2019-12-04 2020-04-03 齐鲁工业大学 一种基于MDNet的改进车辆跟踪方法及系统
WO2021210414A1 (ja) * 2020-04-17 2021-10-21 株式会社Roxy 可視化方法、これに用いるプログラム、および、可視化装置、並びに、これを備える判別装置
CN113743425B (zh) * 2020-05-27 2024-10-22 北京沃东天骏信息技术有限公司 一种生成分类模型的方法和装置
CN111881936A (zh) * 2020-06-19 2020-11-03 北京三快在线科技有限公司 训练样本筛选方法、装置、电子设备及存储介质
CN112183627B (zh) * 2020-09-28 2024-07-19 中星技术股份有限公司 生成预测密度图网络的方法和车辆年检标数量检测方法
CN114358291B (zh) * 2020-09-30 2024-04-09 本源量子计算科技(合肥)股份有限公司 量子连通图的交叉连线处理方法、装置、终端及存储介质
US20220284340A1 (en) * 2021-03-02 2022-09-08 Adobe Inc. Determining digital personas utilizing data-driven analytics
CN112860806B (zh) * 2021-04-06 2022-09-02 中国科学技术大学 数据分类方法及装置、存储介质及电子设备
CN113713381B (zh) * 2021-09-09 2023-06-20 腾讯科技(深圳)有限公司 对象管理方法、装置、设备、存储介质及系统
CN113807500A (zh) * 2021-09-18 2021-12-17 中国电信股份有限公司 一种用于异常用户识别的方法、介质及装置
CN114265988B (zh) * 2021-12-20 2024-09-10 人工智能与数字经济广东省实验室(广州) 基于重要性得分的好友推荐方法
US12488223B2 (en) * 2021-12-21 2025-12-02 International Business Machines Corporation Federated learning for training machine learning models
CN114662706B (zh) * 2022-03-24 2024-07-12 支付宝(杭州)信息技术有限公司 一种模型训练方法、装置及设备
CN114722937B (zh) * 2022-04-06 2024-07-16 腾讯科技(深圳)有限公司 一种异常数据检测方法、装置、电子设备和存储介质
CN114862592B (zh) * 2022-04-21 2026-02-27 北京百度网讯科技有限公司 图节点类别获取的方法、装置及电子设备
CN115146725B (zh) * 2022-06-30 2023-05-30 北京百度网讯科技有限公司 对象分类模式的确定方法、对象分类方法、装置和设备
CN115329838A (zh) * 2022-07-07 2022-11-11 武汉理工大学 一种考虑类别不平衡的属性图异常检测方法
CN115081024B (zh) * 2022-08-16 2023-01-24 杭州金智塔科技有限公司 基于隐私保护的去中心化业务模型训练方法及装置
CN118171150A (zh) * 2022-12-08 2024-06-11 马上消费金融股份有限公司 分类模型的训练方法、类别识别方法及计算机设备
CN116016199B (zh) * 2023-02-21 2023-06-09 山东海量信息技术研究院 一种信息控制方法、系统、电子设备及可读存储介质
CN118964284B (zh) * 2024-07-22 2025-07-18 寒序科技(北京)有限公司 概率计算加速卡、概率计算加速方法、装置和介质

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8930422B2 (en) * 2012-06-04 2015-01-06 Northrop Grumman Systems Corporation Pipelined incremental clustering algorithm
US9912523B2 (en) * 2015-01-20 2018-03-06 Telefonaktiebolaget Lm Ericsson (Publ) Systems and methods for multi-variate attribute correlation
CN106503319A (zh) * 2016-10-13 2017-03-15 中国人民解放军国防科学技术大学 一种适用于网络节点分类方法评估的仿真网络生成方法
CN106776729B (zh) 2016-11-18 2020-08-14 同济大学 一种大规模知识图谱路径查询预测器构造方法
CN106997474A (zh) * 2016-12-29 2017-08-01 南京邮电大学 一种基于深度学习的图节点多标签分类方法
US10573003B2 (en) * 2017-02-13 2020-02-25 Amit Sethi Systems and methods for computational pathology using points-of-interest
CN108520275A (zh) * 2017-06-28 2018-09-11 浙江大学 一种基于邻接矩阵的连接信息规整系统、图特征提取系统、图分类系统和方法
CN108319953B (zh) * 2017-07-27 2019-07-16 腾讯科技(深圳)有限公司 目标对象的遮挡检测方法及装置、电子设备及存储介质
US11797838B2 (en) * 2018-03-13 2023-10-24 Pinterest, Inc. Efficient convolutional network for recommender systems
CN109460793B (zh) * 2018-11-15 2023-07-18 腾讯科技(深圳)有限公司 一种节点分类的方法、模型训练的方法及装置
US11625611B2 (en) * 2019-12-31 2023-04-11 X Development Llc Training artificial neural networks based on synaptic connectivity graphs
US11620487B2 (en) * 2019-12-31 2023-04-04 X Development Llc Neural architecture search based on synaptic connectivity graphs

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
John Boaz Lee, et al.,"Higher-order Graph Convolutional Networks",arXiv:1809.07697v1,version v1,[online], arXiv (Cornell University),2018年09月12日,Pages 1-9,[令和4年4月12日検索], インターネット, <URL: https://arxiv.org/abs/1809.07697v1>.
伏見 卓恭(外3名),「隣接関係を考慮したノード群へのアノテーション付与法」,第12回ネットワーク生態学シンポジウム予稿集,[USB],日本,(社)情報処理学会ネットワーク生態学研究グループ,2015年08月04日,全2頁,(特許庁受入日:平成27年8月12日).
河原達也 編著,「音声認識システム」,改訂2版,日本,株式会社オーム社,2016年09月15日,第63~64頁,ISBN: 978-4-274-21936-8.
立花 誠人(外1名),「構造特徴とグラフ畳み込みを用いたネットワークの半教師あり学習」,第115回知識ベースシステム研究会資料(SIG-KBS-B802),日本,一般社団法人 人工知能学会,2018年11月15日,第20~25頁.
荒木 雅弘,「フリーソフトではじめる機械学習入門」,第2版,日本,森北出版株式会社,2018年04月20日,第147~148頁,ISBN: 978-4-627-85212-9.
藤田 一弥(外1名)著, 株式会社フォワードネットワーク監修,「実装 ディープラーニング」,第1版,日本,株式会社オーム社,2016年11月30日,第48~56頁,ISBN: 978-4-274-21999-3.

Also Published As

Publication number Publication date
CN109460793A (zh) 2019-03-12
WO2020098606A1 (zh) 2020-05-22
EP3882820A1 (en) 2021-09-22
JP2021533474A (ja) 2021-12-02
US11853882B2 (en) 2023-12-26
US20210142108A1 (en) 2021-05-13
CN109460793B (zh) 2023-07-18
EP3882820A4 (en) 2022-01-05

Similar Documents

Publication Publication Date Title
JP7183385B2 (ja) ノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラム
US10958748B2 (en) Resource push method and apparatus
US11481617B2 (en) Generating trained neural networks with increased robustness against adversarial attacks
CN109905772B (zh) 视频片段查询方法、装置、计算机设备及存储介质
CN113742580B (zh) 目标类型数据的召回方法、装置、电子设备及存储介质
CN113821657A (zh) 基于人工智能的图像处理模型训练方法及图像处理方法
CN109993627B (zh) 推荐方法、推荐模型的训练方法、装置和存储介质
CN110851621B (zh) 基于知识图谱预测视频精彩级别的方法、装置及存储介质
CN111325350B (zh) 可疑组织发现系统和方法
WO2018102014A1 (en) Determination of similarity between videos using shot duration correlation
CN111159481B (zh) 图数据的边预测方法、装置及终端设备
CN115705706B (zh) 视频处理方法、装置、计算机设备和存储介质
CN115225336B (zh) 一种面向网络环境的漏洞可利用性的计算方法及装置
CN115730139B (zh) 基于异质多兴趣建模的短视频推荐方法及装置
US20250013868A1 (en) Method and apparatus for training machine learning model, device, and storage medium
CN111079930A (zh) 数据集质量参数的确定方法、装置及电子设备
CN113536069B (zh) 误标注数据识别方法、装置、计算机设备和存储介质
JP2017021606A (ja) 動画像検索方法、動画像検索装置及びそのプログラム
CN113763193A (zh) 群体检测方法、装置、电子设备和计算机存储介质
CN114519893B (zh) 一种分阶段注意时序对齐的少样本动作识别方法
CN113128217B (zh) 一种基于网络孪生空间的舆情处置决策方法
CN117608984A (zh) 软件新版本评分方法、装置、设备及存储介质
CN116384508A (zh) 一种面向横向联邦学习的低质数据主动忘却方法
CN115690465A (zh) 图像多标签分类方法、装置、计算机设备和存储介质
CN115994839A (zh) 作答准确率的预测方法、装置、设备及介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221122

R150 Certificate of patent or registration of utility model

Ref document number: 7183385

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250