JP2018200524A - 分類装置、分類方法および分類プログラム - Google Patents

分類装置、分類方法および分類プログラム Download PDF

Info

Publication number
JP2018200524A
JP2018200524A JP2017104304A JP2017104304A JP2018200524A JP 2018200524 A JP2018200524 A JP 2018200524A JP 2017104304 A JP2017104304 A JP 2017104304A JP 2017104304 A JP2017104304 A JP 2017104304A JP 2018200524 A JP2018200524 A JP 2018200524A
Authority
JP
Japan
Prior art keywords
label
granularity
classification
teacher data
assigned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017104304A
Other languages
English (en)
Other versions
JP6725452B2 (ja
Inventor
友貴 山中
Tomoki Yamanaka
友貴 山中
真徳 山田
Masanori Yamada
真徳 山田
彩子 長谷川
Ayako Hasegawa
彩子 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017104304A priority Critical patent/JP6725452B2/ja
Publication of JP2018200524A publication Critical patent/JP2018200524A/ja
Application granted granted Critical
Publication of JP6725452B2 publication Critical patent/JP6725452B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】階層構造をもつラベルが付与された教師データを用いてセキュリティインシデントの種別を分類する。【解決手段】取得部15cが、分類の階層を表す粒度の異なるラベルが付与された教師データを取得し、変換部15dが、取得された第2の粒度のラベルが付与されたデータのラベルを、第1の粒度のラベルに変換する。データに付与する第1の粒度のラベルを出力する粗分類部15aは、取得された第1の粒度のラベルが付与された教師データと、変換された第1の粒度のラベルが付与された教師データとを用いて、第1の粒度のラベルの付与を学習する。データに付与する粒度が第1の粒度より細かい粒度のラベルを出力し、第1の粒度のラベルから第2の粒度のラベルを出力する細分類部15bは、取得された第2の粒度のラベルが付与された教師データと、粗分類部15aが出力した第1の粒度のラベルとを用いて、第2の粒度のラベルの付与を学習する。【選択図】図1

Description

本発明は、分類装置、分類方法および分類プログラムに関する。
近年、データの質の向上、データ数の増加、計算リソースの増加、あるいは機械学習のアルゴリズムの進歩に伴って、深層学習を用いた分類問題を解く事例が増加している。深層学習は、教師データとして与えられたラベル情報に基づいて、自動的にデータの特徴を抽出しながら学習を行うことにより、高い分類性能を示すことが知られている。
例えば、通信データ等に基づいて深層学習を用いて、発生したセキュリティインシデントの種別を自動的に分類することができる。その場合には、通信データ等に対してインシデントの種別を示すラベルが付与された教師データが必要となる。深層学習に用いられる教師データには、同じ階層で分類されている同じ粒度のラベルが付与されている必要がある。例えば、「DoS攻撃」と「XXXマルウェアによるDoS攻撃」とは粒度が異なるラベルであり、そのままでは深層学習に用いることができない。
ここで、教師データは、人手によりラベルを付与したり、ウィルスチェックのサービスサイトであるVirusTotal等からセキュリティベンダが付与したラベルの情報を取得したりすることにより用意される。人手により付与されたラベルの粒度は、ラベル付与を実施した実施者によって異なる場合がある。また、セキュリティベンダにより付与されたラベルや、SHA−1ハッシュ値等がラベルとして用いられる場合には、ラベルが異なる粒度の階層構造をもつ場合がある。
Richard P.Lippmann、"Pattern Classification Using Neural Networks"、[online]、1989年11月、IEEE Communications Magazine、pp.47-64、[2017年5月11日検索]、インターネット<URL:http://ieeexplore.ieee.org/abstract/document/41401/> Tom Auld、Andrew W.Moore、Stephen F.Gull、"Bayesian Neural Networks for Internet Traffic Classification"、 [online]、2007年1月、IEEE TRANSACTIONS ON NEWRAL NETWORKS、VOL.18、pp.223-239、[2017年5月11日検索]、インターネット<URL: http://ieeexplore.ieee.org/abstract/document/4049810/>
しかしながら、従来の技術では、階層構造をもつラベルが付与された教師データを用いてセキュリティインシデントの種別を分類することは困難であった。例えば、深層学習を用いてセキュリティインシデントの種別を分類する場合に、大量のインシデントのデータを収集し、各データに対して粒度の揃った適切なラベルを付与することは困難である。一方、粗い粒度のラベルの教師データを用いる場合には、細かい粒度の詳細なラベルが付与された教師データは学習に使用できない。また、新たなセキュリティインシデントが発見された場合にも、適切な粒度のラベルが付与されなければ教師データとして追加することができない。
本発明は、上記に鑑みてなされたものであって、階層構造をもつラベルが付与された教師データを用いてセキュリティインシデントの種別を分類することを目的とする。
上述した課題を解決し、目的を達成するために、本発明に係る分類装置は、データに付与する分類の階層を表す第1の粒度のラベルを出力する粗分類部と、データに付与する粒度が前記第1の粒度のラベルより細かい第2の粒度のラベルを出力するとともに、前記第1の粒度のラベルから前記第2の粒度のラベルを出力する細分類部と、前記第1の粒度のラベルが付与された教師データまたは前記第2の粒度のラベルが付与された教師データを取得する取得部と、取得された前記第2の粒度のラベルが付与された教師データのラベルを、前記第1の粒度のラベルに変換する変換部と、を備え、前記粗分類部は、取得された前記第1の粒度のラベルが付与された教師データと、変換された前記第1の粒度のラベルが付与された教師データとを用いて、前記第1の粒度のラベルの付与を学習し、前記細分類部は、取得された前記第2の粒度のラベルが付与された教師データと、前記粗分類部が出力した前記第1の粒度のラベルとを用いて、前記第2の粒度のラベルの付与を学習することを特徴とする。
本発明によれば、階層構造をもつラベルが付与された教師データを用いてセキュリティインシデントの種別を分類することができる。
図1は、本発明の一実施形態に係る分類装置の概略構成を例示する模式図である。 図2は、ラベル情報のデータ構成を例示する図である。 図3は、分類装置の処理概要を説明するための説明図である。 図4は、ラベルの変換について説明するための説明図である。 図5は、他の実施形態に係る分類装置の構成を説明するための説明図である。 図6は、分類処理手順を示すフローチャートである。 図7は、分類プログラムを実行するコンピュータを例示する図である。
以下、図面を参照して、本発明の一実施形態を詳細に説明する。なお、この実施形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。
[分類装置の構成]
図1は、分類装置の概略構成を例示する模式図である。図1に例示するように、分類装置10は、パソコン等の汎用コンピュータで実現され、入力部11、出力部12、通信制御部13、記憶部14、および制御部15を備える。
入力部11は、キーボードやマウス等の入力デバイスを用いて実現され、操作者による入力操作に対応して、制御部15に対して処理開始などの各種指示情報を入力する。出力部12は、液晶ディスプレイなどの表示装置、プリンター等の印刷装置等によって実現される。
通信制御部13は、NIC(Network Interface Card)等で実現され、LAN(Local Area Network)やインターネットなどの電気通信回線を介したIoT機器2等の外部の装置と制御部15との通信を制御する。
記憶部14は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現され、後述する分類処理により特定される正常な状態のモデルのパラメータ等が記憶される。なお、記憶部14は、通信制御部13を介して制御部15と通信する構成でもよい。
本実施形態において、記憶部14には、ラベル情報14aが格納される。ラベル情報14aは、分類装置10で分類されたデータに付与されるラベルと、各ラベルの分類の階層を表す粒度とを示す情報である。ラベル情報14aは、例えば、米国政府が推進しているサイバー攻撃対策において、検知に有効なサイバー攻撃を特徴付ける指標等を記述するための技術仕様であるSTIX(Structured Threat Information eXpression)を参照して構築される。
図2は、ラベル情報14aのデータ構成を例示する図である。図2には、マルウェアが行った通信のネットワークログを分類する場合の階層型のラベルが例示されている。図2に示す例では、DoS、ランサムウェア、およびトロイの木馬は、階層1の粒度の粗いラベルである。また、例えばDoSマルウェア1およびDoSマルウェア2は、階層1のDoSより粒度の細かい階層2のラベルである。
図1の説明に戻る。制御部15は、CPU(Central Processing Unit)等を用いて実現され、メモリに記憶された処理プログラムを実行する。これにより、制御部15は、図1に例示するように、粗分類部15a、細分類部15b、取得部15c、および変換部15dとして機能する。なお、これらの機能部は、それぞれ、あるいは一部が異なるハードウェアに実装されてもよい。
粗分類部15aは、データに付与する分類の階層を表す第1の粒度のラベルを出力する。また、細分類部15bは、データに付与する粒度が第1の粒度のラベルより細かい第2の粒度のラベルを出力するとともに、第1の粒度のラベルから第2の細かい粒度のラベルを出力する。第1の粒度のラベルとは、例えば、図2に例示した階層1のラベルであり、第2の粒度のラベルとは、階層2のラベルである。以下、第1の粒度のラベルを粒度の粗いラベルとも記し、第2の粒度のラベルを粒度の細かいラベルまたは詳細ラベルとも記す。
ここで、図3を参照して粗分類部15aおよび細分類部15bについて説明する。図3は、分類装置10の処理概要を説明するための説明図である。図3に例示するように、本実施形態の分類装置10は、2階層の階層型のラベルのうち、粒度の粗いラベルを出力する粗分類部15aと、粒度の細かいラベルを出力する細分類部15bとが組み合わされて構成される。
粗分類部15aは、単一の階層のラベルを取り扱う従来の分類装置と同様に構成され、データxが入力されると、隠れ層(hidden)を介して、データxに付与する「DoS」等の粒度の粗いラベルyを出力する。細分類部15bは、hiddenを介して、入力されたデータxに付与する「DoSマルウェア1」等の粒度の細かい詳細ラベルzを出力する。また、細分類部15bは、hiddenを介して、入力された粒度の粗いラベルyから粒度の細かい詳細ラベルzを出力する。
粗分類部15aおよび細分類部15bは、後述するように、階層型の粒度の異なるラベルが付与されたデータを教師データとして深層学習を行う。これにより、分類装置10は入力されたデータxに付与する詳細ラベルzを高精度に出力することが可能となる。このように、深層学習で最適化される誤差関数を拡張することにより、分類装置10の分類性能を向上させることが可能となる。
なお、粗分類部15aおよび細分類部15bの深層学習の方式は限定されず、例えば、変分オートエンコーダ(Variational auto encoder)等を用いた高度な半教師あり学習が適用されてもよい。
図1の説明に戻る。取得部15cは、第1の粒度のラベルが付与された教師データまたは第2の粒度のラベルが付与された教師データを取得する。例えば、取得部15cは、入力部11あるいは通信制御部13を介して、階層型のラベルが付与されたデータを教師データとして取得する。
変換部15dは、取得された第2の粒度のラベルが付与された教師データのラベルを、第1の粒度のラベルに変換する。具体的には、変換部15dは、階層型のラベルを階層の数の要素をもつベクトル形式に変換する。
図4は、ラベルの変換について説明するための説明図である。図4に例示するように、変換部15dは、ラベル情報14aを参照し、例えば人手により付与された粒度のそろっていない2階層の階層型のラベルを、2つの要素をもつベクトルに変換する。例えば、変換部15dは、「DoSマルウェア1」を(DoS,DoSマルウェア1)に変換する。
また、粗いラベルのみが付与されていて詳細ラベルが不明である場合に、変換部15dは、(DoS,*)あるいは(DoS,null)のように、不明な詳細ラベルの値を*またはnull等とする。図4に示す例では、例えば、階層1の粒度の粗いラベルである「トロイの木馬」が(トロイの木馬,*)というベクトルに変換されている。これにより、変換部15dは、取得部15cが取得した教師データのラベルが階層2の詳細ラベルであった場合に、ラベル情報14aを参照し、階層1の粗いラベルに変換する。
なお、マルウェアが行った通信のネットワークログを、SHA−1ハッシュ値等で表されるマルウェア検体IDをラベルとして用いて分類する場合には、変換部15dは、マルウェア検体IDを元にして、最適な階層の階層型ラベルに変換する。その際、変換部15dは、必要以上に詳細な階層の値、あるいは信頼度の低い階層の値を*またはnull等とする。
そして、粗分類部15aは、取得された第1の粒度のラベルが付与された教師データと、変換された第1の粒度のラベルが付与された教師データとを用いて、第1の粒度のラベルの付与を学習する。また、細分類部15bは、取得された第2の粒度の詳細ラベルが付与された教師データと、粗分類部15aが出力した第1の粒度のラベルとを用いて、第2の粒度の詳細ラベルの付与を学習する。
言い換えれば、粒度の粗いラベルが付与された教師データが入力された場合に、粗分類部15aが粒度の粗いラベルの付与を学習する。また、粒度の細かい詳細ラベルが付与された教師データが入力された場合に、変換部15dが詳細ラベルを粒度の粗いラベルに変換することにより、粗分類部15aが粒度の粗いラベルの付与を学習する。また、細分類部15bが、粒度の細かい詳細ラベルが付与された教師データと、粗分類部15aが出力した粒度の粗いラベルとを用いて、詳細ラベルの付与を学習する。このように、分類装置10は、粒度の粗いラベルが付与された教師データおよび粒度の細かい詳細ラベルが付与された教師データのすべての教師データを用いて、詳細ラベルの付与を学習することが可能となる。
なお、分類装置10が取り扱うラベルの階層は3以上でもよい。ここで、図5を参照して、その場合の分類装置の構成を説明する。その場合に、分類装置10は、さらに、データに付与する、第1の粒度よりさらに粗い粒度のラベルを出力する粗分類部15αを備え、該粗分類部15αが粗分類部15aに連結される
図5には、分類装置10が3階層のラベルを取り扱う場合について例示されている。図5に示すように、階層1の粒度の粗いラベルを出力する粗分類部15aに、粗分類部15aと同様に構成され階層1よりさらに粒度の粗いラベルを出力する粗分類部15αが連結されている。これにより、分類装置10が、詳細ラベル、粗いラベル、および、さらに粗いラベルの3階層のラベルを取り扱うことが可能となる。
分類装置10が4階層のラベルを取り扱う場合には、粗分類部15aおよび粗分類部15αと同様に構成され粒度が最も粗いラベルを出力する新たな粗分類部が、粗分類部15αに連結される。このように、分類装置10が取り扱うラベルの階層の数が増えた場合には、粗分類部15aと同様に構成され粒度が最も粗いラベルを出力する新たな粗分類部を分類装置10に連結することにより実現可能となる。これにより、分類装置10は、多様な教師データを用いて最も粒度の細かい詳細ラベルの付与を学習することが可能となる。
[分類処理]
次に、図6を参照して、本実施形態に係る分類装置10による分類処理について説明する。図6は、分類処理手順を示すフローチャートである。図6のフローチャートは、例えば、分類処理の開始を指示する操作入力があったタイミングで開始される。
まず、取得部15cが、入力部11あるいは通信制御部13を介して、粒度の粗いラベルが付与された教師データまたは粒度の細かいラベルが付与された教師データを取得する(ステップS1)。
次に、変換部15dが、教師データに付与されている階層型のラベルを階層の数の要素をもつベクトル形式に変換することにより、取得された教師データに詳細ラベルが付与されている場合には、詳細ラベルを粒度の粗いラベルに変換する(ステップS2)。
取得部15cが、粒度の粗いラベルが付与された教師データを取得した場合に(ステップS3、Yes)、粗分類部15aが粗いラベルの付与を学習する(ステップS4)。また、取得部15cが、詳細ラベルが付与された教師データを取得した場合に(ステップS3,No)、粗分類部15aが粗いラベルの付与を学習し、細分類部15bが詳細ラベルの付与を学習する(ステップS5)。これにより、一連の分類処理が終了する。
以上、説明したように、本実施形態の分類装置10において、粗分類部15aが、データに付与する分類の階層を表す第1の粒度の粗いラベルを出力する。また、細分類部15bが、データに付与する第1の粒度より細かい第2の粒度の詳細ラベルを出力するとともに、第1の粒度の粗いラベルから第2の粒度の詳細ラベルを出力する。また、取得部15cが、第1の粒度の粗いラベルが付与された教師データまたは第2の粒度の詳細ラベルが付与された教師データを取得する。
また、変換部15dが、取得された第2の粒度の詳細ラベルが付与された教師データのラベルを、第1の粒度の粗いラベルに変換する。粗分類部15aは、取得された第1の粒度の粗いラベルが付与された教師データと、変換された第1の粒度の粗いラベルが付与された教師データとを用いて、第1の粒度の粗いラベルの付与を学習する。また、細分類部15bは、取得された第2の粒度の詳細ラベルが付与された教師データと、粗分類部15aが出力した第1の粒度の粗いラベルとを用いて、第2の粒度の詳細ラベルの付与を学習する。
この場合に、粗分類部15aは、大量の教師データを用いて学習するので、精度が向上する。また、細分類部15bは、分類対象のデータに加え、粒度の粗いラベルを用いて分類するので、精度が向上する。また、粒度の粗いラベルが付与された教師データが無駄にされることなく詳細ラベルの付与の学習に利用される。
このように、分類装置10は、階層型の粒度の異なるラベルが付与されたすべての教師データを用いて、詳細ラベルの付与を学習することが可能となる。これにより、ラベルの粒度に関わらず、幅広くより多くのラベルの情報を教師データとして学習できるので、分類性能が向上する。
また、セキュリティインシデントの原因を絞り込みながら、その時点でわかった範囲で抽象的なラベルが付与された教師データを用いて学習することが可能となる。同一のマルウェアに対して、セキュリティベンダごとに異なるラベルが付与されていても、異なるラベルの教師データを用いて学習することができる。このように、本実施形態の分類装置10の分類処理により、階層構造をもつラベルが付与された教師データを用いてセキュリティインシデントの種別を分類することできる。
さらに、データに付与するさらに粒度の粗いラベルを出力する粗分類部15αを備え、該粗分類部15αが粗分類部15aに連結されてもよい。これにより、分類装置10が3階層のラベルを取り扱うことが可能となる。このように、分類装置10は、多数階層構造の多様なラベルが付与された教師データを用いて、最も粒度の細かい詳細ラベルの付与を学習することが可能となる。
[実施例]
次に、本実施形態の分類装置10と、単一の階層のラベルを取り扱う従来の分類装置について、以下の条件で実験を行って、分類精度を測定した。ここで、従来の分類装置は、hiddenを介して入力されたデータに付与する粒度の細かい詳細ラベルを出力する。入力されるデータは、手書き数字の画像データとし、詳細ラベルは、1,2,…の10種の数字のラベルとした。また、本実施形態の分類装置10で取り扱われる粒度の粗いラベルは、偶数または奇数の2種類のラベルとした。
本実施形態の分類装置10および従来の分類装置のそれぞれに、詳細ラベルが付与された教師データ300件を入力し、粗いラベルが付与された教師データ9700件を本実施形態の分類装置10に入力し、詳細ラベルの付与の学習を行った。その後、本実施形態の分類装置10および従来の分類装置のそれぞれに、学習されていない未知のデータ10000件を入力した。その結果、従来の分類装置の分類精度は82%であった。これに対し、本実施形態の分類装置10の分類精度は87%であり、約5%の分類精度の向上が確認された。
[プログラム]
上記実施形態に係る分類装置10が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。一実施形態として、分類装置10は、パッケージソフトウェアやオンラインソフトウェアとして上記の分類処理を実行する分類プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の分類プログラムを情報処理装置に実行させることにより、情報処理装置を分類装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型またはノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)などの移動体通信端末、さらには、PDA(Personal Digital Assistants)などのスレート端末などがその範疇に含まれる。
また、分類装置10は、ユーザが使用する端末装置をクライアントとし、当該クライアントに上記の分類処理に関するサービスを提供するサーバ装置として実装することもできる。例えば、分類装置10は、教師データおよび未知のデータを入力とし、未知のデータに付与するラベルを出力する分類処理サービスを提供するサーバ装置として実装される。この場合、分類装置10は、Webサーバとして実装することとしてもよいし、アウトソーシングによって上記の分類処理に関するサービスを提供するクラウドとして実装することとしてもかまわない。以下に、分類装置10と同様の機能を実現する分類プログラムを実行するコンピュータの一例を説明する。
図7は、分類プログラムを実行するコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010と、CPU1020と、ハードディスクドライブインタフェース1030と、ディスクドライブインタフェース1040と、シリアルポートインタフェース1050と、ビデオアダプタ1060と、ネットワークインタフェース1070とを有する。これらの各部は、バス1080によって接続される。
メモリ1010は、ROM(Read Only Memory)1011およびRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1031に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1041に接続される。ディスクドライブ1041には、例えば、磁気ディスクや光ディスク等の着脱可能な記憶媒体が挿入される。シリアルポートインタフェース1050には、例えば、マウス1051およびキーボード1052が接続される。ビデオアダプタ1060には、例えば、ディスプレイ1061が接続される。
ここで、ハードディスクドライブ1031は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093およびプログラムデータ1094を記憶する。上記実施形態で説明した各テーブルは、例えばハードディスクドライブ1031やメモリ1010に記憶される。
また、分類プログラムは、例えば、コンピュータ1000によって実行される指令が記述されたプログラムモジュール1093として、ハードディスクドライブ1031に記憶される。具体的には、上記実施形態で説明した分類装置10が実行する各処理が記述されたプログラムモジュール1093が、ハードディスクドライブ1031に記憶される。
また、分類プログラムによる情報処理に用いられるデータは、プログラムデータ1094として、例えば、ハードディスクドライブ1031に記憶される。そして、CPU1020が、ハードディスクドライブ1031に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して、上述した各手順を実行する。
なお、分類プログラムに係るプログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1031に記憶される場合に限られず、例えば、着脱可能な記憶媒体に記憶されて、ディスクドライブ1041等を介してCPU1020によって読み出されてもよい。あるいは、分類プログラムに係るプログラムモジュール1093やプログラムデータ1094は、LANやWAN(Wide Area Network)等のネットワークを介して接続された他のコンピュータに記憶され、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
以上、本発明者によってなされた発明を適用した実施形態について説明したが、本実施形態による本発明の開示の一部をなす記述および図面により本発明は限定されることはない。すなわち、本実施形態に基づいて当業者等によりなされる他の実施形態、実施例および運用技術等は全て本発明の範疇に含まれる。
10 分類装置
11 入力部
12 出力部
13 通信制御部
14 記憶部
14a ラベル情報
15 制御部
15a 粗分類部
15b 細分類部
15c 取得部
15d 変換部

Claims (4)

  1. データに付与する分類の階層を表す第1の粒度のラベルを出力する粗分類部と、
    データに付与する粒度が前記第1の粒度のラベルより細かい第2の粒度のラベルを出力するとともに、前記第1の粒度のラベルから前記第2の粒度のラベルを出力する細分類部と、
    前記第1の粒度のラベルが付与された教師データまたは前記第2の粒度のラベルが付与された教師データを取得する取得部と、
    取得された前記第2の粒度のラベルが付与された教師データのラベルを、前記第1の粒度のラベルに変換する変換部と、を備え、
    前記粗分類部は、取得された前記第1の粒度のラベルが付与された教師データと、変換された前記第1の粒度のラベルが付与された教師データとを用いて、前記第1の粒度のラベルの付与を学習し、
    前記細分類部は、取得された前記第2の粒度のラベルが付与された教師データと、前記粗分類部が出力した前記第1の粒度のラベルとを用いて、前記第2の粒度のラベルの付与を学習することを特徴とする分類装置。
  2. さらに、データに付与する、前記第1の粒度よりさらに粗い粒度のラベルを出力する第2の粗分類部を備え、該第2の粗分類部が前記粗分類部に連結されることを特徴とする請求項1に記載の分類装置。
  3. 分類装置で実行される分類方法であって、
    データに付与する分類の階層を表す第1の粒度のラベルを出力する粗分類工程と、
    データに付与する粒度が前記第1の粒度のラベルより細かい第2の粒度のラベルを出力するとともに、前記第1の粒度のラベルから前記第2の粒度のラベルを出力する細分類工程と、
    前記第1の粒度のラベルが付与された教師データまたは前記第2の粒度のラベルが付与された教師データを取得する取得工程と、
    取得された前記第2の粒度のラベルが付与された教師データのラベルを、前記第1の粒度のラベルに変換する変換工程と、を含み、
    前記粗分類工程において、取得された前記第1の粒度のラベルが付与された教師データと、変換された前記第1の粒度のラベルが付与された教師データとを用いて、前記第1の粒度のラベルの付与を学習し、
    前記細分類工程において、取得された前記第2の粒度のラベルが付与された教師データと、前記粗分類工程において出力された前記第1の粒度のラベルとを用いて、前記第2の粒度のラベルの付与を学習することを特徴とする分類方法。
  4. データに付与する分類の階層を表す第1の粒度のラベルを出力する粗分類ステップと、
    データに付与する粒度が前記第1の粒度のラベルより細かい第2の粒度のラベルを出力するとともに、前記第1の粒度のラベルから前記第2の粒度のラベルを出力する細分類ステップと、
    前記第1の粒度のラベルが付与された教師データまたは前記第2の粒度のラベルが付与された教師データを取得する取得ステップと、
    取得された前記第2の粒度のラベルが付与された教師データのラベルを、前記第1の粒度のラベルに変換する変換ステップと、を含み、
    前記粗分類ステップにおいて、取得された前記第1の粒度のラベルが付与された教師データと、変換された前記第1の粒度のラベルが付与された教師データとを用いて、前記第1の粒度のラベルの付与を学習し、
    前記細分類ステップにおいて、取得された前記第2の粒度のラベルが付与された教師データと、前記粗分類ステップにおいて出力された前記第1の粒度のラベルとを用いて、前記第2の粒度のラベルの付与を学習する処理をコンピュータに実行させることを特徴とする分類プログラム。
JP2017104304A 2017-05-26 2017-05-26 分類装置、分類方法および分類プログラム Active JP6725452B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017104304A JP6725452B2 (ja) 2017-05-26 2017-05-26 分類装置、分類方法および分類プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017104304A JP6725452B2 (ja) 2017-05-26 2017-05-26 分類装置、分類方法および分類プログラム

Publications (2)

Publication Number Publication Date
JP2018200524A true JP2018200524A (ja) 2018-12-20
JP6725452B2 JP6725452B2 (ja) 2020-07-22

Family

ID=64668226

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017104304A Active JP6725452B2 (ja) 2017-05-26 2017-05-26 分類装置、分類方法および分類プログラム

Country Status (1)

Country Link
JP (1) JP6725452B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019016212A (ja) * 2017-07-07 2019-01-31 日本電信電話株式会社 付与装置、付与方法および付与プログラム
CN110322688A (zh) * 2019-05-20 2019-10-11 华为技术有限公司 一种数据处理的方法、数据查询的方法及相关设备
CN111104800A (zh) * 2019-12-24 2020-05-05 东软集团股份有限公司 一种实体识别方法、装置、设备、存储介质和程序产品
JPWO2021059527A1 (ja) * 2019-09-27 2021-04-01
CN113544704A (zh) * 2019-03-26 2021-10-22 日本电信电话株式会社 评价装置、评价方法以及评价程序
JPWO2021241173A1 (ja) * 2020-05-27 2021-12-02

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010092203A (ja) * 2008-10-07 2010-04-22 Nec Corp 異常検出装置および異常検出方法
US20130322743A1 (en) * 2012-05-31 2013-12-05 Casio Computer Co., Ltd. Multi-class identifier, method, and computer-readable recording medium
US20160260014A1 (en) * 2015-03-06 2016-09-08 Panasonic Intellectual Property Management Co., Ltd. Learning method and recording medium
JP2018128942A (ja) * 2017-02-10 2018-08-16 ヤフー株式会社 解析装置、解析方法、およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010092203A (ja) * 2008-10-07 2010-04-22 Nec Corp 異常検出装置および異常検出方法
US20130322743A1 (en) * 2012-05-31 2013-12-05 Casio Computer Co., Ltd. Multi-class identifier, method, and computer-readable recording medium
US20160260014A1 (en) * 2015-03-06 2016-09-08 Panasonic Intellectual Property Management Co., Ltd. Learning method and recording medium
JP2017084320A (ja) * 2015-03-06 2017-05-18 パナソニックIpマネジメント株式会社 学習方法およびプログラム
JP2018128942A (ja) * 2017-02-10 2018-08-16 ヤフー株式会社 解析装置、解析方法、およびプログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019016212A (ja) * 2017-07-07 2019-01-31 日本電信電話株式会社 付与装置、付与方法および付与プログラム
CN113544704A (zh) * 2019-03-26 2021-10-22 日本电信电话株式会社 评价装置、评价方法以及评价程序
CN110322688A (zh) * 2019-05-20 2019-10-11 华为技术有限公司 一种数据处理的方法、数据查询的方法及相关设备
JPWO2021059527A1 (ja) * 2019-09-27 2021-04-01
WO2021059527A1 (ja) * 2019-09-27 2021-04-01 日本電気株式会社 学習装置、学習方法、及び、記録媒体
JP7283554B2 (ja) 2019-09-27 2023-05-30 日本電気株式会社 学習装置、学習方法、及び、プログラム
US12073608B2 (en) 2019-09-27 2024-08-27 Nec Corporation Learning device, learning method and recording medium
CN111104800A (zh) * 2019-12-24 2020-05-05 东软集团股份有限公司 一种实体识别方法、装置、设备、存储介质和程序产品
CN111104800B (zh) * 2019-12-24 2024-01-23 东软集团股份有限公司 一种实体识别方法、装置、设备、存储介质和程序产品
JPWO2021241173A1 (ja) * 2020-05-27 2021-12-02
JP7655318B2 (ja) 2020-05-27 2025-04-02 コニカミノルタ株式会社 学習装置

Also Published As

Publication number Publication date
JP6725452B2 (ja) 2020-07-22

Similar Documents

Publication Publication Date Title
JP6725452B2 (ja) 分類装置、分類方法および分類プログラム
CN106919555B (zh) 用于日志流内包含的数据的字段提取的系统和方法
CN111615702B (zh) 一种从图像中提取结构化数据的方法、装置和设备
RU2454714C1 (ru) Система и способ повышения эффективности обнаружения неизвестных вредоносных объектов
CN107004159B (zh) 主动机器学习
US20200159924A1 (en) Protecting a machine learning model
CN111639178B (zh) 生命科学文档的自动分类和解释
RU2708356C1 (ru) Система и способ двухэтапной классификации файлов
JP2021526687A (ja) 効率的なラベル伝搬のためのアンサンブルベースのデータキュレーションパイプライン
Tasyurek et al. RT-Droid: a novel approach for real-time android application analysis with transfer learning-based CNN models
WO2020040312A1 (ja) 学習装置、学習方法および予測システム
Fathurrahman et al. Lightweight convolution neural network for image-based malware classification on embedded systems
CN115033945A (zh) 图形界面处理方法及装置
CN112632952A (zh) 一种对比文件的方法和装置
JP2024546566A (ja) 算出された不確実性および予測されたリソース消費に基づくセキュリティ・ポリシ選択
CN110569924A (zh) 图标处理方法、装置、可读存储介质及计算机设备
US20240143414A1 (en) Load testing and performance benchmarking for large language models using a cloud computing platform
US12586002B2 (en) Multi-polytope machine for classification
US11227231B2 (en) Computational efficiency in symbolic sequence analytics using random sequence embeddings
WO2023238246A1 (ja) 統合モデル生成方法、統合モデル生成装置および統合モデル生成プログラム
CN113366511B (zh) 利用遗传编程的命名实体识别和提取
US20240275818A1 (en) Security audit of data-at-rest
CN113612777B (zh) 训练方法、流量分级方法、装置、电子设备以及存储介质
Alsubai et al. Quantum transfer learning for cross-domain cybersecurity threat detection and categorization
CN112367336B (zh) webshell拦截检测方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200605

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200623

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200625

R150 Certificate of patent or registration of utility model

Ref document number: 6725452

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350