JP7668460B2 - 処理方法およびそれを利用した処理装置 - Google Patents

処理方法およびそれを利用した処理装置 Download PDF

Info

Publication number
JP7668460B2
JP7668460B2 JP2021041612A JP2021041612A JP7668460B2 JP 7668460 B2 JP7668460 B2 JP 7668460B2 JP 2021041612 A JP2021041612 A JP 2021041612A JP 2021041612 A JP2021041612 A JP 2021041612A JP 7668460 B2 JP7668460 B2 JP 7668460B2
Authority
JP
Japan
Prior art keywords
target
symbol
symbols
image
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021041612A
Other languages
English (en)
Other versions
JP2022141358A (ja
Inventor
武彦 榎阪
祥平 鎌田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2021041612A priority Critical patent/JP7668460B2/ja
Publication of JP2022141358A publication Critical patent/JP2022141358A/ja
Application granted granted Critical
Publication of JP7668460B2 publication Critical patent/JP7668460B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

本開示は、処理技術、特に画像に対する処理を実行する処理方法およびそれを利用した処理装置に関する。
近年、CAD(Computer-Aided Design)システム等を用いて建設図面が容易に作成される。建築図面をもとに見積書を作成する場合、ユーザは、建築図面に含まれる記号を抽出し、各記号の積算数を導出する。これらを手作業で行う場合、ユーザの手間が大きくなる。ユーザの手間を低減するために、記号を抽出するために、ニューラルネットワークを使用することが可能である。しかしながら、記号の種類は数十種類以上と多いとともに、類似した形状の記号も存在するので、すべての記号に対してニューラルネットワークを学習させることは困難である。一方、学習が不十分であると、処理の正確性が低下する。これらに対して、特許文献1では、記号を複数の系統に分類し、系統をもとにニューラルネットワークを学習させ、記号を系統として対象画像から抽出する(例えば、特許文献1参照)。
国際公開第19/189026号
画像に含まれる記号の数をさらに高精度に積算することが望まれる。
本開示はこうした状況に鑑みなされたものであり、その目的は、画像に含まれる記号の数を高精度に積算する技術を提供することにある。
上記課題を解決するために、本開示のある態様の処理装置は、処理対象とすべき対象画像に含まれた複数の記号を記号の種類毎に積算する処理装置であって、複数種類の記号の一覧が示された表形式の凡例画像から、積算対象となる各記号を参照記号として抽出する抽出部と、対象画像に対して、抽出部において抽出した複数種類の参照記号により学習させた第1ニューラルネットワークの処理を実行することによって、対象画像に含まれた複数の記号のそれぞれを対象記号として抽出する第1処理部と、第2ニューラルネットワークとして対象記号用ニューラルネットワークと参照記号用ニューラルネットワークを含み、複数の対象記号のそれぞれに対して、抽出部において抽出した複数種類の参照記号により学習させた対象記号用ニューラルネットワークの処理を実行することによって、中間層の処理結果の画像を対象特徴画像として取得し、各参照記号との組合せに対して、抽出部において抽出した複数種類の参照記号により学習させた参照記号用ニューラルネットワークの処理を実行することによって、中間層の処理結果の画像を参照特徴画像として取得し、対象特徴画像を1次元のベクトルである第1特徴量に変換するとともに、参照特徴画像を1次元のベクトルである第2特徴量に変換し、複数の対象記号と各参照記号との組合せのそれぞれに対して、第1特徴量と第2特徴量との距離を類似度として導出する第2処理部と、各対象記号を最大の類似度の参照記号に分類することによって、各参照記号に含まれる対象記号の数を積算する積算部と、を備える。
本開示の別の態様は、処理方法である。この方法は、処理対象とすべき対象画像に含まれた複数の記号を記号の種類毎に積算する処理方法であって、複数種類の記号の一覧が示された表形式の凡例画像から、積算対象となる各記号を参照記号として抽出するステップと、対象画像に対して、抽出するステップにおいて抽出した複数種類の参照記号により学習させた第1ニューラルネットワークの処理を実行することによって、対象画像に含まれた複数の記号のそれぞれを対象記号として抽出するステップと、第2ニューラルネットワークとして対象記号用ニューラルネットワークと参照記号用ニューラルネットワークが含まれ、複数の対象記号のそれぞれに対して、抽出した複数種類の参照記号により学習させた対象記号用ニューラルネットワークの処理を実行することによって、中間層の処理結果の画像を対象特徴画像として取得し、各参照記号との組合せに対して、抽出した複数種類の参照記号により学習させた参照記号用ニューラルネットワークの処理を実行することによって、中間層の処理結果の画像を参照特徴画像として取得し、対象特徴画像を1次元のベクトルである第1特徴量に変換するとともに、参照特徴画像を1次元のベクトルである第2特徴量に変換し、複数の対象記号と各参照記号との組合せのそれぞれに対して、第1特徴量と第2特徴量との距離を類似度として導出するステップと、各対象記号を最大の類似度の参照記号に分類することによって、各参照記号に含まれる対象記号の数を積算するステップと、を備える。
なお、以上の構成要素の任意の組合せ、本開示の表現を方法、装置、システム、コンピュータプログラム、またはコンピュータプログラムを記録した記録媒体などの間で変換したものもまた、本開示の態様として有効である。
本開示によれば、画像に含まれる記号の数を高精度に積算できる。
実施例の処理対象となる対象画像を示す図である。 実施例の凡例画像を示す図である。 実施例に係る処理装置の構成を示す図である。 図3の第2処理部における処理の概要を示す図である。 図4の対象記号用ニューラルネットワーク、参照記号用ニューラルネットワークの処理の概要を示す図である。 図3の積算部における処理の概要を示す図である。 図3の処理装置による処理手順を示すフローチャートである。
本開示の実施例を具体的に説明する前に、本実施例の概要を説明する。実施例は、複数の電気記号が示されている建設図面から、電気記号の種類毎に個数を積算する処理装置に関する。建設図面から電気記号を抽出する精度を向上するために、ニューラルネットワークを使用することが有力である。しかしながら、同一の機器であってもさまざま電気記号により表現されるので、すべての電気記号をニューラルネットワークを学習させることは困難である。例えば、同一の機器であっても地方等に応じて電気記号の形状が異なる。そのため、すべての電気記号に対してニューラルネットワークを学習させることは困難である。学習が不十分であっても誤判定が生じる可能性がある。本実施例は、ニューラルネットワークを使用して、建築画面に含まれる電気記号の数を高精度に積算することである。
本実施例に係る処理装置は、建築図面に付加された凡例画像であって、かつ建築図面において使用される電気記号の一覧が示される凡例画像をニューラルネットワークに使用する。処理装置は、凡例画像の各電気記号を参照記号として抽出し、参照記号によって第1ニューラルネットワークを学習させる。処理装置は、建築図面に対して第1ニューラルネットワークを使用することによって、建築図面から各電気記号を対象記号として抽出する。処理装置は、参照記号により第2ニューラルネットワークを学習させる。処理装置は、対象記号と参照記号とに対して第2ニューラルネットワークを使用することによって、対象記号と各参照記号との類似度を導出する。処理装置は、類似度をもとに、各参照記号に含まれる対象記号の数を積算する。
図1は、処理対象となる対象画像10を示す。対象画像10の一例は、前述のごとく建設図面である。対象画像10には、記号20と総称される第1記号20aから第26記号20z、第27記号20aa、第28記号20ab、第29記号20ac、第30記号20adが含まれる。各記号20は電気記号である。ここでは、対象画像10に含まれる記号20の数を「30」としたが、それに限定されない。記号20の形状が異なれば、別の電気記号を示すので、別の機器に相当する。例えば、第5記号20eと第6記号20fは同じ形状であるが、第5記号20eと第1記号20aは異なる形状である。このような対象画像10をもとに見積書を作成する場合、ユーザは、記号20の種類毎に記号20の数を数える必要がある。対象画像10のサイズが大きくなり、対象画像10に含まれる記号20の数が増加するほど、その作業にかかる手間が大きくなる。
図2は、凡例画像30を示す。凡例画像30は、凡例表であり、対象画像10において使用される記号20の一覧が示される。凡例画像30は、対象画像10の一部分、例えば、左下側部分あるいは右下部分に配置されてもよく、対象画像10とは別に準備されてもよい。以下では、凡例画像30における記号20を参照記号40と呼ぶ。図2において凡例画像30には、参照記号40と総称される第1参照記号40a、第2参照記号40b、第3参照記号40cが含まれる。第1参照記号40aは、定温式煙感知器を示し、第2参照記号40bは、インターフォンを示し、第3参照記号40cは、光電式煙感知器を示す。凡例画像30に含まれる参照記号40はこれらに限定されない。一般的に、参照記号40は、統一されておらず、対象画像10によって異なる。また、参照記号40は、対象画像10において実際に使用される記号20と完全に同一でなくてもよい。これらの参照記号40は、縦線と横線で構成される表の中に配置される。
図3は、処理装置100の構成を示す。処理装置100は、処理対象とすべき対象画像10に含まれた複数の記号を記号の種類毎に積算する。処理装置100は、抽出部110、第1処理部112、第2処理部114、積算部116を含む。対象画像10は、図1に示される建築図面であり、かつ電子情報である。凡例画像30は、図2に示される凡例表である。前述のごとく、凡例画像30は対象画像10の一部分に配置されていてもよい。
抽出部110は、凡例画像30を受けつけ、凡例画像30から各参照記号40を抽出する。抽出部110は、表を構成する縦線と横線とを予め記憶しており、縦線と横線でパターンマッチングを実行することによって、凡例画像30に含まれる表の位置を特定する。抽出部110は、特定した表の中に配置される参照記号40を抽出する。抽出部110における参照記号40にはパターンマッチング以外の技術が使用されてもよい。抽出部110は、抽出した複数種類の参照記号40を第1処理部112と第2処理部114に出力する。
第1処理部112は、対象画像10を受けつけるとともに、抽出部110から複数種類の参照記号40を受けつける。第1処理部112は、畳み込み層とプーリング層との組合せを含む畳み込みニューラルネットワークを第1ニューラルネットワークとして保持する。第1処理部112は、複数種類の参照記号40により第1ニューラルネットワークを学習させる。第1ニューラルネットワークの学習には公知の技術が使用されればよいが、畳み込みニューラルネットワークの畳み込み層が学習される。第1処理部112は、対象画像10に対して、学習させた第1ニューラルネットワークの処理を実行することによって、対象画像10に含まれた複数の記号20のそれぞれの位置の重心の座標、あるいは複数の記号20のそれぞれの位置の一部の座標を予測する。位置の一部の座標とは、例えば、記号20の左上端の座標と右下端の座標である。第1処理部112は、対象画像10から、予測した座標に配置される複数の記号20のそれぞれを対象記号50として抽出する。第1処理部112は、抽出した複数の対象記号50を第2処理部114に出力する。
第2処理部114は、抽出部110から複数種類の参照記号40を受けつけ、第1処理部112から複数の対象記号50を受けつける。第2処理部114は、第2ニューラルネットワークを保持し、第2ニューラルネットワークを使用することによって、複数種類の参照記号40のそれぞれと、各対象記号50との間の類似度を導出する。
図4は、第2処理部114における処理の概要を示す。第2処理部114における第2ニューラルネットワークは、対象記号50を入力するための対象記号用ニューラルネットワーク200と、参照記号40を入力するための参照記号用ニューラルネットワーク210とを含む。
図5は、対象記号用ニューラルネットワーク200、参照記号用ニューラルネットワーク210の処理の概要を示す。対象記号用ニューラルネットワーク200と参照記号用ニューラルネットワーク210は、畳み込みニューラルネットワークであり、畳み込み層242と総称される第1畳み込み層242aから第3畳み込み層242c、プーリング層244と総称される第1プーリング層244a、第2プーリング層244b、全結合層246を含む。ここでは、一例として、第1畳み込み層242a、第1プーリング層244a、第2畳み込み層242b、第2プーリング層244b、第3畳み込み層242c、全結合層246が順に並べられる。畳み込みニューラルネットワークの構成はこれに限定されない。
各畳み込み層242は、入力された画像に対して、当該画像のサイズよりも小さいサイズの空間フィルタをずらしながら空間フィルタリングを実行する。空間フィルタリングは公知の技術であるので、ここでは説明を省略するが、この空間フィルタリングが畳み込み処理に相当し、畳み込み処理によって画像の特徴量が抽出される。畳み込み層242においてパディング等が実行されてもよい。
各プーリング層244は、画像内の任意の領域に含まれた複数の画素を1つの画素にまとめることによって、画像のサイズを小さくする。ここで、複数の画素を1つの画素にまとめるために、平均プーリングあるいは最大プーリングが実行される。平均プーリングでは、領域内の複数の画素値の平均値が1つの画素に対して使用され、最大プーリングでは、領域内の複数の画素値のうちの最大値が1つの画素に対して使用される。プーリング処理は、着目領域における代表値あるいは平均値の並進移動に対してロバスト性を強化するためになされる。プーリング層244は、畳み込み層242に続くので、畳み込み層242において抽出される画像の特徴量にも相当する。
全結合層246は、対象記号用ニューラルネットワーク200と参照記号用ニューラルネットワーク210の最終段に配置される。対象記号用ニューラルネットワーク200と参照記号用ニューラルネットワーク210の各畳み込み層242は、参照記号40により学習される。当該学習には公知の技術が使用されるので、ここでは説明を省略する。
学習の終了後、対象記号用ニューラルネットワーク200の第1畳み込み層242aには、対象記号50(図4)が入力され、各畳み込み層242と各プーリング層244は、前述の処理を実行する。第3畳み込み層242cは、中間層であり、中間層の処理結果の画像を特徴量画像として出力される。対象記号用ニューラルネットワーク200の中間層から得られる特徴量画像は、図4において対象特徴画像220と示される。対象特徴画像220は、例えば、4×4×256のサイズを有する。
学習の終了後、参照記号用ニューラルネットワーク210の第1畳み込み層242aには、参照記号40(図4)が入力され、各畳み込み層242と各プーリング層244は、前述の処理を実行する。第3畳み込み層242cは、中間層の処理結果の画像を特徴量画像として出力される。参照記号用ニューラルネットワーク210の中間層から得られる特徴量画像は、図4において参照特徴画像230と示される。参照特徴画像230も、例えば、4×4×256のサイズを有する。図4に戻る。
第2処理部114は、4×4×256のサイズの対象特徴画像220を1次元のベクトルである第1特徴量222に変換する。第1特徴量222のサイズは例えば4096である。また、第2処理部114は、4×4×256のサイズの参照特徴画像230を1次元のベクトルである第2特徴量232に変換する。第2特徴量232のサイズも例えば4096である。第2処理部114は、第1特徴量222と第2特徴量232とに対して2つのベクトルの二乗誤差等を使用することによって、第1特徴量222と第2特徴量232の距離を導出する。第1特徴量222と第2特徴量232との距離が小さくなるほど、第1特徴量222と第2特徴量232との類似度が大きくなり、第1特徴量222と第2特徴量232との距離が大きくなるほど、第1特徴量222と第2特徴量232との類似度が小さくなる。そのため、距離と類似度は、互いに関連したパラメータであり、例えば、距離の逆数が類似度に相当する。第2処理部114は、すべての参照記号40とすべての対象記号50との組合せのそれぞれに対して類似度(距離)を導出する。つまり、第2処理部114は、複数種類の対象記号50のそれぞれと、各参照記号40との間の類似度(距離)を導出する。図3に戻る。第2処理部114は、複数の類似度(距離)を積算部116に出力する。
積算部116は、第2処理部114から複数の類似度(距離)を受けつける。積算部116は、各対象記号50を最大の類似度の参照記号40に分類する。積算部116における処理を説明するために、ここでは図6も使用する。図6は、積算部116における処理の概要を示す。説明を明瞭にするための一部の対象記号50として、第1対象記号50a、第2対象記号50b、第3対象記号50cが示され、一部の参照記号40として、第1参照記号40a、第3参照記号40cが示される。第1対象記号50aと第1参照記号40aとの間の距離は「0.1」と示され、第1対象記号50aと第2参照記号40bとの間の距離は「0.6」と示される。第1対象記号50aと第2参照記号40bとの間の距離よりも、第1対象記号50aと第1参照記号40aとの間の距離の方が小さいので、第1対象記号50aは第1参照記号40aに分類される。距離が小さいことは、類似度が大きいことに相当する。第2対象記号50bと第3対象記号50cに対しても同様の処理がなされることによって、第2対象記号50bは第1参照記号40aに分類され、第3対象記号50cは第3参照記号40cに分類される。
積算部116は、分類に続いて、各参照記号40に含まれる対象記号50の数を積算する。図6では、第1参照記号40aに含まれる対象記号50の数は「2」であり、第2参照記号40bに含まれる対象記号50の数は「1」である。積算部116は、積算結果を出力する。
本開示における装置、システム、または方法の主体は、コンピュータを備えている。このコンピュータがプログラムを実行することによって、本開示における装置、システム、または方法の主体の機能が実現される。コンピュータは、プログラムにしたがって動作するプロセッサを主なハードウェア構成として備える。プロセッサは、プログラムを実行することによって機能を実現することができれば、その種類は問わない。プロセッサは、半導体集積回路(IC)、またはLSI(Large Scale Integration)を含む1つまたは複数の電子回路で構成される。複数の電子回路は、1つのチップに集積されてもよいし、複数のチップに設けられてもよい。複数のチップは1つの装置に集約されていてもよいし、複数の装置に備えられていてもよい。プログラムは、コンピュータが読み取り可能なROM、光ディスク、ハードディスクドライブなどの非一時的記録媒体に記録される。プログラムは、記録媒体に予め格納されていてもよいし、インターネット等を含む広域通信網を介して記録媒体に供給されてもよい。
以上の構成による処理装置100の動作を説明する。図7は、処理装置100による処理手順を示すフローチャートである。抽出部110は、凡例画像30から参照記号40を抽出する(S10)。第1処理部112は、対象画像10から対象記号50を抽出する(S12)。第2処理部114は、対象記号50と参照記号40との間の類似度を導出する(S14)。積算部116は、類似度をもとに対象記号50をいずれかの参照記号40に分類する(S16)。積算部116は、参照記号40毎に対象記号50の数を積算する(S18)。
本実施例によれば、凡例画像30から抽出した参照記号40と、第1ニューラルネットワークの処理により対象画像10から抽出した対象記号50に対して、第2ニューラルネットワークの処理を実行することによって対象記号50と参照記号40との間の類似度を導出するので、対象記号50をいずれかの参照記号40に分類できる。また、凡例画像30を利用して対象記号50をいずれかの参照記号40に分類するので、各参照記号40に含まれる対象記号50の数を高精度に積算できる。また、第1ニューラルネットワークは、対象記号50の位置の重心の座標、あるいは対象記号50の位置の一部の座標を予測するので、対象画像10から対象記号50を抽出できる。また、第2ニューラルネットワークの中間層から得られる対象記号50と参照記号40との特徴量の距離を導出するので、類似度を導出できる。
本開示の一態様の概要は、次の通りである。本開示のある態様の処理装置(100)は、処理対象とすべき対象画像(10)に含まれた複数の記号を記号の種類毎に積算する処理装置(100)であって、複数種類の記号の一覧が示された凡例画像(30)から、各記号を参照記号(40)として抽出する抽出部(110)と、対象画像(10)に対して、複数種類の参照記号(40)により学習させた第1ニューラルネットワークの処理を実行することによって、対象画像(10)に含まれた複数の記号のそれぞれを対象記号(50)として抽出する第1処理部(112)と、複数の対象記号(50)のそれぞれと各参照記号(40)との組合せに対して、複数種類の参照記号(40)により学習させた第2ニューラルネットワークの処理を実行することによって、複数の対象記号(50)のそれぞれと、各参照記号(40)との間の類似度を導出する第2処理部(114)と、各対象記号(50)を最大の類似度の参照記号(40)に分類することによって、各参照記号(40)に含まれる対象記号(50)の数を積算する積算部(116)と、を備える。
第1処理部(112)において使用される第1ニューラルネットワークは、対象記号(50)の位置の重心の座標、あるいは対象記号(50)の位置の一部の座標を予測してもよい。
第2処理部(114)は、第2ニューラルネットワークの中間層から得られる対象記号(50)と参照記号(40)との特徴量の距離を類似度として導出してもよい。
本開示の別の態様は、処理方法である。この方法は、処理対象とすべき対象画像(10)に含まれた複数の記号を記号の種類毎に積算する処理方法であって、複数種類の記号の一覧が示された凡例画像(30)から、各記号を参照記号(40)として抽出するステップと、対象画像(10)に対して、複数種類の参照記号(40)により学習させた第1ニューラルネットワークの処理を実行することによって、対象画像(10)に含まれた複数の記号のそれぞれを対象記号(50)として抽出するステップと、複数の対象記号(50)のそれぞれと各参照記号(40)との組合せに対して、複数種類の参照記号(40)により学習させた第2ニューラルネットワークの処理を実行することによって、複数の対象記号(50)のそれぞれと、各参照記号(40)との間の類似度を導出するステップと、各対象記号(50)を最大の類似度の参照記号(40)に分類することによって、各参照記号(40)に含まれる対象記号(50)の数を積算するステップと、を備える。
以上、本開示を実施例をもとに説明した。この実施例は例示であり、それらの各構成要素あるいは各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本開示の範囲にあることは当業者に理解されるところである。
10 対象画像、 20 記号、 30 凡例画像、 40 参照記号、 50 対象記号、 100 処理装置、 110 抽出部、 112 第1処理部、 114 第2処理部、 116 積算部、 200 対象記号用ニューラルネットワーク、 210 参照記号用ニューラルネットワーク、 220 対象特徴画像、 222 第1特徴量、 230 参照特徴画像、 232 第2特徴量、 242 畳み込み層、 244 プーリング層、 246 全結合層。

Claims (3)

  1. 処理対象とすべき対象画像に含まれた複数の記号を記号の種類毎に積算する処理装置であって、
    複数種類の記号の一覧が示された表形式の凡例画像から、積算対象となる各記号を参照記号として抽出する抽出部と、
    前記対象画像に対して、前記抽出部において抽出した複数種類の前記参照記号により学習させた第1ニューラルネットワークの処理を実行することによって、前記対象画像に含まれた前記複数の記号のそれぞれを対象記号として抽出する第1処理部と、
    第2ニューラルネットワークとして対象記号用ニューラルネットワークと参照記号用ニューラルネットワークを含み、複数の前記対象記号のそれぞれに対して、前記抽出部において抽出した複数種類の前記参照記号により学習させた前記対象記号用ニューラルネットワークの処理を実行することによって、中間層の処理結果の画像を対象特徴画像として取得し、各参照記号との組合せに対して、前記抽出部において抽出した複数種類の前記参照記号により学習させた前記参照記号用ニューラルネットワークの処理を実行することによって、中間層の処理結果の画像を参照特徴画像として取得し、対象特徴画像を1次元のベクトルである第1特徴量に変換するとともに、参照特徴画像を1次元のベクトルである第2特徴量に変換し、複数の前記対象記号と各参照記号との組合せのそれぞれに対して、前記第1特徴量と前記第2特徴量との距離を類似度として導出する第2処理部と、
    各対象記号を最大の類似度の前記参照記号に分類することによって、各参照記号に含まれる前記対象記号の数を積算する積算部と、
    を備える処理装置。
  2. 前記第1処理部において使用される前記第1ニューラルネットワークは、前記対象記号の位置の重心の座標、あるいは前記対象記号の位置の一部の座標を予測する請求項1に記載の処理装置。
  3. 処理対象とすべき対象画像に含まれた複数の記号を記号の種類毎に積算する処理方法であって、
    複数種類の記号の一覧が示された表形式の凡例画像から、積算対象となる各記号を参照記号として抽出するステップと、
    前記対象画像に対して、前記抽出するステップにおいて抽出した複数種類の前記参照記号により学習させた第1ニューラルネットワークの処理を実行することによって、前記対象画像に含まれた前記複数の記号のそれぞれを対象記号として抽出するステップと、
    第2ニューラルネットワークとして対象記号用ニューラルネットワークと参照記号用ニューラルネットワークが含まれ、複数の前記対象記号のそれぞれに対して、抽出した複数種類の前記参照記号により学習させた前記対象記号用ニューラルネットワークの処理を実行することによって、中間層の処理結果の画像を対象特徴画像として取得し、各参照記号との組合せに対して、抽出した複数種類の前記参照記号により学習させた前記参照記号用ニューラルネットワークの処理を実行することによって、中間層の処理結果の画像を参照特徴画像として取得し、対象特徴画像を1次元のベクトルである第1特徴量に変換するとともに、参照特徴画像を1次元のベクトルである第2特徴量に変換し、複数の前記対象記号と各参照記号との組合せのそれぞれに対して、前記第1特徴量と前記第2特徴量との距離を類似度として導出するステップと、
    各対象記号を最大の類似度の前記参照記号に分類することによって、各参照記号に含まれる前記対象記号の数を積算するステップと、
    を備える処理方法。
JP2021041612A 2021-03-15 2021-03-15 処理方法およびそれを利用した処理装置 Active JP7668460B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021041612A JP7668460B2 (ja) 2021-03-15 2021-03-15 処理方法およびそれを利用した処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021041612A JP7668460B2 (ja) 2021-03-15 2021-03-15 処理方法およびそれを利用した処理装置

Publications (2)

Publication Number Publication Date
JP2022141358A JP2022141358A (ja) 2022-09-29
JP7668460B2 true JP7668460B2 (ja) 2025-04-25

Family

ID=83402681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021041612A Active JP7668460B2 (ja) 2021-03-15 2021-03-15 処理方法およびそれを利用した処理装置

Country Status (1)

Country Link
JP (1) JP7668460B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073692A (ja) 2000-07-13 2002-03-12 Vhsoft Ip Co Ltd 工学図面を分析および解釈するコンピュータ自動化プロセス
JP2015185042A (ja) 2014-03-25 2015-10-22 キヤノン株式会社 情報処理装置、認証装置およびそれらの方法
WO2020102554A1 (en) 2018-11-15 2020-05-22 Magic Leap, Inc. Deep neural network pose estimation system
JP2020135432A (ja) 2019-02-20 2020-08-31 株式会社日立ソリューションズ・クリエイト 学習データの生成方法、学習データ生成装置及びプログラム
WO2020193708A1 (en) 2019-03-28 2020-10-01 F. Hoffmann-La Roche Ag Machine learning using distance-based similarity labels
JP2020536337A (ja) 2017-10-13 2020-12-10 スアラブ カンパニー リミテッド ディープラーニングに基づく画像比較装置と方法及びコンピューター可読媒体に保存されたコンピュータープログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3347435B2 (ja) * 1993-11-24 2002-11-20 バブコック日立株式会社 階層型ニューラルネットワークによるパターン認識方法
JPH0883333A (ja) * 1994-09-13 1996-03-26 Central Res Inst Of Electric Power Ind 設備図面からの電柱自動認識システム
JP3607433B2 (ja) * 1996-10-04 2005-01-05 株式会社リコー 建設図面の電気記号抽出方法及びその装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002073692A (ja) 2000-07-13 2002-03-12 Vhsoft Ip Co Ltd 工学図面を分析および解釈するコンピュータ自動化プロセス
JP2015185042A (ja) 2014-03-25 2015-10-22 キヤノン株式会社 情報処理装置、認証装置およびそれらの方法
JP2020536337A (ja) 2017-10-13 2020-12-10 スアラブ カンパニー リミテッド ディープラーニングに基づく画像比較装置と方法及びコンピューター可読媒体に保存されたコンピュータープログラム
WO2020102554A1 (en) 2018-11-15 2020-05-22 Magic Leap, Inc. Deep neural network pose estimation system
JP2020135432A (ja) 2019-02-20 2020-08-31 株式会社日立ソリューションズ・クリエイト 学習データの生成方法、学習データ生成装置及びプログラム
WO2020193708A1 (en) 2019-03-28 2020-10-01 F. Hoffmann-La Roche Ag Machine learning using distance-based similarity labels

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
中林 正裕,カラー道路地図からの記号抽出・認識,電子情報通信学会技術研究報告 IEICE Technical Report,日本,社団法人電子情報通信学会,1997年10月02日,第96巻

Also Published As

Publication number Publication date
JP2022141358A (ja) 2022-09-29

Similar Documents

Publication Publication Date Title
JP7386545B2 (ja) 画像中の物体を識別するための方法、及び当該方法を実施するためのモバイル装置
Ji et al. Interactive body part contrast mining for human interaction recognition
KR101563297B1 (ko) 영상에서 행동을 인식하는 방법 및 장치
CN109376681A (zh) 一种多人姿态估计方法及系统
CN114155610B (zh) 基于上半身姿态估计的面板装配关键动作识别方法
KR101635896B1 (ko) 깊이 정보 기반 사람 추적 장치 및 그 방법
JP7451373B2 (ja) 図面構造化システムおよび図面構造化方法
CN103348381A (zh) 图像识别装置、图像识别方法、程序及集成电路
JP6353660B2 (ja) 手話単語分類情報生成装置およびそのプログラム
CN110443148A (zh) 一种动作识别方法、系统和存储介质
JP7173309B2 (ja) 学習方法、学習プログラム、および、学習装置
Rao et al. Neural network classifier for continuous sign language recognition with selfie video
CN114842391A (zh) 基于视频的运动姿态识别方法及系统
JP6803578B2 (ja) 処理方法およびそれを利用した処理装置
JP6052533B2 (ja) 特徴量抽出装置および特徴量抽出方法
CN115471745A (zh) 用于植株识别的网络模型和装置、电子设备
JP7668460B2 (ja) 処理方法およびそれを利用した処理装置
CN114266691A (zh) 过滤方法、过滤程序和过滤装置
Tierny et al. Fast and precise kinematic skeleton extraction of 3D dynamic meshes
JP5747695B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP5840074B2 (ja) 画像処理装置
KR20230120501A (ko) 동영상으로부터 휴먼 객체를 분리하고 자세를 추정하는 방법 및 장치
JP7209238B2 (ja) 処理装置および処理方法
KR20210156793A (ko) 낮은 공간 지터, 낮은 레이턴시 및 저전력 사용을 갖는 객체 및 키포인트 검출 시스템
KR101627929B1 (ko) 제스처 인식기 설정 방법, 제스처 인식 방법 및 그 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230613

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240326

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20241015

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241212

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250402

R150 Certificate of patent or registration of utility model

Ref document number: 7668460

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150