JP7735814B2 - 機械学習モデルの学習に用いる教師データを作成する方法、システム、及び、コンピュータープログラム - Google Patents

機械学習モデルの学習に用いる教師データを作成する方法、システム、及び、コンピュータープログラム

Info

Publication number
JP7735814B2
JP7735814B2 JP2021187668A JP2021187668A JP7735814B2 JP 7735814 B2 JP7735814 B2 JP 7735814B2 JP 2021187668 A JP2021187668 A JP 2021187668A JP 2021187668 A JP2021187668 A JP 2021187668A JP 7735814 B2 JP7735814 B2 JP 7735814B2
Authority
JP
Japan
Prior art keywords
orientation
image
imaging direction
machine learning
learning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021187668A
Other languages
English (en)
Other versions
JP2023074647A (ja
Inventor
博光 水上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2021187668A priority Critical patent/JP7735814B2/ja
Priority to CN202211425100.XA priority patent/CN116137062B/zh
Priority to US17/988,795 priority patent/US12567241B2/en
Publication of JP2023074647A publication Critical patent/JP2023074647A/ja
Application granted granted Critical
Publication of JP7735814B2 publication Critical patent/JP7735814B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Program-controlled manipulators
    • B25J9/16Program controls
    • B25J9/1694Program controls characterised by use of sensors other than normal servo-feedback from position, speed or acceleration sensors, perception control, multi-sensor controlled systems, sensor fusion
    • B25J9/1697Vision controlled systems
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • G06T7/74Determining position or orientation of objects or cameras using feature-based methods involving reference images or patches
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/12Details of acquisition arrangements; Constructional details thereof
    • G06V10/14Optical characteristics of the device performing the acquisition or on the illumination arrangements
    • G06V10/145Illumination specially adapted for pattern recognition, e.g. using gratings
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/255Detecting or recognising potential candidate objects based on visual cues, e.g. shapes
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40053Pick 3-D object from pile of objects
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40532Ann for vision processing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30164Workpiece; Machine component
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Mechanical Engineering (AREA)
  • Robotics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本開示は、機械学習モデルの学習に用いる教師データを作成する方法、システム、及び、コンピュータープログラムに関する。
特許文献1には、物体を撮像した画像に対して、3次元モデルデータから求めた物体の特徴をマッチングさせて、物体の位置及び姿勢を認識する技術が開示されている。また、特許文献2には、機械学習モデルを用いて物体の位置及び姿勢を認識する技術が開示されている。一般に、機械学習モデルを物体の位置及び姿勢の認識に適用する場合には、位置及び姿勢をラベルとする教師データが必要であり、教師データの作成に準備が膨大な手間がかかる。そこで、特許文献2では、教師データをシミュレーションにより生成する手法が使われている。
特開2019-185239号公報 特開2020-87310号公報
シミュレーションにより教師データを作成する際には、或るシーンに対して物体の画像が生成され、シーン中の物体に対して位置及び姿勢のラベルが付与される。しかし、シミュレーションと実環境では得られる画像に差があり、シミュレーションによって作成された教師データで学習した機械学習モデルでは、実環境での位置及び姿勢の認識精度が低下する傾向があるという問題があった。
本開示の第1の形態によれば、物体の位置姿勢を認識する機械学習モデルの学習に用いる教師データを作成する方法が提供される。この方法は、(a)前記物体のシミュレーションデータを用いて前記機械学習モデルの事前学習を実行する工程と、(b)カメラを用いて第1撮影方向から前記物体の第1画像を撮影する工程と、(c)前記事前学習済みの前記機械学習モデルを用いて、前記第1画像から前記物体の第1位置姿勢を認識する工程と、(d)前記第1位置姿勢に対して正誤判定を行う工程と、(e)前記第1位置姿勢が正解と判定された場合に前記カメラを用いて前記第1撮影方向と異なる第2撮影方向から前記物体の第2画像を撮影し、前記第1位置姿勢に対して前記第1撮影方向から前記第2撮影方向への変化に応じた変換を行うことによって第2位置姿勢を算出し、前記第2位置姿勢を前記第2画像に付与することによって教師データを作成する工程と、(f)前記物体の現実の位置姿勢を変更して前記工程(b)~(e)を繰り返す工程と、を含む。
本開示の第2の形態によれば、物体の位置姿勢を認識する機械学習モデルの学習に用いる教師データを作成するシステムが提供される。このシステムは、前記物体を撮影するカメラと、前記教師データの作成を行う教師データ作成部と、を備える。前記教師データ作成部は、(a)前記物体のシミュレーションデータを用いて前記機械学習モデルの事前学習を実行する処理と、(b)前記カメラを用いて第1撮影方向から前記物体の第1画像を撮影する処理と、(c)前記事前学習済みの前記機械学習モデルを用いて、前記第1画像から前記物体の第1位置姿勢を認識する処理と、(d)前記第1位置姿勢に対して正誤判定を行う処理と、(e)前記カメラを用いて前記第1撮影方向と異なる第2撮影方向から前記物体の第2画像を撮影し、前記第1位置姿勢に対して前記第1撮影方向から前記第2撮影方向への変化に応じた変換を行うことによって第2位置姿勢を算出し、前記第2位置姿勢を前記第2画像に付与することによって教師データを作成する処理と、(f)前記物体の現実の位置姿勢を変更して前記処理(b)~(e)を繰り返す処理と、を実行する。
本開示の第3の形態によれば、物体の位置姿勢を認識する機械学習モデルの学習に用いる教師データを作成する処理をプロセッサーに実行させるコンピュータープログラムが提供される。このコンピュータープログラムは、(a)前記物体のシミュレーションデータを用いて前記機械学習モデルの事前学習を実行する処理と、(b)カメラを用いて第1撮影方向から前記物体の第1画像を撮影する処理と、(c)前記事前学習済みの前記機械学習モデルを用いて、前記第1画像から前記物体の第1位置姿勢を認識する処理と、(d)前記第1位置姿勢に対して正誤判定を行う処理と、(e)前記カメラを用いて前記第1撮影方向と異なる第2撮影方向から前記物体の第2画像を撮影し、前記第1位置姿勢に対して前記第1撮影方向から前記第2撮影方向への変化に応じた変換を行うことによって第2位置姿勢を算出し、前記第2位置姿勢を前記第2画像に付与することによって教師データを作成する処理と、(f)前記物体の現実の位置姿勢を変更して前記処理(b)~(e)を繰り返す処理と、を前記プロセッサーに実行させる。
実施形態におけるロボットシステムの構成を示す説明図。 実施形態における情報処理装置の機能ブロック図。 機械学習モデルによる物体の位置姿勢の認識機能を示す説明図。 第1実施形態における処理の全体手順を示すフローチャート。 シミュレーションによる事前学習用の教師データの作成処理の説明図。 第1実施形態のステップS130の詳細手順を示すフローチャート。 第1実施形態における撮影方向の変更の様子を示す説明図。 第2実施形態における処理の全体手順を示すフローチャート。 第2実施形態のステップS125の詳細手順を示すフローチャート。 統計データを用いて第2撮影方向を決定する方法を示す説明図。 第2実施形態のステップS135の詳細手順を示すフローチャート。
A.第1実施形態:
図1は、一実施形態におけるロボットシステムの一例を示す説明図である。このロボットシステムは、ロボット100と、ロボット100を制御する制御装置200と、情報処理装置300と、カメラ400と、架台500とを備える。情報処理装置300は、例えばパーソナルコンピューターである。図1には、3次元空間の直交座標系を規定する3つの軸X,Y,Zが描かれている。X軸とY軸は水平方向の軸であり、Z軸は鉛直方向の軸である。これらのX,Y,Z軸は、ロボット100の予め定められた位置を原点とするロボット座標系Σrの座標軸である。
ロボット100は、基台110と、ロボットアーム120と、を備えている。ロボットアーム120の先端部であるアームエンド122には、エンドエフェクターとしてのハンド150が装着されている。ハンド150は、物体OBを把持することが可能なグリッパーや吸着パッドとして実現可能である。ハンド150の先端部には、ロボット100の制御点としてのTCP(Tool Center Point)が設定されている。なお、制御点TCPは、任意の位置に設定可能である。
ロボットアーム120は、6つの関節J1~J6で順次接続されている。これらの関節J1~J6のうち、3つの関節J2,J3,J5は曲げ関節であり、他の3つの関節J1,J4,J6はねじり関節である。本実施形態では6軸ロボットを例示しているが、1個以上の関節を有する任意のロボットアーム機構を有するロボットを用いることが可能である。また、本実施形態のロボット100は、垂直多関節ロボットであるが、水平多関節ロボットを使用してもよい。
架台500には、第1トレイ510と第2トレイ520が設置されている。第1トレイ510には、複数の物体OBがバラ積みされる。第2トレイ520は、第1トレイ510から取り出された物体OBを載置する場所として使用される。ロボット100は、第1トレイ510から物体OBを取り出して、第2トレイ520に載置する作業を実行する。
ロボットアーム120の先端部分には、第1トレイ510内の物体OBの画像を撮影するカメラ400が設置されている。カメラ400で撮影された画像は、物体OBの3次元的な位置及び姿勢を求めるために使用される。3次元的な位置及び姿勢を、以下では「位置姿勢」と呼ぶ。カメラ400としては、例えば、RGBDカメラや、ステレオカメラを用いることができる。RGBDカメラは、RGB画像を撮影するRGBカメラと、深度画像(Depth image)を撮影するDカメラと、を有するカメラである。RGBカメラの代わりにグレー画像を撮影するモノクロカメラを用いてもよい。また、カメラ400として、単眼カメラを用いることも可能である。なお、カメラ400をロボットアーム120に設置する必要はなく、ロボット100と別個に設置してもよい。但し、ロボットアーム120にカメラ400を設置すれば、カメラ400による物体OBの撮影方向を変更しやすいという利点がある。
図2は、情報処理装置300の機能を示すブロック図である。情報処理装置300は、プロセッサー310と、メモリー320と、インターフェイス回路330と、インターフェイス回路330に接続された入力デバイス340及び表示デバイス350と、を有している。インターフェイス回路330には、更に、制御装置200とカメラ400が接続されている。ロボット100の電流センサー180と関節エンコーダー190の計測結果は、制御装置200を介して情報処理装置300に供給される。電流センサー180は、ロボット100の各関節に設けられたモーターの電流を測定するセンサーである。関節エンコーダー190は、各関節の動作位置を検出するセンサーである。
本実施形態において、カメラ400は、RGB画像やグレー画像などの2次元画像を撮影する第1カメラ410と、深度画像を撮影する第2カメラ420と、第2カメラ420用の照明光を照射する照明部430とを有する。照明部430は、深度画像を撮影するための赤外線パターンを照射するプロジェクターである。
プロセッサー310は、物体OBの位置姿勢を認識する機械学習モデルの学習に用いる教師データを作成する教師データ作成部311としての機能を有する。教師データ作成部311は、シミュレーション実行部312と学習実行部314と物体認識部316と正誤判定部318の機能を含む。シミュレーション実行部312は、第1トレイ510に物体OBが存在するシーンをシミュレーションすることによって、機械学習モデルの事前学習用の教師データを作成する処理を実行する。学習実行部314は、機械学習モデルの事前学習及び本学習を実行する。物体認識部316は、学習済みの機械学習モデルを用いて、カメラ400で撮影された画像から物体OBの位置姿勢を認識する処理を実行する。正誤判定部318は、機械学習モデルを用いて認識された物体OBの位置姿勢が正解であるか誤りであるかの判定を実行する。教師データ作成部311の機能は、メモリー320に格納されたコンピュータープログラムをプロセッサー310が実行することによって実現される。但し、教師データ作成部311の機能の一部又は全部をハードウェア回路で実現してもよい。
メモリー320には、物体OBの位置姿勢を認識する機械学習モデルMMと、シミュレーションデータSDと、事前学習用の教師データPTDと、本学習用の教師データRTDと、ロボット制御プログラムRPが格納される。シミュレーションデータSDは、第1トレイ510に物体OBがバラ積みされたシーンをシミュレーションするために使用されるデータであり、物体OBの3次元モデルデータであるCADデータと、ロボット100の位置及び形状を示すロボットデータと、カメラ400のカメラパラメーターと、を含んでいる。ロボット制御プログラムRPは、ロボット100を動作させる複数の命令で構成される。
図3は、機械学習モデルMMによる物体OBの位置姿勢の認識機能を示す説明図である。カメラ400は予めキャリブレーションされており、カメラ座標系Σcとロボット座標系Σrとの相対関係は既知である。カメラ400は、物体OBを撮影することによって2次元画像M1と深度画像M2とを作成する。以下では、これらの画像M1,M2をまとめて「画像IM」とも呼ぶ。機械学習モデルMMは、画像IMの入力に応じて、物体OBの位置姿勢PAを出力する回帰モデルである。位置姿勢PAは、例えば、ロボット座標系Σrにおける位置(x,y,z)と姿勢(w,p,r)で表現されている。姿勢は、3軸廻りの回転角度(w,p,r)で表される。
バラ積み状態にある複数の物体のうち、どの物体を対象として位置姿勢PAを認識するかについては、以下の3通りが考えられる。
(A1)一番上にある物体のみを対象とする。
(A2)一番上にある物体のみでなく、他の物体に一部重なった物体も対象とする。具体的には、例えば、隠れている面積割合が20%以下の物体を対象とする。
(A3)全ての物体を対象とする。
実際のバラ積みピッキング作業を考えると、上記(A2)の物体を対象として位置姿勢を認識できるように教師データを作成することが好ましい。この場合には、シミュレーションで生成したバラ積み状態に関して、上記(A2)の条件を満たす複数の物体についての位置姿勢をラベルとして付した画像が教師データセットとして生成される。但し、以下では、説明の便宜上、上記(A1)に従い、1つの物体OBのみについて機械学習モデルMMがその位置姿勢PAを認識するものとする。
図4は、第1実施形態における処理の全体手順を示すフローチャートである。ステップS110では、シミュレーション実行部312が、シミュレーションにより事前学習用の教師データを作成する。
図5は、シミュレーションによる事前学習用の教師データの作成処理の説明図である。シミュレーション実行部312は、認識対象となる物体OBのCADデータと、各種パラメーターとを含むシミュレーションデータSDを、シーンシミュレーターSSに入力する。シーンシミュレーターSSは、物理シミュレーションによって、例えば、CADデータで表現された物体OBをある高さからランダムに複数落下させることによって、バラ積み状態のシーンを作成する。バラ積みされた物体OBの位置姿勢は、シミュレーションなので既知となる。シミュレーション実行部312は、各種パラメーターで設定されたカメラ情報を元に、このシーンをレンダリングして、2次元画像M1と深度画像M2とを含む画像IMを生成する。シミュレーション実行部312は、画像IMに物体OBの位置姿勢をラベルとして付与することによって、事前学習用の教師データPTDを作成する。バラ積みされたシーンを複数生成することによって、多数の教師データPTDを生成することができる。本実施形態では物体OBのバラ積み状態のシミュレーションを行ったが、バラ積み状態以外の状態、例えば、1個の物体OBが任意の位置姿勢でトレイ510に載置されている状態、をシミュレーションしてもよい。
ステップS120では、学習実行部314が、事前学習用の教師データPTDを用いて、機械学習モデルMMの事前学習を実行する。
ステップS130では、教師データ作成部311が、物体OBの鏡面反射光を考慮して本学習用の教師データRTDを作成する。物体OBの鏡面反射光を考慮するのは、以下のような理由による。すなわち、ステップS110で行ったシミュレーションでは、実環境において物体OBの鏡面反射光がカメラ400に入射する状態で撮影される画像IMを正確に再現することが難しい。このため、事前学習用の教師データで学習した機械学習モデルMMでは、実環境において鏡面反射光がカメラ400に入射する状態については、物体OBの位置姿勢の認識精度が低下する傾向がある。特に、物体OBが光沢物である場合には、光の反射具合を正確にシミュレーションに反映することが難しいため、認識精度が大きく低下する傾向がある。そこで、ステップ130では、物体OBの鏡面反射光をカメラ400が受光する状態について、本学習用の教師データを作成する。
図6は、ステップS130の詳細手順を示すフローチャートである。ステップS310では、教師データ作成部311が、カメラ400を用いて、バラ積みされた物体OBの第1画像を撮影する。「第1画像」は、図3に示した2次元画像M1と深度画像M2を含む。このときのカメラ400による撮影方向を「第1撮影方向」と呼ぶ。
ステップS320では、物体認識部316が、事前学習済みの機械学習モデルMMを用いて、第1画像から物体OBの第1位置姿勢を認識する。ステップS330では、正誤判定部318が、認識結果の正誤を判定する。この正誤判定は、例えば信頼度スコアを用いて実行することができる。信頼度スコアは、認識された物体OBの第1位置姿勢を用い、シミュレーションによって第1位置姿勢における物体OBのシミュレーション画像を作成し、このシミュレーション画像とカメラ400で撮影された第1画像とが一致する程度を表す指標として算出できる。例えば、信頼度スコアRSは、次式で算出される。
RS=α×S1+(1-α)×S2 (1)
ここで、αは0≦α≦1の係数、S1はシミュレーション画像に含まれる2次元画像と第1画像に含まれる2次元画像の間の類似度、S2はシミュレーション画像に含まれる深度画像と第1画像に含まれる深度画像の間の類似度である。類似度S1,S2は、画像類似度やコサイン類似度として算出することが可能である。上記(1)式によれば、信頼度スコアRSを、類似度S1,S2の重み付き加算によって算出できる。
正誤判定部318は、信頼度スコアRSと、予め設定された信頼度閾値とを比較することによって、認識結果の正誤を判定する。すなわち、信頼度スコアRSが信頼度閾値以上の場合には認識結果が正解と判定し、信頼度閾値未満の場合には認識結果を誤りと判定する。別の方法として、例えばシミュレーション画像と第1画像における物体OBの輪郭を重ねて表示デバイス350に表示して、ユーザーに正誤を判定させるようにしてもよい。認識結果が正解である場合には、後述するステップS340に進む。一方、認識結果が誤りである場合には、ステップS390に進み、物体OBの現実の位置姿勢を変更してステップS310に戻る。物体OBの位置姿勢の変更は、例えば、ユーザーが物体OBのバラ積みをやり直すことによって行われる。
ステップS340では、教師データ作成部311が、照明光の鏡面反射方向を第2撮影方向と決定し、ステップS350では、カメラ400を用いて第2撮影方向から物体OBを撮影することによって第2画像を生成する。
図7は、第1実施形態における撮影方向の変更の様子を示す説明図である。図7の上方は、ステップS310において第1撮影方向で物体OBの撮影が行われている状態を示している。この状態では、照明部430から射出される第2カメラ420用の照明光のうち、拡散反射光が第2カメラ420に入射する。第2カメラ420で撮影される深度画像は、この拡散反射光から得られる画像である。ステップS340では、図7の下方に示すように、照明部430からの照明光の鏡面反射光が第2カメラ420に入射するように、カメラ400の位置姿勢が変更される。照明部430による照明光の射出方向は既知なので、物体OBの位置姿勢が分かれば、物体OBからの鏡面反射光の方向を算出することができる。また、カメラ400の位置姿勢の変更は、ロボットアーム120を動かすことによって実行可能である。上述したように、シミュレーションでは、実環境において物体OBの鏡面反射光がカメラ400に入射する状態で撮影される画像を正確に再現することが難しく、特に、物体OBが光沢物である場合にその傾向が顕著である。そこで、ステップS340では、実環境において、物体OBの鏡面反射光がカメラ400に入射するように第2撮影方向を決定する。この第2撮影方向から撮影した画像を用いて教師データを作成すれば、シミュレーションで作成することが難しい教師データを得ることが可能である。
図7の例では、物体OBからの鏡面反射光が深度画像用の第2カメラ420に入射する状態を第2撮影方向として決定していたが、この代わりに、物体OBからの鏡面反射光が2次元画像用の第1カメラ410に入射する状態を第2撮影方向として決定してもよい。後者の場合は、2次元画像のための照明光源の位置が既知であれば実行可能である。また、第1カメラ410と第2カメラ420の両方について、物体OBからの鏡面反射光が入射する状態をそれぞれ第2撮影方向として設定して、撮影を行うようにしてもよい。
ステップS360では、教師データ作成部311が、第2画像における物体OBの第2位置姿勢を演算する。第2位置姿勢は、次式に従って算出可能である。
Pb=×Pa (2)
ここで、Pbは第2位置姿勢を示す4×4行列、Paは第1位置姿勢を示す4×4行列、は第1位置姿勢Paから第2位置姿勢Pbへの変換を表す同次変換行列である。この行列は、カメラ400の第1撮影方向Daから第2撮影方向Dbへの変換を表す行列と同じものである。換言すれば、第2位置姿勢Pbは、第1撮影方向Daから第2撮影方向Dbへの変化に応じた変換を、第1位置姿勢Paに対して行うことによって算出される。
ステップS370では、教師データ作成部311が、位置姿勢付きの画像を、本学習用の教師データとして作成する。すなわち、ステップS350で撮影した第2画像に、第2位置姿勢をラベルとして付与することによって本学習用の教師データを作成する。このとき、ステップS310で撮影した第1画像に第1位置姿勢をラベルとして付与することによって、本学習用の教師データを追加するようにしてもよい。
ステップS380では、教師データ作成部311が、本学習用の教師データが、予定していた数だけ得られたか否かを判定する。十分な数の教師データが得られていない場合には、ステップS390に進み、物体OBの現実の位置姿勢を変更してステップS310に戻り、上述したステップS310~S380を再度実行する。一方、十分な数の教師データが得られた場合には、図6の処理を終了する。
図6に示したステップS130の処理が終了すると、図4のステップS140において、学習実行部314が、ステップS130で作成した本学習用の教師データを用いて、機械学習モデルMMの本学習を実行する。本学習の際には、ステップS130で作成された教師データのみでなく、ステップS110で作成されていた事前学習用の教師データを用いても良い。ステップS140では、本学習済みの機械学習モデルMMによる物体OBの認識を利用して、ロボット100の作業を実行する。この作業は、予め作成されたロボット制御プログラムRPに従って実行される。
以上のように、第1実施形態では、事前学習済みの機械学習モデルMMを用いて第1画像から物体OBの第1位置姿勢を認識し、第1位置姿勢が正解と判定された場合には、カメラを用いて第1撮影方向と異なる第2撮影方向から第2画像を撮影し、物体OBの第2位置姿勢を第2画像に付与することによって本学習用の教師データを作成する。この結果、機械学習を行うための教師データを実環境で容易に作成でき、また、シミュレーションと実環境との差を埋めることができるので、機械学習モデルMMの性能を向上させることができる。また、第1実施形態では、鏡面反射方向に第2撮影方向を設定するので、光沢物に対して位置姿勢の認識を正しく行うための教師データを作成できる。
B.第2実施形態:
図8は、第2実施形態における処理の全体手順を示すフローチャートである。図4に示した第1実施形態との違いは、ステップS125を追加した点と、ステップS130をステップS135に置き換えた点だけであり、他のステップは第1実施形態と同じである。また、第2実施形態の装置構成は、第1実施形態と同じである。
ステップS125では、教師データ作成部311が、事前学習済みの機械学習モデルMMを用いて統計データを作成する。この統計データは、第2撮影方向を決定するために利用されるデータである。
図9は、ステップS125の詳細手順を示すフローチャートである。ステップS210では、教師データ作成部311が、カメラ400を用いて、バラ積みされた物体OBの画像を撮影する。この画像は、図3に示した2次元画像M1と深度画像M2を含む。ステップS220では、物体認識部316が、事前学習済みの機械学習モデルMMを用いて、ステップS210で得られた画像から、物体OBの位置姿勢を認識する。ステップS230では、正誤判定部318が、認識結果の正誤を判定する。この正誤判定は、上述した図6のステップS330と同様に、信頼度スコアを用いて実行することができる。認識結果が正解である場合には、後述するステップS240に進む。一方、認識結果が誤りである場合には、ステップS260に進み、物体OBの現実の位置姿勢を変更してステップS210に戻る。物体OBの位置姿勢の変更は、例えば、ユーザーが物体OBのバラ積みをやり直すことによって行われる。
ステップS240では、教師データ作成部311が、位置姿勢付きの画像を統計データとして作成する。すなわち、ステップS210で撮影した画像に、ステップS220で認識した位置姿勢を付与することによって統計データを作成する。ステップS250では、教師データ作成部311が、予定していた数の統計データが得られたか否かを判定する。十分な数の統計データが得られていない場合には、ステップS260に進み、物体OBの現実の位置姿勢を変更してステップS210に戻り、上述したステップS210~S250を再度実行する。一方、十分な数の統計データが得られた場合には、ステップS270に進む。
ステップS270では、教師データ作成部311が、統計データを参照して不足位置姿勢を算出し、統計データに登録する。
図10は、統計データにおける不足位置姿勢を示す説明図である。「不足位置姿勢」とはステップS210~S260の処理で作成された統計データに含まれていない姿勢である。図10の上方には、統計データに含まれる位置姿勢(x,y,z,w,p,r)のうちの回転角度(w,p)のみを2次元的に示している。統計データには、位置姿勢がほぼ均一に含まれているのが理想であるが、図9のステップS230で不正解と判定された位置姿勢は統計データに含まれていない。図10の上方の図において、黒丸の点は正解と判定されて統計データに含まれている位置姿勢を示している。不正解領域(Incorrect solution area)では、正解と判定された位置姿勢が欠落している。教師データ作成部311が、この不正解領域において、1つ以上の位置姿勢を「不足位置姿勢」として認識して、統計データに登録する。図10の下方の図では、不足位置姿勢(Desired position and attitude)が白丸で追加された状態を示している。なお、「不足位置姿勢」は、例えば、物体OBに対して全方位の球体をある一定のエリアに分割して、統計データに含まれている位置姿勢をマッピングしたときに、特定のエリアの認識結果が少ない、と認識する分析から求めることができる。不足位置姿勢は、シミュレーションによる事前学習を行った機械学習モデルMMでは正確に認識できない位置姿勢であり、シミュレーションと現実との画像差が大きい位置姿勢であると考えられる。そこで、統計データにおいて正解と判定された位置姿勢が欠落している不正解領域において、1つ以上の位置姿勢を「不足位置姿勢」として登録することによって、シミュレーションと現実の差を埋めるための適切な位置姿勢を効率的に集めることができる。
こうして、ステップS125の処理が終了すると、図8のステップS135に進み、教師データ作成部311が、統計データを利用して本学習用の教師データを作成する。
図11は、ステップS135の詳細手順を示すフローチャートである。図11の手順は、第1実施形態において図6に示したステップS130の詳細手順のうち、ステップS340をステップS345に置き換えたものであり、他のステップは図6と同じである。
ステップS345では、教師データ作成部311が、統計データを用いて第2撮影方向を決定する。この第2撮影方向は、図10で説明した不足位置姿勢に対応する撮影方向である。不足位置姿勢が複数存在する場合には、そのうちの任意の位置姿勢が得られる撮影方向を、第2撮影方向として採用することができる。例えば、第1位置姿勢に最も近い不足位置姿勢が得られる撮影方向を第2撮影方向として採用できる。なお、1つの第1位置姿勢から、2つ以上の第2撮影方向を決定してもよい。ステップS350では、カメラ400を用いて第2撮影方向から物体OBを撮影することによって第2画像が生成される。ステップS350以降の処理は、第1実施形態と同じである。
第2実施形態のステップS345において決定される第2撮影方向は、事前学習済みの機械学習モデルMMで認識される位置姿勢が正解と判定されない方向である。このように、シミュレーションによる事前学習済みの機械学習モデルMMでは正解と判定されない方向に第2撮影方向を設定すれば、シミュレーションと実環境との差を埋める教師データを作成することができる。
以上のように、第2実施形態においても、第1実施形態と同様に、事前学習済みの機械学習モデルMMを用いて第1画像から物体OBの第1位置姿勢を認識し、第1位置姿勢が正解と判定された場合には、カメラを用いて第1撮影方向と異なる第2撮影方向から第2画像を撮影し、物体OBの第2位置姿勢を第2画像に付与することによって本学習用の教師データを作成する。この結果、機械学習を行うための教師データを実環境で容易に作成でき、また、シミュレーションと実環境との差を埋めることができるので、機械学習モデルMMの性能を向上させることができる。また、第2実施形態では、事前学習済みの機械学習モデルMMでは正解と判定されない方向に第2撮影方向を設定するので、シミュレーションと実環境との差を埋める教師データを作成することができる。
上述した第1実施形態と第2実施形態では、ロボット100を用いた作業において物体を認識する場合を想定していたが、本開示は、ロボットを用いないシステムにおいて物体を認識する場合にも適用可能である。
・他の形態:
本開示は、上述した実施形態に限られるものではなく、その趣旨を逸脱しない範囲において種々の形態で実現することができる。例えば、本開示は、以下の形態(aspect)によっても実現可能である。以下に記載した各形態中の技術的特徴に対応する上記実施形態中の技術的特徴は、本開示の課題の一部又は全部を解決するために、あるいは、本開示の効果の一部又は全部を達成するために、適宜、差し替えや、組み合わせを行うことが可能である。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することが可能である。
(1)本開示の第1の形態によれば、物体の位置姿勢を認識する機械学習モデルの学習に用いる教師データを作成する方法が提供される。この方法は、(a)前記物体のシミュレーションデータを用いて前記機械学習モデルの事前学習を実行する工程と、(b)カメラを用いて第1撮影方向から前記物体の第1画像を撮影する工程と、(c)前記事前学習済みの前記機械学習モデルを用いて、前記第1画像から前記物体の第1位置姿勢を認識する工程と、(d)前記第1位置姿勢に対して正誤判定を行う工程と、(e)前記第1位置姿勢が正解と判定された場合に前記カメラを用いて前記第1撮影方向と異なる第2撮影方向から前記物体の第2画像を撮影し、前記第1位置姿勢に対して前記第1撮影方向から前記第2撮影方向への変化に応じた変換を行うことによって第2位置姿勢を算出し、前記第2位置姿勢を前記第2画像に付与することによって教師データを作成する工程と、(f)前記物体の現実の位置姿勢を変更して前記工程(b)~(e)を繰り返す工程と、を含む。
この方法によれば、機械学習を行うための教師データを実環境で容易に作成でき、また、シミュレーションと実環境との差を埋めることができるので、機械学習モデルの性能を向上させることができる。
(2)上記方法において、前記工程(e)は、(e1)前記物体への照明光の照射方向と前記第1位置姿勢から、前記物体からの鏡面反射方向を求める工程と、(e2)前記鏡面反射方向を前記第2撮影方向として設定する工程と、を含むものとしてもよい。
この方法によれば、鏡面反射方向に第2撮影方向を設定するので、光沢物に対して位置姿勢の認識を正しく行うための教師データを作成できる。
(3)上記方法において、前記第2撮影方向は、前記第2撮影方向から撮影される画像を用いて前記事前学習済みの前記機械学習モデルで認識される位置姿勢が正解と判定されない方向に設定されるものとしてもよい。
この方法によれば、シミュレーションによる事前学習済みの機械学習モデルで正解と判定されない方向に第2撮影方向を設定するので、シミュレーションと実環境との差を埋める教師データを作成できる。
(4)上記方法において、前記工程(b)~(f)の前に、前記事前学習済みの前記機械学習モデルを用いて前記物体の位置姿勢を認識して正誤判定を行い、正解と判定された前記位置姿勢の履歴を登録する処理を、複数回実行する工程を含み、前記第2撮影方向は、前記正解と判定された履歴が存在しない位置姿勢が得られる方向に設定されるものとしてもよい。
この方法によれば、シミュレーションデータによる事前学習済みの機械学習モデルで正解と判定された履歴の無い方向に第2撮影方向を設定するので、シミュレーションと実環境との差を埋める教師データを作成できる。
(5)上記方法において、前記工程(d)は、(d1)シミュレーションによって前記第1位置姿勢における前記物体のシミュレーション画像を作成する工程と、(d2)前記第1画像と前記シミュレーション画像とを用いて前記第1位置姿勢の信頼度スコアを算出する工程と、(d3)前記信頼度スコアを閾値と比較することによって前記第1位置姿勢の正誤を判定する工程と、を含むものとしてもよい。
この方法によれば、第1画像とシミュレーション画像とに応じて算出される信頼度スコアによって第1位置姿勢の正誤を判定できる。
(6)本開示の第2の形態によれば、物体の位置姿勢を認識する機械学習モデルの学習に用いる教師データを作成するシステムが提供される。このシステムは、前記物体を撮影するカメラと、前記教師データの作成を行う教師データ作成部と、を備える。前記教師データ作成部は、(a)前記物体のシミュレーションデータを用いて前記機械学習モデルの事前学習を実行する処理と、(b)前記カメラを用いて第1撮影方向から前記物体の第1画像を撮影する処理と、(c)前記事前学習済みの前記機械学習モデルを用いて、前記第1画像から前記物体の第1位置姿勢を認識する処理と、(d)前記第1位置姿勢に対して正誤判定を行う処理と、(e)前記カメラを用いて前記第1撮影方向と異なる第2撮影方向から前記物体の第2画像を撮影し、前記第1位置姿勢に対して前記第1撮影方向から前記第2撮影方向への変化に応じた変換を行うことによって第2位置姿勢を算出し、前記第2位置姿勢を前記第2画像に付与することによって教師データを作成する処理と、(f)前記物体の現実の位置姿勢を変更して前記処理(b)~(e)を繰り返す処理と、を実行する。
(7)本開示の第3の形態によれば、物体の位置姿勢を認識する機械学習モデルの学習に用いる教師データを作成する処理をプロセッサーに実行させるコンピュータープログラムが提供される。このコンピュータープログラムは、(a)前記物体のシミュレーションデータを用いて前記機械学習モデルの事前学習を実行する処理と、(b)カメラを用いて第1撮影方向から前記物体の第1画像を撮影する処理と、(c)前記事前学習済みの前記機械学習モデルを用いて、前記第1画像から前記物体の第1位置姿勢を認識する処理と、(d)前記第1位置姿勢に対して正誤判定を行う処理と、(e)前記カメラを用いて前記第1撮影方向と異なる第2撮影方向から前記物体の第2画像を撮影し、前記第1位置姿勢に対して前記第1撮影方向から前記第2撮影方向への変化に応じた変換を行うことによって第2位置姿勢を算出し、前記第2位置姿勢を前記第2画像に付与することによって教師データを作成する処理と、(f)前記物体の現実の位置姿勢を変更して前記処理(b)~(e)を繰り返す処理と、を前記プロセッサーに実行させる。
本開示は、上記以外の種々の形態で実現することも可能である。例えば、ロボットとロボット制御装置とを備えたロボットシステム、ロボット制御装置の機能を実現するためのコンピュータープログラム、そのコンピュータープログラムを記録した一時的でない記録媒体(non-transitory storage medium)等の形態で実現することができる。
100…ロボット、110…基台、120…ロボットアーム、122…アームエンド、150…ハンド、180…電流センサー、190…関節エンコーダー、200…制御装置、300…情報処理装置、310…プロセッサー、311…教師データ作成部、312…シミュレーション実行部、314…学習実行部、316…物体認識部、318…正誤判定部、320…メモリー、330…インターフェイス回路、340…入力デバイス、350…表示デバイス、400…カメラ、410…第1カメラ、420…第2カメラ、430…照明部、500…架台、510…第1トレイ、520…第2トレイ

Claims (7)

  1. 物体の位置姿勢を認識する機械学習モデルの学習に用いる教師データを作成する方法であって、
    (a)前記物体のシミュレーションデータを用いて前記機械学習モデルの事前学習を実行する工程と、
    (b)カメラを用いて第1撮影方向から前記物体の第1画像を撮影する工程と、
    (c)前記事前学習済みの前記機械学習モデルを用いて、前記第1画像から前記物体の第1位置姿勢を認識する工程と、
    (d)前記第1位置姿勢に対して正誤判定を行う工程と、
    (e)前記第1位置姿勢が正解と判定された場合に前記カメラを用いて前記第1撮影方向と異なる第2撮影方向から前記物体の第2画像を撮影し、前記第1位置姿勢に対して前記第1撮影方向から前記第2撮影方向への変化に応じた変換を行うことによって第2位置姿勢を算出し、前記第2位置姿勢を前記第2画像に付与することによって教師データを作成する工程と、
    (f)前記物体の現実の位置姿勢を変更して前記工程(b)~(e)を繰り返す工程と、
    を含む、方法。
  2. 請求項1に記載の方法であって、
    前記工程(e)は、
    (e1)前記物体への照明光の照射方向と前記第1位置姿勢から、前記物体からの鏡面反射方向を求める工程と、
    (e2)前記鏡面反射方向を前記第2撮影方向として設定する工程と、
    を含む、方法。
  3. 請求項1に記載の方法であって、
    前記第2撮影方向は、前記第2撮影方向から撮影される画像を用いて前記事前学習済みの前記機械学習モデルで認識される位置姿勢が正解と判定されない方向に設定される、方法。
  4. 請求項3に記載の方法であって、
    前記工程(b)~(f)の前に、前記事前学習済みの前記機械学習モデルを用いて前記物体の位置姿勢を認識して正誤判定を行い、正解と判定された前記位置姿勢の履歴を登録する処理を、複数回実行する工程を含み、
    前記第2撮影方向は、前記正解と判定された履歴が存在しない位置姿勢が得られる方向に設定される、方法。
  5. 請求項1~4のいずれか一項に記載の方法であって、
    前記工程(d)は、
    (d1)シミュレーションによって前記第1位置姿勢における前記物体のシミュレーション画像を作成する工程と、
    (d2)前記第1画像と前記シミュレーション画像とを用いて前記第1位置姿勢の信頼度スコアを算出する工程と、
    (d3)前記信頼度スコアを閾値と比較することによって前記第1位置姿勢の正誤を判定する工程と、
    を含む、方法。
  6. 物体の位置姿勢を認識する機械学習モデルの学習に用いる教師データを作成するシステムであって、
    前記物体を撮影するカメラと、
    前記教師データの作成を行う教師データ作成部と、
    を備え、
    前記教師データ作成部は、
    (a)前記物体のシミュレーションデータを用いて前記機械学習モデルの事前学習を実行する処理と、
    (b)前記カメラを用いて第1撮影方向から前記物体の第1画像を撮影する処理と、
    (c)前記事前学習済みの前記機械学習モデルを用いて、前記第1画像から前記物体の第1位置姿勢を認識する処理と、
    (d)前記第1位置姿勢に対して正誤判定を行う処理と、
    (e)前記カメラを用いて前記第1撮影方向と異なる第2撮影方向から前記物体の第2画像を撮影し、前記第1位置姿勢に対して前記第1撮影方向から前記第2撮影方向への変化に応じた変換を行うことによって第2位置姿勢を算出し、前記第2位置姿勢を前記第2画像に付与することによって教師データを作成する処理と、
    (f)前記物体の現実の位置姿勢を変更して前記処理(b)~(e)を繰り返す処理と、
    を実行する、システム。
  7. 物体の位置姿勢を認識する機械学習モデルの学習に用いる教師データを作成する処理をプロセッサーに実行させるコンピュータープログラムであって、
    (a)前記物体のシミュレーションデータを用いて前記機械学習モデルの事前学習を実行する処理と、
    (b)カメラを用いて第1撮影方向から前記物体の第1画像を撮影する処理と、
    (c)前記事前学習済みの前記機械学習モデルを用いて、前記第1画像から前記物体の第1位置姿勢を認識する処理と、
    (d)前記第1位置姿勢に対して正誤判定を行う処理と、
    (e)前記カメラを用いて前記第1撮影方向と異なる第2撮影方向から前記物体の第2画像を撮影し、前記第1位置姿勢に対して前記第1撮影方向から前記第2撮影方向への変化に応じた変換を行うことによって第2位置姿勢を算出し、前記第2位置姿勢を前記第2画像に付与することによって教師データを作成する処理と、
    (f)前記物体の現実の位置姿勢を変更して前記処理(b)~(e)を繰り返す処理と、
    を前記プロセッサーに実行させる、コンピュータープログラム。
JP2021187668A 2021-11-18 2021-11-18 機械学習モデルの学習に用いる教師データを作成する方法、システム、及び、コンピュータープログラム Active JP7735814B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2021187668A JP7735814B2 (ja) 2021-11-18 2021-11-18 機械学習モデルの学習に用いる教師データを作成する方法、システム、及び、コンピュータープログラム
CN202211425100.XA CN116137062B (zh) 2021-11-18 2022-11-15 生成训练数据的方法、系统以及存储介质
US17/988,795 US12567241B2 (en) 2021-11-18 2022-11-17 Method for generating training data used to learn machine learning model, system, and non-transitory computer-readable storage medium storing computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021187668A JP7735814B2 (ja) 2021-11-18 2021-11-18 機械学習モデルの学習に用いる教師データを作成する方法、システム、及び、コンピュータープログラム

Publications (2)

Publication Number Publication Date
JP2023074647A JP2023074647A (ja) 2023-05-30
JP7735814B2 true JP7735814B2 (ja) 2025-09-09

Family

ID=86323898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021187668A Active JP7735814B2 (ja) 2021-11-18 2021-11-18 機械学習モデルの学習に用いる教師データを作成する方法、システム、及び、コンピュータープログラム

Country Status (3)

Country Link
US (1) US12567241B2 (ja)
JP (1) JP7735814B2 (ja)
CN (1) CN116137062B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN119188787B (zh) * 2024-11-27 2025-04-08 法奥意威(苏州)机器人系统有限公司 实现深框工件抓取的方法、装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008246631A (ja) 2007-03-30 2008-10-16 Fanuc Ltd 対象物取出装置
JP2014137756A (ja) 2013-01-17 2014-07-28 Canon Inc 画像処理装置および画像処理方法
JP2018116599A (ja) 2017-01-20 2018-07-26 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
JP2021071878A (ja) 2019-10-30 2021-05-06 ファナック株式会社 アノテーション装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3300682B2 (ja) * 1999-04-08 2002-07-08 ファナック株式会社 画像処理機能を持つロボット装置
JP4077869B2 (ja) * 2006-05-29 2008-04-23 松下電器産業株式会社 光源推定装置、光源推定システムおよび光源推定方法、並びに、画像高解像度化装置および画像高解像度化方法
JP2009031941A (ja) * 2007-07-25 2009-02-12 Advanced Telecommunication Research Institute International 照明モデル作成装置、照明モデル作成方法及び照明モデル作成プログラム
US10652579B2 (en) * 2017-06-12 2020-05-12 Dolby Laboratories Licensing Corporation Coding multiview video
CN109685906A (zh) * 2017-10-18 2019-04-26 深圳市掌网科技股份有限公司 基于增强现实的场景融合方法和装置
CN108520552A (zh) * 2018-03-26 2018-09-11 广东欧珀移动通信有限公司 图像处理方法、装置、存储介质及电子设备
JP7064144B2 (ja) * 2018-09-28 2022-05-10 日本電信電話株式会社 情報統合方法、情報統合装置、及び情報統合プログラム
JP7167668B2 (ja) 2018-11-30 2022-11-09 コニカミノルタ株式会社 学習方法、学習装置、プログラムおよび記録媒体
JP7372076B2 (ja) * 2019-08-07 2023-10-31 ファナック株式会社 画像処理システム
JP7282703B2 (ja) * 2020-02-10 2023-05-29 株式会社東芝 ロボットシステムおよびプログラム
CN113034575B (zh) * 2021-01-27 2024-11-29 深圳市华汉伟业科技有限公司 一种模型构建方法、位姿估计方法及物体拣取装置
CN112639846A (zh) * 2021-02-07 2021-04-09 华为技术有限公司 一种训练深度学习模型的方法和装置
CN113313766B (zh) * 2021-03-09 2024-08-20 常州龙源智能机器人科技有限公司 机器人及其位姿计算方法、位姿计算装置
CN113077516B (zh) * 2021-04-28 2024-02-23 深圳市人工智能与机器人研究院 一种位姿确定方法及相关设备
CN113370217B (zh) * 2021-06-29 2023-06-16 华南理工大学 基于深度学习的物体姿态识别和抓取的智能机器人的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008246631A (ja) 2007-03-30 2008-10-16 Fanuc Ltd 対象物取出装置
JP2014137756A (ja) 2013-01-17 2014-07-28 Canon Inc 画像処理装置および画像処理方法
JP2018116599A (ja) 2017-01-20 2018-07-26 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
JP2021071878A (ja) 2019-10-30 2021-05-06 ファナック株式会社 アノテーション装置

Also Published As

Publication number Publication date
US12567241B2 (en) 2026-03-03
CN116137062A (zh) 2023-05-19
US20230154162A1 (en) 2023-05-18
JP2023074647A (ja) 2023-05-30
CN116137062B (zh) 2026-02-27

Similar Documents

Publication Publication Date Title
US12109710B2 (en) Method and apparatus for motion planning of robot, method and apparatus for path planning of robot, and method and apparatus for grasping of robot
CN114599488B (zh) 机器学习数据生成装置、机器学习装置、作业系统、计算机程序、机器学习数据生成方法及作业机的制造方法
CN117103277B (zh) 一种基于多模态数据融合的机械手臂感知方法
CN109015640B (zh) 抓取方法、系统、计算机装置及可读存储介质
CN111515950A (zh) 机器人坐标系变换关系确定方法、装置、设备和存储介质
US20210331311A1 (en) Image generation device, robot training system, image generation method, and non-transitory computer readable storage medium
JP2012141962A (ja) 位置姿勢計測装置及び位置姿勢計測方法
CN113927597A (zh) 基于深度学习的机器人连接件六自由度位姿估计系统
JP6626338B2 (ja) 情報処理装置、情報処理装置の制御方法、およびプログラム
JP2020001127A (ja) ピッキングシステム,ピッキング処理装置及びプログラム
KR20220067719A (ko) 딥러닝과 마커를 이용한 비전인식을 통한 로봇 제어장치 및 그 방법
CN118809624A (zh) 一种机械臂分拣抓取控制方法、系统及装置
JP7735814B2 (ja) 機械学習モデルの学習に用いる教師データを作成する方法、システム、及び、コンピュータープログラム
US12350847B2 (en) Method for controlling a robot for manipulating, in particular picking up, an object
JP7249221B2 (ja) センサ位置姿勢キャリブレーション装置及びセンサ位置姿勢キャリブレーション方法
CN116901054A (zh) 识别位置姿态的方法、系统以及存储介质
CN115082550A (zh) 从对象的相机图像中定位对象的位置的设备和方法
CN116152335A (zh) 用于训练机器学习模型以生成描述符图像的装置和方法
US20250178205A1 (en) Robot system, method of controlling the robot system, method of manufacturing products, and recording medium
US20210233269A1 (en) Method and computer readable medium for pose estimation
JP2023121899A (ja) カメラで撮影される物体の位置及び姿勢を認識する方法、システム、及び、コンピュータープログラム
Fröhlig et al. Three-dimensional pose estimation of deformable linear object tips based on a low-cost, two-dimensional sensor setup and AI-based evaluation
Kamiya et al. Learning from Human Hand Demonstration for Wire Harness Grasping
JP2022183723A (ja) 処理装置、サーボシステム、処理方法、およびプログラム
CN111178299A (zh) 图像处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20241007

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250605

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250729

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250811

R150 Certificate of patent or registration of utility model

Ref document number: 7735814

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150