JP2000353244A - A method for obtaining a fundamental matrix, a method for restoring Euclidean three-dimensional information, and a three-dimensional information restoring apparatus. - Google Patents
A method for obtaining a fundamental matrix, a method for restoring Euclidean three-dimensional information, and a three-dimensional information restoring apparatus.Info
- Publication number
- JP2000353244A JP2000353244A JP11163478A JP16347899A JP2000353244A JP 2000353244 A JP2000353244 A JP 2000353244A JP 11163478 A JP11163478 A JP 11163478A JP 16347899 A JP16347899 A JP 16347899A JP 2000353244 A JP2000353244 A JP 2000353244A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- obtaining
- image data
- images
- dimensional information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 144
- 238000000034 method Methods 0.000 title claims abstract description 111
- 230000009466 transformation Effects 0.000 claims abstract description 43
- 238000004364 calculation method Methods 0.000 claims abstract description 29
- 238000006243 chemical reaction Methods 0.000 claims abstract description 9
- 238000011156 evaluation Methods 0.000 claims abstract description 7
- 238000000354 decomposition reaction Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 10
- 238000012937 correction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000036544 posture Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 101100366710 Arabidopsis thaliana SSL12 gene Proteins 0.000 description 1
- 102100033040 Carbonic anhydrase 12 Human genes 0.000 description 1
- 101000867855 Homo sapiens Carbonic anhydrase 12 Proteins 0.000 description 1
- 101100280298 Homo sapiens FAM162A gene Proteins 0.000 description 1
- 101000680262 Homo sapiens Transmembrane protein 60 Proteins 0.000 description 1
- 101100366563 Panax ginseng SS13 gene Proteins 0.000 description 1
- 102100023788 Protein FAM162A Human genes 0.000 description 1
- 102100022076 Transmembrane protein 60 Human genes 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Landscapes
- Length Measuring Devices By Optical Means (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】
【課題】 未校正カメラで撮影した複数枚の画像からユ
ークリッド的な3次元情報の復元を安定して精度良く行
なえる3次元情報復元装置を提供する。
【解決手段】 3次元情報復元装置は、未校正カメラ3
0によって撮影され非等方的変換された画像データ72
にKanataniの最適推定法を適用して基礎行列を求める手
段76と、基礎行列から射影的な射影行列の組を求める
手段78と、各射影的な射影行列に対応する2次元射影
座標系からユークリッド的な空間の座標系への基底変換
行列を求める手段と、基底変換行列を用いてユークリッ
ド的な3次元情報の復元を行う手段80を含む。基底変
換行列を求める手段は、射影的な射影行列から未校正カ
メラの内部パラメータの初期値を推定し、基底変換行列
の初期値を準備する手段と、推定された初期値から所定
の誤差評価関数を用いて反復計算することにより基底変
換行列を求める手段を含む。
(57) [Summary] [PROBLEMS] To provide a three-dimensional information restoring device capable of stably and accurately restoring Euclidean three-dimensional information from a plurality of images taken by an uncalibrated camera. A three-dimensional information restoration device includes an uncalibrated camera (3).
Image data 72 captured and anisotropically transformed by the
Means for obtaining a fundamental matrix by applying Kanatani's optimal estimation method, means 78 for obtaining a set of projective projection matrices from the basic matrices, and Euclidean projection from a two-dimensional projection coordinate system corresponding to each projective projection matrix. Means for obtaining a basis transformation matrix for a coordinate system in a general space, and means 80 for restoring Euclidean three-dimensional information using the basis transformation matrix. Means for obtaining a basis conversion matrix, estimating an initial value of an internal parameter of the uncalibrated camera from the projective projection matrix, and preparing an initial value of the basis transformation matrix; and a predetermined error evaluation function from the estimated initial value. Means for obtaining a basis conversion matrix by iterative calculation using
Description
【0001】[0001]
【発明の属する技術分野】この発明はカメラ等からの画
像を処理する画像処理に関し、特に、画像を処理するこ
とにより環境の情報を獲得する画像処理・画像認識の分
野および画像から3次元的な位置および距離を計測する
画像計測の分野に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to image processing for processing an image from a camera or the like, and in particular, to the field of image processing and image recognition for acquiring environmental information by processing an image, and to three-dimensional image processing. The present invention relates to the field of image measurement for measuring position and distance.
【0002】[0002]
【従来の技術】[参考文献]この分野に関連する参考文
献として以下のものがあげられる。2. Description of the Related Art References related to this field include the following.
【0003】[0003]
【表1】 [Table 1]
【0004】[用語の定義]以下に、本明細書で使用す
る主な用語についてその定義を記載する。[Definition of terms] Definitions of main terms used in this specification are described below.
【0005】「未校正カメラ」とはカメラの位置、姿
勢、レンズの焦点距離などの知識が事前に得られないカ
メラをいう。[0005] An "uncalibrated camera" refers to a camera for which knowledge of the camera position, attitude, lens focal length, and the like cannot be obtained in advance.
【0006】「対応点」とはある物体の複数個の画像内
での、物体上の同一点の画像位置のことをいう。The term "corresponding point" refers to an image position of the same point on an object in a plurality of images of the object.
【0007】「射影的な復元(Projective Reconstruct
ion)」とは、異なる位置または異なる姿勢で撮影した
複数枚の画像から、ある種の不定性を含んで復元された
3次元情報を復元することをいう。[0007] "Projective Reconstruction
“ion)” refers to restoring three-dimensional information including a certain degree of uncertainty from a plurality of images photographed at different positions or different postures.
【0008】「基礎行列(Fundamental Matrix)」と
は、射影的な復元を行うための、2枚の画像間の幾何学
的な関係を記述する3行×3列、ランク(階数)2の行
列のことをいう。[0008] A "fundamental matrix" is a matrix of 3 rows x 3 columns, rank (rank) 2 that describes a geometric relationship between two images for projective restoration. Means
【0009】「ユークリッド的な復元」とは、ここで
は、対象物体の形は知ることができるが、その大きさが
不定な3次元情報を復元することをいう。Here, "Euclidean restoration" refers to the restoration of three-dimensional information whose size is indefinite, although the shape of the target object can be known.
【0010】なお、以下の説明では、出願書類に関する
記法上の制約から、集合を示す記号である中かっ
こ「{」および「}」について、上付きの添字にした場合
にはそれぞれ「<」および「>」と記すことがある。[従
来技術の要旨]対象物体をカメラで撮影し、対象物体の
3次元情報を画像だけから推定する問題は、コンピュー
タビジョン、画像認識の分野の中心的な問題である。特
に、カメラの位置、姿勢、レンズの焦点距離などの知識
が事前に得られないカメラ(未校正カメラと呼ばれる)
で撮影された画像を用いて対象物体の3次元情報を復元
する手法が注目されている。[0010] In the following description, the curly braces “{” and “}”, which are symbols indicating a set, are replaced by “<” and “< May be written as ">". [Summary of the Prior Art] The problem of capturing a target object with a camera and estimating three-dimensional information of the target object only from an image is a central problem in the fields of computer vision and image recognition. In particular, cameras for which knowledge of camera position, posture, lens focal length, etc. cannot be obtained in advance (called uncalibrated cameras)
Attention has been paid to a method of restoring three-dimensional information of a target object using an image captured in the above.
【0011】これらの手法を適用するには、画像間で、
対応点を決定する必要がある。対応点を求める手法は様
々なものが提案されている。その多くは、画像内で、画
素の輝度の変化の激しい場所を画像のエッジとして抽出
し、相関を用いて計算している。対応点の画像上での座
標が一旦決定されれば、幾何学的な投影関係を使って対
象物体の3次元情報を得ることができる。[0011] To apply these techniques,
The corresponding points need to be determined. Various methods have been proposed for obtaining corresponding points. In many cases, a location where the luminance of a pixel changes greatly in an image is extracted as an edge of the image, and calculation is performed using a correlation. Once the coordinates of the corresponding point on the image are determined, three-dimensional information of the target object can be obtained using the geometric projection relationship.
【0012】未校正画像から3次元情報を復元するため
には、異なる位置または異なる姿勢で撮影した複数枚の
画像が必要である。しかも、これだけでは3次元情報は
一意には決定できず、復元された情報はある種の不定性
を含んでいる。このように不定性を残して3次元情報を
復元する手法は射影的な復元(Projective Reconstruct
ion)と呼ばれる。射影的な復元の初期の論文として[2]
および[10]が有名である。また[7]は、様々な射影的な
復元の手法を比較している。In order to restore three-dimensional information from an uncalibrated image, a plurality of images taken at different positions or at different postures are required. In addition, the three-dimensional information cannot be uniquely determined by this alone, and the restored information includes some kind of indefiniteness. The method of restoring three-dimensional information while leaving indefiniteness is a projective restoration (Projective Reconstruction).
ion). As an early paper on projective reconstruction [2]
And [10] are famous. [7] compares various projective reconstruction methods.
【0013】射影的な復元を行うためには、まず2枚の
画像間の幾何学的な関係を計算する必要がある。この関
係は3行×3列、ランク(階数)2の行列で記述され、
この行列は基礎行列(fundamental Matrix)と呼ばれ
る。In order to perform projective restoration, it is necessary to first calculate a geometric relationship between two images. This relationship is described by a matrix of 3 rows × 3 columns and rank (rank) 2,
This matrix is called a fundamental matrix.
【0014】基礎行列の計算は3次元情報の復元を行う
最初のステップとなるが、その計算は必ずしも容易では
ない。特に、この計算は画像に含まれるノイズの影響を
大きく受け、そのため基礎行列を精度良く計算すること
は困難であった。そこで、[4]では、最適な評価関数を
導入し、基礎行列を精度良く、そしてその信頼性の評価
までも同時に計算する手法を提案している。また[9]
は、基礎行列を計算する様々なアルゴリズムの性能を評
価し、数値計算上で様々な工夫が施され、十分な精度の
計算方法を提案している。The calculation of the fundamental matrix is the first step for restoring three-dimensional information, but the calculation is not always easy. In particular, this calculation is greatly affected by noise included in the image, and therefore, it has been difficult to calculate the basic matrix with high accuracy. Therefore, [4] proposes a method that introduces the optimal evaluation function, calculates the fundamental matrix with high accuracy, and simultaneously evaluates its reliability. Also [9]
Evaluates the performance of various algorithms for calculating the fundamental matrix, proposes a calculation method with sufficient accuracy by taking various measures in numerical calculation.
【0015】2枚の画像間での基礎行列が計算できる
と、次に、複数枚の画像間の関係も記述することが可能
になる。2枚だけでなく、3枚以上の画像の情報を使用
すると、射影的復元ではなく、より不定性の少ないユー
クリッド的な復元が可能となる。ここでいうユークリッ
ド的な復元とは、対象物体の形は知ることができるが、
その大きさが不定なものである。ユークリッド的な復元
では、物体の長さの比や、角度等が正確に復元できる。
未校正カメラから得られた3枚以上の画像からのユーク
リッド的な復元に関する手法は[8]、[5]および[1]によ
って実現されている。If the basic matrix between the two images can be calculated, the relationship between the plurality of images can be described next. When information of three or more images is used instead of two, it is possible to perform Euclidean restoration with less indefiniteness instead of projective restoration. Euclidean restoration here means that you can know the shape of the target object,
Its size is indeterminate. In the Euclidean restoration, the length ratio, the angle, and the like of the object can be accurately restored.
A method for Euclidean restoration from three or more images obtained from an uncalibrated camera is realized by [8], [5], and [1].
【0016】[0016]
【発明が解決しようとする課題】基礎行列を計算するた
めの手法のうち[4]で提案されているKanataniの最適推
定法は、精度も良く、信頼性も同時に得られるという優
れた特性を持つが、数値計算上の不安定さが残されてい
る。すなわちこの手法では、反復計算が収束すれば基礎
行列を精度良く推定できるが、収束しない場合も少なく
ないという問題がある。また[9]の手法では、基礎行列
の信頼性を得ることができないという問題がある。Among the methods for calculating the fundamental matrix, Kanatani's optimal estimation method proposed in [4] has excellent characteristics that accuracy and reliability are obtained at the same time. However, numerical instability remains. That is, in this method, if the iterative calculation converges, the basic matrix can be estimated with high accuracy. In addition, the method of [9] has a problem that the reliability of the fundamental matrix cannot be obtained.
【0017】また、ユークリッド的な復元に関する手法
には、いずれも数値計算上の不安定さが付きまとい、い
かなる画像データに適用した場合でも良好な結果が得ら
れる訳ではないという問題がある。In addition, all of the methods relating to Euclidean restoration have a problem in that numerical calculations are unstable, and good results cannot be obtained when applied to any image data.
【0018】さらに、従来の技術では、対応点の抽出、
基礎行列の計算、およびユークリッド的な復元への変換
の個々の技術の改良に関する研究はあったが、これらを
統合して実現したものはなかった。Further, in the conventional technology, extraction of corresponding points,
There have been studies on improving the individual techniques of calculating the fundamental matrix and converting to Euclidean reconstruction, but none of them has been realized.
【0019】それゆえに本発明の目的は、基礎行列を、
その信頼性とともに精度良く安定して計算することによ
って、未校正カメラで撮影した複数枚の画像から3次元
情報を精度良く復元するようにできる基礎行列を求める
ための方法、ユークリッド的な3次元情報復元方法およ
び3次元情報復元装置を提供することである。Therefore, it is an object of the present invention to define the fundamental matrix as
A method for obtaining a basic matrix that can accurately restore three-dimensional information from multiple images taken with an uncalibrated camera by calculating accurately and stably with its reliability, Euclidean three-dimensional information An object of the present invention is to provide a restoration method and a three-dimensional information restoration device.
【0020】この発明の他の目的は、射影的な復元から
ユークリッド的な復元への変換を安定にかつ精度良く行
えるようにすることにより、未校正カメラで撮影した複
数枚の画像から3次元情報を精度良く復元するようにで
きる基礎行列を求めるための方法、ユークリッド的な3
次元情報復元方法および3次元情報復元装置を提供する
ことである。Another object of the present invention is to enable stable and accurate conversion from projective restoration to Euclidean restoration so that three-dimensional information can be obtained from a plurality of images taken by an uncalibrated camera. To find the fundamental matrix that can be accurately restored, Euclidean 3
An object of the present invention is to provide a three-dimensional information restoring method and a three-dimensional information restoring apparatus.
【0021】この発明のさらに他の目的は、未校正カメ
ラで撮影した複数枚の画像からの対応点の抽出、基礎行
列の計算およびユークリッド的な復元の一連のステップ
を統合した3次元情報復元装置を提供することである。Still another object of the present invention is to provide a three-dimensional information restoring apparatus which integrates a series of steps of extracting corresponding points from a plurality of images taken by an uncalibrated camera, calculating a fundamental matrix, and restoring in a Euclidean manner. It is to provide.
【0022】[0022]
【課題を解決するための手段】請求項1に記載の発明に
かかる方法は、画像間の対応点の組から、画像間の関係
を記述する基礎行列を求めるための方法であって、未校
正カメラによって撮影された、対象物体を異なる角度か
ら撮影した3枚以上の画像データを準備するステップ
と、画像データに対して所定の非等方変換を行うステッ
プと、所定の非等方変換によって変換された画像データ
に対して、Kanataniの最適推定法を適用して各画像間の
基礎行列を計算するステップとを含む。According to a first aspect of the present invention, there is provided a method for obtaining a basic matrix describing a relationship between images from a set of corresponding points between images, the method comprising: Preparing three or more pieces of image data of the target object photographed by the camera at different angles, performing a predetermined anisotropic transformation on the image data, and performing a predetermined anisotropic transformation Calculating the fundamental matrix between each image by applying Kanatani's optimal estimation method to the obtained image data.
【0023】この発明によれば、Kanataniの最適推定法
を用いるに先立って、データに対して非等方変換を行う
ので、Kanataniの最適推定法における初期値の計算の精
度が大きく向上する。その結果、Kanataniの最適推定法
における数値計算が安定し、より精度の高い計算が可能
となる。According to the present invention, prior to using Kanatani's optimal estimation method, anisotropic transformation is performed on the data, so that the accuracy of calculating the initial value in Kanatani's optimal estimation method is greatly improved. As a result, numerical calculations in Kanatani's optimal estimation method are stable, and more accurate calculations are possible.
【0024】請求項2に記載の発明にかかるユークリッ
ド的な3次元情報復元方法は、正方ピクセルを有し、か
つスキューのない未校正カメラによって撮影された、対
象物体を異なる角度から撮影した3枚以上の画像データ
から、画像の対の間の射影的な射影行列の組を求めるス
テップと、各射影的な射影行列に対応する2次元射影座
標系からユークリッド的な空間の座標系への基底変換行
列を求めるステップと、基底変換行列を用いて前記画像
データからユークリッド的な3次元情報の復元を行うス
テップとを含み、基底変換行列を求めるステップは、射
影的な射影行列の正準形の左3×3小行列からQR分解
を用いて前記未校正カメラの内部パラメータの初期値を
推定し、基底変換行列の初期値を準備するステップと、
推定された初期値から所定の誤差評価関数を用いて、か
つ自明な解に収束しないようあらかじめ選択された拘束
条件を満足するように反復計算することにより基底変換
行列を求めるステップとを含む。According to a second aspect of the present invention, there is provided a method for restoring three-dimensional information in a Euclidean manner. A step of obtaining a set of projective projection matrices between pairs of images from the image data, and a basis transformation from a two-dimensional projective coordinate system corresponding to each projective projection matrix to a coordinate system in a Euclidean space A step of obtaining a matrix and a step of restoring Euclidean three-dimensional information from the image data using the basis transformation matrix, wherein the step of finding the basis transformation matrix comprises: Estimating an initial value of an internal parameter of the uncalibrated camera using a QR decomposition from a 3 × 3 small matrix, and preparing an initial value of a basis transformation matrix;
Obtaining a basis conversion matrix by iteratively calculating a predetermined error evaluation function from the estimated initial value and satisfying a constraint condition selected in advance so as not to converge to an obvious solution.
【0025】請求項2に記載の方法によれば、Bougnoux
の手法において見られた、自明な解に収束するという欠
点が除去され、より安定して頑健に解を得ることができ
る。According to the method of the second aspect, Bougnoux
The disadvantage that the method converges to a trivial solution, which has been observed in the method described above, is removed, and a more stable and robust solution can be obtained.
【0026】請求項3に記載の発明にかかる方法は、請
求項2に記載の発明の構成に加えて、射影的な射影行列
の組を求めるステップは、画像間の対応点の組から、画
像間の関係を記述する基礎行列を求めるステップと、基
礎行列に基づいて所定の整合条件を満足する射影的な射
影行列の組を求めるステップとを含み、基礎行列を求め
るステップは、未校正カメラによって撮影された、対象
物体を異なる角度から撮影した3枚以上の画像データを
準備するステップと、画像データに対して所定の非等方
変換を行うステップと、所定の非等方変換によって変換
された画像データに対して、Kanataniの最適推定法を適
用して各画像間の基礎行列を計算するステップとを含
む。According to a third aspect of the present invention, in addition to the configuration of the second aspect of the present invention, the step of obtaining a set of projective projection matrices includes the steps of: Determining a basis matrix that describes the relationship between the two, and determining a set of projective projection matrices that satisfy a predetermined matching condition based on the basis matrix. Preparing three or more pieces of image data obtained by photographing the target object from different angles, performing a predetermined anisotropic transformation on the image data, and converting the image data by a predetermined anisotropic transformation Calculating the fundamental matrix between each image by applying Kanatani's optimal estimation method to the image data.
【0027】請求項3に記載の発明によれば、請求項2
に記載の発明の作用効果に加えて、基礎行列を求める際
にKanataniの最適推定法を用いるに先立って、データに
対して非等方変換を行うので、Kanataniの最適推定法に
おける初期値の計算の精度が大きく向上する。その結
果、Kanataniの最適推定法における数値計算が安定し、
より精度高く基礎行列が求められ、結果としてユークリ
ッド的な3次元情報の精度が向上する。According to the invention of claim 3, according to claim 2,
In addition to the operation and effect of the invention described in (1), prior to using Kanatani's optimal estimation method when obtaining the fundamental matrix, anisotropic transformation is performed on the data, so the initial value calculation in Kanatani's optimal estimation method The accuracy of the method is greatly improved. As a result, numerical calculations in Kanatani's optimal estimation method become stable,
The base matrix is obtained with higher accuracy, and as a result, the accuracy of Euclidean three-dimensional information is improved.
【0028】請求項4に記載の発明にかかる3次元情報
復元装置は、正方ピクセルを有し、かつスキューのない
未校正カメラによって撮影された、対象物体を異なる角
度から撮影した3枚以上の画像データから、画像の対の
間の射影的な射影行列の組を求めるための手段と、各射
影的な射影行列に対応する3次元射影座標系からユーク
リッド的な空間の座標系への基底変換行列を求めるため
の手段と、基底変換行列を用いて前記画像データからユ
ークリッド的な3次元情報の復元を行うための手段とを
含み、基底変換行列を求めるための手段は、射影的な射
影行列の正準形の左3×3小行列からQR分解を用いて
前記未校正カメラの内部パラメータの初期値を推定し、
基底変換行列の初期値を準備するための手段と、推定さ
れた初期値から所定の誤差評価関数を用いて反復計算す
ることにより基底変換行列を求めるための手段とを含
み、射影的な射影行列の組を求めるための前記手段は、
画像間の対応点の組から、画像間の関係を記述する基礎
行列を求めるための手段と、基礎行列に基づいて所定の
整合条件を満足する射影的な射影行列の組を求めるため
の手段とを含み、基礎行列を求めるための手段は、未校
正カメラによって撮影された、対象物体を異なる角度か
ら撮影した3枚以上の画像データを準備するための手段
と、画像データに対して所定の非等方変換を行うための
手段と、所定の非等方変換によって変換された画像デー
タに対して、Kanataniの最適推定法を適用して各画像間
の基礎行列を計算するための手段とを含む。According to a third aspect of the present invention, there is provided a three-dimensional information restoration apparatus comprising three or more images of a target object taken from different angles, which are taken by an uncalibrated camera having square pixels and having no skew. Means for obtaining a set of projective projection matrices between pairs of images from data, and a basis transformation matrix from a three-dimensional projective coordinate system corresponding to each projective projection matrix to a coordinate system in a Euclidean space And means for performing Euclidean three-dimensional information restoration from the image data using the basis transformation matrix, wherein the means for finding the basis transformation matrix comprises: Estimating initial values of the internal parameters of the uncalibrated camera using QR decomposition from the left 3 × 3 small matrix of the canonical form,
Means for preparing an initial value of a basis transformation matrix, and means for obtaining a basis transformation matrix by iteratively calculating from the estimated initial value using a predetermined error evaluation function, a projective projection matrix The means for determining the set of
Means for obtaining a basic matrix describing a relationship between images from a set of corresponding points between images; and means for obtaining a set of projective projection matrices satisfying a predetermined matching condition based on the basic matrix. Means for preparing three or more sets of image data of the target object taken from different angles, taken by an uncalibrated camera, and a predetermined non- Including means for performing isotropic transformation and means for calculating a basic matrix between each image by applying Kanatani's optimal estimation method to image data transformed by a predetermined anisotropic transformation .
【0029】請求項4に記載の発明によれば、基礎行列
を求める際にKanataniの最適推定法を用いるに先立っ
て、データに対して非等方変換を行うので、Kanataniの
最適推定法における初期値の計算の精度が大きく向上す
る。さらに、そうして得られた基礎行列から射影的な射
影行列を求め、さらにユークリッド的な3次元情報の復
元を行うときに、Bougnouxの手法において見られたよう
に、自明な解に収束するという欠点が除去される。その
結果、Kanataniの最適推定法における数値計算が安定
し、より精度高く基礎行列が求められることと併せて、
ユークリッド的な3次元情報を、より安定し、精度高
く、かつ頑健に得ることができる。According to the fourth aspect of the present invention, the data is subjected to anisotropic transformation prior to using the Kanatani optimal estimation method in obtaining the fundamental matrix. The accuracy of value calculation is greatly improved. Furthermore, when a projective projection matrix is obtained from the fundamental matrix obtained in this way, and when Euclidean 3D information is restored, it converges to a trivial solution as seen in Bougnoux's method. Defects are eliminated. As a result, the numerical calculation in Kanatani's optimal estimation method is stable, and in addition to the fact that the fundamental matrix is obtained with higher accuracy,
Euclidean three-dimensional information can be obtained more stably, accurately, and robustly.
【0030】[0030]
【発明の実施の形態】[ハードウェア構成]以下、本発
明の実施の形態にかかる3次元情報復元装置について説
明する。この3次元情報復元装置は、パーソナルコンピ
ュータまたはワークステーションなど、コンピュータ上
で実行されるソフトウェアにより実現される。図1に、
この3次元情報復元装置の外観を示す。DESCRIPTION OF THE PREFERRED EMBODIMENTS [Hardware Configuration] Hereinafter, a three-dimensional information restoration apparatus according to an embodiment of the present invention will be described. The three-dimensional information restoration device is realized by software executed on a computer such as a personal computer or a workstation. In FIG.
The appearance of the three-dimensional information restoration device is shown.
【0031】図1を参照してこの3次元情報復元装置
は、CD−ROM(Compact Disc Read-Only Memory )
ドライブ50およびFD(Flexible Disk)ドライブ5
2を備えたコンピュータ本体40と、コンピュータ本体
40に接続された表示装置としてのディスプレイ42
と、同じくコンピュータ本体40に接続された入力装置
としてのキーボード46およびマウス48と、コンピュ
ータ本体40に接続された、画像を取込むためのカメラ
30を含む。この実施の形態の装置では、カメラ30と
してはビデオカメラを用い、カメラ30の前で対象物体
を移動させながら得た複数枚の画像に対して後述する3
次元情報復元処理を行うものとする。Referring to FIG. 1, the three-dimensional information restoring apparatus is a CD-ROM (Compact Disc Read-Only Memory).
Drive 50 and FD (Flexible Disk) drive 5
And a display 42 as a display device connected to the computer main body 40
And a keyboard 46 and a mouse 48 as input devices also connected to the computer main body 40, and a camera 30 connected to the computer main body 40 for capturing images. In the apparatus according to the present embodiment, a video camera is used as the camera 30, and a plurality of images obtained while moving the target object in front of the camera 30 will be described later.
It is assumed that dimension information restoration processing is performed.
【0032】図2に、この3次元情報復元装置の構成を
ブロック図形式で示す。図2に示されるようにこのシス
テム20を構成するコンピュータ本体40は、CD−R
OMドライブ50およびFDドライブ52に加えて、そ
れぞれバス66に接続されたCPU(Central Processi
ng Unit)56と、ROM(Read Only Memory)58と、
RAM(Random Access Memory)60と、ハードディスク
54と、カメラ30からの画像を取込むための画像取込
装置68とを含んでいる。CD−ROMドライブ50に
はCD−ROM62が装着される。FDドライブ52に
はFD64が装着される。FIG. 2 is a block diagram showing the configuration of the three-dimensional information restoration apparatus. As shown in FIG. 2, a computer main body 40 constituting the system 20 includes a CD-R
In addition to the OM drive 50 and the FD drive 52, CPUs (Central Process
ng Unit) 56, ROM (Read Only Memory) 58,
It includes a RAM (Random Access Memory) 60, a hard disk 54, and an image capturing device 68 for capturing an image from the camera 30. A CD-ROM 62 is mounted on the CD-ROM drive 50. An FD 64 is mounted on the FD drive 52.
【0033】既に述べたようにこの3次元情報復元装置
の主要部は、コンピュータハードウェアと、CPU56
により実行されるソフトウェアとにより実現される。一
般的にこうしたソフトウェアはFDドライブ52、FD
64などの記憶媒体に格納されて流通し、CD−ROM
ドライブ50またはFDドライブ52などにより記憶媒
体から読取られてハードディスク54に一旦格納され
る。または、当該装置がネットワークに接続されている
場合には、ネットワーク上のサーバからハードディスク
54に一旦コピーされる。そうしてさらにハードディス
ク54からRAM60に読出されてCPU56により実
行される。なお、ネットワーク接続されている場合に
は、ハードディスク54に格納することなくRAM60
に直接ロードして実行するようにしてもよい。図5およ
び図6に示したコンピュータのハードウェア自体は一般
的なものである。したがって、本発明の最も本質的な部
分はFDドライブ52、FD64、ハードディスク54
などの記憶媒体に記憶されたソフトウェアである。As described above, the main parts of the three-dimensional information restoring device are computer hardware and CPU 56.
And software executed by the software. Generally, such software is FD drive 52, FD
CD-ROM stored in a storage medium such as CD-ROM
The data is read from the storage medium by the drive 50 or the FD drive 52 and temporarily stored in the hard disk 54. Alternatively, when the device is connected to a network, the data is temporarily copied to a hard disk 54 from a server on the network. Then, the data is further read from the hard disk 54 to the RAM 60 and executed by the CPU 56. Note that, when connected to a network, the RAM 60
May be directly loaded and executed. The hardware itself of the computer shown in FIGS. 5 and 6 is general. Therefore, the most essential parts of the present invention are the FD drive 52, the FD 64, and the hard disk 54.
Software stored in a storage medium such as
【0034】なお、最近の傾向として、コンピュータの
オペレーティングシステムの一部として様々なプログラ
ムモジュールを用意しておき、アプリケーションプログ
ラムはこれらモジュールを随時呼び出して処理を進める
方式が一般的である。そうした場合、当該3次元情報復
元装置を実現するためのソフトウェア自体にはそうした
モジュールは含まれず、当該コンピュータでオペレーテ
ィングシステムと協働してはじめて3次元情報復元装置
が実現することになる。しかし、一般的なプラットフォ
ームを使用する限り、そうしたモジュールを含ませたソ
フトウェアを流通させる必要はなく、それらモジュール
を含まないソフトウェア自体およびそれらソフトウェア
を記録した記録媒体(およびそれらソフトウェアがネッ
トワーク上を流通する場合のデータ信号)が実施の形態
を構成すると考えることができる。As a recent trend, a general method is to prepare various program modules as a part of an operating system of a computer, and an application program calls these modules as needed to advance processing. In such a case, the software itself for realizing the three-dimensional information restoration device does not include such a module, and the three-dimensional information restoration device is realized only when the computer cooperates with the operating system. However, as long as a general platform is used, it is not necessary to distribute software including such modules, and the software itself that does not include those modules and a recording medium on which the software is recorded (and the software is distributed on a network) Data signal in such a case) can be considered to constitute an embodiment.
【0035】なお図1および図2に示したコンピュータ
自体の動作は周知であるので、ここではその詳細な説明
は繰返さない。 [概略構成]図3を参照して、本実施の形態の装置で
は、固定したカメラ30(未校正カメラ)の前で対象物
体70を任意に運動させて撮影し、得られた複数枚の画
像72−1〜72−niからそこに写っている対象物体
70の3次元情報を復元する。またはカメラで対象物体
を異なる複数方向から撮影して得た複数枚の画像から3
次元情報を復元してもよい。Since the operation of the computer itself shown in FIGS. 1 and 2 is well known, detailed description thereof will not be repeated here. [Schematic Configuration] Referring to FIG. 3, in the apparatus of the present embodiment, a plurality of images are obtained by arbitrarily moving target object 70 in front of fixed camera 30 (uncalibrated camera). The three-dimensional information of the target object 70 shown there is restored from 72-1 to 72-ni. Or, from a plurality of images obtained by shooting the target object from different directions with a camera, 3
The dimensional information may be restored.
【0036】本実施の形態の装置は、以下の3つのステ
ップからなる方法を用いて3次元情報を復元する。 (1) 対象物体70を撮影した複数枚の画像72−1
〜72−niから、画像間で対応点を探索し、決定する
(74)。 (2) 得られた複数枚の画像72−1〜72−ni間
での対応関係から、エピポーラ幾何学を援用し、3次元
射影空間での3次元情報を復元する(76、78)。 (3) こうして得られた3次元射影空間での3次元情
報をユークリッド空間での3次元情報に変換する(8
0)。The apparatus according to the present embodiment restores three-dimensional information by using a method including the following three steps. (1) A plurality of images 72-1 of the target object 70
From to 72-n i, searches the corresponding point between images are determined (74). From the correspondence relationship between (2) The obtained plurality of images 72-1 to 72-n i, the aid of epipolar geometry, to restore the three-dimensional information in the three-dimensional projective space (76, 78). (3) Convert the obtained three-dimensional information in the three-dimensional projective space into three-dimensional information in the Euclidean space (8)
0).
【0037】ここでは、撮像素子が正方であること以
外、カメラに関する拘束はない。また仮に撮像素子が正
方でなくとも、後述するように所定の変換を行うことで
撮像素子が正方であるものとして取扱うことができる。Here, there is no restriction on the camera except that the image sensor is square. Even if the image sensor is not a square, the image sensor can be treated as a square by performing a predetermined conversion as described later.
【0038】上述した手法のうち、本実施の形態の眼目
となるのは以下の点である。 (1) 基礎行列の計算(76)において、従来技術で
あるKanataniの最適推定法[4]と、Hartleyの画像正規化
手法[3]を組合わせ、より頑健に、安定に解を推定でき
る新しい手法を用いる。 (2) ユークリッド的な3次元復元(80)におい
て、Bougnouxの手法[1]の、自明な解に収束するという
欠点を回避するような新たな手法を用いる。 (3) 画像の入力、対応点の探索、3次元形状の復元
まで組合わせ、一貫したシステムとして提案する。Of the above-mentioned methods, the following points are of interest in the present embodiment. (1) In the calculation of the fundamental matrix (76), a combination of the prior art Kanatani's optimal estimation method [4] and Hartley's image normalization method [3] is used, and a more robust and stable solution can be estimated. Use a method. (2) In Euclidean three-dimensional reconstruction (80), a new method that avoids the disadvantage of Bougnoux's method [1] of converging to an obvious solution is used. (3) Combine input of images, search for corresponding points, and restoration of three-dimensional shapes to propose a consistent system.
【0039】以下、図7の画像72−1〜72−niが
得られたものとして、ステップ74以下の処理をどのよ
うに行うかについて説明する。 [対応点の決定]まずカメラ30によって対象物体70
を撮影して得た複数枚の画像72−1〜72−niの間
で、対応点を決定する。この決定には従来の手法を利用
することができる。[0039] Hereinafter, as an image 72-1 to 72-n i in FIG. 7 is obtained will be described or carried out how the following process step 74. [Determination of Corresponding Points] First, the target object 70 is
Among a plurality of images 72-1 to 72-n i obtained by photographing a, determines the corresponding points. Conventional methods can be used for this determination.
【0040】たとえば、各画像において画素の輝度の変
化の激しい場所をエッジとして抽出し、さらにエッジの
連続したものを物体の輪郭として抽出する。抽出された
輪郭のうち、曲率の大きな点を対応点の候補とし、画像
間でのそれらの相関に基づいて対応点を決定する。 [基礎行列の計算]最初に、基礎行列の計算において使
用する数式について以下に記載する。説明中では随時こ
れら数式を参照する。For example, in each image, a location where the luminance of a pixel changes greatly is extracted as an edge, and a continuous edge is extracted as an outline of an object. Of the extracted contours, a point having a large curvature is set as a candidate for a corresponding point, and the corresponding point is determined based on their correlation between images. [Calculation of Fundamental Matrix] First, mathematical expressions used in the calculation of the fundamental matrix will be described below. In the description, these formulas will be referred to as needed.
【0041】[0041]
【数1】 (Equation 1)
【0042】未校正画像xj (i)を、画像iのj番目の特
徴点の、画像上での2次元射影空間の座標であるものと
する。さらにχSを、画像集合Sにわたる、対応点の組
とする。たとえば、χj {1,2}=(xj (1), xj (2))であり、
χj {1, 2}∈χ{1, 2}である。ただし、{1, 2}は、画像
番号の集合を表している。It is assumed that the uncalibrated image x j (i) is the coordinates of the j-th feature point of the image i in the two-dimensional projection space on the image. Further chi S, over the image set S, and the corresponding point pairs. For example, χ j {1,2} = (x j (1) , x j (2) )
χ j {1, 2} ∈χ {1, 2}. However, {1, 2} represents a set of image numbers.
【0043】Sを{1, 2, ..., ni}とする。もしnp個(n
p≧9)の対応点の集合χSが与えられたなら、Kanatani
の最適推定法[4]を用いて、2枚の画像間の関係を記述
する基礎行列を計算することができる。具体的には、χ
{1,k}、(k=2,...,ni)、|χ{1 ,k}|=npから、3×3、ran
k 2の基礎行列F1kを計算する。基礎行列F1kでは、す
べての対応点の組(x(1), x(k))について、式(1)が成
立する。Let S be {1, 2,..., N i }. If n p (n
Given a set of corresponding points p S for p ≥ 9), Kanatani
By using the optimal estimation method [4], a fundamental matrix describing the relationship between two images can be calculated. Specifically, χ
{1, k} , (k = 2, ..., n i ), | χ {1 , k} | = n p , 3 × 3, ran
Calculate the fundamental matrix F 1k of k 2. In the fundamental matrix F 1k , Expression (1) holds for all pairs of corresponding points (x (1) , x (k) ).
【0044】つまり、χ{1,k}の全ての要素について式
(1)が成立している。Kanataniの最適推定法では、対
応点の組χ{1,k}だけでなく、χj {1,k}∈χ{1, k}の、正
規化された共分散行列V0[xj (1)]やV0[xj (k)]を必要とす
る。これら行列はxに含まれるノイズの分布形状を表し
ている。実際のxの共分散行列V[x]と、V0[x]との関係
は式(2)の通りとなる。ただし、この式(2)におけ
るεはノイズレベルと呼ばれ、ノイズの大きさを表して
いる。ここでは、V0[x]=diag(1,1, 0)と仮定している。
(「diag」は、かっこ内の要素を主対角線上の要素とす
る対角行列を表す。)この仮定は、画像データの座標に
乗るノイズがガウスノイズである場合には十分に良い近
似である。That is, equation (1) holds for all elements of χ {1, k} . In Kanatani's optimal estimation method, the normalized covariance matrix V 0 [x j () of not only the pair of corresponding points χ {1, k} but also χ j {1, k} ∈χ {1, k} 1) ] and V 0 [x j (k) ]. These matrices represent the distribution shape of the noise contained in x. The relationship between the actual covariance matrix V [x] of x and V 0 [x] is as shown in Expression (2). Here, ε in the equation (2) is called a noise level, and represents the magnitude of noise. Here, it is assumed that V 0 [x] = diag (1,1,0).
("Diag" represents a diagonal matrix with the elements in parentheses on the main diagonal.) This assumption is a good approximation if the noise on the coordinates of the image data is Gaussian noise. .
【0045】Kanataniの最適推定法の利点は、基礎行列
F1kを計算できるだけでなく、画像データに乗るノイズ
レベルε1kを推定できる点である。ノイズレベルε1kを
利用することで、画像データのアウトライヤー(間違っ
た対応づけ)除去等を行うためのしきい値を、経験的な
値を用いることなく統計的に決定することが可能にな
る。The advantage of Kanatani's optimal estimation method is that the fundamental matrix
The point is that not only can F1k be calculated, but also the noise level ε1k on the image data can be estimated. By using the noise level ε 1k , it is possible to statistically determine a threshold value for removing outliers (wrong association) of image data without using empirical values. .
【0046】Kanataniの最適推定法の中核は、くり込み
法と呼ばれる数値計算法である。このくり込み法では、
まず線形解法により初期値を得る。その後、真の解に到
達するまで反復的に解を計算していく。この方法では、
必ずしも真の解に収束することが保証されているわけで
はなく、発散してしまう場合も少なくない。その原因
は、初期値を計算する線形解法に問題があるためと考え
られる。すなわち、初期値と真の解とが大きく異なって
いる場合に、反復計算の結果が収束しなくなるものと予
想される。The core of Kanatani's optimal estimation method is a numerical calculation method called a renormalization method. In this renormalization method,
First, an initial value is obtained by a linear solution. Then, iteratively calculate the solution until it reaches the true solution. in this way,
Convergence to a true solution is not always guaranteed, and divergence often occurs. The cause is considered to be a problem in the linear solution for calculating the initial value. That is, when the initial value and the true solution are significantly different, it is expected that the result of the iterative calculation will not converge.
【0047】ここで、Hartleyは、[3]において線形計算
法の精度を大きく向上させる方法を提案している(Hart
leyの画像正規化手法)。これは、予め画像データに非
等方的な変換を施してから、基礎行列を線形計算で計算
する手法である。この手法により、数値的な安定性や精
度が大きく向上する。本実施の形態では、Hartleyの画
像正規化手法をKanataniの最適推定法と組合わせること
で、より一層安定して基礎行列を計算することを可能と
した。図4にその処理の流れを示す。Here, Hartley proposes in [3] a method of greatly improving the accuracy of the linear calculation method (Hartley).
(ley's image normalization method). This is a method of performing anisotropic conversion on image data in advance, and then calculating a basic matrix by linear calculation. This technique greatly improves numerical stability and accuracy. In the present embodiment, the combination of Hartley's image normalization method and Kanatani's optimal estimation method makes it possible to calculate the fundamental matrix more stably. FIG. 4 shows the flow of the processing.
【0048】図4を参照して、まず全ての画像iで、xj
(i)、j=1,...,npに、Hartleyの非等方的変換を施す(9
0)。行列Tiを、画像iに施した非等方的変換行列であ
るとする。するとxj (i)が式(3)にしたがって変換さ
れる。この変換に対応して、Kanataniの最適推定法の、
正規化された共分散行列も式(4)に示されるように変
換しておく。こうして非等方的変換を施したデータに対
してKanataniの最適推定法を適用する(92)ことによ
って、F1k=T1F'1kTkとノイズレベルε1k=ε'1kとを得
る。 [射影的な復元]続いて、射影的な復元について説明す
る。ここで使用する数式についてまずまとめて掲げてお
く。以下の説明ではこの数式を随時参照する。Referring to FIG. 4, first, for all images i, x j
(i) Apply Hartley's anisotropic transformation to j = 1, ..., n p (9
0). It is assumed that the matrix T i is an anisotropic transformation matrix applied to the image i. Then, x j (i) is transformed according to equation (3). Corresponding to this conversion, Kanatani's optimal estimation method
The normalized covariance matrix is also transformed as shown in equation (4). By applying Kanatani's optimal estimation method to the data subjected to the anisotropic transformation in this way (92), F 1k = T 1 F ′ 1k T k and a noise level ε 1k = ε ′ 1k are obtained. [Projective Restoration] Next, projective restoration will be described. The formulas used here are summarized first. In the following description, this formula will be referred to as needed.
【0049】[0049]
【数2】 (Equation 2)
【0050】射影的な復元ではまず、χSという対応点
の組と、基礎行列F1k(k=2,..., ni)が与えられたとき
に、その中から5点の対応点の組YSを選択する。この5
点の組から、射影的な射影行列Pi, P2, P3, Pniを計算
する。射影的な射影行列Piは、画像iと、3次元射影座
標系との間の関係を記述するものである。YSは、どの
4点も同一平面上にないことなど、所定の条件を満足す
るように選択する。図5にni=3の場合の例を示し、図6
にこの処理の流れを示す。以下これら図面を参照して説
明する。対応点の組の選択およびそこからの基礎行列の
計算は図5および図6のステップ100に相当する。In the projective restoration, first, when a set of corresponding points of χ S and a basic matrix F 1k (k = 2,..., N i ) are given, five corresponding points are selected from them. to select a set of Y S. This 5
From the set of points, projective projective matrix P i, to calculate the P 2, P 3, Pn i . Projective projective matrix P i is used to describe an image i, the relationship between the three-dimensional projective coordinate system. Y S is selected so as to satisfy a predetermined condition such that no four points are on the same plane. FIG. 5 shows an example where n i = 3, and FIG.
Shows the flow of this processing. Hereinafter, description will be made with reference to these drawings. The selection of the set of corresponding points and the calculation of the fundamental matrix therefrom correspond to step 100 in FIGS.
【0051】ここで、射影的な射影行列Piを計算する方
法について述べる(ステップ102〜ステップ10
8)。もしノイズが存在しないならば、[9]に述べられ
ているとおり、F1kとy{1,k}から、P'1 (k), P'k, k=2,
..., niを計算することができ(ステップ102)、y
{1,2}とF12から計算したP'1 (2)と、y{1,k}とF1k、2≠k
から計算したP'1 (k)は一致する。つまり、P'1 (2)=P'1
(k)である。しかし、ノイズが存在する場合にはこれは
成立しない。Here, a method of calculating the projective projection matrix P i will be described (steps 102 to 10).
8). If no noise is present, as described in [9], from F 1k and y {1, k} , P ′ 1 (k) , P ′ k , k = 2,
..., n i can be calculated (step 102) and y
P ′ 1 (2) calculated from {1,2} and F 12 , y {1, k} and F 1k , 2 ≠ k
P ′ 1 (k) calculated from the values agree. That is, P ' 1 (2) = P' 1
(k) . However, this is not true when noise is present.
【0052】ノイズが存在する場合でも、整合性のとれ
た射影行列の組(P1, ..., Pni)を得るために、P'1 (2)
=P'1 (k)Hk2, k=2, ..., niのようにP'1 (k)をP'1 (2)に変
換するような、4×4のホモグラフィー行列Hk2を推定
する(ステップ104)。[3]にあるように、どのよう
な射影行列の対(P'1 (k), P'k)=も((I|0), P'kX1k)のよ
うに、正準形に変換でき、そのようなホモグラフィー行
列X1kは式(5)のように定義される。Even in the presence of noise, in order to obtain a consistent set of projection matrices (P 1 ,..., Pn i ), P ′ 1 (2)
= P ' 1 (k) H 4x4 homography matrix H that converts P' 1 (k) to P ' 1 (2) , such as k2 , k = 2, ..., n i k2 is estimated (step 104). As shown in [3], any pair of projection matrices (P ' 1 (k) , P' k ) = canonical form as ((I | 0), P ' k X 1k ) Can be transformed and such a homography matrix X 1k is defined as in equation (5).
【0053】よって、ホモグラフィー行列Hk2は、式
(6)にしたがって得られる。このホモグラフィー行列
Hk2を用いて、仮の射影行列の組(P"1, P"2, ..., P"ni)
=(P'1 ( 2), P'2H22, ..., P'niHni2)を作る(ステップ1
06)。この中間的な射影行列の組(P"1, P"2, ..., P"
ni)から、整合性のとれた射影行列(P1, ..., Pni)を得
るために、以下のようなエピポーラ修正(Epipolar Adj
ustment)を使用する(ステップ108)。Therefore, the homography matrix H k2 is obtained according to the equation (6). This homography matrix
Using H k2 , a set of temporary projection matrices (P " 1 , P" 2 , ..., P "n i )
= (P ' 1 ( 2) , P' 2 H 22 , ..., P'n i H ni2 )
06). This intermediate set of projection matrices (P " 1 , P" 2 , ..., P "
n i ) to obtain a consistent projection matrix (P 1 , ..., Pn i ), the following Epipolar Adj
ustment) (step 108).
【0054】中間的な射影行列の組(P"1, P"2, ..., P"
ni)と、対応点の組の集合χSとから、P"i, i=1, ..., n
iの各11個の要素を変化させながら、[6]に記載されて
いるパウエル法により式(7)に示す誤差関数を最小化
する。ただし式(7)中で使用されているdは式(8)
によって定義されるものである。基礎行列は、[9]に示
される方法を使って射影行列の組(P"i, P"k), 1≦i<k
≦niから計算する。A set of intermediate projection matrices (P " 1 , P" 2 ,..., P "
n i ) and the set of pairs of corresponding points χ S , P ” i , i = 1, ..., n
The error function shown in the equation (7) is minimized by the Powell method described in [6] while changing each of the eleven elements of i . Where d used in equation (7) is
Is defined by The fundamental matrix is a set of projection matrices (P " i , P" k ), 1≤i <k using the method shown in [9].
Calculated from ≦ n i.
【0055】xj (i)=(uj (1), vj (1), 1)、xj (k)=(uj (k),
vj (k), 1)と、射影行列P1とPkとから、Xjに対して射影
的な復元をするために、ここでも[9]の方法を用いる。p
1 [i]とpk [i]とをそれぞれ、行列P1とPkとのi行目のベ
クトルとする。すると、射影的な復元は、式(9)に示
す線形同次方程式を特異値分解して、その零空間を求め
ることと等価である。すなわち、ATAの最小固有値に
対する固有ベクトルが解となる。[9]は、この方法が他
の射影的復元方法と比較してより優れていることを述べ
ている。X j (i) = (u j (1) , v j (1) , 1), x j (k) = (u j (k) ,
v j (k) , 1), and the projection matrices P 1 and P k , the method of [9] is again used to projectively restore X j . p
Let 1 [i] and p k [i] be the i-th vectors of the matrices P 1 and P k , respectively. Then, the projective restoration is equivalent to singular value decomposition of the linear homogeneous equation shown in Expression (9) and finding its null space. That is, the eigenvector for the minimum eigenvalue of A T A is the solution. [9] states that this method is better than other projective reconstruction methods.
【0056】しかし本発明では、より頑健性を向上させ
るために、行列Aの1行目と2行目には重み1/ω
12を、3行目と4行目には重み1/ω34を乗じたものを
各ステップで用いて反復的に重み付き線形方程式を解く
ようにした。ここでω12およびω 34はそれぞれ式(1
0)(11)により定義される値である。However, in the present invention, the robustness is further improved.
Therefore, the first and second rows of the matrix A have weights 1 / ω
12And weights 1 / ω in the third and fourth rows34Multiplied by
Solve weighted linear equations iteratively at each step
I did it. Where ω12And ω 34Is the formula (1)
0) is a value defined by (11).
【0057】このように重み付線形方程式を反復的に解
くことにより、この最小化に幾何学的な意味付けをする
ことができる。すなわちこの操作は、抽出された画像上
の点と、その射影的な復元点Xjの画像への投影点との間
の画像上での距離を最小化していることになる。 [ユークリッド的な復元]以上のようにして求められた3
×4の射影行列の組(P1,...,Pni)が与えられたときに、
現実の3次元空間に対応する3×4のユークリッド的な
射影行列の組(P1,...,Pni)を計算しなくては
ならない(図7のステップ80)。以下にその方法につ
いて説明する。この説明中で参照する数式を以下に掲げ
る。By iteratively solving the weighted linear equation in this way, it is possible to give a geometrical meaning to this minimization. In other words, this operation minimizes the distance on the image between the extracted point on the image and the projected point of the projected restoration point Xj on the image. [Euclidean Restoration] 3 as determined above
Given a set of × 4 projection matrices (P 1 , ..., Pn i ),
A set of 3 × 4 Euclidean projection matrices (P 1 ,..., Pn i ) corresponding to a real three-dimensional space must be calculated (step 80 in FIG. 7). The method will be described below. The formulas referred to in this description are listed below.
【0058】[0058]
【数3】 (Equation 3)
【0059】[0059]
【数4】 (Equation 4)
【0060】[0060]
【数5】 (Equation 5)
【0061】このユークリッド的な射影行列Pk,k=1,
..., niは式(12)によって定義される。ただし3×
3行列Akはカメラの内部パラメータの行列であり、Tk
はカメラの外部パラメータの行列である。さらに詳しく
言えば行列Akは式(13)によって定義される。The Euclidean projection matrix P k , k = 1,
..., ni are defined by equation (12). However, 3x
The three matrix A k is a matrix of camera internal parameters, and T k
Is a matrix of camera external parameters. More specifically, the matrix A k is defined by equation (13).
【0062】また行列Tkは式(14)によって定義さ
れる。式(14)中に現れる3×3行列Rkは回転行列
であり、tkは並進ベクトルを表す。The matrix T k is defined by equation (14). The 3 × 3 matrix R k appearing in the equation (14) is a rotation matrix, and t k represents a translation vector.
【0063】各Pkについて次のような二つの拘束条件
が存在する。式(12)より、式(15)および(1
6)が得られる。この式(15)および(16)を、ア
スペクト比とスキューとを、行列Pkの左3×3小行列
の各行ベクトルと関連付けるために利用することができ
る。すなわち式(17)および(18)という式が満足
される必要がある。The following two constraints exist for each P k . From Expression (12), Expressions (15) and (1)
6) is obtained. Equations (15) and (16) can be used to associate the aspect ratio and skew with each row vector of the left 3 × 3 small matrix of matrix P k . That is, the expressions (17) and (18) need to be satisfied.
【0064】ユークリッド的な射影行列は、射影的な射
影行列の特別な場合に相当する。したがって、射影的な
射影行列から、ユークリッド的な射影行列を求めよとい
う問題は、射影的な座標系から、ユークリッド的な部分
空間の座標系への基底変換行列H(4×4、det(H)≠
0)を求めることと等価である。The Euclidean projection matrix corresponds to a special case of the projective projection matrix. Therefore, the problem of obtaining a Euclidean projection matrix from a projective projection matrix is a problem in that a basis transformation matrix H (4 × 4, det (H)) from a projective coordinate system to a coordinate system of a Euclidean subspace is used. ≠
0).
【0065】どのような射影的な射影行列Pkも、2次元
射影空間である画像から、同一の3次元射影空間の座標
系への射影を表している。したがって式(19)により
xj k=(uj (k), vj (k), 1)を求めることができる。ただし
ここで行列Pk=PkH、k=1,...,niはユークリッド的な射
影行列であり、H-1Xj、j=1,...,npは、復元すべきユー
クリッド的な3次元情報である。Any projective projection matrix P k represents the projection of an image, which is a two-dimensional projection space, onto the same three-dimensional projection space coordinate system. Therefore, according to equation (19)
x j k = (u j (k) , v j (k) , 1) can be obtained. However where the matrix P k = P k H, k = 1, ..., n i is the Euclidean projective matrix, H -1 X j, j = 1, ..., n p is restored to It should be Euclidean three-dimensional information.
【0066】以後の説明では、カメラは正方ピクセル
(すなわちアスペクト比=1)を持っているものとし、
スキューも存在しないものとする。式(13)で述べた
とおりsu (k), sv (k)はピクセルの大きさを表すから、こ
の場合にはsu (k),=sv (k)であり、γ(k)=0である。よっ
て、α(k)=αu (k)=αv (k)でもある。正方ピクセルでな
いカメラを用いるのであればsu (k),=sv (k)は成立しない
が、対応点の射影座標x(k)に3×3の変換行列diag(1,
sv (k),/su (k), 1)を乗ずることにより、以後の説明を適
用することができる。In the following description, it is assumed that the camera has a square pixel (ie, aspect ratio = 1),
It is assumed that there is no skew. As described in Expression (13), s u (k) and s v (k) represent the size of a pixel. In this case, s u (k) and = s v (k) , and γ (k ) = 0. Therefore, α (k) = αu (k) = αv (k) . If the use of the camera not square pixel s u (k), = s v (k) but does not hold, the transformation matrix diag (1 of the corresponding point projective coordinates x (k) 3 × 3,
By multiplying by s v (k) , / s u (k) , 1), the following description can be applied.
【0067】正方ピクセルでありかつスキューのないカ
メラのホモグラフィー行列Hを求めるために、Bougnoux
の手法[1]を用いる。[1]では、射影的な射影行列の正準
形の組(式(20)参照)から、パラメータ化された基
底変換行列Q(α,q)を推定している。Xを、式(5)
と同様に推定された、式(21)を満たす行列とする
と、式(22)としてHが求められる。To find the homography matrix H for a square pixel and skew-free camera, Bougnoux
Method [1] is used. In [1], a parameterized basis transformation matrix Q (α, q) is estimated from a set of canonical forms of projective projection matrices (see Equation (20)). X is represented by the formula (5)
Assuming that the matrix satisfies the equation (21) estimated in the same way as the above, H is obtained as the equation (22).
【0068】[1]では、初期化の過程で、すべてのkに対
してA1=Akを仮定し、第1番目の画像の画像中心(u0
(1), v0 (1))を(0, 0)に仮定して、Kruppa方程式を解く
ことでα(1)を得ている。また、ユークリッド的な射影
行列の初期値を(A1|0)に選ぶことで、Q(α, q)の
初期値(式(22))を、(A1|0)=(I|0)Q(α,
q)から計算することができる。全てのkについてA1=A
kであり、α=α(1)なので、Q(α, q)の初期値はqを除
いて一意に決定できる。[1]にあるように、q’=A1q
とおくとA1と式(20)に示した正準形の組とから線
形方程式を作り、q’を解くことができる。q’が得ら
れれば、q’=A1qをqについて解くことによりqが得
られる。In [1], during the initialization process, A 1 = A k is assumed for all k, and the image center (u 0) of the first image is assumed.
Α (1) is obtained by solving the Kruppa equation, assuming (1) , v 0 (1) ) as (0, 0). Also, by selecting the initial value of the Euclidean projection matrix to (A 1 | 0), the initial value of Q (α, q) (Equation (22)) can be changed to (A 1 | 0) = (I | 0). ) Q (α,
q). A 1 = A for all k
Since k and α = α (1) , the initial value of Q (α, q) can be uniquely determined except for q. As in [1], q '= A 1 q
In other words, a linear equation is created from A 1 and the set of canonical forms shown in equation (20), and q ′ can be solved. If q ′ is obtained, q is obtained by solving q ′ = A 1 q with respect to q.
【0069】ここで、q’とその共分散行列COV[q’]
を重み付きの最小二乗法で解いたときに最も良い結果が
得られた。この解法は、q’の不定性に応じた重みを用
い、反復法と特異値分解とを用いて計算するものであ
る。ほぼ2回から3回の反復で解が得られる。この解は
他の一般的な解法によるものより、残差は大きいものの
不定性ははるかに小さい。Here, q ′ and its covariance matrix COV [q ′]
The best results were obtained when was solved by the weighted least squares method. This solution uses a weight according to the indefiniteness of q ′, and is calculated using an iterative method and singular value decomposition. A solution is obtained in approximately two to three iterations. This solution has larger residuals but much less uncertainty than other general solutions.
【0070】[1]では、式(23)および(24)とい
う拘束条件を課すために、αとqとを変化させながら非
線形最小化している。しかし、ユークリッド的な場合に
は式(17)および(18)では拘束が十分ではない。
なぜなら、式(23)および(24)の右辺を満たす自
明な解(式(25))が存在するからである。In [1], in order to impose the constraint conditions of equations (23) and (24), nonlinear minimization is performed while changing α and q. However, in the Euclidean case, the constraints in equations (17) and (18) are not sufficient.
This is because there is a trivial solution (Equation (25)) that satisfies the right sides of Equations (23) and (24).
【0071】したがって、式(23)は式(26)で置
き換えなければならない。また式(24)が成立するの
は式(27)が成立するときだけである。Therefore, equation (23) must be replaced with equation (26). Expression (24) holds only when Expression (27) holds.
【0072】本実施の形態では、正しく最小化するため
に、式(28)に示す誤差関数を最小化する。この最小
化には、パウエル法[6]を用いる。この線形方程式か
ら、必要となる画像の枚数は最小3枚であることが分か
る ([1])。 [実験結果およびその評価] −基礎行列計算 本実施の形態で採用しているKanataniの最適推定法とHa
rtleyの画像正規化手法との組合せ手法の優位性を確認
するために、Kanataniの最適推定法を始め、[9]に記載
されている他の4つの方法と本願発明の採用した方法と
を比較した。比較した手法は以下のとおりである。 (1) 線形手法。基礎行列の要素を9次元ベクトルf
で表し、fの計算を固有値問題に帰着させて解いたも
の。‖f‖=1と正規化している。 (2) Hartleyの非等方的変換を施し、線形解法で解
いたもの (3) 各点と、その対応点のエピポーラ線との距離を
最小化する非線形解法 (4) 非線形解法3と類似しているが、誤差関数の傾
きで重み付けしたもの (5) Kanataniの最適推定法 (6) Kanataniの最適推定法を改良したもの(本願発
明) 実験には、コンピュータで生成した100個の対応点デ
ータに標準偏差1ピクセルのノイズをのせたものに対し
て、各方法を用いて各画像のエピポール位置を求め、そ
の結果を正確な位置とそれぞれ比較した。結果を表2に
示す。ここで、表2の最上段には真のエピポールの位置
を示している。方法(1)〜方法(4)まではZhang[9]
で比較されている方法である。表2より、方法(2)
(3)(6)の精度が他とくらべて抜きん出ていること
が分かる。また、表2に示すとおり、正確なエピポール
の位置(表2の最上段)に最も近いのは、本発明にかか
る方法(6)を適用したものである。In the present embodiment, the error function shown in equation (28) is minimized in order to correctly minimize it. The Powell method [6] is used for this minimization. From this linear equation, it can be seen that the required number of images is a minimum of three ([1]). [Experimental results and evaluation]-Fundamental matrix calculation Kanatani's optimal estimation method and Ha
In order to confirm the superiority of the combination method with rtley's image normalization method, we compared the four other methods described in [9] with the method adopted by the present invention, including Kanatani's optimal estimation method did. The method compared is as follows. (1) Linear method. The elements of the fundamental matrix are represented by a 9-dimensional vector f
And solved by reducing the calculation of f to an eigenvalue problem. {F} = 1 is normalized. (2) Hartley's anisotropic transformation and linear solution (3) Non-linear solution to minimize the distance between each point and the corresponding epipolar line (4) Similar to nonlinear solution 3 (5) Kanatani's optimal estimation method (6) An improved Kanatani's optimal estimation method (the present invention) In the experiment, 100 corresponding point data generated by computer were used. Then, the epipole position of each image was obtained by using each method, and the result was compared with the accurate position. Table 2 shows the results. Here, the position of the true epipole is shown at the top of Table 2. Zhang [9] for method (1) to method (4)
This is the method that has been compared. From Table 2, method (2)
(3) It can be seen that the accuracy of (6) is outstanding compared to the others. In addition, as shown in Table 2, the position closest to the accurate epipole position (the top row in Table 2) is the result of applying the method (6) according to the present invention.
【0073】[0073]
【表2】 [Table 2]
【0074】また表3には、それぞれの手法のエピポー
ルの座標の平均二乗誤差(RMS)を示した。ここで
「方法0」の欄に記入された値は、正確な値を表してい
る。Table 3 shows the mean square error (RMS) of the epipole coordinates of each method. Here, the value entered in the column of "method 0" represents an accurate value.
【0075】[0075]
【表3】 [Table 3]
【0076】表3に示してあるとおり、ノイズレベルが
得られるのは手法(5)および(6)のみである。しか
も手法(6)の方がより正確なノイズレベルを表してい
ることも表3から容易に見てとれる。 −ユークリッド的な3次元復元 いくつかある実験結果のうち、模様のある剛体物体のユ
ークリッド的な3次元構造を復元する実験結果を示す。
図7はni=6枚の画像を示し、図8はnp=50個の対応点の
組を示している。これらの対応点を用いて、基礎行列を
求めたり、ユークリッド的な復元したり、という一連の
処理を行った。ni=6≧3であり、np=40≧9であるので、
データ数は十分である。さらに図7に示されるように、
これら6枚の画像を見ると、それぞれの画像内における
対象物体の位置、姿勢は十分に異なっており、ユークリ
ッド的な復元に適していることが分かる。As shown in Table 3, only the methods (5) and (6) can obtain the noise level. Moreover, it can be easily seen from Table 3 that the method (6) represents a more accurate noise level. -Euclidean three-dimensional reconstruction Among several experimental results, the experimental results of restoring the Euclidean three-dimensional structure of a patterned rigid object are shown.
FIG. 7 shows n i = 6 images, and FIG. 8 shows a set of n p = 50 corresponding points. Using these corresponding points, a series of processes such as obtaining a fundamental matrix and performing Euclidean restoration was performed. Since n i = 6 ≧ 3 and n p = 40 ≧ 9,
The number of data is enough. As further shown in FIG.
Looking at these six images, it can be seen that the position and orientation of the target object in each image are sufficiently different and are suitable for Euclidean restoration.
【0077】なおこの処理の前提として、対応点につい
てはその位置の不定性があるのみで、対応関係について
は間違いがないものとする。5組の画像χ{1,k}、k=
2,...,6を用いて、まず本発明にかかる基礎行列計算法
を用いて基礎行列を計算すると、ノイズレベルε1k∈
[0.51, 0.68]となり全てのkにおいてエピポーラ幾何を
サブピクセルの精度で推定できた。As a premise of this processing, it is assumed that there is only an uncertainty in the position of the corresponding point and there is no mistake in the corresponding relation. 5 sets of images χ {1, k} , k =
First, when the fundamental matrix is calculated using the fundamental matrix calculation method according to the present invention by using 2, ..., 6, the noise level ε 1k ∈
[0.51, 0.68], and the epipolar geometry could be estimated with subpixel accuracy for all k.
【0078】さらに、3次元射影空間の基底は、対応点
の組YS(S={1, ..., 6})の中で5組の対応点χS、j
∈{10, 22, 38, 8, 35}を含むように決定した。図7か
ら明らかなように、これら5点のうちどの4点も平面上
またはほぼ平面上にないことが分かる。よって、理論的
に、これらの点がよい射影座標の基底となり得ることが
分かる。Further, the basis of the three-dimensional projection space is a set of five corresponding points χ S , j in the corresponding point set Y S (S = {1,..., 6}).
∈ {10, 22, 38, 8, 35}. As is clear from FIG. 7, it can be seen that none of these five points is on a plane or almost on a plane. Therefore, it can be understood that these points can theoretically be the basis of good projection coordinates.
【0079】さて、P"k上の上2×4小行列に注目する
と、このni・(2・4)個の要素の変化は、初期値に対して
最大1.51%であった。P"kの下1×4小行列では、このn
i・(1・4)個の要素の変化は初期値に対して最大0.06%
であった。Now, paying attention to the upper 2 × 4 small matrix on P ″ k , the change of the n i · (2 · 4) elements is 1.51% at maximum with respect to the initial value. In the lower 1 × 4 matrix of k , this n
i・ (1 ・ 4) elements change 0.06% max.
Met.
【0080】この結果から、40枚の画像の対応点の組
をサブピクセルの精度で説明できるような、射影的な射
影行列を求めることができたことになる。さらに、下1
×4小行列は無限遠平面を表しており、この平面はカメ
ラの内部パラメータに対応している。すなわち、非線形
なエピポーラ修正方法により、この無限遠平面の傾きを
0.02°以下の精度で推定できたことになる。From this result, it is possible to obtain a projective projection matrix that can explain a set of corresponding points of 40 images with sub-pixel accuracy. In addition,
The × 4 small matrix represents the plane at infinity, and this plane corresponds to the intrinsic parameters of the camera. That is, the inclination of this plane at infinity is calculated by the nonlinear epipolar correction method.
This means that the estimation was performed with an accuracy of 0.02 ° or less.
【0081】ここで、図7に示す6枚の画像に対してBo
ugnouxの手法によるユークリッド的な復元方法を適用し
た。ここではα(k)=f(k)/su (k)=7.5/0.0099[pixel/mm]
を定数として与えた。さらに、1枚目の画像の画像中心
を(u0 (1), v0 (1))=(320, 240)に置いた。こうして非線
形最小化を施した後に、次の表4に示すようなカメラの
内部パラメータが求められた。表4において、各行は画
像番号を表す。Here, Bo is applied to the six images shown in FIG.
The Euclidean restoration method by ugnoux method was applied. Here, α (k) = f (k) / s u (k) = 7.5 / 0.0099 [pixel / mm]
Was given as a constant. Further, the image center of the first image was set at (u 0 (1) , v 0 (1) ) = (320, 240). After performing the nonlinear minimization in this way, camera internal parameters as shown in the following Table 4 were obtained. In Table 4, each row represents an image number.
【0082】[0082]
【表4】 [Table 4]
【0083】理想的には、α(k)は1.0に、γ(k)、s(k)
はそれぞれ0になる筈である。また同一のカメラで各画
像を撮影しているので、焦点距離f(k)は一定になる筈で
ある。実際にはもちろん画像にはノイズが必ず乗ってい
るので、正確な値は得られない。しかし表4に示すよう
に、本発明によれば焦点距離として理想値である757.6
にほぼ等しい値が得られている。Ideally, α (k) is set to 1.0, and γ (k) and s (k)
Should be 0 in each case. Further, since each image is photographed by the same camera, the focal length f (k) should be constant. Actually, of course, noise is always present in the image, so an accurate value cannot be obtained. However, as shown in Table 4, according to the present invention, the focal length is an ideal value of 757.6.
Is obtained.
【0084】こうして行われたユークリッド的な復元の
結果を図9に示す。対象物体は図7に示すように箱型の
物体である。図9に示すように、復元された3次元形状
の3つの面はそれぞれ平面でありかつ互いに直交しあっ
ており、図7に示す対象物体の形状が正確に復元されて
いることが分かる。FIG. 9 shows the result of the Euclidean restoration performed in this manner. The target object is a box-shaped object as shown in FIG. As shown in FIG. 9, the three surfaces of the restored three-dimensional shape are planes and are orthogonal to each other, and it can be seen that the shape of the target object shown in FIG. 7 has been accurately restored.
【0085】以上のように本発明によれば、画像の対応
点の組を使って、特別な知識なしにユークリッド的な3
次元形状を復元することができる。特に、基礎行列計算
では、Kanataniの最適推定法に、Hartleyの画像正規化
手法に見られる非等方的な変換を施すことで、より頑健
で安定な解を得ることに成功した。また、精度の面から
いっても、他の、最も精度が良いとされている手法と比
較して遜色のないものが得られた。As described above, according to the present invention, using a set of corresponding points of an image, a Euclidean 3
The dimensional shape can be restored. In particular, in the fundamental matrix calculation, we succeeded in obtaining a more robust and stable solution by applying the anisotropic transformation found in Hartley's image normalization method to Kanatani's optimal estimation method. Further, even in terms of precision, a technique comparable to the other techniques considered to have the highest accuracy was obtained.
【0086】さらに、ユークリッド的な3次元形状の復
元に関しては、Bougnouxの手法を改良し、反復的な最小
二乗法を用いることでより不定性の少ない解を計算でき
るようになった。さらに、Bougnouxの手法の非線形最適
化の段階での自明な解への収束を防ぐことが可能になっ
た。Further, as for the Euclidean three-dimensional shape reconstruction, Bougnoux's method was improved, and a solution with less indefiniteness could be calculated by using an iterative least squares method. Furthermore, it became possible to prevent Bougnoux's method from converging to a trivial solution at the stage of nonlinear optimization.
【0087】今回開示された実施の形態はすべての点で
例示であって制限的なものではないと考えられるべきで
ある。本発明の範囲は上記した説明ではなくて特許請求
の葉にによって示され、特許請求の範囲と均等の意味お
よび範囲内でのすべての変更が含まれることが意図され
る。The embodiments disclosed this time are to be considered in all respects as illustrative and not restrictive. The scope of the present invention is defined by the terms of the claims, rather than the description above, and is intended to include any modifications within the scope and meaning equivalent to the terms of the claims.
【図1】本発明の1実施の形態にかかるシステムの外観
図である。FIG. 1 is an external view of a system according to an embodiment of the present invention.
【図2】本発明の1実施の形態にかかるシステムのハー
ドウェア的構成を示すブロック図である。FIG. 2 is a block diagram illustrating a hardware configuration of a system according to an embodiment of the present invention.
【図3】本発明の1実施の形態にかかるシステムでのデ
ータフローおよび処理の流れを示すフローチャートであ
る。FIG. 3 is a flowchart showing a data flow and a processing flow in the system according to the embodiment of the present invention;
【図4】基礎行列の計算処理のフローチャートである。FIG. 4 is a flowchart of a basic matrix calculation process.
【図5】画像データから射影的な3次元復元を行う処理
を模式的に示す図である。FIG. 5 is a diagram schematically illustrating a process of performing projective three-dimensional restoration from image data.
【図6】射影的な3次元復元を行う処理のフローチャー
トである。FIG. 6 is a flowchart of a process of performing projective three-dimensional restoration.
【図7】実験に用いた6枚の画像を示す図である。FIG. 7 is a diagram showing six images used in the experiment.
【図8】実験で得られた対応点の組を示す図である。FIG. 8 is a diagram showing a set of corresponding points obtained in an experiment.
【図9】実験におけるユークリッド的な復元の結果を示
す模式図である。FIG. 9 is a schematic diagram showing a result of Euclidean restoration in an experiment.
20 3次元情報復元装置 30 カメラ 70 対象物体 72−1〜72−ni 画像20 three-dimensional information reconstructing apparatus 30 camera 70 object 72-1 to 72-n i image
─────────────────────────────────────────────────────
────────────────────────────────────────────────── ───
【手続補正書】[Procedure amendment]
【提出日】平成12年8月18日(2000.8.1
8)[Submission date] August 18, 2000 (2000.8.1)
8)
【手続補正1】[Procedure amendment 1]
【補正対象書類名】明細書[Document name to be amended] Statement
【補正対象項目名】0007[Correction target item name] 0007
【補正方法】変更[Correction method] Change
【補正内容】[Correction contents]
【0007】「射影的な復元(Projective Reconstruct
ion)」とは、異なる位置または異なる姿勢で撮影した
複数枚の画像から、ある種の不定性を含んで3次元情報
を復元することをいう。[0007] "Projective Reconstruction
"ion)" refers to restoring three- dimensional information from a plurality of images taken at different positions or at different orientations, including certain indeterminacy.
【手続補正2】[Procedure amendment 2]
【補正対象書類名】明細書[Document name to be amended] Statement
【補正対象項目名】0010[Correction target item name] 0010
【補正方法】変更[Correction method] Change
【補正内容】[Correction contents]
【0010】[従来技術の要旨]対象物体をカメラで撮
影し、対象物体の3次元情報を画像だけから推定する問
題は、コンピュータビジョン、画像認識の分野の中心的
な問題である。特に、カメラの位置、姿勢、レンズの焦
点距離などの知識が事前に得られないカメラ(未校正カ
メラと呼ばれる)で撮影された画像を用いて対象物体の
3次元情報を復元する手法が注目されている。[0010] photographing the target object [SUMMARY OF PRIOR ART In the camera, the problem of estimating the three-dimensional information of the target object only from the image, computer vision, a central problem in the field of image recognition. In particular, attention has been paid to a method of restoring three-dimensional information of a target object using an image captured by a camera (called an uncalibrated camera) for which knowledge of the camera position, posture, lens focal length, and the like cannot be obtained in advance. ing.
フロントページの続き (72)発明者 木下 敬介 京都府相楽郡精華町大字乾谷小字三平谷5 番地 株式会社エイ・ティ・アール人間情 報通信研究所内 Fターム(参考) 2F065 AA04 AA12 AA53 BB05 DD03 DD04 FF04 FF42 JJ03 JJ09 JJ26 QQ00 QQ17 QQ18 QQ21 QQ24 QQ32 QQ34 QQ42 SS13 UU05 5B057 BA02 CA12 CA16 CC01 DA20 DB02 DC16 DC32 5L096 CA04 EA18 FA06 FA12 HA01Continued on the front page (72) Inventor Keisuke Kinoshita 5 Shiraya, Inaya, Seika-cho, Soraku-gun, Kyoto Prefecture F-term in ATI Human Information and Communication Research Laboratories (reference) 2F065 AA04 AA12 AA53 BB05 DD03 DD04 FF04 FF42 JJ03 JJ09 JJ26 QQ00 QQ17 QQ18 QQ21 QQ24 QQ32 QQ34 QQ42 SS13 UU05 5B057 BA02 CA12 CA16 CC01 DA20 DB02 DC16 DC32 5L096 CA04 EA18 FA06 FA12 HA01
Claims (4)
を記述する基礎行列を求めるための方法であって、 未校正カメラによって撮影された、対象物体を異なる角
度から撮影した3枚以上の画像データを準備するステッ
プと、 前記画像データに対して所定の非等方変換を行うステッ
プと、 前記所定の非等方変換によって変換された画像データに
対して、Kanataniの最適推定法を適用して各画像間の基
礎行列を計算するステップとを含む、基礎行列を求める
ための方法。1. A method for obtaining a basic matrix describing a relationship between images from a set of corresponding points between images, comprising three images of a target object taken from different angles, taken by an uncalibrated camera. Preparing the above image data, performing a predetermined anisotropic transformation on the image data, and applying Kanatani's optimal estimation method to the image data converted by the predetermined anisotropic transformation. Applying to calculate a fundamental matrix between each image.
い未校正カメラによって撮影された、対象物体を異なる
角度から撮影した3枚以上の画像データから、画像の対
の間の射影的な射影行列の組を求めるステップと、 前記各射影的な射影行列に対応する2次元射影座標系か
らユークリッド的な空間の座標系への基底変換行列を求
めるステップと前記基底変換行列を用いて前記画像デー
タからユークリッド的な3次元情報の復元を行うステッ
プとを含み、 前記基底変換行列を求めるステップは、 前記射影的な射影行列の正準形の左3×3小行列からQ
R分解を用いて前記未校正カメラの内部パラメータの初
期値を推定し、基底変換行列の初期値を準備するステッ
プと、 前記推定された初期値から所定の誤差評価関数を用いて
反復計算することにより基底変換行列を求めるステップ
とを含む、ユークリッド的な3次元情報の復元方法。2. A projective projection matrix between a pair of images from three or more image data obtained by photographing an object from different angles and photographed by an uncalibrated camera having square pixels and having no skew. And a step of obtaining a basis transformation matrix from a two-dimensional projection coordinate system corresponding to each of the projective projection matrices to a coordinate system of a Euclidean space, and from the image data using the basis transformation matrix Restoring Euclidean three-dimensional information, wherein the step of obtaining the basis transformation matrix is performed by using the left 3 × 3 small matrix of the canonical form of the projective projection matrix as Q
Estimating an initial value of an internal parameter of the uncalibrated camera using an R-decomposition and preparing an initial value of a basis transformation matrix; and iteratively calculating from the estimated initial value using a predetermined error evaluation function. Obtaining a basis transformation matrix according to Eq. (3).
ステップは、 画像間の対応点の組から、画像間の関係を記述する基礎
行列を求めるステップと、 前記基礎行列に基づいて所定の整合条件を満足する射影
的な射影行列の組を求めるステップとを含み、 前記基礎行列を求めるステップは、 未校正カメラによって撮影された、対象物体を異なる角
度から撮影した3枚以上の画像データを準備するステッ
プと、 前記画像データに対して所定の非等方変換を行うステッ
プと、 前記所定の非等方変換によって変換された画像データに
対して、Kanataniの最適推定法を適用して各画像間の基
礎行列を計算するステップとを含む、請求項2に記載の
ユークリッド的な3次元情報の復元方法。3. The step of obtaining a set of projective projection matrices includes: obtaining a basic matrix describing a relationship between images from a set of corresponding points between images; Obtaining a set of projective projection matrices satisfying the matching condition, wherein the step of obtaining the basic matrix comprises: obtaining three or more pieces of image data of the target object taken from different angles, taken by an uncalibrated camera. Preparing, and performing a predetermined anisotropic transformation on the image data, and applying the Kanatani optimal estimation method to the image data converted by the predetermined anisotropic transformation to each image. Calculating a basic matrix between the three-dimensional information.
い未校正カメラによって撮影された、対象物体を異なる
角度から撮影した3枚以上の画像データから、画像の対
の間の射影的な射影行列の組を求めるための手段と、 前記各射影的な射影行列に対応する2次元射影座標系か
らユークリッド的な空間の座標系への基底変換行列を求
めるための手段と前記基底変換行列を用いて前記画像デ
ータからユークリッド的な3次元情報の復元を行うため
の手段とを含み、 前記基底変換行列を求めるための手段は、 前記射影的な射影行列の正準形の左3×3小行列からQ
R分解を用いて前記未校正カメラの内部パラメータの初
期値を推定し、基底変換行列の初期値を準備するための
手段と、 前記推定された初期値から所定の誤差評価関数を用いて
反復計算することにより基底変換行列を求めるための手
段とを含み、 前記射影的な射影行列の組を求めるための前記手段は、 画像間の対応点の組から、画像間の関係を記述する基礎
行列を求めるための手段と、 前記基礎行列に基づいて所定の整合条件を満足する射影
的な射影行列の組を求めるための手段とを含み、 前記基礎行列を求めるための手段は、 未校正カメラによって撮影された、対象物体を異なる角
度から撮影した3枚以上の画像データを準備するための
手段と、 前記画像データに対して所定の非等方変換を行うための
手段と、 前記所定の非等方変換によって変換された画像データに
対して、Kanataniの最適推定法を適用して各画像間の基
礎行列を計算するための手段とを含む、3次元情報の復
元装置。4. A projective projection matrix between a pair of images from three or more image data obtained by photographing an object from different angles and photographed by an uncalibrated camera having square pixels and having no skew. Means for determining a set of..., A means for determining a basis transformation matrix from a two-dimensional projective coordinate system corresponding to each projective projection matrix to a coordinate system of a Euclidean space, and using the basis transformation matrix. Means for restoring Euclidean three-dimensional information from the image data, wherein the means for obtaining the basis transformation matrix is based on a left 3 × 3 small matrix of a canonical form of the projective projection matrix. Q
Means for estimating the initial values of the internal parameters of the uncalibrated camera using the R-decomposition and preparing an initial value of the basis transformation matrix; and iterative calculation using a predetermined error evaluation function from the estimated initial values. Means for determining a basis transformation matrix by calculating the basis matrix describing a relationship between images from a set of corresponding points between the images. Means for obtaining a set of projective projection matrices satisfying a predetermined matching condition based on the basic matrix, wherein the means for obtaining the basic matrix is captured by an uncalibrated camera. Means for preparing three or more image data obtained by photographing the target object from different angles, means for performing a predetermined anisotropic conversion on the image data, and the predetermined anisotropic conversion Thus for the converted image data, and means for computing the fundamental matrix between the images by applying the optimum estimation of Kanatani, restoration apparatus of three-dimensional information.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP16347899A JP3476710B2 (en) | 1999-06-10 | 1999-06-10 | Euclidean 3D information restoration method and 3D information restoration apparatus |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP16347899A JP3476710B2 (en) | 1999-06-10 | 1999-06-10 | Euclidean 3D information restoration method and 3D information restoration apparatus |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2000353244A true JP2000353244A (en) | 2000-12-19 |
| JP3476710B2 JP3476710B2 (en) | 2003-12-10 |
Family
ID=15774650
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP16347899A Expired - Fee Related JP3476710B2 (en) | 1999-06-10 | 1999-06-10 | Euclidean 3D information restoration method and 3D information restoration apparatus |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3476710B2 (en) |
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100422370B1 (en) * | 2000-12-27 | 2004-03-18 | 한국전자통신연구원 | An Apparatus and Method to Measuring Dimensions of 3D Object on a Moving Conveyor |
| JP2008186456A (en) * | 2007-01-26 | 2008-08-14 | Conversion Works Inc | Methodology for 3d scene reconstruction from 2d image sequences |
| JP2013539147A (en) * | 2010-10-07 | 2013-10-17 | サンジェビティ | Rapid 3D modeling |
| US8791941B2 (en) | 2007-03-12 | 2014-07-29 | Intellectual Discovery Co., Ltd. | Systems and methods for 2-D to 3-D image conversion using mask to model, or model to mask, conversion |
| US8860712B2 (en) | 2004-09-23 | 2014-10-14 | Intellectual Discovery Co., Ltd. | System and method for processing video images |
| CN111783770A (en) * | 2020-01-16 | 2020-10-16 | 北京沃东天骏信息技术有限公司 | Image correction method, device and computer readable storage medium |
| CN114820811A (en) * | 2022-04-18 | 2022-07-29 | 东北大学 | Fundamental matrix solving and calibrating method of synchronous camera based on moving sphere |
| CN115147619A (en) * | 2022-06-14 | 2022-10-04 | 西北工业大学 | An Incremental Motion Restoration Structure Method for Optimizing Image Addition Order |
| CN115222961A (en) * | 2022-09-19 | 2022-10-21 | 成都信息工程大学 | An Evaluation Method for Uncertainty of Image Fundamental Matrix |
| CN118945157A (en) * | 2024-10-14 | 2024-11-12 | 苏州元脑智能科技有限公司 | A transmission method, device and storage medium based on input and output system files |
| CN119573553A (en) * | 2024-11-30 | 2025-03-07 | 北京工业大学 | An experimental device and method for visual measurement of various types of software driver postures |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| IL247245B (en) * | 2016-08-11 | 2019-01-31 | Technion Res & Dev Foundation | Systems and methods for printing 3D models |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0991436A (en) * | 1995-09-21 | 1997-04-04 | Toyota Central Res & Dev Lab Inc | Image processing method and apparatus |
| JPH10143666A (en) * | 1996-11-15 | 1998-05-29 | Meidensha Corp | Method for camera calibration |
| JPH10240939A (en) * | 1997-02-28 | 1998-09-11 | Meidensha Corp | Camera calibration method |
| JPH1137721A (en) * | 1997-07-22 | 1999-02-12 | Atr Ningen Joho Tsushin Kenkyusho:Kk | A linear estimation method of three-dimensional position by affine camera correction |
-
1999
- 1999-06-10 JP JP16347899A patent/JP3476710B2/en not_active Expired - Fee Related
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0991436A (en) * | 1995-09-21 | 1997-04-04 | Toyota Central Res & Dev Lab Inc | Image processing method and apparatus |
| JPH10143666A (en) * | 1996-11-15 | 1998-05-29 | Meidensha Corp | Method for camera calibration |
| JPH10240939A (en) * | 1997-02-28 | 1998-09-11 | Meidensha Corp | Camera calibration method |
| JPH1137721A (en) * | 1997-07-22 | 1999-02-12 | Atr Ningen Joho Tsushin Kenkyusho:Kk | A linear estimation method of three-dimensional position by affine camera correction |
Cited By (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100422370B1 (en) * | 2000-12-27 | 2004-03-18 | 한국전자통신연구원 | An Apparatus and Method to Measuring Dimensions of 3D Object on a Moving Conveyor |
| US8860712B2 (en) | 2004-09-23 | 2014-10-14 | Intellectual Discovery Co., Ltd. | System and method for processing video images |
| JP2008186456A (en) * | 2007-01-26 | 2008-08-14 | Conversion Works Inc | Methodology for 3d scene reconstruction from 2d image sequences |
| US9082224B2 (en) | 2007-03-12 | 2015-07-14 | Intellectual Discovery Co., Ltd. | Systems and methods 2-D to 3-D conversion using depth access segiments to define an object |
| US8791941B2 (en) | 2007-03-12 | 2014-07-29 | Intellectual Discovery Co., Ltd. | Systems and methods for 2-D to 3-D image conversion using mask to model, or model to mask, conversion |
| US8878835B2 (en) | 2007-03-12 | 2014-11-04 | Intellectual Discovery Co., Ltd. | System and method for using feature tracking techniques for the generation of masks in the conversion of two-dimensional images to three-dimensional images |
| JP2013539147A (en) * | 2010-10-07 | 2013-10-17 | サンジェビティ | Rapid 3D modeling |
| CN111783770A (en) * | 2020-01-16 | 2020-10-16 | 北京沃东天骏信息技术有限公司 | Image correction method, device and computer readable storage medium |
| CN111783770B (en) * | 2020-01-16 | 2024-05-24 | 北京沃东天骏信息技术有限公司 | Image correction method, device and computer readable storage medium |
| CN114820811A (en) * | 2022-04-18 | 2022-07-29 | 东北大学 | Fundamental matrix solving and calibrating method of synchronous camera based on moving sphere |
| CN115147619A (en) * | 2022-06-14 | 2022-10-04 | 西北工业大学 | An Incremental Motion Restoration Structure Method for Optimizing Image Addition Order |
| CN115222961A (en) * | 2022-09-19 | 2022-10-21 | 成都信息工程大学 | An Evaluation Method for Uncertainty of Image Fundamental Matrix |
| CN115222961B (en) * | 2022-09-19 | 2022-11-25 | 成都信息工程大学 | An Evaluation Method for Uncertainty of Fundamental Matrix of Imagery |
| CN118945157A (en) * | 2024-10-14 | 2024-11-12 | 苏州元脑智能科技有限公司 | A transmission method, device and storage medium based on input and output system files |
| CN119573553A (en) * | 2024-11-30 | 2025-03-07 | 北京工业大学 | An experimental device and method for visual measurement of various types of software driver postures |
Also Published As
| Publication number | Publication date |
|---|---|
| JP3476710B2 (en) | 2003-12-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN112767538B (en) | Three-dimensional reconstruction and related interaction and measurement methods, related devices and equipment | |
| CN112084849B (en) | Image recognition method and device | |
| US9053388B2 (en) | Image processing apparatus and method, and computer-readable storage medium | |
| CN111179427A (en) | Autonomous mobile device, control method thereof, and computer-readable storage medium | |
| WO2005111936A1 (en) | Parameter estimation method, parameter estimation device, and correlation method | |
| CN116030136B (en) | Cross-angle visual positioning method, device and computer equipment based on geometric features | |
| CN110741413A (en) | rigid body configuration method and optical motion capture method | |
| CN113902855B (en) | Three-dimensional face reconstruction method based on camera equipment and related equipment | |
| CN107016319A (en) | A kind of key point localization method and device | |
| CN113902851A (en) | Face three-dimensional reconstruction method and device, electronic equipment and storage medium | |
| CN113902852A (en) | Face three-dimensional reconstruction method and device, electronic equipment and storage medium | |
| JP6086491B2 (en) | Image processing apparatus and database construction apparatus thereof | |
| JP3476710B2 (en) | Euclidean 3D information restoration method and 3D information restoration apparatus | |
| CN111311681A (en) | Visual positioning method, device, robot and computer-readable storage medium | |
| JP2008511932A (en) | System and method for registration and modeling of deformable shapes by direct factorization | |
| CN109785373A (en) | A kind of six-freedom degree pose estimating system and method based on speckle | |
| CN113361400B (en) | Head posture estimation method, device and storage medium | |
| WO2019058487A1 (en) | Three-dimensional reconstructed image processing device, three-dimensional reconstructed image processing method, and computer-readable storage medium having three-dimensional reconstructed image processing program stored thereon | |
| CN113902853A (en) | Face three-dimensional reconstruction method and device, electronic equipment and storage medium | |
| CN113256693A (en) | Multi-view registration method based on K-means and normal distribution transformation | |
| CN116630423A (en) | A multi-target binocular positioning method and system for micro-robots based on ORB features | |
| Zhu et al. | Nonrigid shape recovery by gaussian process regression | |
| KR101673144B1 (en) | Stereoscopic image registration method based on a partial linear method | |
| Paffenholz et al. | Geo-referencing point clouds with transformational and positional uncertainties. | |
| CN108694348B (en) | Tracking registration method and device based on natural features |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030902 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100926 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100926 Year of fee payment: 7 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110926 Year of fee payment: 8 |
|
| LAPS | Cancellation because of no payment of annual fees |