JP2019160251A - 画像処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラム - Google Patents
画像処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラム Download PDFInfo
- Publication number
- JP2019160251A JP2019160251A JP2018050247A JP2018050247A JP2019160251A JP 2019160251 A JP2019160251 A JP 2019160251A JP 2018050247 A JP2018050247 A JP 2018050247A JP 2018050247 A JP2018050247 A JP 2018050247A JP 2019160251 A JP2019160251 A JP 2019160251A
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- edge
- pixel
- parallax
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
Abstract
【課題】路面形状の推定および俯瞰画像の作成をせずに、高速かつ高精度に物体を検出することができる画像処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラムを提供する。【解決手段】物体認識装置は、物体を撮像する第1撮像部および第2撮像部によりそれぞれ撮像された撮像画像のうちいずれかを輝度画像として取得する画像取得部と、第1撮像部および第2撮像部によりそれぞれ撮像された撮像画像に基づいて距離情報を演算する距離演算部300と、輝度画像から水平エッジを抽出するエッジ抽出部401と、エッジ抽出部により抽出された水平エッジの両端近傍の垂直方向に長い第1領域に対応する距離情報によって定まる第2領域に基づいて物体を検出する検出部402と、を備える。【選択図】図4
Description
本発明は、画像処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラムに関する。
従来、自動車の安全性において、歩行者と自動車とが衝突したときに、いかに歩行者を守れるか、および、乗員を保護できるかの観点から、自動車のボディー構造等の開発が行われてきた。しかし、近年、情報処理技術および画像処理技術の発達により、高速に人および自動車を検出する技術が開発されてきている。これらの技術を応用して、自動車が物体に衝突する前に自動的にブレーキをかけ、衝突を未然に防ぐというAEB(Automatic Emergency Braking:衝突被害軽減ブレーキ)の制御機能を搭載した自動車も既に開発されている。また、安全性能に加えてドライバーの運転時の負荷を軽減するため、前方車両を認識して、自動で追従する制御機能であるACC(Adaptive Cruise Control)も既に車載システムとして発売されている。
これらの制御を実現するためには、自車から人または他車等の物体までの距離を正確に測定する必要があり、そのためには、ミリ波レーダおよびレーザレーダによる測距、ならびに、ステレオカメラによる測距等が実用化されている。その中でもステレオカメラを用いた物体検出の方法として、視差画像を生成したうえで、路面形状の推定、俯瞰画像の作成、およびラベリングによる視差の塊である孤立領域を検出することで物体の奥行きを含めた位置が検出できることが既に知られている。
ただし、物体検出の方法においては、上述のような路面形状の推定、および俯瞰画像の作成等を行わずに、輝度画像におけるエッジを抽出して物体を検出する技術も知られている。
このような輝度画像を用いて物体を検出する技術として、正反対の方向を有する縦エッジのペアを見つけ、当該縦エッジの間に物体が存在するものとして検出する技術が開示されている(特許文献1参照)。
しかしながら、特許文献1に記載された技術では、例えば、ポールとポールとが距離を隔てて前方に存在する場合、当該各ポールで縦エッジが検出されることになるが、これらの縦エッジがペアとして検出され、各ポール間は何もない空間でありながら物体があるものとして検出する可能性があるという問題がある。
本発明は、上記に鑑みてなされたものであって、路面形状の推定および俯瞰画像の作成をせずに、高速かつ高精度に物体を検出することができる画像処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、物体を撮像する第1撮像部および第2撮像部によりそれぞれ撮像された撮像画像のうちいずれかを輝度画像として取得する画像取得部と、前記第1撮像部および前記第2撮像部によりそれぞれ撮像された前記撮像画像に基づいて距離情報を演算する距離演算部と、前記輝度画像から水平エッジを抽出するエッジ抽出部と、前記エッジ抽出部により抽出された前記水平エッジの両端近傍の垂直方向に長い第1領域に対応する前記距離情報によって定まる第2領域に基づいて前記物体を検出する検出部と、を備えたことを特徴とする。
本発明によれば、路面形状の推定および俯瞰画像の作成をせずに、高速かつ高精度に物体を検出することができる。
以下に、図1〜図25を参照しながら、本発明に係る画像処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラムの実施形態を詳細に説明する。また、以下の実施形態によって本発明が限定されるものではなく、以下の実施形態における構成要素には、当業者が容易に想到できるもの、実質的に同一のもの、およびいわゆる均等の範囲のものが含まれる。さらに、以下の実施形態の要旨を逸脱しない範囲で構成要素の種々の省略、置換、変更および組み合わせを行うことができる。
[第1の実施形態]
(物体認識装置を備えた車両の概略構成)
図1は、第1の実施形態に係る機器制御システムを車両に搭載した例を示す図である。図1を参照しながら、本実施形態に係る機器制御システム60が車両70に搭載される場合を例に説明する。
(物体認識装置を備えた車両の概略構成)
図1は、第1の実施形態に係る機器制御システムを車両に搭載した例を示す図である。図1を参照しながら、本実施形態に係る機器制御システム60が車両70に搭載される場合を例に説明する。
図1のうち、図1(a)は、機器制御システム60を搭載した車両70の側面図であって、機器制御システム60の搭載態様の概略図であり、図1(b)は、車両70の正面図であり、そして、図1(c)は、車両70の平面図(上面図)である。
図1に示すように、自動車である車両70は、機器制御システム60を搭載している。機器制御システム60は、車両70の居室空間である車室に設置された物体認識装置1と、車両制御装置6と、ステアリングホイール7と、ブレーキペダル8と、を含む。
物体認識装置1は、車両70の進行方向を撮像する撮像機能を有し、例えば、車両70のフロントウィンドウ内側のバックミラー近傍に設置される。物体認識装置1は、構成および動作の詳細は後述するが、各ハードウェア部品を内蔵した本体部2と、本体部2に固定された撮像部10aと、撮像部10bとを備えている。撮像部10a、10bは、車両70の進行方向の被写体を撮像できるように本体部2に固定されている。図1(c)に示すように、撮像部10aで撮像される視界(右目視界)と、撮像部10bで撮像される視界(左目視界)とは、ずれがあるため、これが視差として測定される。
車両制御装置6は、物体認識装置1から受信した認識情報に基づいて、各種車両制御を実行するECU(Electronic Control Unit)である。車両制御装置6は、車両制御の例として、物体認識装置1から受信した認識情報に基づいて、ステアリングホイール7を含むステアリング系統(制御対象)を制御して障害物を回避するステアリング制御、または、ブレーキペダル8(制御対象)を制御して車両70を減速および停止させるブレーキ制御等を実行する。
このような物体認識装置1および車両制御装置6を含む機器制御システム60のように、ステアリング制御またはブレーキ制御等の車両制御が実行されることによって、車両70の運転の安全性を向上することができる。
なお、上述のように、物体認識装置1は、車両70の前方を撮像するものとしたが、これに限定されるものではない。すなわち、物体認識装置1は、車両70の後方または側方を撮像するように設置されるものとしてもよい。この場合、物体認識装置1は、車両70の後方の後続車および人、または側方の他の車両および人等の位置を検出することができる。そして、車両制御装置6は、車両70の車線変更時または車線合流時等における危険を検知して、上述の車両制御を実行することができる。また、車両制御装置6は、車両70の駐車時等におけるバック動作において、物体認識装置1によって出力された車両70の後方の障害物についての認識情報に基づいて、衝突の危険があると判断した場合に、上述の車両制御を実行することができる。
(物体認識装置の構成)
図2は、第1の実施形態に係る物体認識装置の外観の一例を示す図である。図2に示すように、物体認識装置1は、上述のように、各ハードウェア部品を内蔵した本体部2と、本体部2に固定された撮像部10aと、撮像部10bとを備えている。撮像部10a、10bは、本体部2に平行等位に配置された一対の円筒形状のカメラで構成されている。また、説明の便宜上、図2に示す撮像部10aを右のカメラと称し、撮像部10bを左のカメラと称する場合がある。
図2は、第1の実施形態に係る物体認識装置の外観の一例を示す図である。図2に示すように、物体認識装置1は、上述のように、各ハードウェア部品を内蔵した本体部2と、本体部2に固定された撮像部10aと、撮像部10bとを備えている。撮像部10a、10bは、本体部2に平行等位に配置された一対の円筒形状のカメラで構成されている。また、説明の便宜上、図2に示す撮像部10aを右のカメラと称し、撮像部10bを左のカメラと称する場合がある。
<物体認識装置のハードウェア構成>
図3は、第1の実施形態に係る物体認識装置のハードウェア構成の一例を示す図である。図3を参照しながら、本実施形態に係る物体認識装置1のハードウェア構成について説明する。
図3は、第1の実施形態に係る物体認識装置のハードウェア構成の一例を示す図である。図3を参照しながら、本実施形態に係る物体認識装置1のハードウェア構成について説明する。
図3に示すように、物体認識装置1は、撮像部10aと、撮像部10bと、情報処理部30と、を備えている。撮像部10aおよび撮像部10bによって、いわゆるステレオカメラが構成される。
撮像部10aは、前方の被写体を撮像して撮像画像(輝度画像)を生成する処理部である。撮像部10aは、撮像レンズ11aと、画像センサ13aと、センサコントローラ20aと、を備えている。
撮像レンズ11aは、入射する光を屈折させて物体の像を画像センサ13aに結像させるための光学素子である。画像センサ13aは、撮像レンズ11aに入射して透過した光を電気的なアナログの画像信号に変換する半導体素子である。画像センサ13aは、例えば、CCD(Charge Coupled Devices)またはCMOS(Complementary Metal Oxide Semiconductor)等の固体撮像素子によって実現される。
センサコントローラ20aは、画像センサ13aの露光制御、画像読み出し制御、外部回路との通信、および画像データの送信制御等を行うコントローラである。センサコントローラ20aは、画像センサ13aによって得られたアナログの画像信号をデジタル形式の画像データ(以下、単に「画像」と称する場合がある)(撮像画像、輝度画像)に変換して、後段の情報処理部30に送信する。
撮像部10bは、前方の被写体を撮像して撮像画像(輝度画像)を生成する処理部である。撮像部10bは、撮像レンズ11bと、画像センサ13bと、センサコントローラ20bと、を備えている。なお、撮像レンズ11b、画像センサ13bおよびセンサコントローラ20bの機能は、それぞれ上述した撮像レンズ11a、画像センサ13aおよびセンサコントローラ20aの機能と同様である。また、撮像レンズ11aおよび撮像レンズ11bは、左右のカメラが同一の条件で撮像されるように、それぞれのレンズの主面が互いに同一平面上にあるように設置されている。
情報処理部30は、撮像部10a、10bからそれぞれ得られた輝度画像から、視差画像を生成し、当該視差画像に基づいて、輝度画像に写り込んでいる人および車等の物体を認識する物体認識処理を行う装置である。情報処理部30は、物体認識処理の結果を示す認識情報を、車両制御装置6に出力する。情報処理部30は、FPGA(Field Programmable Gate Array)31と、CPU(Central Processing Unit)32と、ROM(Read Only Memory)33と、RAM(Random Access Memory)34と、データI/F(Interface)35と、シリアルI/F36と、シリアルバスライン38と、データバスライン39と、を備えている。
FPGA31は、画像データに対してリアルタイム性が要求される処理を行う集積回路である。FPGA31は、例えば、ガンマ補正、歪み補正(左右画像の平行化)、ブロックマッチング(ステレオマッチング処理の一例)による視差演算を行い、視差画像を生成し、生成した視差画像をRAM34に書き込む。
CPU32は、情報処理部30の各機能を制御する演算装置である。CPU32は、例えば、撮像部10a、10bのセンサコントローラ20a、20bの制御を行う。また、CPU32は、データI/F35を介して、車両70のCAN(Controller Area Network)情報(例えば、車速、加速度、舵角、ヨーレート等)を取得し、ROM33に記憶されている物体認識処理プログラムに従って、RAM34に記憶されている輝度画像および視差画像を用いて、物体に対する物体認識処理を行う。
ROM33は、CPU32が情報処理部30の物体認識処理を実行する物体認識処理プログラムを記憶している不揮発性の記憶装置である。物体認識処理プログラムは、画像処理プログラムの一例である。
RAM34は、CPU32にワークエリアとして使用される揮発性の記憶装置である。
データI/F35は、車両70のCANに接続され、CAN情報を受信するインターフェースである。シリアルI/F36は、情報処理部30による物体認識処理により生成された認識情報を、例えば、外部の車両制御装置6に送信するためのインターフェースである。
シリアルバスライン38は、FPGA31またはCPU32からのセンサ露光値の変更制御データ、画像読み出しパラメータの変更制御データ、および各種設定データ等を、センサコントローラ20a、20bへ送信するためのバスである。データバスライン39は、図3に示すように、センサコントローラ20a、20b、FPGA31、CPU32、ROM33、RAM34、データI/F35およびシリアルI/F36が互いに通信可能となるように接続するバスである。
なお、情報処理部30は、視差画像を生成する集積回路としてFPGA31を備えるものとしているが、これに限定されるものではなく、ASIC(Application Specific Integrated Circuit)等のその他の集積回路であってもよい。
また、図3に示す物体認識装置1のハードウェア構成は一例であって、これに限定されるものではなく、図3に示した構成要素を全て含む必要はなく、または、その他の構成要素を含むものとしてもよい。
<物体認識装置の機能ブロックの構成>
図4は、第1の実施形態に係る物体認識装置の機能ブロック構成の一例を示す図である。図4を参照しながら、本実施形態に係る物体認識装置1の機能ブロック構成について説明する。
図4は、第1の実施形態に係る物体認識装置の機能ブロック構成の一例を示す図である。図4を参照しながら、本実施形態に係る物体認識装置1の機能ブロック構成について説明する。
図4に示すように、本実施形態に係る物体認識装置1は、画像取得部100a(第1撮像部または第2撮像部)、画像取得部100b(第2撮像部または第1撮像部)と、変換部200a、200bと、視差演算部300(画像取得部の一例、距離演算部)と、クラスタリング部400(画像取得部の一例)と、棄却部500と、トラッキング判定部550と、を有する。
画像取得部100aは、右のカメラにより前方の被写体を撮像して、アナログの画像信号を生成し、画像信号に基づく画像(撮像画像)である輝度画像を得る機能部である。画像取得部100aは、図3に示す撮像部10aによって実現される。
画像取得部100bは、左のカメラにより前方の被写体を撮像して、アナログの画像信号を生成し、画像信号に基づく画像(撮像画像)である輝度画像を得る機能部である。画像取得部100bは、図3に示す撮像部10bによって実現される。
変換部200aは、画像取得部100aにより得られた輝度画像の画像データに対して、ノイズの除去等を行い視差画像の基となる基準画像Iaに変換して生成する機能部である。変換部200aは、図3に示すFPGA31によって実現される。
変換部200bは、画像取得部100bにより得られた輝度画像の画像データに対して、ノイズの除去等を行い視差画像の基となる比較画像Ibに変換して生成する機能部である。変換部200bは、図3に示すFPGA31によって実現される。
すなわち、変換部200a、200bは、画像取得部100a、100bそれぞれから出力された2つの輝度画像に基づいて、それぞれ基準画像Iaおよび比較画像Ibを視差演算部300へ出力する。また、変換部200aは、基準画像Iaを、クラスタリング部400および棄却部500へ出力する。
視差演算部300は、変換部200a、200bそれぞれから受け取った基準画像Iaおよび比較画像Ibに基づいて、ステレオマッチング処理である局所領域のブロックマッチング等を用いて、基準画像Iaの各画素についての視差値dpを導出し、基準画像Iaの各画素に視差値を対応させた視差画像(距離情報の一例)を生成する機能部である。視差演算部300は、図4に示すように、コスト算出部301と、サブピクセル推定部302と、視差画像生成部303と、を有する。
コスト算出部301は、基準画像Iaにおける基準画素p(x,y)の輝度値、および、基準画素p(x,y)に基づく比較画像Ibにおけるエピポーラ線上で、基準画素p(x,y)の位置に相当する画素からシフト量dでシフトすることにより特定される、対応画素の候補である候補画素q(x+d,y)の各輝度値(画素値)に基づいて、各候補画素q(x+d,y)のコスト値C(p,d)を算出する機能部である。なお、コスト値C(p,d)は、基準画素pの位置からシフト量dだけシフトした位置の候補画素q(x+d,y)のコスト値を示す。
サブピクセル推定部302は、コスト算出部301により算出された、基準画像Iaにおける基準画素についての比較画像Ibにおける画素のコスト値Cの最小値に対応するシフト量d、およびそれに隣接するシフト量dにおけるコスト値Cに基づいて、サブピクセル推定を実行する機能部である。
視差画像生成部303は、サブピクセル推定部302により導出されたサブピクセル単位の視差値dpに基づいて、基準画像Iaの各画素の輝度値を、その画素に対応する視差値dpで置き換えた画像である視差画像を生成する機能部である。
視差演算部300は、生成した視差画像を、クラスタリング部400へ出力する。視差演算部300は、図3に示すFPGA31によって実現される。
クラスタリング部400は、変換部200aから受信した基準画像、視差演算部300から受信した視差画像に基づいて、視差画像に写っている物体を検出する機能部である。クラスタリング部400は、図4に示すように、エッジ抽出部401と、物体検出部402(検出部)と、を有する。
なお、変換部200aからクラスタリング部400に基準画像Iaが入力されることに限定されるものではなく、変換部200bから比較画像Ibが入力され物体の検出に用いられるものとしてもよい。
エッジ抽出部401は、基準画像Iaから水平エッジを抽出して、抽出された水平エッジを示すエッジ画像を生成する機能部である。
物体検出部402は、エッジ抽出部401により抽出された水平エッジと、視差画像生成部303から入力した視差画像とを用いて、物体の検出領域である矩形を求める機能部である。
そして、クラスタリング部400は、検出した物体の画像(物体検出部402により求められた矩形内の画像)(認識画像)に関する情報(例えば、基準画像Iaでの位置を示す座標、およびサイズ等)(以下、単に「認識画像情報」と称する)を棄却部500へ出力する。
棄却部500は、変換部200aから出力された基準画像Ia、およびクラスタリング部400から出力された認識画像情報に基づいて、認識画像情報で示される認識画像について棄却するか否かを判定する棄却判定を行う機能部である。ここで、棄却とは、その物体を後段の処理(追跡処理等)の対象外とする処理を示す。棄却部500は、当該棄却判定の結果を、対応する認識画像情報に含めて、後段のトラッキング判定部550へ出力するものとすればよい。
トラッキング判定部550は、棄却部500からの棄却判定の結果に基づいて、認識画像に含まれる物体に対してトラッキングを行うか否かを判定する機能部である。例えば、トラッキング判定部550は、棄却部500で棄却と判定されなかった物体に対してトラッキングを行うものと判定し、その物体の認識画像情報にトラッキングを行う旨の情報を含め、認識情報として車両制御装置6に出力する。
また、図4に示す物体認識装置1のクラスタリング部400、棄却部500およびトラッキング判定部550は、それぞれ図3に示すCPU32がプログラム(物体認識処理プログラム)を実行することによって実現される。なお、クラスタリング部400、棄却部500およびトラッキング判定部550の一部または全部は、ハードウェア回路であるFPGA31、または、その他のハードウェア回路(ASIC等)によって実現されるものとしてもよい。
なお、本発明に係る「画像処理装置」は、視差演算部300およびクラスタリング部400を含む処理部であってもよく、当該処理部を含む情報処理部30であってもよい。
また、図4に示す物体認識装置1の各機能部は、機能を概念的に示したものであって、このような構成に限定されるものではない。例えば、図4に示す物体認識装置1で独立した機能部として図示した複数の機能部を、1つの機能部として構成してもよい。一方、図4に示す物体認識装置1で1つの機能部が有する機能を複数に分割し、複数の機能部として構成するものとしてもよい。
(ステレオマッチング処理(視差演算))
<コスト算出>
図5は、撮像部から物体までの距離を導き出す原理を説明する図である。図6は、基準画像の基準画素に対応する比較画像の対応画素を求める場合の説明図である。図7は、画素単位のシフト量と、コスト値との関係の一例を示すグラフである。図5〜図7を参照しながら、本実施形態の視差演算部300における視差演算のうちのコスト算出について説明する。
<コスト算出>
図5は、撮像部から物体までの距離を導き出す原理を説明する図である。図6は、基準画像の基準画素に対応する比較画像の対応画素を求める場合の説明図である。図7は、画素単位のシフト量と、コスト値との関係の一例を示すグラフである。図5〜図7を参照しながら、本実施形態の視差演算部300における視差演算のうちのコスト算出について説明する。
まず、図5を参照しながら、ステレオカメラ(撮像部10a、10b)から物体に対する視差を導出し、この視差を示す視差値によって、ステレオカメラから物体までの距離を測定する原理について説明する。図5に示すように、撮像部10a、10bは、それぞれ、入射する光を屈折させて物体の像を固体撮像素子である画像センサに結像させる撮像レンズ11a、11bを有する。撮像部10aおよび撮像部10bによって撮像された各画像は、上述したように、それぞれ基準画像Iaおよび比較画像Ibである。図5において、3次元空間内の物体E上の点Sは、基準画像Iaおよび比較画像Ibそれぞれにおいて、撮像レンズ11aと撮像レンズ11bとを結ぶ直線と平行な直線上の位置に写像される。ここで、各画像に写像された点Sを、基準画像Iaにおいて点Sa(x,y)とし、比較画像Ibにおいて点Sb(X,y)とする。このとき、視差値dpは、基準画像Ia上の座標における点Sa(x,y)と比較画像Ib上の座標における点Sb(X,y)とを用いて、以下の式(1)のように表される。
dp=X−x ・・・(1)
また、図5において、基準画像Iaにおける点Sa(x,y)と撮像レンズ11aから撮像面上におろした垂線の交点との距離をΔaとし、比較画像Ibにおける点Sb(X,y)と撮像レンズ11bから撮像面上におろした垂線の交点との距離をΔbにすると、視差値dpは、dp=Δa+Δbと表すこともできる。
次に、視差値dpを用いることにより、撮像部10a、10bと物体Eとの間の距離Zを導出する。ここで、距離Zは、撮像レンズ11aの焦点位置と撮像レンズ11bの焦点位置とを結ぶ直線から物体E上の点Sまでの距離である。図5に示すように、撮像レンズ11aおよび撮像レンズ11bの焦点距離f、撮像レンズ11aと撮像レンズ11bとの間の長さである基線長B、および視差値dpを用いて、下記の式(2)により、距離Zを算出することができる。
Z=(B×f)/dp ・・・(2)
この式(2)により、視差値dpが大きいほど距離Zは小さく、視差値dpが小さいほど距離Zは大きくなることがわかる。
次に、図6および図7を用いて、ブロックマッチング(ステレオマッチング処理の一例)によるコスト値の算出方法について説明する。
図6のうち、図6(a)は、基準画像Iaにおける基準画素pおよび基準領域pbを示す概念図を示し、図6(b)は、図6(a)に示す基準画素pに対応する比較画像Ibにおける対応画素の候補を順次シフトしながら(ずらしながら)、コスト値Cを算出する際の概念図である。ここで、対応画素とは、基準画像Iaにおける基準画素pに最も類似する比較画像Ibにおける画素を示す。また、コスト値Cとは、基準画像Iaにおける基準画素pに対する、比較画像Ibにおける各画素の類似度または非類似度を表す評価値(一致度)である。以下に示すコスト値Cは、値が小さいほど、比較画像Ibにおける画素が基準画素pと類似していることを示す非類似度を表す評価値であるものとして説明する。
コスト算出部301は、図6(a)に示すように、基準画像Iaにおける基準画素p(x,y)、および、基準画素p(x,y)に対する比較画像Ibにおけるエピポーラ線EL上の対応画素の候補である候補画素q(x+d,y)の各輝度値(画素値)に基づいて、基準画素p(x,y)に対する対応画素の候補画素q(x+d,y)のコスト値C(p,d)を算出する。dは、基準画素pと候補画素qとのシフト量(ずれ量)であり、シフト量dは、画素単位でシフトされる。すなわち、図6では、候補画素q(x+d,y)を予め指定された範囲(例えば、0<d<25)において順次一画素分シフトしながら、候補画素q(x+d,y)と基準画素p(x,y)との輝度値の非類似度であるコスト値C(p,d)が算出される。
また、基準画素pの対応画素を求めるためのマッチング処理として、本実施形態ではブロックマッチングを行う。ブロックマッチングでは、基準画像Iaの基準画素pを中心とする所定領域である基準領域pbと、比較画像Ibの候補画素qを中心とする候補領域qb(大きさは基準領域pbと同一)との非類似度を求める。基準領域pbと候補領域qbとの非類似度を示すコスト値Cとしては、SAD(Sum of Absolute Difference)、SSD(Sum of Squared Difference)、または、SSDの値から各ブロックの平均値を減算したZSSD(Zero−mean−Sum of Squared Difference)等が用いられる。これらの評価値は、相関が高い(類似の度合いが高い)ほど、値が小さくなるので非類似度を示す。
なお、上述のように、撮像部10a、10bは、それぞれ平行等位に配置されるため、基準画像Iaおよび比較画像Ibも、それぞれ平行等位の関係にある。したがって、基準画像Iaにおける基準画素pに対応する比較画像Ibにおける対応画素は、図6に紙面視横方向の線として示されるエピポーラ線EL上に存在することになり、比較画像Ibにおける対応画素を求めるためには、比較画像Ibのエピポーラ線EL上の画素を探索すればよい。
このようなコスト算出部301によるブロックマッチングで算出されたコスト値C(p,d)は、シフト量dとの関係で、例えば、図7に示すグラフにより表される。図7の例では、コスト値Cは、シフト量d=3の場合が最小値となるため、視差値dp=3として導出される。ただし、図7に示すような画素単位のシフト量dに対すコスト値Cのグラフにおいては、視差値dpとして画素単位の値を導出することしかできないことになる。そこで、図8および図9で後述するように、視差値dpを画素単位の値ではなく、画素単位より小さい単位(以下、サブピクセル単位という)で視差値dpを推定して導出するサブピクセル推定がサブピクセル推定部302によって実行される。
<サブピクセル推定>
図8は、パラボラフィッティングによるサブピクセル推定を説明する図である。図9は、最小二乗法によるサブピクセル推定を説明する図である。図8および図9を参照しながら、本実施形態の視差演算部300における視差演算のうちのサブピクセル推定について説明する。
図8は、パラボラフィッティングによるサブピクセル推定を説明する図である。図9は、最小二乗法によるサブピクセル推定を説明する図である。図8および図9を参照しながら、本実施形態の視差演算部300における視差演算のうちのサブピクセル推定について説明する。
まず、図8を参照しながら、サブピクセル推定部302がパラボラフィッティングによるサブピクセル推定を実行する場合について説明する。サブピクセル推定部302は、コスト算出部301によって算出されたコスト値Cのグラフ(図7参照)において、コスト値Cが最小となるシフト量dの値を求める。図7の例では、シフト量d=3の場合が、コスト値Cが最小となる。次に、サブピクセル推定部302は、シフト量d=3に隣接するシフト量dを求める。具体的には、シフト量d=2,4である。次に、サブピクセル推定部302は、図7に示すシフト量dとコスト値Cとのグラフにおいて、図8に示すように、シフト量d=2,3,4である3点を通る下に凸の2次曲線を求める。そして、サブピクセル推定部302は、その2次曲線の極小値に対応するサブピクセル単位のシフト量dが視差値dpであると推定する。
次に、図9を参照しながら、サブピクセル推定部302が最小二乗法によるサブピクセル推定を実行する場合について説明する。サブピクセル推定部302は、コスト算出部301によって算出されたコスト値Cのグラフ(図7参照)において、コスト値Cが最小となるシフト量dの値を求める。図7の例では、シフト量d=3の場合が、コスト値Cが最小となる。次に、サブピクセル推定部302は、シフト量d=3の近傍の4つのシフト量dを求める。具体的には、シフト量d=1,2,4,5である。次に、サブピクセル推定部302は、図7に示すシフト量dとコスト値Cとのグラフにおいて、図9に示すように、最小二乗法によってシフト量d=1,2,3,4,5である5点の近傍を通る下に凸の2次曲線を求める。そして、サブピクセル推定部302は、その2次曲線の極小値に対応するサブピクセル単位のシフト量dが視差値dpであると推定する。
サブピクセル推定部302は、図8に示すパラボラフィッティングによるサブピクセル推定、または、図9に示す最小二乗法によるサブピクセル推定のいずれかによって、視差値dpを推定して導出する。これによって、画素単位より小さい単位であるサブピクセル単位で視差値dpを導出することができるので、精度が高く、かつ密な視差値dpを導出することができる。
なお、サブピクセル推定は、上述のパラボラフィッティングによるもの、または、最小二乗法によるものに限定されるものではなく、その他の方法によってサブピクセル推定を行うものとしてもよい。例えば、サブピクセル推定部302は、図8に示す3点を用いて、2次曲線ではなく、3点を通る等角直線を求めて視差値dpを推定する等角直線フィッティングによりサブピクセル推定を実行するものとしてもよい。
また、最小二乗法によるサブピクセル推定において、図9に示すグラフ上の5点を用いて2次曲線を求めるものとしたが、これに限定されるものではなく、異なる数の点を用いて2次曲線を求めるものとしてもよい。
また、サブピクセル推定部302によるサブピクセル推定によってサブピクセル単位の視差値dpを算出することに限定されるものではなく、サブピクセル推定の実行はせずに、画素単位の視差値dpを算出するものとしてもよい。この場合、サブピクセル推定部302は、コスト算出部301により算出された、基準画像Iaにおける基準画素についての比較画像Ibにおける画素のコスト値Cの最小値に対応するシフト量dを視差値dpとすればよい。
また、サブピクセル推定によって発生する可能性がある推定視差の誤差を現象させるEEC(Estimation Error Cancel method)等の方式を利用するものとしてもよい。
<視差画像生成>
図10は、撮像画像から生成される視差画像の一例を示す図である。図10を参照しながら、本実施形態の視差演算部300における視差演算のうちの視差画像の生成について説明する。
図10は、撮像画像から生成される視差画像の一例を示す図である。図10を参照しながら、本実施形態の視差演算部300における視差演算のうちの視差画像の生成について説明する。
視差画像生成部303は、サブピクセル推定部302により導出されたサブピクセル単位の視差値dpに基づいて、基準画像Iaの各画素の輝度値を、その画素に対応する視差値dpで置き換えた画像である視差画像を生成する。図10のうち、図10(a)は、基準画像Iaの一例である基準画像Ia1を示し、図10(b)は、視差画像生成部303により生成された視差画像の一例である視差画像Ipの模式図を示す。図10(a)に示す基準画像Ia1には、路面600と、車601とが、写り込んでいる。この基準画像Ia1の路面600は、図10(b)に示す視差画像Ipにおいては路面部600aに対応し、車601は、車部601aに対応する。
なお、上述の視差演算部300によるステレオマッチング処理では、ブロックマッチングによって視差値を求めるものとしたが、これに限定されるものではなく、例えば、SGM(Semi−Global Matching)法を用いて視差値を求めるものとしてもよい。
また、視差画像生成部303は、視差画像を生成するものとしているが、視差に関する情報ではなく、視差から距離に変換した距離情報の画像を生成するものとしてもよい。また、視差画像生成部303が生成するものは、画像形式に限定するものではなく、画像形式ではない視差情報または距離情報を生成するものとしてもよい。
上述のブロックマッチングに基づく視差値の導出では、図10(b)に示すように、垂直方向に延びるエッジ(以下、単に「垂直エッジ」と称する場合がある)の部分における視差(図10(b)の実線部分)が十分な精度で得られる傾向があり、その視差点(有効な視差値を有する画素)の数も多い。一方、ブロックマッチングによる視差演算の問題として、水平方向に延びるエッジの部分、および輝度変化が小さい部分では視差を正しく演算することが困難である傾向がある。そこで、図11〜図15で後述するように、本実施形態では、水平方向に延びるエッジ(以下、単に「水平エッジ」と称する場合がある)について、輝度画像である基準画像Iaを用いて求める。
(クラスタリング処理)
<エッジの抽出>
図11は、エッジを検出するための計算用フィルタの一例を示す図である。図12は、水平エッジを判定するための説明図である。図13は、輝度画像から得られた水平エッジを示すエッジ画像の一例を示す図である。図14は、車両上の水平ラインまでの距離を求めることを説明する図である。図15は、短い水平エッジを除去した後のエッジ画像の一例を示す図である。図11〜図15を参照しながら、本実施形態のクラスタリング部400におけるクラスタリング処理のうちエッジの抽出動作について説明する。
<エッジの抽出>
図11は、エッジを検出するための計算用フィルタの一例を示す図である。図12は、水平エッジを判定するための説明図である。図13は、輝度画像から得られた水平エッジを示すエッジ画像の一例を示す図である。図14は、車両上の水平ラインまでの距離を求めることを説明する図である。図15は、短い水平エッジを除去した後のエッジ画像の一例を示す図である。図11〜図15を参照しながら、本実施形態のクラスタリング部400におけるクラスタリング処理のうちエッジの抽出動作について説明する。
まず、クラスタリング部400のエッジ抽出部401は、変換部200aから入力した基準画像Iaの各画素値(輝度値)に対して、例えば、図11に示すソーベルフィルタを用いて、対象画素の水平方向のエッジに関する強度Ey、垂直方向のエッジに関する強度Exを算出する。図11のうち、図11(a)に示すフィルタは、対象画素の水平方向のエッジに関する強度Eyを求めるための計算用フィルタ(ソーベルフィルタ)であり、当該対象画素の周辺8画素の画素値に対して、フィルタの係数をかけて合計した値を強度Eyとしている。また、図11(b)に示すフィルタは、対象画素の垂直方向のエッジに関する強度Exを求めるための計算用フィルタ(ソーベルフィルタ)であり、当該対象画素の周辺8画素の画素値に対して、フィルタの係数をかけて合計した値を強度Exとしている。なお、図11に示すソーベルフィルタの係数およびフィルタのサイズは一例である。
そして、エッジ抽出部401は、算出した強度Ey、Exから、対象画素についてのエッジ強度E(変化量)を、下記の式(3)を用いて算出する。
また、エッジ抽出部401は、算出した強度Ey、Exから、対象画素におけるエッジ方向θ(変化方向)を、下記の式(4)を用いて算出する。
そして、エッジ抽出部401は、対象画素について、エッジ強度Eが所定の閾値以上、かつ、エッジ方向θが水平方向から所定の角度範囲内である場合、当該対象画素を、水平エッジを構成する画素(以下、単に「水平エッジ画素」と称する場合がある)であると判定する。具体的には、対象画素のエッジ強度Eが所定の閾値以上であるか否かは、図12に示す矢印701の長さが、半径が当該閾値である円形状の強度範囲702以上となるか否かによって判定される。また、対象画素のエッジ方向θが水平方向から所定範囲内であるか否かは、図12に示す矢印701の方向が、水平エッジ範囲703の範囲内であるか否かによって判定される。すなわち、エッジ抽出部401は、エッジ強度Eが所定の閾値以上の画素のみを用いることによって、ノイズの影響を抑制することができ、さらに、エッジ方向θが水平方向から所定範囲内となる画素を水平エッジ画素とみなすものとする。
以上のような方法により、エッジ抽出部401は、基準画像Ia(例えば、図13(a)に示す基準画像Ia1)から、水平エッジ画素で構成されたエッジ画像(例えば、図13(b)に示すエッジ画像Ie)を得る。図13(a)に示す基準画像Ia1の車601は、図13(b)に示すエッジ画像Ieにおいては車部601bに対応する。なお、エッジ抽出部401によって得られるエッジ画像は、上述のように水平エッジ画素で構成されるが、この水平エッジ画素の画素値は、例えば、当該水平エッジ画素に対応する基準画像Iaの画素値であってもよく、エッジ抽出部401により算出されたエッジ強度Eの値であってもよく、水平エッジ画素であることを示す任意の値に設定するものとすればよい。
また、エッジ抽出部401は、図13(b)に示すように、エッジ画像において水平方向に隣接する水平エッジ画素を一塊として水平エッジとして抽出する。なお、一塊の水平エッジとするのは、厳密に、隣接した水平エッジ画素とすることに限定されるものではなく、同じ水平ライン上で水平エッジ画素の抜けがある場合等、水平エッジ画素が同じ水平ライン上で近接している場合は、同じ一塊の水平エッジとして扱うものとしてもよい。具体的には、水平エッジ画素間が所定の画素数以内(所定間隔以内)の間隔であれば、当該各水平エッジ画素を同じ一塊の水平エッジに含まれるものとすればよい。
また、抽出された水平エッジを用いて物体の検出を行う場合、すべての水平エッジを用いるとノイズも多く誤検出となる可能性が高まる。そこで、エッジ抽出部401は、所定の長さ以下(所定条件の一例)の短い水平エッジはノイズであるものとして、当該水平エッジを後段の物体検出に用いないように除去する。これによって、物体の誤検出を抑制することができる。
ここで、車両までの実際の距離に応じて当該車両の幅が画像上でどのくらいの画素数(ピクセル数)となるかを算出する方法の一例を説明する。一般的な車両の幅を1700[mm]、撮像部10a(10b)の焦点距離をf[mm]、画像センサ13a(13b)のセルピッチをcp[mm/pix]とし、距離Dist[mm]に映る車両の画像上での幅W[pix]は、下記の式(5)で算出される。
そして、エッジ抽出部401は、式(5)により計算された幅W[pix]に基づいて閾値を設定し、当該閾値未満の長さ(画素数)の水平エッジを、車両以外の部分だと判断して、後段の車両検出に用いないように除去するものとすればよい。
また、上述の距離Distについては、例えば、対象となる水平エッジに対応する視差値から求まる最大距離としてもよく、または、当該水平エッジの周辺の視差値に基づいて算出するものとしてもよい。水平エッジの周辺の視差値に基づいて距離を算出する方法としては、例えば、図14に示す視差画像Ipにおいて、対象となる水平エッジ610(便宜上、視差画像Ipに重ねて表している)を含むような計算エリア620を設定する。そして、計算エリア620に含まれる視差値の平均値から求まる距離を、距離Distとすればよい。
エッジ抽出部401によって、車両以外の水平エッジだと判断されて除去された後のエッジ画像の例を、図15のエッジ画像Ie1に示す。図15に示すエッジ画像Ie1は、図13(b)に示したエッジ画像Ieと比較して、サイドミラーおよびナンバープレートに対応する水平エッジが除去されている。
以上のような動作によって、エッジ抽出部401は、基準画像Ia(および視差画像)から、車両の水平エッジを示すエッジ画像を得る。
<物体の検出領域を示す矩形の導出>
図16は、視差画像に水平エッジを重畳させた例を示す図である。図17は、視差画像において水平エッジから車両の検出領域を示す矩形を求めるための左右の領域を示した図である。図18は、車両の検出領域を示す矩形の一例を示す図である。図16〜図18を参照しながら、本実施形態のクラスタリング部400におけるクラスタリング処理のうち、物体の検出領域を示す矩形の導出動作について説明する。
図16は、視差画像に水平エッジを重畳させた例を示す図である。図17は、視差画像において水平エッジから車両の検出領域を示す矩形を求めるための左右の領域を示した図である。図18は、車両の検出領域を示す矩形の一例を示す図である。図16〜図18を参照しながら、本実施形態のクラスタリング部400におけるクラスタリング処理のうち、物体の検出領域を示す矩形の導出動作について説明する。
図16は、視差演算部300により生成された視差画像Ipに、エッジ抽出部401で得られたエッジ画像Ie1を重畳させた状態を示している。図16では、便宜上、視差値を有する画素の部分は太い破線、水平エッジ部分は太い実線で示している。図16に示すように、車両物体は、リアバンパ、リアガラス、ボンネット、および車体の影を有していることから、水平エッジが画像上の物体内部に存在し、かつ、車両と背景との境界部分に有効な視差値が得られやすい。そして、物体検出部402は、エッジ抽出部401により抽出された水平エッジと、視差画像生成部303から入力した視差画像とを用いて、物体(ここでは車両)の検出領域である矩形を求める。
具体的には、物体検出部402は、図17に示すように、抽出された水平エッジのうち特定の水平エッジ(図17の例では、水平エッジ610)(以下、「対象水平エッジ」と称する場合がある)の両端の端点周辺に縦方向に延びる左側領域631(第1領域の一例)および右側領域632(第1領域の一例)を設定する。この対象水平エッジの両端の端点周辺の縦方向に延びる領域としては、例えば、縦方向の高さを実際の車両の高さを包含するような長さとし、横方向の幅をブロックマッチングで用いたブロック(基準領域pb)の幅とすればよい。なお、左側領域631および右側領域632については、図17に示すように、縦方向の矩形形状の領域に限定されるものではなく、例えば、縦方向かつ斜めに細長い形状の領域でもよく、縦方向に長い楕円形状の領域であってもよい。
そして、物体検出部402は、左側領域631内の視差点を走査して、上端点Pu1、左端点Pl、および下端点Pd1を特定し、右側領域632内の視差点を走査して、上端点Pu2、右端点Pr、および下端点Pd2を特定する。そして、物体検出部402は、上端点Pu1および上端点Pu2のうち低い方(または高い方)、下端点Pd1および下端点Pd2のうち高い方(または低い方)、左端点Pl、および、右端点Prで囲まれた矩形(図18に示す矩形640)(第2領域の一例)を、物体の検出領域として決定する。なお、左側領域631および右側領域632は矩形形状としているが、これに限定されるものではなく、その他の形状であってもよい。また、物体検出部402により物体の検出領域とされるのは矩形に限定されるものではなく、特定された各端点に基づいたその他の形状を呈する領域(第2領域の一例)であってもよい。
なお、物体検出部402は、エッジ抽出部401により抽出された複数の水平エッジのうち、特定の水平エッジを用いて、物体の検出領域を示す矩形を決定するものとしたが、この特定の水平エッジとしては、例えば、以下のように決めればよい。例えば、抽出された複数の水平エッジのうち最も長い水平エッジ、または、一般的な車両の長さに最も近似する水平エッジ等を、特定エッジとして決めればよい。または、抽出された複数の水平エッジについて、高さ方向の平均位置を求め、かつ、水平方向の平均長さを求め、当該平均位置に存在する当該平均長さの水平エッジを、特定エッジとして決めてもよい。
また、左側領域631および右側領域632に含まれるすべての視差点を対象として各端点を特定するものとしているが、これに限定されるものではない。例えば、左側領域631および右側領域632に含まれる視差点の視差値から、距離の範囲を決定し、当該距離の範囲に含まれる視差点の視差値のみを用いて、各端点を特定するものとしてもよい。これによって、ノイズおよび背景の視差に対してロバストに物体の検出領域を示す矩形を決定することが可能となる。
また、エッジ抽出部401は、抽出した水平エッジの両端近傍の視差値が左右で所定値以上(所定条件の一例)異なっていれば、当該水平エッジは物体(例えば、車両)に属する水平エッジではないと判定し、当該水平エッジを除去するものとしてもよい。このように、基準画像Iaの輝度値に加え、視差画像の視差値を用いることによって、水平エッジの抽出の精度を向上させることができる。
また、物体検出部402は、物体(例えば、車両)の検出領域として決定した矩形内の画像(認識画像)に対して、当該物体についてのモデルとなるテンプレートを用いて、認識画像とテンプレートとを比較するものとしてもよい。その比較の結果、テンプレートの物体に対して認識画像が示す物体が一致しないと判断される場合は、当該矩形を棄却するものとしてもよい。これによって、検出対象とする物体とは異なる他の物体(例えば、道路上の看板等の人工物)を誤って検出することを抑制することができる。また、物体のモデルとなるテンプレートを用いる場合、エッジ抽出部401により複数の水平エッジが抽出された場合、物体検出部402は、各水平エッジについて矩形を求め、各矩形内の画像に対してテンプレートと比較し、当該テンプレートに最も近似する画像を有する矩形を、物体の検出領域として決定するものとしてもよい。
(物体認識処理の流れ)
<ステレオマッチング処理の流れ>
図19は、第1の実施形態に係る物体認識装置のステレオマッチング処理の一例を示すフローチャートである。図19を参照しながら、本実施形態に係る物体認識装置1のステレオマッチング処理の流れについて説明する。
<ステレオマッチング処理の流れ>
図19は、第1の実施形態に係る物体認識装置のステレオマッチング処理の一例を示すフローチャートである。図19を参照しながら、本実施形態に係る物体認識装置1のステレオマッチング処理の流れについて説明する。
<<ステップS1−1>>
画像取得部100bは、左のカメラにより前方の被写体を撮像して、アナログの画像信号を生成し、画像信号に基づく画像(撮像画像)である輝度画像を得る。これによって、後段の画像処理の対象となる画像信号が得られることになる。そして、ステップS2−1へ移行する。
画像取得部100bは、左のカメラにより前方の被写体を撮像して、アナログの画像信号を生成し、画像信号に基づく画像(撮像画像)である輝度画像を得る。これによって、後段の画像処理の対象となる画像信号が得られることになる。そして、ステップS2−1へ移行する。
<<ステップS1−2>>
画像取得部100aは、右のカメラにより前方の被写体を撮像して、アナログの画像信号を生成し、画像信号に基づく画像(撮像画像)である輝度画像を得る。これによって、後段の画像処理の対象となる画像信号が得られることになる。そして、ステップS2−2へ移行する。
画像取得部100aは、右のカメラにより前方の被写体を撮像して、アナログの画像信号を生成し、画像信号に基づく画像(撮像画像)である輝度画像を得る。これによって、後段の画像処理の対象となる画像信号が得られることになる。そして、ステップS2−2へ移行する。
<<ステップS2−1>>
変換部200bは、画像取得部100bにより得られた輝度画像の画像データに対して、ノイズの除去等を行い、デジタル形式の画像データである比較画像Ibに変換して生成する。このように、デジタル形式の画像データに変換することによって、その画像データに基づく画像に対して画素ごとの画像処理が可能となる。そして、ステップS3−1へ移行する。
変換部200bは、画像取得部100bにより得られた輝度画像の画像データに対して、ノイズの除去等を行い、デジタル形式の画像データである比較画像Ibに変換して生成する。このように、デジタル形式の画像データに変換することによって、その画像データに基づく画像に対して画素ごとの画像処理が可能となる。そして、ステップS3−1へ移行する。
<<ステップS2−2>>
変換部200aは、画像取得部100aにより得られた輝度画像の画像データに対して、ノイズの除去等を行い、デジタル形式の画像データである基準画像Iaに変換して生成する。このように、デジタル形式の画像データに変換することによって、その画像データに基づく画像に対して画素ごとの画像処理が可能となる。そして、ステップS3−2へ移行する。
変換部200aは、画像取得部100aにより得られた輝度画像の画像データに対して、ノイズの除去等を行い、デジタル形式の画像データである基準画像Iaに変換して生成する。このように、デジタル形式の画像データに変換することによって、その画像データに基づく画像に対して画素ごとの画像処理が可能となる。そして、ステップS3−2へ移行する。
<<ステップS3−1>>
変換部200bは、ステップS2−1において生成したデジタル形式の画像データである比較画像Ibを視差演算部300へ出力する。これによって、ブロックマッチングにおいて視差値を求めるための比較対象となる画像を得る。そして、ステップS4へ移行する。
変換部200bは、ステップS2−1において生成したデジタル形式の画像データである比較画像Ibを視差演算部300へ出力する。これによって、ブロックマッチングにおいて視差値を求めるための比較対象となる画像を得る。そして、ステップS4へ移行する。
<<ステップS3−2>>
変換部200aは、ステップS2−2において生成したデジタル形式の画像データである基準画像Iaを視差演算部300へ出力する。これによって、ブロックマッチングにおいて視差値を求めるための比較対象となる画像を得る。そして、ステップS4へ移行する。
変換部200aは、ステップS2−2において生成したデジタル形式の画像データである基準画像Iaを視差演算部300へ出力する。これによって、ブロックマッチングにおいて視差値を求めるための比較対象となる画像を得る。そして、ステップS4へ移行する。
<<ステップS4>>
視差演算部300のコスト算出部301は、基準画像Iaにおける基準画素p(x,y)の輝度値、および、基準画素p(x,y)に基づく比較画像Ibにおけるエピポーラ線EL上で、基準画素p(x,y)の位置に相当する画素からシフト量dでシフトすることにより特定される、対応画素の候補である候補画素q(x+d,y)の各輝度値(画素値)に基づいて、各候補画素q(x+d,y)のコスト値C(p,d)を算出する。具体的には、コスト算出部301は、ブロックマッチングにより、基準画像Iaの基準画素pを中心とする所定領域である基準領域pbと、比較画像Ibの候補画素qを中心とする候補領域qb(大きさは基準領域pbと同一)との非類似度をコスト値Cとして算出する。そして、ステップS5へ移行する。
視差演算部300のコスト算出部301は、基準画像Iaにおける基準画素p(x,y)の輝度値、および、基準画素p(x,y)に基づく比較画像Ibにおけるエピポーラ線EL上で、基準画素p(x,y)の位置に相当する画素からシフト量dでシフトすることにより特定される、対応画素の候補である候補画素q(x+d,y)の各輝度値(画素値)に基づいて、各候補画素q(x+d,y)のコスト値C(p,d)を算出する。具体的には、コスト算出部301は、ブロックマッチングにより、基準画像Iaの基準画素pを中心とする所定領域である基準領域pbと、比較画像Ibの候補画素qを中心とする候補領域qb(大きさは基準領域pbと同一)との非類似度をコスト値Cとして算出する。そして、ステップS5へ移行する。
<<ステップS5>>
視差演算部300のサブピクセル推定部302は、コスト算出部301により算出された、基準画像Iaにおける基準画素についての比較画像Ibにおける画素のコスト値Cの最小値に対応するシフト量d、およびそれに隣接するシフト量dにおけるコスト値Cに基づいて、サブピクセル推定を実行する。そして、サブピクセル推定部302は、サブピクセル単位の視差値dpを求める。そして、ステップS6へ移行する。
視差演算部300のサブピクセル推定部302は、コスト算出部301により算出された、基準画像Iaにおける基準画素についての比較画像Ibにおける画素のコスト値Cの最小値に対応するシフト量d、およびそれに隣接するシフト量dにおけるコスト値Cに基づいて、サブピクセル推定を実行する。そして、サブピクセル推定部302は、サブピクセル単位の視差値dpを求める。そして、ステップS6へ移行する。
<<ステップS6>>
視差演算部300の視差画像生成部303は、サブピクセル推定部302により導出されたサブピクセル単位の視差値dpに基づいて、基準画像Iaの各画素の輝度値を、その画素に対応する視差値dpで置き換えた画像である視差画像を生成する。
視差演算部300の視差画像生成部303は、サブピクセル推定部302により導出されたサブピクセル単位の視差値dpに基づいて、基準画像Iaの各画素の輝度値を、その画素に対応する視差値dpで置き換えた画像である視差画像を生成する。
以上のステップS1〜S6の流れによって物体認識装置1によるステレオマッチング処理が実行される。
<クラスタリング処理の流れ>
図20は、第1の実施形態に係る物体認識装置のクラスタリング処理の一例を示すフローチャートである。図20を参照しながら、本実施形態に係る物体認識装置1のクラスタリング処理の流れについて説明する。
図20は、第1の実施形態に係る物体認識装置のクラスタリング処理の一例を示すフローチャートである。図20を参照しながら、本実施形態に係る物体認識装置1のクラスタリング処理の流れについて説明する。
<<ステップS11>>
クラスタリング部400のエッジ抽出部401は、基準画像Iaの各画素値に対して、エッジ強度Eおよびエッジ方向θを算出し、水平エッジ画素であるか否かを判定し、水平エッジ画素で構成されたエッジ画像を生成する。そして、ステップS12へ移行する。
クラスタリング部400のエッジ抽出部401は、基準画像Iaの各画素値に対して、エッジ強度Eおよびエッジ方向θを算出し、水平エッジ画素であるか否かを判定し、水平エッジ画素で構成されたエッジ画像を生成する。そして、ステップS12へ移行する。
<<ステップS12>>
エッジ抽出部401は、エッジ画像において水平方向に隣接する水平エッジ画素を一塊として水平エッジとして抽出する。また、エッジ抽出部401は、所定の長さ以下の短い水平エッジはノイズであるものとして除去する。そして、ステップS13へ移行する。
エッジ抽出部401は、エッジ画像において水平方向に隣接する水平エッジ画素を一塊として水平エッジとして抽出する。また、エッジ抽出部401は、所定の長さ以下の短い水平エッジはノイズであるものとして除去する。そして、ステップS13へ移行する。
<<ステップS13>>
クラスタリング部400の物体検出部402は、エッジ抽出部401により抽出された水平エッジのうち特定の水平エッジを対象水平エッジとし、両端の端点周辺に縦方向に延びる左側領域631および右側領域632を設定する。そして、物体検出部402は、左側領域631内の視差点を走査して、上端点Pu1、左端点Pl、および下端点Pd1を特定し、右側領域632内の視差点を走査して、上端点Pu2、右端点Pr、および下端点Pd2を特定する。そして、ステップS14へ移行する。
クラスタリング部400の物体検出部402は、エッジ抽出部401により抽出された水平エッジのうち特定の水平エッジを対象水平エッジとし、両端の端点周辺に縦方向に延びる左側領域631および右側領域632を設定する。そして、物体検出部402は、左側領域631内の視差点を走査して、上端点Pu1、左端点Pl、および下端点Pd1を特定し、右側領域632内の視差点を走査して、上端点Pu2、右端点Pr、および下端点Pd2を特定する。そして、ステップS14へ移行する。
<<ステップS14>>
物体検出部402は、上端点Pu1および上端点Pu2のうち低い方(または高い方)、下端点Pd1および下端点Pd2のうち高い方(または低い方)、左端点Pl、および、右端点Prで囲まれた矩形(例えば、図18に示す矩形640)を、物体の検出領域として決定する。このように、物体検出部402により物体の検出領域としての矩形が決定されることにより、当該物体が検出されることになる。
物体検出部402は、上端点Pu1および上端点Pu2のうち低い方(または高い方)、下端点Pd1および下端点Pd2のうち高い方(または低い方)、左端点Pl、および、右端点Prで囲まれた矩形(例えば、図18に示す矩形640)を、物体の検出領域として決定する。このように、物体検出部402により物体の検出領域としての矩形が決定されることにより、当該物体が検出されることになる。
以上のステップS11〜S14の流れによって物体認識装置1によるクラスタリング処理が実行される。
以上のように、本実施形態に係る物体認識装置1は、輝度画像である基準画像Iaから水平エッジを抽出し、当該水平エッジの両端の縦方向に延びる左右の領域に含まれる視差値に基づいて、物体の検出領域である矩形の各端点を特定するものとしている。このように、輝度画像では水平方向のエッジが出やすく、視差画像では垂直方向に有効な視差値が並ぶ部分(垂直エッジ)が得られやすいという特性を利用して、物体の検出領域である矩形を決定している。したがって、上述の特許文献1に記載した技術のように何もない空間に物体があるものとして検出されることを抑制することが可能となり、高精度に物体を検出することが可能となる。
また、従来の物体認識処理では、路面形状を推定するためのV−Disparityマップを視差画像から生成し、推定された路面形状より上方に位置する情報のみを利用して物体を認識するためのU−DisparityマップまたはReal U−Disparityマップ等を生成するものが散見される。しかし、本実施形態に係る物体認識装置1は、V−Disparityマップを生成して路面形状を推定する必要がなく、さらに、U−DisparityマップまたはReal U−Disparityマップ等を生成する必要がないので、高速に物体を検出することが可能となる。
[第2の実施形態]
第2の実施形態に係る物体認識装置について、第1の実施形態に係る物体認識装置1と相違する点を中心に説明する。第1の実施形態では、抽出された複数の水平エッジのうち特定の水平エッジを用いて、物体の検出領域である矩形を求めるものとしていた。本実施形態では、抽出されたそれぞれの水平エッジを用いて、物体の検出領域である矩形を求める動作について説明する。なお、本実施形態に係る物体認識装置のハードウェア構成は、第1の実施形態で説明した構成と同様である。
第2の実施形態に係る物体認識装置について、第1の実施形態に係る物体認識装置1と相違する点を中心に説明する。第1の実施形態では、抽出された複数の水平エッジのうち特定の水平エッジを用いて、物体の検出領域である矩形を求めるものとしていた。本実施形態では、抽出されたそれぞれの水平エッジを用いて、物体の検出領域である矩形を求める動作について説明する。なお、本実施形態に係る物体認識装置のハードウェア構成は、第1の実施形態で説明した構成と同様である。
(物体認識装置の機能ブロックの構成および動作)
図21は、第2の実施形態に係る物体認識装置の機能ブロック構成の一例を示す図である。図22は、矩形内でスコアを求めることを説明する図である。図23は、エッジ画像で求められた矩形の群の一例を示す図である。図24は、各矩形でのスコアから生成された顕著性マップの一例を示す図である。図21〜図24を参照しながら、本実施形態に係る物体認識装置1aの機能ブロック構成および動作について説明する。
図21は、第2の実施形態に係る物体認識装置の機能ブロック構成の一例を示す図である。図22は、矩形内でスコアを求めることを説明する図である。図23は、エッジ画像で求められた矩形の群の一例を示す図である。図24は、各矩形でのスコアから生成された顕著性マップの一例を示す図である。図21〜図24を参照しながら、本実施形態に係る物体認識装置1aの機能ブロック構成および動作について説明する。
図21に示すように、本実施形態に係る物体認識装置1aは、画像取得部100a、100bと、変換部200a、200bと、視差演算部300(画像取得部の一例)と、クラスタリング部400a(画像取得部の一例)と、棄却部500と、トラッキング判定部550と、を有する。なお、画像取得部100a、100b、変換部200a、200b、視差演算部300、棄却部500およびトラッキング判定部550の機能は、第1の実施形態で説明した機能と同様である。
クラスタリング部400aは、変換部200aから受信した基準画像、視差演算部300から受信した視差画像に基づいて、視差画像に写っている物体を検出する機能部である。クラスタリング部400aは、図21に示すように、エッジ抽出部401と、物体検出部402a(検出部)と、マップ生成部403(生成部)と、を有する。なお、エッジ抽出部401の機能は、第1の実施形態のエッジ抽出部401と同様である。
マップ生成部403は、エッジ抽出部401により抽出された複数の水平エッジのそれぞれについて矩形を決定し、各矩形において人間が目で見たときに注目しやすい位置ほど高いスコアに設定し、各矩形において設定されたスコアに基づいて顕著性マップを生成する機能部である。ここで、顕著性マップとは、人間が画像を目で見たときに注目しやすい位置を画像の特徴に基づいて計算し、画像上で注目度の高さをヒートマップで示したものである。
具体的には、マップ生成部403は、エッジ抽出部401により抽出された複数の水平エッジそれぞれについて、第1の実施形態の物体検出部402と同様の方法により、各端点を特定して、当該各端点に基づく矩形を決定する。次に、マップ生成部403は、図22(a)に示すように、決定した各矩形に含まれるそれぞれの画素に対して、下記の式(6)で示すスコアSCRを設定する。当該式(6)に示すように、矩形の中心に近づくほど高いスコアを設定し、周辺部になるほど0に近づくように設定する。
図22(a)において、Cpは矩形の中心であり、Pはスコアの計算対象の画素であり、Dは画素Pと中心Cpとの距離であり、Dmaxは中心Cpとの間でとり得る最大距離である。また、式(6)において、Dminは中心Cpとの間でとり得る最小距離であり、SCRmaxは最大スコアである。この最大スコアSCRmaxは任意に設定することが可能であり、例えば、SCRmax=1とした場合、スコアSCRは1以下の値となる。以上のような方法で各矩形に含まれるそれぞれの画像に対してスコアSCRを設定した結果、ある特定の矩形の画素にスコアSCRを設定した例を、図22(b)に示す。図22(b)に示すスコア画像Isは、スコアSCRの値が大きいほど白色に近づくようにして示した画像である。
また、図23に、エッジ抽出部401により抽出された複数の水平エッジを含むエッジ画像の一例を示す。図23に示すエッジ画像Ie2では、複数の水平エッジとして水平エッジ611a〜611dが抽出され、マップ生成部403によって、水平エッジ611a〜611dそれぞれに対して矩形641a〜641dが決定された状態が示されている。そして、マップ生成部403は、矩形641a〜641dのそれぞれに対して、上述のように、スコアを設定する。また、1つの車両に対して抽出された各水平エッジについて決定された各矩形は、同じような位置で定まるため、図23に示すように、各矩形はそれぞれ重畳した状態となる。
そして、マップ生成部403は、決定した複数の矩形についてそれぞれスコアを設定した後、基準画像Iaのそれぞれの画素に対応する各矩形のスコアの値を加算していき、当該画素について最終的な合計スコアを設定したものを顕著性マップとして生成する。この顕著性マップの例を図24に示す。図24のうち、図24(a)は、顕著性マップを生成する基となる基準画像Ia1を示し、図24(b)は、基準画像Ia1で抽出された複数の水平エッジにより決定された各矩形を用いて生成された顕著性マップImを示す。図24(b)に示すように、すべての矩形を用いて顕著性マップImを生成すると、基準画像Ia1に示す車601の中心付近に対応する部分が最も値(合計スコア)が高く、周辺に行くにつれて値(合計スコア)が低くなっていく。
物体検出部402aは、マップ生成部403により生成された顕著性マップに対して、二値化処理を行い、値が残った部分に対して外接する矩形(以下、「外接矩形」と称する場合がある)を求め、当該外接矩形を物体の検出領域とする機能部である。図24(c)に、顕著性マップImを構成する画素の合計スコアに対して二値化処理を行った顕著性マップIm1の例を示す。図24(c)に示す例の場合、物体検出部402aは、二値化処理を行い、値が残った部分(楕円形部分)に対して外接する外接矩形を求める。なお、物体検出部402aにより物体の検出領域とされるのは上述の外接矩形に限定されるものではなく、顕著性マップの値(合計スコア)に基づいて定めた領域であればよい。
そして、クラスタリング部400aは、検出した物体の画像(物体検出部402aにより求められた外接矩形内の画像)(認識画像)に関する認識画像情報を棄却部500へ出力する。
なお、図21に示す物体認識装置1aのクラスタリング部400a、棄却部500およびトラッキング判定部550は、それぞれ図3に示すCPU32がプログラム(物体認識処理プログラム)を実行することによって実現される。なお、クラスタリング部400a、棄却部500およびトラッキング判定部550の一部または全部は、ハードウェア回路であるFPGA31、または、その他のハードウェア回路(ASIC等)によって実現されるものとしてもよい。
また、本発明に係る「画像処理装置」は、視差演算部300およびクラスタリング部400aを含む処理部であってもよく、当該処理部を含む情報処理部30であってもよい。
また、図21に示す物体認識装置1aの各機能部は、機能を概念的に示したものであって、このような構成に限定されるものではない。例えば、図21に示す物体認識装置1aで独立した機能部として図示した複数の機能部を、1つの機能部として構成してもよい。一方、図21に示す物体認識装置1aで1つの機能部が有する機能を複数に分割し、複数の機能部として構成するものとしてもよい。
(クラスタリング処理の流れ)
図25は、第2の実施形態に係る物体認識装置のクラスタリング処理の一例を示すフローチャートである。図25を参照しながら、本実施形態に係る物体認識装置1aのクラスタリング処理の流れについて説明する。
図25は、第2の実施形態に係る物体認識装置のクラスタリング処理の一例を示すフローチャートである。図25を参照しながら、本実施形態に係る物体認識装置1aのクラスタリング処理の流れについて説明する。
<<ステップS21>>
クラスタリング部400aのエッジ抽出部401は、基準画像Iaの各画素値に対して、エッジ強度Eおよびエッジ方向θを算出し、水平エッジ画素であるか否かを判定し、水平エッジ画素で構成されたエッジ画像を生成する。そして、ステップS22へ移行する。
クラスタリング部400aのエッジ抽出部401は、基準画像Iaの各画素値に対して、エッジ強度Eおよびエッジ方向θを算出し、水平エッジ画素であるか否かを判定し、水平エッジ画素で構成されたエッジ画像を生成する。そして、ステップS22へ移行する。
<<ステップS22>>
エッジ抽出部401は、エッジ画像において水平方向に隣接する水平エッジ画素を一塊として水平エッジとして抽出する。また、エッジ抽出部401は、所定の長さ以下の短い水平エッジはノイズであるものとして除去する。そして、ステップS23へ移行する。
エッジ抽出部401は、エッジ画像において水平方向に隣接する水平エッジ画素を一塊として水平エッジとして抽出する。また、エッジ抽出部401は、所定の長さ以下の短い水平エッジはノイズであるものとして除去する。そして、ステップS23へ移行する。
<<ステップS23>>
クラスタリング部400aのマップ生成部403は、エッジ抽出部401により抽出された複数の水平エッジそれぞれについて、両端の端点周辺に縦方向に延びる左側領域および右側領域を設定し、各領域において当該各領域に含まれる視差点に基づいて各端点を特定する。そして、ステップS24へ移行する。
クラスタリング部400aのマップ生成部403は、エッジ抽出部401により抽出された複数の水平エッジそれぞれについて、両端の端点周辺に縦方向に延びる左側領域および右側領域を設定し、各領域において当該各領域に含まれる視差点に基づいて各端点を特定する。そして、ステップS24へ移行する。
<<ステップS24>>
マップ生成部403は、特定した各端点から各水平エッジに対応する矩形をそれぞれ決定する。マップ生成部403により決定された各矩形が、物体が検出される候補位置として特定される。そして、ステップS25へ移行する。
マップ生成部403は、特定した各端点から各水平エッジに対応する矩形をそれぞれ決定する。マップ生成部403により決定された各矩形が、物体が検出される候補位置として特定される。そして、ステップS25へ移行する。
<<ステップS25>>
マップ生成部403は、決定した複数の矩形についてそれぞれスコアを設定し、基準画像Iaのそれぞれの画素に対応する各矩形のスコアの値を加算していき、当該画素について最終的な合計スコアを設定したものを顕著性マップとして生成する。そして、ステップS26へ移行する。
マップ生成部403は、決定した複数の矩形についてそれぞれスコアを設定し、基準画像Iaのそれぞれの画素に対応する各矩形のスコアの値を加算していき、当該画素について最終的な合計スコアを設定したものを顕著性マップとして生成する。そして、ステップS26へ移行する。
<<ステップS26>>
クラスタリング部400aの物体検出部402aは、マップ生成部403により生成された顕著性マップに対して、二値化処理を行い、値が残った部分に対して外接する外接矩形を求め、当該外接矩形を物体の検出領域とする。このように、物体検出部402aにより物体の検出領域としての外接矩形が決定されることにより、当該物体が検出されることになる。
クラスタリング部400aの物体検出部402aは、マップ生成部403により生成された顕著性マップに対して、二値化処理を行い、値が残った部分に対して外接する外接矩形を求め、当該外接矩形を物体の検出領域とする。このように、物体検出部402aにより物体の検出領域としての外接矩形が決定されることにより、当該物体が検出されることになる。
以上のステップS21〜S26の流れによって物体認識装置1aによるクラスタリング処理が実行される。
以上のように、本実施形態に係る物体認識装置1aは、輝度画像である基準画像Iaから水平エッジを抽出し、各水平エッジに対応する矩形をそれぞれ決定し、決定した複数の矩形についてそれぞれスコアを設定し、基準画像Iaのそれぞれの画素に対応する各矩形のスコアの値を加算していき、当該画素について最終的な合計スコアを設定したものを顕著性マップとして生成する。さらに、物体認識装置1aは、生成された顕著性マップに対して、二値化処理を行い、値が残った部分に対して外接する外接矩形を求め、当該外接矩形を物体の検出領域としている。このように、抽出された複数の水平エッジに対してそれぞれ決定される矩形を用いて、顕著性マップを生成し、外接矩形を物体の検出領域として求めることにより、特定の水平エッジを用いる第1の実施形態と比較して、物体の検出精度をさらに向上させることができる。
また、上述の各実施形態では、車両70としての自動車に搭載される物体認識装置について説明したが、これに限定されるものではない。例えば、他の車両の一例としてバイク、自転車、車椅子または農業用の耕運機等の車両に搭載されるものとしてもよい。また、移動体の一例としての車両だけでなく、ロボット等の移動体であってもよい。
また、上述の各実施形態において、物体認識装置の情報処理部30の各機能部の少なくともいずれかがプログラムの実行によって実現される場合、そのプログラムは、ROM等に予め組み込まれて提供される。また、上述の各実施形態に係る物体認識装置で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disc)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。また、上述の各実施形態の物体認識装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、上述の各実施形態の物体認識装置で実行されるプログラムを、インターネット等のネットワーク経由で提供または配布するように構成してもよい。また、上述の各実施形態の物体認識装置で実行されるプログラムは、上述した各機能部のうち少なくともいずれかを含むモジュール構成となっており、実際のハードウェアとしてはCPU32が上述のROM33からプログラムを読み出して実行することにより、上述の各機能部が主記憶装置(RAM34等)上にロードされて生成されるようになっている。
1、1a 物体認識装置
2 本体部
6 車両制御装置
7 ステアリングホイール
8 ブレーキペダル
10a、10b 撮像部
11a、11b 撮像レンズ
13a、13b 画像センサ
20a、20b センサコントローラ
30 情報処理部
31 FPGA
32 CPU
33 ROM
34 RAM
35 データI/F
36 シリアルI/F
38 シリアルバスライン
39 データバスライン
60 機器制御システム
70 車両
100a、100b 画像取得部
200a、200b 変換部
300 視差演算部
301 コスト算出部
302 サブピクセル推定部
303 視差画像生成部
400、400a クラスタリング部
401 エッジ抽出部
402、402a 物体検出部
403 マップ生成部
500 棄却部
550 トラッキング判定部
600 路面
600a 路面部
601 車
601a、601b 車部
610 水平エッジ
611a〜611d 水平エッジ
620 計算エリア
631 左側領域
632 右側領域
640 矩形
641a〜641d 矩形
701 矢印
702 強度範囲
703 水平エッジ範囲
B 基線長
C コスト値
d シフト量
dp 視差値
E 物体
EL エピポーラ線
f 焦点距離
Ia、Ia1 基準画像
Ib 比較画像
Ie、Ie1、Ie2 エッジ画像
Im、Im1 顕著性マップ
Ip 視差画像
Is スコア画像
p 基準画素
pb 基準領域
Pd1、Pd2 下端点
Pl 左端点
Pr 右端点
Pu1、Pu2 上端点
q 候補画素
qb 候補領域
S、Sa、Sb 点
Z 距離
2 本体部
6 車両制御装置
7 ステアリングホイール
8 ブレーキペダル
10a、10b 撮像部
11a、11b 撮像レンズ
13a、13b 画像センサ
20a、20b センサコントローラ
30 情報処理部
31 FPGA
32 CPU
33 ROM
34 RAM
35 データI/F
36 シリアルI/F
38 シリアルバスライン
39 データバスライン
60 機器制御システム
70 車両
100a、100b 画像取得部
200a、200b 変換部
300 視差演算部
301 コスト算出部
302 サブピクセル推定部
303 視差画像生成部
400、400a クラスタリング部
401 エッジ抽出部
402、402a 物体検出部
403 マップ生成部
500 棄却部
550 トラッキング判定部
600 路面
600a 路面部
601 車
601a、601b 車部
610 水平エッジ
611a〜611d 水平エッジ
620 計算エリア
631 左側領域
632 右側領域
640 矩形
641a〜641d 矩形
701 矢印
702 強度範囲
703 水平エッジ範囲
B 基線長
C コスト値
d シフト量
dp 視差値
E 物体
EL エピポーラ線
f 焦点距離
Ia、Ia1 基準画像
Ib 比較画像
Ie、Ie1、Ie2 エッジ画像
Im、Im1 顕著性マップ
Ip 視差画像
Is スコア画像
p 基準画素
pb 基準領域
Pd1、Pd2 下端点
Pl 左端点
Pr 右端点
Pu1、Pu2 上端点
q 候補画素
qb 候補領域
S、Sa、Sb 点
Z 距離
Claims (13)
- 物体を撮像する第1撮像部および第2撮像部によりそれぞれ撮像された撮像画像のうちいずれかを輝度画像として取得する画像取得部と、
前記第1撮像部および前記第2撮像部によりそれぞれ撮像された前記撮像画像に基づいて距離情報を演算する距離演算部と、
前記輝度画像から水平エッジを抽出するエッジ抽出部と、
前記エッジ抽出部により抽出された前記水平エッジの両端近傍の垂直方向に長い第1領域に対応する前記距離情報によって定まる第2領域に基づいて前記物体を検出する検出部と、
を備えた画像処理装置。 - 前記検出部は、前記第1領域に対応する前記距離情報から上端点および下端点を特定し、左側の前記第1領域から左端点を特定し、右側の前記第1領域から右端点を特定し、前記上端点、前記下端点、前記左端点および前記右端点で囲まれた領域を前記第2領域として決定する請求項1に記載の画像処理装置。
- 前記エッジ抽出部は、前記輝度画像において、水平方向に互いに所定間隔以内に位置する画素で構成される画素群を前記水平エッジとして抽出する請求項1または2に記載の画像処理装置。
- 前記エッジ抽出部は、前記輝度画像において、輝度値の変化量が所定値以上、かつ変化方向が所定の角度範囲内である画素から前記水平エッジを抽出する請求項1〜3のいずれか一項に記載の画像処理装置。
- 前記エッジ抽出部は、抽出した前記水平エッジのうち、該水平エッジの長さについての所定条件を満たさないものを除去する請求項1〜4のいずれか一項に記載の画像処理装置。
- 前記エッジ抽出部は、抽出した前記水平エッジのうち、該水平エッジの両端近傍の前記距離情報についての所定条件を満たさないものを除去する請求項1〜4のいずれか一項に記載の画像処理装置。
- 前記検出部は、前記第2領域の画像と、所定のテンプレートとを比較して、その比較の結果、当該第2領域と前記テンプレートとが一致しないと判定した場合、当該第2領域に対応する前記水平エッジを除去する請求項1〜6のいずれか一項に記載の画像処理装置。
- 前記エッジ抽出部により抽出された前記各水平エッジにより定まる前記各第2領域において、含まれる画素の位置に応じてスコアを設定し、当該スコアに基づいて顕著性マップを生成する生成部を、さらに備え、
前記検出部は、前記顕著性マップの画素値により定まる領域に基づいて、前記物体を検出する請求項1〜7のいずれか一項に記載の画像処理装置。 - 前記第1撮像部と、
前記第1撮像部の位置とは異なる位置に配置された前記第2撮像部と、
請求項1〜8のいずれか一項に記載の画像処理装置と、
を備えた物体認識装置。 - 請求項9に記載の物体認識装置と、
前記物体認識装置により認識された前記物体の情報に基づいて、制御対象を制御する制御装置と、
を備えた機器制御システム。 - 請求項10に記載の機器制御システムを備えた移動体。
- 物体を撮像する第1撮像部および第2撮像部によりそれぞれ撮像された撮像画像のうちいずれかを輝度画像として取得する画像取得ステップと、
前記第1撮像部および前記第2撮像部によりそれぞれ撮像された前記撮像画像に基づいて距離情報を演算する距離演算ステップと、
前記輝度画像から水平エッジを抽出するエッジ抽出ステップと、
抽出した前記水平エッジの両端近傍の垂直方向に長い第1領域に対応する前記距離情報によって定まる第2領域に基づいて前記物体を検出する検出ステップと、
を有する画像処理方法。 - コンピュータに、
物体を撮像する第1撮像部および第2撮像部によりそれぞれ撮像された撮像画像のうちいずれかを輝度画像として取得する画像取得ステップと、
前記第1撮像部および前記第2撮像部によりそれぞれ撮像された前記撮像画像に基づいて距離情報を演算する距離演算ステップと、
前記輝度画像から水平エッジを抽出するエッジ抽出ステップと、
抽出した前記水平エッジの両端近傍の垂直方向に長い第1領域に対応する前記距離情報によって定まる第2領域に基づいて前記物体を検出する検出ステップと、
を実行させるためのプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018050247A JP2019160251A (ja) | 2018-03-16 | 2018-03-16 | 画像処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラム |
| EP19162218.2A EP3540643A1 (en) | 2018-03-16 | 2019-03-12 | Image processing apparatus and image processing method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018050247A JP2019160251A (ja) | 2018-03-16 | 2018-03-16 | 画像処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2019160251A true JP2019160251A (ja) | 2019-09-19 |
Family
ID=65801872
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018050247A Withdrawn JP2019160251A (ja) | 2018-03-16 | 2018-03-16 | 画像処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラム |
Country Status (2)
| Country | Link |
|---|---|
| EP (1) | EP3540643A1 (ja) |
| JP (1) | JP2019160251A (ja) |
Families Citing this family (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116194832B (zh) * | 2020-09-23 | 2026-04-14 | 索尼集团公司 | 信息处理装置、信息处理方法和程序 |
| CN114268621B (zh) * | 2021-12-21 | 2024-04-19 | 东方数科(北京)信息技术有限公司 | 基于深度学习的数字仪表读表方法及装置 |
| CN114814803B (zh) * | 2022-04-22 | 2025-03-14 | 福思(杭州)智能科技有限公司 | 一种车辆的视觉测距方法、装置及存储介质 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06273170A (ja) * | 1993-03-18 | 1994-09-30 | Mitsubishi Electric Corp | 車両用障害物検出装置 |
| JP2001331788A (ja) * | 2000-05-22 | 2001-11-30 | Mitsubishi Electric Corp | 車両検出装置 |
| JP2014235750A (ja) * | 2013-06-03 | 2014-12-15 | 株式会社リコー | 目標検出方法及び目標検出装置 |
| JP2015219773A (ja) * | 2014-05-19 | 2015-12-07 | 本田技研工業株式会社 | 物体検出装置、運転支援装置、物体検出方法、および物体検出プログラム |
| JP2017004480A (ja) * | 2015-06-04 | 2017-01-05 | オムロン株式会社 | 顕著性情報取得装置及び顕著性情報取得方法 |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4123138B2 (ja) | 2003-11-21 | 2008-07-23 | 株式会社日立製作所 | 車両検知方法及び車両検知装置 |
-
2018
- 2018-03-16 JP JP2018050247A patent/JP2019160251A/ja not_active Withdrawn
-
2019
- 2019-03-12 EP EP19162218.2A patent/EP3540643A1/en not_active Withdrawn
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06273170A (ja) * | 1993-03-18 | 1994-09-30 | Mitsubishi Electric Corp | 車両用障害物検出装置 |
| JP2001331788A (ja) * | 2000-05-22 | 2001-11-30 | Mitsubishi Electric Corp | 車両検出装置 |
| JP2014235750A (ja) * | 2013-06-03 | 2014-12-15 | 株式会社リコー | 目標検出方法及び目標検出装置 |
| JP2015219773A (ja) * | 2014-05-19 | 2015-12-07 | 本田技研工業株式会社 | 物体検出装置、運転支援装置、物体検出方法、および物体検出プログラム |
| JP2017004480A (ja) * | 2015-06-04 | 2017-01-05 | オムロン株式会社 | 顕著性情報取得装置及び顕著性情報取得方法 |
Non-Patent Citations (1)
| Title |
|---|
| 久保山英生, 外1名: ""連続画像からのトンネル内における重交通流計測"", 電子情報通信学会論文誌, vol. 第J85-D-II巻, 第2号, JPN6021049403, 1 February 2002 (2002-02-01), JP, pages 210 - 218, ISSN: 0004661444 * |
Also Published As
| Publication number | Publication date |
|---|---|
| EP3540643A1 (en) | 2019-09-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6795027B2 (ja) | 情報処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラム | |
| JP6614247B2 (ja) | 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム | |
| JP6597792B2 (ja) | 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム | |
| EP3545464B1 (en) | Information processing device, imaging device, equipment control system, mobile object, information processing method, and computer-readable recording medium | |
| JP6516012B2 (ja) | 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム | |
| JP6597795B2 (ja) | 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム | |
| JP6743882B2 (ja) | 画像処理装置、機器制御システム、撮像装置、画像処理方法及びプログラム | |
| JP6907513B2 (ja) | 情報処理装置、撮像装置、機器制御システム、情報処理方法およびプログラム | |
| JP2017151535A (ja) | 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム | |
| JP6992356B2 (ja) | 情報処理装置、撮像装置、機器制御システム、移動体、情報処理方法およびプログラム | |
| JPWO2017099199A1 (ja) | 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム | |
| JP2019160251A (ja) | 画像処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラム | |
| WO2017154305A1 (ja) | 画像処理装置、機器制御システム、撮像装置、画像処理方法、及び、プログラム | |
| JP7062904B2 (ja) | 情報処理装置、撮像装置、機器制御システム、移動体、情報処理方法およびプログラム | |
| JP2017167970A (ja) | 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム | |
| JP6969245B2 (ja) | 情報処理装置、撮像装置、機器制御システム、移動体、情報処理方法、及び、情報処理プログラム | |
| EP2919191B1 (en) | Disparity value deriving device, equipment control system, movable apparatus, robot, and disparity value producing method | |
| JP6429101B2 (ja) | 画像判定装置、画像処理装置、画像判定プログラム、画像判定方法、移動体 | |
| JP7087499B2 (ja) | 画像処理装置、物体認識装置、機器制御システム、移動体、画像処理方法およびプログラム | |
| WO2018097269A1 (en) | Information processing device, imaging device, equipment control system, mobile object, information processing method, and computer-readable recording medium | |
| JP6943092B2 (ja) | 情報処理装置、撮像装置、機器制御システム、移動体、情報処理方法、及び、情報処理プログラム | |
| JP6828332B2 (ja) | 画像処理装置、物体認識装置、機器制御システム、画像処理方法およびプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201210 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211125 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211214 |
|
| A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20220426 |