以下、添付の図面を参照して、発明の実施形態を説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
図1は、発明の実施形態に対応する監視システム10の構成例を示す図である。当該監視システム10は、ネットワークカメラ100、情報処理装置200、データベース装置300、受付端末400、情報表示装置500がネットワーク回線であるLAN600によって相互接続されて構成されている。図1に示した監視システム10の構成要素は、あくまで一例であって、これら以外の構成要素が更に追加されても良い。以下、各構成要素について説明する。
まず、ネットワークカメラ100は、撮像センサ部101、現像処理部102、符号化部103、人物検出処理部104、LANインタフェース(I/F)部105を含むように構成することができる。撮像センサ部101は、撮像面に結像された光像を光電変換してアナログ画像信号を出力するCMOS等の撮像素子、及び、アナログ画像信号をデジタル画像信号に変換するA/D変換器を含んで構成される。現像処理部102は、撮像センサ部101から出力されたデジタル画像信号に対して、所定の現像処理を実行する。現像処理には、例えば、ディベイヤ処理、ホワイトバランス処理、階調変換処理、エッジ強調補正処理、キズ補正、ノイズ除去、拡大縮小処理、YCbCr形式への色変換などの処理を含むことができる。
符号化部103は、現像処理部102が出力したデジタル画像信号を圧縮・符号化して、情報処理装置200に提供する配信用の画像データを生成する。生成される画像データには、ネットワークカメラ100の識別情報(カメラID)、設置場所の情報(位置情報)、撮影時刻情報等が含まれる。符号化部103は画像データ生成時にフレームレートの設定も行う。ここで、配信用の画像圧縮方式は、例えば、H.264、H.265、MPEGまたはJPEGなどの規格に基づくことができる。さらに、mp4やavi形式などを含む任意の形式の画像データを生成しても良い。
人物検出処理部104は、現像処理部102から出力されたデジタル画像を解析して、デジタル画像に含まれる人物に関する情報を検出する。検出対象となる人物情報は、例えば、顔、上半身、下半身、全身、後姿等の画像データが含まれる。当該画像データは、撮像画像から人物の含まれる領域を抽出した画像データであってもよい。領域を抽出する場合には、当該領域の撮像画像における座標情報が画像データに添付される。また人物情報は、画像データそのものではなく、当該画像から所定の演算に基づいて得られた特徴量であってもよいし、画像データと特徴量との両方を含んでいてもよい。人物情報が画像データを含む場合、当該画像データは、符号化部103で行うのと同様に圧縮符号化処理が施され、例えば静止画の場合にはJPEG画像データが含まれる。検出された人物情報及び撮像画像内におけるその座標情報は、当該人物を撮影したネットワークカメラ100のカメラID、位置情報、及び撮影時刻情報等と共に、情報処理装置200に提供される。ここで生成される情報を「人物検出情報」という。
ここで、人物検出処理部104は、ネットワークカメラ100が備えている構成以外に、外部装置、例えば情報処理装置200が備えていても良い。その場合、人物検出処理部104が実行する機能の一部または全部を情報処理装置200が実行し、残りの機能をネットワークカメラ100で実行してもよい。
LAN I/F部105は、符号化部103から出力された画像データや、人物検出処理部104が生成した人物検出情報を、LAN600を介して情報処理装置200に送信するための通信インタフェースである。LAN I/F部105は、例えば、NFSやCIFSなどのネットワークファイルシステム、または、UDPやTCPなどのネットワーク通信プロトコルを使用して、通信相手との間でデータのやり取りの調整を行う。
次に、情報処理装置200の構成について説明する。情報処理装置200は、LAN インタフェース(I/F)部201、復号部202、認証部203、データベース管理部204、判定部205、通知部(出力部)206を含み、相互にシステムバス207で接続されるように構成することができる。
LAN I/F部201は、LAN600を介してネットワークカメラ100や情報表示装置500等と通信する。復号部202はネットワークカメラ100からLAN600を介して取得した人物検出情報に含まれる画像データを、伸張し復号してデジタル画像信号を復元する。復号されたデジタル画像信号は認証部203に出力される。ここで、情報処理装置200が人物検出処理部104を有するような実施形態では、人物検出処理部104がシステムバス207と接続されるように設けることができる。人物検出処理部104は、復号部202が復号した画像データから人物に関する情報を検出し、人物検出情報を認証部203に提供する。
認証部203は、人物検出処理部104が生成した人物検出情報と、画像データベース330や不審人物データベース340に登録されている後述の人物特定用情報とに基づき、撮像された人物を特定するための認証処理を行う。この認証処理の詳細は後述する。データベース管理部204は、データベース装置300のデータベース310から340のそれぞれの登録情報を管理する。例えば、各データベースの登録情報を更新し、各データベースから登録情報を抽出し、必要に応じて各処理部に提供するといった処理を行う。判定部205は、データベース装置300の各データベースの登録情報に基づいて、共有エリアの滞在人物のうちで不審人物に該当する人物を特定するための処理を行う。通知部206は、認証部203、判定部205における判定結果に基づき、情報表示装置500に対して不審人物に関する情報の通知(出力)を行う。通知情報の詳細は、図7及び図8を参照して後述する。
データベース装置300は、情報処理装置200が本実施形態に対応する処理を実行するに際して参照する情報が登録されたデータベースであって、来場者データベース310、時間情報データベース320、画像データベース330、不審人物データベース340等を含むことができる。データベース装置300は情報処理装置200に接続される構成となっているが、ネットワークインターフェースを備え、LAN600上に接続されていてもよい。その場合、情報処理装置200とデータベース装置300との通信は、LAN I/F部201を介して行われる。
来場者データベース310は、本監視システム10の監視対象区域に滞在する来場者の情報を登録しているデータベースである。時間情報データベース320は、来場者が監視対象区域内の所定の位置で確認された時刻等の時間情報を登録するデータベースである。画像データベース330は、本監視システム10で監視対象区域内に配置されたネットワークカメラ100が撮像した画像を、来場者データベース310が登録する来場者の情報と関連づけて登録しているデータベースである。不審人物データベース340は、本監視システム10において、来場者の行動を監視した結果、不審人物と認定された人物に関する情報を、過去の情報を含めて登録しているデータベースである。これらのデータベースにおけるデータ構造の詳細は図3を参照して後述する。
受付端末400は、監視対象区域に来場した来場者が、受付を行う際に利用する端末装置である。来場者は事前に来場の予約をしておくことができ、自分を特定するための所定の情報(社会保障に係る管理番号、IDカード)を提示して、入場するために必要な受付手続を行うことができる。受付端末400は、受付手続が完了すると、受付を行った来場者の人物を特定し、人物情報を受付完了情報と共に情報処理装置200に送信する。人物情報は、例えば、IDカード等に基づき、当該人物の氏名やID番号(社会保障に係る管理番号等の個人を識別可能な番号)を特定して情報処理装置200に送信することができる。
情報表示装置500は、情報処理装置200から送信された情報を表示する装置であって、例えばパーソナルコンピュータ(PC)やタブレット端末、スマートフォン端末等により実現することができる。情報表示装置500は、LAN600との接続を有線、無線のうち、いずれにおいて行ってもよい。無線は、例えばIEEE802.11の無線LANの規格に従うことができる。以下に説明する本実施形態では、情報表示装置500を本監視システム10が設置された施設内を警備する警備員が、情報処理装置200からの通知を確認するための表示装置としてのパーソナルコンピュータとする。
図1に示す監視システム10構成において、ネットワークカメラ100の台数は1台以上の任意の数とすることができ、台数に限定はない。情報処理装置200、データベース装置300及び情報表示装置500は、単一の装置により実現される場合だけでなく、それぞれ複数の装置が協働して各機能を実現してもよい。
本実施形態の監視システムは、図2(A)に示すような監視対象区域に対して適用することができる。監視対象区域は、共有エリア1と所定エリア2とに大きく区画されている。共有エリア1は、事前予約や受付等をしなくても任意の人物により自由にアクセスが可能なエリアであって、所定エリア2は、受付をした来場者のみが入室(或いは「入場」、以下同様)を許可されるエリア(部屋、或いは、当該部屋につながる通路等)である。図1では、所定エリア2は1つのエリアとして示しているが、複数の部屋に区画されていても良い。
また、共有エリア1及び所定エリア2を監視する監視員が常駐する監視室7が別途設けられる。監視室7は、共有エリア1や所定エリア2との関係でどのような場所に設置されるかは、実際の実施の態様に依存するものであって発明の実施そのものには特に影響がない。
監視対象区域に入場するためには入退場口3を通る必要があり、入退場口3にはネットワークカメラ100が設置されていて、入退場口3を通過する人物の画像を撮像して、撮像画像に基づいて人物特定を行うことができる。共有エリア1内には待合所4と受付5とが設置されており、来場者は待合所4において受付や入室まで待機することができる。共有エリア1にはネットワークカメラ100が複数台設置されており、来場者の行動を監視することができる。ネットワークカメラ100は、待合所4を含めて共有エリア1内で待機している来場者の様子を撮像し、当該撮像画像に基づいて情報処理装置200は不必要に長い時間滞在している来場者がいないかどうかを判定することができる。来場者は、受付5において所定エリア2に入室するための受付手続を行う。その際の様子もネットワークカメラ100により撮像され、受付手続を行った人物を特定することができる。
来場者が所定エリア2に入室するためには入退室口6を通過しなければならず、監視対象区域は所定エリア2には共有エリア1からしか入室できない構造となっている。入退室口6には、ネットワークカメラ100が設置されており、入室、退室(或いは「退場」、以下同様)する来場者を撮像し、入室、退室した人物を特定することができる。入退室口6は、手続を行なったものだけが通過できるような通用ゲートを設けても良い。当該通用ゲートを利用することで入室、退室が行われたかどうかを確実に検知することができると共に、正確な時刻を特定することが可能となる。同様の通用ゲートは入退場口3に設けることもできる。所定エリア2内にもネットワークカメラ100が設置されており、所定エリア2内での来場者の行動を監視することができる。
共有エリア1に不必要に長時間滞在している人物が検出された場合は、監視室7内の情報表示装置500を利用して当該人物の存在が監視員に対して通知される。
次に、本実施形態に対応する監視システム10を構成する情報処理装置200の概略構成を説明する。図2(B)は、情報処理装置200のハードウェア構成の一例を示すブロック図である。上述した情報処理装置としてのデータベース装置300、受付端末400及び情報表示装置500も、同様或いは同等のハードウェア構成として構成しても良い。
図2(B)において、CPU210は、ハードディスク装置(以下、HDと呼ぶ)215に格納されているアプリケーションプログラム、オペレーティングシステム(OS)や制御プログラム等を実行し、RAM212にプログラムの実行に必要な情報、ファイル等を一時的に格納する制御を行う。また、ネットワークカメラ100から提供され、RAM212に記憶された検出人物情報、及び、データベース装置300から取得した情報に基づき本実施形態に対応する処理を実行する。さらには、インタフェース(I/F)218を介した外部の情報表示装置500とのデータ送受信を制御する。なお、後述する図5から図7における処理もCPU210が対応する処理プログラムを実行することにより装置全体を制御して実現される。
ROM211は、内部に基本I/Oプログラムの他、所定の処理を実行するアプリケーションプログラム等の各種データを記憶する。RAM212は各種データを一時記憶し、CPU210の主メモリ、ワークエリア等として機能する。また、ネットワークカメラ100やデータベース装置300から受信した情報を一時的に記憶する。
外部記憶ドライブ213は、記録媒体へのアクセスを実現するための外部記憶ドライブであり、メディア(記録媒体)214に記憶されたプログラム等を本コンピュータシステムにロードすることができる。尚、メディア214は、例えば、フロッピー(登録商標)ディスク(FD)、CD-ROM、CD-R、CD-RW、PCカード、DVD、Blu-ray(登録商標)、ICメモリカード、MO、メモリスティック等を利用することができる。
外部記憶装置215は、本実施形態では大容量メモリとして機能するHD(ハードディスク)を用いている。HD215には、アプリケーションプログラム、OS、制御プログラム、関連プログラム等が格納される。なお、ハードディスクの代わりに、フラッシュ(登録商標)メモリ等の不揮発性記憶装置を用いても良い。
指示入力装置216は、キーボードやポインティングデバイス(マウス等)、タッチパネル等がこれに相当する。出力装置217は、指示入力装置216から入力されたコマンドや、それに対する情報処理装置200の応答出力等を出力する。出力装置217にはディスプレイ、スピーカ、ヘッドフォン端子等を含むことができる。システムバス219は、情報処理装置200内のデータの流れを司る。
インタフェース(以下、I/Fという)218は、外部装置とのデータのやり取りを仲介する役割を果たす。具体的に、I/F218は、無線通信モジュールを含むことができ、当該モジュールはアンテナシステム、RF送受信器、1つ以上の増幅器、同調器、1つ以上の発振器、デジタル信号プロセッサ、CODECチップセット、加入者識別モジュールカード、メモリなどを含む、周知の回路機構を含むことができる。また、有線接続のための有線通信モジュールを含むことができる。有線通信モジュールは1つ以上の外部ポートを介して他のデバイスとの通信を可能とする。また、データを処理する様々なソフトウェアコンポーネントを含むことができる。外部ポートは、イーサーネット、USBやIEEE1394等を介して、直接的に、又はネットワークを介して間接的に他のデバイスと結合する。尚、以上の各装置と同等の機能を実現するソフトウェアにより、ハードウェア装置の代替として構成することもできる。
本実施形態に対応する処理を実行するために対応するプログラムを動作させる度に、既にプログラムがインストールされているHD215からRAM212にロードするようにしてもよい。また、本実施形態に係るプログラムをROM211に記録しておき、これをメモリマップの一部をなすように構成し、直接CPU210で実行することも可能である。さらに、メディア214から対応プログラム及び関連データを直接RAM212にロードして実行させることもできる。
次に、図3を参照して、データベース装置300における各データベースのデータ構造について説明する。まず、図3(A)は、来場者データベース310のデータ構造の一例を示すテーブルである。来場者データベース310には、本監視システム10の監視対象区域に来場した来場者に関する情報として、ID311、氏名312、ID番号313、受付314、入室315、退室316、不審人物フラグ317の各情報がそれぞれ登録されている。
ID311には、データベース内で個々の来場者を一意に特定可能とする識別情報が登録される。氏名312は、来場者が施設の利用者として登録済みの場合に、その氏名が登録される。ID番号313は、登録済みの来場者に割り当てられたID番号の情報が登録される。例えば、施設の利用者として登録されている人物には、人物名とID番号とが、利用履歴と関連づけて登録されている。人物の特定は、受付において提示されるIDカードに基づいて行うことができる。受付けが済んだ来場者については、特定された人物情報に基づいて氏名とID番号が登録される。なお、人物情報(氏名、ID番号、来場履歴、画像等)を管理するデータベースは別途用意することができる。
受付314は、当該来場者が受付5において受付手続を済ませたかどうかを示す情報が登録される。また、入室315には、当該来場者が共有エリア1から所定エリア2に入室したかどうかを示す情報が登録される。退室316には、当該来場者が所定エリア2を退室し、共有エリア1に戻ったかどうかを示す情報が登録される。不審人物フラグ317には、当該来場者が不審人物に該当するかどうかを示す情報が登録される。当該フラグ情報は、来場者の不審度のランクを示すように設定されても良い。例えば、3段階で不審度をランク付けする場合に、フラグ情報が0の場合、当該来場者は不審者ではなく、1、2、3と数字が大きくなるほどに不審度が高くなるようにしても良い。図3(A)に示した情報はあくまで一例であって、ここに示す以外の情報を来場者の情報として登録することができる。
次に、図3(B)は、時間情報データベース320のデータ構造の一例を示すテーブルである。時間情報データベース320は、監視対象区域内に設置されたネットワークカメラ100での撮像時刻等に基づき、来場者データベース310で管理する来場者が所定の行動を行った時刻を登録している。
時間情報データベース320は、来場者の時間に関する情報を管理するために、ID321、入場時刻322、受付時刻323、入室時刻324、退室時刻325、退場時刻326、利用可能時間帯327、現在位置328、共有エリア滞在時間329を登録する。ID321には、各来場者を一意に特定可能とする識別情報が登録される。同一の来場者には、来場者データベース310で登録されたID311と同じ識別情報が割り当てられる。入場時刻322には、来場者が監視対象区域の入退場口3から入場した時刻が登録される。入場時刻は、入場の際に撮像された撮像画像の撮像時刻に基づき決定することができる。或いは、入場ゲートがある場合にはゲート通過時刻により決定してもよい。受付時刻323には、来場者が受付5において受付手続を行った時刻が登録される。受付時刻は、受付時に撮像された撮像画像の撮像時刻、或いは、受付を行った時刻に基づき、決定することができる。本実施形態において、受付の手続は受付担当者により行う人的な手続であっても、受付端末400を利用した人を介さずに行う手続であってもよい。
入室時刻324には、来場者が共有エリア1から所定エリア2に移動して、所定エリア2に入室した時刻が登録される。入室時刻は、入退室口6を来場者が通過する際に撮像された撮像画像の撮像時刻、または、入退室口6にゲートが設けられている場合には当該ゲートの通過時刻に基づき決定することができる。退室時刻325には、来場者が所定エリア2から共有エリア1に移動して、所定エリア2から退室した時刻が登録される。退室時刻は、入退室口6を来場者が通過する際に撮像された撮像画像の撮像時刻、または、入退室口6にゲートが設けられている場合には当該ゲートの通過時刻に基づき決定することができる。
利用可能時間帯327には、来場者に対して所定エリア2の利用(滞在)を許可する時間帯の情報が登録される。例えば、来場者に14時から15時の1時間の間において所定エリアに入ることを許可する場合には、「14時から15時」という時間帯の情報が登録される。利用可能時間帯の情報は来場者の受付時に指定されて登録されてもよい。現在位置328には、監視対象区域内における来場者の現在位置の情報が登録される。現在位置は、例えば当該来場者の最新の撮像画像を生成したネットワークカメラ100の位置に基づいて決定することができる。共有エリア滞在時間329には、来場者が共有エリア1に滞在している滞在時間が登録される。
また、図3(B)に示した情報はあくまで一例であって、ここに示す以外の情報を時間情報として登録することができる。
次に、図3(C)は、画像データベース330のデータ構造の一例を示すテーブルである。画像データベース330は、監視対象区域内に設置されたネットワークカメラ100が撮像した、来場者データベース310で管理されている来場者の画像を登録している。画像データベース330は、ID331、人物特定用情報332、入場画像333、受付画像334、入室画像335、退室画像336、退場画像337、最新画像338を登録する。
ID331には、各来場者を一意に特定可能とする識別情報が登録される。同一の来場者には、来場者データベース310で登録されたID311と同じ識別情報が割り当てられる。人物特定用情報332には、来場者を特定するために利用可能な情報が登録される。例えば、撮像画像において人物を特定するために利用可能な来場者の顔の特徴情報(顔画像、及び、顔画像から抽出された特徴量を含む)を登録することができる。当該特徴情報は、本監視システム10において過去に撮影され、人物特定に使用した顔画像の画像データを含んでいてもよい。また、本実施形態では、顔だけでなく、全身から得られる特徴を利用してもよく、例えば、顔画像の他、全身画像、上半身、下半身等の画像、或いは、そこから抽出された特徴量を含めることができる。さらに、画像データ以外の利用者の個人情報(生年月日、住所、年齢、性別、職業等)を登録することもできる。この人物特定用情報を利用した画像認識処理により、監視対象区域内のネットワークカメラ100で撮影された画像において個々の来場者の人物特定が可能となる。
入場画像333には、来場者が監視対象区域の入退場口3から入場する際に撮像された画像が登録される。受付画像334には、来場者が受付を行った際に撮像された画像が登録される。入室画像335には、来場者が入退室口6を通過して所定エリア2に入室する際に撮像された画像が登録される。退室画像336には、来場者が入退室口6を通過して所定エリア2から退室する際に撮像された画像が登録される。退場画像337には、来場者が監視対象区域の入退場口3から退場する際に撮像された画像が登録される。最新画像338には、来場者を撮像した最新の画像が登録される。
次に、図3(D)は、不審人物データベース340のデータ構造の一例を示すテーブルである。不審人物データベース340は、監視対象区域内において不審な行動をしていると判定された来場者の情報を登録している。不審人物データベース340は、ID341、氏名342、ID番号343、日時344、共有エリア滞在時間345、人物特定用情報346を登録する。
ID341には、不審人物として登録された来場者を一意に特定可能とする識別情報が登録される。来場者データベース310で登録されたID311とは異なる識別情報が割り当てられてよい。例えば、同一の人物が監視対象区域を複数回訪れ、その都度不審人物と判定されている場合には、当該人物についてそれぞれの判定結果に従い複数回の登録が行われるが、その際には同一の識別情報を割り当てる。
氏名342、ID番号343には、当該不審人物が監視対象区域の利用登録を行なっている場合には、当該人物の氏名と割り当てられたID番号とがそれぞれ登録される。仮に登録を行っていない人物の場合には、氏名342、ID番号343は空欄でよい。日時344には、当該人物が不審人物と判定された日付の他、総滞在時間、滞在時間帯、その日の利用可能時間帯の情報等の時間情報が登録される。共有エリア滞在時間345には、不審と判定された際に当該人物が共有エリアに滞在していた時間の情報が登録される。時間情報には、滞在時間の長さ、滞在時間帯の情報等を含むことができる。
人物特定用情報346には、当該人物を特定するために利用可能な情報が登録される。人物特定用情報として、例えば、画像データベース330に登録された人物特定用情報332のように、不審と判定した際に当該人物を特定するために利用した特徴情報を登録することができる。人物特定用情報346は、該当人物が次回監視対象区域を訪れた際に、入場時点で不審人物として登録されている人物かどうかを判定するために利用することができる。また、図3(D)に示した情報はあくまで一例であって、ここに示す以外の情報を不審人物情報として登録することができる。
次に、本実施形態の監視システム10における動作の詳細を説明する。図4は、発明の実施形態に対応する監視システム10におけるネットワークカメラ100が実行する処理の一例を示すフローチャートである。
まず、S401において、ネットワークカメラ100は、その設置位置において撮像対象となる所定の空間或いは領域の画像を撮像センサ部101が撮像し、現像処理部102にデジタル画像信号を出力する。現像処理部102は所定の現像処理を行った後、処理結果のデジタル画像信号を符号化部103及び人物検出処理部104に出力する。符号化部103は、入力されたデジタル画像信号を圧縮・符号化して画像データを生成し、LAN I/F部105を介して情報処理装置200に送信する。
続くS402では、人物検出処理部104が処理対象のデジタル画像信号(以下、単に処理対象画像という。)に基づき人物検出を行う。ここでは人物検出処理部104が人物の顔を検出することにより人物検出を行う場合を説明する。顔の検出方法は公知の手法を用いることができる。また、人物の顔を検出することができた場合、処理はS403に進む。一方、人物の顔を検出することができなかった場合、処理はS401に戻る。
S403では、人物検出処理部104は、検出した人物についての情報(検出人物情報)を、LAN I/F部105を介して情報処理装置200に送信する。このときの検出人物情報のデータ構造の一例を図4(B)に示す。
検出人物情報410は、当該情報を識別するための識別情報であるID411、画像を検出したネットワークカメラ100を識別するためのカメラID412、ネットワークカメラ100の位置情報413、画像の撮像時刻を示す時刻情報414を含む。また、検出した顔画像、或いは、顔画像から抽出した所定の特徴量を示す人物情報415を含む。人物情報415が画像データを含む場合、静止画像としてJPEG等の形式で圧縮符号化しても良い。また、顔画像の代わりに処理対象のデジタル画像信号において人物の顔が位置する座標の情報を検出人物情報410に含めてもよい。検出人物情報410は、1枚の撮像画像中に複数の人物が検出された場合には、人物毎に生成してもよいし、或いは、複数の人物についてまとめて1つの情報を生成してもよい。その際、人物毎に画像中に写っている位置を特定するための座標情報が含まれる。
その後、S401に戻って処理を繰り返す。以上の処理によりネットワークカメラ100では、撮像対象の領域の画像データを情報処理装置200に送信すると同時に、人物検出処理を行って、人物が検出された場合には当該人物に関する検出人物情報410を情報処理装置200に送信することができる。
人物検出処理部104が情報処理装置200に含まれるような実施形態では、上記S402及びS403の処理はネットワークカメラ100側では実行せず、情報処理装置200において実行する。具体的に、人物検出処理部104は、復号部202が復号した画像データに対してS402に対応する人物検出処理を実行し、人物を検出した場合には、検出人物情報を認証部203に提供する。
次に、図5を参照してネットワークカメラ100から受信した検出人物情報410に基づき情報処理装置200が実行する処理について説明する。図5は、発明の実施形態に対応する監視システム10における情報処理装置200が実行する処理の一例を示すフローチャートである。以下の説明では、人物検出処理をネットワークカメラ100で行なう場合を説明するが、人物検出処理を情報処理装置200側で行っても良い。その場合、検出人物情報410は、情報処理装置200内に設けられた人物検出処理部104が提供するものとして読み替えればよい。
まず、S501において、情報処理装置200は、ネットワークカメラ100から撮像画像及び検出人物情報410を取得する。続くS502では、認証部203が、認証処理を実行する。具体的には、取得した検出人物情報410に基づきデータベース装置300を検索して、人物を特定する処理を行うと共に、各データベースの登録情報を更新する。S502における認証処理の詳細は図6のフローチャートを参照して後述する。
情報処理装置200は、S501及びS502における処理を、監視対象区域内に設置されたネットワークカメラ100から取得した撮像画像及び検出人物情報410のそれぞれについて実行する。続くS503以降の処理については、共有エリア1に現在滞在していると認められる来場者について実行する。共有エリア1に滞在している来場者は、時間情報データベース320において現在位置328が共有エリア1を示している来場者である。
S503では、判定部205が共有エリア1における滞在人物に該当する来場者の情報をデータベース装置300から取得する。続くS504では、判定部205が取得した登録情報に基づき、検出された来場者が既に受付を済ませているかどうかを判定する。例えば、来場者データベース310の受付314が済になっているかどうかにより判定することができる。受付をまだ済ませていないと判定した場合、処理はS505に進む。受付を既に済ませていると判定した場合、処理はS506に進む。
S505では、判定部205が共有エリア1の滞在時間が所定時間以上であるかを判定する。当該処理は、例えば、時間情報データベース320の共有エリア滞在時間329が、所定時間以上の値になっているかどうかを判定することで実行することができる。この時、所定時間をTh1とすることができる。Th1の大きさは、受付をするために想定される待機時間を考慮して決定することができる。S505において、所定時間が経過していると判定された場合には、処理はS510に進む。一方、所定時間が経過していないと判定された場合には、処理はS511に進む。
S506では、入退室の記録があるか否かを判定する。例えば、来場者データベース310の入室315、退室316が共に済になっているかどうかにより判定することができる。入退室の記録があると判定した場合、処理はS507に進む。入退室の記録がない判定した場合、処理はS508に進む。S507では、判定部205が共有エリア1の滞在時間が所定時間以上であるかを判定する。当該処理は、例えば、時間情報データベース320の共有エリア滞在時間329が、所定時間以上の値になっているかどうかを判定することで実行することができる。この時、所定時間をTh2とすることができる。Th2の大きさは、受付をするために想定される待機時間を考慮したTh1以下の時間とすることができる。S507において、所定時間が経過していると判定された場合には、処理はS510に進む。一方、所定時間が経過していないと判定された場合には、処理はS511に進む。
S508では、判定部205が当該来場者に割り当てられた利用可能時間が既に開始しているか否かを判定する。例えば、時間情報データベース320の利用可能時間帯327の情報に基づき判定することができる。既に、利用可能時間が開始されている場合、処理はS509に進む。一方、利用可能時間が開始されていない場合、処理はS511に進む。続くS509では、判定部205が利用可能時間の開始時刻より所定時間以上が経過しているか否かが判定される。当該処理は、例えば、現在時刻と利用可能時間の開始時刻との差分が、所定時間以上の値になっているかどうかを判定することで実行することができる。この時、所定時間をTh3とすることができる。Th3は、Th1やTh2以下の時間とすることができる。S509において、所定時間以上が経過していると判定された場合、処理はS510に進む。一方、所定時間以上が経過していないと判定された場合、処理はS511に進む。
S510では、判定部205はデータベース管理部204を制御して、該当する来場者を不審人物として、来場者データベース310の不審人物フラグに不審人物であることを示す情報を登録する。このとき、判定の根拠になった共有エリア1における滞在時間の長さに応じて、複数の段階で不審度を登録しても良い。例えば、30分、1時間、2時間の3段階として、30分を超えれば不審度1、1時間を超えれば不審度2、2時間を超えれば不審度3とすることができる。但し、ここに示すランク付けはあくまで一例であって、実施形態に応じたランク付けが可能である。
また、不審人物データベース340に当該人物の情報を登録する。具体的に、当該人物の氏名342、ID番号343を来場者データベース310から取得し、日時344、共有エリア滞在時間345を時間情報データベース320から取得する。また人物特定用情報346を画像データベース330から取得する。
S511では、判定部205が共有エリア1に滞在する来場者の全てについてS503からS510までの処理を実行したか否かを判定する。未処理の来場者がいる場合には、S503に戻って処理を繰り返す。一方、未処理の来場者がいない場合には、S501に戻って処理を繰り返す。
なお、不審人物であるかどうかを判定する際、所定エリア2内の人物の目的地に割り当てられた機密度を考慮しても良い。例えば、機密度の高いエリアへ入ることが許可されている人物は信頼性が高いと言えるので、所定時間が経過したかどうかの閾値Th1からTh3の値を大きく取ることで、不審人物と判定される可能性を低くすることができる。
以上により、共有エリア1に滞在する来場者の全員について不審度を判定して、不審人物を特定することができる。
次に、図6を参照して、S502における認証処理について説明する。図6は、発明の実施形態に対応する認証処理の一例を示すフローチャートである。
まずS601において、認証部203はネットワークカメラ100から受信した検出人物情報410から人物情報415を抽出し、検出された人物を特定する。具体的には、検出人物情報410には、検出された人物の人物情報415が含まれるので、画像データベース330に登録されている人物特定用情報332の中から、人物情報415と最も特徴が一致する人物特定用情報332を有する来場者を特定する。例えば、人物情報415に顔画像が含まれている場合には、当該顔画像と最も類似する顔画像を含む人物特定用情報332を有する来場者を特定する。また、人物情報415に、人物の全身画像、上半身の画像等が含まれている場合も、同様にしてそれらの画像と最も類似する画像を含む人物特定用情報332を有する来場者を特定する。また、画像から得られる特徴には、人物が着用している衣服やバッグ、装飾品等の情報を含むことができるので、これらの情報を補助的に利用することもできる。ここで、ユーザを特定するための画像の比較処理の方法自体は本発明の特徴ではなく、公知の任意の手法を採用することができるので、これ以上の詳細な説明については省略する。
続くS602において、認証部203は、人物の特定ができたかどうか、換言すると、画像データベース330に登録済みであるかどうかを判定する。S601における人物特定の処理により、画像データベース330では人物を特定できない場合には、処理はS603に進む。一方、人物が特定でき、登録済みであることが判明した場合には処理はS604に進む。S603では、認証部203は、当該来場者は画像データベース330に未登録の人物であるので、当該来場者を識別するための新たなIDを付与して、データベース管理部204を介して来場者データベース310、時間情報データベース320、画像データベース330に新規エントリを登録する。ここで、S601の人物特定において画像データベース330には未登録と判定されたもの、不審人物データベース340の人物特定用情報346に、検出された人物の人物情報415と一致する情報が登録されている場合、当該人物は過去に不審人物と特定された第1の種別の人物である。そこで、S603において当該人物を来場者データベース310に新規登録する場合には、不審人物フラグ317の値を不審人物を示す値としておく。その際、不審度のランクについては、過去の登録回数に応じて決定することができる。例えば、過去不審人物と認定されている回数が、1回の場合にはランク1、2回から3回ならばランク2、4回以上ならばランク3とすることができる。
例えば、図3(A)の来場者データベース310に登録されたID1112の人物は、受付が行われていないのにもかかわらず、不審人物フラグ317が1に設定されており、これは、入場時の撮像画像の認証結果に基づき不審人物データベース340に登録されているID0003の人物と同一人物と特定されたためである。
また、S601からS603では、ネットワークカメラ100で撮像した画像に含まれる人物全てを人物特定の対象としているが、監視対象区域内で働くスタッフのように、人物を特定する必要のない第2の種別の人物も撮像画像に含まれることがある。そこで、第2の種別の人物については、人物特定の対象から除外する。そのために、第2の種別の人物用の顔画像等の人物特定用情報を予め用意しておき、人物情報415に含まれる情報と対比して第2の種別の人物と認められる場合には本発明の適用対象から除外する。
S604では、認証部203は、検出人物情報410のカメラID412及び/または位置情報413に基づき、撮像画像が共有エリア1の入場口3で撮像された画像であるかを判定する。もし、入場口3で撮像された画像であると判定された場合、処理はS605に進む。一方、入場口3で撮像された画像ではないと判定された場合、処理はS607に進む。S605では、認証部203は、検出人物情報410の時刻情報414に含まれる時刻情報に基づいて、データベース管理部204を介して時間情報データベース320の入場時刻322に入場時刻を登録する。また、検出人物情報410の位置情報413に基づき、現在位置328を登録する。この場合、来場者は監視対象区域内に入場したので、現在位置328は共有エリア1となる。続くS606において、認証部203はデータベース管理部204を介して、検出人物情報410の人物情報415に含まれる特徴量を、画像データベース330の人物特定用情報332に登録し、人物情報415に含まれる画像を、画像データベース330の入場画像333と最新画像338とに登録する。その後、処理はS625に進む。
続くS607では、認証部203は、検出人物情報410のカメラID412及び/または位置情報413に基づき、撮像画像が共有エリア1の受付5で撮像された画像であるかを判定する。もし、受付5で撮像された画像であると判定された場合、処理はS608に進む。一方、受付5で撮像された画像ではないと判定された場合、処理はS611に進む。S608では、認証部203はデータベース管理部204を介して、検出人物情報410の時刻情報414に含まれる時刻情報に基づいて、時間情報データベース320の受付時刻323に受付時刻を登録する。このとき、来場者データベース310の受付314を「未」から「済」に更新する。また、検出人物情報410の位置情報413に基づき、現在位置328を登録する。この場合、来場者は共有エリア1内で受付をしたので現在位置328は共有エリア1となる。続くS609において、認証部203はデータベース管理部204を介して、検出人物情報410の人物情報415に含まれる特徴量を、画像データベース330の人物特定用情報332に登録し、人物情報415に含まれる画像を、画像データベース330の受付画像334と最新画像338とに登録する。人物特定用情報332は、古い特徴量が新たな特徴量により上書きされても良いし、古い特徴量に追加で新たな特徴量を登録してもよいし、古い情報と新しい情報とを合成(例えば、単純平均や重みづけ平均で新しい特徴量の重みを大きくする)した結果を登録してもよい。人物特定用情報332の取り扱いは、これ以降の処理でも同様である。
続くS610では、データベース管理部204は、受付端末400から情報処理装置200に送信された来場者に関する情報を登録する。例えば、氏名やID番号が通知された場合には、来場者データベース310の氏名312及びID番号313に当該情報を登録する。その後、処理はS625に進む。
続くS611では、認証部203は、検出人物情報410のカメラID412及び/または位置情報413に基づき、撮像画像が入退室口6での入室時に撮像された画像であるかを判定する。もし、入室時に撮像された画像であると判定された場合、処理はS612に進む。一方、入室時に撮像された画像ではないと判定された場合、処理はS614に進む。S612では、認証部203はデータベース管理部204を介して、検出人物情報410の時刻情報414に含まれる時刻情報に基づいて、時間情報データベース320の入室時刻324に入室時刻を登録する。このとき、来場者データベース310の入室315を「未」から「済」に更新する。また、検出人物情報410の位置情報413に基づき、現在位置328を登録する。この場合、来場者は入退室口6から所定エリア2に入室したので、現在位置328は所定エリア2となる。続くS613において、認証部203はデータベース管理部204を介して、検出人物情報410の人物情報415に含まれる特徴量を、画像データベース330の人物特定用情報332に登録し、人物情報415に含まれる画像を、画像データベース330の入室画像335と最新画像338とに登録する。その後、処理はS625に進む。
続くS614では、認証部203は、検出人物情報410のカメラID412及び/または位置情報413に基づき、撮像画像が入退室口6での退室時に撮像された画像であるかを判定する。もし、退室時に撮像された画像であると判定された場合、処理はS615に進む。一方、退室時に撮像された画像ではないと判定された場合、処理はS617に進む。S615では、認証部203はデータベース管理部204を介して、検出人物情報410の時刻情報414に含まれる時刻情報に基づいて、時間情報データベース320の退室時刻325に退室時刻を登録する。このとき、来場者データベース310の退室316を「未」から「済」に更新する。また、検出人物情報410の位置情報413に基づき、現在位置328を登録する。この場合、来場者は入退室口6から所定エリア2を退室したので、現在位置328は共有エリア1となる。続くS616において、認証部203はデータベース管理部204を介して、検出人物情報410の人物情報415に含まれる特徴量を、画像データベース330の人物特定用情報332に登録し、人物情報415に含まれる画像を、画像データベース330の退室画像336と最新画像338とに登録する。その後、処理はS625に進む。
続くS617では、認証部203は、検出人物情報410のカメラID412及び/または位置情報413に基づき、撮像画像が入退場口3での退場時に撮像された画像であるかを判定する。もし、退場時に撮像された画像であると判定された場合、処理はS618に進む。一方、退場時に撮像された画像ではないと判定された場合、処理はS620に進む。S618では、認証部203はデータベース管理部204を介して、検出人物情報410の時刻情報414に含まれる時刻情報に基づいて、時間情報データベース320の退場時刻326に退場時刻を登録する。また、検出人物情報410の位置情報413に基づき、現在位置328を登録する。この場合、来場者は監視対象区域外に退場したので、現在位置328は屋外となる。続くS619において、認証部203はデータベース管理部204を介して、検出人物情報410の人物情報415に含まれる特徴量を、画像データベース330の人物特定用情報332に登録し、人物情報415に含まれる画像を、画像データベース330の退場画像337と最新画像338とに登録する。その後、処理はS622に進む。
S620では、認証部203はデータベース管理部204を介して、検出人物情報410の位置情報413に含まれる位置情報に基づいて、時間情報データベース320の現在位置328に現在位置を登録する。続くS621において、認証部203はデータベース管理部204を介して、検出人物情報410の人物情報415に含まれる特徴量を、画像データベース330の人物特定用情報332に登録し、人物情報415に含まれる画像を、画像データベース330の最新画像338に登録する。その後、処理はS625に進む。
S622では、認証部203は、退場画像337を登録した時点において、来場者データベース310の不審人物フラグ317の値を参照し、当該人物が不審人物と認定されたか否かを判定する。もし、不審人物と認定されていた場合、処理はS623に進み、不審人物と認定されていなかった場合、処理はS624に進む。S623では、認証部203はデータベース管理部204を介して、不審人物データベース340における当該人物の人物情報を更新する。不審人物データベース340を更新したら、該当する人物の情報を来場者データベース310、時間情報データベース320、画像データベース330から削除する。また、S624では、認証部203はデータベース管理部204を介して、不審人物ではないと判定された人物の情報を来場者データベース310、時間情報データベース320、画像データベース330から削除する。その後、図5の処理に戻る。なお、S623、S624では、各データベースから登録情報削除することを記載したが、一定期間が経過するまでは保持しておき、一定期間経過後に削除するようにしても良い。
S625では、時間情報データベース320の現在位置328が「共有エリア1」を示している来場者の滞在時間を以下の式1から式3を利用して算出し、共有エリア滞在時間329を更新する。
入場から受付までの間:現在時刻-入場時刻 (式1)
受付から入室までの間:現在時刻-利用可能時間の開始時刻 (式2)
退室後:現在時刻-退室時刻 (式3)
いずれの式を使用するかは来場者データベース310の受付314、入室315及び退室316の値に基づくことができる。受付314が「未」の場合(入室315、退室316も「未」)には式1を選択する。受付314が「済」で入室315及び退室316が「未」の場合には式2を選択する。受付314、入室315、退室316が全て「済」の場合には式3を選択する。なお、式3において退室時刻が特定できない場合、利用可能時間の終了時刻を利用しても良い。
次に、上記の処理結果に基づいて、情報表示装置500に不審人物に関する情報を表示するための処理を説明する。図7は、発明の実施形態に対応する監視システム10における情報処理装置200が実行する処理の一例を示すフローチャートである。
まず、S701において、情報処理装置200は、通知部206は、来場者データベース310において、不審人物フラグ317が設定された人物を特定する。当該人物はID311、氏名312、ID番号313等により特定することができるので、通知部206は、データベース管理部204を介して来場者データベース310からこれらの情報を取得する。次にS702において、通知部206は、S701で取得した情報に基づき、データベース管理部204を介して画像データベース330から不審人物の人物特定用情報332を取得する。本実施形態では、同一の人物には共通のIDが使用されるので、来場者データベース310から取得したID311と同一のID331と対応付けられた人物特定用情報332を取得すればよい。
次に、S703において、通知部206は、共有エリア1内に設置されたネットワークカメラ100から受信した撮像画像中で不審人物を探索する。ここでは、例えば、各撮像画像において人物特定用情報332に含まれる特徴量と一致する人物を探索することができる。また、ネットワークカメラ100からは検出人物情報410が送信されてくるので、当該検出人物情報410に含まれる人物情報415についてS702で取得した人物特定用情報332を適用して不審人物を特定してもよい。
撮像画像中での不審人物の位置が特定できたならば、続くS704において通知部206は、データベース管理部204を介して当該人物に関する情報を来場者データベース310、時間情報データベース320、画像データベース330、不審人物データベース340から取得する。続くS705において、通知部206は、LAN I/F部201を介して取得した不審人物に関する情報を、共有エリア1の撮像画像に重畳表示可能な情報として、当該撮像画像と共に情報表示装置500に送信する。情報表示装置500側では、情報処理装置200から送信されてくる画像に不審人物に関する情報を重畳して画面表示することができる。
このときの表示の一例は、例えば図8に示すようになる。図8は、情報表示装置500における画面表示の一例を示す図である。まず、図8(A)は、共有エリア1における待合所4を撮像した画像を表示する画面の一例である。画面800において、画像801にはネットワークカメラ100が待合所4を撮影した画像が表示されている。待合所4を撮像するネットワークカメラ100は、待合所4を天井側から俯瞰するように撮像し、待合所4の椅子に座っている来場者を正面から撮像することができる。画像801において、マーク802は不審人物と判定された人物を識別するためのマークである。この時点では、二人の人物が不審人物と認定されている。
このような表示状態において、情報表示装置400の操作部において所定の操作を行うと、画面表示が図8(B)に示すような形態に切り替る。図8(B)では、不審人物と認定された人物に関する情報が表示される。当該情報には、例えば、人物の不審度、受付手続が済であるかどうか、利用可能時間帯、総滞在時間、超過時間、過去の検出回数などを含めることができる。このうち超過時間は、例えば、上記の式1から3のいずれかで計算した共有エリア1における滞在時間、あるいは、当該滞在時間と対応する閾値との差分として求めることができる。また、過去の検出回数は、不審人物データベース340における同一人物の登録数に基づいて決定することができる。この過去の情報については、例えば画面800上の過去の検出回数を表示する部分をクリックすることにより詳細を表示できるようにしてもよい。
また、上述の実施形態では、ネットワークカメラ100により撮像した画像に基づき人物を特定する場合について記載したが、人物の特定は画像のみに依らなくても良い。例えば、受付5における受付時にビーコン発信機を貸与して、当該ビーコン発信機から発信されるビーコン信号を受信することにより、人物の存在を検出し、特定を行っても良い。
以上の実施形態によれば、任意の人物が滞在可能な共有エリア1における滞在時間が不必要に長い人物を確実に検出し、監視することができる。特に、本実施形態では、監視対象区域への入場から受付までの間、受付から入室までの間、退室後に共有エリア1に長期に滞在する人物を検知して監視することが可能となる。これにより、表向きは用向きを装いながら実際には共有エリアにおいて施設内の人物や来訪者を観察するような人物を的確に監視するための仕組みを提供することができる。
<その他の実施形態>
以上、実施形態を詳述したが、本発明は例えば、システム、装置、方法、プログラム若しくは記録媒体(記憶媒体)等としての実施態様をとることが可能である。具体的には、複数の機器(例えば、ホストコンピュータ、インタフェース機器、撮像装置、webアプリケーション等)から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。