WO2006028106A1 - 異常動作検出装置および異常動作検出方法 - Google Patents

異常動作検出装置および異常動作検出方法 Download PDF

Info

Publication number
WO2006028106A1
WO2006028106A1 PCT/JP2005/016380 JP2005016380W WO2006028106A1 WO 2006028106 A1 WO2006028106 A1 WO 2006028106A1 JP 2005016380 W JP2005016380 W JP 2005016380W WO 2006028106 A1 WO2006028106 A1 WO 2006028106A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
feature data
frame
abnormal
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2005/016380
Other languages
English (en)
French (fr)
Inventor
Nobuyuki Otsu
Takuya Nanri
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to EP05778592A priority Critical patent/EP1801757A4/en
Priority to US11/662,366 priority patent/US20080123975A1/en
Publication of WO2006028106A1 publication Critical patent/WO2006028106A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING SYSTEMS, e.g. PERSONAL CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/02Alarms for ensuring the safety of persons
    • G08B21/04Alarms for ensuring the safety of persons responsive to non-activity, e.g. of elderly persons
    • G08B21/0438Sensor means for detecting
    • G08B21/0476Cameras to detect unsafe condition, e.g. video cameras
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/254Analysis of motion involving subtraction of images
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • G06V40/23Recognition of whole body movements, e.g. for sport training
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING SYSTEMS, e.g. PERSONAL CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B13/00Burglar, theft or intruder alarms
    • G08B13/18Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength
    • G08B13/189Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems
    • G08B13/194Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems
    • G08B13/196Actuation by interference with heat, light, or radiation of shorter wavelength; Actuation by intruding sources of heat, light, or radiation of shorter wavelength using passive radiation detection systems using image scanning and comparing systems using television cameras
    • G08B13/19602Image analysis to detect motion of the intruder, e.g. by frame subtraction
    • G08B13/1961Movement detection not involving frame subtraction, e.g. motion detection on the basis of luminance changes in the image

Definitions

  • the present invention relates to an abnormal operation detection device and an abnormal operation detection method for capturing a moving image and detecting an unusual operation.
  • the three-dimensional high-order local autocorrelation feature means that the local autocorrelation feature is calculated at each point in the botacel data (3D data) in which images are arranged in time series. It is a statistical feature obtained by integrating over the entire Botacel data, and can be said to be an operation feature. The recognition result obtained by applying the four actions to discriminant analysis for this feature is very high at almost 100%.
  • Non-Patent Document 1 T. Kobayashi ana Action and simultaneous Multiple-Person Identification Using Cubic Higher-Order Local Auto-Correlation "Proceeding of 17th International Conference on Pattern Recognition ⁇ 2004
  • An object of the present invention is to solve such problems and to provide an abnormal motion detection device and an abnormal motion detection method for detecting abnormal motion using a three-dimensional higher-order local autocorrelation feature, which is a feature extraction of moving image force and others. It is to provide.
  • the abnormal motion detection apparatus of the present invention includes difference data generation means for generating inter-frame difference data from moving image data composed of a plurality of image frame data, and inter-frame difference data power feature data based on higher-order local autocorrelation.
  • the feature data extracting means for extracting a plurality of feature data extracted by the feature data extracting means in the past, the subspace based on the principal component vector obtained by the principal component analysis method, and the feature data extracting means
  • a distance calculating means for calculating a distance from the feature data, an abnormality determining means for determining an abnormality when the distance is greater than a predetermined value, and outputting a determination result when the abnormality determining means determines an abnormality.
  • the main feature is the provision of output means.
  • the feature data extraction unit may extract feature data from a plurality of nearest three-dimensional data that is the inter-frame difference data force by a cubic higher-order local autocorrelation. .
  • the abnormal operation detection device described above further includes a capturing unit that captures moving image frame data in real time, a frame data storage unit that stores the captured frame data, and feature data extracted by the feature data extraction unit.
  • a storage unit that stores data for a certain period of time, and a subspace in which subspace information is updated by obtaining a subspace based on a principal component vector obtained by a principal component analysis method from feature data stored in the storage unit It may be possible to provide an updating means.
  • the abnormal motion detection method of the present invention includes a first step of generating moving image data force inter-frame difference data composed of a plurality of image frame data, and a plurality of the three-dimensional data composed of the plurality of inter-frame difference data forces.
  • Feature data by 3D higher order local autocorrelation A second step of extracting, a third step of calculating a distance between the subspace based on the principal component vector obtained by the principal component analysis method from a plurality of feature data extracted in the past and the feature data, and the distance is predetermined.
  • the main feature is that it has a fourth step for determining an abnormality when it is greater than the value and a fifth step for outputting a determination result when it is determined to be abnormal.
  • the first step includes a step of capturing moving image frame data in real time and a step of storing the captured frame data
  • the third step includes feature data extraction.
  • the feature data extracted by the means is stored for a certain period of time, and the subspace information is updated by obtaining a subspace based on the principal component outline obtained by the principal component analysis method from the stored feature data. Even if you include steps.
  • the motion feature does not depend on the position or the like of the target! /, (3D) higher-order local autocorrelation features that are position-invariant values are used, and when there are a plurality of targets, Due to the property that the total feature value is the sum of the individual feature values, normal behavior that is abundantly obtained as normal data is statistically learned as a subspace, and abnormal behavior is derived from it. For example, when there are multiple people on the screen, V, and most of the conventional methods are used to cut out and track individual persons. Can be detected.
  • the amount of calculation with a small amount of calculation for feature extraction or abnormality determination is constant regardless of the number of subjects, and there is an effect that real-time processing is possible.
  • FIG. 1 is a block diagram showing a configuration of an abnormal operation detection device according to the present invention.
  • FIG. 2 is a flowchart showing the contents of abnormal operation detection processing according to the present invention.
  • FIG. 3 is a flowchart showing the contents of the S13 cubic high-order local autocorrelation feature extraction process.
  • FIG. 4 is an explanatory diagram showing autocorrelation processing coordinates in a three-dimensional pixel space.
  • FIG. 5 is an explanatory diagram showing an example of an autocorrelation mask pattern.
  • FIG. 6 is an explanatory diagram showing the contents of real-time processing of a moving image according to the present invention.
  • FIG. 7 is an explanatory diagram showing the additiveness of CHLAC features and the properties of subspaces.
  • FIG. 8 is an explanatory diagram showing an example of the additiveness of CHLAC features and subspaces.
  • abnormal operation is that the abnormality itself cannot be defined so that all abnormal events cannot be listed. Therefore, in this specification, abnormal operation is defined as “not normal operation”. Normal operation can be learned from a statistical distribution if it is an operation in which the distribution is concentrated considering the statistical distribution of operation characteristics. An operation that deviates greatly from the distribution is defined as an abnormal operation.
  • a general motion such as a walking motion is learned and recognized as a normal motion, but a motion like a suspicious behavior is a walking motion. Since it is not a periodic motion but a small distribution, it is recognized as an abnormal operation.
  • the present inventors conducted an experiment with the “walking” operation as a normal operation, the “running” operation, and the “falling” operation as an abnormal operation.
  • a partial space of normal motion features is generated in the motion feature space based on the three-dimensional higher-order local autocorrelation features, and the distances of the partial space forces are different. Abnormal operation is detected as a normal value.
  • the principal component analysis method is used to generate the normal motion subspace.
  • the principal component subspace is composed of principal component vectors with a cumulative contribution rate of 0.99.
  • the three-dimensional higher-order local autocorrelation feature has a property that it does not require extraction of an object and is additive in the screen. Due to this additivity, when a normal motion subspace is constructed, the feature vector will fit in the normal motion subspace no matter how many people perform normal motions on the screen, and even one of them will behave abnormally. If it does, it will jump out of the subspace and be detected as an abnormal value. Since there is no need to track and calculate each individual person, the amount of calculation is constant without being proportional to the target number of people and can be calculated at high speed.
  • the principal component vector of the CHLAC feature to be learned is obtained, and the force that forms the subspace using the principal component vector.
  • the important thing here is that the additive property of the CHLAC feature The compatibility of is very good. Whether or not it belongs to the normal motion subspace (distance is below a predetermined threshold) does not depend on the vector size. That is, only the direction of the vector is an element of whether or not it belongs to the normal operation subspace.
  • FIG. 7 is an explanatory diagram showing the additiveness of the CHLAC feature and the properties of the subspace.
  • the CHLAC feature data space is 2 dimensions (actually 251 dimensions), and the normal operation subspace is 1 dimension (in the example, for example, if the cumulative contribution ratio is 0.99, 3 ⁇
  • the CHLAC feature data of normal operation forms a group for each number of monitoring targets.
  • the normal motion subspace S obtained by the principal component analysis exists in the vicinity including the CHLAC feature data of normal operation. Since the CHL AC feature data A of the abnormal operation that deviates from the normal operation subspace S has a large vertical distance d ⁇ , an abnormality is determined by this vertical distance d ⁇ .
  • FIG. 8 is an explanatory diagram showing an example of CHLAC feature additivity and subspace.
  • Figure 8 (a) shows the CHLAC feature vector for one person's normal motion (walking), and is in the normal motion subspace S (very close).
  • Fig. 8 (b) shows the CHLAC characteristic vector for one person's abnormal operation (falling), and is separated from the normal operation subspace S by a vertical distance d ⁇ .
  • Fig. 8 (c) shows the CHL AC feature vector when two normal operations (walking) and one abnormal operation (tumbling) coexist, and as in (b). Normal operation subspace Vertical distance from S d ⁇ apart.
  • N normal and A is abnormal. Projectors are defined later.
  • FIG. 1 is a block diagram showing a configuration of an abnormal operation detection device according to the present invention.
  • Video power Mera 10 outputs moving image frame data of the target person or device in real time.
  • Video camera 10 can be monochrome or color camera.
  • the computer 11 may be, for example, a well-known personal computer (PC) equipped with a video capture circuit for capturing moving images.
  • the present invention is realized by creating, installing, and starting up a program to be described later on any known computer 11 such as a personal computer.
  • the monitor device 12 is a well-known output device of the computer 11 and is used, for example, to display to the operator that an abnormal operation has been detected.
  • the detected anomalies can be reported and displayed on a remote monitoring device via the Internet, etc., by alerting by sound, or by calling a wired or mobile phone and reporting by voice.
  • the method of performing etc. is employable.
  • the keyboard 13 and the mouse 14 are well-known input devices used for input by the operator.
  • moving image data input from the video camera 10 may be processed in real time, or may be stored in a moving image file and sequentially read out for processing.
  • FIG. 2 is a flowchart showing the contents of abnormal operation detection processing according to the present invention.
  • the process waits until the input of frame data from the video camera 10 is completed.
  • S11 In frame data is input (read into a memory).
  • the image data at this time is, for example, 256 gray scale data.
  • binarization is performed by automatic threshold selection in order to remove color information and noise unrelated to "movement".
  • the input moving image data becomes a column of frame data (binary image) having logical values of “moved (1)” and “moved (0)” as pixel values.
  • Non-Patent Document 2 Noriyuki Otsu, "Automatic threshold selection method based on discrimination and least squares criterion" IEICE Transactions D, J63-D-4, P349-356, 1980.
  • the higher order local autocorrelation function is limited to a local region.
  • the displacement direction is limited to a local area of 3 X 3 X 3 pixels centered on the reference point r, that is, 26 neighborhoods of the reference point r.
  • the displacement direction in the case of taking a cubic higher-order local autocorrelation feature may not necessarily be separated by adjacent pixels.
  • the number of feature amounts that is, the dimension of the feature vector corresponds to the type of mask pattern.
  • the number of pixels multiplied by 1 is 1. Therefore, terms with a square or higher are deleted as duplicates of terms with a square that differ only in the multiplier.
  • patterns that overlap in the integration operation (translation: scan) in Equation 1 leave one representative pattern and delete others. Since the expression on the right side of Equation 1 always includes the reference point (r) : the center of the local area), select a representative pattern that includes the central point and that fits within the local area of 3 X 3 X 3 pixels. .
  • the 3D higher-order local autocorrelation feature vector for one 3D data is 251D.
  • the correlation value is a (0th order) ⁇ a X a (l order) ⁇ a X a X a ( Even if the selected pixels are the same, duplicated ones with different multipliers cannot be deleted. Therefore, in the case of multiple values, the number of mask patterns is increased by 2 when the number of selected pixels is 1 and by 26 when the number of selected pixels is 2, compared to the case of 2 values.
  • the frame CHLAC data is stored corresponding to the frame.
  • the latest CHLAC data obtained in S13 is added to the current CHLAC data, and new CHLAC data is obtained by subtracting the current CHLAC data from the frame CHLAC data corresponding to frames older than a predetermined period. Generate and save.
  • FIG. 6 is an explanatory diagram showing the contents of real-time processing of a moving image according to the present invention.
  • the moving image data is a sequence of frames. Therefore, a time window with a certain width is set in the time direction, and the set of frames in the window is used as one 3D data. Each time a new frame is input, the time window is moved and the old frame is deleted to obtain finite 3D data. The length of this time window should be set equal to or longer than one period of the motion to be recognized.
  • the principal component vectors are obtained by the principal component analysis method from all of the CHLAC data groups stored up to now or the most recent predetermined number, and the normal operation subspace is determined. To do. Since the principal component analysis method itself is well known, an outline will be described. [0039] First, in order to construct a subspace of normal operation, principal component vectors are obtained from the CHLAC feature data group by principal component analysis.
  • the M-dimensional CHLAC feature vector X is expressed as follows.
  • is the average vector of feature vectors X
  • the matrix U is obtained from the eigenvalue problem of the following equation using this covariance matrix ⁇ .
  • this vertical distance d ⁇ is used as an indicator of whether or not the force is abnormal.
  • FIG. 3 is a flowchart showing the contents of the three-dimensional higher-order local autocorrelation feature extraction process in S13.
  • S30 251 correlation pattern counters are cleared.
  • S31 one unprocessed target pixel (reference point) is selected (scans the target pixel in order in the frame).
  • S32 one unprocessed mask pattern is selected.
  • FIG. 4 is an explanatory diagram showing the autocorrelation processing coordinates in the three-dimensional pixel space.
  • the xy planes of three difference frames of t ⁇ 1 frame, t frame, and t + 1 frame are shown side by side.
  • the mask pattern is information indicating the combination of pixels to be correlated, and the pixel data selected by the mask pattern is used to calculate the correlation value, but the powerful pixels not selected by the mask pattern are ignored. .
  • the target pixel center pixel
  • the number of patterns after eliminating the overlap in a 3 ⁇ 3 ⁇ 3 pixel cube is 251.
  • FIG. 5 is an explanatory diagram showing an example of an autocorrelation mask pattern.
  • Figure 5 (1) shows the simplest 0th-order mask pattern with only the pixel of interest.
  • (2) is an example of a primary mask pattern in which two hatched pixels are selected.
  • (3) and (4) are examples of a secondary mask pattern in which three hatched pixels are selected. There are many other patterns.
  • Equation 2 is the difference between the coordinates corresponding to the mask pattern and the binarization 3D data pixel value
  • Equation 1 corresponds to moving (scanning) the pixel of interest within the frame and adding the correlation values with the counter corresponding to the mask pattern (counting 1).
  • S34 it is determined whether or not the correlation value is 1. If the determination result is affirmative, the flow proceeds to S35, but if negative, the flow proceeds to S36. In order to reduce the amount of calculation, the actual calculation first determines whether the pixel value of the reference point is 1 or not after S31 before calculating the correlation value in S33. Even if the correlation is calculated, it is 0, so skip to S37. In S35, the correlation pattern counter corresponding to the mask pattern is incremented by 1. In S36, it is determined whether or not the force has been processed for all patterns. If the determination result is affirmative, the process proceeds to S37. If the determination is negative, the process proceeds to S32.
  • S37 it is determined whether or not the processing has been completed for all the pixels. If the determination result is affirmative, the process proceeds to S38. If the determination result is negative, the process proceeds to S31. In S38, a set of pattern counter values is output as 251 dimensional frame CHLAC data.
  • normal motion is statistically learned as a subspace, and abnormal motion can be detected as a deviation from it. it can.
  • This method can be applied to the case of multiple people, and can be detected if one person performs an abnormal operation on the screen. However, it is an effective and highly practical method that does not require the extraction of the target and the calculation amount is constant regardless of the number of people.
  • this method statistically learns normal operations without explicitly defining them, it is in accordance with the monitoring target that does not need to be defined as what normal operation means at the design stage. Natural detection.
  • This since no assumptions or knowledge about the monitoring target is required, This is a general-purpose method that can determine normality / abnormality for various monitoring targets.
  • online learning can detect abnormal behavior in real time.
  • the embodiment for detecting the abnormal operation has been described. However, the following modifications may be considered in the present invention.
  • the normal operation partial space is generated in advance by the learning phase, or for example, 1 minute, 1
  • a normal operation subspace may be generated and updated at a predetermined period longer than a frame interval such as time or one day, and abnormal operation may be detected using a fixed subspace until the next update. . In this way, the throughput is further reduced.
  • Non-patent document 3 Juyang Weng, Yilu Zhang and Wey-bhiuan Hwang, Candid and ovarian ce- Free Incremental Principal Component Analysis ", IEEti, fransactions on Pattern Analysis and Machine Intelligence, Vol.25, No.8, pp.1034— 1040, 2003
  • the configuration of the embodiment cannot form the normal operation subspace so correctly, and the detection accuracy of abnormal operations may be reduced. Therefore, after clustering in the normal operation subspace, it is conceivable to measure the distance from the cluster so that it can cope with the multimodal distribution.
  • a partial space can be generated for each of a plurality of normal operation patterns
  • a plurality of abnormality determinations are performed using each partial space, and a logical product of a plurality of determination results is taken to determine that all patterns are abnormal.
  • the determined item may be regarded as abnormal.
  • the frame determined to be an abnormal operation is also used for the normal operation partial space generation processing.
  • the frame determined to be an abnormal operation may be excluded from the subspace generation processing power. In this way, the detection accuracy is improved when the rate of abnormal operation is high or when the number of image samples is V.
  • 3D CHLAC an example of calculating 3D CHLAC was disclosed. However, considering the use, accuracy, and computational complexity, 2D height is calculated from each difference frame that 3D CHLAC does not have. Next, local autocorrelation features may be calculated to generate a subspace of this data force normal motion to detect abnormal motion.

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Human Computer Interaction (AREA)
  • Social Psychology (AREA)
  • Gerontology & Geriatric Medicine (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

 動画像から異常動作を検出する異常動作検出装置および異常動作検出方法を提供する。  異常動作検出装置11は、ビデオカメラ10から入力される動画像データからフレーム間差分データを生成し、複数のフレーム間差分データからなる3次元データから立体高次局所自己相関によって特徴データを抽出し、過去の特徴データから主成分分析手法により得られた主成分ベクトルに基づく部分空間と、最新の特徴データとの距離を計算する。そして、この距離が所定値よりも大きい場合に異常と判定する。正常動作を部分空間として学習し、異常動作をそこからの逸脱として検出することにより、例えば画面内に複数人いる場合でも1人の異常動作を検出可能である。また、計算量が少なく、実時間処理が可能である。

Description

異常動作検出装置および異常動作検出方法
技術分野
[0001] 本発明は、動画像を取り込んで通常とは異なる動作を検出する異常動作検出装置 および異常動作検出方法に関するものである。
背景技術
[0002] 現在、セキュリティ分野における映像監視や老人介護のモニタリングシステムなど、 カメラによる監視システムが多く利用されている力 人による動画像からの異常検出 は労力も多大であり、これをコンピュータで代替できるならば大幅な労力削減につな がる。また老人介護においても、発作などに対する自動通報システムがあるならば、 介護者の負担を減らすことができるため、異常を知らせるなどのカメラによるモニタリ ングシステムが必要とされて 、る。
[0003] そこで、対象に対して動作特徴を抽出するような動画像からの動作認識が必要とな る。動作認識の研究としては、特に、本発明者の一部らが発表した下記の非特許文 献 1には、顔画像認識などに有効な高次局所自己相関特徴を拡張し、時間方向の 相関も加えた特徴である、立体高次局所自己相関特徴 (以下、 CHLACとも記す)を 用いた動作認識を行う技術が開示されて!ヽる。
立体高次局所自己相関特徴とはすなわち、画像を時系列に並べたボタセルデータ (3次元データ)に対して、その中の各点において局所的な自己相関特徴を計算し、 この局所特徴をボタセルデータ全体にわたって積分することにより得られる統計的特 徴であり、動作特徴であるといえる。この特徴に対して 4つの動作を判別分析にかけ た認識結果は、ほぼ 100 %と非常に高いものとなっている。
非特許文献 1 : T.Kobayashi ana
Figure imgf000003_0001
Action and simultaneous Multiple-Person Identification Using Cubic Higher-Order Local Auto-Correlation" Proceeding of 17t h International Conference on Pattern Recognition^ 2004
発明の開示
発明が解決しょうとする課題 [0004] 上記した従来の動作認識方法を異常動作の検出に適用しょうとした場合には、全 ての異常動作の特徴データを予め生成して登録しておく必要がある。しかし、人や装 置の異常動作は予測することが困難であり、全ての異常動作の特徴データを高精度 で生成することは不可能であるという問題点があった。本発明の目的はこのような問 題点を解決し、動画像力ゝらの特徴抽出である立体高次局所自己相関特徴を用いて 異常動作を検出する異常動作検出装置および異常動作検出方法を提供する点にあ る。
課題を解決するための手段
[0005] 本発明の異常動作検出装置は、複数の画像フレームデータからなる動画像データ からフレーム間差分データを生成する差分データ生成手段と、前記フレーム間差分 データ力 高次局所自己相関によって特徴データを抽出する特徴データ抽出手段と 、過去に特徴データ抽出手段によって抽出された複数の特徴データ力 主成分分 析手法により得られた主成分ベクトルに基づく部分空間と、前記特徴データ抽出手 段により抽出された特徴データとの距離を計算する距離計算手段と、前記距離が所 定値よりも大きい場合に異常と判定する異常判定手段と、前記異常判定手段が異常 と判定した場合に判定結果を出力する出力手段とを備えたことを主要な特徴とする。 また、前記した異常動作検出装置において、前記特徴データ抽出手段は、直近の 複数の前記フレーム間差分データ力 なる 3次元データから立体高次局所自己相関 によって特徴データを抽出するものであってもよい。
[0006] また、前記した異常動作検出装置は更に、動画像フレームデータをリアルタイムで 取り込む取り込み手段と、取り込んだフレームデータを保存するフレームデータ保存 手段と、特徴データ抽出手段により抽出された特徴データを一定期間分だけ保存す る保存手段と、前記保存手段に保存されている特徴データから主成分分析手法によ り得られた主成分ベクトルに基づく部分空間を求めて部分空間情報を更新する部分 空間更新手段とを備えるようにしてもょ ヽ。
[0007] 本発明の異常動作検出方法は、複数の画像フレームデータからなる動画像データ 力 フレーム間差分データを生成する第 1ステップと、直近の複数の前記フレーム間 差分データ力 なる 3次元データから立体高次局所自己相関によって特徴データを 抽出する第 2ステップと、過去に抽出された複数の特徴データから主成分分析手法 により得られた主成分ベクトルに基づく部分空間と特徴データとの距離を計算する第 3ステップと、前記距離が所定値よりも大きい場合に異常と判定する第 4ステップと、 異常と判定された場合に判定結果を出力する第 5ステップとを備えたことを主要な特 徴とする。
また前記した異常動作検出方法において、前記第 1ステップは、動画像フレームデ ータをリアルタイムで取り込むステップと、取り込んだフレームデータを保存するステツ プとを含み、前記第 3ステップは、特徴データ抽出手段により抽出された特徴データ を一定期間分だけ保存するステップと、保存されている特徴データから主成分分析 手法により得られた主成分べ外ルに基づく部分空間を求めて部分空間情報を更新 するステップとを含むようにしてもょ 、。
発明の効果
[0008] 本発明によれば、動作特徴として対象の位置等に依らな!/、位置不変な値である( 立体)高次局所自己相関特徴を用いており、複数個の対象がある場合、全体の特徴 値はそれぞれの個別の特徴値の和になるという加法性があるという性質によって、通 常データとして豊富に得られる正常動作を統計的に部分空間として学習し、異常動 作をそこからの逸脱として検出することにより、例えば画面内に複数人いる場合にお V、て、従来の殆どの方式が採用して 、る個々の人物の切り出しやトラッキングを行うこ となぐ 1人の異常動作をも検出可能であるという効果がある。
また、特徴抽出や異常判定のための計算量が少なぐ計算量は対象人数に依らず 一定であり、実時間処理が可能であるという効果もある。
[0009] 更に、正常動作を陽に定義することなく統計的に学習しているため、設計の段階で 正常動作とは何かにつ 、て定義する必要がなぐ監視対象に則した自然な検出を行 うことができる。さらに、監視対象についての仮定が不要であり、人の動作に限らず、 さまざまな監視対象に対しても、正常 ·異常を判別できるという効果もある。また、リア ルタイムで動画像を取り込み、正常動作の部分空間を更新することにより、正常動作 の緩やかな変化に追従して 、くことができると 、う効果もある。
図面の簡単な説明 [0010] [図 1]図 1は本発明による異常動作検出装置の構成を示すブロック図である。
[図 2]図 2は本発明による異常動作検出処理の内容を示すフローチャートである。
[図 3]図 3は S13の立体高次局所自己相関特徴抽出処理の内容を示すフローチヤ一 トである。
[図 4]図 4は 3次元画素空間における自己相関処理座標を示す説明図である。
[図 5]図 5は自己相関マスクパターンの例を示す説明図である。
[図 6]図 6は本発明による動画像の実時間処理の内容を示す説明図である。
[図 7]図 7は CHLAC特徴の加法性と部分空間の性質を示す説明図である。
[図 8]図 8は CHLAC特徴の加法性と部分空間の例を示す説明図である。
符号の説明
[0011] 10…ビデオカメラ
11 · ··コンピュータ
12…モニタ装置
13· "キーボード
14· ··マウス
発明を実施するための最良の形態
[0012] まず、「異常動作」の定義であるが、異常の事象を全て列挙することができないよう に、異常そのものを定義することはできない。そこで本明細書においては、異常動作 を「正常動作ではないもの」として定義する。正常動作は、動作特徴の統計的な分布 を考えた場合に分布の集中する動作であるものとすれば、統計的な分布から学習可 能である。そして、その分布から大きく逸脱する動作を異常動作とする。
[0013] 例えば、通路や道路などに設置された防犯カメラでは、歩く動作のような一般的な 動作は正常動作として学習され認識されるが、挙動不審のような動作は、歩く動作の ような周期運動でもなく分布として少ないため、異常動作として認識されることになる 。なお、本発明者らは、「歩く」動作を正常動作、「走る」動作、「転ぶ」動作を異常動 作として実験を行った。
[0014] 異常動作検出の具体的な手法としては、立体高次局所自己相関特徴による動作 特徴空間の中で正常動作特徴の部分空間を生成し、その部分空間力もの距離を異 常値として異常動作を検出する。正常動作部分空間の生成には主成分分析手法を 用い、例えば累積寄与率 0.99の主成分ベクトルにより主成分部分空間を構成する。
[0015] ここで、立体高次局所自己相関特徴には、対象の切りだしが不要で画面内におい て加法性があるという性質がある。この加法性により、正常動作部分空間を構成する と、画面内に何人の人が正常動作を行っても特徴ベクトルは正常動作部分空間の中 に収まることになり、その中の一人でも異常動作を行うと、部分空間から飛び出して異 常値として検出できることになる。人を個々にトラッキングし、切り出して計算する必要 がないため、計算量は対象人数に比例することなく一定となり、高速に計算可能であ る。
[0016] 本発明においては、学習する CHLAC特徴の主成分ベクトルを求め、その主成分べ タトルを用いて部分空間を構成している力 ここで重要なことは、 CHLAC特徴の加法 性の性質との相性が非常に良いということである。正常動作部分空間に属する (距離 が所定の閾値以下)かどうかはベクトルの大きさに依存しない。すなわち、ベクトルの 方向のみが正常動作部分空間に属するか否かの要素となる。
[0017] 図 7は、 CHLAC特徴の加法性と部分空間の性質を示す説明図である。図 7は、説 明を簡単にするために、 CHLAC特徴データ空間を 2次元(実際には 251次元)とし、 正常動作の部分空間を 1次元(実施例では例えば累積寄与率 0.99とすると 3〜12次 元程度)としたものであり、正常動作の CHLAC特徴データが監視対象の個数ごとの 集団を形成している。主成分分析によって求められた正常動作部分空間 Sは正常動 作の CHLAC特徴データを含む形で近傍に存在して 、る。逸脱する異常動作の CHL AC特徴データ Aは、正常動作部分空間 Sとの垂直距離 d丄が大きくなるので、この垂 直距離 d丄によって異常を判定する。
[0018] 図 8は、 CHLAC特徴の加法性と部分空間の例を示す説明図である。図 8 (a)は 1人 の正常動作 (歩く)の場合の CHLAC特徴ベクトルを示しており、正常動作部分空間 S 内(ごく近傍)にある。図 8 (b)は 1人の異常動作 (転ぶ)の場合の CHLAC特徴べタト ルを示しており、正常動作部分空間 Sから垂直距離 d丄だけ離れている。
[0019] 図 8 (c)は 2人の正常動作 (歩く)と 1人の異常動作 (転ぶ)が混在して 、る場合の CHL AC特徴ベクトルを示しており、やはり (b)と同様に正常動作部分空間 Sから垂直距離 d丄だけ離れている。一般に、 n人の正常動作と一人の異常動作が混在している場合 を射影子を用いた式により示すと以下のようになる。なお、 Nは正常、 Aは異常を示 す。射影子は後に定義する。
[0020] [数 1] χ ^ χ^ ' - + χ + χΑ とすると
= Ρ±( +· · · + + Χ
= Ρ (χ^ + ' - + χ^) + Ρ±χΑ
= Ρ±χΑ > 0
実施例 1
[0021] 図 1は、本発明による異常動作検出装置の構成を示すブロック図である。ビデオ力 メラ 10は対象となる人や装置の動画像フレームデータをリアルタイムで出力する。ビ デォカメラ 10はモノクロでもよ 、しカラーカメラであってもよ 、。コンピュータ 11は例え ば動画像を取り込むためのビデオキヤプチヤー回路を備えた周知のパソコン (PC)で あってもよい。本発明は、パソコンなどの周知の任意のコンピュータ 11に後述するプ ログラムを作成してインストールして起動することにより実現される。
[0022] モニタ装置 12はコンピュータ 11の周知の出力装置であり、例えば異常動作が検出 されたことをオペレータに表示するために使用される。なお、検出した異常の通報、 表示方法は、インターネットなどを介して遠方のモニタ装置に通報表示する方法、音 による通報により注意を促す方法、有線電話機あるいは携帯電話機に発呼して音声 により通報を行う方法等を採用可能である。
キーボード 13およびマウス 14は、オペレータが入力に使用する周知の入力装置で ある。なお、実施例においては、例えばビデオカメラ 10から入力された動画像データ を実時間で処理してもよ 、し、ー且動画像ファイルに保存して力も順次読み出して処 理してちよい。
[0023] 図 2は、本発明による異常動作検出処理の内容を示すフローチャートである。 S10 においては、ビデオカメラ 10からのフレームデータの入力が完了するまで待つ。 S11 においては、フレームデータを入力(メモリに読み込む)する。このときの画像データ は例えば 256階調のグレイスケールデータである。
[0024] S12においては、動画像データに対して「動き」の情報を検出し、背景など静止して いるものを除去する目的で差分データを生成する。差分の取り方としては、隣接する フレーム間の同じ位置の画素の輝度の変化を抽出するフレーム間差分方式を採用 するが、フレーム内における輝度の変化部分を抽出するエッジ差分、あるいは両方を 採用してもよい。なお、画素毎に RGBのカラーデータを持っている場合には、 2つの 画素の差分データとして、 2つの RGBカラーベクトル間の距離を算出してもよい。
[0025] 更に、「動き」に無関係な色情報やノイズを除去するために自動閾値選定による 2値 化を行う。 2値ィ匕の方法としては、例えば一定閾値、下記非特許文献 2に開示されて V、る判別最小二乗自動閾値法、閾値 0及びノイズ処理方式 (濃淡画像にお!/、て差が 0以外を全て動き有り = 1とし、公知のノイズ除去法によってノイズを除去する方法)を 採用可能である。以上の前処理により入力動画データは画素値に「動いた(1)」「動 かな 、 (0)」の論理値をもつフレームデータ(2値画像)の列となる。
非特許文献 2 :大津展之、 "判別および最小 2乗規準に基づく自動しきい値選定法" 電子通信学会論文誌 D、 J63-D-4、 P349-356、 1980年。
[0026] S13においては、 1フレーム毎の立体画素データに関する相関パターンカウント処 理を行い、フレームと対応するフレーム CHLACデータを生成する。詳細は後述する 力 251次元特徴データを生成する CHLAC抽出処理を行う。時系列の二値差分デ 一タカもの動作特徴の抽出には、立体高次局所自己相関 (CHLAC)特徴を用いる。 N次の CHLACは次の数式 2のようになる。
[0027] [数 2] (" ' · aN) = + ax · - f(r + aN)dr
Figure imgf000009_0001
[0028] ここで、 fは時系列画素値 (差分値)であり、参照点(注目画素) rおよび参照点から みた N個の変位 a (i = 1, . . . ,Ν)は差分フレーム内の二次元座標に時間も成分とし て持つ三次元のベクトルである。更に、時間方向の積分範囲はどの程度の時間方向 の相関を取るかのパラメータである。但し、 S 13におけるフレーム CHLACデータは 1 フレーム毎のデータであり、これを時間方向に所定期間だけ積分 (加算)したものが C HLAC特徴データとなる。
[0029] 変位方向、次数のとり方により高次自己相関関数は無数に考えられる力 これを局 所領域に限定したものが高次局所自己相関関数である。立体高次局所自己相関特 徴では変位方向を参照点 rを中心とする 3 X 3 X 3画素の局所領域内、即ち参照点 r の 26近傍に限定している。なお、一般的には、立体高次局所自己相関特徴を取る 場合の変位方向は必ずしも隣接画素でなぐ離れても良い。特徴量の計算は 1組の 変位方向に対して式 1の積分値が 1つの特徴量になる。従つて変位方向の組み合わ せ(=マスクパターン)の数だけ特徴量が生成される。
[0030] 特徴量の数、つまり特徴ベクトルの次元はマスクパターンの種類に相当する。 2値 画像の場合、画素値 1を何回乗算しても 1であるので、二乗以上の項は乗数のみが 異なる 1乗の項と重複するものとして削除する。また式 1の積分操作 (平行移動:スキ ヤン)で重複するパターンは 1つの代表パターンを残して他を削除する。式 1右辺の 式は参照点 ( r) :局所領域の中心)を必ず含むので、代表パターンとしては中心点を 含み、パターン全体が 3 X 3 X 3画素の局所領域内に収まるものを選択する。
[0031] この結果、中心点を含むマスクパターンの種類は、選択画素数が 1個のもの: 1個、 2個のもの: 26個、 3個のもの: 26 X 25Z2 = 325個の計 352個あるが、式 1の積分 操作(平行移動:スキャン)で重複するパターンを除くと、マスクパターンの種類は 25 1種類となる。即ち、 1つの 3次元データに対する立体高次局所自己相関特徴べタト ルは 251次元となる。
[0032] なお、画素の値が多値の濃淡画像の場合には、例えば画素値を aとすると、相関値 は a (0次)≠a X a (l次)≠a X a X a (2次)となり、選択画素が同じでも乗数の異なるも のを重複削除できない。従って、多値の場合には、 2値の場合より選択画素数が 1の 場合に 2個、選択画素数が 2の場合に 26個増加し、マスクパターンの種類は計 279 種類となる。
[0033] 立体高次局所自己相関特徴の性質としては、変位方向を局所領域に限定している ためにデータに対する加法性があり、画面全体および時間を含めての立体データ領 域全体を通して積分しているためにデータ内の位置不変性がある。さらに自己相関 をとつて!/ヽるのでノイズ対して頑強でもある。
[0034] S14においては、フレーム CHLACデータをフレーム対応に保存する。 S15におい ては、現在の CHLACデータに S13で求めた最新のフレーム CHLACデータを加算す ると共に、所定期間以上古いフレームに対応するフレーム CHLACデータを現在の C HLACデータ力 減算して新たな CHLACデータを生成し、保存する。
[0035] 図 6は、本発明による動画像の実時間処理の内容を示す説明図である。動画像の データはフレームのシーケンスとなっている。そこで時間方向に一定幅の時間窓を設 定し、窓内のフレーム集合を 1つの 3次元データとする。そして、新たなフレームが入 力される度に時間窓を移動させ、古いフレームを削除することで有限な 3次元データ が得られる。この時間窓の長さは、認識しょうとする動作の 1周期と等しいか、より長く 設定することが望ましい。
[0036] なお、実際には画像フレームデータは差分を取るために 1フレームのみ保存され、 次に入力された画像フレームデータとの間で差分が取られる。差分フレームデータは 2フレーム分だけ保存され、次に入力された画像フレームデータに基づく差分フレー ムデータと合わせて 3フレーム分の差分フレームデータからフレーム CHLACデータ が生成される。そして、フレームと対応するフレーム CHLACデータが時間窓分だけ保 存される。即ち、図 6において時刻 tに新たなフレームが入力された時点では、直前 の時間窓(t-1, t-n-1)に対応するフレーム CHLACデータはすでに算出されている。 但し、フレーム CHLACデータを計算するためには直近の 3つの差分フレームが必要 であるが、(t-1)フレームは端なのでフレーム CHLACデータは(t- 2)フレームに対応 するものまで算出されている。
[0037] そこで、新たに入力された tフレームを用いて (t-1)フレームに対応するフレーム CH LACデータを生成して CHLACデータに加算する。また、最も古い (t-n- 1)フレームと 対応するフレーム CHLACデータを CHLACデータから減算する。このような処理によ り、時間窓と対応する CHLAC特徴データが更新される。
[0038] 図 2に戻って、 S16においては、現在までに保存されている CHLACデータ群の全 て、あるいは直近の所定数から主成分分析手法により主成分ベクトルを求め、正常 動作の部分空間とする。主成分分析手法自体は周知であるので概略を説明する。 [0039] まず、正常動作の部分空間を構成するために、 CHLAC特徴データ群から主成分 分析により主成分ベクトルを求める。 M次元の CHLAC特徴ベクトル Xを以下のように 表す。
[0040] [数 3] xi e VM(i = - · N) なお、 M = 251である。また、主成分ベクトル(固有ベクトル)を列に並べた行列 Uを 以下のように表す。
[0041] [数 4]
Figure imgf000012_0001
• · · ¾], Uj G VMU = l' · M) なお、 M = 251である。主成分ベクトルを列に並べた行列 Uは、以下のように求める 。共分散行列∑を次式に示す。
[0042] [数 5]
Figure imgf000012_0002
なお、 μは特徴ベクトル Xの平均ベクトルであり、 Εは期待値を求める演算記号 (Ε = ( 1/Ν)∑)である。行列 Uはこの共分散行列∑を用いて、次の式の固有値問題よ り求まる。
[0043] [数 6]
XU =ひ Λ
[0044] 固有値の対角行列 Λを次式で表すと、
[0045] [数 7]
A = diag(A^,' · λΜ) 第 Κ固有値までの累積寄与率 7? は、以下のように表される。
κ
[0046] [数 8]
Figure imgf000013_0001
[0047] そこで、累積寄与率 r? が所定値 (例えば r? =0.99)となる次元までの固有ベクトル
K K
u ,...,uにより張られる空間を、正常動作の部分空間として適用する。なお、累積寄
1 K
与率 7? の最適値は監視対象や検出精度にも依存するものと考えられるので実験等
K
により決定する。以上の計算を行うことにより、正常動作の部分空間が生成される。
[0048] S17においては、 S15にて求めた CHLAC特徴データと S16で求めた部分空間との 垂直距離 d丄を求める。得られた主成分直交基底 U =[u ,...,u ]によって張られた部
K 1 K
分空間への射影子 Pおよびそれに対する直交補空間への射影子 P丄は、
[0049] [数 9]
P = UKUK'
となる。 u'は行列 uの転置行列であり、 Iは M次の単位行列である。直交補空間で の 2乗距離、即ち、部分空間 Uへの垂線の 2乗距離 d2丄は、
[0050] [数 10] αし— し
= \\(IM - UKUK f )xf
= xf(IM - UKUK f y(IM - UKUK r )x
= x\IM - UKUK f )x と表すことができる。本実施例においては、この垂直距離 d丄を異常である力否かの 指標とする。
[0051] S18においては、垂直距離 d丄が所定の閾値よりも大きいか否かが判定され、判定 結果が否定の場合には S19に移行する力 肯定の場合には S20に移行する。 S19 においては、このフレームの動作は正常動作であると判定する。また、 S20において は、このフレームの動作は異常動作であると判定する。 S21においては、判定結果を モニタ装置等へ出力する。 S22においては、例えばオペレータによる終了操作が検 出された力否かによって処理を終了する力否かが判定され、判定結果が否定の場合 には S 10に戻る力 肯定の場合には処理を終了する。以上のような方法によって、実 時間で異常検出処理ができる。
[0052] 図 3は、 S13の立体高次局所自己相関特徴抽出処理の内容を示すフローチャート である。 S30においては、 251個の相関パターンカウンタをクリアする。 S31において は、未処理の注目画素(参照点)を 1つ選択する(フレーム内で注目画素を順にスキ ヤンする)。 S32においては、未処理のマスクパターンを 1つ選択する。
[0053] 図 4は、 3次元画素空間における自己相関処理座標を示す説明図である。図 4にお いては、 t— 1フレーム、 tフレーム、 t+ 1フレームの 3つの差分フレームの xy平面を並 ベて図示してある。
[0054] 本発明においては、注目画素を中心とする 3 X 3 X 3 ( = 27)画素の立方体の内部 の画素について相関を取る。マスクパターンは、相関を取る画素の組合せを示す情 報であり、マスクパターンによって選択された画素のデータは相関値の計算に使用さ れるが、マスクパターンによって選択されな力つた画素は無視される。前記したように 、マスクパターンでは注目画素(中心の画素)は必ず選択される。また、 2値画像で 0 次〜 2次までの相関値を考えた場合、 3 X 3 X 3画素の立方体において重複を排除し た後のパターン数は 251個となる。
[0055] 図 5は、自己相関マスクパターンの例を示す説明図である。図 5 (1)は注目画素の みの最も簡単な 0次のマスクパターンである。 (2)はハッチングを施した 2つの画素が 選択されている 1次のマスクパターン例、(3)、 (4)はハッチングを施した 3つの画素 が選択されている 2次のマスクパターン例であり、この他に多数のパターンがある。
[0056] 図 3に戻って、 S33においては、前記した式 1を用いて相関値を計算する。式 2の r )Kr+a )- --Kr+a )はマスクパターンと対応する座標の差分 2値化 3次元データの画素値
1 N
を掛け合わせる(=相関値、 0または 1)ことに相当する。また、式 1の積分操作は注目 画素をフレーム内で移動 (スキャン)させて相関値をマスクパターンと対応するカウン タによって足し合わせる( 1をカウントする)ことに相当する。 [0057] S34においては、相関値は 1か否かが判定され、判定結果が肯定の場合には S35 に移行するが、否定の場合には S36に移行する。なお、実際の計算は、計算量を削 減するために、 S33で相関値を計算する前に、 S31の後で、まず参照点の画素値が 1か否かを判断し、 0ならば、相関を計算しても 0となるので S37にスキップする。 S35においては、マスクパターンと対応する相関パターンカウンタを + 1する。 S36に おいては、全てのパターンについて処理が完了した力否かが判定され、判定結果が 肯定の場合には S37に移行する力 否定の場合には S32に移行する。
[0058] S37においては、全ての画素について処理が完了したか否かが判定され、判定結 果が肯定の場合には S38に移行する力 否定の場合には S31に移行する。 S38に おいては、パターンカウンタ値の集合を 251次元フレーム CHLACデータとして出力 する。
[0059] 次に、本発明者らが行った実験結果について説明する。実験には画像データとし て、複数人が行き交う動画を用いた。この動画は数千フレーム力 成り、ごく一部に 異常動作である「転ぶ」動作の画像を含んでいる。実験の結果、正常動作の部分空 間の次元が安定するまでは、新しいサンプル画像は常に異なる次元に飛び出して垂 直距離 d丄として多少大きな値が出るが、ある程度特徴データが蓄積された中盤に お!、ては、正常動作の画像につ!、ては垂直距離 d丄の値は小さな値で安定しており 、異常動作である「転ぶ」フレームでのみ垂直距離 d丄の値が大きくなつて正しく異常 動作が検出できることを確認した。なお、正常動作部分空間の次元は常に 4次元程 度で変化しており、非常に小さいものとなっている。
[0060] 以上のように、実施例においては、 CHLAC特徴の加法性と部分空間法を用いて、 正常動作を統計的に部分空間として学習し、異常動作をそこからの逸脱として検出 することができる。この手法は、複数人の場合にも適用することができ、画面内で一人 でも異常動作を行えば、検出することができる。しカゝも、対象の切り出しは不要で、計 算量は人数に依らず一定であり、有効で実用性が高い手法である。また、この手法 では、正常動作を陽に定義することなく統計的に学習しているため、設計の段階で正 常動作とは何かにつ!/、て定義する必要がなぐ監視対象に則した自然な検出を行う ことができる。さらに、監視対象についての仮定や知識が全く必要ないので、人の動 作に限らず、さまざまな監視対象に対しても、正常 ·異常を判別できる汎用的な手法 である。また、オンライン学習によってリアルタイムに異常動作を検出することができる
[0061] 以上、異常動作の検出を行う実施例について説明したが、本発明には以下のよう な変形例も考えられる。実施例においては、正常動作の部分空間を更新しながら異 常動作の検出を行う例を開示したが、学習フェーズによって予め正常動作の部分空 間を生成しておくか、あるいは例えば 1分、 1時間あるいは 1日などのフレーム間隔よ りも長い所定の周期で正常動作の部分空間を生成して更新し、次の更新までは固定 した部分空間を使用して異常動作の検出を行ってもよい。このようにすれば処理量は 更に減少する。
更に、リアルタイムに部分空間を更新する学習法として、下記の非特許文献 3に開 示されているような、主成分分析による固有値問題を解かずに、入力データから逐次 近似的に固有ベクトルを求める方法を採用してもょ 、。
非特干文献 3 :Juyang Weng, Yilu Zhang and Wey-bhiuan Hwang, Candid し ovarian ce- Free Incremental Principal Component Analysis", IEEti, fransactions on Pattern Analysis and Machine Intelligence,Vol.25, No.8, pp.1034— 1040, 2003
[0062] 正常動作が複数パターン存在する場合、実施例の構成ではあまり正しく正常動作 部分空間を構成することができず、異常動作の検出精度が低下してしまうことがある 。そこで、正常動作部分空間内においてもクラスタリングを行った後、そこからの距離 を測るようにして多峰性の分布にも対応できるよう〖こすることが考えられる。
あるいは、複数の正常動作パターンのそれぞれについて部分空間を生成すること ができれば、それぞれの部分空間を使用して複数の異常判定を行い、複数の判定 結果の論理積を取って全てのパターンについて異常と判定されたものを異常とする ようにしてもよい。
[0063] 実施例においては、異常動作と判定されたフレームも正常動作の部分空間生成処 理に使用しているが、異常動作と判定されたフレームを部分空間生成処理力 除い てもよい。このようにすれば、異常動作の割合が高い場合や、画像サンプル数が少な V、場合等に検出精度が向上する。 実施例にお!、ては、 3次元の CHLACを計算する例を開示したが、用途や精度、計 算量の点を考慮して、 3次元の CHLACではなぐ各差分フレームから 2次元の高次 局所自己相関特徴を計算して、このデータ力 正常動作の部分空間を生成して異常 動作を検出するようにしてもよい。このようにすれば、歩くなどの周期的動作の場合に は時間方向の積分がない分誤差が大きくなるが、やはり異常行動を検出することが でき、 251次元の CHLACに比べて 25次元となるので大幅に計算が少なくて済む。 従って、応用に依っては有効である。

Claims

請求の範囲
[1] 複数の画像フレームデータからなる動画像データからフレーム間差分データを生 成する差分データ生成手段と、
前記フレーム間差分データ力 高次局所自己相関によって特徴データを抽出する 特徴データ抽出手段と、
過去に特徴データ抽出手段によって抽出された複数の特徴データ力 主成分分 析手法により得られた主成分ベクトルに基づく部分空間と、前記特徴データ抽出手 段により抽出された特徴データとの距離を計算する距離計算手段と、
前記距離が所定値よりも大きい場合に異常と判定する異常判定手段と、 前記異常判定手段が異常と判定した場合に判定結果を出力する出力手段と を備えたことを特徴とする異常動作検出装置。
[2] 前記特徴データ抽出手段は、直近の複数の前記フレーム間差分データからなる 3 次元データから立体高次局所自己相関によって特徴データを抽出するものであるこ とを特徴とする請求項 1に記載の異常動作検出装置。
[3] 更に、動画像フレームデータをリアルタイムで取り込む取り込み手段と、
取り込んだフレームデータを保存するフレームデータ保存手段と、
特徴データ抽出手段により抽出された特徴データを一定期間分だけ保存する保存 手段と、
前記保存手段に保存されている特徴データから主成分分析手法により得られた主 成分ベクトルに基づく部分空間を求めて部分空間情報を更新する部分空間更新手 段と
を備えたことを特徴とする請求項 2に記載の異常動作検出装置。
[4] 複数の画像フレームデータからなる動画像データからフレーム間差分データを生 成する第 1ステップと、
直近の複数の前記フレーム間差分データからなる 3次元データから立体高次局所 自己相関によって特徴データを抽出する第 2ステップと、
過去に抽出された複数の特徴データから主成分分析手法により得られた主成分べ タトルに基づく部分空間と特徴データとの距離を計算する第 3ステップと、 前記距離が所定値よりも大きい場合に異常と判定する第 4ステップと、
異常と判定された場合に判定結果を出力する第 5ステップと
を備えたことを特徴とする異常動作検出方法。
前記第 1ステップは、動画像フレームデータをリアルタイムで取り込むステップと、取 り込んだフレームデータを保存するステップとを含み、
前記第 3ステップは、特徴データ抽出手段により抽出された特徴データを一定期間 分だけ保存するステップと、保存されて!ヽる特徴データから主成分分析手法により得 られた主成分ベクトルに基づく部分空間を求めて部分空間情報を更新するステップ とを含むことを特徴とする請求項 4に記載の異常動作検出方法。
PCT/JP2005/016380 2004-09-08 2005-09-07 異常動作検出装置および異常動作検出方法 Ceased WO2006028106A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP05778592A EP1801757A4 (en) 2004-09-08 2005-09-07 DETECTOR FOR ABNORME ACTION AND DETECTION METHOD FOR ABNORME ACTION
US11/662,366 US20080123975A1 (en) 2004-09-08 2005-09-07 Abnormal Action Detector and Abnormal Action Detecting Method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004261179A JP4368767B2 (ja) 2004-09-08 2004-09-08 異常動作検出装置および異常動作検出方法
JP2004-261179 2004-09-08

Publications (1)

Publication Number Publication Date
WO2006028106A1 true WO2006028106A1 (ja) 2006-03-16

Family

ID=36036387

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/016380 Ceased WO2006028106A1 (ja) 2004-09-08 2005-09-07 異常動作検出装置および異常動作検出方法

Country Status (4)

Country Link
US (1) US20080123975A1 (ja)
EP (1) EP1801757A4 (ja)
JP (1) JP4368767B2 (ja)
WO (1) WO2006028106A1 (ja)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4701100B2 (ja) * 2006-02-17 2011-06-15 株式会社日立製作所 異常行動検知装置
JP4215781B2 (ja) * 2006-06-16 2009-01-28 独立行政法人産業技術総合研究所 異常動作検出装置および異常動作検出方法
JP4603512B2 (ja) * 2006-06-16 2010-12-22 独立行政法人産業技術総合研究所 異常領域検出装置および異常領域検出方法
JP4429298B2 (ja) * 2006-08-17 2010-03-10 独立行政法人産業技術総合研究所 対象個数検出装置および対象個数検出方法
JP5121258B2 (ja) 2007-03-06 2013-01-16 株式会社東芝 不審行動検知システム及び方法
JP4842197B2 (ja) * 2007-04-17 2011-12-21 財団法人ソフトピアジャパン 多重分割画像を用いた異常動作検出装置、異常動作検出方法及び異常動作検出用プログラム
JP4769983B2 (ja) * 2007-05-17 2011-09-07 独立行政法人産業技術総合研究所 異常検出装置および異常検出方法
JP4573857B2 (ja) * 2007-06-20 2010-11-04 日本電信電話株式会社 逐次更新型非定常検出装置、逐次更新型非定常検出方法、逐次更新型非定常検出プログラムおよびそのプログラムを記録した記録媒体
JP4925120B2 (ja) * 2007-07-02 2012-04-25 独立行政法人産業技術総合研究所 物体認識装置および物体認識方法
JP4654347B2 (ja) * 2007-12-06 2011-03-16 株式会社融合技術研究所 異常動作監視装置
JP4953211B2 (ja) * 2007-12-13 2012-06-13 独立行政法人産業技術総合研究所 特徴抽出装置および特徴抽出方法
WO2010111748A1 (en) * 2009-04-01 2010-10-07 Curtin University Of Technology Systems and methods for detecting anomalies from data
DE102009021765A1 (de) * 2009-05-18 2010-11-25 Deutsches Zentrum für Luft- und Raumfahrt e.V. Verfahren zum automatischen Erkennen einer Situationsänderung
JP2011048547A (ja) * 2009-08-26 2011-03-10 Toshiba Corp 異常行動検知装置、監視システム及び異常行動検知方法
JP5190968B2 (ja) * 2009-09-01 2013-04-24 独立行政法人産業技術総合研究所 動画像の圧縮方法及び圧縮装置
JP5131863B2 (ja) * 2009-10-30 2013-01-30 独立行政法人産業技術総合研究所 Hlac特徴量抽出方法、異常検出方法及び装置
CN102317978B (zh) * 2009-12-22 2014-11-12 松下电器产业株式会社 动作解析装置以及动作解析方法
JP5455787B2 (ja) * 2010-05-27 2014-03-26 パナソニック株式会社 動作解析装置および動作解析方法
JP5675229B2 (ja) 2010-09-02 2015-02-25 キヤノン株式会社 画像処理装置及び画像処理方法
AU2012288992B2 (en) * 2011-07-28 2015-03-12 Paul Scherrer Institut Method for image fusion based on principal component analysis
US9824296B2 (en) 2011-11-10 2017-11-21 Canon Kabushiki Kaisha Event detection apparatus and event detection method
CN103106394A (zh) * 2012-12-24 2013-05-15 厦门大学深圳研究院 一种视频监控中的人体行为识别方法
CN103902966B (zh) * 2012-12-28 2018-01-05 北京大学 基于序列时空立方体特征的视频交互事件分析方法及装置
CN103310463B (zh) * 2013-06-18 2016-01-20 西北工业大学 基于概率主成分分析和压缩感知的在线目标跟踪方法
JP6285116B2 (ja) * 2013-07-02 2018-02-28 Necプラットフォームズ株式会社 動作評価装置、動作評価方法及び動作評価プログラム
WO2015198767A1 (ja) * 2014-06-27 2015-12-30 日本電気株式会社 異常検知装置及び異常検知方法
JP6464635B2 (ja) * 2014-09-26 2019-02-06 株式会社リコー 画像処理装置、画像処理装置の制御方法、及びプログラム
WO2016079833A1 (ja) * 2014-11-19 2016-05-26 富士通株式会社 異常検出装置、異常検出方法および異常検出プログラム
WO2016088758A1 (ja) * 2014-12-01 2016-06-09 国立研究開発法人産業技術総合研究所 超音波検査システム及び超音波検査方法
CN106157326B (zh) * 2015-04-07 2020-10-27 中国科学院深圳先进技术研究院 群体异常行为检测方法及系统
CN107949865B (zh) * 2015-09-02 2021-10-29 富士通株式会社 异常检测装置、异常检测方法
JP6708385B2 (ja) 2015-09-25 2020-06-10 キヤノン株式会社 識別器作成装置、識別器作成方法、およびプログラム
JP6336952B2 (ja) * 2015-09-30 2018-06-06 セコム株式会社 群衆解析装置
SG10201510337RA (en) 2015-12-16 2017-07-28 Vi Dimensions Pte Ltd Video analysis methods and apparatus
CN105513095B (zh) * 2015-12-30 2019-04-09 山东大学 一种行为视频无监督时序分割方法
JP6702340B2 (ja) * 2016-01-28 2020-06-03 株式会社リコー 画像処理装置、撮像装置、移動体機器制御システム、画像処理方法、及びプログラム
JP6884517B2 (ja) 2016-06-15 2021-06-09 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
JP7035395B2 (ja) * 2017-09-13 2022-03-15 沖電気工業株式会社 異常検知システム、情報処理装置、及び、異常検知方法
CN111149129A (zh) 2017-09-21 2020-05-12 株式会社安德科技术 异常检测装置及异常检测方法
CN110276398A (zh) * 2019-06-21 2019-09-24 北京滴普科技有限公司 一种视频异常行为自动判断方法
US11526958B2 (en) 2019-06-26 2022-12-13 Halliburton Energy Services, Inc. Real-time analysis of bulk material activity
CN112822434A (zh) * 2019-11-15 2021-05-18 西安科芮智盈信息技术有限公司 防窃照处理方法、设备及系统
KR102770773B1 (ko) * 2022-07-25 2025-02-24 주식회사 아임토리 인공지능 기반의 로봇 팔 이미지 데이터 처리 방법
CN116884187B (zh) * 2023-06-25 2026-02-06 吉林金域医学检验所有限公司 实验室监测方法、装置、电子设备及存储介质

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0363828B1 (en) * 1988-10-11 1999-01-07 Kabushiki Kaisha Ouyo Keisoku Kenkyusho Method and apparatus for adaptive learning type general purpose image measurement and recognition
US6545115B2 (en) * 1996-12-11 2003-04-08 Rhodia Chimie Process for preparing a stable silicone oil containing SiH groups and hydrosilylable functions
US6466685B1 (en) * 1998-07-14 2002-10-15 Kabushiki Kaisha Toshiba Pattern recognition apparatus and method
JP4226730B2 (ja) * 1999-01-28 2009-02-18 株式会社東芝 物体領域情報生成方法及び物体領域情報生成装置並びに映像情報処理方法及び情報処理装置
EP1297691A2 (en) * 2000-03-07 2003-04-02 Sarnoff Corporation Camera pose estimation
US7522186B2 (en) * 2000-03-07 2009-04-21 L-3 Communications Corporation Method and apparatus for providing immersive surveillance
US7110569B2 (en) * 2001-09-27 2006-09-19 Koninklijke Philips Electronics N.V. Video based detection of fall-down and other events
US7016884B2 (en) * 2002-06-27 2006-03-21 Microsoft Corporation Probability estimate for K-nearest neighbor
CN100477745C (zh) * 2002-08-09 2009-04-08 夏普株式会社 图像合成装置和图象合成方法
JP3954484B2 (ja) * 2002-12-12 2007-08-08 株式会社東芝 画像処理装置およびプログラム
JP4090388B2 (ja) * 2003-05-27 2008-05-28 三洋電機株式会社 電波受信装置
US7616782B2 (en) * 2004-05-07 2009-11-10 Intelliview Technologies Inc. Mesh based frame processing and applications
US20060018516A1 (en) * 2004-07-22 2006-01-26 Masoud Osama T Monitoring activity using video information
JP3970877B2 (ja) * 2004-12-02 2007-09-05 独立行政法人産業技術総合研究所 追跡装置および追跡方法
US7739284B2 (en) * 2005-04-20 2010-06-15 International Business Machines Corporation Method and apparatus for processing data streams
US7376246B2 (en) * 2005-06-27 2008-05-20 Mitsubishi Electric Research Laboratories, Inc. Subspace projection based non-rigid object tracking with particle filters
US7760911B2 (en) * 2005-09-15 2010-07-20 Sarnoff Corporation Method and system for segment-based optical flow estimation
JP4603512B2 (ja) * 2006-06-16 2010-12-22 独立行政法人産業技術総合研究所 異常領域検出装置および異常領域検出方法
JP4215781B2 (ja) * 2006-06-16 2009-01-28 独立行政法人産業技術総合研究所 異常動作検出装置および異常動作検出方法
JP4429298B2 (ja) * 2006-08-17 2010-03-10 独立行政法人産業技術総合研究所 対象個数検出装置および対象個数検出方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
KOBAYASHI T.ET AL: "Action and Simultaneous Multiple-Person Identification Using Cubic Higher-order Local Auto-Correlation", PROCEEDINGS OF THE 17TH INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR'04), vol. 4, 2004, pages 741 - 744, XP010724027 *
See also references of EP1801757A4 *
YOSUKE YAMADA ET AL: "Koji Kyokusho Jiho Sokan Tokucho to Hanbetsu Bunseki ni yoru Kao Gazo no Hyojo Ninshiki. (The Expression Recognition......)", ITE TECHNICAL REPORT, 2003 NEN 2 GATU KAISAIBUN, THE INSTITUTE OF IMAGE INFORMATION AND TELEVISION ENGINEERS, vol. 27, no. 8, 3 February 2003 (2003-02-03), pages 145 - 148, XP002998978 *

Also Published As

Publication number Publication date
JP2006079272A (ja) 2006-03-23
JP4368767B2 (ja) 2009-11-18
US20080123975A1 (en) 2008-05-29
EP1801757A1 (en) 2007-06-27
EP1801757A4 (en) 2012-02-01

Similar Documents

Publication Publication Date Title
WO2006028106A1 (ja) 異常動作検出装置および異常動作検出方法
JP4215781B2 (ja) 異常動作検出装置および異常動作検出方法
CN109076198B (zh) 基于视频的对象跟踪遮挡检测系统、方法和设备
US7916944B2 (en) System and method for feature level foreground segmentation
JP4842197B2 (ja) 多重分割画像を用いた異常動作検出装置、異常動作検出方法及び異常動作検出用プログラム
JP3970877B2 (ja) 追跡装置および追跡方法
Avgerinakis et al. Recognition of activities of daily living for smart home environments
KR101750094B1 (ko) 영상의 실시간 모니터링을 통한 비정상 집단행동 분류 방법
JP4061377B2 (ja) 3次元データからの特徴抽出装置
US20100195899A1 (en) Detection of people in real world videos and images
EP2352128A1 (en) Mobile body detection method and mobile body detection apparatus
Poonsri et al. Improvement of fall detection using consecutive-frame voting
Moore A real-world system for human motion detection and tracking
Wang et al. Experiential sampling for video surveillance
Siva et al. Real-time, embedded scene invariant crowd counting using scale-normalized histogram of moving gradients (HoMG)
JP5186656B2 (ja) 動作評価装置および動作評価方法
Villamizar et al. Watchnet: Efficient and depth-based network for people detection in video surveillance systems
Xie et al. Recognizing violent activity without decoding video streams
Saxena et al. Video inpainting detection and localization using inconsistencies in optical flow
Biswas et al. Short local trajectory based moving anomaly detection
JP2014182585A (ja) 画像解析装置、画像解析方法および画像解析プログラム
CN102254329A (zh) 基于运动向量归类分析的异常行为检测方法
JP2015049702A (ja) 対象認識装置、対象認識方法、およびプログラム
Mantini et al. A signal detection theory approach for camera tamper detection
Iqbal et al. On video based human abnormal activity detection with histogram of oriented gradients

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2005778592

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2005778592

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 11662366

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 11662366

Country of ref document: US