WO2003003307A1 - Image processing apparatus and method, and image pickup apparatus - Google Patents

Image processing apparatus and method, and image pickup apparatus Download PDF

Info

Publication number
WO2003003307A1
WO2003003307A1 PCT/JP2002/006385 JP0206385W WO03003307A1 WO 2003003307 A1 WO2003003307 A1 WO 2003003307A1 JP 0206385 W JP0206385 W JP 0206385W WO 03003307 A1 WO03003307 A1 WO 03003307A1
Authority
WO
WIPO (PCT)
Prior art keywords
pixel
background
pixel data
frame
foreground
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2002/006385
Other languages
English (en)
French (fr)
Inventor
Tetsujiro Kondo
Takahiro Nagano
Junichi Ishibashi
Takashi Sawao
Naoki Fujiwara
Seiji Wada
Toru Miyake
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to KR1020037002804A priority Critical patent/KR100894923B1/ko
Priority to CA002420069A priority patent/CA2420069C/en
Priority to US10/362,558 priority patent/US7181080B2/en
Priority to EP02741315A priority patent/EP1400925A4/en
Priority to MXPA03001576A priority patent/MXPA03001576A/es
Publication of WO2003003307A1 publication Critical patent/WO2003003307A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Definitions

  • Image processing apparatus and method and imaging apparatus
  • the present invention relates to an image processing apparatus and method, and an image capturing apparatus, and more particularly to an image processing apparatus and method that takes into account a difference between a signal detected by a sensor and the real world, and an image capturing apparatus.
  • motion blur occurs when the moving speed of the object is relatively high.
  • the present invention has been made in view of such a situation, and has an object to specify an area of a background image, an area of an image of a moving object, and an area of an image in which mixing occurs.
  • the purpose is to:
  • the image processing apparatus is configured to convert pixel data of a peripheral frame around a frame of interest corresponding to a pixel of interest of the frame of interest of image data into a background object serving as a background among a plurality of objects of the image data. And extract the target pixel data of the target pixel existing in the target frame.
  • a relational expression generating means for generating a plurality of relational expressions indicating the relation between the target pixel data and the background pixel data for the eye pixel; and a plurality of relational expressions in the real world corresponding to the target pixel based on the relational expression.
  • a mixing ratio detecting means for detecting a mixing ratio indicating the mixing state of the object; a prediction error calculating means for calculating a prediction error by substituting the mixing ratio detected by the mixing ratio detecting means into a relational expression;
  • the area to which the pixel of interest belongs is a mixed area in which a plurality of objects are mixed, and is formed at the tip of the foreground object, which is the foreground of the plurality of objects, in the movement direction.
  • An uncovered background area that is a covered background area or a mixed area that is formed at the rear end of the foreground object in the direction of motion.
  • a covered background area for specifying whether there is an object, an uncovered background area specifying means, and an area to which the pixel of interest belongs is a foreground area consisting only of foreground object components constituting a foreground object, or a background object.
  • a foreground area background area specifying means for specifying whether or not the background area consists only of the background object component.
  • the mixture ratio detecting means detects a foreground object component included in the pixel of interest based on the relational expression, corresponding to the pixel of interest, and detects a mixture ratio.
  • the prediction error can be calculated by substituting the detected mixture ratio and the foreground object component included in the pixel of interest into the relational expression.
  • the relational expression generation means extracts the pixel data of the peripheral frame corresponding to the target pixel as background pixel data corresponding to the background object, and extracts the pixel data of the target pixel and the vicinity of the target pixel in the target frame. Extracts neighboring pixel data of the neighboring pixels located, and, for the pixel of interest, a plurality of relationships indicating the relationship between the pixel data of interest, the neighboring pixel data, and the background pixel data corresponding to the pixel data of interest or the neighboring pixel data. An expression can be generated.
  • the relational expression generating means performs the first approximation that the foreground object components included in the target pixel data and the neighboring pixel data are equal, and the change of the mixture ratio in the mixed region.
  • a plurality of relational expressions can be generated based on a second approximation that the transformation is linear with respect to the position of the pixel in the mixed area.
  • the relational expression generating means performs the first approximation that the foreground object components included in the target pixel data and the neighboring pixel data are equal, and that the change in the mixture ratio in the mixed region is based on the position of the pixel in the mixed region.
  • a plurality of relational expressions can be generated based on a second approximation that is assumed to be planar.
  • the mixture ratio detection means can detect the mixture ratio by solving a plurality of relational expressions by the least square method.
  • the relational expression generation means extracts the pixel data of the frame before the target frame as background pixel data, and determines that the target pixel belongs to the uncovered background area.
  • the pixel data of the frame following the frame of interest can be extracted as background pixel data, and a plurality of relational expressions can be generated.
  • the relational expression generating means extracts mixed pixel data in which a plurality of objects are in a mixed state from the attention frame and the surrounding frame based on the movement of the foreground object in accordance with the target pixel, and Based on the motion of the background object, the background pixel data corresponding to the background object is extracted from a frame different from the frame from which the mixed pixel data was extracted, and multiple relational expressions are calculated. Can be generated.
  • the relational expression generating means is based on the first approximation that the foreground object components corresponding to the mixed pixel data are equal, and the second approximation that the mixed pixel data extracted from the frame of interest and the surrounding frame is constant. Thus, a plurality of relational expressions can be generated.
  • the relational expression generating means extracts mixed pixel data in which a plurality of objects are in a mixed state from the attention frame and the surrounding frame based on the movement of the foreground object in accordance with the target pixel, and Corresponding to each of the following, based on the motion of the background object, from the frame before the frame from which the mixed pixel data was extracted, The background pixel data corresponding to the background object is extracted, a plurality of relational expressions are generated, and the power bird background area and the uncovered background area specifying means uncover the area where the prediction error is equal to or greater than a predetermined threshold. It can be specified as an area.
  • the relational expression generating means extracts mixed pixel data in which a plurality of objects are in a mixed state from the attention frame and the surrounding frame based on the movement of the foreground object in accordance with the target pixel, and Based on the motion of the background object, background pixel data corresponding to the background object is extracted from the frame following the frame from which the mixed pixel data is extracted, and a plurality of relational expressions are generated.
  • the bird background area / covered background area specifying means can specify an area where the prediction error is equal to or larger than a predetermined threshold value as a covered background area.
  • pixel data of a peripheral frame around a frame of interest corresponding to a pixel of interest of the frame of interest of image data is converted into a background object as a background among a plurality of objects of the image data.
  • target pixel data of the target pixel existing in the target frame is extracted, and a plurality of relational expressions indicating the relationship between the target pixel data and the background pixel data are obtained for the target pixel.
  • a relational expression generation step to generate, and a mixture ratio detection step for detecting a mixture ratio indicating a mixture state of a plurality of objects in the real world based on the relational expression.
  • the area to which the pixel of interest belongs is a mixed area formed by mixing a plurality of objects, and a covered back formed at the tip of the foreground object, which is the foreground of the plurality of objects, in the direction of movement.
  • the mixture ratio detection step detects a foreground object component included in the pixel of interest corresponding to the pixel of interest based on the relational expression, detects a mixture ratio, and calculates a prediction error.
  • the prediction error can be calculated by substituting the mixture ratio detected by the above processing and the foreground object component included in the pixel of interest into the relational expression.
  • the pixel data of the peripheral frame corresponding to the target pixel is extracted as background pixel data corresponding to the background object, and the target pixel data of the target pixel and the vicinity of the target pixel in the target frame are extracted. Extracts neighboring pixel data of the neighboring pixels located and generates a plurality of relational expressions for the pixel of interest, showing the relationship between the pixel data of interest, the neighboring pixel data, and the background pixel data corresponding to the pixel data of interest or neighboring pixel data. You can make it.
  • the relational expression generation step includes a first approximation that the foreground object components included in the target pixel data and the neighboring pixel data are equal, and a change in the mixture ratio in the mixed region is linear with respect to the position of the pixel in the mixed region. It is possible to generate a plurality of relational expressions based on the second approximation that is appropriate.
  • the relational expression generation step includes a first approximation that the foreground object components included in the target pixel data and the neighboring pixel data are equal, and a change in the mixing ratio in the mixed region is a plane relative to the position of the pixel in the mixed region. It is possible to generate a plurality of relational expressions based on the second approximation that is appropriate.
  • the mixture ratio can be detected by solving a plurality of relational expressions by the least square method.
  • the relational expression generation step is as follows. If the target pixel belongs to the covered background area, the pixel data of the frame before the target frame is extracted as background pixel data, and the target pixel is set in the uncovered background area. If they belong, The pixel data of the frame next to the frame of interest can be extracted as background pixel data, and a plurality of relational expressions can be generated.
  • the relational expression generation step extracts mixed pixel data in which a plurality of objects are in a mixed state from the frame of interest and peripheral frames based on the movement of the foreground object in accordance with the pixel of interest. Based on the motion of the background object, the background pixel data corresponding to the background object is extracted from a frame different from the frame from which the mixed pixel data was extracted, and multiple relational expressions are extracted. Can be generated.
  • the relational expression generation step includes a first approximation that the foreground object components corresponding to the mixed pixel data are equal, and a second approximation that the mixed pixel data extracted from the frame of interest and the surrounding frame is constant. Based on this, a plurality of relational expressions can be generated.
  • the relational expression generation step extracts mixed pixel data in which a plurality of objects are in a mixed state from the frame of interest and peripheral frames based on the movement of the foreground object in accordance with the pixel of interest. Based on the movement of the background object, the background pixel data corresponding to the background object is extracted from the frame before the frame from which the mixed pixel data is extracted, and a plurality of relational expressions are generated.
  • the power bird background area uncovered background area specifying step may specify an area where the prediction error is equal to or greater than a predetermined threshold to be an covered background area.
  • the relational expression generating step extracts mixed pixel data in which a plurality of objects are in a mixed state from the frame of interest and peripheral frames, based on the movement of the foreground object, in accordance with the pixel of interest. Based on the movement of the background object, the background pixel data corresponding to the background object is extracted from the frame following the frame from which the mixed pixel data was extracted, and multiple relational expressions are generated.
  • the bird's-background area uncovered background area specifying step is a step in which the area where the prediction error is equal to or more than a predetermined threshold is regarded as the covered background area. Can be specified.
  • the program of the recording medium is a program for converting a pixel data of a peripheral frame around a target frame corresponding to a target pixel of the target frame of image data into a background object as a background among a plurality of objects of the image data. And extracting the target pixel data of the target pixel existing in the target frame and generating a plurality of relational expressions indicating the relation between the target pixel data and the background pixel data for the target pixel.
  • a mixture ratio detection step for detecting a mixture state indicating a mixture state of a plurality of objects in the real world based on the relational expression, based on the relational expression, and a mixture ratio detection step,
  • a prediction error calculation step of calculating a prediction error by substituting the calculated mixture ratio into a relational expression.
  • the region to which the pixel of interest belongs is a mixed region formed by mixing a plurality of objects, and is formed at the leading end in the movement direction of the foreground object that is the foreground of the plurality of objects.
  • a force background area that determines whether the area is a covered background area or a mixed area, which is an uncovered background area formed at the rear end of the foreground object in the direction of motion.
  • the step of identifying the covered background area and the area to which the pixel of interest belongs is either a foreground area consisting only of the foreground object components that make up the foreground object, or a spine consisting only of the background object component that makes up the background object.
  • a foreground area / background area specifying step for specifying whether the area is a scene area.
  • the mixture ratio detection step detects a foreground object component included in the pixel of interest corresponding to the pixel of interest based on the relational expression, detects the mixture ratio, and calculates the prediction error.
  • the prediction error can be calculated by substituting the mixture ratio detected by the above processing and the foreground object component included in the pixel of interest into the relational expression.
  • the pixel data of the peripheral frame corresponding to the target pixel is extracted as background pixel data corresponding to the background object, and the pixel data of the target pixel is extracted. Extract the pixel data of interest and the neighboring pixel data of the neighboring pixel located in the vicinity of the pixel of interest in the frame of interest, and for the pixel of interest, correspond to the pixel data of interest and neighboring pixel data, and the pixel data of interest or neighboring pixel data A plurality of relational expressions indicating the relation between the background pixel data can be generated.
  • the relational expression generation step includes a first approximation that the foreground object components included in the target pixel data and the neighboring pixel data are equal, and a change in the mixture ratio in the mixed region is linear with respect to the position of the pixel in the mixed region. It is possible to generate a plurality of relational expressions based on the second approximation that is appropriate.
  • the relational expression generation step includes a first approximation that the foreground object components included in the target pixel data and the neighboring pixel data are equal, and a change in the mixture ratio in the mixed region indicates a position of a pixel in the mixed region.
  • a plurality of relational expressions can be generated based on a second approximation that is assumed to be planar.
  • the mixture ratio can be detected by solving a plurality of relational expressions by the least square method.
  • the relational expression generation step if the target pixel belongs to the covered background area, the pixel data of the frame before the target frame is extracted as background pixel data, and the target pixel belongs to the uncovered background area.
  • the pixel data of the frame next to the frame of interest can be extracted as background pixel data, and a plurality of relational expressions can be generated.
  • the relational expression generating step extracts mixed pixel data in which a plurality of objects are in a mixed state from the frame of interest and peripheral frames, based on the movement of the foreground object, in accordance with the pixel of interest. Based on the motion of the background object, the background pixel data corresponding to the background object is extracted from a frame different from the frame from which the mixed pixel data was extracted, and multiple relational expressions are extracted. Can be generated.
  • the relational expression generation step the first approximation that the foreground object components corresponding to the mixed pixel data are equal, and extracted from the frame of interest and the surrounding frame A plurality of relational expressions can be generated based on the second approximation that the mixed pixel data is constant.
  • the relational expression generation step extracts mixed pixel data in which a plurality of objects are in a mixed state from the frame of interest and peripheral frames based on the movement of the foreground object in accordance with the pixel of interest. Based on the motion of the background object, the background pixel data corresponding to the background object is extracted from the frame before the frame from which the mixed pixel data was extracted, and multiple relational expressions are generated.
  • the power bird background area uncovered background area specifying step can specify an area in which the prediction error is equal to or greater than a predetermined threshold as the uncovered background area.
  • the relational expression generation step extracts mixed pixel data in which a plurality of objects are in a mixed state from the frame of interest and peripheral frames based on the movement of the foreground object, corresponding to the pixel of interest, and extracts the mixed pixel data. Based on the motion of the background object, the background pixel data corresponding to the background object is extracted from the frame following the frame from which the mixed pixel data is extracted, and a plurality of relational expressions are generated. In the uncovered background area specifying step, the area where the prediction error is equal to or larger than a predetermined threshold can be specified as the covered background area.
  • the program according to the present invention stores, in a computer, pixel data of a peripheral frame around the frame of interest corresponding to the pixel of interest of the frame of interest in the image data, as a background object as a background among a plurality of objects of the image data. Is extracted as background pixel data corresponding to, the target pixel data of the target pixel existing in the target frame is extracted, and a plurality of relational expressions are generated for the target pixel, indicating the relationship between the target pixel data and the background pixel data.
  • a relational expression generation step a mixture ratio detection step of detecting a mixture ratio indicating a mixture state of a plurality of objects in the real world based on the relational expression, corresponding to a target pixel, and a mixture ratio detection step Prediction error calculation step for calculating the prediction error by substituting the mixture ratio detected by
  • the region to which the pixel of interest belongs is a mixed region in which a plurality of objects are mixed, and the motion direction of the foreground object, which is the foreground of the plurality of objects, based on the Is a covered background area formed at the front end of the foreground object, or an uncovered background area formed at the rear end of the foreground object in the movement direction of the foreground object.
  • the area to which the pixel of interest belongs is a foreground area consisting only of the foreground object components that make up the foreground object, or a background object that makes up the background object
  • a foreground area background area identification step for identifying whether the area is a background area consisting only of components is executed. It is characterized by having
  • the mixture ratio detection step detects a foreground object component included in the pixel of interest corresponding to the pixel of interest based on the relational expression, detects the mixture ratio, and calculates the prediction error.
  • the prediction error can be calculated by substituting the mixture ratio detected by the above processing and the foreground object component included in the pixel of interest into the relational expression.
  • the pixel data of the peripheral frame corresponding to the target pixel is extracted as background pixel data corresponding to the background object, and the target pixel data of the target pixel and the vicinity of the target pixel in the target frame are extracted. Extracts neighboring pixel data of the neighboring pixels located and generates a plurality of relational expressions for the pixel of interest, showing the relationship between the pixel data of interest, the neighboring pixel data, and the background pixel data corresponding to the pixel data of interest or neighboring pixel data. You can make it.
  • the relational expression generation step includes a first approximation that the foreground object components included in the target pixel data and the neighboring pixel data are equal, and a change in the mixture ratio in the mixed region is linear with respect to the position of the pixel in the mixed region. It is possible to generate a plurality of relational expressions based on the second approximation that is appropriate.
  • the relational expression generation step includes a first approximation that the foreground object components included in the target pixel data and the neighboring pixel data are equal, and a mixing ratio in the mixed region.
  • a plurality of relational expressions can be generated based on a second approximation that the change of the pixel is planar with respect to the position of the pixel in the mixed area.
  • the mixture ratio can be detected by solving a plurality of relational expressions by the least square method.
  • the relational expression generation step if the target pixel belongs to the covered background area, the pixel data of the frame before the target frame is extracted as background pixel data, and the target pixel belongs to the uncovered background area.
  • the pixel data of the frame next to the frame of interest can be extracted as background pixel data, and a plurality of relational expressions can be generated.
  • the relational expression generation step extracts mixed pixel data in which a plurality of objects are in a mixed state from the frame of interest and peripheral frames based on the movement of the foreground object in accordance with the pixel of interest. Based on the motion of the background object, the background pixel data corresponding to the background object is extracted from a frame different from the frame from which the mixed pixel data was extracted, and multiple relational expressions are extracted. Can be generated.
  • the relational expression generation step includes a first approximation that the foreground object components corresponding to the mixed pixel data are equal, and a second approximation that the mixed pixel data extracted from the frame of interest and the surrounding frame is constant. Based on this, a plurality of relational expressions can be generated.
  • the relational expression generation step extracts mixed pixel data in which a plurality of objects are in a mixed state from the frame of interest and peripheral frames based on the movement of the foreground object in accordance with the pixel of interest. Based on the movement of the background object, the background pixel data corresponding to the background object is extracted from the frame before the frame from which the mixed pixel data is extracted, and a plurality of relational expressions are generated.
  • the bird's-eye background area uncovered background area specifying step may specify an area where the prediction error is equal to or greater than a predetermined threshold as an uncovered background area.
  • the relational expression generation step includes extracting mixed pixel data in which a plurality of objects are in a mixed state from the frame of interest and peripheral frames, based on the movement of the foreground object, corresponding to the target pixel. Based on the motion of the background object, the background pixel data corresponding to the background object is extracted from the frame following the frame from which the mixed pixel data was extracted, and multiple relational expressions are generated.
  • the power bird background area uncovered background area specifying step an area in which the prediction error is equal to or larger than a predetermined threshold can be specified as a covered background area.
  • An imaging device includes: an imaging unit that outputs a subject image captured by an imaging element having a predetermined number of pixels having a time integration effect as image data including a predetermined number of pixel data;
  • the pixel data of the peripheral frame around the frame of interest corresponding to the pixel of interest is extracted as background pixel data corresponding to the background object that is the background of the plurality of objects of the image data, and
  • a relational expression generating means for extracting a plurality of relational expressions indicating the relation between the target pixel data and the background pixel data for the target pixel by extracting target pixel data of an existing target pixel.
  • a mixing ratio detecting means for detecting a mixing ratio indicating a mixed state of a plurality of objects in the real world.
  • a prediction error calculating means for calculating a prediction error by substituting the mixing ratio detected by the mixing ratio detecting means into a relational expression; and, based on the prediction error, a region to which a target pixel belongs and a plurality of objects mixed.
  • a force or a mixed area which is a cover background area formed on the leading end side in the direction of movement of the foreground object which is a foreground of the plurality of objects,
  • a covered background area for identifying whether or not an uncovered background area is formed at the rear end of the foreground object in the direction of movement of the foreground object. Is the foreground area consisting of only the foreground object components that compose the background object, or the spine that composes the background object.
  • Foreground area background specifying whether a background area consisting of only Obujuku preparative component Region specifying means.
  • the mixture ratio detecting means detects a foreground object component included in the pixel of interest based on the relational expression, corresponding to the pixel of interest, and detects a mixture ratio.
  • the prediction error can be calculated by substituting the detected mixture ratio and the foreground object component contained in the target pixel into the relational expression.
  • the relational expression generation means extracts the pixel data of the peripheral frame corresponding to the target pixel as background pixel data corresponding to the background object, and extracts the pixel data of the target pixel and the vicinity of the target pixel in the target frame. Extracts neighboring pixel data of the neighboring pixels located, and, for the pixel of interest, a plurality of relationships indicating the relationship between the pixel data of interest, the neighboring pixel data, and the background pixel data corresponding to the pixel data of interest or the neighboring pixel data. An expression can be generated.
  • the relational expression generating means performs the first approximation that the foreground object components included in the target pixel data and the neighboring pixel data are equal, and that the change in the mixture ratio in the mixed region is based on the position of the pixel in the mixed region.
  • a plurality of relational expressions can be generated based on a second approximation that is linear.
  • the relational expression generating means performs the first approximation that the foreground object components included in the target pixel data and the neighboring pixel data are equal, and that the change in the mixture ratio in the mixed region is based on the position of the pixel in the mixed region.
  • a plurality of relational expressions can be generated based on a second approximation that is assumed to be planar.
  • the mixture ratio detection means can detect the mixture ratio by solving a plurality of relational expressions by the least square method.
  • the relational expression generation means extracts the pixel data of the frame before the target frame as background pixel data, and determines that the target pixel belongs to the uncovered background area.
  • the pixel data of the frame following the frame of interest can be extracted as background pixel data, and a plurality of relational expressions can be generated.
  • the relational expression generating means extracts mixed pixel data in which a plurality of objects are in a mixed state from the attention frame and the surrounding frame based on the movement of the foreground object in accordance with the target pixel, and Based on the motion of the background object, the background pixel data corresponding to the background object is extracted from a frame different from the frame from which the mixed pixel data was extracted, and multiple relational expressions are calculated. Can be generated.
  • the relational expression generating means is based on the first approximation that the foreground object components corresponding to the mixed pixel data are equal, and the second approximation that the mixed pixel data extracted from the frame of interest and the surrounding frame is constant. Thus, a plurality of relational expressions can be generated.
  • the relational expression generating means extracts mixed pixel data in which a plurality of objects are in a mixed state from the attention frame and the surrounding frame based on the movement of the foreground object in accordance with the target pixel, and Based on the motion of the background object, the background pixel data corresponding to the background object is extracted from the frame before the frame from which the mixed pixel data is extracted, and a plurality of relational expressions are generated.
  • the bird's-eye-background-area-covered-background-area specifying means can specify an area in which the prediction error is equal to or greater than a predetermined threshold as an uncovered background area.
  • the relational expression generating means extracts mixed pixel data in which a plurality of objects are in a mixed state from the attention frame and the surrounding frame based on the movement of the foreground object in accordance with the target pixel, and Based on the motion of the background object, background pixel data corresponding to the background object is extracted from the frame following the frame from which the mixed pixel data is extracted, and a plurality of relational expressions are generated.
  • the bird background area / covered background area specifying means can specify an area where the prediction error is equal to or larger than a predetermined threshold value as a covered background area.
  • the pixel data of the frame is extracted as background pixel data corresponding to a background object serving as a background of the plurality of objects of the image data, and the pixel data of the pixel of interest existing in the frame of interest is extracted.
  • a plurality of relational expressions indicating the relationship between the target pixel data and the background pixel data are generated, and based on the relational expression, indicate a mixed state of a plurality of objects in the real world corresponding to the target pixel.
  • a mixture ratio is detected, and a prediction error is calculated by substituting the detected mixture ratio into a relational expression.Based on the prediction error, a region to which a pixel of interest belongs is mixed with a plurality of objects.
  • a covered background formed at the front end side in the movement direction of the foreground object which is the foreground of the plurality of objects in the mixed area It is specified whether the area is a mixed area or an uncovered background area formed at the rear end of the foreground object in the movement direction of the foreground object. It is specified whether it is a foreground region consisting only of the foreground object components that make up the background object or a background region consisting only of the background object components that make up the background object.
  • FIG. 1 is a diagram showing an embodiment of an image processing apparatus according to the present invention.
  • FIG. 2 is a block diagram illustrating the image processing apparatus.
  • FIG. 3 is a diagram illustrating imaging by a sensor.
  • FIG. 4 is a diagram illustrating the arrangement of pixels.
  • FIG. 5 is a diagram illustrating the operation of the detection element.
  • FIG. 6A is a diagram illustrating an image obtained by capturing an object corresponding to a moving foreground and an object corresponding to a stationary background.
  • FIG. 6B is a diagram illustrating a model of an image obtained by capturing an object corresponding to a moving foreground and an object corresponding to a stationary background.
  • FIG. 7 is a diagram illustrating a background area, a foreground area, a mixed area, a covered background area, and an uncovered background area.
  • Figure 8 shows the time-wise expansion of the pixel values of the pixels that are adjacent to each other in a row in the image of the object corresponding to the stationary foreground and the object corresponding to the stationary background. It is a model figure.
  • FIG. 9 is a model diagram in which pixel values are developed in the time direction and a period corresponding to the shutter time is divided.
  • FIG. 10 is a model diagram in which pixel values are developed in the time direction and a period corresponding to the shirt time is divided.
  • FIG. 11 is a model diagram in which pixel values are developed in the time direction and a period corresponding to the shirt time is divided.
  • FIG. 12 is a diagram illustrating an example in which pixels in a foreground area, a background area, and a mixed area are extracted.
  • Fig. 13 is a diagram showing the correspondence between pixels and a model in which pixel values are expanded in the time direction.
  • Fig. 14 is a model in which pixel values are expanded in the time direction and a period corresponding to the shirt time is divided.
  • FIG. 15 is a model diagram in which pixel values are developed in the time direction and a period corresponding to the shutter time is divided.
  • FIG. 16 is a model diagram in which pixel values are developed in the time direction and a period corresponding to the shutter time is divided.
  • FIG. 17 is a model diagram in which pixel values are developed in the time direction and a period corresponding to the shutter time is divided.
  • FIG. 18 is a model diagram in which pixel values are developed in the time direction and a period corresponding to the shirt time is divided.
  • FIG. 19 is a flowchart illustrating the process of adjusting the amount of motion blur.
  • FIG. 20 is a block diagram showing the configuration of the mixture ratio calculation unit 103. As shown in FIG.
  • FIG. 21 is a diagram showing an example of an ideal mixing ratio.
  • FIG. 22 is a model diagram in which pixel values are developed in the time direction and a period corresponding to the shirt time is divided.
  • FIG. 23 is a model diagram in which pixel values are developed in the time direction and a period corresponding to the shirt time is divided.
  • FIG. 24 is a diagram illustrating selection of a pixel.
  • FIG. 25 is a diagram illustrating selection of a pixel.
  • FIG. 26 is a block diagram illustrating a configuration of the estimated mixture ratio processing unit 201.
  • FIG. 27 is a flowchart illustrating a process of calculating the estimated mixture ratio.
  • FIG. 28 is a flowchart illustrating a process of calculating a mixture ratio estimation using a model corresponding to the covered background region.
  • FIG. 29 is a block diagram showing another configuration of the mixture ratio calculating section 103. As shown in FIG.
  • FIG. 30 is a diagram illustrating a straight line that approximates the mixture ratio H.
  • FIG. 31 is a diagram illustrating a plane approximating the mixture ratio a.
  • FIG. 32 is a view for explaining the correspondence of pixels in a plurality of frames when calculating the mixture ratio ⁇ .
  • FIG. 33 is a flowchart illustrating the process of estimating the mixture ratio using a model corresponding to the covered background area.
  • FIG. 34 is a block diagram showing still another configuration of the mixture ratio calculating section 103.
  • FIG. 35 is a block diagram showing the configuration of the area specifying unit 104. As shown in FIG.
  • FIG. 36 is a diagram for explaining the determination process of the uncovered background area determination unit 303.
  • FIG. 37 is a diagram for explaining the determination process of the uncovered background area determination unit 303.
  • FIG. 38 is a diagram illustrating an example of an input image.
  • FIG. 39 is a diagram illustrating an example of the result of the area determination.
  • FIG. 40 is a diagram illustrating an example of the result of the area determination.
  • FIG. 41 is a diagram illustrating an example of an input image.
  • FIG. 42 is a diagram illustrating an example of the result of the area determination.
  • FIG. 43 is a diagram illustrating an example of the result of the area determination.
  • FIG. 44 is a block diagram illustrating another configuration of the area specifying unit 104.
  • FIG. 45 is a block diagram showing still another configuration of the area specifying unit 104.
  • FIG. 46 is a block diagram showing still another configuration of the area specifying unit 104.
  • FIG. 47 is a flowchart for explaining the area specifying process.
  • FIG. 48 is a flowchart illustrating a specific process of the covered background area.
  • FIG. 49 is a flowchart illustrating a specific process of the uncovered background area.
  • FIG. 50 is a block diagram showing an example of the configuration of the foreground / background separation unit 105.
  • FIG. 51A is a diagram illustrating an input image, a foreground component image, and a background component image.
  • FIG. 51B is a diagram illustrating an input image, a foreground component image, and a background component image.
  • FIG. 52 is a model diagram in which pixel values are developed in the time direction and a period corresponding to the shirt time is divided.
  • FIG. 53 is a model diagram in which pixel values are developed in the time direction and a period corresponding to the shirt time is divided.
  • FIG. 54 is a model diagram in which pixel values are developed in the time direction and a period corresponding to the shutter time is divided.
  • FIG. 55 is a block diagram illustrating an example of the configuration of the separation unit 600.
  • FIG. 56A is a diagram illustrating an example of a separated foreground component image.
  • FIG. 56B is a diagram illustrating an example of the separated background component image.
  • FIG. 57 is a flowchart for explaining the process of separating the foreground and the background.
  • FIG. 58 is a block diagram illustrating an example of the configuration of the motion-blur adjusting unit 106.
  • FIG. 59 is a diagram illustrating a processing unit.
  • FIG. 60 is a model diagram in which the pixel values of the foreground component image are developed in the time direction, and the period corresponding to the shutter time is divided.
  • FIG. 61 is a model diagram in which the pixel values of the foreground component image are developed in the time direction and the period corresponding to the shutter time is divided.
  • FIG. 62 is a model diagram in which the pixel values of the foreground component image are developed in the time direction, and the period corresponding to the time interval is divided.
  • FIG. 63 is a model diagram in which the pixel values of the foreground component image are developed in the time direction and the period corresponding to the shirt time is divided.
  • FIG. 64 is a diagram illustrating another configuration of the motion-blur adjusting unit 106.
  • FIG. 65 is a flowchart illustrating a process of adjusting the amount of motion blur included in the foreground component image by the motion blur adjustment unit 106.
  • FIG. 66 is a block diagram illustrating another example of the configuration of the motion-blur adjusting unit 106.
  • FIG. 67 is a diagram illustrating an example of a model that specifies a correspondence between a pixel value and a foreground component.
  • FIG. 68 is a diagram for explaining calculation of a foreground component.
  • FIG. 69 is a diagram for explaining calculation of a foreground component.
  • FIG. 70 is a flowchart for describing the process of removing motion blur in the foreground.
  • FIG. 1 is a diagram showing an embodiment of an image processing apparatus according to the present invention.
  • the CPU (Central Processing Unit) 21 executes various processes according to a program stored in a ROM (Read Only Memory) 22 or a storage unit 28.
  • ROM Read Only Memory
  • RAM Random Access Memory 23 programs executed by the CPU 21 and data are stored as appropriate.
  • the CPU 21, the ROM 22, and the RAM 23 are interconnected by a node 24.
  • An input / output interface 25 is also connected to the CPU 21 via a bus 24.
  • the input / output interface 25 is connected to an input unit 26 including a keyboard, a mouse, and a microphone, and an output unit 27 including a display, a speaker, and the like.
  • the CPU 21 performs various processes in response to commands input from the input unit 26. Execute. Then, the CPU 21 outputs an image, a sound, or the like obtained as a result of the processing to the output unit 27.
  • the storage unit 28 connected to the input / output interface 25 is composed of, for example, a hard disk, and stores programs executed by the CPU 21 and various data.
  • the communication unit 29 includes the Internet and other Communicate with external devices via the network. In the case of this example, the communication unit 29 acts as an acquisition unit that captures the output of the sensor. Alternatively, the program may be acquired via the communication unit 29 and stored in the storage unit 28.
  • the drive 30 connected to 5 drives the magnetic disk 51, optical disk 52, magneto-optical disk 53, or semiconductor memory 54 when they are mounted, and drives the programs recorded there. And data. The acquired programs and data are transferred to and stored in the storage unit 28 as necessary.
  • FIG. 2 is a block diagram illustrating the image processing apparatus.
  • each function of the image processing apparatus is implemented by hardware or software. That is, each block diagram in this specification may be considered as a block diagram of hardware or a functional block diagram by software.
  • an image to be imaged that corresponds to an object in the real world is referred to as an image object.
  • the input image supplied to the image processing device is supplied to an object extracting unit 101, a mixture ratio calculating unit 103, an area specifying unit 104, and a foreground / background separating unit 105.
  • the object extraction unit 101 roughly extracts an image object corresponding to the foreground object included in the input image, and extracts the extracted image object from the motion detection unit.
  • the object extracting unit 101 roughly extracts an image object corresponding to a foreground object by detecting a contour of the image object corresponding to the foreground object included in the input image.
  • the object extraction unit 101 roughly extracts the image object corresponding to the background object included in the input image, and extracts the extracted image object from the motion detection unit. Feed to 102.
  • the object extracting unit 101 roughly extracts, for example, an image object corresponding to the background object from a difference between the input image and the extracted image object corresponding to the extracted foreground object. .
  • the object extracting unit 101 determines the image object corresponding to the foreground object from the difference between the background image stored in the background memory provided therein and the input image.
  • the image object corresponding to the background object may be roughly extracted.
  • the motion detection unit 102 calculates the motion vector of the image object corresponding to the coarsely extracted foreground object by using, for example, a block matching method, a gradient method, a phase correlation method, and a perrecursive method. Then, the calculated motion vector and the position information of the motion vector (information for specifying the position of the pixel corresponding to the motion vector) are supplied to the mixture ratio calculation unit 103 and the motion blur adjustment unit 106. I do.
  • the motion vector output by the motion detection unit 102 includes information corresponding to the motion amount V.
  • the motion detection unit 102 may output the motion vector for each image object to the motion blur adjustment unit 106 together with the pixel position information for specifying the pixel in the image object. .
  • the motion amount V is a value representing a change in the position of the image corresponding to the moving object in units of pixel intervals. For example, when the image of the object corresponding to the foreground is moving so that it is displayed at a position separated by 4 pixels in the next frame with respect to a certain frame, the motion amount of the image of the object corresponding to the foreground V is
  • the object extraction unit 101 and the motion detection unit 102 are necessary when adjusting the amount of motion blur corresponding to a moving object.
  • the mixture ratio calculation unit 103 Based on the input image, the motion vector supplied from the motion detection unit 102, and the positional information, the mixture ratio calculation unit 103 sets the pixels in the covered background area, which is one of the mixed areas. And the estimated mixture ratio (hereinafter, the mixture ratio) ), And the corresponding mixture ratio relationship information is generated, and the pixel is assumed to belong to the uncovered background region, which is another one of the mixture regions. Then, the estimated mixture ratio and the mixture ratio relation information corresponding thereto are generated, and the generated two estimated mixture ratios and the mixture ratio relation information corresponding thereto are supplied to the region identification unit 104.
  • the region identification unit 104 the region identification unit 104.
  • the mixing ratio or is a value indicating a ratio of a component of an image corresponding to a background object (hereinafter, also referred to as a background component) in a pixel value, as shown in Expression (3) described below.
  • the region specifying unit 104 determines each of the pixels of the input image based on the input image and the two estimated mixture ratios supplied from the mixture ratio calculation unit 103 and the mixture ratio relationship information corresponding thereto. , Foreground area, background area, or mixed area, and indicates whether each pixel belongs to the foreground area, background area, or mixed area (hereinafter referred to as area information). This is supplied to the section 105 and the motion blur adjusting section 106.
  • the region identification unit 104 generates a mixture ratio based on the generated region information, the two estimated mixture ratios supplied from the mixture ratio calculation unit 103, and the mixture ratio relationship information corresponding to them.
  • the obtained mixture ratio H is supplied to the foreground / background separation unit 105.
  • the foreground / background separation section 105 only includes components of the image corresponding to the foreground object (hereinafter also referred to as foreground components).
  • the input image is separated into a foreground component image composed of the following components and a background component image composed of only the background component, and the foreground component image is supplied to the motion blur adjustment unit 106 and the selection unit 107. It is also conceivable to use the separated foreground component image as the final output. It is possible to specify only the foreground and the background without considering the conventional mixed area, and obtain a more accurate foreground and background compared to the separated method.
  • the motion-blur adjusting unit 106 includes a motion amount V and area information that can be determined from the motion vector. Based on, a processing unit indicating one or more pixels included in the foreground component image is determined. The processing unit is data that specifies a group of pixels to be processed for adjusting the amount of motion blur.
  • the motion blur adjustment unit 106 includes a motion blur adjustment amount input to the image processing apparatus, a foreground component image supplied from the foreground / background separation unit 105, and a motion vector supplied from the motion detection unit 102.
  • the motion blur included in the foreground component image, reducing the amount of motion blur, or increasing the amount of motion blur in the foreground component image based on the The amount of blur is adjusted, and the foreground component image in which the amount of motion blur is adjusted is output to the selector 107.
  • the motion vector and its position information may not be used.
  • the motion blur refers to a distortion included in an image corresponding to a moving object, which is caused by the movement of the object in the real world to be imaged and the characteristics of the sensor imaging. .
  • the selection unit 107 includes, for example, a foreground component image supplied from the foreground / background separation unit 105 and a motion supplied from the motion blur adjustment unit 106 based on a selection signal corresponding to the user's selection.
  • a foreground component image supplied from the foreground / background separation unit 105 and a motion supplied from the motion blur adjustment unit 106 based on a selection signal corresponding to the user's selection.
  • One of the foreground component images whose blur amount has been adjusted is selected, and the selected foreground component image is output.
  • FIG. 3 is a diagram illustrating imaging by a sensor.
  • the sensor includes, for example, a CCD video camera equipped with a CCD (Charge-Coupled Device) area sensor that is a solid-state imaging device.
  • the object 111 corresponding to the foreground in the real world moves horizontally between the sensor 112 corresponding to the background in the real world and the sensor, for example, from left to right in the figure.
  • CCD Charge-Coupled Device
  • the sensor captures the object 111 corresponding to the foreground together with the object 111 corresponding to the background.
  • Sensor dew The light time can be 130 seconds.
  • the exposure time is the period from when the sensor starts converting the input light into electric charge until the sensor finishes converting the input light into electric charge.
  • the exposure time is also referred to as shirt time.
  • FIG. 4 is a diagram illustrating the arrangement of pixels.
  • a to I indicate individual pixels.
  • the pixels are arranged on a plane corresponding to the image.
  • One detection element corresponding to one pixel is arranged on the sensor.
  • one detection element When the sensor captures an image, one detection element outputs a pixel value corresponding to one pixel forming the image.
  • the position of the detection element in the X direction corresponds to the position in the horizontal direction on the image
  • the position of the detection element in the Y direction corresponds to the position in the vertical direction on the image.
  • a detection element such as a CCD converts input light into electric charges and accumulates the converted electric charges for a period corresponding to the shutter time.
  • the amount of charge is almost proportional to the intensity of the input light and the time the light is input.
  • the detection element adds the electric charge converted from the input light to the electric charge already stored during a period corresponding to the shutter time. That is, the detection element integrates the input light for a period corresponding to the shutter time, and accumulates an amount of charge corresponding to the integrated light. It can be said that the detection element has an integration effect with respect to time.
  • the electric charge accumulated in the detection element is converted into a voltage value by a circuit (not shown), and the voltage value is further converted into a pixel value such as digital data and output. Therefore, the individual pixel values output from the sensor are the values projected into a one-dimensional space, which is the result of integrating the spatially extended part of the object corresponding to the foreground or background over the shirt time. Having.
  • the image processing apparatus extracts significant information buried in the output signal, for example, the mixture ratio H by the accumulation operation of the sensor.
  • the image processing device adjusts the amount of distortion caused by mixing of the foreground image objects themselves, for example, the amount of motion blur.
  • the image processing device adjusts the amount of distortion caused by mixing the foreground image object and the background image object.
  • FIG. 6A shows an object corresponding to a moving foreground and a stationary background.
  • FIG. 9 is a diagram illustrating an image obtained by imaging a corresponding object.
  • FIG. 6B is a diagram illustrating a model of an image obtained by capturing an object corresponding to a moving foreground and an object corresponding to a stationary background.
  • FIG. 6A shows an image obtained by capturing an object corresponding to a moving foreground and an object corresponding to a stationary background.
  • the object corresponding to the foreground moves horizontally from left to right with respect to the screen.
  • FIG. 6B is a model diagram in which pixel values corresponding to one line of the image shown in FIG. 6A are expanded in the time direction.
  • the horizontal direction in Fig. 6B corresponds to the spatial direction X in Fig. 6A.
  • the pixels in the background area are the background components, that is, the pixel values from only the components of the image corresponding to the background object. Is configured.
  • the pixel values of the pixels in the foreground area are composed of only the components of the foreground, that is, the components of the image corresponding to the foreground object.
  • the pixel value of a pixel in the mixed area is composed of a background component and a foreground component. Since the pixel value is composed of the background component and the foreground component, the mixed region can be said to be a distorted region.
  • the mixed area is further classified into a covered background area and an covered background area.
  • the covered background area is a mixed area at a position corresponding to the front end of the foreground object in the traveling direction with respect to the foreground area, and is an area where the background component is covered by the foreground with the passage of time. .
  • the uncovered background area is a mixed area at the position corresponding to the rear end of the foreground object in the traveling direction with respect to the foreground area. The area that appears.
  • the image including the foreground area, the background area, or the covered background area or the uncovered background area is divided into the area specifying unit 104, the mixture ratio calculating unit 103, and the foreground / background separating unit 1.
  • 05 is input as an input image.
  • Figure 7 shows the background area, foreground area, mixed area, covered backdall
  • FIG. 3 is a diagram illustrating a window area and an uncovered background area.
  • the background area is a stationary part
  • the foreground area is a moving part
  • the covered background area of the mixed area is a part that changes from the background to the foreground
  • the uncovered background area of the mixed area is the part that changes from the foreground to the background.
  • Fig. 8 shows the timewise expansion of the pixel values of the pixels that are arranged in a row and adjacent to each other in the images of the object corresponding to the stationary foreground and the object corresponding to the stationary background. It is a model figure. For example, it is possible to select pixels that are arranged on one line of the screen as pixels that are adjacently arranged in one column.
  • the pixel values of F01 to F04 shown in FIG. 8 are the pixel values of the pixels corresponding to the stationary foreground object.
  • the pixel values B01 to B04 shown in FIG. 8 are the pixel values of the pixels corresponding to the stationary background object.
  • the vertical direction in FIG. 8 corresponds to time, and time elapses from top to bottom in the figure.
  • the position on the upper side of the rectangle in FIG. 8 corresponds to the time when the sensor starts converting the input light into electric charge, and the position on the lower side of the rectangle in FIG. 8 indicates the electric power of the light input to the sensor.
  • the horizontal direction in FIG. 8 corresponds to the spatial direction X described in FIG. 6A. More specifically, in the example shown in FIG. 8, the distance from the left side of the rectangle indicated by “F01” in FIG. 8 to the right side of the rectangle indicated by “B04” is eight times the pixel pitch. That is, it corresponds to the interval between eight consecutive pixels.
  • the light input to the sensor does not change during the period corresponding to the shutter time.
  • the period corresponding to the shirt time is divided into two or more periods of the same length,
  • the model diagram shown in FIG. 8 can be represented as a model shown in FIG.
  • the number of virtual divisions is set according to the amount of movement V of the object corresponding to the foreground within the shutter time.
  • the number of virtual divisions is set to 4 corresponding to the motion amount V of 4, and the period corresponding to the shutter time is divided into four.
  • the top row in the figure corresponds to the first, divided period since the shirt opened.
  • the second row from the top in the figure corresponds to the second, divided period when the shirt is open.
  • the third row from the top in the figure corresponds to the third, divided period since the shirt opened.
  • the fourth row from the top in the figure corresponds to the fourth, divided period since the shirt opened.
  • the shirt time divided according to the movement amount V is also referred to as shirt time / V.
  • the foreground component FO l / v is equal to the value obtained by dividing the pixel value F01 by the number of virtual divisions.
  • the foreground component FO l / v is equal to the value obtained by dividing the pixel value F01 by the number of virtual divisions.
  • F02 / v is equal to the pixel value F02 divided by the number of virtual divisions
  • the foreground component F03 / v is equal to the pixel value F03 divided by the number of virtual divisions
  • the foreground component F04 / v is the pixel It is equal to the value F04 divided by the number of virtual partitions.
  • the background component BO l / v is equal to the value obtained by dividing the pixel value B01 by the number of virtual divisions.
  • the background component B02 / v is equal to a value obtained by dividing the pixel value B02 by the virtual division number
  • B03 / v is a pixel value B03 obtained by dividing the pixel value B03 by the virtual division number.
  • B04 / v is equal to the pixel value B04 divided by the number of virtual divisions.
  • the light corresponding to the background object input to the sensor does not change during the period corresponding to the shirt time, so the first The background component BO l / v corresponding to V, and the background component BO l / v corresponding to the second opening of the shirt, and the third background component BO l / v corresponding to the shirt time / V
  • the corresponding background component BO l / v has the same value as the background component BO l / v corresponding to the fourth shutter opening time / V when the shutter is opened.
  • B02 / v to B04 / v also have the same relationship.
  • Figure 10 is a model diagram in which the pixel values of the pixels on one line, including the covered background area, are expanded in the time direction when the object corresponding to the foreground moves toward the right in the figure. is there.
  • the foreground motion amount V is 4. Since one frame is short, it can be assumed that the object corresponding to the foreground is rigid and moves at a constant speed.
  • the image of the object corresponding to the foreground moves so as to be displayed four pixels to the right in the next frame with respect to a certain frame.
  • the leftmost pixel to the fourth pixel from the left belong to the foreground area.
  • the fifth through seventh pixels from the left belong to the mixed area that is the covered background area.
  • the rightmost pixel belongs to the background area.
  • the image belonging to the covered background area At some point during the period corresponding to the shirt time, the component contained in the elementary pixel value changes from the background component to the foreground component.
  • a pixel value M indicated by a thick line frame in FIG. 10 is represented by Expression (1).
  • the fifth pixel from the left contains the background component corresponding to one shirt time / V and the foreground component corresponding to three shirt times / V, so the fifth pixel from the left is mixed The ratio is 1/4.
  • the sixth pixel from the left contains the background component corresponding to the two shirt times / v and the foreground component corresponding to the two shirt times / v, so the mixture ratio of the sixth pixel from the left Is 1/2.
  • the seventh pixel from the left contains the background component corresponding to the three shutter times / V and the foreground component corresponding to one shutter time / V, so the mixture ratio of the seventh pixel from the left is , 3/4.
  • the object corresponding to the foreground is a rigid body and the foreground image moves at a constant speed so that it is displayed four pixels to the right in the next frame, for example, from the left in Fig. 10
  • the foreground component F07 / v of the first pixel the shirt is open at the first time
  • the fifth pixel from the left in Figure 10 is the second at the time of the shirt at the open time.
  • the foreground component F07 / v is the foreground component of the sixth pixel from the left in Fig. 10 corresponding to the third shirt time / v when the shirt is open, and the left in Fig. 10 From the seventh pixel, the shirt is open and the fourth is equal to the foreground component corresponding to the shirt time / V, 0
  • the object corresponding to the foreground is a rigid body and the foreground image moves at a constant speed so that it is displayed four pixels to the right in the next frame, for example, from the left in Fig. 10
  • the foreground component F06 / v of the 1st pixel, the shutter opening / first shutter time / V corresponds to the 4th pixel from the left in Fig. 10, the second shutter time / v when the shutter is open Equal to the foreground component.
  • the foreground component F06 / v is the fifth shirt from the left in Figure 10 Of the foreground component corresponding to the shutter time / v and the foreground component of the sixth pixel from the left in Fig. 10 corresponding to the fourth shutter time / v when the shirt is opened. ,.
  • the object corresponding to the foreground is a rigid body and the foreground image moves at a constant speed so that it is displayed four pixels to the right in the next frame, for example, from the left in Fig. 10
  • the foreground component F05 / v is the foreground component of the fourth pixel from the left in FIG. 10 corresponding to the third shirt time / V when the shirt is opened, and the left in FIG.
  • the foreground component F04 / v of the pixel in which the shirt is open and the first shirtta time / V, is the foreground corresponding to the second pixel from the left in Fig. 10, in which the shirt is open and the second shirtta time / V Is equal to the component of Similarly, the foreground component F04 / v is the foreground component of the third pixel from the left in Fig. 10, which corresponds to the third shutter time / v when the shutter is opened, and the left pixel in Fig. 10.
  • the fourth pixel is equal to the foreground component corresponding to the fourth shirt time / V when the shirt is open. Since the foreground area corresponding to the moving object includes the motion blur as described above, it can be said that the area is a distortion area.
  • FIG. 11 is a model diagram in which pixel values of pixels on one line, including the uncovered background area, are developed in the time direction when the foreground moves toward the right side in the figure.
  • the motion amount V of the foreground is 4. Since one frame is short, it can be assumed that the object corresponding to the foreground is rigid and moves at a constant speed.
  • the image of the object corresponding to the foreground The image moves to the right by four pixels in the next frame with reference to a certain frame.
  • the leftmost pixel to the fourth pixel from the left belong to the background area.
  • the fifth to seventh pixels from the left belong to the mixed area that is the uncovered background.
  • the rightmost pixel belongs to the foreground area.
  • the pixels belonging to the uncovered background area At some point during the period that corresponds to the shirt time, the components included in the values change from the foreground components to the background components.
  • a pixel value M ′ with a thick frame in FIG. 11 is represented by Expression (2).
  • the fifth pixel from the left contains the background component corresponding to three shirt times / V and the foreground component corresponding to one shirt time / V, so the fifth pixel from the left is mixed The ratio is 3/4.
  • the sixth pixel from the left contains the background component corresponding to the two shirt times / V and the foreground component corresponding to the two shirt times / v, so the mixture ratio of the sixth pixel from the left Is 1/2.
  • the seventh pixel from the left contains the background component corresponding to one shutter time / V and the foreground component corresponding to three shutter times / V, so the mixture ratio of the seventh pixel from the left a Is 1/4.
  • h is the mixing ratio.
  • B is the pixel value of the background, and Fi / v is the foreground component.
  • the object corresponding to the foreground is a rigid body and moves at a constant speed, and the movement amount V is 4, for example, the shirt pixel of the fifth pixel from the left in FIG. Is the first
  • the foreground component FO l / v of shirt time / V is the foreground component of the sixth pixel from the left in Fig. 11, corresponding to the second shutter time / V when the shutter is opened. Equal to minutes.
  • FO l / v is the foreground component of the seventh pixel from the left in Fig. 11 corresponding to the third shutter time / V when the shutter is open
  • the eighth pixel from the left in Fig. 11 The pixel of the foreground component corresponding to the fourth shirt time / V when the shirt is open is equal to the respective pixels.
  • the first foreground component F02 / v of the shirt time / V is equal to the foreground component of the seventh pixel from the left in Fig. 11 corresponding to the second shirt time / V when the shirt opens.
  • the foreground component F02 / v is equal to the foreground component of the eighth pixel from the left in FIG. 11 corresponding to the third shutter time / V after the shutter is opened.
  • the first foreground component F03 / v of the shirt time / V is equal to the foreground component of the eighth pixel from the left in FIG. 11 corresponding to the second shutter time / V when the shutter is opened.
  • the number of virtual divisions has been described as four, but the number of virtual divisions corresponds to the amount of motion V.
  • the motion amount V generally corresponds to the moving speed of the object corresponding to the foreground. For example, when the object corresponding to the foreground is moving so as to be displayed four pixels to the right in the next frame with respect to a certain frame, the motion amount V is set to 4.
  • the number of virtual divisions is four.
  • the motion amount V is set to 6, and the virtual division is performed. The number is six.
  • Figures 12 and 13 show the mixed area consisting of the foreground area, background area, covered background area or anchored background area described above. And the relationship between the foreground component and the background component corresponding to the divided shutter time.
  • Figure 12 shows an example of extracting pixels in the foreground, background, and mixed regions from an image containing the foreground corresponding to an object moving in front of a stationary background.
  • the object indicated by A and corresponding to the foreground moves horizontally with respect to the screen.
  • Frame # n + l is the next frame after frame #n
  • frame # n + 2 is the next frame after frame # n + l.
  • the pixel value in the foreground area is composed of four different foreground components corresponding to the time / V period, since the object corresponding to the foreground moves.
  • the leftmost pixel of the pixels in the foreground area shown in FIG. 13 is
  • Consists of FO l / v, F02 / v, F03 / v, and F04 / V that is, pixels in the foreground area include motion blur.
  • the pixel value in the background area does not include motion blur.
  • the pixel value of a pixel belonging to a mixed area composed of a covered background area or an covered background area is composed of a foreground component and a background component.
  • FIG. 4 is a model diagram developed in the time direction.
  • Frame #n is the next frame after frame ⁇ -l
  • frame ⁇ + l is the next frame after frame # ⁇ .
  • Other frames are similarly referred to.
  • the pixel values B01 to B12 shown in FIG. 14 are the pixel values of the pixels corresponding to the stationary background object. Since the object corresponding to the background is stationary, the pixel value of the corresponding pixel in frame # ⁇ -1 to frame ⁇ + 1 does not change. For example, the pixel in frame # ⁇ and the pixel in frame # ⁇ + 1 corresponding to the position of the pixel having the pixel value of # 05 in frame # ⁇ -l each have the pixel line of # 05.
  • Figure 15 shows the pixels in a row adjacent to one another in the three frames of the image of the object corresponding to the foreground moving to the right in the figure together with the object corresponding to the stationary background.
  • FIG. 9 is a model diagram in which pixel values of pixels at the same position on a frame are developed in the time direction. The model shown in FIG. 15 includes a covered background region.
  • Fig. 15 it can be assumed that the object corresponding to the foreground is rigid and moves at a constant speed, and the foreground image moves so that it is displayed four pixels to the right in the next frame.
  • the motion amount V is 4, and the number of virtual divisions is 4.
  • the foreground component of the leftmost pixel of frame ⁇ -1 in Fig. 15 at the time when the shutter opens and the first shutter time / V is F12 / v
  • the second pixel from the left in Fig. 15 The foreground component of the pixel's second shirt time / V when the shirt is open is also F12 / v.
  • the fourth pixel from the left in Figure 15 is the fourth pixel from the left pixel
  • the foreground component of the shirt time / V is F12 / v.
  • the foreground component of the second shutter time / V of the leftmost pixel of frame-1 in Fig. 15-1 is Fl l / v
  • the second pixel from the left in Fig. 15 is also Fl l / v
  • the foreground component of the third pixel from the left in Fig. 15 at the fourth shutter time / V when the shutter is open is Fl l / v.
  • the foreground component of the leftmost pixel of frame ⁇ -1 in Fig. 15 at the third shutter time / V after the shutter is opened is FlO / v
  • the second pixel from the left in Fig. 15 is also FlO / v
  • the foreground component of the fourth shirt time / V when the shirt is opened is also FlO / v.
  • the foreground component of the leftmost pixel of frame ttn-1 in FIG. 15 at the fourth shutter time / V from when the shutter has opened is F09 / v.
  • the second pixel from the left of frame #nl in Fig. 15 It becomes v.
  • the background components of the third pixel from the left of frame # n-l in Fig. 15 at the first and second shutter / V when shutter is opened are B02 / v.
  • the background component of the fourth pixel from the left of the frame # n-l in FIG. 15 from the first to third shirt time / V from when the shirt is opened is B03 / V.
  • the leftmost pixel belongs to the foreground area, and the second to fourth pixels from the left side belong to the mixed area which is the covered background area.
  • the fifth through 12th pixels from the left of frame # n-1 in FIG. 15 belong to the background area, and their pixel values are B04 through B11, respectively.
  • the first to fifth pixels from the left of frame ⁇ in FIG. 15 belong to the foreground area.
  • the foreground component of the shirt time / v in the foreground area of frame # ⁇ is one of F05 / v to F12 / v.
  • the object corresponding to the foreground is a rigid body and moves at a constant speed, and the image of the foreground moves so that it is displayed four pixels to the right in the next frame.
  • the foreground component of the first shutter time / V of the fifth pixel from the left of the pixel is F12 / v
  • the first pixel of the sixth pixel from the left in Figure 15 The foreground component of the second shirt time / V is also F12 / v.
  • the time / V foreground component is F12 / v.
  • the foreground component of the fifth pixel from the left of frame #n in Fig. 15 in which the shirt is open and the second shutter is opened is Fl l / v
  • the sixth pixel from the left in Fig. 15 is The foreground component of the pixel, which is the third shirt time / V when the shirt is opened, is also Fl l / v.
  • the foreground component of the seventh pixel from the left in Fig. 15 at the fourth shutter time / v when the shutter is open is Fl l / v.
  • the foreground component of the 5th pixel from the left of frame #n in Fig. 15 at the third shutter opening time / V in the foreground is FlO / v
  • the sixth pixel from the left in Fig. 15 The foreground component of the fourth shirt time / V, which is the same as when the shirt opens, is also FlO / v.
  • the foreground component of the fifth pixel from the left of frame #n in Fig. 15 at the fourth shutter time / V after the shutter is opened is F09 / v.
  • the background component of the sixth pixel from the left in the frame in Fig. 15 at the first shutter opening time / V when the shutter is open is B05 / v.
  • the background components of the seventh and the seventh pixels from the left of the frame ttn in Fig. 15 from the left, and the first and second shirt time / V from when the shirt is opened are B06 / v.
  • the background components of the eighth to the left pixels of the frame ⁇ in FIG. 15 from the left, the first to the third, and the background of the shirt time / V from the opening of the shirt are ⁇ 07 / ⁇ .
  • the ninth to 12th pixels from the left of frame # ⁇ in FIG. 15 belong to the background area, and the pixel values are # 08 to B11, respectively.
  • the first through ninth pixels from the left of frame ⁇ + 1 in FIG. 15 belong to the foreground area.
  • the foreground component of the shirt time / V in the foreground area of the frame ⁇ + 1 is any of FO l / v to F 12 / v.
  • the object corresponding to the foreground is rigid and moves at a constant speed. Since the scenery image moves so that it is displayed four pixels to the right in the next frame, the shutter is opened and the first shutter time / V of the ninth pixel from the left in frame # n + l in Figure 15
  • the foreground component of the foreground is F12 / v
  • the foreground component of the 10th pixel from the left in Fig. 15 at the second shirt time / V after the shirt is opened is also F12 / v.
  • the foreground component of the fourth shirt time / V is F12 / v.
  • the foreground component of the ninth pixel from the left of frame itn + 1 in Fig. 15 during the second shutter release time / V from when the shutter is opened is Fl l / v, which is 1 from the left in Fig. 15.
  • the 0th pixel, the shirt is open and the 3rd shirt is the time / V foreground component
  • the foreground component of the ninth pixel from the left of frame # n + 1 in Fig. 15 corresponding to the fourth shutter time / V after the shutter is opened is F09 / v.
  • the background component of the 10th pixel from the left of frame ⁇ + 1 in Fig. 15 in Fig. 15 at the time of the first shirt time / V when the shirt is opened is V09 / ⁇ .
  • the background components of the 11th pixel from the left of frame ttn + 1 in Fig. 15 corresponding to the first and second portions of the shutter time / V from when the shutter has opened are BIO / v.
  • the background components of the first to third pixels from the left of the first pixel to the third pixel, and the background of the shirt time / V are Bl l / v.
  • FIG. 16 is a model diagram of an image in which foreground components are extracted from the pixel values shown in FIG. Figure 17 shows the pixels that are adjacent to each other and are arranged in a single row in the three frames of the image that captures the foreground corresponding to the object moving to the right in the figure together with the stationary background.
  • FIG. 5 is a model diagram in which pixel values of pixels at the same position are developed in the time direction. In FIG. 17, an uncovered background area is included. In Fig. 17, it can be assumed that the object corresponding to the foreground is a rigid body and moves at a constant speed.
  • the motion amount V is 4, for example, the most significant amount of frame #nl in Figure 17
  • the foreground component of the left pixel which is the first pixel when the shirt is open, is F13 / v
  • the second pixel from the left in Figure 17 is the second pixel when the shirt is open.
  • the time / V foreground component is also F13 / V.
  • the fourth pixel from the left in Fig. 17 is the fourth pixel from the open pixel.
  • the foreground component of the shirt time / V is F13 / v.
  • the foreground component of the second pixel from the left of frame ttn-1 in Figure 17 at the first shutter release time / V after shutter release is F14 / v
  • the third image from the left in Figure 17 The foreground component of the second shirt time / V, which is the first time that the shirt is open, is also F14 / v.
  • the background component of the leftmost pixel of the leftmost pixel of frame # n-l in Fig. 17 and the second to fourth, and the background components of the shirtdown time / V of the shirtdown time are: , B25 / v.
  • the background component of the second pixel from the left of frame # n-1 in FIG. 17, the third and fourth shutter shirt time / V after the shutter is opened, is B26 / v.
  • the background component of the third pixel from the left of frame # n-l in Fig. 17 at the fourth shutter time / V after the shutter is opened is B27 / v.
  • the leftmost pixel to the third pixel belong to the mixed area which is the covered background area.
  • the fourth through 12th pixels from the left of frame ttn-1 in Fig. 17 are the foreground Belongs to the area.
  • the foreground component of the frame is one of F13 / v to F24 / v.
  • the leftmost pixel to the fourth pixel from the left of frame ⁇ in FIG. 17 belong to the background area, and the pixel values are ⁇ 25 to ⁇ 28, respectively.
  • the object corresponding to the foreground is rigid and moves at a constant speed, and the image of the foreground moves so that it is displayed four pixels to the right in the next frame, so the left of the frame in Figure 17
  • the foreground component of the fifth pixel from the shutter for the first shutter time / V after the shutter is opened is F13 / v
  • the sixth pixel from the left in Fig. 17 is the second for the shutter open.
  • the foreground component of the shirt time / V is also F13 / V.
  • the foreground component of the seventh pixel from the left in Figure 17, the third pixel at the time of opening, and the foreground component of the seventh pixel from the left in Figure 17, the fourth pixel of the pixel at the eighth pixel from the left in Figure 17 The foreground component of the shirt time / V is F13 / v.
  • the foreground component of the 6th pixel from the left of frame 7 ⁇ in Fig. 17 at the first shutter time / V when the shutter is open is F14 / v
  • the 7th pixel from the left in Fig. 17 the foreground component of the shutter has opened is the second shutter time / V
  • shutter is the first shutter time / V open
  • the foreground component is F15 / V.
  • the background component of the fifth pixel from the left of the frame in Figure 17 at the 2nd to 4th shutter time / V from when the shutter has opened is ⁇ 29 / ⁇ .
  • the background component of the third and fourth shirt time / V when the shirt is open is B30 / v.
  • the background component of the seventh pixel from the left of the frame in Fig. 17 corresponding to the fourth shutter time / V from when the shutter is opened is B31 / v.
  • the eighth to 12th pixels from the left of frame #n in FIG. 17 belong to the foreground area.
  • the value corresponding to the period of the shirt time / V in the foreground area of the frame ftn is any one of F13 / v to F20 / v.
  • the leftmost pixel to the eighth pixel from the left of frame ⁇ + 1 in FIG. 17 belong to the background area, and their pixel values are ⁇ 25 to ⁇ 32, respectively.
  • the object corresponding to the foreground is rigid and moves at a constant speed.
  • the image of the foreground moves so that it is displayed four pixels to the right in the next frame, so the frame ttn + 1 in Fig. 17
  • the foreground component of the first shutter time / V at the ninth pixel from the left of the pixel is F13 / V
  • the shirt at the 10th pixel from the left in Figure 17 is open.
  • the foreground component of the second Zeta time / V is also F13 / v.
  • the foreground component of the fourth shirt time / V is F13 / v.
  • the foreground component of the 10th pixel from the left of frame # n + l in Fig. 17 at the first shutter release time / V after the shutter is opened is F14 / v, which is 1 1 from the left in Fig. 17
  • the foreground component of the second pixel, at the time when the shutter is opened and at the second shutter time / V, is also F14 / v.
  • the foreground component of the second pixel from the left in Fig. 17 at the first shutter button time / V when the shutter button opens is F15 / v.
  • the components of the ninth pixel from the left of frame # n + l in Fig. 17 and the background components of the 2nd to 4th, shirt time / v Becomes B33 / v.
  • the background component of the 10th pixel from the left of frame # n + l in Fig. 17 corresponding to the 3rd and 4th shutter time / V from when the shutter has opened is B34 / v.
  • the background component of the 11th pixel from the left of frame ttn + 1 in FIG. 17 corresponding to the fourth portion of the shutter time / V from when the shutter has opened is 35 / ⁇ .
  • the 12th pixel from the left of frame ⁇ + l in FIG. 17 belongs to the foreground area.
  • the foreground component of the shirt time / V in the foreground region of frame + 1 is any one of F13 / v to F16 / v.
  • FIG. 18 is a model diagram of an image in which foreground components are extracted from the pixel values shown in FIG. You.
  • the mixture ratio calculation unit 103 determines that the pixel belongs to the covered background area. Generates the estimated mixture ratio and the corresponding mixture ratio relationship information under the assumption, and the estimated mixture ratio, which is the estimated mixture ratio when the pixel belongs to the uncovered background area, and Generates mixing ratio relation information corresponding to.
  • the mixture ratio calculation unit 103 supplies the generated two estimated mixture ratios and the mixture ratio relation information corresponding thereto to the region identification unit 104.
  • the region specifying unit 104 determines each of the pixels of the input image based on the input image and the two estimated mixture ratios supplied from the mixture ratio calculation unit 103 and the mixture ratio relationship information corresponding thereto. , Foreground area, background area, or mixed area, and for each pixel the area information indicating whether the pixel belongs to the foreground area, background area, or mixed area. It is supplied to the blur adjusting unit 106.
  • the foreground / background separation unit 105 extracts a foreground component image consisting of only foreground components based on the pixel values of a plurality of frames, area information, and the mixture ratio a, and supplies the extracted foreground component image to the motion blur adjustment unit 106. I do.
  • the motion blur adjusting unit 106 is supplied from the foreground component image supplied from the foreground / background separating unit 105, the motion vector supplied from the motion detecting unit 102, and the region identifying unit 104. Based on the obtained region information, the amount of motion blur included in the foreground component image is adjusted, and a foreground component image in which the amount of motion blur is adjusted is output.
  • step SI1 the mixture ratio calculation unit 103 determines that the pixel belongs to the covered background area based on the input image, the motion vector supplied from the motion detection unit 102, and its position information. Assuming that the estimated mixture ratio, which is the estimated mixture ratio, and the corresponding mixture ratio relation information are calculated, and that, assuming that the pixel belongs to the uncovered background area, the estimated mixture ratio, which is the estimated mixture ratio, The mixture ratio and the mixture ratio relation information corresponding thereto are calculated. Mixing ratio calculation The output unit 103 supplies the calculated two estimated mixture ratios and the mixture ratio relationship information corresponding thereto to the region identification unit 104. The details of the mixture ratio calculation process will be described later.
  • the region identification unit 104 determines the input image based on the input image, the two estimated mixture ratios supplied from the mixture ratio calculation unit 103, and the mixture ratio relationship information corresponding thereto. For each pixel of, an area specifying process for generating area information indicating whether the pixel belongs to the foreground area, the background area, the covered background area, or the uncovered background area is executed. The details of the area specifying process will be described later.
  • the region identification unit 104 generates a mixture ratio a based on the generated region information, the two estimated mixture ratios supplied from the mixture ratio calculation unit 103, and the mixture ratio relationship information corresponding thereto, The generated mixture ratio is supplied to the foreground / background separation unit 105.
  • step S13 the foreground / background separation unit 105 extracts a foreground component from the input image based on the region information and the mixture ratio H, and supplies the foreground component image to the motion blur adjustment unit 106. I do.
  • step S14 the motion-blur adjusting unit 106 determines, based on the motion vector and the area information, continuous pixels arranged in the motion direction, the uncovered background area, the foreground area, and the covered background area.
  • a processing unit indicating the position of an image belonging to one of the regions on the image is generated, and the amount of motion blur included in the foreground component corresponding to the processing unit is adjusted. The details of the processing for adjusting the amount of motion blur will be described later.
  • step S15 the image processing apparatus determines whether or not processing has been completed for the entire screen. If it is determined that processing has not been completed for the entire screen, the process proceeds to step S14, where the processing unit is determined. The process of adjusting the amount of motion blur for the foreground component corresponding to is repeated.
  • step S15 If it is determined in step S15 that the processing has been completed for the entire screen, the processing ends.
  • the image processing apparatus separates the foreground from the background, and The amount of ke can be adjusted. That is, the image processing apparatus can adjust the amount of motion blur included in the sample data that is the pixel value of the foreground pixel.
  • FIG. 20 is a block diagram showing the configuration of the mixture ratio calculation unit 103.
  • the estimated mixture ratio processing unit 201 executes an operation corresponding to the model of the covered background area.
  • the estimated mixture ratio is calculated for each pixel, and the estimated mixture ratio is output together with the mixture ratio relationship information calculated with the calculation of the estimated mixture ratio.
  • the mixture ratio relationship information output from the estimated mixture ratio processing unit 201 is, for example, a sum of foreground components.
  • the estimated mixture ratio processing unit 202 Based on the motion vector and its position information supplied from the motion detection unit 102 and the input image, the estimated mixture ratio processing unit 202 performs an arithmetic operation corresponding to the model of the uncovered background area. The estimated mixture ratio is calculated for each pixel, and the estimated mixture ratio is output together with the mixture ratio relationship information calculated with the calculation of the estimated mixture ratio.
  • the mixture ratio relationship information output by the estimated mixture ratio processing unit 202 is, for example, a sum of foreground components.
  • the mixing ratio of the pixels belonging to the mixed region has the following properties. That is, the mixture ratio changes linearly in accordance with the change in the pixel position. If the change in pixel position is one-dimensional, the change in the mixture ratio can be represented by a straight line.If the change in pixel position is two-dimensional, the change in the mixture ratio can be represented by a plane. It is a thing.
  • the slope of the mixture ratio is the inverse ratio of the amount of movement V in the foreground within the shutter time.
  • Figure 21 shows an example of an ideal mixing ratio.
  • the slope 1 can be expressed as the reciprocal of the motion amount V.
  • the ideal mixture ratio H has a value of 1 in the background region, a value of 0 in the foreground region, and a value exceeding 0 and less than 1 in the mixture region.
  • the pixel value C06 of the seventh pixel from the left of frame ttn can be expressed by equation (4) using the pixel value P06 of the seventh pixel from the left of frame #nl. it can.
  • the pixel value C06 is expressed as the pixel value M of the pixel in the mixed area
  • the pixel value P06 is expressed as the pixel value B of the pixel in the background area. That is, the pixel value M of the pixel in the mixed area and the pixel value B of the pixel in the background area can be expressed as Expressions (5) and (6), respectively.
  • Equation (4) corresponds to the mixing ratio. Since the motion amount V is 4, the mixture ratio of the seventh pixel from the left of frame #n is 0.5.
  • Equation (3) which represents hi, can be rewritten as equation (7).
  • Equation (7) is the sum of the foreground components contained in the pixel of interest ⁇ iFi / v.
  • the variables included in equation (7) are the mixture ratio H and the sum f of the foreground components.
  • Fig. 23 shows a model in which pixel values are expanded in the time direction in which the amount of motion V is 4 and the number of virtual divisions in the time direction is 4 in the uncovered background area.
  • the pixel value C of the frame #n of interest is regarded as the pixel value of the mixed area, and the frame # after the frame #n, as in the expression in the covered background area described above.
  • Equation (3) showing the mixture ratio H can be expressed as Equation (8).
  • the background object has been described as being stationary, even when the background object is moving, the pixel value of the pixel at the position corresponding to the background motion amount V can be used. Equations (4) to (8) can be applied. For example, in FIG. 22, when the motion amount V of the object corresponding to the background is 2 and the number of virtual divisions is 2, when the object corresponding to the background is moving to the right in the figure, the equation (6) The pixel value B of the pixel in the background area in) is the pixel value P04.
  • Equations (7) and (8) each contain two variables, so the mixture ratio cannot be determined as it is.
  • the motion vector supplied from the motion detection unit 102 and its position information are used.
  • equation (9) holds for ⁇ 02 of frame ⁇ -1
  • equation (10) holds for C06 of frame ⁇ .
  • the motion of the foreground object V It is possible to select a plurality of sets of pixels belonging to a mixed region having the same sum of the mixture ratio and the foreground component, and pixels belonging to a corresponding background region. For example, a plurality of sets of pixels belonging to the mixed area and pixels belonging to the corresponding background area can be set to five sets.
  • the pixels Mtl to Mt5 belonging to the mixed region and the pixels belonging to the corresponding background region are obtained from frame # n-3 to frame ⁇ + 2.
  • Pixels Btl to Bt5 can be selected.
  • white circles indicate pixels considered to belong to the background area
  • black circles indicate pixels considered to belong to the mixed area.
  • the five formulas (11) to (15) include the common variables such as the mixing ratio and the sum f of the foreground components, the formulas (11) to (15) By applying the least squares method, it is possible to obtain the mixing ratio f and the sum f of the foreground components.
  • the estimated mixture ratio processing unit 201 previously stores a normal equation for calculating the sum f of the mixture ratio and the foreground component, and stores the pixel values belonging to the mixed region in the stored normal equation. Then, the pixel value belonging to the corresponding background area is set, and the mixture ratio Of and the sum f of the foreground components are calculated by a matrix solution.
  • the estimated mixture ratio processing unit 201 associates the pixel value belonging to the mixed region with the normal equation in accordance with the background motion amount ⁇ ′, Then, the pixel values belonging to the corresponding background region are set, and the mixture ratio h and the sum f of the foreground components are calculated by the matrix solution.
  • white circles indicate pixels considered to belong to the background area
  • black circles indicate pixels considered to belong to the mixed area.
  • the estimated mixture ratio processing unit 201 calculates the estimated mixture ratio using the motion amount V based on the model corresponding to the covered background area.
  • the estimated mixture ratio processing unit 202 calculates the estimated mixture ratio using the motion amount V based on the model corresponding to the uncovered background area.
  • the pixels belonging to the corresponding background area are selected from the frame after the frame of the pixel of interest.
  • FIG. 26 is a block diagram illustrating a configuration of the estimated mixture ratio processing unit 201 that calculates the estimated mixture ratio using the motion amount V based on the model corresponding to the covered background area.
  • the normal equation adding unit 222 Based on the motion vector supplied from the motion detection unit 102 and its position information, the normal equation adding unit 222 adds M images of the input image to the normal equation stored in advance. Set the pixel values belonging to the mixed area and the pixel values belonging to the corresponding background area included in. The normal equation adding unit 2 2 1 calculates the normal equation in which the pixel values belonging to the mixed area and the pixel values belonging to the corresponding background area are set, by an arithmetic unit 2 2 2 To supply.
  • the arithmetic unit 222 solves the normal equation with the pixel values supplied from the normal equation adding unit 222 by applying a matrix solution method such as a sweeping-out method (Gauss-Jordan elimination method), and estimates Calculate the mixture ratio and output the calculated estimated mixture ratio.
  • the calculation unit 222 outputs the calculated sum of the foreground components as the mixture ratio relationship information in accordance with the calculation of the estimated mixture ratio.
  • the estimated mixture ratio processing unit 201 calculates the estimated mixture ratio using the motion amount V based on the model corresponding to the covered background area.
  • the estimated mixture ratio processing unit 201 outputs the sum of foreground components as mixture ratio relationship information.
  • the estimated mixture ratio processing unit 202 has the same configuration as the estimated mixture ratio processing unit 201, the description thereof is omitted.
  • the mixture ratio calculation unit 103 assumes that the pixel belongs to the covered background area based on the input image, the motion vector supplied from the motion detection unit 102, and its position information. Of the estimated mixture ratio and the corresponding mixture ratio relationship information at the same time, and the estimated mixture ratio, which is the estimated mixture ratio when the pixel belongs to the uncovered background area, and the estimated mixture ratio. Corresponding mixture ratio relationship information can be generated.
  • step S201 the estimated mixture ratio processing unit 201 converts the input background image into the covered background area based on the input image and the motion vector and its position information supplied from the motion detection unit 102. Execute the mixture ratio estimation process using the corresponding model. The details of the mixture ratio estimation process will be described later with reference to the flowchart in FIG.
  • step S202 the estimated mixture ratio processing unit 202 responds to the anchor bird background area based on the input image and the motion vector and its position information supplied from the motion detection unit 102. Execute the mixture ratio estimation process using the model.
  • step S203 the mixture ratio calculation unit 103 determines whether or not the mixture ratio has been estimated for the entire frame. If it is determined that the mixture ratio has not been estimated for the entire frame, the process proceeds to step S203. Returning to step S201, processing for estimating the mixture ratio for the next pixel is executed.
  • step S203 If it is determined in step S203 that the mixture ratio has been estimated for the entire frame, the process ends.
  • the mixture ratio calculation unit 103 calculates an estimated mixture ratio corresponding to each pixel based on the motion vector and its position information supplied from the motion detection unit 102 and the input image. be able to.
  • step S221 the normal equation adding unit 221 reads the motion vector supplied from the motion detection unit 102 and the position information thereof, and acquires the motion amount V.
  • step S222 the normal equation adding unit 221 selects a pixel from the input M frame images based on the motion amount V, and selects a pixel in a previously stored normal equation. Set the pixel value of the pixel.
  • step S223 the normal equation adding unit 221 determines whether the setting of the pixel value has been completed for the target pixel, and has completed the setting of the pixel value for the target pixel. If it is determined that there is no pixel value, the process returns to step S222, and the process of setting the pixel value is repeated.
  • step S224 the normal equation adding unit 2 21 calculates the normal equation in which the pixel value is set.
  • the calculation unit 222 supplies the calculation unit 222.
  • the calculation unit 222 solves the normal equation by applying a sweeping method (Gauss-Jordan elimination method) to the normal equation in which the pixel value is set, and obtains the estimated mixture ratio. Is calculated, and the process ends.
  • the operation unit 2 2 2 Along with the calculation of the constant mixture ratio, the calculated sum of the foreground components corresponding to each pixel is output as mixture ratio relation information.
  • the estimated mixture ratio processing unit 201 can calculate the estimated mixture ratio.
  • step S202 in FIG. 27 the estimated mixture ratio processing unit 202 executes the uncovered
  • the process of estimating the mixture ratio using the model corresponding to the background region is the same as the process shown in the flowchart of FIG. 28 using the normal equation corresponding to the model of the uncovered background region, and a description thereof will be omitted. .
  • FIG. 29 is a block diagram showing another configuration of the mixture ratio calculation unit 103. As shown in FIG. The mixture ratio calculation unit 103 whose configuration is shown in FIG. 29 does not use a motion vector.
  • the estimated mixture ratio processor 241 calculates an estimated mixture ratio for each pixel based on the input image by an operation corresponding to the model of the covered background area, and calculates the estimated mixture ratio with the calculation of the estimated mixture ratio. Outputs the estimated mixture ratio together with the ratio relation information.
  • the mixture ratio relationship information output by the estimated mixture ratio processing unit 241 includes, for example, a sum of foreground components, a gradient of the mixture ratio, and the like.
  • the estimated mixture ratio processing section 242 calculates the estimated mixture ratio for each pixel by an operation corresponding to the model of the uncovered background area based on the input image, and is calculated along with the calculation of the estimated mixture ratio.
  • the estimated mixture ratio is output together with the mixture ratio relationship information.
  • the mixture ratio relation information output by the estimated mixture ratio processing unit 242 includes, for example, the sum of foreground components, the gradient of the mixture ratio, and the like.
  • the estimated mixture ratio processing unit 241 or the estimated mixture ratio processing unit 242 responds to the change in the position of the pixel by moving the object corresponding to the foreground at a constant speed within the shutter time.
  • the mixing ratio ⁇ changes linearly
  • an equation is established that approximates the mixture ratio h and the sum f of the foreground components.
  • an equation that approximates the mixture ratio H and the sum f of the foreground components is solved.
  • Equation (16) i is an index in the spatial direction where the position of the pixel of interest is 0. 1 is the slope of the straight line of the mixing ratio a. p is the intercept of the straight line of the mixture ratio Of and the mixture ratio a of the pixel of interest. In equation (16), index i is known, but slope 1 and intercept p are unknown.
  • Figure 30 shows the relationship between the index, the slope, and the intercept p.
  • a white circle indicates a target pixel
  • a black circle indicates a neighboring pixel.
  • Equation (16) a plurality of different mixture ratios for a plurality of pixels are represented by two variables.
  • the five mixture ratios for the five pixels are expressed by two variables, a slope 1 and an intercept p.
  • Equation (17) j is the horizontal index with the position of the pixel of interest set to 0, and k is the vertical index.
  • m is the horizontal inclination of the surface of the mixture ratio H
  • q is the vertical inclination of the surface of the mixture ratio H.
  • p is the intercept of the plane of the mixture ratio Of.
  • X represents a position in the spatial direction.
  • equation (2 1) can be expressed as equation (2 2).
  • Equation (22) j is the horizontal index with the position of the pixel of interest set to 0, and k is the vertical index.
  • Equation (27) the unknown variables are the horizontal slope m of the surface of the mixture ratio, the vertical slope q of the surface of the mixture ratio, the intercept p, s, t, and the surface of the surface of the mixture ratio. u have six.
  • a pixel value M and a pixel value B are set in Equation (27) in correspondence with a pixel in the vicinity of the pixel of interest, and for a plurality of expressions in which the pixel value M and the pixel value B are set, Calculate the mixture ratio by solving with the least squares method.
  • Equation (28) The horizontal slope m, vertical slope q, intercept p, s, t, and u are expressed as variables w0, wl, w2, w3, w4, and w5, respectively, and jB, kB, B, j, k , And 1 are expressed as aO, al, a2, a3, a4 v and a5, respectively.
  • equation (28) can be rewritten as equation (38).
  • X is any one of integers from 0 to 8.
  • equation (39) can be derived.
  • equation (42) is obtained.
  • wO is the horizontal slope m
  • wl is the vertical slope q
  • w2 is the intercept p
  • w3 is s
  • w4 is t
  • w5 is u.
  • the horizontal slope m, the vertical slope q, the intercept p, s, t, and u are obtained. be able to.
  • Mc2 (0)-Bc2m + (-l)-Bc2-q + Bc2p + (0) s + (-1)-t + u (44
  • Mc3 (+ 1) Bc3m + (-1) Bc3 q + Bc3p + (+ l) s + (_ l)-t + u (4 5
  • Mc4 (-1)-Bc4-m + (0)-Bc4q + Bc4p + (_ l)-s + (0)-t + u (4 6
  • Mc5 (0) Bc5-m + (0) Bc5-q + Bc5p + (0)-s + (0)-t + u (4 7
  • Mc6 (+ 1) Bc6m + (0)-Bc6q + Bc6p + (+ l) s + (0) -t + u (4 8
  • Mc7 (-1)-Bc7-m + (+ l)-Bc7-q + Bc7p + (-l)-s + (+ l)-t + u (4 9
  • Mc8 (0)-Bc8m + (+ l) Bc8q + Bc8-p + (0) s + (+ l)-t + u
  • Mc9 (+ 1) Bc9-m + (+ l ) ⁇ Bc9 ⁇ q + Bc9 ⁇ p + (+ l) ⁇ s + (+ l)-t + u
  • the equation (4 3 In Equations (5 1) to (5 1) the pixel values Bel to Bc9 of the pixels in the background area of the pixels in frame - ⁇ -1 corresponding to the pixels in frame ttn are used ( uncovered background shown in FIG. 32 ) .
  • the mixture ratio H of the pixels included in the region the following equations (52) to (60) are established: The pixel value of the pixel for which the mixture ratio is calculated is Mu5.
  • mixture ratio estimation processing section 241 and the mixture ratio estimation processing section 242 have the same configuration as the mixture ratio processing section 201, the description thereof is omitted.
  • the process of calculating the estimated mixture ratio by the mixture ratio calculation unit 103 having the configuration shown in FIG. 29 is the same as the process described with reference to the flowchart in FIG. 27, and a description thereof will be omitted.
  • step S241 the estimated mixture ratio processing unit 241 sets a pixel value included in the input image to a normal equation corresponding to the model of the covered background area.
  • step S224 the estimated mixture ratio processing unit 241 determines whether the setting for the target pixel has been completed, and determines that the setting for the target pixel has not been completed. If so, the process returns to step S241 to repeat the process of setting the pixel value in the normal equation.
  • step S224 When it is determined in step S224 that the setting of the pixel value for the target pixel has been completed, the process proceeds to step S243, where the estimated mixture ratio processing unit 2411 sets the pixel value.
  • the estimated mixture ratio is calculated, and the obtained estimated mixture ratio is output.
  • the estimated mixture ratio processing unit 241 outputs the sum of the foreground components and the gradient of the estimated mixture ratio as the mixture ratio relationship information along with the calculation of the estimated mixture ratio.
  • the estimated mixture ratio processing unit 241 can calculate the estimated mixture ratio based on the input image.
  • the estimated mixture ratio processing unit 241 outputs the sum of the components of the foreground and the gradient of the estimated mixture ratio as the mixture ratio relation information.
  • the processing of the mixture ratio estimation by the model corresponding to the uncovered background region by the estimated mixture ratio processing unit 242 is performed by the model of the uncovered background region.
  • the process is the same as the process shown in the flowchart of FIG. 33 using the normal equation corresponding to the rule, and a description thereof will be omitted.
  • FIG. 34 is a block diagram illustrating still another configuration of the mixture ratio calculation unit 103 that estimates a mixture ratio from an input image input as a component signal.
  • a component refers to an individual signal such as a luminance signal and a color difference signal or an RGB (Red-green-blue) signal in a component signal.
  • component 1 is assumed to be a luminance value Y
  • component 2 is assumed to be a color difference U
  • component 3 is assumed to be a color difference V.
  • the estimated mixture ratio processing unit 241-1-1 calculates the estimated mixture ratio for each pixel based on the component 1 of the input image by calculation corresponding to the model of the covered background area, and calculates the estimated mixture ratio.
  • the estimated mixture ratio is output together with the mixture ratio relation information calculated accordingly.
  • the mixture ratio relationship information output by the estimated mixture ratio processing unit 24-1-1 is composed of, for example, the sum of foreground components and the gradient of the mixture ratio.
  • the estimated mixture ratio processor 2 4 2-1-1 calculates the estimated mixture ratio for each pixel based on the component 1 of the input image by calculation corresponding to the model in the anchored background area, and calculates the estimated mixture ratio
  • the estimated mixing ratio is output together with the mixing ratio relation information calculated in accordance with.
  • the mixture ratio relation information output by the estimated mixture ratio processing unit 242-1 includes, for example, a sum of foreground components, a gradient of the mixture ratio, and the like.
  • the estimated mixture ratio processor 2 4 1-2-2 calculates the estimated mixture ratio for each pixel based on the component 2 of the input image by calculation corresponding to the model of the covered background area, and calculates the estimated mixture ratio.
  • the estimated mixture ratio is output together with the mixture ratio relation information calculated accordingly.
  • the estimated mixture ratio processor 2 4 2-2-2 calculates the estimated mixture ratio for each pixel based on the component 2 of the input image by calculation corresponding to the model of the anchored background area, and calculates the estimated mixture ratio
  • the estimated mixing ratio is output together with the mixing ratio relation information calculated in accordance with.
  • the estimated mixture ratio processing unit 2 4 1-3 calculates the estimated mixture ratio for each pixel based on the component 3 of the input image by calculation corresponding to the model of the covered background area, and calculates the estimated mixture ratio.
  • the estimated mixture ratio is output together with the mixture ratio relation information calculated accordingly.
  • the estimated mixture ratio processing unit 2 4 2-3 calculates the estimated mixture ratio for each pixel based on the component 3 of the input image by calculation corresponding to the model of the anchored background area, and calculates the estimated mixture ratio
  • the estimated mixing ratio is output together with the mixing ratio relation information calculated in accordance with.
  • the mixture ratio calculation unit 103 whose configuration is shown in FIG. 34 is based on the input image input as the component signal, and for each component, the estimated mixture ratio based on the model corresponding to the covered back-drop region. , And an estimated mixture ratio by a model corresponding to the uncovered backdrop region.
  • the mixture ratio calculation unit 103 calculates, for each component, the sum of the foreground components corresponding to the estimated mixture ratio by the model corresponding to the covered background region and the estimated mixture ratio by the model corresponding to the uncovered background region. And output the mixture ratio relation information including the inclination of the estimated mixture ratio.
  • the mixture ratio calculation unit 103 uses the estimated mixture ratio processing unit 201 and the estimated mixture ratio processing unit 2.
  • the estimated mixture ratio of the model corresponding to the covered background region and the estimated mixture ratio of the model corresponding to the uncovered background region are calculated for each component, and the estimated mixture ratio is calculated together with the estimated mixture ratio.
  • the mixing ratio relationship information may be output.
  • the above-described processing for obtaining the mixture ratio can be applied even when the image corresponding to the background area includes motion.
  • the mixture ratio calculator 103 shifts the entire image in response to this movement, and the object corresponding to the background is stationary.
  • the processing is performed in the same manner as in the case. Also, it corresponds to the background area
  • the mixture ratio calculator 103 selects the pixel corresponding to the motion as the pixel corresponding to the pixel belonging to the mixed area, and performs the above-described processing. .
  • FIG. 35 is a block diagram showing a configuration of the area specifying unit 104.
  • the prediction error calculation unit 301 corresponds to each pixel based on the estimated mixture ratio based on the model corresponding to the covered background region and the mixture ratio relationship information corresponding to the estimated mixture ratio based on the model corresponding to the covered background region.
  • the calculated error value (a prediction error corresponding to the estimated mixture ratio) is calculated, and the calculated error value is supplied to the uncovered background area determination unit 303.
  • the mixture ratio calculation unit 103 estimates the mixture ratio by applying the least squares method to the equations (11) to (15), the prediction error calculation unit 301 (61) based on the mixture ratio information, which is the sum of the components of the foreground corresponding to the estimated mixture ratio of the model corresponding to the background region and the estimated mixture ratio of the model corresponding to the bird background region.
  • the least square error sum which is the error value S is calculated.
  • the prediction error calculation unit 302 calculates each of the estimated mixing ratios based on the model corresponding to the uncovered background area and the mixing ratio relation information corresponding to the estimated mixing ratio based on the model corresponding to the uncovered background area. An error value corresponding to the pixel is calculated, and the calculated error value is supplied to the covered background area determination unit 304.
  • the prediction error calculation unit 301 and the prediction error calculation unit 302 calculate, for example, an error value corresponding to each pixel for each block including a plurality of pixels such as a block including 5 pixels ⁇ 5 pixels. It may be.
  • the prediction error calculation unit 301 and the prediction error calculation unit 302 may set t in advance, or obtain t from the mixture ratio calculation unit 103 as mixture ratio relation information. It may be.
  • the uncovered background area determination unit 303 determines, for each pixel, whether or not the error value supplied from the prediction error calculation unit 301 is equal to or greater than a threshold value Th stored in advance. Is determined to be greater than or equal to the threshold Th, it is determined that the pixel of interest belongs to the uncovered background area, and a flag indicating the uncovered background area is set in association with the pixel of interest.
  • the uncovered background area determination unit 303 supplies a flag indicating the uncovered background area set for each pixel to the synthesis unit 303.
  • the covered background area determination unit 304 determines, for each pixel, whether or not the error value supplied from the prediction error calculation unit 302 is equal to or greater than a threshold value Th stored in advance. If is determined to be greater than or equal to the threshold Th, it is determined that the pixel of interest belongs to the covered background area, and a flag indicating the covered background area is set for the pixel of interest.
  • the covered background area determination unit 304 supplies a flag indicating the covered background area set for each pixel to the combining unit 303.
  • the foreground / background area determination unit 3005 determines a foreground area and a background area based on the input image.
  • the foreground / background region determination unit 3005 calculates the difference between the pixel value of the pixel of interest in the frame of interest ttn and the pixel corresponding to the pixel of interest in frame # n-1. The motion of the pixel of interest is determined. The foreground / background region determination unit 3005 calculates the difference between the pixel value of the pixel of interest in the frame of interest ttn and the pixel corresponding to the pixel of interest in frame # n + l. The motion is determined for the pixel of interest. The foreground / background area determination unit 300 determines that the pixel of interest is determined to be moving from frame # n-l to frame # ⁇ , and is determined to be moving from frame to frame # n + l. It is determined that they belong.
  • the foreground background area determination unit 3 0 when the pixel of interest, is determined from the frame # n -l for frame over arm stationary, is determined stationary for frame #n force al frame # n + l, attention It is determined that the pixel belongs to the background area.
  • the foreground / background area determination unit 3005 supplies a flag indicating the foreground area and a flag indicating the background area, set for each pixel, to the synthesizing unit 303.
  • the synthesizing unit 303 sets the flag indicating the uncovered background area supplied from the uncovered background area determination unit 303 and the covered background area supplied from the covered background area determination unit 304. On the basis of the flag indicating the foreground area supplied from the foreground / background area determination unit 3005, and the flag indicating the background area, for each pixel, the uncovered background area, the covered background area, the foreground area, And area information indicating one of the background areas.
  • the combining section 303 supplies the combined area information to the mixture ratio determining section 307, and outputs the area information.
  • the mixture ratio determination unit 307 determines the mixture ratio H based on the area information supplied from the synthesis unit 306. More specifically, the mixture ratio determination unit 307 sets 0 to the mixture ratio when the target pixel belongs to the foreground region, and sets 1 when the target pixel belongs to the background region. Set the mixing ratio to. If the target pixel belongs to the covered background region, the mixture ratio determination unit 307 sets the mixture ratio estimated by the model corresponding to the covered covered backdrop region to the mixture ratio H, and the target pixel If it belongs to the uncovered background region, set the mixture ratio estimated by the model corresponding to the uncovered background region to the mixture ratio. The mixture ratio determining unit 307 outputs the mixture ratio determined based on the area information.
  • the determination process of the uncovered background area determination unit 303 will be described with reference to FIGS. 36 and 37.
  • the pixel value of the pixel of interest belonging to the background area of the frame of interest ⁇ is the same as that of the next frame # ⁇ + 1 of frame ⁇ ⁇ . It is equal to the pixel value of the pixel corresponding to the target pixel.
  • W indicates a background area.
  • the pixel value of the pixel of frame # ⁇ + 1 indicated by the motion vector based on the target pixel is the pixel value of the corresponding pixel of frame ttn + 2. Equal to pixel value.
  • the estimated mixture ratio of the model corresponding to the covered coverback region corresponding to the pixels belonging to the background region is substantially 1, and the sum of the components of the foreground is substantially zero.
  • the pixel value of the pixel of interest in frame #n of interest is indicated by a motion vector based on the pixel of interest. Equal to the pixel value of the pixel in frame # n + l. Also, the foreground object has a strong correlation in the spatial direction, so that the values of the foreground components are almost equal.
  • the foreground component included in the pixel value of the pixel of interest of the frame of interest belonging to the uncovered background area indicated by Z in the figure is the frame ttn Is different from the foreground component included in the pixel value of the pixel corresponding to the target pixel of the next frame lln + 1.
  • the foreground component included in the pixel value of the pixel in frame # n + l, indicated by the motion vector based on the pixel of interest is It is different from the foreground component included in the pixel value of the pixel corresponding to the time ⁇ + 2.
  • the least-squares error sum of the estimated mixture ratio and the sum of the foreground components calculated by the least squares method is calculated when the pixel of interest belongs to the uncovered background area. , which is a large value.
  • the uncovered background area determination unit 303 calculates the estimated mixture ratio calculated by the least squares method based on the model corresponding to the covered covered background area and the error value of the sum of the foreground components. By determining whether or not S is equal to or greater than the threshold Th, it can be determined whether or not the corresponding pixel belongs to the uncovered background area.
  • the covered background area determination unit 304 calculates the estimated mixture ratio and the error value S of the sum of the foreground components calculated by the least squares method based on the model corresponding to the uncovered background area. By determining whether or not the pixel is equal to or greater than the threshold Th, it is possible to determine whether or not the corresponding pixel belongs to the covered background area.
  • FIGS. 38 to 43 are diagrams illustrating an example of an input image and a result of region determination performed by the region identifying unit 104 corresponding to the input image.
  • FIG. 38 is a diagram showing an input image.
  • the foreground object moves from the left side to the right side in the figure.
  • FIG. 39 is based on the input image shown in FIG. 38, in which the mixture ratio calculation unit 103 identifies the region based on the estimated mixture ratio calculated using seven frames and the sum of the foreground components.
  • FIG. 11 is a diagram illustrating a result of a determination made by a unit 104 with a threshold Th set to 70 for each pixel.
  • FIG. 40 is based on the estimated mixture ratio and the sum of the components of the foreground calculated by the mixture ratio calculator 103 using the three frames for the input image shown in FIG. 38.
  • the area specifying unit 104 sets the threshold value Th of the sum of the error values S for the block to 7500, assuming that the mixing ratio is constant for each block of 5 pixels ⁇ 5 pixels.
  • FIG. 10 is a diagram illustrating a result of a determination made by setting a threshold value Th of an error value S of one pixel to 10;
  • FIG. 41 is a diagram showing an input image.
  • the foreground object moves from the left side to the right side in the figure.
  • FIG. 10 is a diagram illustrating a result of a determination made by a unit 104 with a threshold Th set to 70 for each pixel.
  • FIG. 43 the area is identified based on the estimated mixture ratio calculated using the three frames and the sum of the foreground components by the mixture ratio calculator 103 with respect to the input image shown in FIG. 41.
  • the unit 104 sets the threshold value Th of the sum of the error values S for the block to 755, assuming that the mixing ratio is constant for each block of 5 pixels ⁇ 5 pixels, and sets one of the blocks in the block.
  • FIG. 10 is a diagram illustrating a result of determination that a threshold value Th of a pixel error value S is set to 10;
  • the covered background area is located at the front end of the foreground object in the traveling direction of the foreground object, and the uncovered background area is located at the foreground area with respect to the foreground area. It is located at the rear end of the object in the direction of travel.
  • the area specifying unit 104 can determine the area almost accurately.
  • the mixture ratio calculating unit 103 estimates the mixture ratio by applying the least squares method to the equations (28) to (36), and the data indicating the slope of the estimated mixture ratio together with the estimated mixture ratio.
  • the process performed by the area specifying unit 104 when outputting as the mixture ratio relationship information will be described.
  • the pixel value M of the target pixel is expressed by Expression (6 2) from Expression (27).
  • Equation (62) j is a horizontal index with the position of the pixel of interest set to 0, and k is a vertical index.
  • m is the horizontal inclination of the plane of the mixture ratio, and q is the vertical inclination of the plane of the mixture ratio.
  • p is the intercept of the surface of the mixture ratio.
  • s, t, and u are variables indicating the relationship between m, q, and P and the foreground components, as shown in equations (23) to (25).
  • the prediction error calculation unit 301 calculates the estimated mixture ratio of the model corresponding to the covered background region and the estimated mixture ratio of the model corresponding to the covered background region, j, k, m, q, p, Based on the mixing ratio relationship information including S , t, and u, the least square error sum that is the error value S can be calculated by the operation corresponding to the equation (63).
  • the prediction error calculation unit 302 uses a model corresponding to the uncovered covered background area Based on the estimated mixture ratio and the mixture ratio relationship information corresponding to the estimated mixture ratio based on the model corresponding to the uncovered backround region, the error value corresponding to each pixel is calculated by the operation corresponding to Equation (63). Is calculated, and the calculated error value is supplied to the covered background area determination unit 304.
  • the uncovered background area determination unit 303 previously stores, for each pixel, the error value supplied from the prediction error calculation unit 301 and determines whether or not the error value is equal to or greater than a threshold Th. If the value is determined to be equal to or greater than the threshold Th, it is determined that the pixel of interest belongs to the uncovered background area, and a flag indicating the uncovered background area is set in association with the pixel of interest. .
  • the uncovered background area determination unit 303 supplies a flag indicating an uncovered background area set for each pixel to the synthesis unit 303.
  • the covered background area determination unit 304 determines, for each pixel, whether or not the error value supplied from the prediction error calculation unit 302 is equal to or greater than a threshold value Th stored in advance. If the value is determined to be equal to or greater than the threshold Th, the pixel of interest is covered. It determines that the pixel belongs to one background area, and sets a flag indicating the covered background area to the pixel of interest. The covered background area determination unit 304 supplies a flag indicating the covered background area set for each pixel to the combining unit 303.
  • the foreground / background region determination unit 3005 determines the foreground region and the background region based on the input image, and combines the flag indicating the foreground region and the flag indicating the background region set for each pixel. 0 to 6
  • the synthesizing section 303 sets the flag indicating the uncovered background area supplied from the uncovered background area determination section 303 and the covered background area supplied from the covered background area determination section 304. On the basis of the flag indicating the foreground area supplied from the foreground / background area determination unit 3005, and the flag indicating the background area, the uncovered background area, the covered background area, the foreground area, and Area information indicating one of the background areas is synthesized.
  • the synthesizing unit 303 supplies the synthesized region information to the mixture ratio determining unit 307, and outputs the region information.
  • the mixing ratio determining unit 307 determines the mixing ratio a based on the area information supplied from the synthesizing unit 306.
  • the region identification unit 104 can generate the region information based on the estimated mixture ratio and the mixture ratio relationship information in accordance with the mixture ratio estimation method of the mixture ratio calculation unit 103. it can.
  • FIG. 44 shows the configuration of the region specifying unit 104 that specifies a region based on the mixture ratio estimated for each component signal and the corresponding mixture ratio relationship information, and the input image input as the component signal. It is a block diagram shown. The same portions as those shown in FIG. 35 are denoted by the same reference numerals, and description thereof will be omitted.
  • the prediction error calculator 3 0 1—1 calculates the estimated mixture ratio of the model corresponding to the covered background region and the estimated mixture ratio of the model corresponding to the covered background region, calculated from the component 1 of the input image. Corresponding mixing ratio An error value corresponding to each pixel is calculated based on the relationship information, and the calculated error value is supplied to the adder 3221.
  • the prediction error calculation unit 310_1_2 corresponds to the estimated mixture ratio of the model corresponding to the covered background region and the estimated mixture ratio of the model corresponding to the covered background region, calculated from the component 2 of the input image. An error value corresponding to each pixel is calculated based on the mixing ratio relationship information to be calculated, and the calculated error value is supplied to the adding unit 3221.
  • the prediction error calculator 3 0 1-3 supports the estimated mixture ratio of the model corresponding to the covered background region and the estimated mixture ratio of the model corresponding to the covered background region, calculated from the component 3 of the input image. An error value corresponding to each pixel is calculated based on the mixing ratio relationship information to be calculated, and the calculated error value is supplied to the adding unit 3221.
  • the prediction error calculator 3 0 2 _ 1 calculates the estimated mixture ratio of the model corresponding to the uncovered background region and the estimated mixture ratio of the model corresponding to the uncovered background region, calculated from the component 1 of the input image. An error value corresponding to each pixel is calculated based on the corresponding mixture ratio relationship information, and the calculated error value is supplied to the adder 322.
  • the prediction error calculator 3 0 2-2 calculates the estimated mixture ratio of the model corresponding to the uncovered background region and the estimated mixture ratio of the model corresponding to the uncovered background region, calculated from the component 2 of the input image. An error value corresponding to each pixel is calculated based on the corresponding mixture ratio relationship information, and the calculated error value is supplied to the adder 322.
  • the prediction error calculator 3 0 2-3 calculates the estimated mixture ratio of the model corresponding to the uncovered background region and the estimated mixture ratio of the model corresponding to the uncovered background region, calculated from the component 3 of the input image. An error value corresponding to each pixel is calculated based on the corresponding mixture ratio relationship information, and the calculated error value is supplied to the adder 322.
  • the adder 3 2 1 receives the error value supplied from the prediction error calculator 3 0 1-1, the error value supplied from the prediction error calculator 3 0 1 1 1 1, and the prediction error calculator 3 0 1 _ 3 The supplied error values are added, and the added error value is supplied to the anchored background area determination unit 303.
  • the adder 3 2 2 receives the error value supplied from the prediction error calculator 3 0 2-1, the error value supplied from the prediction error calculator 3 0 2-2, and the prediction error calculator 3 0 2-3 The supplied error values are added, and the added error value is supplied to the covered background area determination unit 304.
  • the addition unit 3 2 3 adds the component 1 of the input image, the component 2 of the input image, and the component 3 of the input image, and adds the added component 1, component 2, and component 3 to the foreground / background region determination unit 3 0 5 the c uncovered-background-area determining unit 3 0 3 supplies, for each pixel, the error value supplied from the adder 3 2 1, it is determined whether the threshold Th or stored in advance. If the error value is determined to be equal to or greater than the threshold Th, it is determined that the pixel of interest belongs to the uncovered background area, and a flag indicating the uncovered background area is set in association with the pixel of interest. I do.
  • the uncovered background area determination unit 303 supplies a flag indicating the uncovered background area set for each pixel to the synthesis unit 303.
  • the covered background area determination unit 304 determines, for each pixel, whether or not the error value supplied from the addition unit 3222 is equal to or greater than a threshold value Th stored in advance. If it is determined to be Th or more, it is determined that the pixel of interest belongs to the covered background area, and a flag indicating the covered background area is set for the pixel of interest.
  • the covered background area determination unit 304 supplies a flag indicating the covered background area set for each pixel to the synthesizing unit 303.
  • the foreground / background region determination unit 3005 determines a foreground region and a background region based on the added component 1, component 2, and component 3, and The flag indicating the foreground area and the flag indicating the background area, which have been set in, are supplied to the synthesizing unit 310.
  • the combining unit 303 includes a flag indicating the uncovered background area supplied from the uncovered background area determination unit 303, and a covered background area supplied from the power bird background area determination unit 304. Based on the flag indicating the foreground area and the flag indicating the background area supplied from the foreground / background area determination unit 305 for each pixel based on the uncovered background area, the covered background area, and the foreground.
  • the area information indicating either the area or the background area is synthesized.
  • the combining section 303 supplies the combined area information to the mixture ratio determining section 307, and outputs the area information.
  • the region specifying unit 104 shown in FIG. 44 uses the mixture ratio estimated for each component signal and the mixture ratio relation information corresponding thereto, and the input image input as the component signal, based on the input image.
  • the area can be specified.
  • the area specifying unit 104 having the configuration shown in FIG. 44 can specify the area more accurately than the area specifying unit 104 having the configuration shown in FIG.
  • FIG. 45 shows another example of the region specifying unit 104 that specifies a region based on the mixture ratio estimated for each component signal and the corresponding mixture ratio relation information, and the input image input as the component signal. It is a block diagram which shows a structure.
  • the prediction error calculator 3 0 1—1 corresponds to the estimated mixture ratio of the model corresponding to the covered background region and the estimated mixture ratio of the model corresponding to the covered background region, calculated from the component 1 of the input image. An error value corresponding to each pixel is calculated based on the mixing ratio relationship information to be calculated, and the calculated error value is supplied to the anchored background area determination unit 303-3-1.
  • the prediction error calculation unit 310_1_2 calculates the estimated mixture ratio of the model corresponding to the covered background area, calculated from the component 2 of the input image, and the coverage. An error value corresponding to each pixel is calculated based on the mixture ratio relationship information corresponding to the estimated mixture ratio by the model corresponding to the background region, and the calculated error value is used as an anchor background region determination unit. Supply 2
  • the prediction error calculator 3 0 1-3 corresponds to the estimated mixture ratio of the model corresponding to the covered background region and the estimated mixture ratio of the model corresponding to the covered background region, calculated from the component 3 of the input image. An error value corresponding to each pixel is calculated based on the mixing ratio relationship information to be calculated, and the calculated error value is supplied to the anchored background area determination unit 303-3-3.
  • the prediction error calculator 3 0 2—1 calculates the estimated mixture ratio of the model corresponding to the uncovered background region and the estimated mixture ratio of the model corresponding to the uncovered background region, calculated from the component 1 of the input image. An error value corresponding to each pixel is calculated based on the corresponding mixture ratio relationship information, and the calculated error value is supplied to the covered background area determination unit 3044-1.
  • the prediction error calculator 3 0 2-2 calculates the estimated mixture ratio of the model corresponding to the uncovered background region and the estimated mixture ratio of the model corresponding to the uncovered background region, calculated from the component 2 of the input image. An error value corresponding to each pixel is calculated based on the corresponding mixture ratio relationship information, and the calculated error value is supplied to the covered background area determination unit 3044-2.
  • the prediction error calculator 3 0 2-3 calculates the estimated mixture ratio of the model corresponding to the uncovered background region and the estimated mixture ratio of the model corresponding to the uncovered background region, calculated from the component 3 of the input image. An error value corresponding to each pixel is calculated based on the corresponding mixture ratio relationship information, and the calculated error value is supplied to the covered background area determination unit 304_3.
  • the covered background area determination unit 303-1 determines whether the error value supplied from the prediction error calculation unit 310-1 for each pixel is equal to or greater than a threshold value Th stored in advance. If the error value is determined to be equal to or greater than the threshold Th, it is determined that the pixel of interest belongs to the uncovered background area, and the image of interest is determined. A flag indicating the uncovered background area is set corresponding to the element. The covered background area determination unit 303-1 supplies a flag indicating the covered background area set for each pixel to the logical sum operation unit 341.
  • ⁇ Uncovered background area determination unit 3 0 3-2 determines, for each pixel, whether or not the error value supplied from the prediction error calculation unit 3 0 1-2 is equal to or greater than a threshold value Th stored in advance, and If it is determined to be Th or more, it is determined that the pixel of interest belongs to the uncovered background area, and a flag indicating the uncovered background area is set in association with the pixel of interest.
  • the covered background area determination unit 303-3-2 supplies the flag indicating the covered background area set for each pixel to the logical sum operation unit 341 (the uncovered background area determination unit).
  • 3 0 3-3 determines, for each pixel, whether or not the error value supplied from the prediction error calculation unit 3 0 1 _ 3 is equal to or greater than a threshold value Th stored in advance, and If it is determined to be greater than or equal to Th, it is determined that the pixel of interest belongs to the uncovered background area, and a flag indicating the uncovered background area is set corresponding to the pixel of interest.
  • the covered background area determination unit 303-3-3 supplies the flag indicating the covered background area set for each pixel to the logical sum operation unit 341.
  • the region determining unit 304-1 determines, for each pixel, whether or not the error value supplied from the prediction error calculating unit 302-1 is equal to or greater than a threshold value Th stored in advance.
  • the background area determination unit 3044-1 supplies a flag indicating a covered backdrop region set for each pixel to the logical sum operation unit 342.
  • the covered background area determination unit 3044-2 determines, for each pixel, whether the error value supplied from the prediction error calculation unit 3002-2 is equal to or greater than a threshold value Th stored in advance. If it is determined that the error value is equal to or greater than the threshold Th, the image of interest is It determines that the element belongs to the covered background area, and sets a flag indicating the covered background area corresponding to the pixel of interest.
  • the covered knock ground area determination unit 304-2 supplies the flag indicating the covered back dull area set for each pixel to the logical sum operation unit 3422.
  • the covered background area determination unit 304_3 determines, for each pixel, whether the error value supplied from the prediction error calculation unit 302-3 is equal to or greater than a threshold value Th stored in advance. If it is determined that the error value is equal to or greater than the threshold Th, it is determined that the pixel of interest belongs to the covered background area, and a flag indicating the covered background area is set corresponding to the pixel of interest. I do.
  • the covered knock area determination section 304-4-3 supplies a flag indicating a covered background area set for each pixel to the logical sum operation section 342.
  • the foreground / background area determination unit 3005-1 determines the foreground area and the background area based on the component 1, and performs a logical OR of the flag indicating the foreground area and the flag indicating the background area set for each pixel. Supplied to the operation unit 3 4 3.
  • the foreground / background area determination unit 3005-2 determines the foreground area and the background area based on the component 2, and ORs the flag indicating the foreground area and the flag indicating the background area set for each pixel. Supplied to the operation unit 3 4 3.
  • the foreground / background area determination unit 300-5-3 determines the foreground area and the background area based on the component 3, and logically ORs the flag indicating the foreground area and the flag indicating the background area set for each pixel. Supplied to the operation unit 3 4 3.
  • the OR operation unit 341 is a flag indicating the uncovered background area supplied from the uncovered background area determination unit 303-3, and is supplied from the uncovered background area determination unit 303-3-2. Based on the flag indicating the uncovered background area and the flag indicating the uncovered background area supplied from the covered background area determination unit 303, the covered background area determination unit 30 is provided. 3—Uncovered background area indicated by flag supplied from 1 and uncovered background area judgment The logical sum of the covered background area indicated by the flag supplied from part 3 03-3 and the uncovered background area indicated by the flag supplied from the covered background area determination section 303-3 Is calculated to generate a flag indicating the uncovered background area calculated by the logical sum. The logical sum operation unit 341 supplies the generated flag indicating the uncovered background area to the synthesis unit 306.
  • the OR operation unit 342 includes a flag indicating the covered background area supplied from the covered background area determination unit 3044-1 and the covered background area determination unit 3044-2 supplied from the covered background area determination unit. Based on the flag indicating the ground area and the flag indicating the covered background area supplied from the covered background area determination section 304-4-3, the flag supplied from the covered background area determination section 3044-1 The flag supplied from the covered background area indicated by the flag and the flag supplied from the covered background area judging section 304-1-2, and the flag supplied from the force bird background area judging section 304-4-3 Calculate the logical sum of the indicated covered background area and calculate with the logical sum Generating a flag indicating the covered background area. The OR operation unit 342 supplies the generated flag indicating the covered background area to the synthesis unit 306.
  • the OR operation unit 343 includes a flag indicating the foreground region supplied from the foreground / background region determination unit 3005-1, a flag indicating the foreground region supplied from the foreground / background region determination unit 3005-2, And the foreground / background area determination unit 3005--3 determines the foreground area and foreground background area indicated by the flag supplied from the foreground / background area determination unit 3005-1 based on the flag indicating the foreground area. Calculates the logical sum of the foreground area indicated by the flag supplied from the section 3055-2 and the foreground area indicated by the flag supplied from the foreground / background area determination section 305-5-3, and calculates the logical sum. A flag indicating the foreground area is generated.
  • the OR operation unit 343 supplies the generated flag indicating the foreground area to the synthesis unit 306.
  • the OR operation unit 3 4 3 outputs the background region supplied from the foreground / background region determination unit 3 05—1. Based on the flag indicating the background area, the flag indicating the background area supplied from the foreground / background area determination unit 300-5-2, and the flag indicating the background area supplied from the foreground / background area determination unit 300-5-3.
  • the synthesizing unit 303 includes a flag indicating the uncovered backdrop region supplied from the logical sum calculating unit 341, a flag indicating the covered background region supplied from the logical sum calculating unit 342, and a logical sum.
  • the combining section 303 outputs the combined area information.
  • the area specifying unit 104 having the configuration shown in FIG. 45 can output the area information specifying the foreground area, the background area, the covered background area, and the uncovered background area without leaking.
  • FIG. 46 is a diagram illustrating a mixture ratio estimated for each component signal and mixture ratio relation information corresponding thereto, and an area specifying unit 104 for specifying a region based on an input image input as a component signal.
  • FIG. 3 is a block diagram showing the configuration of FIG. Portions similar to those in the case shown in FIG. 45 are denoted by the same reference numerals, and description thereof will be omitted.
  • the AND operation unit 36 1 is provided with a flag indicating the uncovered background area supplied from the uncovered background area determination unit 3 0 3-1, and supplied from the uncovered background area determination unit 3 0 3-2. Based on a flag indicating the uncovered background area and a flag indicating the uncovered background area supplied from the uncovered background area determination unit 303_3. Uncovered background area judging unit 3 03-1 Uncovered background area indicated by the flag supplied from 3-1, Uncovered background area judging unit 3 0 3—Uncovered background indicated by the flag supplied from 3-2 Calculates the logical product of the uncovered background region indicated by the flag supplied from the ground region and the uncovered background region determination unit 303 to indicate the uncovered background region calculated by the logical product Generate a flag. The AND operation unit 361 supplies the generated flag indicating the uncovered background area to the synthesis unit 306.
  • the AND operation unit 365 includes a flag indicating the covered background area supplied from the covered background area determination unit 304-1, and the covered back area determination unit 304-4 supplied from the covered background area determination unit. Based on the flag indicating the ground area and the flag indicating the covered background area supplied from the covered background area determination unit 304-4-3, the flag supplied from the covered background area determination unit 3044-1 is The flag supplied from the covered background area indicated by the flag provided by the covered background area judgment unit 304-4-2 and the flag supplied by the force bird background area judgment unit 304_3 Calculates the logical product of the indicated covered background areas and calculates the logical product. Generate a flag indicating the covered background area. The logical product operation unit 365 supplies the generated flag indicating the covered background area to the synthesis unit 360.
  • the AND operation unit 365 includes a flag indicating the foreground region supplied from the foreground / background region determination unit 3005-1, a flag indicating the foreground region supplied from the foreground / background region determination unit 3005-2, And the foreground / background area determination unit 300-5-3, based on the flag indicating the foreground area supplied from the foreground / background area determination unit 300-5—determination of the foreground area and foreground background area indicated by the flag supplied from the Calculates the logical product of the foreground area indicated by the flag supplied from the section 3 05-2 and the foreground area indicated by the flag supplied from the foreground / background area determination section 3 2005-3, and calculates the logical product A flag indicating the foreground area is generated.
  • the calculation unit 363 supplies the generated flag indicating the foreground area to the synthesis unit 306.
  • the AND operation unit 365 includes a flag indicating the background area supplied from the foreground / background area determination unit 3005-11, a flag indicating the background area supplied from the foreground / background area determination unit 3005-2, And the foreground / background area determination unit 3005--3 determines the background area and foreground background area indicated by the flag supplied from the foreground / background area determination unit 3005-1 based on the flag indicating the background area. Calculates the logical product of the background area indicated by the flag supplied from section 3 05-2 and the background area indicated by the flag supplied from foreground background area determination section 3 05-3, and calculates the logical product.
  • a flag is generated that indicates the background area that has been set.
  • the logical product operation unit 366 supplies a flag indicating the generated background area to the synthesis unit 306.
  • the synthesizing unit 360 includes a flag indicating the uncovered backdrop region supplied from the logical product calculating unit 361, a flag indicating the covered background region supplied from the logical product calculating unit 362, and logical product. Indicates one of the uncovered background area, covered background area, foreground area, and background area for each pixel based on the flag indicating the foreground area and the flag indicating the background area supplied from the calculation unit 365. Synthesize area information.
  • the combining section 303 outputs the combined area information.
  • the area specifying unit 104 whose configuration is shown in FIG. 46 can output area information with fewer errors.
  • step S301 the area specifying unit 104 executes specific processing of the covered background area for each pixel based on the error value. Details of the specific processing of the covered background area will be described later.
  • step S302 the area specifying unit 104 executes a specific process of the uncovered background area for each pixel based on the error value. Details of the specific processing of the uncovered background area will be described later.
  • step S303 the foreground / background area determination unit 3005 specifies a foreground area and a background area for each pixel based on the input image, and the process ends.
  • the specific processing of the covered background area corresponding to step S301 will be described.
  • step S321 the prediction error calculation section 302 calculates an error value by a model corresponding to the uncovered background region.
  • the prediction error calculation unit 304 supplies the calculated error value to the covered background area determination unit 304.
  • step S322 the covered background area determination unit 304 determines whether the error value supplied from the prediction error calculation unit 302 is equal to or larger than the threshold Th, and determines whether the error value is equal to the threshold Th. If it is determined that it is equal to or greater than Th, the flow proceeds to step S323, and a flag indicating the covered background area is set to the pixel corresponding to the error value. The procedure proceeds to step S324.
  • step S322 If it is determined in step S322 that the error value is not equal to or greater than the threshold Th, the processing in step S332 is skipped because the area is not in the covered background area, and the procedure proceeds to step S322. Proceed to.
  • step S3224 the area specifying unit 104 determines whether or not processing has been performed on the entire screen, and when it is determined that processing has not been performed on the entire screen, the area specifying unit 104 determines in step S321. Return, and repeat the process of determining the covered background area. If it is determined in step S324 that the entire screen has been processed, the process proceeds to step S325, in which the covered background area determination unit 304 outputs a flag indicating the covered background area. The process ends.
  • step S302 With reference to the flowchart in FIG. 49, the specific processing of the anchored background area corresponding to step S302 will be described.
  • step S3401 the prediction error calculation unit 310 calculates an error value based on a model corresponding to the covered background area.
  • the prediction error calculation unit 301 supplies the calculated error value to the uncovered background area determination unit 303.
  • step S3342 the uncovered background area determination unit 303 determines whether or not the error value supplied from the prediction error calculation unit 301 is equal to or greater than the threshold Th, and determines whether the error value is equal to the threshold Th. If it is determined to be equal to or greater than Th, go to step S 3 4 3 Then, a flag indicating the uncovered background area is set to the pixel corresponding to the error value, and the procedure proceeds to step S344.
  • step S3342 If it is determined in step S3342 that the error value is not greater than or equal to the threshold value Th, the processing is not skipped in the uncovered background area, and the process in step S3343 is skipped, and the procedure proceeds to step S3344. move on.
  • step S3344 the area specifying unit 104 determines whether or not processing has been performed for the entire screen, and when it is determined that processing has not been performed for the entire screen, the area specifying unit 104 determines in step S3341. Return and repeat the process of determining the uncovered background area.
  • step S344 If it is determined in step S344 that the entire screen has been processed, the process proceeds to step S345, where the uncovered background area determination unit 303 outputs a flag indicating the uncovered background area. Then, the process ends.
  • the region specifying unit 104 calculates the error value based on the estimated mixture ratio and the mixture ratio relationship information corresponding to the estimated mixture ratio, and based on the calculated error value, The uncovered background area can be specified.
  • the region specifying unit 104 can determine the mixture ratio H based on the generated region information, and can output the determined mixture ratio H.
  • the area specifying unit 104 shown in FIG. 44 has a configuration similar to that of the flow charts of FIGS. 47 to 49 except that a covered background area or an uncovered background area is specified based on the added error value. Since the area is specified by the same processing as that described with reference to FIG. 1, detailed description of the processing is omitted.
  • the area specifying unit 104 shown in FIG. 45 specifies the area for each component, except that the final area is obtained by the logical sum of the specified areas. Since the area is specified by the same processing as described with reference to the flowchart of FIG. 49, detailed description of the processing is omitted.
  • the area specifying unit 104 shown in FIG. 46 specifies the area for each component, except that the final area is obtained by the logical product of the specified areas. Since the area is specified by the same processing as the processing described with reference to the flowchart of FIG. 7, detailed description of the processing is omitted.
  • FIG. 50 is a block diagram illustrating an example of the configuration of the foreground / background separation unit 105.
  • the input image supplied to the foreground / background separation unit 105 is supplied to the separation unit 601, switch 602, and switch 604.
  • the information indicating the covered background area and the area information indicating the uncovered background area supplied from the area specifying unit 104 are supplied to the separating unit 601.
  • the area information indicating the foreground area is supplied to the switch 602.
  • the area information indicating the background area is supplied to the switch 604.
  • the mixing ratio supplied from the mixing ratio calculation unit 103 is supplied to the separation unit 601.
  • the separation unit 601 is an area information indicating a covered background area, and an area indicating an uncovered background area. Based on the information and the mixture ratio ⁇ , the foreground components are separated from the input image, and the separated foreground components are supplied to the synthesis unit 603, and the background components are separated from the input image.
  • the separated background component is supplied to the synthesis unit 605.
  • the switch 602 is closed when the pixel corresponding to the foreground is input based on the area information indicating the foreground area, and supplies only the pixel corresponding to the foreground included in the input image to the synthesizing unit 603 I do.
  • the switch 604 is closed when a pixel corresponding to the background is input based on the area information indicating the background area, and supplies only the pixel corresponding to the background included in the input image to the combining unit 605. I do.
  • the combining unit 603 combines the foreground component image based on the foreground component supplied from the separation unit 601 and the foreground pixel supplied from the switch 602, and combines The foreground component image is output. Since the foreground area and the mixed area do not overlap, the combining unit 603 combines the foreground component image by applying a logical product operation to the foreground component and the foreground pixel, for example. .
  • the synthesizing unit 603 stores an image in which all pixel values are 0 in a built-in frame memory in an initialization process executed at the beginning of the process of synthesizing the foreground component image, and In the synthesis process, the foreground component image is stored (overwritten). Therefore, in the foreground component image output from the combining unit 603, 0 is stored as a pixel value in a pixel corresponding to the background region.
  • the synthesis unit 605 synthesizes a background component image based on the component corresponding to the background supplied from the separation unit 601 and the pixel corresponding to the background supplied from the switch 604, and synthesizes them. Outputs a background component image. Since the background region and the mixed region do not overlap, the combining unit 605 combines the background component image by applying a logical product operation to the component corresponding to the background and the pixel corresponding to the background, for example.
  • the synthesizing unit 605 stores an image in which all pixel values are 0 in a built-in frame memory in an initialization process executed at the beginning of the background component image synthesizing process.
  • the background component image is stored (overwritten) in the composition process. Accordingly, in the background component image output from the combining unit 605, 0 is stored as a pixel value in a pixel corresponding to the foreground area.
  • FIG. 51A is a diagram illustrating an input image input to the foreground / background separation unit 105, and a foreground component image and a background component image output from the foreground / background separation unit 105.
  • Figure 5 1 B is, c Figure 5 1 illustrates the input image input into the foreground background separator 1 0 5, and the model of the foreground component image and the background component image output from the foreground background separator 1 0 5 A is a schematic diagram of a displayed image
  • FIG. 51B is a one-line image including pixels belonging to the foreground area, background area, and mixed area corresponding to FIG. 51A.
  • FIG. 4 shows a model diagram in which pixels are developed in the time direction.
  • the background component image output from the foreground / background separation unit 105 includes pixels belonging to the background area and the background Is composed of
  • the foreground component image output from the foreground / background separator 105 is composed of the pixels belonging to the foreground area and the foreground components included in the pixels of the mixed area. You.
  • the pixel values of the pixels in the mixed area are separated into a background component and a foreground component by the foreground / background separation unit 105.
  • the separated background component forms a background component image together with the pixels belonging to the background region.
  • the separated foreground component forms a foreground component image together with the pixels belonging to the foreground area.
  • the pixel value of the pixel corresponding to the background region is set to 0, and meaningful pixel values are set to the pixel corresponding to the foreground region and the pixel corresponding to the mixed region.
  • the pixel value of the pixel corresponding to the foreground area is set to 0, and a significant pixel value is set to the pixel corresponding to the background area and the pixel corresponding to the mixed area.
  • FIG. 52 is a model of an image showing foreground components and background components of two frames including a foreground corresponding to an object moving from left to right in the figure.
  • the foreground motion amount V is 4, and the number of virtual divisions is 4.
  • the leftmost pixel and the 14th to 18th pixels from the left consist only of background components and belong to the background area.
  • the second through fourth pixels from the left include the background component and the foreground component, and belong to the anchor bird background area.
  • the 11th to 13th pixels from the left include the background component and the foreground component, and belong to the covered background region.
  • the fifth through tenth pixels from the left consist only of foreground components and belong to the foreground area.
  • the first through fifth pixels from the left, and 18 from the left The ith pixel consists of only background components and belongs to the background area.
  • the sixth through eighth pixels from the left include the background component and the foreground component, and belong to the uncovered background area.
  • the fifteenth through seventeenth pixels from the left include the background component and the foreground component, and belong to the covered background area.
  • the ninth to 14th pixels from the left consist only of foreground components and belong to the foreground area.
  • FIG. 53 is a diagram illustrating a process of separating a foreground component from pixels belonging to a covered background area.
  • 1 to 18 are mixing ratios corresponding to each of the pixels in frame #n.
  • the 15th to 17th pixels from the left belong to the covered background area.
  • h 15 is the mixture ratio of the 15th pixel from the left of frame #n.
  • P15 is the pixel value of the 15th pixel from the left of frame # ⁇ -1.
  • Equation (65) the sum ⁇ 5 of the foreground components of the 15th pixel from the left of frame ttn is expressed by Equation (65).
  • Equation (6 6) the sum ⁇ 6 of the foreground components of the 16th pixel from the left of frame ⁇ is expressed by Equation (6 6), and the sum ⁇ 7 of the foreground components of the 17th pixel from the left of frame # ⁇ is , which is expressed by equation (67).
  • P is the pixel value of the corresponding pixel in the previous frame.
  • FIG. 54 is a diagram illustrating a process of separating a foreground component from pixels belonging to an uncovered background area.
  • hi 1 through hi 18 are the mixing ratios corresponding to each of the pixels in the frame tin.
  • the second through fourth pixels from the left belong to the uncovered background area.
  • the pixel value C02 of the second pixel from the left of frame #n is represented by Expression (69).
  • 2 is the mixture ratio of the second pixel from the left of frame ⁇ .
  • ⁇ 02 is the pixel value of the second pixel from the left of frame # ⁇ + 1.
  • Equation (70) the sum f02 of the foreground components of the second pixel from the left of frame # ⁇ is expressed by Equation (70).
  • equation (7 1) the sum f03 of the foreground components of the third pixel from the left of frame # ⁇ is expressed by equation (7 1)
  • equation f04 of the foreground components of the fourth pixel from the left of frame ⁇ ⁇ is expressed by equation (7 2).
  • the foreground component fu included in the pixel value C of the pixel belonging to the uncovered background area is calculated by Expression (73).
  • is the pixel value of the corresponding pixel in the next frame.
  • the separation unit 601 includes information indicating the covered background area and information indicating the uncovered background area included in the area information.
  • the foreground component and the background component can be separated from the pixels belonging to the mixed region based on the mixing ratio for each pixel.
  • FIG. 55 is a block diagram illustrating an example of a configuration of the separation unit 6001 that performs the above-described processing.
  • the image input to the separation section 601 is supplied to the frame memory 621, and area information indicating the covered background area and the uncovered background area supplied from the mixture ratio calculation section 103. , And the mixing ratio H are input to the separation processing block 62.
  • the frame memory 6 21 stores the input image in frame units.
  • the frame memory 6 2 1 stores the frame 1, which is the frame immediately before the frame tfn, the frame # ⁇ , and the frame ifn + 1 which is the frame after the frame #n. Is stored.
  • the frame memory 6 21 supplies the corresponding pixels of the frame # n ⁇ 1, the frame #n, and the frame # n + l to the separation processing block 6 22.
  • the separation processing block 62 2 includes the frame #nl, the frame ttn, and the frame supplied from the frame memory 62 1 based on the area information indicating the covered background area and the uncovered background area, and the mixing ratio. Apply the operation described with reference to Figs. 53 and 54 to the pixel value of the corresponding pixel of # n + l. Separate the foreground and background components from the pixels belonging to the mixed area of frame tin. And supplies it to the frame memory 6 23.
  • the separation processing block 6 22 includes an uncovered area processing section 6 31, a covered area processing section 6 32, a combining section 6 33, and a combining section 6 3 4.
  • the multiplier 6 4 1 of the uncovered area processing unit 6 3 1 multiplies the mixture ratio H by the pixel value of the pixel of the frame ttn + 1 supplied from the frame memory 6 2 1 and outputs the result to the switch 6 4 2 .
  • the switch 642 is closed when the pixel of the frame supplied from the frame memory 62 1 (corresponding to the pixel of the frame ⁇ + 1) is in the uncovered background area, and the switch 642 is closed.
  • the pixel value multiplied by the mixture ratio supplied from is supplied to the computing unit 643 and the synthesizing unit 634. From Switch 6 4 2
  • the value obtained by multiplying the pixel value of the pixel of the input frame ttn + 1 by the mixture ratio H is equal to the background component of the pixel value of the corresponding pixel of the frame ttn + 1.
  • Arithmetic unit 643 subtracts the background component supplied from switch 642 from the pixel value of the pixel of frame #n supplied from frame memory 621, and obtains the foreground component.
  • the arithmetic unit 634 supplies the foreground component of the pixel of the frame ttn belonging to the anchored background area to the synthesizing unit 633.
  • the multiplier 651 of the covered area processing unit 632 multiplies the mixture ratio H by the pixel value of the pixel of the frame ttn-1 supplied from the frame memory 621 and outputs the result to the switch 652.
  • the switch 652 is closed when the pixel of the frame ttn (corresponding to the pixel of the frame #nl) supplied from the frame memory 6 21 is a covered background area, and is supplied from the multiplier 651.
  • the pixel value multiplied by the mixture ratio a is supplied to the computing unit 653 and the synthesizing unit 6334.
  • the value obtained by multiplying the pixel value of the pixel of the frame ttn_l output from the switch 652 by the mixture ratio is equal to the background component of the pixel value of the corresponding pixel of the frame.
  • the computing unit 653 subtracts the background component supplied from the switch 652 from the pixel value of the pixel of the frame ⁇ supplied from the frame memory 621, thereby obtaining a foreground component.
  • the computing unit 653 supplies the foreground component of the pixel of frame # ⁇ belonging to the covered background area to the combining unit 633.
  • the synthesizing unit 633 includes, in the frame, the foreground components of the pixels belonging to the uncovered background area supplied from the computing unit 643, and the covered background area supplied from the computing unit 653.
  • the foreground components of the pixels belonging to are synthesized and supplied to the frame memory 6 23.
  • the synthesizing unit 634 includes a background component of a pixel belonging to the anchored background area supplied from the switch 642 and a pixel belonging to the covered background area supplied from the switch 652 of the frame.
  • the background components of are synthesized and supplied to the frame memory 623.
  • the frame memory 6 2 3 stores the frame supplied from the separation processing block 6 2 2 «The foreground component and the background component of the pixel in the mixed region of n are stored respectively.
  • the frame memory 623 outputs the stored foreground components of the pixels of the mixed region of the frame # ⁇ and the stored background components of the pixels of the mixed region of the frame ttn.
  • the synthesizing unit 603 generates a foreground component image by synthesizing the foreground components of the pixels in the mixed area of the frame ttn and the pixels belonging to the foreground area, which are output from the separating unit 601.
  • the reference numeral 605 generates a background component image by synthesizing the background component of the pixel in the mixed region of the frame ⁇ and the pixel belonging to the background region, which are output from the separation unit 601.
  • FIG. 56 shows an example of a foreground component image corresponding to frame ⁇ of FIG. Since the leftmost pixel and the 14th pixel from the left consisted of only the background component before the foreground and background were separated, the pixel value was set to 0.
  • the second to fourth pixels from the left belong to the covered background area before the foreground and background are separated, the background component is set to 0, and the foreground component is left as it is.
  • the 11th to 13th pixels from the left belong to the covered background area, the background component is set to 0, and the foreground component is left as it is.
  • the fifth to tenth pixels from the left are left as they are because they consist only of foreground components.
  • 'FIG. 56 ⁇ shows an example of a background component image corresponding to frame # ⁇ in FIG. The leftmost pixel and the 14th pixel from the left are left alone because they consisted only of the background component before the foreground and background were separated.
  • the second to fourth pixels from the left belong to the covered background area before the foreground and the background are separated, the foreground component is set to 0, and the background component is left as it is.
  • the 11th to 13th pixels from the left belong to the covered background area before the foreground and background are separated, the foreground component is set to 0, and the background component is left as it is. 5th to 10th pixels from the left Before the foreground and the background are separated, the pixel consists of only the foreground components, so the pixel value is set to 0.
  • step S601 the frame memory 621 of the separation unit 601 acquires the input image, and sets the frame ttn to be separated from the foreground and background into the previous frame ⁇ -l and the subsequent frame tt ⁇ -l. With frame ttn + 1
  • step S602 the separation processing block 622 of the separation unit 601 acquires the area information supplied from the mixture ratio calculation unit 103.
  • Separating section 6 0 1 of the separation processing block 6 2 2 acquires the supplied mixing ratio a from the mixing ratio calculating unit 1 0 3.
  • step S604 the uncovered area processing unit 631 determines the pixel value of the pixel belonging to the uncovered background area supplied from the frame memory 621, based on the area information and the mixture ratio. , The background components are extracted.
  • step S605 the uncovered area processing unit 631 executes the processing of the pixels belonging to the uncovered background area supplied from the frame memory 621, based on the area information and the mixture ratio ⁇ . Extract the foreground component from the value.
  • step S606 the covered area processing unit 632 calculates the pixel value of the pixel belonging to the covered background area supplied from the frame memory 621, based on the area information and the mixing ratio. Extract background components.
  • step S607 the covered area processing unit 632 calculates the pixel value of the pixel belonging to the covered background area supplied from the frame memory 621, based on the area information and the mixing ratio. Extract foreground components.
  • step S 608 the synthesizing unit 633 3 extracts the foreground components of the pixels belonging to the anchored background area extracted in the processing in step S 605 and the pixels in the processing in step S 607.
  • the pixels belonging to the covered background area are combined with the foreground components.
  • the synthesized foreground component is supplied to the synthesis unit 603. Further, the synthesizing unit 603 synthesizes the pixels belonging to the foreground area supplied via the switch 602 with the foreground components supplied from the separating unit 601 to generate a foreground component image. To achieve.
  • step S609 the synthesizing unit 634 extracts the background components of the pixels belonging to the uncovered background area extracted in the processing of step S604 and the background components of the pixels in the processing of step S606. And the background components of the pixels belonging to the covered background area.
  • the synthesized background component is supplied to the synthesis unit 605. Further, the synthesizing unit 605 synthesizes the pixels belonging to the background area supplied via the switch 604 and the background component supplied from the separating unit 601 to generate a background component image. To achieve.
  • step S610 the synthesizing unit 603 outputs a foreground component image.
  • step S611 the synthesizing unit 605 outputs the background component image, and the process ends.
  • the foreground / background separating unit 105 separates the foreground component and the background component from the input image based on the region information and the mixture ratio, and outputs a foreground component image including only the foreground component, and A background component image consisting of only background components can be output. Next, adjustment of the amount of motion blur in the foreground component image will be described.
  • FIG. 58 is a block diagram illustrating an example of the configuration of the motion-blur adjusting unit 106.
  • the motion vector and its position information supplied from the motion detecting unit 102 are supplied to the processing unit determining unit 801, the modeling unit 802, and the arithmetic unit 805.
  • the area information supplied from the area specifying unit 104 is supplied to the processing unit determining unit 801.
  • the foreground component image supplied from the foreground / background separation unit 105 is supplied to the adding unit 804.
  • the processing unit determination unit 8001 generates a processing unit based on the motion vector, its position information, and area information, and sends the generated processing unit to the modeling unit 8002 and the adding unit 800. Supply.
  • the processing unit generated by the processing unit determination unit 801 starts with a pixel corresponding to the covered background area of the foreground component image, as shown in A in FIG. Consecutive pixels arranged in the motion direction up to the pixel corresponding to the covered background area, or consecutive pixels arranged in the motion direction starting from the pixel corresponding to the uncovered background area to the pixel corresponding to the covered background area Is shown.
  • the processing unit is composed of, for example, two data: an upper left point (a pixel specified by the processing unit and a position of a pixel located at the leftmost or uppermost position on the image) and a lower right point.
  • the modeling unit 802 performs modeling based on the motion vector and the input processing unit. More specifically, for example, the modeling unit 802 includes a plurality of models corresponding to the number of pixels included in a processing unit, the number of virtual divisions of pixel values in the time direction, and the number of foreground components for each pixel. Is stored in advance, and a model that specifies the correspondence between the pixel value and the foreground component as shown in FIG. 60 is selected based on the processing unit and the number of virtual divisions of the pixel value in the time direction. .
  • the modeling unit 8002 sets the number of virtual divisions to 5 and is positioned at the leftmost position.
  • the pixel contains one foreground component
  • the second pixel from the left contains two foreground components
  • the third pixel from the left contains three foreground components
  • the fourth pixel from the left contains four foreground components.
  • the fifth pixel from the left contains five foreground components
  • the sixth pixel from the left contains five foreground components
  • the seventh pixel from the left contains five foreground components.
  • the eighth pixel from the left contains five foreground components
  • the ninth pixel from the left contains four foreground components
  • the tenth pixel from the left contains three foreground components
  • 1 The first pixel contains two foreground components
  • the second pixel from the left contains one foreground component
  • the modeling unit 8002 determines the model based on the motion vector and the processing unit. May be generated.
  • the modeling unit 802 supplies the selected model to the equation generation unit 803.
  • the equation generation unit 803 generates an equation based on the model supplied from the modeling unit 802. Referring to the foreground component image model shown in FIG. 60, the number of foreground components is 8, the number of pixels corresponding to the processing unit is 12, the amount of motion V is 5, and the number of virtual divisions is The equation generated by the equation generator 803 when the value is 5 will be described.
  • C05 F05 / v + F04 / v + F03 / v + F02 / v + F01 / v (7 8)
  • C06 F06 / v + F05 / v + F04 / v + F03 / v + F02 / v (7 9)
  • C07 F07 / v + F06 / v + F05 / v + F04 / v + F03 / v (80)
  • C08 F08 / v + F07 / v + F06 / v + F05 / v + F04 / v (8 1)
  • C09 F08 / v + F07 / v + F06 / v + F05 / v (8 2)
  • Equations (86) to (97) show the equations generated by the equation generator 803.
  • C03 lFOl / v + 1F02 / v + lF03 / v + 0F04 / v + 0-F05 / v + 0F06 / v + 0F07 / v + 0F08 / v 88)
  • C04 l-FOl / v + 1-F02 / v + l-F03 / v + lF04 / v + 0-F05 / v
  • C05 lFO1 / v + 1F02 / v + l-F03 / v + lF04 / v + l-F05 / v
  • Equations (86) to (97) can also be expressed as Equation (98)
  • Ci .aij'Filv (98)
  • j indicates the position of the pixel.
  • j has a value of any one of 1 to 12.
  • I indicates the position of the foreground value.
  • i has a value of any one of 1 to 8.
  • aij has a value of 0 or 1 corresponding to the values of i and j.
  • equation (98) can be expressed as equation (99).
  • ej is an error included in the target pixel Cj.
  • Equation (99) can be rewritten as equation (100). '
  • equation (103) can be derived.
  • equation (105) Based on the least squares method, the normal equation generated by the equation generator 8 03 An example is shown in equation (105).
  • the error contained in the pixel C can be dispersed.
  • the equation generating section 803 supplies the normal equation generated in this way to the adding section 804.
  • the adding unit 804 converts the pixel value C included in the foreground component image into an equation of a matrix supplied from the equation generating unit 803 based on the processing unit supplied from the processing unit determining unit 801. Set.
  • the adding unit 804 supplies the matrix in which the pixel values C are set to the arithmetic unit 805.
  • the arithmetic unit 805 calculates the foreground component Fi / v from which the motion blur has been removed by a processing based on a solution method such as a sweeping-out method (Gauss-Jordan elimination), and calculates the foreground pixel from which the motion blur has been removed. Calculate Fi corresponding to any one of the integers from 0 to 8, i.e., the value of Fi, which is a pixel value from which motion blur has been removed, as shown in FIG. 61.
  • the foreground component image is output to the motion blur adding unit 806 and the selecting unit 807.
  • each of F01 to F08 is set for each of C03 to C10 in order not to change the position of the foreground component image with respect to the screen. Yes, and can correspond to any position.
  • the motion blur adding unit 806 includes a motion blur adjustment amount v ′ having a value different from the motion amount V, for example, a motion blur adjustment amount V ′ having a half value of the motion amount V, and a value irrelevant to the motion amount V.
  • the motion blur adding unit 806 divides the foreground pixel value Fi from which the motion blur has been removed by the motion blur adjustment amount v ′ to obtain a foreground component Fi / v ′. Is calculated, and the sum of the foreground components Fi / v 'is calculated to generate a pixel value in which the amount of motion blur is adjusted.
  • the pixel value C02 is (F01) / ⁇ ′
  • the pixel value C03 is (F01 + F02) / ⁇ ′
  • the pixel value C04 is ( FO 1 + F02 + F03) / ⁇ ′
  • the pixel: C05 is (F02 + F03 + F04) / v ′.
  • the motion blur adding unit 806 supplies the foreground component image in which the amount of motion blur has been adjusted to the selecting unit 807.
  • the selection unit 807 is, for example, a calculation unit 807 based on a selection signal corresponding to the user's selection.
  • the motion blur adjustment unit 106 can adjust the amount of motion blur based on the selection signal and the motion blur adjustment amount v ′.
  • the motion-blur adjusting unit 106 calculates the equation (10 6) Generate an expression for the matrix shown.
  • the motion-blur adjusting unit 106 sets an expression corresponding to the length of the processing unit in this way, and calculates Fi, which is a pixel value in which the amount of motion blur has been adjusted. Similarly, for example, when the number of pixels included in the processing unit is 100, an equation corresponding to 100 pixels is generated, and Fi is calculated.
  • FIG. 64 is a diagram illustrating another configuration of the motion-blur adjusting unit 106.
  • the same parts as those shown in FIG. 58 are denoted by the same reference numerals, and description thereof will be omitted.
  • the selection unit 821 based on the selection signal, supplies the input motion vector and its position signal to the processing unit determination unit 8001 and the modeling unit 8002 as they are, or the motion vector. Is replaced by the motion-blur adjustment amount v ', and the motion vector and its position signal whose size has been replaced by the motion-blur adjustment amount v' are processed by the processing unit determination unit 81 and the modeling unit 80.
  • Supply 2
  • the processing unit determination unit 801 to the calculation unit 805 of the motion blur adjustment unit 106 in FIG. 64 correspond to the values of the motion amount V and the motion blur adjustment amount v ′.
  • the motion-blur adjusting unit 106 generates an equation corresponding to the motion amount V and the processing unit, sets the pixel value of the foreground component image in the generated equation, and reduces the amount of motion blur. An adjusted foreground component image is calculated.
  • step S801 the processing unit determination unit 801 of the motion blur adjustment unit 106 generates a processing unit based on the motion vector and the area information, and the generated processing unit is modeled by the modeling unit. 802.
  • step S802 the modeling unit 802 of the motion-blur adjusting unit 106 selects or generates a model according to the motion amount V and the processing unit.
  • step S803 the equation generator 803 creates a normal equation based on the selected model.
  • step S804 the adding unit 804 sets the pixel value of the foreground component image in the created normal equation.
  • step S805 the adding unit 804 determines whether or not the pixel values of all the pixels corresponding to the processing unit have been set, and determines whether the pixel values of all the pixels corresponding to the processing unit have been set. If it is determined that the setting has not been performed, the process returns to step S804, and the process of setting the pixel value to the normal equation is repeated.
  • step S805 If it is determined in step S805 that the pixel values of all the pixels in the processing unit have been set, the process proceeds to step S806, and the arithmetic unit 805 is supplied from the adding unit 804. Based on the normal equation in which the pixel value is set, the pixel value of the foreground with the amount of motion blur adjusted is calculated, and the process ends.
  • the motion blur adjusting unit 106 can adjust the amount of motion blur from the foreground image including motion blur based on the motion vector and the area information.
  • FIG. 66 is a block diagram illustrating another example of the configuration of the motion-blur adjusting unit 106.
  • the motion vector and its position information supplied from the motion detection unit 102 are supplied to the processing unit determination unit 901 and the correction unit 905, and the region information supplied from the region identification unit 104 is , And are supplied to the processing unit determination unit 901.
  • the foreground component image supplied from the foreground / background separator 105 is supplied to the calculator 904.
  • the processing unit determination unit 901 generates a processing unit based on the motion vector, its position information, and area information, and supplies the generated processing unit to the modeling unit 902 together with the motion vector. I do.
  • the modeling unit 902 executes modeling based on the motion vector and the input processing unit. More specifically, for example, the modeling unit 92 includes a plurality of models corresponding to the number of pixels included in the processing unit, the number of virtual divisions of pixel values in the time direction, and the number of foreground components for each pixel. Is stored in advance, and a model that specifies the correspondence between pixel values and foreground components as shown in Fig. 67 is selected based on the processing unit and the number of virtual divisions of pixel values in the time direction. .
  • the modeling unit 902 sets the number of virtual divisions to 5, and the leftmost pixel is one. Contains the foreground component, the second pixel from the left contains two foreground components, the third pixel from the left contains three foreground components, and the fourth pixel from the left contains four foreground components. The fifth pixel from the left contains five foreground components, the sixth pixel from the left contains five foreground components, the seventh pixel from the left contains five foreground components, and the eighth from the left.
  • Pixel contains five foreground components
  • the ninth pixel from the left contains four foreground components
  • the 10th pixel from the left contains three foreground components
  • the 11th pixel from the left Contains two foreground components
  • the second pixel from the left contains one foreground component, for a total of eight foreground components.
  • the modeling unit 902 uses the model based on the motion vector and the processing unit. May be generated.
  • the equation generator 903 uses the model supplied from the modeling unit 902 to Generate an expression.
  • the number of foreground components is 8
  • the number of pixels corresponding to the processing unit is 12, and the motion amount V is 5.
  • an example of an equation generated by the equation generating unit 93 will be described.
  • the pixel value C12 includes only the foreground component F08 / v, as shown in equation (107), and the pixel value C11 includes the foreground component F08 / v and the foreground component Consists of the sum of products of F07 / v. Therefore, the foreground component F07 / v can be obtained by equation (108).
  • the foreground components F06 / v to FOl / v can be obtained by Expressions (109) to (114). .
  • the equation generation unit 903 generates an equation for calculating a foreground component based on a difference between pixel values, as shown in Expressions (107) to (114).
  • the equation generator 903 supplies the generated equation to the calculator 904.
  • the calculation unit 904 sets the pixel value of the foreground component image to the equation supplied from the equation generation unit 903, and calculates the foreground component based on the equation in which the pixel value is set. Performance For example, when the equations (107) to (111) are supplied from the equation generator 903, the arithmetic unit 904 calculates the equations (107) to (114) as follows. Set the pixel values C05 to C12.
  • the calculation unit 904 calculates a foreground component based on the equation in which the pixel value is set. For example, the arithmetic unit 904 calculates the foreground component FO l as shown in FIG. 68 by an arithmetic operation based on equations (107) to (114) in which pixel values C05 to C12 are set. Calculate / v to F08 / v. The calculation unit 904 supplies the foreground components FO l / v to F08 / v to the correction unit 905.
  • the correction unit 905 removes motion blur by multiplying the foreground component supplied from the calculation unit 904 by the motion amount V included in the motion vector supplied from the processing unit determination unit 901. Calculate the pixel value of the foreground. For example, when the foreground components FO l / v to FOS / v supplied from the arithmetic unit 904 are supplied, the correction unit 905 provides, for each of the foreground components FO l / v to F08 / v, By multiplying by the motion amount V of 5, foreground pixel values F01 to F08 from which motion blur has been removed are calculated as shown in FIG.
  • the correcting unit 905 supplies the foreground component image composed of the pixel values of the foreground, from which the motion blur has been removed, calculated as described above, to the motion blur adding unit 906 and the selecting unit 907.
  • the motion-blur adding unit 9 06 generates a motion-blur adjustment amount v ′ having a value different from the motion amount V, for example, a motion-blur adjustment amount v ′ having a half value of the motion amount V,
  • the amount of motion blur can be adjusted with the motion blur adjustment amount v '. For example, as shown in FIG.
  • the motion-blur adding unit 906 divides the foreground pixel value Fi from which the motion blur has been removed by the motion-blur adjustment amount v ′ to obtain a foreground component Fi / v ′. Is calculated, and the sum of the foreground components Fi / v 'is calculated to generate a pixel value in which the amount of motion blur is adjusted.
  • the pixel value C02 is (F01) / v'
  • the pixel value C03 is (F01 + F02) / v '
  • the pixel value C04 is (F01 + F02 + F03) / v '
  • the pixel value C05 is (F02 + F03 + F04) / v'.
  • the motion blur adding unit 906 supplies the foreground component image in which the amount of motion blur has been adjusted to the selecting unit 907.
  • the selection unit 907 supplies the foreground component image from which the motion blur has been removed supplied from the correction unit 905 and the motion blur addition unit 906 based on a selection signal corresponding to the user's selection, for example.
  • One of the selected foreground component images with the adjusted amount of motion blur is selected, and the selected foreground component image is output.
  • the motion blur adjustment unit 106 can adjust the amount of motion blur based on the selection signal and the motion blur adjustment amount v ′.
  • step S901 the processing unit determination unit 901 of the motion blur adjustment unit 106 generates a processing unit based on the motion vector and the area information, and converts the generated processing unit into a modeling unit. It is supplied to 902 and the collection section 905.
  • step S902 the modeling unit 902 of the motion-blur adjusting unit 106 selects or generates a model according to the motion amount V and the processing unit.
  • step S903 the equation generation unit 903 generates an equation for calculating a foreground component from a difference between pixel values of the foreground component image based on the selected or generated model.
  • step S904 the arithmetic unit 904 sets the pixel value of the foreground component image in the created equation, and calculates the foreground component from the pixel value difference based on the equation in which the pixel value is set. Extract.
  • step S905 the arithmetic unit 904 determines whether all foreground components corresponding to the processing unit have been extracted, and has not extracted all foreground components corresponding to the processing unit. If the judgment is made, the process returns to step S904, and the process of extracting the foreground component is repeated.
  • step S905 If it is determined in step S905 that all the foreground components corresponding to the processing unit have been extracted, the process proceeds to step S906, where the correction unit 905 determines the operation unit based on the motion amount V.
  • the correction unit 905 determines the operation unit based on the motion amount V.
  • Each of the foreground components FO l / v to FOS / v supplied from 904 is corrected to calculate foreground pixel values F01 to F08 from which motion blur has been removed.
  • step S907 the motion-blur adding unit 906 calculates the pixel value of the foreground with the amount of the motion blur adjusted, and the selecting unit 907 selects the image or the motion-blurred image. One of the images in which the amount of motion blur has been adjusted is selected, the selected image is output, and the process ends.
  • the motion-blur adjusting unit 106 shown in FIG. 66 can adjust the motion blur from the foreground image including the motion blur with a simpler operation and more quickly.
  • the image processing apparatus having the configuration shown in FIG. 2 can adjust the amount of motion blur included in the input image.
  • the mixing ratio H has been described as the ratio of the background component included in the pixel value, it may be the ratio of the foreground component included in the pixel value.
  • an example is given in which an image of the real space having the three-dimensional space and the time axis information is projected onto the two-dimensional space and the time and space having the time axis information using the video camera.
  • Is not limited to this example and corrects the distortion caused by the projection of more first information in the first dimension onto the second information in the smaller second dimension. It can be used to extract significant information, or to synthesize images more naturally.
  • the sensor is not limited to a CCD, but may be a solid-state imaging device.
  • the sensor may be a sensor in which the detection elements are arranged in a matrix, but may be a sensor in which the detection elements are arranged in a line.
  • the recording medium on which the program for performing the signal processing of the present invention is recorded as shown in FIG.
  • a magnetic disk 51 including a floppy (registered trademark) disk
  • an optical disk 52 CD-ROM (Compact Di- sc-Read Only Memory)
  • DVD including Digital Versatile Disk
  • magneto-optical disk 53 including MD (Mini-Disc) (trademark)
  • semiconductor media 54 instead, it is provided with the R0M 22 in which the program is recorded, which is provided to the user in a state in which it is previously installed in the computer, and the hard disk included in the storage unit 28.
  • steps for describing a program to be recorded on a recording medium are not only performed in chronological order according to the order described, but are not necessarily performed in chronological order. Alternatively, it also includes processes that are individually executed.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Studio Circuits (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

明細書
画像処理装置および方法、 並びに撮像装置 技術分野
本発明は、 画像処理装置および方法、 並びに撮像装置に関し、 特に、 センサに より検出した信号と現実世界との違いを考慮した画像処理装置および方法、 並び に撮像装置に関する。 背景技術
現実世界における事象をセンサで検出し、 画像センサが出力するサンプリング データを処理する技術が広く利用されている。
例えば、 静止している所定の背景の前で移動する物体をビデオカメラで撮像し て得られる画像には、 物体の移動速度が比較的速い場合、 動きボケが生じること になる。
しかしながら、 静止している背景の前で物体が移動するとき、 移動する物体の 画像自身の混ざり合いによる動きボケのみならず、 背景の画像と移動する物体の 画像との混ざり合いが生じる。 従来は、 背景の画像と移動する物体の画像との混 ざり合いの状態に対応する処理は、 考えられていなかった。 発明の開示
本発明はこのような状況に鑑みてなされたものであり、 背景の画像の領域、 移 動する物体の画像の領域、 および混ざり合いが生じている画像の領域を特定する ことができるようにすることを目的とする。
本発明の画像処理装置は、 画像データの注目フレームの注目画素に対応する、 注目フレームの周辺の周辺フレームの画素データを、 画像データの複数のォブジ ェク トのうちの背景となる背景オブジェク トに相当する背景画素データとして抽 出すると共に、 注目フレームに存在する注目画素の注目画素データを抽出し、 注 目画素について、 注目画素データおよび背景画素データの関係を示す、 複数の関 係式を生成する関係式生成手段と、 関係式に基づいて、 注目画素に対応して、 現 実世界において複数であるオブジェク トの混合状態を示す混合比を検出する混合 比検出手段と、 混合比検出手段により検出された混合比を関係式に代入すること により予測誤差を演算する予測誤差演算手段と、 予測誤差を基に、 注目画素の属 する領域が、 複数のオブジェク 卜が混合されてなる混合領域であって、 複数のォ ブジェク トのうちの前景となる前景オブジェク トの動き方向の先端側に形成され るカバードバックグラウンド領域であるか、 または、 混合領域であって、 前景ォ ブジェク トの動き方向の後端側に形成されるアンカバードバックグラウンド領域 であるかを特定するカバードバックグラウンド領域アンカバードバックグラウン ド領域特定手段と、 注目画素の属する領域が、 前景ォブジェク トを構成する前景 オブジェク ト成分のみからなる前景領域であるか、 または、 背景オブジェク トを 構成する背景オブジェク ト成分のみからなる背景領域であるかを特定する前景領 域背景領域特定手段とを含むことを特徴とする。
混合比検出手段は、 関係式に基づいて、 注目画素に対応して、 注目画素に含ま れる前景オブジェク ト成分を検出すると共に、 混合比を検出し、 予測誤差演算手 段は、 混合比検出手段により検出された混合比および注目画素に含まれる前景ォ ブジェク ト成分を関係式に代入することにより予測誤差を演算するようにするこ とができる。
関係式生成手段は、 注目画素に対応する、 周辺フレームの画素データを、 背景 オブジェク トに相当する背景画素データとして抽出すると共に、 注目画素の注目 画素データ、 および注目フレーム内の注目画素の近傍に位置する、 近傍画素の近 傍画素データを抽出し、 注目画素について、 注目画素データおよび近傍画素デー タ、 並びに注目画素データまたは近傍画素データに対応する背景画素データの関 係を示す、 複数の関係式を生成するようにすることができる。
関係式生成手段は、 注目画素データおよび近傍画素データに含まれる、 前景ォ ブジェク ト成分が等しいとする第 1の近似、 および混合領域において混合比の変 化が混合領域の画素の位置に対して直線的であるとする第 2の近似に基づいて、 複数の関係式を生成するようにすることができる。
関係式生成手段は、 注目画素データおよび近傍画素データに含まれる、 前景ォ ブジェク ト成分が等しいとする第 1の近似、 および混合領域において混合比の変 化が混合領域の画素の位置に対して平面的であるとする第 2の近似に基づいて、 複数の関係式を生成するようにすることができる。
混合比検出手段は、 複数の関係式を最小自乗法で解くことにより、 混合比を検 出するようにすることができる。
関係式生成手段は、 注目画素が、 カバードバックグラウンド領域に属するとし た場合、 注目フレームの前のフレームの画素データを、 背景画素データとして抽 出し、 注目画素が、 アンカバードバックグラウンド領域に属するとした場合、 注 目フレームの次のフレームの画素データを、 背景画素データとして抽出し、 複数 の関係式を生成するようにすることができる。
関係式生成手段は、 注目画素に対応して、 前景オブジェク トの動きを基に、 注 目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混合 画素データを抽出すると共に、 混合画素データにの個々に対応して、 背景ォブジ ェク トの動きを基に、 混合画素データが抽出されたフレームとは異なるフレーム から、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生成 するようにすることができる。
関係式生成手段は、 混合画素データに対応する前景オブジェク ト成分が等しい とする第 1の近似、 および注目フレームおよび周辺フレームから抽出された混合 画素データは一定であるとする第 2の近似に基づいて、 複数の関係式を生成する ようにすることができる。
関係式生成手段は、 注目画素に対応して、 前景オブジェク トの動きを基に、 注 目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混合 画素データを抽出すると共に、 混合画素データの個々に対応して、 背景オブジェ ク トの動きを基に、 混合画素データが抽出されたフレームの前のフレームから、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生成し、 力 バードバックグラウンド領域アンカバードバックグラウンド領域特定手段は、 予 測誤差が所定の閾値以上である領域をアンカバードバックグラウンド領域である と特定するようにすることができる。
関係式生成手段は、 注目画素に対応して、 前景オブジェク トの動きを基に、 注 目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混合 画素データを抽出すると共に、 混合画素データの個々に対応して、 背景オブジェ ク トの動きを基に、 混合画素データが抽出されたフレームの次のフレームから、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生成し、 力 バードバックグラウンド領域ァンカバードバックグラウンド領域特定手段は、 予 測誤差が所定の閾値以上である領域をカバードバックグラウンド領域であると特 定するようにすることができる。
本発明の画像処理方法は、 画像データの注目フレームの注目画素に対応する、 注目フレームの周辺の周辺フレームの画素データを、 画像データの複数のォブジ ェク トのうちの背景となる背景オブジェク トに相当する背景画素データとして抽 出すると共に、 注目フレームに存在する注目画素の注目画素データを抽出し、 注 目画素について、 注目画素データおよび背景画素データの関係を示す、 複数の関 係式を生成する関係式生成ステップと、 関係式に基づいて、 注目画素に対応して. 現実世界において複数であるォブジェク トの混合状態を示す混合比を検出する混 合比検出ステップと、 混合比検出ステップの処理により検出された混合比を関係 式に代入することにより予測誤差を演算する予測誤差演算ステップと、 予測誤差 を基に、 注目画素の属する領域が、 複数のォブジェク トが混合されてなる混合領 域であって、 複数のオブジェク トのうちの前景となる前景オブジェク トの動き方 向の先端側に形成されるカバードバックグラウンド領域であるか、 または、 混合 領域であって、 前景オブジェク トの動き方向の後端側に形成されるアンカバード バックグラウンド領域であるかを特定するカバードバックグラウンド領域アンカ バードバックグラウンド領域特定ステップと、 注目画素の属する領域が、 前景ォ ブジェク トを構成する前景オブジェク ト成分のみからなる前景領域である力 ま たは、 背景オブジェク トを構成する背景オブジェク ト成分のみからなる背景領域 であるかを特定する前景領域背景領域特定ステップとを含むことを特徴とする。 混合比検出ステップは、 関係式に基づいて、 注目画素に対応して、 注目画素に 含まれる前景ォブジェク ト成分を検出すると共に、 混合比を検出し、 予測誤差演 算ステップは、 混合比検出ステップの処理により検出された混合比および注目画 素に含まれる前景ォブジェク ト成分を関係式に代入することにより予測誤差を演 算するようにすることができる。
関係式生成ステップは、 注目画素に対応する、 周辺フレームの画素データを、 背景オブジェク トに相当する背景画素データとして抽出すると共に、 注目画素の 注目画素データ、 および注目フレーム内の注目画素の近傍に位置する、 近傍画素 の近傍画素データを抽出し、 注目画素について、 注目画素データおよび近傍画素 データ、 並びに注目画素データまたは近傍画素データに対応する背景画素データ の関係を示す、 複数の関係式を生成するようにすることができる。
関係式生成ステップは、 注目画素データおよび近傍画素データに含まれる、 前 景ォブジヱク ト成分が等しいとする第 1の近似、 および混合領域において混合比 の変化が混合領域の画素の位置に対して直線的であるとする第 2の近似に基づい て、 複数の関係式を生成するようにすることができる。
関係式生成ステップは、 注目画素データおよび近傍画素データに含まれる、 前 景ォブジュク ト成分が等しいとする第 1の近似、 および混合領域において混合比 の変化が混合領域の画素の位置に対して平面的であるとする第 2の近似に基づい て、 複数の関係式を生成するようにすることができる。
混合比検出ステップは、 複数の関係式を最小自乗法で解くことにより、 混合比 を検出するようにすることができる。
関係式生成ステップは'、 注目画素が、 カバードバックグラウンド領域に属する とした場合、 注目フレームの前のフレームの画素データを、 背景画素データとし て抽出し、 注目画素が、 アンカバードバックグラウンド領域に属するとした場合, 注目フレームの次のフレームの画素データを、 背景画素データとして抽出し、 複 数の関係式を生成するようにすることができる。
関係式生成ステップは、 注目画素に対応して、 前景オブジェク トの動きを基に、 注目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混 合画素データを抽出すると共に、 混合画素データにの個々に対応して、 背景ォプ ジェク トの動きを基に、 混合画素データが抽出されたフレームとは異なるフレー ムから、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生 成するようにすることができる。
関係式生成ステップは、 混合画素データに対応する前景オブジェク ト成分が等 しいとする第 1の近似、 および注目フレームおよび周辺フレームから抽出された 混合画素データは一定であるとする第 2の近似に基づいて、 複数の関係式を生成 するようにすることができる。
関係式生成ステップは、 注目画素に対応して、 前景オブジェク トの動きを基に、 注目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混 合画素データを抽出すると共に、 混合画素データの個々に対応して、 背景ォブジ エタ トの動きを基に、 混合画素データが抽出されたフレームの前のフレームから、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生成し、 力 バードバックグラウンド領域アンカバードバックグラウンド領域特定ステップは、 予測誤差が所定の閾値以上である領域をァンカバードバックグラウンド領域であ ると特定するようにすることができる。
関係式生成ステップは、 注目画素に対応して、 前景オブジェク トの動きを基に、 注目フレームおよび周辺フレームから、 複数のォブジェク トが混合状態にある混 合画素データを抽出すると共に、 混合画素データの個々に対応して、 背景ォブジ ェク トの動きを基に、 混合画素データが抽出されたフレームの次のフレームから、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生成し、 力 バードバックグラウンド領域アンカバードバックグラウンド領域特定ステップは- 予測誤差が所定の閾値以上である領域をカバードバックグラウンド領域であると 特定するようにすることができる。
本発明の記録媒体のプログラムは、 画像データの注目フレームの注目画素に対 応する、 注目フレームの周辺の周辺フレームの画素データを、 画像データの複数 のオブジェク トのうちの背景となる背景オブジェク トに相当する背景画素データ として抽出すると共に、 注目フレームに存在する注目画素の注目画素データを抽 出し、 注目画素について、 注目画素データおよび背景画素データの関係を示す、 複数の関係式を生成する関係式生成ステップと、 関係式に基づいて、 注目画素に 対応して、 現実世界において複数であるオブジェク トの混合状態を示す混合比を 検出する混合比検出ステップと、 混合比検出ステップの処理により検出された混 合比を関係式に代入することにより予測誤差を演算する予測誤差演算ステップと. 予測誤差を基に、 注目画素の属する領域が、 複数のオブジェク トが混合されてな る混合領域であって、 複数のオブジェク トのうちの前景となる前景オブジェク ト の動き方向の先端側に形成されるカバードバックグラウンド領域であるか、 また は、 混合領域であって、 前景オブジェク トの動き方向の後端側に形成されるアン カバードバックグラウンド領域であるかを特定する力バードバックグラウンド領 域アンカバードバックグラウンド領域特定ステップと、 注目画素の属する領域が. 前景オブジェク トを構成する前景オブジェク ト成分のみからなる前景領域である か、 または、 背景オブジェク トを構成する背景オブジェク ト成分のみからなる背 景領域であるかを特定する前景領域背景領域特定ステツプとを含むことを特徴と する。
混合比検出ステップは、 関係式に基づいて、 注目画素に対応して、 注目画素に 含まれる前景オブジェク ト成分を検出すると共に、 混合比を検出し、 予測誤差演 算ステップは、 混合比検出ステップの処理により検出された混合比および注目画 素に含まれる前景オブジェク ト成分を関係式に代入することにより予測誤差を演 算するようにすることができる。
関係式生成ステップは、 注目画素に対応する、 周辺フレームの画素データを、 背景オブジェク トに相当する背景画素データとして抽出すると共に、 注目画素の 注目画素データ、 および注目フレーム内の注目画素の近傍に位置する、 近傍画素 の近傍画素データを抽出し、 注目画素について、 注目画素データおよび近傍画素 データ、 並びに注目画素データまたは近傍画素データに対応する背景画素データ の関係を示す、 複数の関係式を生成するようにすることができる。
関係式生成ステップは、 注目画素データおよび近傍画素データに含まれる、 前 景ォブジェク ト成分が等しいとする第 1の近似、 および混合領域において混合比 の変化が混合領域の画素の位置に対して直線的であるとする第 2の近似に基づい て、 複数の関係式を生成するようにすることができる。
関係式生成ステップは、 注目画素データおよび近傍画素データに含まれる、 前 景オブジェク ト成分が等しいとする第 1の近似、 および混合領域において混合比 の変化が混合領域の画素の位置に对して平面的であるとする第 2の近似に基づい て、 複数の関係式を生成するようにすることができる。
混合比検出ステップは、 複数の関係式を最小自乗法で解くことにより、 混合比 を検出するようにすることができる。
関係式生成ステップは、 注目画素が、 カバードバックグラウンド領域に属する とした場合、 注目フレームの前のフレームの画素データを、 背景画素データとし て抽出し、 注目画素が、 アンカバードバックグラウンド領域に属するとした場合、 注目フレームの次のフレームの画素データを、 背景画素データとして抽出し、 複 数の関係式を生成するようにすることができる。
関係式生成ステップは、 注目画素に対応して、 前景オブジェク トの動きを基に、 注目フレームおよび周辺フレームから、 複数のォブジェク トが混合状態にある混 合画素データを抽出すると共に、 混合画素データにの個々に対応して、 背景ォブ ジェク トの動きを基に、 混合画素データが抽出されたフレームとは異なるフレー ムから、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生 成するようにすることができる。
関係式生成ステップは、 混合画素データに対応する前景オブジェク ト成分が等 しいとする第 1の近似、 および注目フレームおよび周辺フレームから抽出された 混合画素データは一定であるとする第 2の近似に基づいて、 複数の関係式を生成 するようにすることができる。
関係式生成ステップは、 注目画素に対応して、 前景オブジェク トの動きを基に、 注目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混 合画素データを抽出すると共に、 混合画素データの個々に対応して、 背景ォブジ ェク トの動きを基に、 混合画素データが抽出されたフレームの前のフレームから、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生成し、 力 バードバックグラウンド領域アンカバードバックグラウンド領域特定ステツプは、 予測誤差が所定の閾値以上である領域をアンカバードバックグラウンド領域であ ると特定するようにすることができる。
関係式生成ステップは、 注目画素に対応して、 前景オブジェクトの動きを基に、 注目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混 合画素データを抽出すると共に、 混合画素データの個々に対応して、 背景ォブジ ェク トの動きを基に、 混合画素データが抽出されたフレームの次のフレームから、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生成し、 力 バードバックグラウンド領域アンカバードバックグラウンド領域特定ステップは, 予測誤差が所定の閾値以上である領域をカバードバックグラウンド領域であると 特定するようにすることができる。
本発明のプログラムは、 コンピュータに、 画像データの注目フレームの注目画 素に対応する、 注目フレームの周辺の周辺フレームの画素データを、 画像データ の複数のオブジェク トのうちの背景となる背景オブジェク トに相当する背景画素 データとして抽出すると共に、 注目フレームに存在する注目画素の注目画素デー タを抽出し、 注目画素について、 注目画素データおよび背景画素データの関係を 示す、 複数の関係式を生成する関係式生成ステップと、 関係式に基づいて、 注目 画素に対応して、 現実世界において複数であるオブジェク トの混合状態を示す混 合比を検出する混合比検出ステップと、 混合比検出ステップの処理により検出さ れた混合比を関係式に代入することにより予測誤差を演算する予測誤差演算ステ ップと、 予測誤差を基に、 注目画素の属する領域が、 複数のオブジェク トが混合 されてなる混合領域であって、 複数のオブジェク トのうちの前景となる前景ォブ ジェク トの動き方向の先端側に形成されるカバードバックグラウンド領域である か、 または、 混合領域であって、 前景オブジェク トの動き方向の後端側に形成さ れるアンカバードバックグラウンド領域であるかを特定するカバードバックダラ ゥンド領域アンカバードバックグラウンド領域特定ステップと、 注目画素の属す る領域が、 前景オブジェク トを構成する前景オブジェク ト成分のみからなる前景 領域であるか、 または、 背景オブジェク トを構成する背景オブジェク ト成分のみ からなる背景領域であるかを特定する前景領域背景領域特定ステツプとを実行さ せることを特徴とする。
混合比検出ステップは、 関係式に基づいて、 注目画素に対応して、 注目画素に 含まれる前景オブジェク ト成分を検出すると共に、 混合比を検出し、 予測誤差演 算ステップは、 混合比検出ステップの処理により検出された混合比および注目画 素に含まれる前景オブジェク ト成分を関係式に代入することにより予測誤差を演 算するようにすることができる。
関係式生成ステップは、 注目画素に対応する、 周辺フレームの画素データを、 背景オブジェク トに相当する背景画素データとして抽出すると共に、 注目画素の 注目画素データ、 および注目フレーム内の注目画素の近傍に位置する、 近傍画素 の近傍画素データを抽出し、 注目画素について、 注目画素データおよび近傍画素 データ、 並びに注目画素データまたは近傍画素データに対応する背景画素データ の関係を示す、 複数の関係式を生成するようにすることができる。
関係式生成ステップは、 注目画素データおよび近傍画素データに含まれる、 前 景ォブジェク ト成分が等しいとする第 1の近似、 および混合領域において混合比 の変化が混合領域の画素の位置に対して直線的であるとする第 2の近似に基づい て、 複数の関係式を生成するようにすることができる。
関係式生成ステップは、 注目画素データおよび近傍画素データに含まれる、 前 景ォブジェク ト成分が等しいとする第 1の近似、 および混合領域において混合比 の変化が混合領域の画素の位置に対して平面的であるとする第 2の近似に基づい て、 複数の関係式を生成するようにすることができる。
混合比検出ステップは、 複数の関係式を最小自乗法で解くことにより、 混合比 を検出するようにすることができる。
関係式生成ステップは、 注目画素が、 カバードバックグラウンド領域に属する とした場合、 注目フレームの前のフレームの画素データを、 背景画素データとし て抽出し、 注目画素が、 アンカバードバックグラウンド領域に属するとした場合、 注目フレームの次のフレームの画素データを、 背景画素データとして抽出し、 複 数の関係式を生成するようにすることができる。
関係式生成ステップは、 注目画素に対応して、 前景オブジェク トの動きを基に、 注目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混 合画素データを抽出すると共に、 混合画素データにの個々に対応して、 背景ォブ ジェク トの動きを基に、 混合画素データが抽出されたフレームとは異なるフレー ムから、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生 成するようにすることができる。
関係式生成ステップは、 混合画素データに対応する前景オブジェク ト成分が等 しいとする第 1の近似、 および注目フレームおよび周辺フレームから抽出された 混合画素データは一定であるとする第 2の近似に基づいて、 複数の関係式を生成 するようにすることができる。
関係式生成ステップは、 注目画素に対応して、 前景オブジェク トの動きを基に、 注目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混 合画素データを抽出すると共に、 混合画素データの個々に対応して、 背景ォブジ エタ トの動きを基に、 混合画素データが抽出されたフレームの前のフレームから、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生成し、 力 バードバックグラウンド領域アンカバードバックダラゥンド領域特定ステップは、 予測誤差が所定の閾値以上である領域をアンカバードバックグラウンド領域であ ると特定するようにすることができる。 関係式生成ステップは、 注目画素に対応して、 前景オブジェク トの動きを基に- 注目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混 合画素データを抽出すると共に、 混合画素データの個々に対応して、 背景ォブジ ェク トの動きを基に、 混合画素データが抽出されたフレームの次のフレームから, 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生成し、 力 バードバックグラウンド領域アンカバードバックグラウンド領域特定ステップは, 予測誤差が所定の閾値以上である領域をカバードバックグラゥンド領域であると 特定するようにすることができる。
本発明の撮像装置は、 時間積分効果を有する所定数の画素を有する撮像素子に よって撮像された被写体画像を、 所定数の画素データからなる画像データとして 出力する撮像手段と、 画像データの注目フレームの注目画素に対応する、 注目フ レームの周辺の周辺フレームの画素データを、 画像データの複数のオブジェク ト のうちの背景となる背景オブジェク トに相当する背景画素データとして抽出する と共に、 注目フレームに存在する注目画素の注目画素データを抽出し、 注目画素 について、 注目画素データおよび背景画素データの関係を示す、 複数の関係式を 生成する関係式生成手段と、 関係式に基づいて、 注目画素に対応して、 現実世界 において複数であるオブジェク トの混合状態を示す混合比を検出する混合比検出 手段と、 混合比検出手段により検出された混合比を関係式に代入することにより 予測誤差を演算する予測誤差演算手段と、 予測誤差を基に、 注目画素の属する領 域が、 複数のオブジェク トが混合されてなる混合領域であって、 複数のオブジェ ク トのうちの前景となる前景オブジェク トの動き方向の先端側に形成されるカバ ードバックグラウンド領域である力、 または、 混合領域であって、 前景オブジェ ク トの動き方向の後端側に形成されるアンカバードバックグラウンド領域である かを特定するカバードバックグラウンド領域ァンカバードバックグラウンド領域 特定手段と、 注目画素の属する領域が、 前景オブジェク トを構成する前景ォブジ エタ ト成分のみからなる前景領域であるか、 または、 背景オブジェク トを構成す る背景ォブジュク ト成分のみからなる背景領域であるかを特定する前景領域背景 領域特定手段とを含むことを特徴とする。
混合比検出手段は、 関係式に基づいて、 注目画素に対応して、 注目画素に含ま れる前景オブジェク ト成分を検出すると共に、 混合比を検出し、 予測誤差演算手 段は、 混合比検出手段により検出された混合比および注目画素に含まれる前景ォ ブジエク ト成分を関係式に代入することにより予測誤差を演算するようにするこ とができる。
関係式生成手段は、 注目画素に対応する、 周辺フレームの画素データを、 背景 オブジェク トに相当する背景画素データとして抽出すると共に、 注目画素の注目 画素データ、 および注目フレーム内の注目画素の近傍に位置する、 近傍画素の近 傍画素データを抽出し、 注目画素について、 注目画素データおよび近傍画素デー タ、 並びに注目画素データまたは近傍画素データに対応する背景画素データの関 係を示す、 複数の関係式を生成するようにすることができる。
関係式生成手段は、 注目画素データおよび近傍画素データに含まれる、 前景ォ ブジェク ト成分が等しいとする第 1の近似、 および混合領域において混合比の変 化が混合領域の画素の位置に対して直線的であるとする第 2の近似に基づいて、 複数の関係式を生成するようにすることができる。
関係式生成手段は、 注目画素データおよび近傍画素データに含まれる、 前景ォ ブジェク ト成分が等しいとする第 1の近似、 および混合領域において混合比の変 化が混合領域の画素の位置に対して平面的であるとする第 2の近似に基づいて、 複数の関係式を生成するようにすることができる。
混合比検出手段は、 複数の関係式を最小自乗法で解くことにより、 混合比を検 出するようにすることができる。
関係式生成手段は、 注目画素が、 カバードバックグラウンド領域に属するとし た場合、 注目フレームの前のフレームの画素データを、 背景画素データとして抽 出し、 注目画素が、 アンカバードバックグラウンド領域に属するとした場合、 注 目フレームの次のフレームの画素データを、 背景画素データとして抽出し、 複数 の関係式を生成するようにすることができる。 関係式生成手段は、 注目画素に対応して、 前景オブジェク トの動きを基に、 注 目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混合 画素データを抽出すると共に、 混合画素データにの個々に対応して、 背景ォブジ ェク トの動きを基に、 混合画素データが抽出されたフレームとは異なるフレーム から、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生成 するようにすることができる。
関係式生成手段は、 混合画素データに対応する前景ォブジェク ト成分が等しい とする第 1の近似、 および注目フレームおよび周辺フレームから抽出された混合 画素データは一定であるとする第 2の近似に基づいて、 複数の関係式を生成する ようにすることができる。
関係式生成手段は、 注目画素に対応して、 前景オブジェク トの動きを基に、 注 目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混合 画素データを抽出すると共に、 混合画素データの個々に対応して、 背景オブジェ ク トの動きを基に、 混合画素データが抽出されたフレームの前のフレームから、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生成し、 力 バードバックグラウンド領域ァンカバードバックグラウンド領域特定手段は、 予 測誤差が所定の閾値以上である領域をアンカバードバックグラウンド領域である と特定するようにすることができる。
関係式生成手段は、 注目画素に対応して、 前景オブジェク トの動きを基に、 注 目フレームおよび周辺フレームから、 複数のオブジェク トが混合状態にある混合 画素データを抽出すると共に、 混合画素データの個々に対応して、 背景オブジェ ク トの動きを基に、 混合画素データが抽出されたフレームの次のフレームから、 背景オブジェトに相当する背景画素データを抽出し、 複数の関係式を生成し、 力 バードバックグラウンド領域ァンカバードバックグラウンド領域特定手段は、 予 測誤差が所定の閾値以上である領域をカバードバックグラウンド領域であると特 定するようにすることができる。
画像データの注目フレームの注目画素に対応する、 注目フレームの周辺の周辺 フレームの画素データを、 画像データの複数のオブジェク 卜のうちの背景となる 背景ォブジェク トに相当する背景画素データとして抽出すると共に、 注目フレー ムに存在する注目画素の注目画素データを抽出し、 注目画素について、 注目画素 データおよび背景画素データの関係を示す、 複数の関係式が生成され、 関係式に 基づいて、 注目画素に対応して、 現実世界において複数であるォブジェク トの混 合状態を示す混合比が検出され、 検出された混合比を関係式に代入することによ り予測誤差が演算され、 予測誤差を基に、 注目画素の属する領域が、 複数のォブ ジェク トが混合されてなる混合領域であって、 複数のオブジェク トのうちの前景 となる前景オブジェク トの動き方向の先端側に形成されるカバードバックグラゥ ンド領域であるか、 または、 混合領域であって、 前景オブジェク トの動き方向の 後端側に形成されるアンカバードバックグラウンド領域であるかが特定され、 注 目画素の属する領域が、 前景オブジェク トを構成する前景オブジェク ト成分のみ からなる前景領域であるか、 または、 背景オブジェク トを構成する背景オブジェ ク ト成分のみからなる背景領域であるかが特定される。
これにより、 背景の画像の領域、 移動する物体の画像の領域、 および混ざり合 いが生じている画像の領域を特定することができる。 図面の簡単な説明
図 1は、 本発明に係る画像処理装置の一実施の形態を示す図である。
図 2は、 画像処理装置を示すブロック図である。
図 3は、 センサによる撮像を説明する図である。
図 4は、 画素の配置を説明する図である。
図 5は、 検出素子の動作を説明する図である。
図 6 Aは、 動いている前景に対応するオブジェク トと、 静止している背景に対 応するオブジェク トとを撮像して得られる画像を説明する図である。
図 6 Bは、 動いている前景に対応するオブジェク トと、 静止している背景に対 応するオブジェク トとを撮像して得られる画像のモデルを説明する図である。 図 7は、 背景領域、 前景領域、 混合領域、 カバードバックグラウンド領域、 お よびアンカバードバックグラウンド領域を説明する図である。
図 8は、 静止している前景に対応するォブジェク トおよび静止している背景に 対応するオブジェク トを撮像した画像における、 隣接して 1列に並んでいる画素 の画素値を時間方向に展開したモデル図である。
図 9は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割した モデル図である。
図 1 0は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割し たモデル図である。
図 1 1は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割し たモデル図である。
図 1 2は、 前景領域、 背景領域、 および混合領域の画素を抽出した例を示す図 である。
図 1 3は、 画素と画素値を時間方向に展開したモデルとの対応を示す図である, 図 1 4は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割し たモデル図である。
図 1 5は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割し たモデル図である。
図 1 6は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割し たモデル図である。
図 1 7は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割し たモデル図である。
図 1 8は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割し たモデル図である。
図 1 9は、 動きボケの量の調整の処理を説明するフローチャートである。
図 2 0は、 混合比算出部 1 0 3の構成を示すブロック図である。
図 2 1は、 理想的な混合比ひの例を示す図である。 図 2 2は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割し たモデル図である。
図 2 3は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割し たモデル図である。
図 2 4は、 画素の選択を説明する図である。
図 2 5は、 画素の選択を説明する図である。
図 2 6は、 推定混合比処理部 2 0 1の構成を示すプロック図である。
図 2 7は、 推定混合比の算出の処理を説明するフローチャートである。
図 2 8は、 カバードバックグラウンド領域に対応するモデルによる混合比推定 の算出の処理を説明するフローチャートである。
図 2 9は、 混合比算出部 1 0 3の他の構成を示すプロック図である。
図 3 0は、 混合比 ひ を近似する直線を説明する図である。
図 3 1は、 混合比 a を近似する平面を説明する図である。
図 3 2は、 混合比 Οί を算出するときの複数のフレームの画素の対応を説明す る図である。
図 3 3は、 カバードバックグラウンド領域に対応するモデルによる混合比推定 の処理を説明するフローチヤ一トである。
図 3 4は、 混合比算出部 1 0 3のさらに他の構成を示すプロック図である。 図 3 5は、 領域特定部 1 0 4の構成を示すプロック図である。
図 3 6は、 アンカバードバックグラウンド領域判定部 3 0 3の判定の処理を説 明する図である。
図 3 7は、 アンカバードバックグラウンド領域判定部 3 0 3の判定の処理を説 明する図である。
図 3 8は、 入力画像の例を示す図である。
図 3 9は、 領域判定の結果の例を示す図である。
図 4 0は、 領域判定の結果の例を示す図である。
図 4 1は、 入力画像の例を示す図である。 図 4 2は、 領域判定の結果の例を示す図である。
図 4 3は、 領域判定の結果の例を示す図である。
図 4 4は、 領域特定部 1 0 4の他の構成を示すブロック図である。
図 4 5は、 領域特定部 1 0 4のさらに他の構成を示すブロック図である。 図 4 6は、 領域特定部 1 0 4のさらに他の構成を示すブロック図である。 図 4 7は、 領域特定の処理を説明するフローチヤ一トである。
図 4 8は、 カバードバックグラウンド領域の特定の処理を説明するフローチヤ 一トである。
図 4 9は、 アンカバードバックグラウンド領域の特定の処理を説明するフロー チャートである。
図 5 0は、 前景背景分離部 1 0 5の構成の一例を示すプロック図である。 図 5 1 Aは、 入力画像、 前景成分画像、 および背景成分画像を示す図である。 図 5 1 Bは、 入力画像、 前景成分画像、 および背景成分画像を示す図である。 図 5 2は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割し たモデル図である。
図 5 3は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割し たモデル図である。
図 5 4は、 画素値を時間方向に展開し、 シャツタ時間に対応する期間を分割し たモデル図である。
図 5 5は、 分離部 6 0 1の構成の一例を示すブロック図である。
図 5 6 Aは、 分離された前景成分画像の例を示す図である。
図 5 6 Bは、 分離された背景成分画像の例を示す図である。
図 5 7は、 前景と背景との分離の処理を説明するフローチャートである。 図 5 8は、 動きボケ調整部 1 0 6の構成の一例を示すブロック図である。 図 5 9は、 処理単位を説明する図である。
図 6 0は、 前景成分画像の画素値を時間方向に展開し、 シャツタ時間に対応す る期間を分割したモデル図である。 図 6 1は、 前景成分画像の画素値を時間方向に展開し、 シャツタ時間に対応す る期間を分割したモデル図である。
図 6 2は、 前景成分画像の画素値を時間方向に展開し、 シャツタ時問に対応す る期間を分割したモデル図である。
図 6 3は、 前景成分画像の画素値を時間方向に展開し、 シャツタ時間に対応す る期間を分割したモデル図である。
図 6 4は、 動きボケ調整部 1 0 6の他の構成を示す図である。
図 6 5は、 動きボケ調整部 1 0 6による前景成分画像に含まれる動きボケの量 の調整の処理を説明するフローチヤ一トである。
図 6 6は、 動きボケ調整部 1 0 6の構成の他の一例を示すブロック図である。 図 6 7は、 画素値と前景の成分のとの対応を指定するモデルの例を示す図であ る。
図 6 8は、 前景の成分の算出を説明する図である。
図 6 9は、 前景の成分の算出を説明する図である。
図 7 0は、 前景の動きボケの除去の処理を説明するフローチャートである。 発明を実施するための最良の形態
図 1は、 本発明に係る画像処理装置の一実施の形態を示す図である。 CPU (Central Process ing Unit) 2 1は、 ROM (Read Onl y Memory) 2 2、 または 記憶部 2 8に記憶されているプログラムに従って各種の処理を実行する。 RAM (Random Access Memory) 2 3には、 CPU 2 1が実行するプログラムやデータ などが適宜記憶される。 これらの CPU 2 1、 ROM 2 2 , および RAM 2 3は、 ノくス 2 4により相互に接続されている。
CPU 2 1にはまた、 バス 2 4を介して入出力インタフェース 2 5が接続されて いる。 入出力インタフェース 2 5には、 キーボード、 マウス、 マイクロホンなど よりなる入力部 2 6、 ディスプレイ、 スピーカなどよりなる出力部 2 7が接続さ れている。 CPU 2 1は、 入力部 2 6から入力される指令に対応して各種の処理を 実行する。 そして、 CPU 2 1は、 処理の結果得られた画像や音声等を出力部 2 7 に出力する。
入出力ィンタフェース 2 5に接続されている記憶部 2 8は、 例えばハードディ スクなどで構成され、 CPU 2 1が実行するプログラムや各種のデータを記憶する, 通信部 2 9は、 インターネット、 その他のネッ トワークを介して外部の装置と通 信する。 この例の場合、 通信部 2 9はセンサの出力を取り込む取得部として働く, また、 通信部 2 9を介してプログラムを取得し、 記憶部 2 8に記憶してもよい, 入出力ィンタフェース 2 5に接続されているドライブ 3 0は、 磁気ディスク 5 1、 光ディスク 5 2、 光磁気ディスク 5 3、 或いは半導体メモリ 5 4などが装着 されたとき、 それらを駆動し、 そこに記録されているプログラムやデータなどを 取得する。 取得されたプログラムやデータは、 必要に応じて記憶部 2 8に転送さ れ、 記憶される。
図 2は、 画像処理装置を示すブロック図である。
なお、 画像処理装置の各機能をハードウェアで実現するか、 ソフトウェアで実 現するかは問わない。 つまり、 本明細書の各ブロック図は、 ハードウェアのブロ ック図と考えても、 ソフトウエアによる機能プロック図と考えても良い。
この明細書では、 撮像の対象となる、 現実世界におけるオブジェク トに対応す る画像を、 画像オブジェク トと称する。
画像処理装置に供給された入力画像は、 オブジェク ト抽出部 1 0 1、 混合比算 出部 1 0 3、 領域特定部 1 0 4、 および前景背景分離部 1 0 5に供給される。 オブジェク ト抽出部 1 0 1は、 入力画像に含まれる前景のオブジェク トに対応 する画像オブジェク トを粗く抽出して、 抽出した画像オブジェク トを動き検出部
1 0 2に供給する。 オブジェク ト抽出部 1 0 1は、 例えば、 入力画像に含まれる 前景のオブジェク トに対応する画像オブジェク トの輪郭を検出することで、 前景 のォブジェク 卜に対応する画像オブジェク トを粗く抽出する。
オブジェク ト抽出部 1 0 1は、 入力画像に含まれる背景のオブジェク 卜に対応 する画像ォブジェク トを粗く抽出して、 抽出した画像ォブジェク トを動き検出部 1 0 2に供給する。 オブジェク ト抽出部 1 0 1は、 例えば、 入力画像と、 抽出さ れた前景のオブジェク トに対応する画像オブジェク トとの差から、 背景のォブジ ェク トに対応する画像オブジェク トを粗く抽出する。
また、 例えば、 オブジェク ト抽出部 1 0 1は、 内部に設けられている背景メモ リに記憶されている背景の画像と、 入力画像との差から、 前景のオブジェク トに 対応する画像オブジェク ト、 および背景のオブジェク トに対応する画像オブジェ ク トを粗く抽出するようにしてもよい。
動き検出部 1 0 2は、 例えば、 ブロックマッチング法、 勾配法、 位相相関法、 およびペルリカーシブ法などの手法により、 粗く抽出された前景のォブジヱク ト に対応する画像オブジェク トの動きベク トルを算出して、 算出した動きベク トル および動きべク トルの位置情報 (動きべク トルに対応する画素の位置を特定する 情報) を混合比算出部 1 0 3および動きボケ調整部 1 0 6に供給する。
動き検出部 1 0 2が出力する動きべク トルには、 動き量 Vに対応する情報が 含まれるている。
また、 例えば、 動き検出部 1 0 2は、 画像オブジェク トに画素を特定する画素 位置情報と共に、 画像オブジェク ト毎の動きべク トルを動きボケ調整部 1 0 6に 出力するようにしてもよい。
動き量 Vは、 動いているオブジェク トに対応する画像の位置の変化を画素間 隔を単位として表す値である。 例えば、 前景に対応するオブジェク トの画像が、 あるフレームを基準として次のフレームにおいて 4画素分離れた位置に表示され るように移動しているとき、 前景に対応するォブジェク トの画像の動き量 V は,
4とされる。
なお、 オブジェク ト抽出部 1 0 1および動き検出部 1 0 2は、 動いているォブ ジェタ トに対応した動きボケ量の調整を行う場合に必要となる。
混合比算出部 1 0 3は、 入力画像、 および動き検出部 1 0 2から供給された動 きべク トルとその位置情報を基に、 画素が混合領域の 1つであるカバードバック グラウンド領域に属すると仮定したとき、 推定される混合比 (以下、 混合比 と称する) である推定混合比およびこれに対応する混合比関係情報を生成すると 共に、 画素が混合領域の他の 1つであるアンカバードバックグラウンド領域に属 すると仮定したとき、 推定される混合比である推定混合比およびこれに対応する 混合比関係情報を生成し、 生成した 2つの推定混合比およびこれらに対応する混 合比関係情報を領域特定部 1 0 4に供給する。
混合比 or は、 後述する式 (3 ) に示されるように、 画素値における、 背景の オブジェク トに対応する画像の成分 (以下、 背景の成分とも称する) の割合を示 す値である。
カバードバックグラウンド領域およびァンカバードバックグラウンド領域の詳 細については、 後述する。
領域特定部 1 0 4は、 入力画像、 並びに混合比算出部 1 0 3から供給された 2 つの推定混合比およびこれらに対応する混合比関係情報を基に、 入力された画像 の画素のそれぞれを、 前景領域、 背景領域、 または混合領域のいずれかに特定し、 画素毎に前景領域、 背景領域、 または混合領域のいずれかに属するかを示す情報 (以下、 領域情報と称する) を前景背景分離部 1 0 5および動きボケ調整部 1 0 6に供給する。
領域特定部 1 0 4は、 生成した領域情報、 並びに混合比算出部 1 0 3から供給 された 2つの推定混合比およびこれらに対応する混合比関係情報を基に、 混合比 を生成し、 生成した混合比 ひ を前景背景分離部 1 0 5に供給する。
前景背景分離部 1 0 5は、 領域特定部 1 0 4から供給された領域情報および混 合比ひ を基に、 前景のオブジェク トに対応する画像の成分 (以下、 前景の成分 とも称する) のみから成る前景成分画像と、 背景の成分のみから成る背景成分画 像とに入力画像を分離して、 前景成分画像を動きボケ調整部 1 0 6および選択部 1 0 7に供給する。 なお、 分離された前景成分画像を最終的な出力とすることも 考えられる。 従来の混合領域を考慮しないで前景と背景だけを特定し、 分離して いた方式に比べ正確な前景と背景を得ることが出来る。
動きボケ調整部 1 0 6は、 動きべク トルからわかる動き量 Vおよび領域情報 を基に、 前景成分画像に含まれる 1以上の画素を示す処理単位を決定する。 処理 単位は、 動きボケの量の調整の処理の対象となる 1群の画素を指定するデータで ある。
動きボケ調整部 1 0 6は、 画像処理装置に入力された動きボケ調整量、 前景背 景分離部 1 0 5から供給された前景成分画像、 動き検出部 1 0 2から供給された 動きべク トルおよびその位置情報、 並びに処理単位を基に、 前景成分画像に含ま れる動きボケを除去する、 動きボケの量を減少させる、 または動きボケの量を増 加させるなど前景成分画像に含まれる動きボケの量を調整して、 動きボケの量を 調整した前景成分画像を選択部 1 0 7に出力する。 動きべク トルとその位置情報 は使わないこともある。
ここで、 動きボケとは、 撮像の対象となる、 現実世界におけるオブジェク トの 動きと、 センサの撮像の特性とにより生じる、 動いているオブジェク トに対応す る画像に含まれている歪みをいう。
選択部 1 0 7は、 例えば使用者の選択に対応した選択信号を基に、 前景背景分 離部 1 0 5から供給された前景成分画像、 および動きボケ調整部 1 0 6から供給 された動きボケの量が調整された前景成分画像のいずれか一方を選択して、 選択 した前景成分画像を出力する。
次に、 図 3乃至図 1 8を参照して、 画像処理装置に供給される入力画像につい て説明する。
図 3は、 センサによる撮像を説明する図である。 センサは、 例えば、 固体撮像 素子である CCD (Charge-Coupled Devi ce) エリアセンサを備えた CCDビデオ力 メラなどで構成される。 現実世界における、 前景に対応するォブジェク ト 1 1 1 は、 現実世界における、 背景に対応するオブジェク ト 1 1 2と、 センサとの間を, 例えば、 図中の左側から右側に水平に移動する。
センサは、 前景に対応するォブジェク ト 1 1 1を、 背景に対応するォブジェク ト 1 1 2と共に撮像する。 センサは、 撮像した画像を 1フレーム単位で出力する t 例えば、 センサは、 1秒間に 3 0フレームから成る画像を出力する。 センサの露 光時間は、 1 3 0秒とすることができる。 露光時間は、 センサが入力された光 の電荷への変換を開始してから、 入力された光の電荷への変換を終了するまでの 期間である。 以下、 露光時間をシャツタ時間とも称する。
図 4は、 画素の配置を説明する図である。 図 4中において、 A乃至 Iは、 個々 の画素を示す。 画素は、 画像に対応する平面上に配置されている。 1つの画素に 対応する 1つの検出素子は、 センサ上に配置されている。 センサが画像を撮像す るとき、 1つの検出素子は、 画像を構成する 1つの画素に対応する画素値を出力 する。 例えば、 検出素子の X方向の位置は、 画像上の横方向の位置に対応し、 検 出素子の Y方向の位置は、 画像上の縦方向の位置に対応する。
図 5に示すように、 例えば、 CCDである検出素子は、 シャツタ時間に対応する 期間、 入力された光を電荷に変換して、 変換された電荷を蓄積する。 電荷の量は、 入力された光の強さと、 光が入力されている時間にほぼ比例する。 検出素子は、 シャツタ時間に対応する期間において、 入力された光から変換された電荷を、 既 に蓄積されている電荷に加えていく。 すなわち、 検出素子は、 シャツタ時間に対 応する期間、 入力される光を積分して、 積分された光に対応する量の電荷を蓄積 する。 検出素子は、 時間に対して、 積分効果があるとも言える。
検出素子に蓄積された電荷は、 図示せぬ回路により、 電圧値に変換され、 電圧 値は更にデジタルデータなどの画素値に変換されて出力される。 従って、 センサ から出力される個々の画素値は、 前景または背景に対応するォブジェク トの空間 的に広がりを有するある部分を、 シャツタ時間について積分した結果である、 1 次元の空間に射影された値を有する。
画像処理装置は、 このようなセンサの蓄積の動作により、 出力信号に埋もれて しまった有意な情報、 例えば、 混合比ひ を抽出する。 画像処理装置は、 前景の 画像オブジェク ト自身が混ざり合うことによる生ずる歪みの量、 例えば、 動きボ ケの量などを調整する。 また、 画像処理装置は、 前景の画像オブジェク トと背景 の画像オブジェクトとが混ざり合うことにより生ずる歪みの量を調整する。
図 6 Aは、 動いている前景に対応するオブジェクトと、 静止している背景に対 応するオブジェク トとを撮像して得られる画像を説明する図である。 図 6 Bは、 動いている前景に対応するォブジェク トと、 静止している背景に対応するォブジ ェク トとを撮像して得られる画像のモデルを説明する図である。
図 6 Aは、 動きを伴う前景に対応するオブジェク トと、 静止している背景に対 応するオブジェク トとを撮像して得られる画像を示している。 図 6 Aに示す例に おいて、 前景に対応するォブジェク トは、 画面に対して水平に左から右に動いて いる。
図 6 Bは、 図 6 Aに示す画像の 1つのラインに対応する画素値を時間方向に展 開したモデル図である。 図 6 Bの横方向は、 図 6 Aの空間方向 Xに対応している, 背景領域の画素は、 背景の成分、 すなわち、 背景のオブジェク トに対応する画 像の成分のみから、 その画素値が構成されている。 前景領域の画素は、 前景の成 分、 すなわち、 前景のオブジェク トに対応する画像の成分のみから、 その画素値 が構成されている。
混合領域の画素は、 背景の成分、 および前景の成分から、 その画素値が構成さ れている。 混合領域は、 背景の成分、 および前景の成分から、 その画素値が構成 されているので、 歪み領域ともいえる。 混合領域は、 更に、 カバードバックグラ ゥンド領域およびァンカバードバックグラウンド領域に分類される。
カバードバックグラウンド領域は、 前景領域に対して、 前景のオブジェク トの 進行方向の前端部に対応する位置の混合領域であり、 時間の経過に対応して背景 成分が前景に覆い隠される領域をいう。
これに対して、 アンカバードバックグラウンド領域は、 前景領域に対して、 前 景のォブジェク トの進行方向の後端部に対応する位置の混合領域であり、 時間の 経過に対応して背景成分が現れる領域をいう。
このように、 前景領域、 背景領域、 またはカバードバックグラウンド領域若し くはアンカバードバックグラウンド領域を含む画像が、 領域特定部 1 0 4、 混合 比算出部 1 0 3、 および前景背景分離部 1 0 5に入力画像として入力される。 図 7は、 以上のような、 背景領域、 前景領域、 混合領域、 カバードバックダラ ゥンド領域、 およびアンカバードバックグラウンド領域を説明する図である。 図 6 Aに示す画像に対応する場合、 背景領域は、 静止部分であり、 前景領域は、 動 き部分であり、 混合領域のカバードバックグラウンド領域は、 背景から前景に変 化する部分であり、 混合領域のアンカバードバックグラウンド領域は、 前景から 背景に変化する部分である。
図 8は、 静止している前景に対応するォブジェク トおよび静止している背景に 対応するォブジェク トを撮像した画像における、 隣接して 1列に並んでいる画素 の画素値を時間方向に展開したモデル図である。 例えば、 隣接して 1列に並んで いる画素として、 画面の 1つのライン上に並んでいる画素を選択することができ る。
図 8に示す F01乃至 F04の画素値は、 静止している前景のオブジェク トに対 応する画素の画素値である。 図 8に示す B01乃至 B04の画素値は、 静止してい る背景のオブジェク トに対応する画素の画素値である。
図 8における縦方向は、 時間に対応し、 図中の上から下に向かって時間が経過 する。 図 8中の矩形の上辺の位置は、 センサが入力された光の電荷への変換を開 始する時刻に対応し、 図 8中の矩形の下辺の位置は、 センサが入力された光の電 荷への変換を終了する時刻に対応する。 すなわち、 図 8中の矩形の上辺から下辺 までの距離は、 シャツタ時間に対応する。
以下において、 シャッタ時間とフレーム間隔とが同一である場合を例に説明す る。
図 8における横方向は、 図 6 Aで説明した空間方向 Xに対応する。 より具体 的には、 図 8に示す例において、 図 8中の" F01 " と記載された矩形の左辺か ら" B04" と記載された矩形の右辺までの距離は、 画素のピッチの 8倍、 すなわ ち、 連続している 8つの画素の間隔に対応する。
前景のオブジェク トおよび背景のオブジェク トが静止している場合、 シャツタ 時間に対応する期間において、 センサに入力される光は変化しない。
ここで、 シャツタ時間に対応する期間を 2つ以上の同じ長さの期間に分割する, 例えば、 仮想分割数を 4とすると、 図 8に示すモデル図は、 図 9に示すモデルと して表すことができる。 仮想分割数は、 前景に対応するオブジェクトのシャツタ 時間内での動き量 Vなどに対応して設定される。 例えば、 4である動き量 Vに 対応して、 仮想分割数は、 4とされ、 シャツタ時間に対応する期間は 4つに分割 される。
図中の最も上の行は、 シャツタが開いて最初の、 分割された期間に対応する。 図中の上から 2番目の行は、 シャツタが開いて 2番目の、 分割された期間に対応 する。 図中の上から 3番目の行は、 シャツタが開いて 3番目の、 分割された期間 に対応する。 図中の上から 4番目の行は、 シャツタが開いて 4番目の、 分割され た期間に対応する。
以下、 動き量 Vに対応して分割されたシャツタ時間をシャツタ時間/ Vとも称 する。
前景に対応するォブジェク トが静止しているとき、 センサに入力される光は変 化しないので、 前景の成分 FO l/vは、 画素値 F01を仮想分割数で除した値に等 しい。 同様に、 前景に対応するオブジェク 卜が静止しているとき、 前景の成分
F02/v は、 画素値 F02 を仮想分割数で除した値に等しく、 前景の成分 F03/v は、 画素値 F03を仮想分割数で除した値に等しく、 前景の成分 F04/vは、 画素値 F04を仮想分割数で除した値に等しい。
背景に対応するオブジェク トが静止しているとき、 センサに入力される光は変 化しないので、 背景の成分 BO l/vは、 画素値 B01を仮想分割数で除した値に等 しい。 同様に、 背景に対応するオブジェクトが静止しているとき、 背景の成分 B02/vは、 画素値 B02を仮想分割数で除した値に等しく、 B03/vは、 画素値 B03 を仮想分割数で除した値に等しく、 B04/vは、 画素値 B04を仮想分割数で除した 値に等しい。
すなわち、 前景に対応するオブジェク トが静止している場合、 シャツタ時間に 対応する期間において、 センサに入力される前景のオブジェク トに対応する光が 変化しないので、 シャツタが開いて最初の、 シャツタ時間/ Vに対応する前景の 成分 FO l/vと、 シャツタが開いて 2番目の、 シャツタ時間/ Vに対応する前景の 成分 FO l/vと、 シャツタが開いて 3番目の、 シャツタ時間/ Vに対応する前景の 成分 FO l/vと、 シャツタが開いて 4番目の、 シャツタ時間/ Vに対応する前景の 成分 FO l/vとは、 同じ値となる。 F02/v乃至 F04/vも、 FO l/vと同様の関係を有 する。
背景に対応するォブジェク トが静止している場合、 シャツタ時間に対応する期 間において、 センサに入力される背景のオブジェク トに対応する光は変化しない ので、 シャツタが開いて最初の、 シャツタ時間/ Vに対応する背景の成分 BO l/v と、 シャツタが開いて 2番目の、 シャツタ時間/ Vに対応する背景の成分 BO l/v と、 シャツタが開いて 3番目の、 シャツタ時間/ Vに対応する背景の成分 BO l/v と、 シャツタが開いて 4番目の、 シャツタ時間/ Vに対応する背景の成分 BO l/v とは、 同じ値となる。 B02/v乃至 B04/vも、 同様の関係を有する。
次に、 前景に対応するォブジェク トが移動し、 背景に対応するォブジェク トが 静止している場合について説明する。
図 1 0は、 前景に対応するオブジェク トが図中の右側に向かって移動する場合 の、 カバードバックグラウンド領域を含む、 1つのライン上の画素の画素値を時 間方向に展開したモデル図である。 図 1 0において、 前景の動き量 Vは、 4で ある。 1フレームは短い時間なので、 前景に対応するオブジェク トが剛体であり 等速で移動していると仮定することができる。 図 1 0において、 前景に対応する オブジェク トの画像は、 あるフレームを基準として次のフレームにおいて 4画素 分右側に表示されるように移動する。
図 1 0において、 最も左側の画素乃至左から 4番目の画素は、 前景領域に属す る。 図 1 0において、 左から 5番目乃至左から 7番目の画素は、 カバードバック グラウンド領域である混合領域に属する。 図 1 0において、 最も右側の画素は、 背景領域に属する。
前景に対応するォブジェク トが時間の経過と共に背景に対応するォブジェク ト を覆い隠すように移動しているので、 カバードバックグラウンド領域に属する画 素の画素値に含まれる成分は、 シャツタ時間に対応する期間のある時点で、 背景 の成分から、 前景の成分に替わる。
例えば、 図 1 0中に太線枠を付した画素値 Mは、 式 (1 ) で表される。
M=B02/v+B02/v+F07/v+F06/v ( 1 )
例えば、 左から 5番目の画素は、 1つのシャツタ時間/ Vに対応する背景の成 分を含み、 3つのシャツタ時間/ Vに対応する前景の成分を含むので、 左から 5 番目の画素の混合比 は、 1/4である。 左から 6番目の画素は、 2つのシャツ タ時間 /vに対応する背景の成分を含み、 2つのシャツタ時間 /vに対応する前景 の成分を含むので、 左から 6番目の画素の混合比 ひ は、 1/2である。 左から 7 番目の画素は、 3つのシャツタ時間/ Vに対応する背景の成分を含み、 1つのシ ャッタ時間/ Vに対応する前景の成分を含むので、 左から 7番目の画素の混合比 は、 3/4である。
前景に対応するオブジェク トが、 剛体であり、 前景の画像が次のフレームにお いて 4画素右側に表示されるように等速で移動すると仮定できるので、 例えば、 図 1 0中の左から 4番目の画素の、 シャツタが開いて最初の、 シャツタ時間/ V の前景の成分 F07/vは、 図 1 0中の左から 5番目の画素の、 シャツタが開いて 2番目のシャツタ時間/ Vに対応する前景の成分に等しい。 同様に、 前景の成分 F07/vは、 図 1 0中の左から 6番目の画素の、 シャツタが開いて 3番目のシャツ タ時間 /vに対応する前景の成分と、 図 1 0中の左から 7番目の画素の、 シャツ タが開いて 4番目のシャツタ時間/ Vに対応する前景の成分とに、 それぞれ等し レ、0
前景に対応するオブジェク トが、 剛体であり、 前景の画像が次のフレームにお いて 4画素右側に表示されるように等速で移動すると仮定できるので、 例えば、 図 1 0中の左から 3番目の画素の、 シャッタが開いて最初のシャッタ時間/ Vの 前景の成分 F06/vは、 図 1 0中の左から 4番目の画素の、 シャツタが開いて 2 番目のシャツタ時間 /vに対応する前景の成分に等しい。 同様に、 前景の成分 F06/vは、 図 1 0中の左から 5番目の画素の、 シャツタが開いて 3番目のシャツ タ時間 /vに対応する前景の成分と、 図 1 0中の左から 6番目の画素の、 シャツ タが開いて 4番目のシャッタ時間 /vに対応する前景の成分とに、 それぞれ等し レ、。
前景に対応するオブジェク トが、 剛体であり、 前景の画像が次のフレームにお いて 4画素右側に表示されるように等速で移動すると仮定できるので、 例えば、 図 1 0中の左から 2番目の画素の、 シャッタが開いて最初のシャッタ時間/ Vの 前景の成分 F05/vは、 図 1 0中の左から 3番目の画素の、 シャツタが開いて 2 番目のシャツタ時間 /vのに対応する前景の成分に等しい。 同様に、 前景の成分 F05/vは、 図 1 0中の左から 4番目の画素の、 シャツタが開いて 3番目のシャツ タ時間/ Vに対応する前景の成分と、 図 1 0中の左から 5番目の画素の、 シャツ タが開いて 4番目のシャッタ時間/ Vに対応する前景の成分とに、 それぞれ等し レ、。
前景に対応するォブジェク トが、 剛体であり、 前景の画像が次のフレームにお いて 4画素右側に表示されるように等速で移動すると仮定できるので、 例えば、 図 1 0中の最も左側の画素の、 シャツタが開いて最初のシャツタ時間/ Vの前景 の成分 F04/vは、 図 1 0中の左から 2番目の画素の、 シャツタが開いて 2番目 のシャツタ時間/ Vに対応する前景の成分に等しい。 同様に、 前景の成分 F04/v は、 図 1 0中の左から 3番目の画素の、 シャツタが開いて 3番目のシャツタ時間 /vに対応する前景の成分と、 図 1 0中の左から 4番目の画素の、 シャツタが開 いて 4番目のシャツタ時間/ Vに対応する前景の成分とに、 それぞれ等しい。 動いているオブジェク トに対応する前景の領域は、 このように動きボケを含む ので、 歪み領域とも言える。
図 1 1は、 前景が図中の右側に向かって移動する場合の、 アンカバードバック グラウンド領域を含む、 1つのライン上の画素の画素値を時間方向に展開したモ デル図である。 図 1 1において、 前景の動き量 Vは、 4である。 1フレームは 短い時間なので、 前景に対応するオブジェク トが剛体であり、 等速で移動してい ると仮定することができる。 図 1 1において、 前景に対応するオブジェク トの画 像は、 あるフレームを基準として次のフレームにおいて 4画素分右側に移動する, 図 1 1において、 最も左側の画素乃至左から 4番目の画素は、 背景領域に属す る。 図 1 1において、 左から 5番目乃至左から 7番目の画素は、 アンカバードバ ックグラウンドである混合領域に属する。 図 1 1において、 最も右側の画素は、 前景領域に属する。
背景に対応するオブジェク トを覆っていた前景に対応するォブジェク トが時間 の経過と共に背景に対応するォブジェク トの前から取り除かれるように移動して いるので、 アンカバードバックグラウンド領域に属する画素の画素値に含まれる 成分は、 シャツタ時間に対応する期間のある時点で、 前景の成分から、 背景の成 分に替わる。
例えば、 図 1 1中に太線枠を付した画素値 M'は、 式 (2 ) で表される。
M' =F02/v+F01/v+B26/v+B26/v ( 2 )
例えば、 左から 5番目の画素は、 3つのシャツタ時間/ Vに対応する背景の成 分を含み、 1つのシャツタ時間/ Vに対応する前景の成分を含むので、 左から 5 番目の画素の混合比 は、 3/4である。 左から 6番目の画素は、 2つのシャツ タ時間/ Vに対応する背景の成分を含み、 2つのシャツタ時間 /vに対応する前景 の成分を含むので、 左から 6番目の画素の混合比 ひ は、 1/2である。 左から 7 番目の画素は、 1つのシャツタ時間/ Vに対応する背景の成分を含み、 3つのシ ャッタ時間/ Vに対応する前景の成分を含むので、 左から 7番目の画素の混合比 a は、 1/4である。
式 (1 ) および式 (2 ) をより一般化すると、 画素値 Mは、 式 (3 ) で表さ れる。
M= -B +∑Fi/v (3)
i
ここで、 ひは、 混合比である。 Bは、 背景の画素値であり、 Fi/vは、 前景の 成分である。
前景に対応するオブジェク トが剛体であり、 等速で動くと仮定でき、 かつ、 動 き量 Vが 4であるので、 例えば、 図 1 1中の左から 5番目の画素の、 シャツタ が開いて最初の、 シャツタ時間/ Vの前景の成分 FO l/vは、 図 1 1中の左から 6 番目の画素の、 シャッタが開いて 2番目のシャッタ時間/ Vに対応する前景の成 分に等しい。 同様に、 FO l/vは、 図 1 1中の左から 7番目の画素の、 シャツタが 開いて 3番目のシャツタ時間/ Vに対応する前景の成分と、 図 1 1中の左から 8 番目の画素の、 シャツタが開いて 4番目のシャツタ時間/ Vに対応する前景の成 分とに、 それぞれ等しい。
前景に対応するォブジェク トが剛体であり、 等速で動く と仮定でき、 かつ、 仮 想分割数が 4であるので、 例えば、 図 1 1中の左から 6番目の画素の、 シャツタ が開いて最初の、 シャツタ時間/ Vの前景の成分 F02/vは、 図 1 1中の左から 7 番目の画素の、 シャツタが開いて 2番目のシャツタ時間/ Vに対応する前景の成 分に等しい。 同様に、 前景の成分 F02/v は、 図 1 1中の左から 8番目の画素の, シャッタが開いて 3番目のシャツタ時間/ Vに対応する前景の成分に等しい。
前景に対応するォブジェク トが剛体であり、 等速で動くと仮定でき、 かつ、 動 き量 Vが 4であるので、 例えば、 図 1 1中の左から 7番目の画素の、 シャツタ が開いて最初の、 シャツタ時間/ Vの前景の成分 F03/vは、 図 1 1中の左から 8 番目の画素の、 シャッタが開いて 2番目のシャッタ時間/ Vに対応する前景の成 分に等しい。
図 9乃至図 1 1の説明において、 仮想分割数は、 4であるとして説明したが、 仮想分割数は、 動き量 Vに対応する。 動き量 Vは、 一般に、 前景に対応するォ ブジェク トの移動速度に対応する。 例えば、 前景に対応するォブジェク トが、 あ るフレームを基準として次のフレームにおいて 4画素分右側に表示されるように 移動しているとき、 動き量 Vは、 4とされる。 動き量 Vに対応し、 仮想分割数 は、 4とされる。 同様に、 例えば、 前景に対応するオブジェク トが、 あるフレー ムを基準として次のフレームにおいて 6画素分左側に表示されるように移動して いるとき、 動き量 Vは、 6とされ、 仮想分割数は、 6とされる。
図 1 2および図 1 3に、 以上で説明した、 前景領域、 背景領域、 カバードバッ クグラウンド領域若しくはアンカバ一ドバックグラウンド領域から成る混合領域 と、 分割されたシャッタ時間に対応する前景の成分および背景の成分との関係を 示す。
図 1 2は、 静止している背景の前を移動しているオブジェク トに対応する前景 を含む画像から、 前景領域、 背景領域、 および混合領域の画素を抽出した例を示 す。 図 1 2に示す例において、 Aで示す、 前景に対応するォブジェク トは、 画面 に対して水平に移動している。
フレーム #n+lは、 フレーム #nの次のフレームであり、 フレーム #n+2は、 フレ ーム #n+ lの次のフレームである。
フレーム ίίη 乃至フレーム ttn+2 のいずれかから抽出した、 前景領域、 背景領域、 および混合領域の画素を抽出して、 動き量 Vを 4として、 抽出された画素の画 素値を時間方向に展開したモデルを図 1 3に示す。
前景領域の画素値は、 前景に対応するオブジェク トが移動するので、 シャツタ 時間/ Vの期間に対応する、 4つの異なる前景の成分から構成される。 例えば、 図 1 3に示す前景領域の画素のうち最も左側に位置する画素は、
FO l/v, F02/v, F03/v、および F04/Vから構成される。 すなわち、 前景領域の画素 は、 動きボケを含んでいる。
背景に対応するォブジェク トが静止しているので、 シャツタ時間に対応する期 間において、 センサに入力される背景に対応する光は変化しない。 この場合、 背 景領域の画素値は、 動きボケを含まない。
カバードバックグラウンド領域若しくはァンカバードバックグラウンド領域か ら成る混合領域に属する画素の画素値は、 前景の成分と、 背景の成分とから構成 される。
次に、 オブジェク トに対応する画像が動いているとき、 複数のフレームにおけ る、 隣接して 1列に並んでいる画素であって、 フレーム上で同一の位置の画素の 画素値を時間方向に展開したモデルについて説明する。 例えば、 オブジェク トに 対応する画像が画面に対して水平に動いているとき、 隣接して 1列に並んでいる 画素として、 画面の 1つのライン上に並んでいる画素を選択することができる。 図 1 4は、 静止している背景に対応するォブジェク トを撮像した画像の 3つの フレームの、 隣接して 1列に並んでいる画素であって、 フレーム上で同一の位置 の画素の画素値を時間方向に展開したモデル図である。 フレーム #nは、 フレー ム ίίη- lの次のフレームであり、 フレーム ίίη+ l は、 フレーム #ηの次のフレームで ある。 他のフレームも同様に称する。
図 1 4に示す B01乃至 B12の画素値は、 静止している背景のオブジェク トに 対応する画素の画素値である。 背景に対応するオブジェク トが静止しているので、 フレーム #η-1乃至フレーム η+ 1において、 対応する画素の画素値は、 変化しな レ、。 例えば、 フレーム ίίη-lにおける Β05の画素値を有する画素の位置に対応す る、 フレーム #η における画素、 およびフレーム #η+ 1 における画素は、 それぞれ、 Β05の画素ィ直を有する。
図 1 5は、 静止している背景に対応するォブジェク トと共に図中の右側に移動 する前景に対応するォブジェク トを撮像した画像の 3つのフレームの、 隣接して 1列に並んでいる画素であって、 フレーム上で同一の位置の画素の画素値を時間 方向に展開したモデル図である。 図 1 5に示すモデルは、 カバードバックグラウ ンド領域を含む。
図 1 5において、 前景に対応するオブジェク トが、 剛体であり、 等速で移動す ると仮定でき、 前景の画像が次のフレームにおいて 4画素右側に表示されるよう に移動するので、 前景の動き量 Vは、 4であり、 仮想分割数は、 4である。
例えば、 図 1 5中のフレーム ίΐη- 1の最も左側の画素の、 シャツタが開いて最 初のシャツタ時間/ Vの前景の成分は、 F12/v となり、 図 1 5中の左から 2番目 の画素の、 シャツタが開いて 2番目のシャツタ時間/ Vの前景の成分も、 F12/v となる。 図 1 5中の左から 3番目の画素の、 シャツタが開いて 3番目のシャツタ 時間/ Vの前景の成分、 および図 1 5中の左から 4番目の画素の、 シャツタが開 いて 4番目のシャツタ時間/ Vの前景の成分は、 F12/vとなる。
図 1 5中のフレーム - 1の最も左側の画素の、 シャッタが開いて 2番目のシ ャッタ時間/ Vの前景の成分は、 Fl l/vとなり、 図 1 5中の左から 2番目の画素 の、 シャツタが開いて 3番目のシャツタ時間/ v の前景の成分も、 Fl l /v となる。 図 1 5中の左から 3番目の画素の、 シャツタが開いて 4番目のシャツタ時間/ V の前景の成分は、 Fl l/vとなる。
図 1 5中のフレーム ίίη- 1の最も左側の画素の、 シャッタが開いて 3番目のシ ャッタ時間/ Vの前景の成分は、 FlO/vとなり、 図 1 5中の左から 2番目の画素 の、 シャツタが開いて 4番目のシャツタ時間/ V の前景の成分も、 FlO/v となる。 図 1 5中のフレーム ttn- 1の最も左側の画素の、 シャッタが開いて 4番目のシャ ッタ時間/ Vの前景の成分は、 F09/vとなる。
背景に対応するオブジェク トが静止しているので、 図 1 5中のフレーム #n-l の左から 2番目の画素の、 シャツタが開いて最初のシャツタ時間/ Vの背景の成 分は、 BO l/vとなる。 図 1 5中のフレーム #n-lの左から 3番目の画素の、 シャ ッタが開いて最初および 2番目のシャツタ時間/ Vの背景の成分は、 B02/vとな る。 図 1 5中のフレーム #n- lの左から 4番目の画素の、 シャツタが開いて最初 乃至 3番目のシャツタ時間/ Vの背景の成分は、 B03/Vとなる。
図 1 5中のフレーム - 1において、 最も左側の画素は、 前景領域に属し、 左 側から 2番目乃至 4番目の画素は、 カバードバックグラウンド領域である混合領 域に属する。
図 1 5中のフレーム #n- 1の左から 5番目の画素乃至 1 2番目の画素は、 背景 領域に属し、 その画素値は、 それぞれ、 B04乃至 B 1 1 となる。
図 1 5中のフレーム ίίηの左から 1番目の画素乃至 5番目の画素は、 前景領域 に属する。 フレーム #ηの前景領域における、 シャツタ時間 /νの前景の成分は、 F05/v乃至 F12/vのいずれかである。
前景に対応するォブジェク トが、 剛体であり、 等速で移動すると仮定でき、 前 景の画像が次のフレームにおいて 4画素右側に表示されるように移動するので、 図 1 5中のフレーム #ηの左から 5番目の画素の、 シャツタが開いて最初のシャ ッタ時間/ V の前景の成分は、 F 12/v となり、 図 1 5中の左から 6番目の画素の, シャツタが開いて 2番目のシャツタ時間/ Vの前景の成分も、 F12/v となる。 図 1 5中の左から 7番目の画素の、 シャツタが開いて 3番目のシャツタ時間/ Vの 前景の成分、 および図 1 5中の左から 8番目の画素の、 シャツタが開いて 4番目 のシャツタ時間/ Vの前景の成分は、 F12/vとなる。
図 1 5中のフレーム #nの左から 5番目の画素の、 シャツタが開いて 2番目の シャツタ時間/ Vの前景の成分は、 Fl l/vとなり、 図 1 5中の左から 6番目の画 素の、 シャツタが開いて 3番目のシャツタ時間/ Vの前景の成分も、 Fl l/v とな る。 図 1 5中の左から 7番目の画素の、 シャツタが開いて 4番目のシャツタ時間 /vの前景の成分は、 Fl l/vとなる。
図 1 5中のフレーム #nの左から 5番目の画素の、 シャツタが開いて 3番目の シャツタ時間/ Vの前景の成分は、 FlO/vとなり、 図 1 5中の左から 6番目の画 素の、 シャツタが開いて 4番目のシャツタ時間/ Vの前景の成分も、 FlO/vとな る。 図 1 5中のフレーム #nの左から 5番目の画素の、 シャツタが開いて 4番目 のシャツタ時間/ Vの前景の成分は、 F09/vとなる。
背景に対応するォブジェク トが静止しているので、 図 1 5中のフレーム の 左から 6番目の画素の、 シャツタが開いて最初のシャツタ時間/ Vの背景の成分 は、 B05/vとなる。 図 1 5中のフレーム ttnの左から 7番目の画素の、 シャツタ が開いて最初および 2番目のシャツタ時間/ Vの背景の成分は、 B06/vとなる。 図 1 5中のフレーム ίίηの左から 8番目の画素の、 シャツタが開いて最初乃至 3 番目の、 シャツタ時間/ Vの背景の成分は、 Β07/ν となる。
図 1 5中のフレーム #ηにおいて、 左側から 6番目乃至 8番目の画素は、 カバ 一ドバックグラウンド領域である混合領域に属する。
図 1 5中のフレーム #ηの左から 9番目の画素乃至 1 2番目の画素は、 背景領 域に属し、 画素値は、 それぞれ、 Β08乃至 B 11 となる。
図 1 5中のフレーム ίίη+ lの左から 1番目の画素乃至 9番目の画素は、 前景領 域に属する。 フレーム ίίη+ lの前景領域における、 シャツタ時間/ Vの前景の成分 は、 FO l/v乃至 F 12/vのいずれかである。
前景に対応するォブジェク トが、 剛体であり、 等速で移動すると仮定でき、 前 景の画像が次のフレームにおいて 4画素右側に表示されるように移動するので、 図 1 5中のフレーム #n+ lの左から 9番目の画素の、 シャッタが開いて最初のシ ャッタ時間/ Vの前景の成分は、 F12/vとなり、 図 1 5中の左から 1 0番目の画 素の、 シャツタが開いて 2番目のシャツタ時間/ Vの前景の成分も、 F12/vとな る。 図 1 5中の左から 1 1番目の画素の、 シャツタが開いて 3番目のシャツタ時 間/ Vの前景の成分、 および図 1 5中の左から 1 2番目の画素の、 シャツタが開 いて 4番目のシャツタ時間/ Vの前景の成分は、 F12/vとなる。
図 1 5中のフレーム itn+ 1の左から 9番目の画素の、 シャッタが開いて 2番目 のシャツタ時間/ Vの期間の前景の成分は、 Fl l/vとなり、 図 1 5中の左から 1 0番目の画素の、 シャツタが開いて 3番目のシャツタ時間/ Vの前景の成分も、
Fl l/v となる。 図 1 5中の左から 1 1番目の画素の、 シャッタが開いて 4番目の、 シャツタ時間/ Vの前景の成分は、 Fl l/vとなる。
図 1 5中のフレーム #n+ lの左から 9番目の画素の、 シャッタが開いて 3番目 の、 シャツタ時間/ Vの前景の成分は、 FlO/vとなり、 図 1 5中の左から 1 0番 目の画素の、 シャツタが開いて 4番目のシャツタ時間/ Vの前景の成分も、 FlO/v となる。 図 1 5中のフレーム #n+lの左から 9番目の画素の、 シャツタが開いて 4番目のシャッタ時間/ Vの前景の成分は、 F09/vとなる。
背景に対応するォブジェク トが静止しているので、 図 1 5中のフレーム ίίη+ 1 の左から 1 0番目の画素の、 シャツタが開いて最初のシャツタ時間/ Vの背景の 成分は、 Β09/νとなる。 図 1 5中のフレーム ttn+1の左から 1 1番目の画素の、 シャッタが開いて最初および 2番目のシャッタ時間/ Vの背景の成分は、 B lO/v となる。 図 1 5中のフレーム #n+lの左から 1 2番目の画素の、 シャツタが開い て最初乃至 3番目の、 シャツタ時間/ Vの背景の成分は、 Bl l/vとなる。
図 1 5中のフレーム #n+l において、 左側から 1 0番目乃至 1 2番目の画素は、 カバードバックグラウンド領域である混合領域に対応する。
図 1 6は、 図 1 5に示す画素値から前景の成分を抽出した画像のモデル図であ る。 図 1 7は、 静止している背景と共に図中の右側に移動するオブジェク トに対応 する前景を撮像した画像の 3つのフレームの、 隣接して 1列に並んでいる画素で あって、 フレーム上で同一の位置の画素の画素値を時間方向に展開したモデル図 である。 図 1 7において、 アンカバードバックグラウンド領域が含まれている。 図 1 7において、 前景に対応するォブジェク トは、 剛体であり、 かつ等速で移 動していると仮定できる。 前景に対応するオブジェク トが、 次のフレームにおい て 4画素分右側に表示されるように移動しているので、 動き量 V は、 4である, 例えば、 図 1 7中のフレーム #n-lの最も左側の画素の、 シャツタが開いて最 初の、 シャツタ時間/ Vの前景の成分は、 F13/vとなり、 図 1 7中の左から 2番 目の画素の、 シャツタが開いて 2番目のシャツタ時間/ Vの前景の成分も、 F13/V となる。 図 1 7中の左から 3番目の画素の、 シャツタが開いて 3番目のシャツタ 時間/ Vの前景の成分、 および図 1 7中の左から 4番目の画素の、 シャツタが開 いて 4番目のシャツタ時間/ Vの前景の成分は、 F13/vとなる。
図 1 7中のフレーム ttn- 1の左から 2番目の画素の、 シャッタが開いて最初の シャツタ時間/ Vの前景の成分は、 F14/v となり、 図 1 7中の左から 3番目の画 素の、 シャツタが開いて 2番目のシャツタ時間/ Vの前景の成分も、 F14/vとな る。 図 1 7中の左から 3番目の画素の、 シャツタが開いて最初の、 シャツタ時間 Λの前景の成分は、 Fl 5/v となる。
背景に対応するォブジェク トが静止しているので、 図 1 7中のフレーム #n- l の最も左側の画素の、 シャツタが開いて 2番目乃至 4番目の、 シャツタ時間/ V の背景の成分は、 B25/v となる。 図 1 7中のフレーム #n - 1の左から 2番目の画 素の、 シャツタが開いて 3番目および 4番目の、 シャツタ時間/ Vの背景の成分 は、 B26/vとなる。 図 1 7中のフレーム #n- lの左から 3番目の画素の、 シャツ タが開いて 4番目のシャツタ時間/ Vの背景の成分は、 B27/vとなる。
図 1 7中のフレーム #n- 1において、 最も左側の画素乃至 3番目の画素は、 了 ンカバードバックグラウンド領域である混合領域に属する。
図 1 7中のフレーム ttn- 1の左から 4番目の画素乃至 1 2番目の画素は、 前景 領域に属する。 フレームの前景の成分は、 F 13/v乃至 F24/vのいずれかである。 図 1 7中のフレーム ίίηの最も左側の画素乃至左から 4番目の画素は、 背景領 域に属し、 画素値は、 それぞれ、 Β25乃至 Β28となる。
前景に対応するオブジェク トが、 剛体であり、 等速で移動すると仮定でき、 前 景の画像が次のフレームにおいて 4画素右側に表示されるように移動するので、 図 1 7中のフレーム の左から 5番目の画素の、 シャッタが開いて最初のシャ ッタ時間/ V の前景の成分は、 F 13/v となり、 図 1 7中の左から 6番目の画素の、 シャツタが開いて 2番目のシャツタ時間/ Vの前景の成分も、 F 13/Vとなる。 図 1 7中の左から 7番目の画素の、 シャツタが開いて 3番目のシャツタ時間/ Vの 前景の成分、 および図 1 7中の左から 8番目の画素の、 シャツタが開いて 4番目 のシャツタ時間/ Vの前景の成分は、 F 13/vとなる。
図 1 7中のフレーム ίίηの左から 6番目の画素の、 シャツタが開いて最初のシ ャッタ時間/ Vの前景の成分は、 F 14/vとなり、 図 1 7中の左から 7番目の画素 の、 シャツタが開いて 2番目のシャツタ時間/ V の前景の成分も、 F 14/v となる c 図 1 7中の左から 8番目の画素の、 シャツタが開いて最初のシャツタ時間/ Vの 前景の成分は、 F15/Vとなる。
背景に対応するォブジェク トが静止しているので、 図 1 7中のフレーム の 左から 5番目の画素の、 シャッタが開いて 2番目乃至 4番目のシャッタ時間/ V の背景の成分は、 Β29/νとなる。 図 1 7中のフレーム tinの左から 6番目の画素 の、 シャツタが開いて 3番目および 4番目のシャツタ時間/ Vの背景の成分は、 B30/vとなる。 図 1 7中のフレーム の左から 7番目の画素の、 シャツタが開 いて 4番目のシャッタ時間/ Vの背景の成分は、 B31 /vとなる。
図 1 7中のフレーム #nにおいて、 左から 5番目の画素乃至 7番目の画素は、 アンカバードバックグラウンド領域である混合領域に属する。
図 1 7中のフレーム #nの左から 8番目の画素乃至 1 2番目の画素は、 前景領 域に属する。 フレーム ftnの前景領域における、 シャツタ時間/ Vの期間に対応す る値は、 F 13/v乃至 F20/vのいずれかである。 図 1 7中のフレーム ίίη+ lの最も左側の画素乃至左から 8番目の画素は、 背景 領域に属し、 画素値は、 それぞれ、 Β25乃至 Β32 となる。
前景に対応するオブジェク トが、 剛体であり、 等速で移動すると仮定でき、 前 景の画像が次のフレームにおいて 4画素右側に表示されるように移動するので、 図 1 7中のフレーム ttn+ 1の左から 9番目の画素の、 シャツタが開いて最初のシ ャッタ時間/ Vの前景の成分は、 F 13/Vとなり、 図 1 7中の左から 1 0番目の画 素の、 シャツタが開いて 2番目のシャツタ時間/ Vの前景の成分も、 F 13/v とな る。 図 1 7中の左から 1 1番目の画素の、 シャツタが開いて 3番目のシャツタ時 間/ Vの前景の成分、 および図 1 7中の左から 1 2番目の画素の、 シャツタが開 いて 4番目のシャツタ時間/ Vの前景の成分は、 F 13/vとなる。
図 1 7中のフレーム #n+ lの左から 1 0番目の画素の、 シャッタが開いて最初 のシャツタ時間/ Vの前景の成分は、 F 14/v となり、 図 1 7中の左から 1 1番目 の画素の、 シャツタが開いて 2番目のシャツタ時間/ Vの前景の成分も、 F 14/v となる。 図 1 7中の左から 1 2番目の画素の、 シャツタが開いて最初のシャツタ 時間/ Vの前景の成分は、 F 15/v となる。
背景に対応するォブジェク トが静止しているので、 図 1 7中のフレーム #n+ l の左から 9番目の画素の、 シャツタが開いて 2番目乃至 4番目の、 シャツタ時間 /vの背景の成分は、 B33/vとなる。 図 1 7中のフレーム #n+ lの左から 1 0番目 の画素の、 シャッタが開いて 3番目および 4番目のシャッタ時間/ Vの背景の成 分は、 B34/vとなる。 図 1 7中のフレーム ttn+ 1の左から 1 1番目の画素の、 シ ャッタが開いて 4番目のシャッタ時間/ Vの背景の成分は、 Β35/νとなる。
図 1 7中のフレーム #η+ 1において、 左から 9番目の画素乃至 1 1番目の画素 は、 アンカバードバックグラウンド領域である混合領域に属する。
図 1 7中のフレーム ίίη+ lの左から 1 2番目の画素は、 前景領域に属する。 フ レーム + 1の前景領域における、 シャツタ時間/ Vの前景の成分は、 F 13/v乃至 F 16/vのいずれかである。
図 1 8は、 図 1 7に示す画素値から前景の成分を抽出した画像のモデル図であ る。
図 2に戻り、 混合比算出部 1 0 3は、 入力画像、 および動き検出部 1 0 2から 供給された動きべク トルとその位置情報を基に、 画素がカバードバックグラウン ド領域に属すると仮定したときの、 推定混合比およびこれに対応する混合比関係 情報を生成すると共に、 画素がアンカバードバックグラウンド領域に属すると仮 定したときの、 推定される混合比である推定混合比およびこれに対応する混合比 関係情報を生成する。 混合比算出部 1 0 3は、 生成した 2つの推定混合比および これらに対応する混合比関係情報を領域特定部 1 0 4に供給する。
領域特定部 1 0 4は、 入力画像、 並びに混合比算出部 1 0 3から供給された 2 つの推定混合比およびこれらに対応する混合比関係情報を基に、 入力された画像 の画素のそれぞれを、 前景領域、 背景領域、 または混合領域のいずれかに特定し, 画素毎に前景領域、 背景領域、 または混合領域のいずれかに属するかを示す領域 情報を前景背景分離部 1 0 5、 および動きボケ調整部 1 0 6に供給する。
前景背景分離部 1 0 5は、 複数のフレームの画素値、 領域情報、 および混合比 a を基に、 前景の成分のみからなる前景成分画像を抽出して、 動きボケ調整部 1 0 6に供給する。
動きボケ調整部 1 0 6は、 前景背景分離部 1 0 5から供給された前景成分画像、 動き検出部 1 0 2から供給された動きべク トル、 および領域特定部 1 0 4から供 給された領域情報を基に、 前景成分画像に含まれる動きボケの量を調整して、 動 きボケの量を調整した前景成分画像を出力する。
図 1 9のフローチャートを参照して、 画像処理装置による動きボケの量の調整 の処理を説明する。 ステップ S I 1において、 混合比算出部 1 0 3は、 入力画像、 および動き検出部 1 0 2から供給された動きべク トルとその位置情報を基に、 画 素がカバードバックグラウンド領域に属すると仮定したとき、 推定される混合比 である推定混合比およびこれに対応する混合比関係情報を算出すると共に、 画素 がアンカバードバックグラウンド領域に属すると仮定したとき、 推定される混合 比である推定混合比およびこれに対応する混合比関係情報を算出する。 混合比算 出部 1 0 3は、 算出した 2つの推定混合比およびこれらに対応する混合比関係情 報を領域特定部 1 0 4に供給する。 混合比算出の処理の詳細は、 後述する。
ステップ S 1 2において、 領域特定部 1 0 4は、 入力画像、 並びに混合比算出 部 1 0 3から供給された 2つの推定混合比およびこれらに対応する混合比関係情 報を基に、 入力画像の画素毎に、 画素が、 前景領域、 背景領域、 カバードバック グラウンド領域、 またはアンカバードバックグラウンド領域のいずれかに属する かを示す領域情報を生成する領域特定の処理を実行する。 領域特定の処理の詳細 は、 後述する。 領域特定部 1 0 4は、 生成した領域情報、 並びに混合比算出部 1 0 3から供給された 2つの推定混合比およびこれらに対応する混合比関係情報を 基に、 混合比 a を生成し、 生成した混合比 ひ を前景背景分離部 1 0 5に供給す る。
ステップ S 1 3において、 前景背景分離部 1 0 5は、 領域情報、 および混合比 ひ を基に、 入力画像から前景の成分を抽出して、 前景成分画像として動きボケ 調整部 1 0 6に供給する。
ステップ S 1 4において、 動きボケ調整部 1 0 6は、 動きベク トルおよび領域 情報を基に、 動き方向に並ぶ連続した画素であって、 アンカバードバックグラウ ンド領域、 前景領域、 およびカバードバックグラウンド領域のいずれかに属する ものの画像上の位置を示す処理単位を生成し、 処理単位に対応する前景成分に含 まれる動きボケの量を調整する。 動きボケの量の調整の処理の詳細については、 後述する。
ステップ S 1 5において、 画像処理装置は、 画面全体について処理を終了した か否かを判定し、 画面全体について処理を終了していないと判定された場合、 ス テツプ S 1 4に進み、 処理単位に対応する前景の成分を対象とした動きボケの量 の調整の処理を繰り返す。
ステップ S 1 5において、 画面全体について処理を終了したと判定された場合、 処理は終了する。
このように、 画像処理装置は、 前景と背景を分離して、 前景に含まれる動きボ ケの量を調整することができる。 すなわち、 画像処理装置は、 前景の画素の画素 値であるサンプルデータに含まれる動きボケの量を調整することができる。
以下、 混合比算出部 1 0 3、 領域特定部 1 0 4、 前景背景分離部 1 0 5、 およ び動きボケ調整部 1 0 6のそれぞれの構成について説明する。
図 2 0は、 混合比算出部 1 0 3の構成を示すブロック図である。 推定混合比処 理部 2 0 1は、 動き検出部 1 0 2から供給された動きべク トルおよびその位置情 報、 並びに入力画像を基に、 カバードバックグラウンド領域のモデルに対応する 演算により、 画素毎に推定混合比を算出して、 推定混合比の算出に伴い算出され る混合比関係情報と共に、 推定混合比を出力する。 推定混合比処理部 2 0 1が出 力する混合比関係情報は、 例えば、 前景の成分の和などからなる。
推定混合比処理部 2 0 2は、 動き検出部 1 0 2から供給された動きべク トルお よびその位置情報、 並びに入力画像を基に、 アンカバードバックグラウンド領域 のモデルに対応する演算により、 画素毎に推定混合比を算出して、 推定混合比の 算出に伴い算出される混合比関係情報と共に、 推定混合比を出力する。 推定混合 比処理部 2 0 2が出力する混合比関係情報は、 例えば、 前景の成分の和などから なる。
前景に対応するォブジェク トがシャッタ時間内に等速で動いていると仮定でき るので、 混合領域に属する画素の混合比 は、 以下の性質を有する。 すなわち, 混合比ひ は、 画素の位置の変化に対応して、 直線的に変化する。 画素の位置の 変化を 1次元とすれば、 混合比ひ の変化は、 直線で表現することができ、 画素 の位置の変化を 2次元とすれば、 混合比ひ の変化は、 平面で表現することがで さる。
なお、 1フレームの期間は短いので、 前景に対応するオブジェク トが剛体であ り、 等速で移動していると仮定が成り立つ。
この場合、 混合比ひ の傾きは、 前景のシャツタ時間内での動き量 Vの逆比と なる。
理想的な混合比ひ の例を図 2 1に示す。 理想的な混合比ひの混合領域におけ る傾き 1は、 動き量 Vの逆数として表すことができる。
図 2 1に示すように、 理想的な混合比 ひ は、 背景領域において、 1の値を有 し、 前景領域において、 0の値を有し、 混合領域において、 0を越え 1未満の値 を有する。
図 2 2の例において、 フレーム ttnの左から 7番目の画素の画素ィ直 C06は、 フ レーム #n-lの左から 7番目の画素の画素値 P06を用いて、 式 (4 ) で表すこと ができる。
C06 = B06/v + B06/V + FOllv + F02lv
= P06/v + P06/V + FOllv + F02/v
= 2lvP06 +∑FUv (4) 式 (4 ) において、 画素値 C06を混合領域の画素の画素値 Mと、 画素値 P06 を背景領域の画素の画素値 Bと表現する。 すなわち、 混合領域の画素の画素値 M および背景領域の画素の画素値 Bは、 それぞれ、 式 (5 ) および式 (6 ) のよ うに表現することができる。
=C06 ( 5 )
B=P06 ( 6 )
式 (4 ) 中の 2/vは、 混合比 ひ に対応する。 動き量 Vが 4なので、 フレーム #nの左から 7番目の画素の混合比ひは、 0. 5となる。
以上のように、 注目しているフレーム #nの画素値 Cを混合領域の画素値と見 なし、 フレーム の前のフレーム -1の画素値 Pを背景領域の画素値と見なす ことで、 混合比ひ を示す式 (3 ) は、 式 (7 ) のように書き換えられる。
C=Oi - P+f ( 7 )
式 (7 ) の f は、 注目している画素に含まれる前景の成分の和 ∑ iFi/vである。 式 (7 ) に含まれる変数は、 混合比ひ および前景の成分の和 f の 2つである。 同様に、 アンカバードバックグラウンド領域における、 動き量 V が 4であり 時間方向の仮想分割数が 4である、 画素値を時間方向に展開したモデルを図 2 3 に示す。 アンカバードバックグラウンド領域において、 上述したカバードバックダラゥ ンド領域における表現と同様に、 注目しているフレーム #nの画素値 Cを混合領 域の画素値と見なし、 フレーム #nの後のフレーム #n+lの画素値 Nを背景領域の 画素値と見なすことで、 混合比ひ を示す式 (3 ) は、 式 (8 ) のように表現す ることができる。
C= a - N+f ( 8 )
なお、 背景のオブジェク トが静止しているとして説明したが、 背景のオブジェ ク トが動いている場合においても、 背景の動き量 Vに対応させた位置の画素の 画素値を利用することにより、 式 (4 ) 乃至式 (8 ) を適用することができる。 例えば、 図 2 2において、 背景に対応するォブジェク トの動き量 V が 2であり 仮想分割数が 2であるとき、 背景に対応するォブジェク トが図中の右側に動いて いるとき、 式 (6 ) における背景領域の画素の画素値 Bは、 画素値 P04とされ る。
式 (7 ) および式 (8 ) は、 それぞれ 2つの変数を含むので、 そのままでは混 合比 を求めることができない。
そこで、 前景のオブジェク トの動き量 Vに合わせて、 混合領域に属する画素 と、 対応する背景領域に属する画素との組について式を立て、 混合比 α を求め る。
動き量 Vとして、 動き検出部 1 0 2から供給された動きべク トルおよびその 位置情報が利用される。
推定混合比処理部 2 0 1による、 カバードバックグラウンド領域に対応するモ デルを基にした、 動き量 Vを使用した推定混合比の算出について説明する。
カバ一ドバックグラウンド領域に対応する図 2 2に示す例において、 フレーム ίίη- 1の Ρ02について、 式 (9 ) が成立し、 フレーム ίίηの C06について、 式 (1 0 ) が成立する。
Ρ02 = 2/ν - Β02 +Σ Filv (9) C06 = 2/v · B06 +∑ Fi/v (10) 式 (9) および式 ( 1 0) において、 混合比 a に対応する値は、 2/v であり 同一である。 式 (9) および式 (10) において、 前景の成分の和に対応する値
∑Fi/v
は、 であり、 同一である。
すなわち、 フレーム ttn- 1の P02およびフレーム の C06の混合比 ひ および 前景の成分の和は、 同一であり、 フレーム #nの C06は、 前景のオブジェク トの 動きにより、 フレーム #n-lの P02に対応していると言える。
複数フレームにわたって、 前景に対応するオブジェク トが等速で動くという仮 定と、 前景の成分が一定であるという仮定を持ち込むことで、 このように、 前景 のォブジェク トの動き量 Vに対応して、 混合比 および前景の成分の和が同一 である混合領域に属する画素と、 対応する背景領域に属する画素との複数の組を 選択することができる。 例えば、 混合領域に属する画素と、 対応する背景領域に 属する画素との複数の組を 5つの組とすることができる。
例えば、 図 24に示すように、 前景のオブジェク トの動き量 Vに対応して、 フレーム #n-3乃至フレーム ίίη+2から、 混合領域に属する画素 Mtl乃至 Mt5と、 対応する背景領域に属する画素 Btl乃至 Bt5とを選択することができる。 図 2 4において、 白丸は、 背景領域に属すると見なす画素を示し、 黒丸は、 混合領域 に属すると見なす画素を示す。
画素 Mtl乃至 Mt5、 および画素 Btl乃至 Bt5について、 式 (1 1) 乃至式 (1 5) が成立する。
Mtl=ひ - Btl+f (1 1)
t2=Qi - Bt2+f (1 2)
Mt3=a · Bt3+f (1 3)
Mt4=ひ · Bt4+f (1 4)
Mt5=or · Bt5+f (1 5) 式 (1 1 ) 乃至式 (1 5 ) の f は、 前景の成分の和 ∑iFi/vである。
式 (1 1 ) 乃至式 (1 5 ) の 5つの式は、 共通する変数である混合比ひ およ び前景の成分の和 f を含むので、 式 (1 1 ) 乃至式 (1 5 ) に最小自乗法を適 用して、 混合比 ひおよび前景の成分の和 f を求めることができる。
例えば、 推定混合比処理部 2 0 1は、 混合比ひおよび前景の成分の和 f を算 出するための正規方程式を予め記憶し、 記憶している正規方程式に混合領域に属 する画素値、 および対応する背景領域に属する画素値を設定して、 行列解法によ り混合比 Of および前景の成分の和 f を算出する。
なお、 背景が動いているとき、 図 2 5に例を示すように、 推定混合比処理部 2 0 1は、 背景の動き量 ν'に対応させて、 正規方程式に混合領域に属する画素値、 および対応する背景領域に属する画素値を設定して、 行列解法により混合比 ひ および前景の成分の和 f を算出する。 図 2 5において、 白丸は、 背景領域に属 すると見なす画素を示し、 黒丸は、 混合領域に属すると見なす画素を示す。
このように推定混合比処理部 2 0 1は、 カバードバックグラウンド領域に対応 するモデルを基に、 動き量 Vを使用して推定混合比を算出する。
推定混合比処理部 2 0 2は、 同様に、 アンカバードバックグラウンド領域に対 応するモデルを基に、 動き量 Vを使用して推定混合比を算出する。 アンカバー ドバックグラウンド領域に対応するモデルにおいて、 対応する背景領域に属する 画素は、 注目している画素のフレームの後のフレームから選択される。
図 2 6は、 カバードバックグラウンド領域に対応するモデルを基に、 動き量 V を使用して推定混合比を算出する推定混合比処理部 2 0 1の構成を示すプロック 図である。
正規方程式加算部 2 2 1は、 動き検出部 1 0 2から供給された動きべク トルと その位置情報を基に、 予め記憶している正規方程式に、 入力画像の M個のフレー ムの画像に含まれる、 混合領域に属する画素値、 および対応する背景領域に属す る画素値を設定する。 正規方程式加算部 2 2 1は、 混合領域に属する画素値、 お よび対応する背景領域に属する画素値が設定された正規方程式を、 演算部 2 2 2 に供給する。
演算部 2 2 2は、 正規方程式加算部 2 2 1から供給された、 画素値が設定され た正規方程式を、 掃き出し法 (Gauss-Jordanの消去法) などの行列解法を適用 して解き、 推定混合比を算出し、 算出した推定混合比を出力する。 演算部 2 2 2 は、 推定混合比の算出に伴い、 求められた前景の成分の和を混合比関係情報とし て出力する。
このように、 推定混合比処理部 2 0 1は、 カバードバックグラウンド領域に対 応するモデルを基に、 動き量 Vを使用して推定混合比を算出する。 推定混合比 処理部 2 0 1は、 混合比関係情報として前景の成分の和を出力する。
推定混合比処理部 2 0 2は、 推定混合比処理部 2 0 1と同様の構成を有するの で、 その説明は省略する。
このように、 混合比算出部 1 0 3は、 入力画像、 および動き検出部 1 0 2から 供給された動きべク トルとその位置情報を基に、 画素がカバードバックグラウン ド領域に属すると仮定したときの、 推定混合比およびこれに対応する混合比関係 情報を生成すると共に、 画素がアンカバードバックグラウンド領域に属すると仮 定したときの、 推定される混合比である推定混合比およびこれに対応する混合比 関係情報を生成することができる。
図 2 7のフローチヤ一トを参照して、 混合比算出部 1 0 3の推定混合比の算出 の処理を説明する。 ステップ S 2 0 1において、 推定混合比処理部 2 0 1は、 入 力画像、 並びに動き検出部 1 0 2から供給された動きべク トルおよびその位置情 報を基に、 カバードバックグラウンド領域に対応するモデルによる混合比推定の 処理を実行する。 混合比推定の処理の詳細は、 図 2 8のフローチャートを参照し て、 後述する。
ステップ S 2 0 2において、 推定混合比処理部 2 0 2は、 入力画像、 並びに動 き検出部 1 0 2から供給された動きベク トルおよびその位置情報を基に、 アンカ バードバックグラウンド領域に対応するモデルによる混合比推定の処理を実行す る。 ステップ S 2 0 3において、 混合比算出部 1 0 3は、 フレーム全体について、 混合比を推定したか否かを判定し、 フレーム全体について、 混合比を推定してい ないと判定された場合、 ステップ S 2 0 1に戻り、 次の画素について混合比を推 定する処理を実行する。
ステップ S 2 0 3において、 フレーム全体について、 混合比を推定したと判定 された場合、 処理は終了する。
このように、 混合比算出部 1 0 3は、 動き検出部 1 0 2から供給された動きべ ク トルおよびその位置情報、 並びに入力画像を基に、 各画素に対応する推定混合 比を算出することができる。
次に、 図 2 7のステップ S 2 0 1に対応する、 推定混合比処理部 2 0 1が実行 する、 カバードバックグラウンド領域に対応するモデルによる混合比推定の算出 の処理を図 2 8のフローチヤ一トを参照して説明する。
ステップ S 2 2 1において、 正規方程式加算部 2 2 1は、 動き検出部 1 0 2力、 ら供給された動きべク トルおよびその位置情報を読み込み、 動き量 Vを取得す る。
ステップ S 2 2 2において、 正規方程式加算部 2 2 1は、 動き量 Vを基に、 入力された M個のフレームの画像から画素を選択して、 予め記憶している正規方 程式に選択した画素の画素値を設定する。
ステップ S 2 2 3において、 正規方程式加算部 2 2 1は、 対象となる画素につ いて画素値の設定を終了したか否かを判定し、 対象となる画素について画素値の 設定を終了していないと判定された場合、 ステップ S 2 2 2に戻り、 画素値の設 定の処理を繰り返す。
ステップ S 2 2 3において、 対象となる画素について画素値の設定を終了した と判定された場合、 ステップ S 2 2 4に進み、 正規方程式加算部 2 2 1は、 画素 値を設定した正規方程式を演算部 2 2 2に供給し、 演算部 2 2 2は、 画素値が設 定された正規方程式に掃き出し法 (Gauss-Jordanの消去法) などを適用して正 規方程式を解き、 推定混合比を算出して、 処理は終了する。 演算部 2 2 2は、 推 定混合比の算出に伴い、 求められた各画素に対応する前景の成分の和を混合比関 係情報として出力する。
このように、 推定混合比処理部 2 0 1は、 推定混合比を算出することができる, 図 2 7のステップ S 2 0 2における、 推定混合比処理部 2 0 2が実行する、 ァ ンカバードバックグラウンド領域に対応するモデルによる混合比推定の処理は、 アンカバードバックグラウンド領域のモデルに対応する正規方程式を利用した、 図 2 8のフローチヤ一トに示す処理と同様なので、 その説明は省略する。
図 2 9は、 混合比算出部 1 0 3の他の構成を示すブロック図である。 図 2 9に 構成を示す混合比算出部 1 0 3は、 動きべク トルを使用しない。
推定混合比処理部 2 4 1は、 入力画像を基に、 カバードバックグラウンド領域 のモデルに対応する演算により、 画素毎に推定混合比を算出して、 推定混合比の 算出に伴い算出される混合比関係情報と共に、 推定混合比を出力する。 推定混合 比処理部 2 4 1が出力する混合比関係情報は、 例えば、 前景の成分の和、 および 混合比の傾きなどからなる。
推定混合比処理部 2 4 2は、 入力画像を基に、 アンカバードバックグラウンド 領域のモデルに対応する演算により、 画素毎に推定混合比を算出して、 推定混合 比の算出に伴い算出される混合比関係情報と共に、 推定混合比を出力する。 推定 混合比処理部 2 4 2が出力する混合比関係情報は、 例えば、 前景の成分の和、 お よび混合比の傾きなどからなる。
図 3 0乃至図 3 2を参照して、 推定混合比処理部 2 4 1および推定混合比処理 部 2 4 2による、 混合比の推定の処理を説明する。
図 2 2および図 2 3を参照して説明したように、 式 (7 ) および式 (8 ) は、 それぞれ 2つの変数を含むので、 そのままでは混合比 を求めることができな レ、。
そこで、 推定混合比処理部 2 4 1または推定混合比処理部 2 4 2は、 シャツタ 時間内において、 前景に対応するオブジェク トが等速で動くことにより、 画素の 位置の変化に対応して、 混合比 α が直線的に変化する性質を利用して、 空間方 向に、 混合比 ひ と前景の成分の和 f とを近似した式を立てる。 混合領域に属す る画素の画素値および背景領域に属する画素の画素値の組の複数を利用して、 混 合比 ひ と前景の成分の和 f とを近似した式を解く。
混合比ひの変化を、 直線として近似すると、 混合比ひ は、 式 (1 6) で表さ れる。
ひ =il+p ( 1 6)
式 (1 6) において、 iは、 注目している画素の位置を 0とした空間方向のイン デッタスである。 1は、 混合比 aの直線の傾きである。 pは、 混合比 Of の直線 の切片である共に、 注目している画素の混合比 a である。 式 (1 6) において、 インデックス iは、 既知であるが、 傾き 1および切片 pは、 未知である。
インデックス お 傾き および切片 pの関係を図 3 0に示す。 図 3 0におい て、 白丸は、 注目画素を示し、 黒丸は、 近傍画素を示す。
混合比ひ を式 (1 6) のように近似することにより、 複数の画素に対して複 数の異なる混合比ひ は、 2つの変数で表現される。 図 3 0に示す例において、 5つの画素に対する 5つの混合比は、 2つの変数である傾き 1および切片 pに より表現される。
図 3 1に示す平面で混合比 a を近似すると、 画像の水平方向および垂直方向 の 2つの方向に対応する動き V を考慮したとき、 式 ( 1 6) を平面に拡張して, 混合比ひ は、 式 (1 7) で表される。 図 3 1において、 白丸は、 注目画素を示 す。
a=jm+kq+p ( 1 7)
式 (1 7) において、 jは、 注目している画素の位置を 0とした水平方向のイン デックスであり、 kは、 垂直方向のインデックスである。 mは、 混合比ひ の面 の水平方向の傾きであり、 q は、 混合比 ひ の面の垂直方向の傾きである。 p は、 混合比 Of の面の切片である。
例えば、 図 2 2に示すフレーム #nにおいて、 C05乃至 C07について、 それぞ れ、 式 (1 8) 乃至式 (20) が成立する。 C05=ひ 05'B05/v+f05 ( 1 8)
C06= 06,B06/v+f06 ( 1 9)
C07=ひ 07-B07/v+f07 ( 2 0)
前景の成分が近傍で一致する、 すなわち、 F01乃至 F03が等しいとして、 F01 乃至 F03を Fcに置き換えると式 (2 1) が成立する。
f (χ) = (ΐ-α (x)) - Fc (2 1)
式 (2 1 ) において、 Xは、 空間方向の位置を表す。
ひ ( X ) を式 ( 1 7) で置き換えると、 式 (2 1 ) は、 式 (2 2) として表す ことができる。
f (x) = (l-(jm+kq+p)) - Fc
=j - (- m · Fc) +k · (- q · Fc) +((l-p) · Fc)
=js+kt+u (2 2)
式 (2 2) において、 (-m■ Fc) 、 (-q - Fc) 、 および(1- p) . Fcは、 式 (2 3) 乃至式 (2 5) に示すように置き換えられている。
s=-m · Fc (2 3)
t=-q - Fc (24)
u=(l-p) . Fc (2 5)
式 (2 2) において、 jは、 注目している画素の位置を 0とした水平方向のィ ンデックスであり、 kは、 垂直方向のインデックスである。
このように、 前景に対応するオブジェク トがシャツタ時間内において等速に移 動し、 前景に対応する成分が近傍において一定であるという仮定が成立するので. 前景の成分の和は、 式 (2 2) で近似される。
なお、 混合比ひ を直線で近似する場合、 前景の成分の和は、 式 (2 6) で表 すことができる。
f (x)=is+u (2 6)
式 (1 6) の混合比 ひおよび前景成分の和を、 式 (1 7) および式 (2 2) を利用して置き換えると、 画素値 Mは、 式 (2 7) で表される。 M=(jm+kq+p) - B+js+kt+u
= j'B · ra+kB · q+B · p+j · s+k · t+u (27)
式 (27) において、 未知の変数は、 混合比ひ の面の水平方向の傾き m、 混 合比 ひ の面の垂直方向の傾き q、 混合比ひ の面の切片 p、 s、 t、 および uの 6 つである。
注目している画素の近傍の画素に対応させて、 式 (27) に、 画素値 Mおよ び画素値 Bを設定し、 画素値 Mおよび画素値 Bが設定された複数の式に対して 最小自乗法で解くことにより、 混合比 を算出する。
例えば、 注目している画素の水平方向のインデックス jを 0とし、 垂直方向 のィンデックス k を 0とし、 注目している画素の近傍の 3 X 3の画素について. 式 (27) に対応する正規方程式に画素値 Mまたは画素値 Bを設定すると、 式
(28) 乃至式 (36) を得る。
M_, .!=(-1) , B—い i · m+(-l) · B—い t · q+B.! .! · p+(- 1) · s+ (- 1) · t+u (28) M0,— ^(0) · Bo,.! · m+(-l) · Bo,.! · q+B0i-1 · p+ (0) · s+ (- 1) · t+u (29) Μ+1ι_!=(+1) · B+1,_! . m+(-l) · B+1,_! . q+B+1,_, . p+(+l) ■ s+(— 1) · t+u (30) M.li0=(-1) · B_li0 · m+(0) · B— 。 · q+B—u · p+(- 1) · s+(0) · t+u (3 1) M0,0=(0) · B。,。■ ra+(0) ■ B。,。 · q+B。,。 · p+(0) · s+ (0) · t+u (32) M+1,0=(+l) · B+1,0 · m+(0) · B+1,0 · q+B+1,0 · p+(+l) · s+(0) · t+u (3 3) M一い L=(—1) · B_lj+1 · m+(+l) · B—い L · q+B.1>+1 · p+ (- 1) · s+(+l) ■ t+u (34) M0i+1=(0) · B0,+1■ m+(+l) . B0,+1 · q+B0,+1 · p+(0) · s+(+l) . t+u (35)
M +1, +1 (+1) · B+ m+(+l) - B+ q+B +1, +1 p+(+l) · s+(+l) · t+u (36) 注目している画素の水平方向のインデックス jが 0であり、 垂直方向のイン デッタス k が 0であるので、 注目している画素の混合比 ひ は、 式 ( 1 7) より j=0および k=0のときの値、 すなわち、 切片 pに等しい。
従って、 式 (28) 乃至式 (36) の 9つの式を基に、 最小自乗法により、 水 平方向の傾き m、 垂直方向の傾き q、 切片 p、 s、 t、 および uのそれぞれの値を 算出し、 切片 pを混合比 として出力すればよレ、。 次に、 最小自乗法を適用して混合比 を算出するより具体的な手順を説明す る。
インデックス i およびィンデックス k を 1つのィンデックス Xで表現すると インデックスお インデックス およびインデックス Xの関係は、 式 (37) で表される。
x=(j + l) · 3+(k+l) (3 7)
水平方向の傾き m、 垂直方向の傾き q、 切片 p、 s、 t、 および uをそれぞれ変 数 w0, wl, w2, w3, w4、 および w5と表現し、 jB, kB, B, j, k、 および 1をそれぞれ aO, al,a2, a3, a4v および a5 と表現する。 誤差 exを考慮すると、 式 (28) 乃 至式 (36) は、 式 (38) に書き換えることができる。
Figure imgf000056_0001
式 (38) において、 Xは、 0乃至 8の整数のいずれかの値である。
式 (38) から、 式 (3 9) を導くことができる。
5
ex = Mx - ^ayWy (39)
y = ここで、 最小自乗法を適用するため、 誤差の自乗和 Eを式 (40) に示すよ うにに定義する。
E=∑ex2 (40)
x = 0 誤差が最小になるためには、 誤差の自乗和 Eに対する、 変数 Wvの偏微分が 0 になればよい。 ここで、 Vは、 0乃至 5の整数のいずれかの値である。 従って、 式 (4 1) を満たすように wyを求める。
dE . ,y dex
8
= 2-∑ex-av = 0 (41)
x = 0
式 (4 1) に式 (39) を代入すると、 式 (42) を得る。 ∑(av∑ay Wy) =∑aV ' Mx (42) x= 0 y = 0 x= 0
式 (4 2 ) の vに 0乃至 5の整数のいずれか 1つを代入して得られる 6つの 式からなる正規方程式に、 例えば、 掃き出し法 (Gauss- Jordanの消去法) など を適用して、 wyを算出する。 上述したように、 wOは水平方向の傾き mであり、 wlは垂直方向の傾き qであり、 w2は切片 pであり、 w3は sであり、 w4は tで あり、 w5は uである。
以上のように、 画素値 Mおよび画素値 Bを設定した式に、 最小自乗法を適用 することにより、 水平方向の傾き m、 垂直方向の傾き q、 切片 p、 s、 t、 および uを求めることができる。
ここで、 切片 p力 インデックス i, kが 0の点、 すなわち中心位置における 混合比ひ となっているので、 これを出力する。
式 (2 8 ) 乃至式 (3 6 ) に対応する説明において、 混合領域に含まれる画素 の画素値を Mとし、 背景領域に含まれる画素の画素値を Bとして説明したが、 注目している画素が、 カバードバックグラウンド領域に含まれる場合、 またはァ ンカバードバックグラウンド領域に含まれる場合のそれぞれに対して、 正規方程 式を立てる必要がある。
例えば、 図 2 2に示す、 フレーム ttnのカバードバックグラウンド領域に含ま れる画素の混合比 ひ を求める場合、 フレーム #nの画素の C04乃至 C08、 および フレーム #n-lの画素の画素値 P04乃至 P08が、 正規方程式に設定される。
図 2 3に示す、 フレーム #nのアンカバードバックグラウンド領域に含まれる 画素の混合比 ひ を求める場合、 フレーム #nの画素の C28乃至 C32、 およびフレ ーム ίίη+ lの画素の画素値 Ν28乃至 Ν32が、 正規方程式に設定される。
また、 例えば、 図 3 2に示す、 カバードバックグラウンド領域に含まれる画素 の混合比 ひ を算出するとき、 以下の式 (4 3 ) 乃至式 (5 1 ) が立てられる。 図 3 2において、 白丸は、 背景と見なす画素を示し、 黒丸は、 混合領域の画素と 見なす画素を示す。 混合比 ひ を算出する画素の画素値は、 Mc5である。 Mcl=(-1) - Bel · m+(-l) · Bel · q+Bcl · p+(_l) · s+ (- 1) · t+u (4 3
Mc2=(0) - Bc2 · m+(-l) - Bc2 - q+Bc2 · p+ (0) · s+ (- 1) - t+u (44
Mc3=(+1) · Bc3 · m+ (- 1) · Bc3 · q+Bc3 · p+(+l) · s+(_l) - t+u (4 5
Mc4= (- 1) - Bc4 - m+(0) - Bc4 · q+Bc4 · p+(_l) - s+(0) - t+u (4 6
Mc5=(0) · Bc5 - m+(0) · Bc5 - q+Bc5 · p+(0) - s+(0) - t+u (4 7
Mc6=(+1) · Bc6 · m+(0) - Bc6 · q+Bc6 · p+(+l) · s+(0) - t+u (4 8
Mc7=(-1) - Bc7 - m+(+l) - Bc7 - q+Bc7 · p+(-l) - s+(+l) - t+u (4 9
Mc8=(0) - Bc8 · m+(+l) ■ Bc8 · q+Bc8 - p+(0) · s+(+l) - t+u (5 0 Mc9=(+1) · Bc9 - m+(+l) · Bc9 · q+Bc9 · p+(+l) · s+(+l) - t+u (5 1 フレーム のカバードバックグラウンド領域に含まれる画素の混合比ひ を算 出するとき、 式 (4 3) 乃至式 (5 1) において、 フレーム ttnの画素に対応す る、 フレーム ίίη- 1 の画素の背景領域の画素の画素値 Bel 乃至 Bc9が使用される ( 図 3 2に示す、 アンカバードバックグラウンド領域に含まれる画素の混合比 ひ を算出するとき、 以下の式 (5 2) 乃至式 (6 0) が立てられる。 混合比 を算出する画素の画素値は、 Mu5である。
Mul=(-1) - Bui · m+(-l) - Bui ■ q+Bul - p+ (- 1) · s+ (- 1) - t+u (5 2 Mu2= (0) - Bu2 - m+ (- 1) · Bu2 - q+Bu2 · p+ (0) · s+ (-1) - t+u (5 3 Mu3=(+1) · Bu3 - m+(-l) - Bu3 · q+Bu3 · p+(+l) - s+(- 1) - t+u (5 4
Mu4=(_l) - Bu4 · m+(0) - Bu4 · q+Bu4 - p+ (- 1) - s+(0) - t+u (5 5 Mu5=(0) ■ Bu5 - m+ (0) · Bu5 · q+Bu5 - p+ (0) · s+(0) - t+u (5 6
Mu6=(+1) · Bu6 - m+(0) · Bu6 · q+Bu6 · p+(+l) - s+(0) - t+u (5 7
Mu7=(-1) - Bu7 - m+(+l) · Bu7 · q+Bu7 · p+ (- 1) - s+(+l) - t+u (5 8
Mu8=(0) · Bu8 · m+(+l) · Bu8 · q+Bu8 · p+ (0) · s+(+l) - t+u (5 9
Mu9=(+1) · Bu9 · m+(+l) - Bu9 · q+Bu9 · p+(+l) · s+(+l) - t+u (6 0 フレーム #nのアンカバードバックグラウンド領域に含まれる画素の混合比 Qi を算出するとき、 式 (5 2) 乃至式 (6 0) において、 フレーム #nの画素に対 応する、 フレーム #n+lの画素の背景領域の画素の画素値 Bui乃至 Bu9が使用さ れる。
混合比推定処理部 2 4 1および混合比推定処理部 2 4 2は、 混合比処理部 2 0 1と同様の構成を有するので、 その説明は省略する。
図 2 9に構成を示す混合比算出部 1 0 3による推定混合比の算出の処理は、 図 2 7のフローチャートを参照して説明した処理と同様なので、 その説明は省略す る。
次に、 推定混合比処理部 2 4 1が実行する、 図 2 7のステップ S 2 0 2に対応 する、 カバードバックグラウンド領域に対応するモデルによる混合比推定の処理 を図 3 3のフローチヤ一トを参照して説明する。
ステップ S 2 4 1において、 推定混合比処理部 2 4 1は、 入力された画像に含 まれる画素値を、 カバードバックグラウンド領域のモデルに対応する正規方程式 に設定する。
ステップ S 2 4 2において、 推定混合比処理部 2 4 1は、 対象となる画素につ いての設定が終了したか否かを判定し、 対象となる画素についての設定が終了し ていないと判定された場合、 ステップ S 2 4 1に戻り、 正規方程式への画素値の 設定の処理を繰り返す。
ステップ S 2 4 2において、 対象となる画素についての画素値の設定が終了し たと判定された場合、 ステップ S 2 4 3に進み、 推定混合比処理部 2 4 1は、 画 素値が設定された正規方程式を解くことにより、 推定混合比を演算して、 求めら れた推定混合比を出力する。 推定混合比処理部 2 4 1は、 推定混合比の算出に伴 レ、、 求められた前景の成分の和および推定混合比の傾きを混合比関係情報として 出力する。
このように、 推定混合比処理部 2 4 1は、 入力画像を基に、 推定混合比を演算 することができる。 推定混合比処理部 2 4 1は、 混合比関係情報として前景の成 分の和および推定混合比の傾きを出力する。
推定混合比処理部 2 4 2による、 アンカバードバックグラウンド領域に対応す るモデルによる混合比推定の処理は、 アンカバードバックグラウンド領域のモデ ルに対応する正規方程式を利用した、 図 3 3のフローチャートに示す処理と同様 なので、 その説明は省略する。
図 3 4は、 コンポーネント信号として入力される入力画像から混合比を推定す る、 混合比算出部 1 0 3のさらに他の構成を示すプロック図である。
この明細書において、 コンポーネントとは、 コンポーネント信号における、 輝 度信号および色差信号、 または R G B (Red-green-blue) 信号などの個別の信 号をいう。
以下の説明において、 コンポーネント 1は、 輝度値 Yとし、 コンポーネント 2は、 色差 Uとし、 コンポーネント 3は、 色差 Vとした例を基に説明する。 推定混合比処理部 2 4 1— 1は、 入力画像のコンポーネント 1を基に、 カバー ドバックグラウンド領域のモデルに対応する演算により、 画素毎に推定混合比を 算出して、 推定混合比の算出に伴い算出される混合比関係情報と共に、 推定混合 比を出力する。 推定混合比処理部 2 4 1— 1が出力する混合比関係情報は、 例え ば、 前景の成分の和、 および混合比の傾きなどからなる。
推定混合比処理部 2 4 2— 1は、 入力画像のコンポーネント 1を基に、 アンカ バードバックグラウンド領域のモデルに対応する演算により、 画素毎に推定混合 比を算出して、 推定混合比の算出に伴い算出される混合比関係情報と共に、 推定 混合比を出力する。 推定混合比処理部 2 4 2 - 1が出力する混合比関係情報は、 例えば、 前景の成分の和、 および混合比の傾きなどからなる。
推定混合比処理部 2 4 1— 2は、 入力画像のコンポーネント 2を基に、 カバー ドバックグラウンド領域のモデルに対応する演算により、 画素毎に推定混合比を 算出して、 推定混合比の算出に伴い算出される混合比関係情報と共に、 推定混合 比を出力する。
推定混合比処理部 2 4 2— 2は、 入力画像のコンポーネント 2を基に、 アンカ バードバックグラウンド領域のモデルに対応する演算により、 画素毎に推定混合 比を算出して、 推定混合比の算出に伴い算出される混合比関係情報と共に、 推定 混合比を出力する。 推定混合比処理部 2 4 1— 3は、 入力画像のコンポーネント 3を基に、 カバー ドバックグラウンド領域のモデルに対応する演算により、 画素毎に推定混合比を 算出して、 推定混合比の算出に伴い算出される混合比関係情報と共に、 推定混合 比を出力する。
推定混合比処理部 2 4 2— 3は、 入力画像のコンポーネント 3を基に、 アンカ バードバックグラウンド領域のモデルに対応する演算により、 画素毎に推定混合 比を算出して、 推定混合比の算出に伴い算出される混合比関係情報と共に、 推定 混合比を出力する。
このように、 図 3 4に構成を示す混合比算出部 1 0 3は、 コンポーネント信号 として入力される入力画像を基に、 各コンポーネント毎に、 カバードバックダラ ゥンド領域に対応するモデルによる推定混合比、 およびアンカバードバックダラ ゥンド領域に対応するモデルによる推定混合比を演算することができる。 混合比 算出部 1 0 3は、 各コンポーネント毎の、 カバードバックグラウンド領域に対応 するモデルによる推定混合比、 およびアンカバードバックグラウンド領域に対応 するモデルによる推定混合比に対応する、 前景の成分の和および推定混合比の傾 きからなる混合比関係情報を出力する。
なお、 混合比算出部 1 0 3は、 コンポーネント信号として入力される入力画像 から混合比を推定するとき、 推定混合比処理部 2 0 1および推定混合比処理部 2
0 2で説明した処理により、 各コンポーネント毎に、 カバードバックグラウンド 領域に対応するモデルによる推定混合比、 およびアンカバードバックグラウンド 領域に対応するモデルによる推定混合比を演算し、 推定混合比と共に、 対応する 混合比関係情報を出力するようにしてもよい。
また、 背景に対応するオブジェク トが静止しているとして説明したが、 背景領 域に対応する画像が動きを含んでいても上述した混合比を求める処理を適用する ことができる。 例えば、 背景領域に対応する画像が一様に動いているとき、 混合 比算出部 1 0 3は、 この動きに対応して画像全体をシフ トさせ、 背景に対応する オブジェク トが静止している場合と同様に処理する。 また、 背景領域に対応する 画像が局所毎に異なる動きを含んでいるとき、 混合比算出部 1 0 3は、 混合領域 に属する画素に対応する画素として、 動きに対応した画素を選択して、 上述の処 理を実行する。
次に、 領域特定部 1 0 4について説明する。
図 3 5は、 領域特定部 1 0 4の構成を示すブロック図である。 予測誤差演算部 3 0 1は、 カバードバックグラウンド領域に対応するモデルによる推定混合比、 およびカバードバックグラウンド領域に対応するモデルによる推定混合比に対応 する混合比関係情報を基に、 各画素に対応する誤差値 (推定混合比に対応する予 測誤差) を算出し、 算出した誤差値をアンカバードバックグラウンド領域判定部 3 0 3に供給する。
例えば、 混合比算出部 1 0 3が、 式 (1 1 ) 乃至式 (1 5 ) に最小自乗法を適 用して混合比を推定するとき、 予測誤差演算部 3 0 1は、 カバードバックグラウ ンド領域に対応するモデルによる推定混合比、 およびバードバックグラウンド領 域に対応するモデルによる推定混合比に対応する前景の成分の和である混合比関 係情報を基に、 式 (6 1 ) に対応する演算により、 誤差値 Sである最小自乗誤 差和を算出する。
S =∑{M - ( - B +∑ Fi/v) (61) 式 (6 1 ) において、 α は、 推定混合比を示し、 は、 混合比の算出に用いら
∑ Filv
れたフレームの数を示す。 i は、 混合比関係情報である前景の成分の和を 示す。
予測誤差演算部 3 0 2は、 アンカバードカバードバックグラウンド領域に対応 するモデルによる推定混合比、 およびアンカバードバックグラウンド領域に対応 するモデルによる推定混合比に対応する混合比関係情報を基に、 各画素に対応す る誤差値を算出し、 算出した誤差値をカバードバックグラウンド領域判定部 3 0 4に供給する。 なお、 予測誤差演算部 3 0 1および予測誤差演算部 3 0 2は、 例えば、 5画素 X 5画素からなるプロックなど複数の画素からなるプロック毎に、 各画素に対応 する誤差値を算出するようにしてもよい。
また、 予測誤差演算部 3 0 1および予測誤差演算部 3 0 2は、 tを予め定めて おいても良く、 または、 tを混合比関係情報として、 混合比算出部 1 0 3から取 得するようにしてもよい。
アンカバードバックグラウンド領域判定部 3 0 3は、 画素毎に、 予測誤差演算 部 3 0 1から供給された誤差値が、 予め記憶している閾値 Th以上であるか否か を判定し、 誤差値が閾値 Th以上であると判定された場合、 注目している画素が アンカバードバックグラウンド領域に属すると判定し、 注目している画素に対応 させてアンカバードバックグラウンド領域を示すフラグを設定する。 アンカバー ドバックグラウンド領域判定部 3 0 3は、 画素毎に設定された、 アンカバードバ ックグラウンド領域を示すフラグを合成部 3 0 6に供給する。
カバードバックグラウンド領域判定部 3 0 4は、 画素毎に、 予測誤差演算部 3 0 2から供給された誤差値が、 予め記憶している閾値 Th以上であるか否かを判 定し、 誤差値が閾値 Th以上であると判定された場合、 注目している画素がカバ 一ドバックグラウンド領域に属すると判定し、 注目している画素にカバードバッ クグラウンド領域を示すフラグを設定する。 カバードバックグラウンド領域判定 部 3 0 4は、 画素毎に設定された、 カバードバックグラウンド領域を示すフラグ を合成部 3 0 6に供給する。
前景背景領域判定部 3 0 5は、 入力画像を基に、 前景領域および背景領域を判 定する。
例えば、 前景背景領域判定部 3 0 5は、 注目しているフレーム ttnの注目して いる注目画素の画素値と、 フレーム #n- 1の注目画素に対応する画素の画素との 差分を基に、 注目画素について動き判定する。 前景背景領域判定部 3 0 5は、 注 目しているフレーム ttnの注目している注目画素の画素値と、 フレーム #n+ lの注 目画素に対応する画素の画素との差分を基に、 注目画素について動き判定する。 前景背景領域判定部 3 0 5は、 注目画素が、 フレーム #n- lからフレーム #ηに ついて動きと判定され、 フレーム からフレーム #n+ lについて動きと判定され たとき、 注目画素を前景領域に属すると判定する。
例えば、 前景背景領域判定部 3 0 5は、 注目画素が、 フレーム #n-lからフレ ーム について静止と判定され、 フレーム #n力 らフレーム #n+lについて静止と 判定されたとき、 注目画素を背景領域に属すると判定する。
前景背景領域判定部 3 0 5は、 画素毎に設定された、 前景領域を示すフラグ、 および背景領域を示すフラグを合成部 3 0 6に供給する。
合成部 3 0 6は、 アンカバードバックグラウンド領域判定部 3 0 3から供給さ れたアンカバードバックグラウンド領域を示すフラグ、 カバードバックグラウン ド領域判定部 3 0 4から供給されたカバードバックグラウンド領域を示すフラグ、 並びに前景背景領域判定部 3 0 5から供給された前景領域を示すフラグ、 および 背景領域を示すフラグを基に、 画素毎に、 アンカバードバックグラウンド領域、 カバードバックグラウンド領域、 前景領域、 および背景領域のいずれかを示す領 域情報を合成する。 合成部 3 0 6は、 合成した領域情報を混合比決定部 3 0 7に 供給すると共に、 領域情報を出力する。
混合比決定部 3 0 7は、 合成部 3 0 6から供給された領域情報を基に、 混合比 ひ を決定する。 より具体的には、 混合比決定部 3 0 7は、 対象となる画素が前 景領域に属する場合、 0を混合比 ひ に設定し、 対象となる画素が背景領域に属 する場合、 1を混合比 ひ に設定する。 混合比決定部 3 0 7は、 対象となる画素 がカバードバックグラウンド領域に属する場合、 カバードカバードバックダラゥ ンド領域に対応するモデルによる推定混合比を混合比ひ に設定し、 対象となる 画素がアンカバードバックグラウンド領域に属する場合、 アンカバードカバード バックグラウンド領域に対応するモデルによる推定混合比を混合比 ひ に設定す る。 混合比決定部 3 0 7は、 領域情報を基に決定した混合比 ひ を出力する。
図 3 6および図 3 7を参照して、 アンカバードバックグラウンド領域判定部 3 0 3の判定の処理を説明する。 図 3 6に示すように、 背景に対応するオブジェク トが静止しているので、 注目 しているフレーム ίίηの背景領域に属する注目画素の画素値は、 フレーム ίίηの次 のフレーム #η+ 1 の注目画素に対応する画素の画素値と等しい。 図 3 6において、 Wは、 背景領域を示す。 同様に、 背景に対応するオブジェク トが静止しているの で、 注目画素を元に動きベク トルで示される、 フレーム #π+ 1 の画素の画素値は, フレーム ttn+2の対応する画素の画素値と等しい。
これにより、 背景領域に属する画素に対応する、 カバードカバ一ドバックダラ ゥンド領域に対応するモデルによる推定混合比は、 ほぼ 1となり、 前景の成分の 和は、 〖まぼ 0となる。
従って、 式 (6 1 ) に対応する演算により、 算出される誤差値 Sは、 ほぼ 0 となる。
図 3 6において、 Xで示す前景領域に属する注目画素において、 動き補償して いるので、 注目しているフレーム #nの注目画素の画素値は、 注目画素を元に動 きベク トルで示される、 フレーム #n+lの画素の画素値と等しい。 また、 前景の オブジェク トについて、 空間方向の相関が強いので、 前景の成分の値は、 ほぼ等 しい。
これにより、 厳密な意味では、 物理的なモデルとの対応は成り立っていないが、 前景領域に属する注目画素において、 最小自乗法により算出された推定混合比お よび前景の成分の和の最小自乗誤差和は、 比較的小さな値となる。
図 3 6において、 Yで示すカバードバックグラウンド領域について、 最小自乗 法により算出された推定混合比および前景の成分の和の最小自乗誤差和は、 当然 に、 ほぼ 0となる。
これに対して、 図 3 7に示すように、 図中において Zで示すアンカバードバッ クグラウンド領域に属する、 注目しているフレーム の注目画素の画素値に含 まれる前景の成分は、 フレーム ttnの次のフレーム lln+ 1の注目画素に対応する画 素の画素値に含まれる前景の成分と異なる。 同様に、 注目画素を元に動きべク ト ルで示される、 フレーム #n+ lの画素の画素値に含まれる前景の成分は、 フレー ム ίίη+2の対応する画素の画素値に含まれる前景の成分と異なる。
最小自乗法により、 推定混合比および前景の成分の和を未知の変数として、 解 を算出したとき、 式に設定された画素値に含まれる前景の成分の和が変化してい るので、 前景の成分の和は算出できない。
従って、 カバードカバードバックグラウンド領域に対応するモデルを基に、 最 小自乗法により算出された推定混合比および前景の成分の和の最小自乗誤差和は, 注目画素がアンカバードバックグラウンド領域に属するとき、 大きな値となる。 このように、 アンカバードバックグラウンド領域判定部 3 0 3は、 カバードカ バードバックグラウンド領域に対応するモデルを基に、 最小自乗法により算出さ れた推定混合比および前景の成分の和についての誤差値 Sが閾値 Th以上である か否かの判定により、 対応する画素がアンカバードバックグラウンド領域に属す るか否かを判定することができる。
同様に、 カバードバックグラウンド領域判定部 3 0 4は、 アンカバードカバー ドバックグラウンド領域に対応するモデルを基に、 最小自乗法により算出された 推定混合比および前景の成分の和についての誤差値 Sが閾値 Th以上であるか否 かの判定により、 対応する画素がカバードバックグラウンド領域に属するか否か を判定することができる。
図 3 8乃至図 4 3は、 入力画像、 および入力画像に対応する領域特定部 1 0 4 による領域の判定の結果の例を示す図である。
図 3 8は、 入力画像を示す図である。 図 3 8の入力画像において、 前景のォブ ジェク トは、 図中の左側から右側に移動している。
図 3 9に示す画像は、 図 3 8に示す入力画像について、 混合比算出部 1 0 3に より、 7フレームを用いて算出された推定混合比および前景の成分の和を基に、 領域特定部 1 0 4が、 1つの画素毎に、 閾値 Thを 7 0として判定した結果を示 す図である。
図 4 0に示す画像は、 図 3 8に示す入力画像について、 混合比算出部 1 0 3に より、 3フレームを用いて算出された推定混合比および前景の成分の和を基に、 領域特定部 1 0 4が、 5画素 X 5画素からなるブロック毎に、 ブロックについて 混合比を一定と仮定して、 プロックについての誤差値 Sの和の閾値 Thを 7 5 0 とし、 ブロック内の 1つの画素の誤差値 Sの閾値 Thを 1 0として判定した結果 を示す図である。
図 4 1は、 入力画像を示す図である。 図 4 1の入力画像において、 前景のォブ ジェク トは、 図中の左側から右側に移動している。
図 4 2に示す画像は、 図 4 1に示す入力画像について、 混合比算出部 1 0 3に より、 7フレームを用いて算出された推定混合比および前景の成分の和を基に、 領域特定部 1 0 4が、 1つの画素毎に、 閾値 Thを 7 0として判定した結果を示 す図である。
図 4 3に示す画像は、 図 4 1に示す入力画像について、 混合比算出部 1 0 3に より、 3フレームを用いて算出された推定混合比および前景の成分の和を基に、 領域特定部 1 0 4が、 5画素 X 5画素からなるブロック毎に、 ブロックについて 混合比を一定と仮定して、 ブロックについての誤差値 Sの和の閾値 Thを 7 5 0 とし、 ブロック内の 1つの画素の誤差値 Sの閾値 Thを 1 0として判定した結果 を示す図である。
図 3 9乃至図 4 3において、 カバードバックグラウンド領域は、 前景領域に対 して、 前景のオブジェク トの進行方向の前端部に位置し、 アンカバードバックグ ラウンド領域は、 前景領域に対して、 前景のオブジェク トの進行方向の後端部に 位置する。
図 3 8乃至図 4 3に示すように、 領域特定部 1 0 4は、 ほぼ正確に、 領域を判 定することができる。
次に、 混合比算出部 1 0 3が、 式 (2 8 ) 乃至式 (3 6 ) に最小自乗法を適用 して混合比を推定し、 推定混合比と共に、 推定混合比の傾きを示すデータを混合 比関係情報として出力するときの、 領域特定部 1 0 4の処理について説明する。 注目画素の画素値 Mは、 式 (2 7 ) より、 式 (6 2 ) で表される。
M= (jm+kq+p) · B+j - s+k - t+u ( 6 2 ) 式 (6 2 ) において、 jは、 注目している画素の位置を 0とした水平方向のイン デックスであり、 kは、 垂直方向のインデックスである。 mは、 混合比 の面 の水平方向の傾きであり、 q は、 混合比 ひ の面の垂直方向の傾きである。 p は、 混合比ひ の面の切片である。 s, t、 および uは、 式 (2 3 ) 乃至式 (2 5 ) に 示すように、 m, q、 および Pと前景の成分との関係を示す変数である。
予測誤差演算部 3 0 1は、 カバードバックグラウンド領域に対応するモデルに よる推定混合比、 およびカバードバックグラウンド領域に対応するモデルによる 推定混合比に対応する、 j,k,m,q,p, S,t、 および u を含む混合比関係情報を基に、 式 (6 3 ) に対応する演算により、 誤差値 Sである最小自乗誤差和を算出する ことができる。
S =∑{M - [(jm +kq+p) 'B +j- s +k * t + u ] (63) 予測誤差演算部 3 0 2は、 アンカバードカバードバックグラウンド領域に対応 するモデルによる推定混合比、 およびアンカバードバックダラゥンド領域に対応 するモデルによる推定混合比に対応する混合比関係情報を基に、 式 (6 3 ) に対 応する演算により、 各画素に対応する誤差値を算出し、 算出した誤差値をカバー ドバックグラウンド領域判定部 3 0 4に供給する。
アンカバードバックグラウンド領域判定部 3 0 3は、 画素毎に、 予測誤差演算 部 3 0 1から供給された誤差値が、 予め記憶している.閾値 Th以上であるか否か を判定し、 誤差値が閾値 Th以上であると判定された場合、 注目している画素が アンカバードバックグラウンド領域に属すると判定し、 注目している画素に対応 させてアンカバードバックグラウンド領域を示すフラグを設定する。 アンカバー ドバックグラウンド領域判定部 3 0 3は、 画素毎に設定された、 アンカバ一ドバ ックグラウンド領域を示すフラグを合成部 3 0 6に供給する。
カバ一ドバックグラウンド領域判定部 3 0 4は、 画素毎に、 予測誤差演算部 3 0 2から供給された誤差値が、 予め記憶している閾値 Th以上であるか否かを判 定し、 誤差値が閾値 Th以上であると判定された場合、 注目している画素がカバ 一ドバックグラウンド領域に属すると判定し、 注目している画素にカバードバッ クグラウンド領域を示すフラグを設定する。 カバードバックグラウンド領域判定 部 3 0 4は、 画素毎に設定された、 カバードバックグラウンド領域を示すフラグ を合成部 3 0 6に供給する。
前景背景領域判定部 3 0 5は、 入力画像を基に、 前景領域および背景領域を判 定し、 画素毎に設定された、 前景領域を示すフラグ、 および背景領域を示すフラ グを合成部 3 0 6に供給する。
合成部 3 0 6は、 アンカバードバックグラウンド領域判定部 3 0 3から供給さ れたアンカバードバックグラウンド領域を示すフラグ、 カバードバックグラウン ド領域判定部 3 0 4から供給されたカバードバックグラウンド領域を示すフラグ 並びに前景背景領域判定部 3 0 5から供給された前景領域を示すフラグ、 および 背景領域を示すフラグを基に、 画素毎に、 アンカバードバックグラウンド領域、 カバードバックグラウンド領域、 前景領域、 および背景領域のいずれか 1つを示 す領域情報を合成する。 合成部 3 0 6は、 合成した領域情報を混合比決定部 3 0 7に供給すると共に、 領域情報を出力する。
混合比決定部 3 0 7は、 合成部 3 0 6から供給された領域情報を基に、 混合比 a を決定する。
このように、 領域特定部 1 0 4は、 混合比算出部 1 0 3の混合比の推定の方法 に対応して、 推定混合比および混合比関係情報を基に、 領域情報を生成すること ができる。
図 4 4は、 コンポーネント信号毎に推定された混合比およびこれらに対応する 混合比関係情報、 並びにコンポーネント信号として入力される入力画像を基に、 領域を特定する領域特定部 1 0 4の構成を示すプロック図である。 図 3 5に示す 場合と同様の部分には同一の番号を付してあり、 その説明は省略する。
予測誤差演算部 3 0 1— 1は、 入力画像のコンポーネント 1から算出された、 カバ一ドバックグラウンド領域に対応するモデルによる推定混合比、 およびカバ 一ドバックグラウンド領域に対応するモデルによる推定混合比に対応する混合比 関係情報を基に、 各画素に対応する誤差値を算出し、 算出した誤差値を加算部 3 2 1に供給する。
予測誤差演算部 3 0 1 _ 2は、 入力画像のコンポーネント 2から算出された、 カバードバックグラウンド領域に対応するモデルによる推定混合比、 およびカバ 一ドバックグラウンド領域に対応するモデルによる推定混合比に対応する混合比 関係情報を基に、 各画素に対応する誤差値を算出し、 算出した誤差値を加算部 3 2 1に供給する。
予測誤差演算部 3 0 1— 3は、 入力画像のコンポーネント 3から算出された、 カバードバックグラウンド領域に対応するモデルによる推定混合比、 およびカバ ードバックグラウンド領域に対応するモデルによる推定混合比に対応する混合比 関係情報を基に、 各画素に対応する誤差値を算出し、 算出した誤差値を加算部 3 2 1に供給する。
予測誤差演算部 3 0 2 _ 1は、 入力画像のコンポーネント 1から算出された、 アンカバードバックグラウンド領域に対応するモデルによる推定混合比、 および アンカバ一ドバックグラウンド領域に対応するモデルによる推定混合比に対応す る混合比関係情報を基に、 各画素に対応する誤差値を算出し、 算出した誤差値を 加算部 3 2 2に供給する。
予測誤差演算部 3 0 2— 2は、 入力画像のコンポーネント 2から算出された、 アンカバードバックグラウンド領域に対応するモデルによる推定混合比、 および アンカバードバックグラウンド領域に対応するモデルによる推定混合比に対応す る混合比関係情報を基に、 各画素に対応する誤差値を算出し、 算出した誤差値を 加算部 3 2 2に供給する。
予測誤差演算部 3 0 2— 3は、 入力画像のコンポーネント 3から算出された、 アンカバードバックグラウンド領域に対応するモデルによる推定混合比、 および アンカバードバックグラウンド領域に対応するモデルによる推定混合比に対応す る混合比関係情報を基に、 各画素に対応する誤差値を算出し、 算出した誤差値を 加算部 3 2 2に供給する。 加算部 3 2 1は、 予測誤差演算部 3 0 1 - 1から供給された誤差値、 予測誤差 演算部 3 0 1 一 2から供給された誤差値、 および予測誤差演算部 3 0 1 _ 3から 供給された誤差値を加算し、 加算した誤差値をアンカバ一ドバックグラウンド領 域判定部 3 0 3に供給する。
加算部 3 2 2は、 予測誤差演算部 3 0 2— 1から供給された誤差値、 予測誤差 演算部 3 0 2— 2から供給された誤差値、 および予測誤差演算部 3 0 2— 3から 供給された誤差値を加算し、 加算した誤差値をカバードバックグラウンド領域判 定部 3 0 4に供給する。
加算部 3 2 3は、 入力画像のコンポーネント 1、 入力画像のコンポーネント 2、 および入力画像のコンポーネント 3を加算し、 加算したコンポーネント 1、 コン ポーネント 2、 およびコンポーネント 3を前景背景領域判定部 3 0 5に供給する c アンカバードバックグラウンド領域判定部 3 0 3は、 画素毎に、 加算部 3 2 1 から供給された誤差値が、 予め記憶している閾値 Th 以上であるか否かを判定し. 誤差値が閾値 Th以上であると判定された場合、 注目している画素がアンカバー ドバックグラウンド領域に属すると判定し、 注目している画素に対応させてアン カバードバックグラウンド領域を示すフラグを設定する。 アンカバードバックグ ラウンド領域判定部 3 0 3は、 画素毎に設定された、 アンカバードバックグラウ ンド領域を示すフラグを合成部 3 0 6に供給する。
カバードバックグラウンド領域判定部 3 0 4は、 画素毎に、 加算部 3 2 2から 供給された誤差値が、 予め記憶している閾値 Th以上であるか否かを判定し、 誤 差値が閾値 Th以上であると判定された場合、 注目している画素がカバードバッ クグラウンド領域に属すると判定し、 注目している画素にカバードバックダラゥ ンド領域を示すフラグを設定する。 カバードバックグラウンド領域判定部 3 0 4 は、 画素毎に設定された、 カバードバックグラウンド領域を示すフラグを合成部 3 0 6に供給する。
前景背景領域判定部 3 0 5は、 加算されたコンポーネント 1、 コンポーネント 2、 およびコンポーネント 3を基に、 前景領域および背景領域を判定し、 画素毎 に設定された、 前景領域を示すフラグ、 および背景領域を示すフラグを合成部 3 0 6に供給する。
合成部 3 0 6は、 アンカバードバックグラウンド領域判定部 3 0 3から供給さ れたアンカバードバックグラウンド領域を示すフラグ、 力バードバックグラウン ド領域判定部 3 0 4から供給されたカバードバックグラウンド領域を示すフラグ. 並びに前景背景領域判定部 3 0 5から供給された前景領域を示すフラグ、 および 背景領域を示すフラグを基に、 画素毎に、 アンカバードバックグラウンド領域、 カバ—ドバックグラウンド領域、 前景領域、 および背景領域のいずれかを示す領 域情報を合成する。 合成部 3 0 6は、 合成した領域情報を混合比決定部 3 0 7に 供給すると共に、 領域情報を出力する。
このように、 図 4 4に示す領域特定部 1 0 4は、 コンポーネント信号毎に推定 された混合比およびこれらに対応する混合比関係情報、 並びにコンポーネント信 号として入力される入力画像を基に、 領域を特定することができる。 図 4 4に構 成を示す領域特定部 1 0 4は、 図 3 5に構成を示す領域特定部 1 0 4に比較して、 より正確に、 領域を特定することができる。
図 4 5は、 コンポーネント信号毎に推定された混合比およびこれらに対応する 混合比関係情報、 並びにコンポーネント信号として入力される入力画像を基に、 領域を特定する領域特定部 1 0 4の他の構成を示すプロック図である。
図 4 4に示す場合と同様の部分には、 同一の番号を付してあり、 その説明は省 略する。
予測誤差演算部 3 0 1— 1は、 入力画像のコンポーネント 1から算出された、 カバードバックグラウンド領域に対応するモデルによる推定混合比、 およびカバ 一ドバックグラウンド領域に対応するモデルによる推定混合比に対応する混合比 関係情報を基に、 各画素に対応する誤差値を算出し、 算出した誤差値をアンカバ 一ドバックグラウンド領域判定部 3 0 3— 1に供給する。
予測誤差演算部 3 0 1 _ 2は、 入力画像のコンポーネント 2から算出された、 カバードバックグラウンド領域に対応するモデルによる推定混合比、 およびカバ 一ドバックグラウンド領域に対応するモデルによる推定混合比に対応する混合比 関係情報を基に、 各画素に対応する誤差値を算出し、 算出した誤差値をアンカバ 一ドバックグラウンド領域判定部 3 0 3— 2に供給する。
予測誤差演算部 3 0 1— 3は、 入力画像のコンポーネント 3から算出された、 カバードバックグラウンド領域に対応するモデルによる推定混合比、 およびカバ 一ドバックグラウンド領域に対応するモデルによる推定混合比に対応する混合比 関係情報を基に、 各画素に対応する誤差値を算出し、 算出した誤差値をアンカバ 一ドバックグラウンド領域判定部 3 0 3— 3に供給する。
予測誤差演算部 3 0 2— 1は、 入力画像のコンポーネント 1から算出された、 アンカバードバックグラウンド領域に対応するモデルによる推定混合比、 および アンカバードバックグラウンド領域に対応するモデルによる推定混合比に対応す る混合比関係情報を基に、 各画素に対応する誤差値を算出し、 算出した誤差値を カバードバックグラウンド領域判定部 3 0 4 - 1に供給する。
予測誤差演算部 3 0 2— 2は、 入力画像のコンポーネント 2から算出された、 アンカバードバックグラウンド領域に対応するモデルによる推定混合比、 および アンカバードバックグラウンド領域に対応するモデルによる推定混合比に対応す る混合比関係情報を基に、 各画素に対応する誤差値を算出し、 算出した誤差値を カバードバックグラウンド領域判定部 3 0 4— 2に供給する。
予測誤差演算部 3 0 2— 3は、 入力画像のコンポーネント 3から算出された、 アンカバードバックグラウンド領域に対応するモデルによる推定混合比、 および アンカバードバックグラウンド領域に対応するモデルによる推定混合比に対応す る混合比関係情報を基に、 各画素に対応する誤差値を算出し、 算出した誤差値を カバードバックグラウンド領域判定部 3 0 4 _ 3に供給する。
ァンカバードバックグラウンド領域判定部 3 0 3— 1は、 画素毎に、 予測誤差 演算部 3 0 1— 1から供給された誤差値が、 予め記憶している閾値 Th以上であ るか否かを判定し、 誤差値が閾値 Th以上であると判定された場合、 注目してい る画素がアンカバードバックグラウンド領域に属すると判定し、 注目している画 素に対応させてアンカバードバックグラウンド領域を示すフラグを設定する。 ァ ンカバードバックグラウンド領域判定部 3 0 3— 1は、 画素毎に設定された、 了 ンカバードバックグラウンド領域を示すフラグを論理和演算部 3 4 1に供給する < アンカバードバックグラウンド領域判定部 3 0 3— 2は、 画素毎に、 予測誤差 演算部 3 0 1— 2から供給された誤差値が、 予め記憶している閾値 Th以上であ るか否かを判定し、 誤差値が閾値 Th以上であると判定された場合、 注目してい る画素がアンカバードバックグラウンド領域に属すると判定し、 注目している画 素に対応させてアンカバードバックグラウンド領域を示すフラグを設定する。 ァ ンカバードバックグラウンド領域判定部 3 0 3— 2は、 画素毎に設定された、 ァ ンカバードバックグラウンド領域を示すフラグを論理和演算部 3 4 1に供給する ( アンカバードバックグラウンド領域判定部 3 0 3— 3は、 画素毎に、 予測誤差 演算部 3 0 1 _ 3から供給された誤差値が、 予め記憶している閾値 Th以上であ るか否かを判定し、 誤差値が閾値 Th以上であると判定された場合、 注目してい る画素がアンカバードバックグラウンド領域に属すると判定し、 注目している画 素に対応させてアンカバードバックグラウンド領域を示すフラグを設定する。 ァ ンカバードバックグラウンド領域判定部 3 0 3— 3は、 画素毎に設定された、 了 ンカバードバックグラウンド領域を示すフラグを論理和演算部 3 4 1に供給する, カバードバックグラウンド領域判定部 3 0 4— 1は、 画素毎に、 予測誤差演算 部 3 0 2— 1から供給された誤差値が、 予め記憶している閾値 Th以上であるか 否かを判定し、 誤差値が閾値 Th以上であると判定された場合、 注目している画 素がカバードバックグラウンド領域に属すると判定し、 注目している画素に対応 させてカバードバックグラウンド領域を示すフラグを設定する。 カバードバック グラウンド領域判定部 3 0 4— 1は、 画素毎に設定された、 カバードバックダラ ゥンド領域を示すフラグを論理和演算部 3 4 2に供給する。
カバードバックグラウンド領域判定部 3 0 4— 2は、 画素毎に、 予測誤差演算 部 3 0 2— 2から供給された誤差値が、 予め記憶している閾値 Th以上であるか 否かを判定し、 誤差値が閾値 Th以上であると判定された場合、 注目している画 素がカバードバックグラウンド領域に属すると判定し、 注目している画素に対応 させてカバードバックグラウンド領域を示すフラグを設定する。 カバードノ ック グラウンド領域判定部 3 0 4— 2は、 画素毎に設定された、 カバードバックダラ ゥンド領域を示すフラグを論理和演算部 3 4 2に供給する。
カバードバックグラウンド領域判定部 3 0 4 _ 3は、 画素毎に、 予測誤差演算 部 3 0 2— 3から供給された誤差値が、 予め記憶している閾値 Th以上であるか 否かを判定し、 誤差値が閾値 Th以上であると判定された場合、 注目している画 素がカバードバックグラウンド領域に属すると判定し、 注目している画素に対応 させてカバードバックグラウンド領域を示すフラグを設定する。 カバードノくック グラウンド領域判定部 3 0 4— 3は、 画素毎に設定された、 カバードバックグラ ゥンド領域を示すフラグを論理和演算部 3 4 2に供給する。
前景背景領域判定部 3 0 5— 1は、 コンポーネント 1を基に、 前景領域および 背景領域を判定し、 画素毎に設定された、 前景領域を示すフラグ、 および背景領 域を示すフラグを論理和演算部 3 4 3に供給する。
前景背景領域判定部 3 0 5— 2は、 コンポーネント 2を基に、 前景領域および 背景領域を判定し、 画素毎に設定された、 前景領域を示すフラグ、 および背景領 域を示すフラグを論理和演算部 3 4 3に供給する。
前景背景領域判定部 3 0 5— 3は、 コンポーネント 3を基に、 前景領域および 背景領域を判定し、 画素毎に設定された、 前景領域を示すフラグ、 および背景領 域を示すフラグを論理和演算部 3 4 3に供給する。
論理和演算部 3 4 1は、 アンカバードバックグラウンド領域判定部 3 0 3 - 1 から供給されたアンカバードバックグラウンド領域を示すフラグ、 アンカバード バックグラウンド領域判定部 3 0 3— 2から供給されたアンカバードバックダラ ゥンド領域を示すフラグ、 およびァンカバードバックグラウンド領域判定部 3 0 3— 3から供給されたアンカバードバックグラウンド領域を示すフラグを基に、 ァンカバードバックグラウンド領域判定部 3 0 3— 1から供給されたフラグが示 すアンカバードバックグラウンド領域、 アンカバードバックグラウンド領域判定 部 3 0 3— 2から供給されたフラグが示すァンカバードバックグラウンド領域、 およびァンカバードバックグラウンド領域判定部 3 0 3— 3から供給されたフラ グが示すアンカバードバックグラウンド領域の論理和を演算して、 論理和により 演算されたアンカバードバックグラウンド領域を示すフラグを生成する。 論理和 演算部 3 4 1は、 生成したアンカバードバックグラウンド領域を示すフラグを合 成部 3 0 6に供給する。
論理和演算部 3 4 2は、 カバードバックグラウンド領域判定部 3 0 4— 1から 供給されたカバードバックグラウンド領域を示すフラグ、 カバードバックグラウ ンド領域判定部 3 0 4 - 2から供給されたカバードバックグラウンド領域を示す フラグ、 およびカバードバックグラウンド領域判定部 3 0 4— 3から供給された カバードバックグラウンド領域を示すフラグを基に、 カバードバックグラウンド 領域判定部 3 0 4一 1から供給されたフラグが示すカバードバックグラウンド領 域、 カバードバックグラウンド領域判定部 3 0 4一 2から供給されたフラグが示 すカバードバックグラウンド領域、 および力バードバックグラウンド領域判定部 3 0 4— 3から供給されたフラグが示すカバードバックグラウンド領域の論理和 を演算して、 論理和により演算されたカバードバックグラウンド領域を示すフラ グを生成する。 論理和演算部 3 4 2は、 生成したカバードバックグラウンド領域 を示すフラグを合成部 3 0 6に供給する。
論理和演算部 3 4 3は、 前景背景領域判定部 3 0 5 - 1から供給された前景領 域を示すフラグ、 前景背景領域判定部 3 0 5— 2から供給された前景領域を示す フラグ、 および前景背景領域判定部 3 0 5— 3から供給された前景領域を示すフ ラグを基に、 前景背景領域判定部 3 0 5— 1から供給されたフラグが示す前景領 域、 前景背景領域判定部 3 0 5— 2から供給されたフラグが示す前景領域、 およ び前景背景領域判定部 3 0 5— 3から供給されたフラグが示す前景領域の論理和 を演算して、 論理和により演算された前景領域を示すフラグを生成する。 論理和 演算部 3 4 3は、 生成した前景領域を示すフラグを合成部 3 0 6に供給する。 論理和演算部 3 4 3は、 前景背景領域判定部 3 0 5— 1から供給された背景領 域を示すフラグ、 前景背景領域判定部 3 0 5— 2から供給された背景領域を示す フラグ、 および前景背景領域判定部 3 0 5— 3から供給された背景領域を示すフ ラグを基に、 前景背景領域判定部 3 0 5— 1から供給されたフラグが示す背景領 域、 前景背景領域判定部 3 0 5— 2から供給されたフラグが示す背景領域、 およ び前景背景領域判定部 3 0 5— 3から供給されたフラグが示す背景領域の論理和 を演算して、 論理和により演算された背景領域を示すフラグを生成する。 論理和 演算部 3 4 3は、 生成した背景領域を示すフラグを合成部 3 0 6に供給する。 合成部 3 0 6は、 論理和演算部 3 4 1から供給されたアンカバードバックダラ ゥンド領域を示すフラグ、 論理和演算部 3 4 2から供給されたカバードバックグ ラウンド領域を示すフラグ、 並びに論理和演算部 3 4 3から供給された前景領域 を示すフラグ、 および背景領域を示すフラグを基に、 画素毎に、 アンカバードバ ックグラウンド領域、 カバードバックグラウンド領域、 前景領域、 および背景領 域のいずれかを示す領域情報を合成する。 合成部 3 0 6は、 合成した領域情報を 出力する。
図 4 5に構成を示す領域特定部 1 0 4は、 前景領域、 背景領域、 カバードバッ クグラウンド領域、 およびアンカバードバックグラウンド領域の各領域を漏らさ ず特定した領域情報を出力することができる。
図 4 6は、 コンポーネント信号毎に推定された混合比およびこれらに対応する 混合比関係情報、 並びにコンポーネント信号として入力される入力画像を基に、 領域を特定する領域特定部 1 0 4のさらに他の構成を示すブロック図である。 図 4 5に示す場合と同様の部分には、 同一の番号を付してあり、 その説明は省 略する。
論理積演算部 3 6 1は、 アンカバードバックグラウンド領域判定部 3 0 3— 1 から供給されたアンカバードバックグラウンド領域を示すフラグ、 アンカバード バックグラウンド領域判定部 3 0 3— 2から供給されたアンカバードバックダラ ゥンド領域を示すフラグ、 およびアンカバードバックグラウンド領域判定部 3 0 3 _ 3カゝら供給されたアンカバ一ドバックグラウンド領域を示すフラグを基に、 アンカバードバックグラウンド領域判定部 3 0 3 - 1から供給されたフラグが示 すァンカバードバックグラウンド領域、 ァンカバードバックグラウンド領域判定 部 3 0 3— 2から供給されたフラグが示すアンカバードバックグラウンド領域、 およびアンカバードバックグラウンド領域判定部 3 0 3 - 3から供給されたフラ グが示すアンカバードバックグラウンド領域の論理積を演算して、 論理積により 演算されたアンカバードバックグラウンド領域を示すフラグを生成する。 論理積 演算部 3 6 1は、 生成したアンカバードバックグラウンド領域を示すフラグを合 成部 3 0 6に供給する。
論理積演算部 3 6 2は、 カバードバックグラウンド領域判定部 3 0 4— 1から 供給されたカバードバックグラウンド領域を示すフラグ、 カバードバックグラウ ンド領域判定部 3 0 4 _ 2から供給されたカバードバックグラウンド領域を示す フラグ、 およびカバードバックグラウンド領域判定部 3 0 4— 3から供給された カバードバックグラウンド領域を示すフラグを基に、 カバードバックグラウンド 領域判定部 3 0 4— 1から供給されたフラグが示すカバードバックグラウンド領 域、 カバードバックグラウンド領域判定部 3 0 4— 2から供給されたフラグが示 すカバードバックグラウンド領域、 および力バードバックグラウンド領域判定部 3 0 4 _ 3から供給されたフラグが示すカバードバックグラウンド領域の論理積 を演算して、 論理積により演算されたカバードバックグラウンド領域を示すフラ グを生成する。 論理積演算部 3 6 2は、 生成したカバードバックグラウンド領域 を示すフラグを合成部 3 0 6に供給する。
論理積演算部 3 6 3は、 前景背景領域判定部 3 0 5— 1から供給された前景領 域を示すフラグ、 前景背景領域判定部 3 0 5— 2から供給された前景領域を示す フラグ、 および前景背景領域判定部 3 0 5— 3から供給された前景領域を示すフ ラグを基に、 前景背景領域判定部 3 0 5 — 1から供給されたフラグが示す前景領 域、 前景背景領域判定部 3 0 5— 2から供給されたフラグが示す前景領域、 およ び前景背景領域判定部 3 0 5— 3から供給されたフラグが示す前景領域の論理積 を演算して、 論理積により演算された前景領域を示すフラグを生成する。 論理積 演算部 3 6 3は、 生成した前景領域を示すフラグを合成部 3 0 6に供給する。 論理積演算部 3 6 3は、 前景背景領域判定部 3 0 5一 1から供給された背景領 域を示すフラグ、 前景背景領域判定部 3 0 5— 2から供給された背景領域を示す フラグ、 および前景背景領域判定部 3 0 5— 3から供給された背景領域を示すフ ラグを基に、 前景背景領域判定部 3 0 5— 1から供給されたフラグが示す背景領 域、 前景背景領域判定部 3 0 5— 2から供給されたフラグが示す背景領域、 およ び前景背景領域判定部 3 0 5— 3から供給されたフラグが示す背景領域の論理積 を演算して、 論理積により演算された背景領域を示すフラグを生成する。 論理積 演算部 3 6 3は、 生成した背景領域を示すフラグを合成部 3 0 6に供給する。 合成部 3 0 6は、 論理積演算部 3 6 1から供給されたアンカバードバックダラ ゥンド領域を示すフラグ、 論理積演算部 3 6 2から供給されたカバードバックグ ラウンド領域を示すフラグ、 並びに論理積演算部 3 6 3から供給された前景領域 を示すフラグ、 および背景領域を示すフラグを基に、 画素毎に、 アンカバードバ ックグラウンド領域、 カバードバックグラウンド領域、 前景領域、 および背景領 域のいずれかを示す領域情報を合成する。 合成部 3 0 6は、 合成した領域情報を 出力する。
図 4 6に構成を示す領域特定部 1 0 4は、 エラーのより少ない領域情報を出力 することができる。
図 4 7のフローチヤ一トを参照して、 領域特定部 1 0 4による、 領域特定の処 理を説明する。 ステップ S 3 0 1において、 領域特定部 1 0 4は、 誤差値を基に 画素毎に、 カバードバックグラウンド領域の特定の処理を実行する。 カバードバ ックグラウンド領域の特定の処理の詳細は、 後述する。
ステップ S 3 0 2において、 領域特定部 1 0 4は、 誤差値を基に、 画素毎に、 アンカバードバックグラウンド領域の特定の処理を実行する。 アンカバードバッ クグラウンド領域の特定の処理の詳細は、 後述する。
ステップ S 3 0 3において、 前景背景領域判定部 3 0 5は、 入力画像を基に、 画素毎に、 前景領域および背景領域を特定し、 処理は、 終了する。 図 4 8のフローチャートを参照して、 ステップ S 3 0 1に対応する、 カバード バックグラウンド領域の特定の処理を説明する。
ステップ S 3 2 1において、 予測誤差演算部 3 0 2は、 アンカバードバックグ ラウンド領域に対応するモデルによる誤差値を計算する。 予測誤差演算部 3 0 2 は、 計算した誤差値をカバードバックグラウンド領域判定部 3 0 4に供給する。 ステップ S 3 2 2において、 カバードバックグラウンド領域判定部 3 0 4は、 予測誤差演算部 3 0 2から供給された誤差値が、 閾値 Th以上であるか否かを判 定し、 誤差値が閾値 Th 以上であると判定された場合、 ステップ S 3 2 3に進み、 誤差値に対応する画素に、 カバ一ドバックグラウンド領域を示すフラグを設定し- 手続きは、 ステップ S 3 2 4に進む。
ステップ S 3 2 2において、 誤差値が閾値 Th以上でないと判定された場合、 カバードバックグラウンド領域ではないので、 ステップ S 3 2 3の処理は、 スキ ップされ、 手続きは、 ステップ S 3 2 4に進む。
ステップ S 3 2 4において、 領域特定部 1 0 4は、 画面全体について処理をし たか否かを判定し、 画面全体について処理をしていないと判定された場合、 ステ ップ S 3 2 1に戻り、 カバードバックグラウンド領域の判定の処理を繰り返す。 ステップ S 3 2 4において、 画面全体について処理をしたと判定された場合、 ステップ S 3 2 5に進み、 カバードバックグラウンド領域判定部 3 0 4は、 カバ 一ドバックグラウンド領域を示すフラグを出力して、 処理は終了する。
図 4 9のフローチャートを参照して、 ステップ S 3 0 2に対応する、 アンカバ 一ドバックグラウンド領域の特定の処理を説明する。
ステップ S 3 4 1において、 予測誤差演算部 3 0 1は、 カバードバックグラウ ンド領域に対応するモデルによる誤差値を計算する。 予測誤差演算部 3 0 1は、 計算した誤差値をアンカバードバックグラウンド領域判定部 3 0 3に供給する。 ステップ S 3 4 2において、 アンカバードバックグラウンド領域判定部 3 0 3 は、 予測誤差演算部 3 0 1から供給された誤差値が、 閾値 Th以上であるか否か を判定し、 誤差値が閾値 Th以上であると判定された場合、 ステップ S 3 4 3に 進み、 誤差値に対応する画素に、 アンカバードバックグラウンド領域を示すフラ グを設定し、 手続きは、 ステップ S 3 4 4に進む。
ステップ S 3 4 2において、 誤差値が閾値 Th以上でないと判定された場合、 アンカバードバックグラウンド領域ではないので、 ステップ S 3 4 3の処理は、 スキップされ、 手続きは、 ステップ S 3 4 4に進む。
ステップ S 3 4 4において、 領域特定部 1 0 4は、 画面全体について処理をし たか否かを判定し、 画面全体について処理をしていないと判定された場合、 ステ ップ S 3 4 1に戻り、 アンカバードバックグラウンド領域の判定の処理を繰り返 す。
ステップ S 3 4 4において、 画面全体について処理をしたと判定された場合、 ステップ S 3 4 5に進み、 アンカバードバックグラウンド領域判定部 3 0 3は、 アンカバードバックグラウンド領域を示すフラグを出力して、 処理は終了する。 以上のように、 領域特定部 1 0 4は、 推定混合比および推定混合比に対応する 混合比関係情報を基に、 誤差値を演算し、 演算された誤差値を基に、 カバードバ ックグラウンド領域およびアンカバードバックグラウンド領域を特定することが できる。
領域特定部 1 0 4は、 生成した領域情報を基に、 混合比 ひ を決定して、 決定 した混合比ひ を出力することができる。
混合比ひ を利用することにより、 動いているオブジェク トに対応する画像に 含まれる動きボケの情報を残したままで、 画素値に含まれる前景の成分と背景の 成分とを分離することが可能になる。
図 4 4に構成を示す領域特定部 1 0 4は、 加算された誤差値を基に、 カバード バックグラウンド領域またはアンカバードバックグラウンド領域を特定する点を 除き、 図 4 7乃至図 4 9のフローチヤ一トを参照して説明した処理と同様の処理 により、 領域を特定するので、 その処理の詳細な説明は省略する。
図 4 5に構成を示す領域特定部 1 0 4は、 各コンポーネント毎に、 領域を特定 し、 特定された領域の論理和により最終的な領域を求める点を除き、 図 4 7乃至 図 4 9のフローチヤ一トを参照して説明した処理と同様の処理により、 領域を特 定するので、 その処理の詳細な説明は省略する。
図 4 6に構成を示す領域特定部 1 0 4は、 各コンポーネント毎に、 領域を特定 し、 特定された領域の論理積により最終的な領域を求める点を除き、 図 4 7乃至 図 4 9のフローチャートを参照して説明した処理と同様の処理により、 領域を特 定するので、 その処理の詳細な説明は省略する。
次に、 前景背景分離部 1 0 5について説明する。 図 5 0は、 前景背景分離部 1 0 5の構成の一例を示すブロック図である。 前景背景分離部 1 0 5に供給された 入力画像は、 分離部 6 0 1、 スィッチ 6 0 2、 およびスィッチ 6 0 4に供給され る。 カバードバックグラウンド領域を示す情報、 およびアンカバードバックダラ ゥンド領域を示す、 領域特定部 1 0 4から供給された領域情報は、 分離部 6 0 1 に供給される。 前景領域を示す領域情報は、 スィッチ 6 0 2に供給される。 背景 領域を示す領域情報は、 スィツチ 6 0 4に供給される。
混合比算出部 1 0 3から供給された混合比 ひ は、 分離部 6 0 1に供給される, 分離部 6 0 1は、 カバードバックグラウンド領域を示す領域情報、 アンカバー ドバックグラウンド領域を示す領域情報、 および混合比 α を基に、 入力画像か ら前景の成分を分離して、 分離した前景の成分を合成部 6 0 3に供給するととも に、 入力画像から背景の成分を分離して、 分離した背景の成分を合成部 6 0 5に 供給する。
スィッチ 6 0 2は、 前景領域を示す領域情報を基に、 前景に対応する画素が入 力されたとき、 閉じられ、 入力画像に含まれる前景に対応する画素のみを合成部 6 0 3に供給する。
スィッチ 6 0 4は、 背景領域を示す領域情報を基に、 背景に対応する画素が入 力されたとき、 閉じられ、 入力画像に含まれる背景に対応する画素のみを合成部 6 0 5に供給する。
合成部 6 0 3は、 分離部 6 0 1から供給された前景に対応する成分、 スィッチ 6 0 2から供給された前景に対応する画素を基に、 前景成分画像を合成し、 合成 した前景成分画像を出力する。 前景領域と混合領域とは重複しないので、 合成部 6 0 3は、 例えば、 前景に対応する成分と、 前景に対応する画素とに論理積の演 算を適用して、 前景成分画像を合成する。
合成部 6 0 3は、 前景成分画像の合成の処理の最初に実行される初期化の処理 において、 内蔵しているフレームメモリに全ての画素値が 0である画像を格納し, 前景成分画像の合成の処理において、 前景成分画像を格納 (上書き) する。 従つ て、 合成部 6 0 3が出力する前景成分画像の内、 背景領域に対応する画素には、 画素値として 0が格納されている。
合成部 6 0 5は、 分離部 6 0 1から供給された背景に対応する成分、 スィッチ 6 0 4から供給された背景に対応する画素を基に、 背景成分画像を合成して、 合 成した背景成分画像を出力する。 背景領域と混合領域とは重複しないので、 合成 部 6 0 5は、 例えば、 背景に対応する成分と、 背景に対応する画素とに論理積の 演算を適用して、 背景成分画像を合成する。
合成部 6 0 5は、 背景成分画像の合成の処理の最初に実行される初期化の処理 において、 内蔵しているフレームメモリに全ての画素値が 0である画像を格納し、 背景成分画像の合成の処理において、 背景成分画像を格納 (上書き) する。 従つ て、 合成部 6 0 5が出力する背景成分画像の内、 前景領域に対応する画素には、 画素値として 0が格納されている。
図 5 1 Aは、 前景背景分離部 1 0 5に入力される入力画像、 並びに前景背景分 離部 1 0 5から出力される前景成分画像および背景成分画像を示す図である。 図 5 1 Bは、 前景背景分離部 1 0 5に入力される入力画像、 並びに前景背景分離部 1 0 5から出力される前景成分画像および背景成分画像のモデルを示す図である c 図 5 1 Aは、 表示される画像の模式図であり、 図 5 1 Bは、 図 5 1 Aに対応す る前景領域に属する画素、 背景領域に属する画素、 および混合領域に属する画素 を含む 1ラインの画素を時間方向に展開したモデル図を示す。
図 5 1 Aおよび図 5 1 Bに示すように、 前景背景分離部 1 0 5から出力される 背景成分画像は、 背景領域に属する画素、 および混合領域の画素に含まれる背景 の成分から構成される。
図 5 1 Aおよび図 5 1 Bに示すように、 前景背景分離部 1 0 5から出力される 前景成分画像は、 前景領域に属する画素、 および混合領域の画素に含まれる前景 の成分から構成される。
混合領域の画素の画素値は、 前景背景分離部 1 0 5により、 背景の成分と、 前 景の成分とに分離される。 分離された背景の成分は、 背景領域に属する画素と共 に、 背景成分画像を構成する。 分離された前景の成分は、 前景領域に属する画素 と共に、 前景成分画像を構成する。
このように、 前景成分画像は、 背景領域に対応する画素の画素値が 0とされ、 前景領域に対応する画素および混合領域に対応する画素に意味のある画素値が設 定される。 同様に、 背景成分画像は、 前景領域に対応する画素の画素値が 0とさ れ、 背景領域に対応する画素および混合領域に対応する画素に意味のある画素値 が設定される。
次に、 分離部 6 0 1が実行する、 混合領域に属する画素から前景の成分、 およ び背景の成分を分離する処理について説明する。
図 5 2は、 図中の左から右に移動するオブジェク トに対応する前景を含む、 2 つのフレームの前景の成分および背景の成分を示す画像のモデルである。 図 5 2 に示す画像のモデルにおいて、 前景の動き量 Vは 4であり、 仮想分割数は、 4 とされている。
フレーム #nにおいて、 最も左の画素、 および左から 1 4番目乃至 1 8番目の 画素は、 背景の成分のみから成り、 背景領域に属する。 フレーム ttnにおいて、 左から 2番目乃至 4番目の画素は、 背景の成分および前景の成分を含み、 アンカ バードバックグラウンド領域に属する。 フレーム #nにおいて、 左から 1 1番目 乃至 1 3番目の画素は、 背景の成分および前景の成分を含み、 カバードバックグ ラウンド領域に属する。 フレーム #nにおいて、 左から 5番目乃至 1 0番目の画 素は、 前景の成分のみから成り、 前景領域に属する。
フレーム itn+ Ιにおいて、 左から 1番目乃至 5番目の画素、 および左から 1 8 番目の画素は、 背景の成分のみから成り、 背景領域に属する。 フレーム #n+lに おいて、 左から 6番目乃至 8番目の画素は、 背景の成分および前景の成分を含み、 アンカバードバックグラウンド領域に属する。 フレーム ttn+1において、 左から 1 5番目乃至 1 7番目の画素は、 背景の成分および前景の成分を含み、 カバード バックグラウンド領域に属する。 フレーム #n+lにおいて、 左から 9番目乃至 1 4番目の画素は、 前景の成分のみから成り、 前景領域に属する。
図 5 3は、 カバードバックグラウンド領域に属する画素から前景の成分を分離 する処理を説明する図である。 図 5 3において、 1乃至 1 8は、 フレーム #nにおける画素のぞれぞれに対応する混合比である。 図 5 3において、 左から 1 5番目乃至 1 7番目の画素は、 カバードバックグラウンド領域に属する。
フレーム tin の左から 1 5番目の画素の画素値 C15 は、 式 (6 4) で表される c C15=B15/v+F09/v+F08/v+F07/v
= al5-B15+F09/v+F08/v+F07/v
=α 15-P15+F09/v+F08/v+F07/v (64)
ここで、 ひ 15 は、 フレーム #n の左から 1 5番目の画素の混合比である。 P15 は- フレーム #η- 1の左から 1 5番目の画素の画素値である。
式 (6 4) を基に、 フレーム ttnの左から 1 5番目の画素の前景の成分の和 Π5は、 式 (6 5) で表される。
fl5=F09/v+F08/v+F07/v
=C15-ひ 15·Ρ15 (6 5)
同様に、 フレーム ίίηの左から 1 6番目の画素の前景の成分の和 Π6は、 式 (6 6) で表され、 フレーム #ηの左から 1 7番目の画素の前景の成分の和 Π7 は、 式 (6 7) で表される。
f 16=C16-a 16-P16 (6 6)
fl7=C17-al7-P17 (6 7)
このように、 カバードバックグラウンド領域に属する画素の画素値 Cに含ま れる前景の成分 fcは、 式 (6 8) で計算される。 fc=C -ひ ·Ρ (6 8)
Pは、 1つ前のフレームの、 対応する画素の画素値である。
図 5 4は、 アンカバードバックグラウンド領域に属する画素から前景の成分を 分離する処理を説明する図である。 図 5 4において、 ひ 1乃至ひ 1 8は、 フレ ーム tinにおける画素のぞれぞれに対応する混合比である。 図 5 4において、 左 から 2番目乃至 4番目の画素は、 アンカバードバックグラウンド領域に属する。 フレーム #nの左から 2番目の画素の画素値 C02は、 式 (6 9) で表される。
C02=B02/v+B02/v+B02/v+F01/v
=ひ 2-B02+F01/v
=a2-N02+F01/v (6 9)
ここで、 2は、 フレーム ίίηの左から 2番目の画素の混合比である。 Ν02は、 フ レーム #η+1の左から 2番目の画素の画素値である。
式 (6 9) を基に、 フレーム #ηの左から 2番目の画素の前景の成分の和 f02 は、 式 (70) で表される。
f02=F01/v
=C02_ 2·Ν02 ( 7 0)
同様に、 フレーム #ηの左から 3番目の画素の前景の成分の和 f03は、 式 (7 1 ) で表され、 フレーム ίίηの左から 4番目の画素の前景の成分の和 f04は、 式 (7 2) で表される。
f03=C03 -ひ 3·Ν03 (7 1)
f04=C04 -ひ 4·Ν04 ( 7 2)
このように、 アンカバードバックグラウンド領域に属する画素の画素値 Cに 含まれる前景の成分 fuは、 式 (7 3) で計算される。
fu=C-a ·Ν (7 3)
Νは、 1つ後のフレームの、 対応する画素の画素値である。
このように、 分離部 60 1は、 領域情報に含まれる、 カバードバックグラウン ド領域を示す情報、 およびアンカバードバックグラウンド領域を示す情報、 並び に画素毎の混合比 を基に、 混合領域に属する画素から前景の成分、 および背 景の成分を分離することができる。
図 5 5は、 以上で説明した処理を実行する分離部 6 0 1の構成の一例を示すブ ロック図である。 分離部 6 0 1に入力された画像は、 フレームメモリ 6 2 1に供 給され、 混合比算出部 1 0 3から供給されたカバードバックグラウンド領域およ びァンカバードバックグラウンド領域を示す領域情報、 並びに混合比 ひ は、 分 離処理ブロック 6 2 2に入力される。
フレームメモリ 6 2 1は、 入力された画像をフレーム単位で記憶する。 フレー ムメモリ 6 2 1は、 処理の対象がフレーム ίίηであるとき、 フレーム tfnの 1つ前 のフレームであるフレーム 1、 フレーム #η、 およびフレーム #nの 1つ後のフ レームであるフレーム ifn+ 1を記憶する。
フレームメモリ 6 2 1は、 フレーム #n- 1、 フレーム #n、 およびフレーム #n+l の対応する画素を分離処理ブロック 6 2 2に供給する。
分離処理ブロック 6 2 2は、 カバードバックグラウンド領域およびアンカバー ドバックグラウンド領域を示す領域情報、 並びに混合比ひ を基に、 フレームメ モリ 6 2 1から供給されたフレーム #n-l、 フレーム ttn、 およびフレーム #n+lの 対応する画素の画素値に図 5 3および図 5 4を参照して説明した演算を適用して. フレーム tinの混合領域に属する画素から前景の成分および背景の成分を分離し て、 フレームメモリ 6 2 3に供給する。
分離処理ブロック 6 2 2は、 アンカバード領域処理部 6 3 1、 カバード領域処 理部 6 3 2、 合成部 6 3 3、 および合成部 6 3 4で構成されている。
アンカバード領域処理部 6 3 1の乗算器 6 4 1は、 混合比 ひ を、 フレームメ モリ 6 2 1から供給されたフレーム ttn+ 1の画素の画素値に乗じて、 スィツチ 6 4 2に出力する。 スィッチ 6 4 2は、 フレームメモリ 6 2 1から供給されたフレ ーム の画素 (フレーム ίίη+1の画素に対応する) がアンカバードバックグラウ ンド領域であるとき、 閉じられ、 乗算器 6 4 1から供給された混合比ひ を乗じ た画素値を演算器 6 4 3および合成部 6 3 4に供給する。 スィツチ 6 4 2から出 力されるフレーム ttn+1の画素の画素値に混合比ひ を乗じた値は、 フレーム の対応する画素の画素値の背景の成分に等しい。
演算器 6 4 3は、 フレームメモリ 6 2 1から供給されたフレーム #nの画素の 画素値から、 スィッチ 6 4 2から供給された背景の成分を減じて、 前景の成分を 求める。 演算器 6 4 3は、 アンカバ一ドバックグラウンド領域に属する、 フレー ム ttnの画素の前景の成分を合成部 6 3 3に供給する。
カバード領域処理部 6 3 2の乗算器 6 5 1は、 混合比 ひ を、 フレームメモリ 6 2 1から供給されたフレーム ttn- 1の画素の画素値に乗じて、 スィツチ 6 5 2 に出力する。 スィッチ 6 5 2は、 フレームメモリ 6 2 1から供給されたフレーム ttnの画素 (フレーム #n-lの画素に対応する) がカバードバックグラウンド領域 であるとき、 閉じられ、 乗算器 6 5 1から供給された混合比 a を乗じた画素値 を演算器 6 5 3および合成部 6 3 4に供給する。 スィツチ 6 5 2から出力される フレーム ttn_ lの画素の画素値に混合比ひ を乗じた値は、 フレーム の対応す る画素の画素値の背景の成分に等しい。
演算器 6 5 3は、 フレームメモリ 6 2 1から供給されたフレーム ίίηの画素の 画素値から、 スィッチ 6 5 2から供給された背景の成分を減じて、 前景の成分を 求める。 演算器 6 5 3は、 カバードバックグラウンド領域に属する、 フレーム #ηの画素の前景の成分を合成部 6 3 3に供給する。
合成部 6 3 3は、 フレームでの、 演算器 6 4 3から供給された、 アンカバー ドバックグラウンド領域に属する画素の前景の成分、 および演算器 6 5 3から供 給された、 カバードバックグラウンド領域に属する画素の前景の成分を合成して. フレームメモリ 6 2 3に供給する。
合成部 6 3 4は、 フレーム の、 スィッチ 6 4 2から供給された、 アンカバ ードバックグラウンド領域に属する画素の背景の成分、 およびスィッチ 6 5 2か ら供給された、 カバードバックグラウンド領域に属する画素の背景の成分を合成 して、 フレームメモリ 6 2 3に供給する。
フレームメモリ 6 2 3は、 分離処理ブロック 6 2 2から供給された、 フレーム «nの混合領域の画素の前景の成分と、 背景の成分とをそれぞれに記憶する。
フレームメモリ 6 2 3は、 記憶しているフレーム #ηの混合領域の画素の前景 の成分、 および記憶しているフレーム ttnの混合領域の画素の背景の成分を出力 する。
特徴量である混合比ひ を利用することにより、 画素値に含まれる前景の成分 と背景の成分とを完全に分離することが可能になる。
合成部 6 0 3は、 分離部 6 0 1から出力された、 フレーム ttnの混合領域の画 素の前景の成分と、 前景領域に属する画素とを合成して前景成分画像を生成する, 合成部 6 0 5は、 分離部 6 0 1から出力された、 フレーム ίίηの混合領域の画素 の背景の成分と、 背景領域に属する画素とを合成して背景成分画像を生成する。 図 5 6 Αは、 図 5 2のフレーム ίίηに対応する、 前景成分画像の例を示す。 最 も左の画素、 および左から 1 4番目の画素は、 前景と背景が分離される前におい て、 背景の成分のみから成っていたので、 画素値が 0とされる。
左から 2番目乃至 4番目の画素は、 前景と背景とが分離される前において、 ァ ンカバードバックグラウンド領域に属し、 背景の成分が 0とされ、 前景の成分が そのまま残されている。 左から 1 1番目乃至 1 3番目の画素は、 前景と背景とが 分離される前において、 カバードバックグラウンド領域に属し、 背景の成分が 0 とされ、 前景の成分がそのまま残されている。 左から 5番目乃至 1 0番目の画素 は、 前景の成分のみから成るので、 そのまま残される。 ' 図 5 6 Βは、 図 5 2のフレーム #ηに対応する、 背景成分画像の例を示す。 最 も左の画素、 および左から 1 4番目の画素は、 前景と背景とが分離される前にお いて、 背景の成分のみから成っていたので、 そのまま残される。
左から 2番目乃至 4番目の画素は、 前景と背景とが分離される前において、 ァ ンカバードバックグラウンド領域に属し、 前景の成分が 0とされ、 背景の成分が そのまま残されている。 左から 1 1番目乃至 1 3番目の画素は、 前景と背景とが 分離される前において、 カバードバックグラウンド領域に属し、 前景の成分が 0 とされ、 背景の成分がそのまま残されている。 左から 5番目乃至 1 0番目の画素 は、 前景と背景とが分離される前において、 前景の成分のみから成っていたので- 画素値が 0とされる。
次に、 図 5 7に示すフローチャートを参照して、 前景背景分離部 1 0 5による 前景と背景との分離の処理を説明する。 ステップ S 6 0 1において、 分離部 6 0 1のフレームメモリ 6 2 1は、 入力画像を取得し、 前景と背景との分離の対象と なるフレーム ttnを、 その前のフレーム ίίη-lおよびその後のフレーム ttn+1 と共に
BDfe"9 る。
ステップ S 6 0 2において、 分離部 6 0 1の分離処理ブロック 6 2 2は、 混合 比算出部 1 0 3から供給された領域情報を取得する。 ステップ S 6 0 3において. 分離部 6 0 1の分離処理ブロック 6 2 2は、 混合比算出部 1 0 3から供給された 混合比 a を取得する。
ステップ S 6 0 4において、 アンカバード領域処理部 6 3 1は、 領域情報およ び混合比 を基に、 フレームメモリ 6 2 1から供給された、 アンカバードバッ クグラウンド領域に属する画素の画素値から、 背景の成分を抽出する。
ステップ S 6 0 5において、 アンカバード領域処理部 6 3 1は、 領域情報およ び混合比 α を基に、 フレームメモリ 6 2 1から供給された、 アンカバードバッ クグラウンド領域に属する画素の画素値から、 前景の成分を抽出する。
ステップ S 6 0 6において、 カバード領域処理部 6 3 2は、 領域情報および混 合比ひ を基に、 フレームメモリ 6 2 1から供給された、 カバードバックグラウ ンド領域に属する画素の画素値から、 背景の成分を抽出する。
ステップ S 6 0 7において、 カバード領域処理部 6 3 2は、 領域情報および混 合比 ひ を基に、 フレームメモリ 6 2 1から供給された、 カバードバックグラウ ンド領域に属する画素の画素値から、 前景の成分を抽出する。
ステップ S 6 0 8において、 合成部 6 3 3は、 ステップ S 6 0 5の処理で抽出 されたアンカバ一ドバックグラウンド領域に属する画素の前景の成分と、 ステツ プ S 6 0 7の処理で抽出されたカバードバックグラウンド領域に属する画素の前 景の成分とを合成する。 合成された前景の成分は、 合成部 6 0 3に供給される。 更に、 合成部 6 0 3は、 スィッチ 6 0 2を介して供給された前景領域に属する画 素と、 分離部 6 0 1から供給された前景の成分とを合成して、 前景成分画像を生 成する。
ステップ S 6 0 9において、 合成部 6 3 4は、 ステップ S 6 0 4の処理で抽出 されたアンカバードバックグラウンド領域に属する画素の背景の成分と、 ステツ プ S 6 0 6の処理で抽出されたカバードバックグラウンド領域に属する画素の背 景の成分とを合成する。 合成された背景の成分は、 合成部 6 0 5に供給される。 更に、 合成部 6 0 5は、 スィッチ 6 0 4を介して供給された背景領域に属する画 素と、 分離部 6 0 1から供給された背景の成分とを合成して、 背景成分画像を生 成する。
ステップ S 6 1 0において、 合成部 6 0 3は、 前景成分画像を出力する。 ステ ップ S 6 1 1において、 合成部 6 0 5は、 背景成分画像を出力し、 処理は終了す る。
このように、 前景背景分離部 1 0 5は、 領域情報および混合比 を基に、 入 力画像から前景の成分と、 背景の成分とを分離し、 前景の成分のみから成る前景 成分画像、 および背景の成分のみから成る背景成分画像を出力することができる, 次に、 前景成分画像の動きボケの量の調整について説明する。
図 5 8は、 動きボケ調整部 1 0 6の構成の一例を示すブロック図である。 動き 検出部 1 0 2から供給された動きべク トルとその位置情報は、 処理単位決定部 8 0 1、 モデル化部 8 0 2、 および演算部 8 0 5に供給される。 領域特定部 1 0 4 から供給された領域情報は、 処理単位決定部 8 0 1に供給される。 前景背景分離 部 1 0 5から供給された前景成分画像は、 足し込み部 8 0 4に供給される。
処理単位決定部 8 0 1は、 動きべク トルとその位置情報、 および領域情報を基 に、 処理単位を生成し、 生成した処理単位をモデル化部 8 0 2および足し込み部 8 0 4に供給する。
処理単位決定部 8 0 1が生成する処理単位は、 図 5 9に Aで例を示すように、 前景成分画像のカバードバックグラウンド領域に対応する画素から始まり、 アン カバードバックグラウンド領域に対応する画素までの動き方向に並ぶ連続する画 素、 またはアンカバードバックグラウンド領域に対応する画素から始まり、 カバ 一ドバックグラウンド領域に対応する画素までの動き方向に並ぶ連続する画素を 示す。 処理単位は、 例えば、 左上点 (処理単位で指定される画素であって、 画像 上で最も左または最も上に位置する画素の位置) および右下点の 2つのデータか ら成る。
モデル化部 8 0 2は、 動きべク トルおよび入力された処理単位を基に、 モデル 化を実行する。 より具体的には、 例えば、 モデル化部 8 0 2は、 処理単位に含ま れる画素の数、 画素値の時間方向の仮想分割数、 および画素毎の前景の成分の数 に対応する複数のモデルを予め記憶しておき、 処理単位、 および画素値の時間方 向の仮想分割数を基に、 図 6 0に示すような、 画素値と前景の成分との対応を指 定するモデルを選択する。
例えば、 処理単位に対応する画素の数が 1 2でありシャツタ時間内の動き量 V が 5であるときにおいては、 モデル化部 8 0 2は、 仮想分割数を 5とし、 最も左 に位置する画素が 1つの前景の成分を含み、 左から 2番目の画素が 2つの前景の 成分を含み、 左から 3番目の画素が 3つの前景の成分を含み、 左から 4番目の画 素が 4つの前景の成分を含み、 左から 5番目の画素が 5つの前景の成分を含み、 左から 6番目の画素が 5つの前景の成分を含み、 左から 7番目の画素が 5つの前 景の成分を含み、 左から 8番目の画素が 5つの前景の成分を含み、 左から 9番目 の画素が 4つの前景の成分を含み、 左から 1 0番目の画素が 3つの前景の成分を 含み、 左から 1 1番目の画素が 2つの前景の成分を含み、 左から 1 2番目の画素 が 1つの前景の成分を含み、 全体として 8つの前景の成分から成るモデルを選択 する。
なお、 モデル化部 8 0 2は、 予め記憶してあるモデルから選択するのではなく 動きべク トル、 および処理単位が供給されたとき、 動きべク トル、 および処理単 位を基に、 モデルを生成するようにしてもよい。
モデル化部 8 0 2は、 選択したモデルを方程式生成部 8 0 3に供給する。 方程式生成部 8 0 3は、 モデル化部 8 0 2から供給されたモデルを基に、 方程 式を生成する。 図 6 0に示す前景成分画像のモデルを参照して、 前景の成分の数 が 8であり、 処理単位に対応する画素の数が 1 2であり、 動き量 V が 5であり 仮想分割数が 5であるときの、 方程式生成部 8 0 3が生成する方程式について説 明する。
前景成分画像に含まれるシャッタ時間/ Vに対応する前景成分が FOl/v乃至 F08/vであるとき、 FOl/v乃至 F08/vと画素値 C01乃至 C12との関係は、 式 (7 4) 乃至式 (8 5) で表される。
C01=F01/v (74)
C02=F02/v+F01/v (7 5)
C03=F03/v+F02/v+F01/v (7 6)
C04=F04/v+F03/v+F02/v+F01/v (7 7)
C05=F05/v+F04/v+F03/v+F02/v+F01/v (7 8) C06=F06/v+F05/v+F04/v+F03/v+F02/v (7 9) C07=F07/v+F06/v+F05/v+F04/v+F03/v (8 0)
C08=F08/v+F07/v+F06/v+F05/v+F04/v (8 1) C09=F08/v+F07/v+F06/v+F05/v (8 2)
C10=F08/v+F07/v+F06/v (8 3)
Cll=F08/v+F07/v (8 4)
C12=F08/v (8 5) 方程式生成部 8 0 3は、 生成した方程式を変形して方程式を生成する。 方程式 生成部 8 0 3が生成する方程式を、 式 (8 6) 乃至式 (9 7) に示す。
C01 = l - FOl/v+0 · F02/v+0 - F03/v+0 - F04/v+0 - F05/v
+0 - F06/v+0 - F07/V+0 · F08/v (8 6)
C02=l · FOl/v+1 · F02/v+0 · F03/v+0 · F04/v+0 · F05/v
+0 - F06/v+0 · F07/v+0 - F08/v (8 7)
C03=l · FOl/v+1 · F02/v+l · F03/v+0 · F04/v+0 - F05/v +0 · F06/v+0 · F07/v+0 · F08/v 88) C04=l - FOl/v+1 - F02/v+l - F03/v+l · F04/v+0 - F05/v
+0 - F06/v+0 · F07/v+0 · F08/v 8 9) C05=l · FOl/v+1 · F02/v+l - F03/v+l · F04/v+l - F05/v
+0 · F06/v+0 · F07/v+0 · F08/v 90) C06=0 · FOl/v+1 · F02/v+l - F03/v+l - F04/v+l · F05/v
+1 - F06/v+0 · F07/v+0 - F08/v 9 1) C07=0 - FOl/v+0 · F02/v+l · F03/v+l · F04/v+l · F05/v
+1 · F06/v+l · F07/v+0 - F08/v 92) C08=0 · FOl/v+0 · F02/v+0 - F03/v+l · F04/v+l · F05/v
+1 · F06/v+l - F07/v+l · F08/v 93) C09=0 · FOl/v+0 · F02/v+0 · F03/v+0 · F04/v+l · F05/v
+1 · F06/V+1 · F07/v+l - F08/v 94) CI 0=0 - FOl/v+0 - F02/v+0 - F03/v+0 · F04/v+0 · F05/v
+1 - F06/v+l - F07/v+l - F08/v 95) C11=0 - FOl/v+0 · F02/v+0 · F03/v+0 · F04/v+0 - F05/v
+0 · F06/v+l · F07/v+l · F08/v 96) C12=0 · FOl/v+0 · F02/v+0 · F03/v+0 · F04/v+0 - F05/v
+0 - F06/v+0 · F07/v+l · F08/v 9 7) 式 (86) 乃至式 (9 7) は、 式 (98) として表すこともできる
08
Ci= .aij'Filv (98)
--01
式 (98) において、 jは、 画素の位置を示す。 この例において、 jは、 1乃 至 1 2のいずれか 1つの値を有する。 また、 iは、 前景値の位置を示す。 この例 において、 iは、 1乃至 8のいずれか 1つの値を有する。 aijは、 iおよび jの 値に対応して、 0または 1の値を有する。
誤差を考慮して表現すると、 式 (98) は、 式 (99) のように表すことがで さる。
08
Cj=∑aij'Fi/v + ej (99)
i=01
式 (9 9 ) において、 ejは、 注目画素 Cjに含まれる誤差である。
式 (9 9 ) は、 式 (1 0 0 ) に書き換えることができる。 '
08
ej = -∑ai Fi/v (扇)
i=01 ここで、 最小自乗法を適用するため、 誤差の自乗和 Eを式 (1 0 1 ) に示す ように定義する。
12
E =∑ej (101)
--0J 誤差が最小になるためには、 誤差の自乗和 Eに対する、 変数 Fkによる偏微分 の値が 0になればよい。 式 (1 0 2 ) を満たすように Fkを求める。 dFk ~ 3 ^Fk
12 OS
= 2,∑{(Cj -∑aij*Fi )'(-akjlv) = 0 (102)
j-ϋΐ i=01
式 (1 0 2 ) において、 動き量 vは固定値であるから、 式 (1 0 3 ) を導く ことができる。
12 OS
∑ akj · (Cj -∑aii-Fi/v) = 0 (103)
j=oi i=oi 式 (1 0 3 ) を展開して、 移項すると、 式 (1 0 4 ) を得る。
12 08 12
∑ ( kj'∑aij-Fi) = v∑ akj
Figure imgf000095_0001
Cj (io4)
j=01 i=01 j= 1 式 (1 0 4 ) の kに 1乃至 8の整数のいずれか 1つを代入して得られる 8つ の式に展開する。 得られた 8つの式を、 行列により 1つの式により表すことがで きる。 この式を正規方程式と呼ぶ。
このような最小自乗法に基づく、 方程式生成部 8 0 3が生成する正規方程式の 例を式 (1 0 5 ) に示す。
Figure imgf000096_0001
式 ( 1 0 5 ) を A ' F=v ' Cと表すと、 C, A, Vが既知であり、 Fは未知である。 ま た、 A, Vは、 モデル化の時点で既知だが、 Cは、 足し込み動作において画素値を 入力することで既知となる。
最小自乗法に基づく正規方程式により前景成分を算出することにより、 画素 C に含まれている誤差を分散させることができる。
方程式生成部 8 0 3は、 このように生成された正規方程式を足し込み部 8 0 4 に供給する。
足し込み部 8 0 4は、 処理単位決定部 8 0 1から供給された処理単位を基に、 前景成分画像に含まれる画素値 Cを、 方程式生成部 8 0 3から供給された行列 の式に設定する。 足し込み部 8 0 4は、 画素値 Cを設定した行列を演算部 8 0 5に供給する。
演算部 8 0 5は、 掃き出し法 (Gauss-Jordanの消去法) などの解法に基づく 処理により、 動きボケが除去された前景成分 Fi/vを算出して、 動きボケが除去 された前景の画素値である、 0乃至 8の整数のいずれかの iに対応する Fiを算 出して、 図 6 1に例を示す、 動きボケが除去された画素値である Fiから成る、 動きボケが除去された前景成分画像を動きボケ付加部 8 0 6および選択部 8 0 7 に出力する。 なお、 図 6 1に示す動きボケが除去された前景成分画像において、 C03乃至 C 10のそれぞれに F01乃至 F08のそれぞれが設定されているのは、 画面に対する 前景成分画像の位置を変化させないためであり、 任意の位置に対応させることが できる。
動きボケ付加部 8 0 6は、 動き量 Vとは異なる値の動きボケ調整量 v'、 例え ば、 動き量 Vの半分の値の動きボケ調整量 V'や、 動き量 Vと無関係の値の動き ボケ調整量 V'を与えることで、 動きボケの量を調整することができる。 例えば、 図 6 2に示すように、 動きボケ付加部 8 0 6は、 動きボケが除去された前景の画 素値 Fiを動きボケ調整量 v'で除すことにより、 前景成分 Fi/v'を算出して、 前 景成分 Fi /v'の和を算出して、 動きボケの量が調整された画素値を生成する。 例 えば、 動きボケ調整量 v'が 3のとき、 画素値 C02は、 (F01 ) /ν'とされ、 画素 値 C03は、 (F01 +F02) /ν'とされ、 画素値 C04は、 (FO 1+F02+F03) /ν'とされ、 画素 : C05は、 (F02+F03+F04) /v'とされる。
動きボケ付加部 8 0 6は、 動きボケの量を調整した前景成分画像を選択部 8 0 7に供給する。
選択部 8 0 7は、 例えば使用者の選択に対応した選択信号を基に、 演算部 8 0
5から供給された動きボケが除去された前景成分画像、 および動きボケ付加部 8
0 6から供給された動きボケの量が調整された前景成分画像のいずれか一方を選 択して、 選択した前景成分画像を出力する。
このように、 動きボケ調整部 1 0 6は、 選択信号および動きボケ調整量 v'を 基に、 動きボケの量を調整することができる。
また、 例えば、 図 6 3に示すように、 処理単位に対応する画素の数が 8であり , 動き量 Vが 4であるとき、 動きボケ調整部 1 0 6は、 式 (1 0 6 ) に示す行列 の式を生成する。
Figure imgf000098_0001
動きボケ調整部 1 0 6は、 このように処理単位の長さに対応した数の式を立て て、 動きボケの量が調整された画素値である Fiを算出する。 同様に、 例えば、 処理単位に含まれる画素の数が 1 0 0あるとき、 1 0 0個の画素に対応する式を 生成して、 Fiを算出する。
図 6 4は、 動きボケ調整部 1 0 6の他の構成を示す図である。 図 5 8に示す場 合と同様の部分には同一の番号を付してあり、 その説明は省略する。
選択部 8 2 1は、 選択信号を基に、 入力された動きべク トルとその位置信号を そのまま処理単位決定部 8 0 1およびモデル化部 8 0 2に供給するか、 または動 きベク トルの大きさを動きボケ調整量 v'に置き換えて、 その大きさが動きボケ 調整量 v'に置き換えられた動きべク トルとその位置信号を処理単位決定部 8 0 1およびモデル化部 8 0 2に供給する。
このようにすることで、 図 6 4の動きボケ調整部 1 0 6の処理単位決定部 8 0 1乃至演算部 8 0 5は、 動き量 Vと動きボケ調整量 v 'との値に対応して、 動き ボケの量を調整することができる。 例えば、 動き量 Vが 5であり、 動きボケ調 整量 v'が 3であるとき、 図 6 4の動きボケ調整部 1 0 6の処理単位決定部 8 0 1乃至演算部 8 0 5は、 図 6 0に示す動き量 Vが 5である前景成分画像に対し て、 3である動きボケ調整量 v'対応する図 6 2に示すようなモデルに従って、 演算を実行し、 (動き量 V ) I (動きボケ調整量 ν ' ) = 5/3、 すなわちほぼ 1. 7 の動き量 Vに応じた動きボケを含む画像を算出する。 なお、 この場合、 算出さ れる画像は、 3である動き量 Vに対応した動きボケを含むのではないので、 動き ボケ付加部 8 0 6の結果とは動き量 Vと動きボケ調整量 v 'の関係の意味合いが 異なる点に注意が必要である。
以上のように、 動きボケ調整部 1 0 6は、 動き量 Vおよび処理単位に対応し て、 式を生成し、 生成した式に前景成分画像の画素値を設定して、 動きボケの量 が調整された前景成分画像を算出する。
次に、 図 6 5のフローチャートを参照して、 動きボケ調整部 1 0 6による前景 成分画像に含まれる動きボケの量の調整の処理を説明する。
ステップ S 8 0 1において、 動きボケ調整部 1 0 6の処理単位決定部 8 0 1は、 動きべク トルおよび領域情報を基に、 処理単位を生成し、 生成した処理単位をモ デル化部 8 0 2に供給する。
ステップ S 8 0 2において、 動きボケ調整部 1 0 6のモデル化部 8 0 2は、 動 き量 Vおよび処理単位に対応して、 モデルの選択や生成を行う。 ステップ S 8 0 3において、 方程式生成部 8 0 3は、 選択されたモデルを基に、 正規方程式を 作成する。
ステップ S 8 0 4において、 足し込み部 8 0 4は、 作成された正規方程式に前 景成分画像の画素値を設定する。 ステップ S 8 0 5において、 足し込み部 8 0 4 は、 処理単位に対応する全ての画素の画素値の設定を行ったか否かを判定し、 処 理単位に対応する全ての画素の画素値の設定を行っていないと判定された場合、 ステップ S 8 0 4に戻り、 正規方程式への画素値の設定の処理を繰り返す。
ステップ S 8 0 5において、 処理単位の全ての画素の画素値の設定を行ったと 判定された場合、 ステップ S 8 0 6に進み、 演算部 8 0 5は、 足し込み部 8 0 4 から供給された画素値が設定された正規方程式を基に、 動きボケの量を調整した 前景の画素値を算出して、 処理は終了する。
このように、 動きボケ調整部 1 0 6は、 動きべク トルおよび領域情報を基に、 動きボケを含む前景画像から動きボケの量を調整することができる。
すなわち、 サンプルデータである画素値に含まれる動きボケの量を調整するこ とができる。
図 6 6は、 動きボケ調整部 1 0 6の構成の他の一例を示すブロック図である。 動き検出部 1 0 2から供給された動きべク トルとその位置情報は、 処理単位決定 部 9 0 1および補正部 9 0 5に供給され、 領域特定部 1 0 4から供給された領域 情報は、 処理単位決定部 9 0 1に供給される。 前景背景分離部 1 0 5から供給さ れた前景成分画像は、 演算部 9 0 4に供給される。
処理単位決定部 9 0 1は、 動きべク トルとその位置情報、 および領域情報を基 に、 処理単位を生成し、 動きべク トルと共に、 生成した処理単位をモデル化部 9 0 2に供給する。
モデル化部 9 0 2は、 動きベク トルおよび入力された処理単位を基に、 モデル 化を実行する。 より具体的には、 例えば、 モデル化部 9 0 2は、 処理単位に含ま れる画素の数、 画素値の時間方向の仮想分割数、 および画素毎の前景の成分の数 に対応する複数のモデルを予め記憶しておき、 処理単位、 および画素値の時間方 向の仮想分割数を基に、 図 6 7に示すような、 画素値と前景の成分との対応を指 定するモデルを選択する。
例えば、 処理単位に対応する画素の数が 1 2であり動き量 Vが 5であるとき においては、 モデル化部 9 0 2は、 仮想分割数を 5とし、 最も左に位置する画素 が 1つの前景の成分を含み、 左から 2番目の画素が 2つの前景の成分を含み、 左 から 3番目の画素が 3つの前景の成分を含み、 左から 4番目の画素が 4つの前景 の成分を含み、 左から 5番目の画素が 5つの前景の成分を含み、 左から 6番目の 画素が 5つの前景の成分を含み、 左から 7番目の画素が 5つの前景の成分を含み、 左から 8番目の画素が 5つの前景の成分を含み、 左から 9番目の画素が 4つの前 景の成分を含み、 左から 1 0番目の画素が 3つの前景の成分を含み、 左から 1 1 番目の画素が 2つの前景の成分を含み、 左から 1 2番目の画素が 1つの前景の成 分を含み、 全体として 8つの前景の成分から成るモデルを選択する。
なお、 モデル化部 9 0 2は、 予め記憶してあるモデルから選択するのではなく, 動きベク トル、 および処理単位が供給されたとき、 動きべク トル、 および処理単 位を基に、 モデルを生成するようにしてもよい。
方程式生成部 9 0 3は、 モデル化部 9 0 2から供給されたモデルを基に、 方程 式を生成する。
図 6 7乃至図 6 9に示す前景成分画像のモデルを参照して、 前景の成分の数が 8であり、 処理単位に対応する画素の数が 1 2であり、 動き量 Vが 5であると きの、 方程式生成部 9 0 3が生成する方程式の例について説明する。
前景成分画像に含まれるシャッタ時間/ Vに対応する前景成分が FOl/v乃至 F08/vであるとき、 FOl/v乃至 F08/vと画素値 C01乃至 C12との関係は、 上述し たように、 式 (74) 乃至式 (8 5) で表される。
画素値 C12および C11に注目すると、 画素値 C12は、 式 (1 0 7) に示すよ うに、 前景の成分 F08/vのみを含み、 画素値 C11は、 前景の成分 F08/vおよび 前景の成分 F07/vの積和から成る。 従って、 前景の成分 F07/vは、 式 (1 0 8) で求めることができる。
F08/v=C12 ( 1 0 7)
F07/v=Cll - C12 ( 1 0 8)
同様に、 画素値 C10乃至 C01に含まれる前景の成分を考慮すると、 前景の成 分 F06/v乃至 FOl/vは、 式 (1 0 9) 乃至式 (1 1 4) により求めることがで さる。
F06/v=C10-Cll ( 1 0 9)
F05/v=C09 - C10 ( 1 1 0)
F04/v=C08-C09 ( 1 1 1)
F03/v=C07-C08+C12 ( 1 1 2)
F02/v=C06-C07+Cll-C12 ( 1 1 3)
F01/v=C05 - C06+C10 - Cll ( 1 1 4)
方程式生成部 9 0 3は、 式 (1 0 7) 乃至式 (1 1 4) に例を示す、 画素値の 差により前景の成分を算出するための方程式を生成する。 方程式生成部 9 0 3は、 生成した方程式を演算部 9 04に供給する。
演算部 904は、 方程式生成部 903から供給された方程式に前景成分画像の 画素値を設定して、 画素値を設定した方程式を基に、 前景の成分を算出する。 演 算部 9 0 4は、 例えば、 式 (1 0 7 ) 乃至式 (1 1 4 ) が方程式生成部 9 0 3か ら供給されたとき、 式 (1 0 7 ) 乃至式 (1 1 4 ) に画素値 C05乃至 C12を設 定する。
演算部 9 0 4は、 画素値が設定された式に基づき、 前景の成分を算出する。 例 えば、 演算部 9 0 4は、 画素値 C05乃至 C12が設定された式 (1 0 7 ) 乃至式 ( 1 1 4 ) に基づく演算により、 図 6 8に示すように、 前景の成分 FO l/v乃至 F08/vを算出する。 演算部 9 0 4は、 前景の成分 FO l/v乃至 F08/vを補正部 9 0 5に供給する。
補正部 9 0 5は、 演算部 9 0 4から供給された前景の成分に、 処理単位決定部 9 0 1から供給された動きベク トルに含まれる動き量 Vを乗じて、 動きボケを 除去した前景の画素値を算出する。 例えば、 補正部 9 0 5は、 演算部 9 0 4から 供給された前景の成分 FO l/v乃至 FOS/vが供給されたとき、 前景の成分 FO l/v 乃至 F08/vのそれぞれに、 5である動き量 Vを乗じることにより、 図 6 9に示 すように、 動きボケを除去した前景の画素値 F01乃至 F08を算出する。
補正部 9 0 5は、 以上のように算出された、 動きボケを除去した前景の画素値 から成る前景成分画像を動きボケ付加部 9 0 6および選択部 9 0 7に供給する。 動きボケ付加部 9 0 6は、 動き量 Vとは異なる値の動きボケ調整量 v'、 例え ば、 動き量 Vの半分の値の動きボケ調整量 v'、 動き量 Vと無関係の値の動きボ ケ調整量 v'で、 動きボケの量を調整することができる。 例えば、 図 6 2に示す ように、 動きボケ付加部 9 0 6は、 動きボケが除去された前景の画素値 Fiを動 きボケ調整量 v'で除すことにより、 前景成分 Fi/v'を算出して、 前景成分 Fi/v'の和を算出して、 動きボケの量が調整された画素値を生成する。 例えば、 動きボケ調整量 v'が 3のとき、 画素値 C02は、 (F01 ) /v'とされ、 画素値 C03 は、 (F01+F02) /v'とされ、 画素値 C04は、 (F01+F02+F03) /v'とされ、 画素 値 C05は、 (F02+F03+F04) /v'とされる。
動きボケ付加部 9 0 6は、 動きボケの量を調整した前景成分画像を選択部 9 0 7に供給する。 選択部 9 0 7は、 例えば使用者の選択に対応した選択信号を基に、 補正部 9 0 5から供給された動きボケが除去された前景成分画像、 および動きボケ付加部 9 0 6から供給された動きボケの量が調整された前景成分画像のいずれか一方を選 択して、 選択した前景成分画像を出力する。
このように、 動きボケ調整部 1 0 6は、 選択信号および動きボケ調整量 v'を 基に、 動きボケの量を調整することができる。
次に、 図 6 6に構成を示す動きボケ調整部 1 0 6による前景の動きボケの量の 調整の処理を図 7 0のフローチヤ一トを参照して説明する。
ステップ S 9 0 1において、 動きボケ調整部 1 0 6の処理単位決定部 9 0 1は、 動きべク トルおよび領域情報を基に、 処理単位を生成し、 生成した処理単位をモ デル化部 9 0 2および捕正部 9 0 5に供給する。
ステップ S 9 0 2において、 動きボケ調整部 1 0 6のモデル化部 9 0 2は、 動 き量 Vおよび処理単位に対応して、 モデルの選択や生成を行う。 ステップ S 9 0 3において、 方程式生成部 9 0 3は、 選択または生成されたモデルを基に、 前 景成分画像の画素値の差により前景の成分を算出するための方程式を生成する。 ステップ S 9 0 4において、 演算部 9 0 4は、 作成された方程式に前景成分画 像の画素値を設定し、 画素値が設定された方程式を基に、 画素値の差分から前景 の成分を抽出する。 ステップ S 9 0 5において、 演算部 9 0 4は、 処理単位に対 応する全ての前景の成分を抽出したか否かを判定し、 処理単位に対応する全ての 前景の成分を抽出していないと判定された場合、 ステップ S 9 0 4に戻り、 前景 の成分を抽出の処理を繰り返す。
ステップ S 9 0 5において、 処理単位に対応する全ての前景の成分を抽出した と判定された場合、 ステップ S 9 0 6に進み、 補正部 9 0 5は、 動き量 Vを基 に、 演算部 9 0 4から供給された前景の成分 FO l /v乃至 FOS/vのそれぞれを補 正して、 動きボケを除去した前景の画素値 F01乃至 F08を算出する。
ステップ S 9 0 7において、 動きボケ付加部 9 0 6は、 動きボケの量を調整し た前景の画素値を算出して、 選択部 9 0 7は、 動きボケが除去された画像または 動きボケの量が調整された画像のいずれかを選択して、 選択した画像を出力して, 処理は終了する。
このように、 図 6 6に構成を示す動きボケ調整部 1 0 6は、 より簡単な演算で、 より迅速に、 動きボケを含む前景画像から動きボケを調整することができる。
ウィナー, フィルタなど従来の動きボケを部分的に除去する手法が、 理想状態 では効果が認められるが、 量子化され、 ノイズを含んだ実際の画像に対して十分 な効果が得られないのに対し、 図 6 6に構成を示す動きボケ調整部 1 0 6におい ても、 量子化され、 ノイズを含んだ実際の画像に対しても十分な効果が認められ, 精度の良い動きボケの除去が可能となる。
以上のように、 図 2に構成を示す画像処理装置は、 入力画像に含まれる動きボ ケの量を調整することができる。
なお、 混合比 ひ は、 画素値に含まれる背景の成分の割合として説明したが、 画素値に含まれる前景の成分の割合としてもよい。
また、 前景となるオブジェク トの動きの方向は左から右として説明したが、 そ の方向に限定されないことは勿論である。
以上においては、 3次元空間と時間軸情報を有する現実空間の画像をビデオ力 メラを用いて 2次元空間と時間軸情報を有する時空間への射影を行った場合を例 としたが、 本発明は、 この例に限らず、 より多くの第 1の次元の第 1の情報を、 より少ない第 2の次元の第 2の情報に射影した場合に、 その射影によって発生す る歪みを捕正したり、 有意情報を抽出したり、 またはより自然に画像を合成する 場合に適応することが可能である。
なお、 センサは、 CCDに限らず、 固体撮像素子である、 例えば、 BBD (Bucket Bri gade Deviceノ 、 CID (Charge Inject ion Device) 、 CPD (Charge Priming Device) 、 または CMOS (Compl ementary Mental Oxide Semiconductor) セン サでもよく、 また、 検出素子がマトリ ックス状に配置されているセンサに限らず、 検出素子が 1列に並んでいるセンサでもよい。
本発明の信号処理を行うプログラムを記録した記録媒体は、 図 1に示すように、 コンピュータとは別に、 ユーザにプログラムを提供するために配布される、 プロ グラムが記録されている磁気ディスク 5 1 (フロッピ (登録商標) ディスクを含 む) 、 光ディスク 5 2 (CD-ROM (Compact Di sc-Read Only Memory) ,
DVD (Digi tal Versat i le Di sc)を含む) 、 光磁気ディスク 5 3 (M D (Min i- Di sc) (商標) を含む) 、 もしくは半導体メモリ 5 4などよりなるパッケージ メディアにより構成されるだけでなく、 コンピュータに予め組み込まれた状態で ユーザに提供される、 プログラムが記録されている R0M 2 2や、 記憶部 2 8に含 まれるハードディスクなどで構成される。
なお、 本明細書において、 記録媒体に記録されるプログラムを記述するステツ プは、 記載された順序に沿って時系列的に行われる処理はもちろん、 必ずしも時 系列的に処理されなくとも、 並列的あるいは個別に実行される処理をも含むもの である。 産業上の利用可能性
本発明によれば、 背景の画像の領域、 移動する物体の画像の領域、 および混ざ り合いが生じている画像の領域を特定することが可能となる。

Claims

請求の範囲
1 . 時間積分効果を有する所定数の画素を有する撮像素子によって取得された 所定数の画素データからなる画像データを処理する画像処理装置において、 前記画像データの注目フレームの注目画素に対応する、 前記注目フレームの周 辺の周辺フレームの前記画素データを、 前記画像データの複数のオブジェク トの うちの背景となる背景オブジェク トに相当する背景画素データとして抽出すると 共に、 前記注目フレームに存在する前記注目画素の注目画素データを抽出し、 前 記注目画素について、 前記注目画素データおよび前記背景画素データの関係を示 す、 複数の関係式を生成する関係式生成手段と、
前記関係式に基づいて、 前記注目画素に対応して、 現実世界において複数であ る前記ォブジェク トの混合状態を示す混合比を検出する混合比検出手段と、 前記混合比検出手段により検出された前記混合比を前記関係式に代入すること により予測誤差を演算する予測誤差演算手段と、
前記予測誤差を基に、 前記注目画素の属する領域が、 前記複数のオブジェク ト が混合されてなる混合領域であって、 前記複数のオブジェク トのうちの前景とな る前景オブジェク トの動き方向の先端側に形成されるカバードバックグラウンド 領域であるか、 または、 前記混合領域であって、 前記前景オブジェク トの動き方 向の後端側に形成されるアンカバードバックグラウンド領域であるかを特定する カバードバックグラウンド領域ァンカバードバックグラウンド領域特定手段と、 前記注目画素の属する領域が、 前記前景オブジェク トを構成する前景オブジェ ク ト成分のみからなる前景領域であるか、 または、 前記背景オブジェク トを構成 する背景オブジェク ト成分のみからなる背景領域であるかを特定する前景領域背 景領域特定手段と
を含むことを特徴とする画像処理装置。
2 . 前記混合比検出手段は、 前記関係式に基づいて、 前記注目画素に対応して. 前記注目画素に含まれる前記前景ォブジェク ト成分を検出すると共に、 前記混合 比を検出し、 前記予測誤差演算手段は、 前記混合比検出手段により検出された前記混合比お よび前記注目画素に含まれる前記前景オブジェク ト成分を前記関係式に代入する ことにより前記予測誤差を演算する
ことを特徴とする請求の範囲第 1項に記載の画像処理装置。
3 . 前記関係式生成手段は、 前記注目画素に対応する、 前記周辺フレームの前 記画素データを、 前記背景オブジェク トに相当する前記背景画素データとして抽 出すると共に、 前記注目画素の注目画素データ、 および前記注目フレーム内の前 記注目画素の近傍に位置する、 近傍画素の近傍画素データを抽出し、 前記注目画 素について、 前記注目画素データおよび前記近傍画素データ、 並びに前記注目画 素データまたは前記近傍画素データに対応する前記背景画素データの関係を示す、 前記複数の関係式を生成する
ことを特徴とする請求の範囲第 2項に記載の画像処理装置。
4 . 前記関係式生成手段は、 前記注目画素データおよび前記近傍画素データに 含まれる、 前記前景オブジェク ト成分が等しいとする第 1の近似、 および前記混 合領域において前記混合比の変化が前記混合領域の画素の位置に対して直線的で あるとする第 2の近似に基づいて、 前記複数の関係式を生成する
ことを特徴とする請求の範囲第 3項に記載の画像処理装置。
5 . 前記関係式生成手段は、 前記注目画素データおよび前記近傍画素データに 含まれる、 前記前景オブジェク ト成分が等しいとする第 1の近似、 および前記混 合領域において前記混合比の変化が前記混合領域の画素の位置に対して平面的で あるとする第 2の近似に基づいて、 前記複数の関係式を生成する
ことを特徴とする請求の範囲第 3項に記載の画像処理装置。
6 . 前記混合比検出手段は、 前記複数の関係式を最小自乗法で解くことにより、 前記混合比を検出する
ことを特徴とする請求の範囲第 3項に記載の画像処理装置。
7 . 前記関係式生成手段は、 前記注目画素が、 前記カバードバックグラウンド 領域に属するとした場合、 前記注目フレームの前のフレームの前記画素データを、 前記背景画素データとして抽出し、 前記注目画素が、 前記アンカバードバックグ ラウンド領域に属するとした場合、 前記注目フレームの次のフレームの前記画素 データを、 前記背景画素データとして抽出し、 前記複数の関係式を生成する ことを特徴とする請求の範囲第 3項に記載の画像処理装置。
8 . 前記関係式生成手段は、 前記注目画素に対応して、 前記前景オブジェク ト の動きを基に、 前記注目フレームおよび前記周辺フレームから、 前記複数のォブ ジェク 卜が混合状態にある混合画素データを抽出すると共に、 前記混合画素デー タにの個々に対応して、 前記背景オブジェク 卜の動きを基に、 前記混合画素デー タが抽出されたフレームとは異なるフレームから、 前記背景オブジェトに相当す る前記背景画素データを抽出し、 複数の関係式を生成する
ことを特徴とする請求の範囲第 2項に記載の画像処理装置。
9 . 前記関係式生成手段は、 前記混合画素データに対応する前記前景オブジェ ク ト成分が等しいとする第 1の近似、 および前記注目フレームおよび前記周辺フ レームから抽出された前記混合画素データは一定であるとする第 2の近似に基づ いて、 複数の関係式を生成する
ことを特徴とする請求の範囲第 8項に記載の画像処理装置。
1 0 : 前記関係式生成手段は、 前記注目画素に対応して、 前記前景ォブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前記複数のォ ブジェク トが混合状態にある混合画素データを抽出すると共に、 前記混合画素デ ータの個々に対応して、 前記背景オブジェク トの動きを基に、 前記混合画素デー タが抽出されたフレームの前のフレームから、 前記背景オブジェトに相当する前 記背景画素データを抽出し、 複数の関係式を生成し、
前記力バードバックグラウンド領域アンカバードバックグラウンド領域特定手 段は、 前記予測誤差が所定の閾値以上である領域をアンカバードバックグラウン ド領域であると特定する
ことを特徴とする請求の範囲第 8項に記載の画像処理装置。
1 1 . 前記関係式生成手段は、 前記注目画素に対応して、 前記前景オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前記複数のォ ブジェク トが混合状態にある混合画素データを抽出すると共に、 前記混合画素デ ータの個々に対応して、 前記背景オブジェク トの動きを基に、 前記混合画素デー タが抽出されたフレームの次のフレームから、 前記背景オブジェトに相当する前 記背景画素データを抽出し、 複数の関係式を生成し、
前記カバードバックグラウンド領域アンカバードバックグラウンド領域特定手 段は、 前記予測誤差が所定の閾値以上である領域をカバードバックグラウンド領 域であると特定する
ことを特徴とする請求の範囲第 8項に記載の画像処理装置。
1 2 . 時間積分効果を有する所定数の画素を有する撮像素子によって取得され た所定数の画素データからなる画像データを処理する画像処理方法において、 前記画像データの注目フレームの注目画素に対応する、 前記注目フレームの周 辺の周辺フレームの前記画素データを、 前記画像データの複数のオブジェク トの うちの背景となる背景オブジェク トに相当する背景画素データとして抽出すると 共に、 前記注目フレームに存在する前記注目画素の注目画素データを抽出し、 前 記注目画素について、 前記注目画素データおよび前記背景画素データの関係を示 す、 複数の関係式を生成する関係式生成ステップと、
前記関係式に基づいて、 前記注目画素に対応して、 現実世界において複数であ る前記オブジェク トの混合状態を示す混合比を検出する混合比検出ステップと、 前記混合比検出ステップの処理により検出された前記混合比を前記関係式に代 入することにより予測誤差を演算する予測誤差演算ステップと、
前記予測誤差を基に、 前記注目画素の属する領域が、 前記複数のオブジェク ト が混合されてなる混合領域であって、 前記複数のオブジェク トのうちの前景とな る前景オブジェク トの動き方向の先端側に形成されるカバードバックグラウンド 領域であるか、 または、 前記混合領域であって、 前記前景オブジェク トの動き方 向の後端側に形成されるアンカバ一ドバックグラウンド領域であるかを特定する カバードバックグラウンド領域ァンカバードバックグラウンド領域特定ステツプ と、
前記注目画素の属する領域が、 前記前景オブジェク トを構成する前景オブジェ ク ト成分のみからなる前景領域であるか、 または、 前記背景オブジェク トを構成 する背景オブジェク ト成分のみからなる背景領域であるかを特定する前景領域背 景領域特定ステップと
を含むことを特徴とする画像処理方法。
1 3 . 前記混合比検出ステップにおいて、 前記関係式に基づいて、 前記注目画 素に対応して、 前記注目画素に含まれる前記前景オブジェク ト成分が検出される と共に、 前記混合比が検出され、
前記予測誤差演算ステップにおいて、 前記混合比検出ステップの処理により検 出された前記混合比および前記注目画素に含まれる前記前景オブジェタ ト成分を 前記関係式に代入することにより前記予測誤差が演算される
ことを特徴とする請求の範囲第 1 2項に記載の画像処理方法。
1 4 . 前記関係式生成ステップにおいて、 前記注目画素に対応する、 前記周辺 フレームの前記画素データが、 前記背景オブジェク トに相当する前記背景画素デ ータとして抽出されると共に、 前記注目画素の注目画素データ、 および前記注目 フレーム内の前記注目画素の近傍に位置する、 近傍画素の近傍画素データが抽出 され、 前記注目画素について、 前記注目画素データおよび前記近傍画素データ、 並びに前記注目画素データまたは前記近傍画素データに対応する前記背景画素デ ータの関係を示す、 前記複数の関係式が生成される
ことを特徴とする請求の範囲第 1 3項に記載の画像処理方法。
1 5 . 前記関係式生成ステップにおいて、 前記注目画素データおよび前記近傍 画素データに含まれる、 前記前景オブジェク ト成分が等しいとする第 1の近似、 および前記混合領域において前記混合比の変化が前記混合領域の画素の位置に対 して直線的であるとする第 2の近似に基づいて、 前記複数の関係式が生成される ことを特徴とする請求の範囲第 1 4項に記載の画像処理方法。
1 6 . 前記関係式生成ステップにおいて、 前記注目画素データおよび前記近傍 画素データに含まれる、 前記前景オブジェク ト成分が等しいとする第 1の近似、 および前記混合領域において前記混合比の変化が前記混合領域の画素の位置に対 して平面的であるとする第 2の近似に基づいて、 前記複数の関係式が生成される ことを特徴とする請求の範囲第 1 4項に記載の画像処理方法。
1 7 . 前記混合比検出ステップにおいて、 前記複数の関係式を最小自乗法で解 くことにより、 前記混合比が検出される
ことを特徴とする請求の範囲第 1 4項に記載の画像処理方法。
1 8 . 前記関係式生成ステップにおいて、 前記注目画素が、 前記カバードバッ クグラウンド領域に属するとした場合、 前記注目フレームの前のフレームの前記 画素データが、 前記背景画素データとして抽出され、 前記注目画素が、 前記アン カバードバックグラウンド領域に属するとした場合、 前記注目フレームの次のフ レームの前記画素データが、 前記背景画素データとして抽出され、 前記複数の関 係式が生成される
ことを特徴とする請求の範囲第 1 4項に記載の画像処理方法。
1 9 . 前記関係式生成ステップにおいて、 前記注目画素に対応して、 前記前景 オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前 記複数のォブジェク トが混合状態にある混合画素データが抽出されると共に、 前 記混合画素データにの個々に対応して、 前記背景オブジェク トの動きを基に、 前 記混合画素データが抽出されたフレームとは異なるフレームから、 前記背景ォブ ジエトに相当する前記背景画素データが抽出され、 複数の関係式が生成される ことを特徴とする請求の範囲第 1 3項に記載の画像処理方法。
2 0 . 前記関係式生成ステップにおいて、 前記混合画素データに対応する前記 前景オブジェク ト成分が等しいとする第 1の近似、 および前記注目フレームおよ び前記周辺フレームから抽出された前記混合画素データは一定であるとする第 2 の近似に基づいて、 複数の関係式が生成される
ことを特徴とする請求の範囲第 1 9項に記載の画像処理方法。
2 1 . 前記関係式生成ステップにおいて、 前記注目画素に対応して、 前記前景 オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前 記複数のオブジェク トが混合状態にある混合画素データが抽出されると共に、 前 記混合画素データの個々に対応して、 前記背景オブジェク トの動きを基に、 前記 混合画素データが抽出されたフレームの前のフレームから、 前記背景オブジェト に相当する前記背景画素データが抽出され、 複数の関係式が生成され、
前記力バ一ドバックグラウンド領域ァンカバードバックグラウンド領域特定ス テツプにおいて、 前記予測誤差が所定の閾値以上である領域がアンカバードバッ クグラウンド領域であると特定される
ことを特徴とする請求の範囲第 1 9項に記載の画像処理方法。
2 2 . 前記関係式生成ステップにおいて、 前記注目画素に対応して、 前記前景 オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前 記複数のオブジェク トが混合状態にある混合画素データが抽出されると共に、 前 記混合画素データの個々に対応して、 前記背景オブジェク トの動きを基に、 前記 混合画素データが抽出されたフレームの次のフレームから、 前記背景オブジェト に相当する前記背景画素データが抽出され、 複数の関係式が生成され、
前記カバードバックグラウンド領域ァンカバードバックグラウンド領域特定ス テツプにおいて、 前記予測誤差が所定の閾値以上である領域がカバードバックグ ラウンド領域であると特定される
ことを特徴とする請求の範囲第 1 9項に記載の画像処理方法。
2 3 . 時間積分効果を有する所定数の画素を有する撮像素子によって取得され た所定数の画素データからなる画像データを処理する画像処理用のプログラムで あって、
前記画像データの注目フレームの注目画素に対応する、 前記注目フレームの周 辺の周辺フレームの前記画素データを、 前記画像データの複数のォブジヱク トの うちの背景となる背景オブジェク トに相当する背景画素データとして抽出すると 共に、 前記注目フレームに存在する前記注目画素の注目画素データを抽出し、 前 記注目画素について、 前記注目画素データおよび前記背景画素データの関係を示 す、 複数の関係式を生成する関係式生成ステップと、
前記関係式に基づいて、 前記注目画素に対応して、 現実世界において複数であ る前記オブジェク トの混合状態を示す混合比を検出する混合比検出ステップと、 前記混合比検出ステップの処理により検出された前記混合比を前記関係式に代 入することにより予測誤差を演算する予測誤差演算ステップと、
前記予測誤差を基に、 前記注目画素の属する領域が、 前記複数のオブジェク ト が混合されてなる混合領域であって、 前記複数のォブジェク トのうちの前景とな る前景オブジェク トの動き方向の先端側に形成されるカバードバックグラウンド 領域であるか、 または、 前記混合領域であって、 前記前景オブジェク トの動き方 向の後端側に形成されるアンカバードバックグラウンド領域であるかを特定する カバードバックグラウンド領域アンカバードバックグラウンド領域特定ステツプ と、
前記注目画素の属する領域が、 前記前景オブジェク トを構成する前景オブジェ ク ト成分のみからなる前景領域であるか、 または、 前記背景オブジェク トを構成 する背景ォブジェク ト成分のみからなる背景領域であるかを特定する前景領域背 景領域特定ステップと
を含むことを特徴とするコンピュータが読み取り可能なプログラムが記録され ている記録媒体。
2 4 . 前記混合比検出ステップにおいて、 前記関係式に基づいて、 前記注目画 素に対応して、 前記注目画素に含まれる前記前景オブジェク ト成分が検出される と共に、 前記混合比が検出され、
前記予測誤差演算ステップにおいて、 前記混合比検出ステップの処理により検 出された前記混合比および前記注目画素に含まれる前記前景オブジェク ト成分を 前記関係式に代入することにより前記予測誤差が演算される
ことを特徴とする請求の範囲第 2 3項に記載の記録媒体。
2 5 . 前記関係式生成ステップにおいて、 前記注目画素に対応する、 前記周辺 フレームの前記画素データが、 前記背景ォブジェク トに相当する前記背景画素デ ータとして抽出されると共に、 前記注目画素の注目画素データ、 および前記注目 フレーム内の前記注目画素の近傍に位置する、 近傍画素の近傍画素データが抽出 され、 前記注目画素について、 前記注目画素データおよび前記近傍画素データ、 並びに前記注目画素データまたは前記近傍画素データに対応する前記背景画素デ ータの関係を示す、 前記複数の関係式が生成される
ことを特徴とする請求の範囲第 2 4項に記載の記録媒体。
2 6 . 前記関係式生成ステップにおいて、 前記注目画素データおよび前記近傍 画素データに含まれる、 前記前景オブジェク ト成分が等しいとする第 1の近似、 および前記混合領域において前記混合比の変化が前記混合領域の画素の位置に対 して直線的であるとする第 2の近似に基づいて、 前記複数の関係式が生成される ことを特徴とする請求の範囲第 2 5項に記載の記録媒体。
2 7 . 前記関係式生成ステップにおいて、 前記注目画素データおよび前記近傍 画素データに含まれる、 前記前景オブジェク ト成分が等しいとする第 1の近似、 および前記混合領域において前記混合比の変化が前記混合領域の画素の位置に対 して平面的であるとする第 2の近似に基づいて、 前記複数の関係式が生成される ことを特徴とする請求の範囲第 2 5項に記載の記録媒体。
2 8 . 前記混合比検出ステップにおいて、 前記複数の関係式を最小自乗法で解 くことにより、 前記混合比が検出される
ことを特徴とする請求の範囲第 2 5項に記載の記録媒体。
2 9 . 前記関係式生成ステップにおいて、 前記注目画素が、 前記カバードバッ クグラウンド領域に属するとした場合、 前記注目フレームの前のフレームの前記 画素データが、 前記背景画素データとして抽出され、 前記注目画素が、 前記アン カバードバックグラウンド領域に属するとした場合、 前記注目フレームの次のフ レームの前記画素データが、 前記背景画素データとして抽出され、 前記複数の関 係式が生成される
ことを特徴とする請求の範囲第 2 5項に記載の記録媒体。
3 0 . 前記関係式生成ステップにおいて、 前記注目画素に対応して、 前記前景 オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前 記複数のオブジェク トが混合状態にある混合画素データが抽出されると共に、 前 記混合画素データにの個々に対応して、 前記背景オブジェク トの動きを基に、 前 記混合画素データが抽出されたフレームとは異なるフレームから、 前記背景ォブ ジエトに相当する前記背景画素データが抽出され、 複数の関係式が生成される ことを特徴とする請求の範囲第 2 4項に記載の記録媒体。
3 1 . 前記関係式生成ステップにおいて、 前記混合画素データに対応する前記 前景オブジェク ト成分が等しいとする第 1の近似、 および前記注目フレームおよ び前記周辺フレームから抽出された前記混合画素データは一定であるとする第 2 の近似に基づいて、 複数の関係式が生成される
ことを特徴とする請求の範囲第 3 0項に記載の記録媒体。
3 2 . 前記関係式生成ステップにおいて、 前記注目画素に対応して、 前記前景 オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前 記複数のオブジェク トが混合状態にある混合画素データが抽出されると共に、 前 記混合画素データの個々に対応して、 前記背景オブジェク トの動きを基に、 前記 混合画素データが抽出されたフレームの前のフレームから、 前記背景オブジェト に相当する前記背景画素データが抽出され、 複数の関係式が生成され、
前記カバードバックグラウンド領域ァンカバードバックグラウンド領域特定ス テツプにおいて、 前記予測誤差が所定の閾値以上である領域がアンカバ一ドバッ クグラウンド領域であると特定される
ことを特徴とする請求の範囲第 3 0項に記載の記録媒体。
3 3 . 前記関係式生成ステップにおいて、 前記注目画素に対応して、 前記前景 オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前 記複数のオブジェク トが混合状態にある混合画素データが抽出されると共に、 前 記混合画素データの個々に対応して、 前記背景オブジェク トの動きを基に、 前記 混合画素データが抽出されたフレームの次のフレームから、 前記背景オブジェト に相当する前記背景画素データが抽出され、 複数の関係式が生成され、 前記カバードバックグラウンド領域アンカバードバックグラウンド領域特定ス テツプにおいて、 前記予測誤差が所定の閾値以上である領域がカバードバックグ ラウンド領域であると特定される
ことを特徴とする請求の範囲第 3 0項に記載の記録媒体。
3 4 . 時間積分効果を有する所定数の画素を有する撮像素子によって取得され た所定数の画素データからなる画像データを処理するコンピュータに、
前記画像データの注目フレームの注目画素に対応する、 前記注目フレームの周 辺の周辺フレームの前記画素データを、 前記画像データの複数のオブジェク トの うちの背景となる背景オブジェク トに相当する背景画素データとして抽出すると 共に、 前記注目フレームに存在する前記注目画素の注目画素データを抽出し、 前 記注目画素について、 前記注目画素データおよび前記背景画素データの関係を示 す、 複数の関係式を生成する関係式生成ステップと、
前記関係式に基づいて、 前記注目画素に対応して、 現実世界において複数であ る前記オブジェク トの混合状態を示す混合比を検出する混合比検出ステップと、 前記混合比検出ステップの処理により検出された前記混合比を前記関係式に代 入することにより予測誤差を演算する予測誤差演算ステップと、
前記予測誤差を基に、 前記注目画素の属する領域が、 前記複数のォブジュク ト が混合されてなる混合領域であって、 前記複数のオブジェク トのうちの前景とな る前景オブジェク トの動き方向の先端側に形成されるカバードバックグラウンド 領域であるか、 または、 前記混合領域であって、 前記前景オブジェク トの動き方 向の後端側に形成されるアンカバードバックグラウンド領域であるかを特定する カバードバックグラウンド領域ァンカバードバックグラウンド領域特定ステツプ と、
前記注目画素の属する領域が、 前記前景オブジェク トを構成する前景オブジェ ク ト成分のみからなる前景領域であるか、 または、 前記背景オブジェク トを構成 する背景オブジェク ト成分のみからなる背景領域であるかを特定する前景領域背 景領域特定ステップと を実行させるプログラム。
3 5 . 前記混合比検出ステップにおいて、 前記関係式に基づいて、 前記注目画 素に対応して、 前記注目画素に含まれる前記前景オブジェク ト成分が検出される と共に、 前記混合比が検出され、
前記予測誤差演算ステップにおいて、 前記混合比検出ステップの処理により検 出された前記混合比および前記注目画素に含まれる前記前景オブジェク ト成分を 前記関係式に代入することにより前記予測誤差が演算される
ことを特徴とする請求の範囲第 3 4項に記載のプログラム。
3 6 . 前記関係式生成ステップにおいて、 前記注目画素に対応する、 前記周辺 フレームの前記画素データが、 前記背景オブジェク トに相当する前記背景画素デ ータとして抽出されると共に、 前記注目画素の注目画素データ、 および前記注目 フレーム内の前記注目画素の近傍に位置する、 近傍画素の近傍画素データが抽出 され、 前記注目画素について、 前記注目画素データおよび前記近傍画素データ、 並びに前記注目画素データまたは前記近傍画素データに対応する前記背景画素デ ータの関係を示す、 前記複数の関係式が生成される
ことを特徴とする請求の範囲第 3 5項に記載のプログラム。
3 7 . 前記関係式生成ステップにおいて、 前記注目画素データおよび前記近傍 画素データに含まれる、 前記前景オブジェク ト成分が等しいとする第 1の近似、 および前記混合領域において前記混合比の変化が前記混合領域の画素の位置に対 して直線的であるとする第 2の近似に基づいて、 前記複数の関係式が生成される ことを特徴とする請求の範囲第 3 6項に記載のプログラム。
3 8 . 前記関係式生成ステップにおいて、 前記注目画素データおよび前記近傍 画素データに含まれる、 前記前景オブジェク ト成分が等しいとする第 1の近似、 および前記混合領域において前記混合比の変化が前記混合領域の画素の位置に対 して平面的であるとする第 2の近似に基づいて、 前記複数の関係式が生成される ことを特徴とする請求の範囲第 3 6項に記載のプログラム。
3 9 . 前記混合比検出ステップにおいて、 前記複数の関係式を最小自乗法で解 くことにより、 前記混合比が検出される
ことを特徴とする請求の範囲第 3 6項に記載のプログラム。
4 0 . 前記関係式生成ステップにおいて、 前記注目画素が、 前記カバードバッ クグラウンド領域に属するとした場合、 前記注目フレームの前のフレームの前記 画素データが、 前記背景画素データとして抽出され、 前記注目画素が、 前記アン カバードバックグラウンド領域に属するとした場合、 前記注目フレームの次のフ レームの前記画素データが、 前記背景画素データとして抽出され、 前記複数の関 係式が生成される
ことを特徴とする請求の範囲第 3 6項に記載のプログラム。
4 1 . 前記関係式生成ステップにおいて、 前記注目画素に対応して、 前記前景 オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前 記複数のオブジェク トが混合状態にある混合画素データが抽出されると共に、 前 記混合画素データにの個々に対応して、 前記背景オブジェク トの動きを基に、 前 記混合画素データが抽出されたフレームとは異なるフレームから、 前記背景ォブ ジエトに相当する前記背景画素データが抽出され、 複数の関係式が生成される ことを特徴とする請求の範囲第 3 5項に記載のプログラム。
4 2 . 前記関係式生成ステップにおいて、 前記混合画素データに対応する前記 前景オブジェク ト成分が等しいとする第 1の近似、 および前記注目フレームおよ び前記周辺フレームから抽出された前記混合画素データは一定であるとする第 2 の近似に基づいて、 複数の関係式が生成される
ことを特徴とする請求の範囲第 4 1項に記載のプログラム。
4 3 . 前記関係式生成ステップにおいて、 前記注目画素に対応して、 前記前景 オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前 記複数のオブジェク トが混合状態にある混合画素データが抽出されると共に、 前 記混合画素データの個々に対応して、 前記背景オブジェク トの動きを基に、 前記 混合画素データが抽出されたフレームの前のフレームから、 前記背景オブジェト に相当する前記背景画素データが抽出され、 複数の関係式が生成され、 前記カバ一ドバックグラウンド領域アンカバードバックグラウンド領域特定ス テツプにおいて、 前記予測誤差が所定の閾値以上である領域がアンカバードバッ クグラウンド領域であると特定される
ことを特徴とする請求の範囲第 4 1項に記載のプログラム。
4 4 . 前記関係式生成ステップにおいて、 前記注目画素に対応して、 前記前景 オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前 記複数のオブジェク トが混合状態にある混合画素データが抽出されると共に、 前 記混合画素データの個々に対応して、 前記背景オブジェク 卜の動きを基に、 前記 混合画素データが抽出されたフレームの次のフレームから、 前記背景オブジェト に相当する前記背景画素データが抽出され、 複数の関係式が生成され、
前記力バードバックグラウンド領域ァンカバードバックグラウンド領域特定ス テツプにおいて、 前記予測誤差が所定の閾値以上である領域がカバードバックグ ラウンド領域であると特定される
ことを特徴とする請求の範囲第 4 1項に記載のプログラム。
4 5 . 時間積分効果を有する所定数の画素を有する撮像素子によって撮像され た被写体画像を、 所定数の画素データからなる画像データとして出力する撮像手 段と、
前記画像データの注目フレームの注目画素に対応する、 前記注目フレームの周 辺の周辺フレームの前記画素データを、 前記画像データの複数のオブジェク トの うちの背景となる背景オブジェク トに相当する背景画素データとして抽出すると 共に、 前記注目フレームに存在する前記注目画素の注目画素データを抽出し、 前 記注目画素について、 前記注目画素データおよび前記背景画素データの関係を示 す、 複数の関係式を生成する関係式生成手段と、
前記関係式に基づいて、 前記注目画素に対応して、 現実世界において複数であ る前記ォブジェク 卜の混合状態を示す混合比を検出する混合比検出手段と、 前記混合比検出手段により検出された前記混合比を前記関係式に代入すること により予測誤差を演算する予測誤差演算手段と、 前記予測誤差を基に、 前記注目画素の属する領域が、 前記複数のオブジェク ト が混合されてなる混合領域であって、 前記複数のオブジェク トのうちの前景とな る前景オブジェク トの動き方向の先端側に形成されるカバードバックグラウンド 領域であるか、 または、 前記混合領域であって、 前記前景オブジェク 卜の動き方 向の後端側に形成されるアンカバードバックグラウンド領域であるかを特定する カバードバックグラウンド領域ァンカバードバックグラウンド領域特定手段と、 前記注目画素の属する領域が、 前記前景オブジェク トを構成する前景オブジェ ク ト成分のみからなる前景領域であるか、 または、 前記背景オブジェク トを構成 する背景オブジェク ト成分のみからなる背景領域であるかを特定する前景領域背 景領域特定手段と
を含むことを特徴とする撮像装置。
4 6 . 前記混合比検出手段は、 前記関係式に基づいて、 前記注目画素に対応し て、 前記注目画素に含まれる前記前景オブジェク ト成分を検出すると共に、 前記 混合比を検出し、
前記予測誤差演算手段は、 前記混合比検出手段により検出された前記混合比お よび前記注目画素に含まれる前記前景オブジェク ト成分を前記関係式に代入する ことにより前記予測誤差を演算する
ことを特徴とする請求の範囲第 4 5項に記載の撮像装置。
4 7 . 前記関係式生成手段は、 前記注目画素に対応する、 前記周辺フレームの 前記画素データを、 前記背景オブジェク トに相当する前記背景画素データとして 抽出すると共に、 前記注目画素の注目画素データ、 および前記注目フレーム内の 前記注目画素の近傍に位置する、 近傍画素の近傍画素データを抽出し、 前記注目 画素について、 前記注目画素データおよび前記近傍画素データ、 並びに前記注目 画素データまたは前記近傍画素データに対応する前記背景画素データの関係を示 す、 前記複数の関係式を生成する
ことを特徴とする請求の範囲第 4 6項に記載の撮像装置。
4 8 . 前記関係式生成手段は、 前記注目画素データおよび前記近傍画素データ に含まれる、 前記前景オブジェク ト成分が等しいとする第 1の近似、 および前記 混合領域において前記混合比の変化が前記混合領域の画素の位置に対して直線的 であるとする第 2の近似に基づいて、 前記複数の関係式を生成する
ことを特徴とする請求の範囲第 4 7項に記載の撮像装置。
4 9 . 前記関係式生成手段は、 前記注目画素データおよび前記近傍画素データ に含まれる、 前記前景オブジェク ト成分が等しいとする第 1の近似、 および前記 混合領域において前記混合比の変化が前記混合領域の画素の位置に対して平面的 であるとする第 2の近似に基づいて、 前記複数の関係式を生成する
ことを特徴とする請求の範囲第 4 7項に記載の撮像装置。
5 0 . 前記混合比検出手段は、 前記複数の関係式を最小自乗法で解くことによ り、 前記混合比を検出する
ことを特徴とする請求の範囲第 4 7項に記載の撮像装置。
5 1 . 前記関係式生成手段は、 前記注目画素が、 前記カバードバックグラウン ド領域に属するとした場合、 前記注目フレームの前のフレームの前記画素データ を、 前記背景画素データとして抽出し、 前記注目画素が、 前記アンカバードバッ クグラウンド領域に属するとした場合、 前記注目フレームの次のフレームの前記 画素データを、 前記背景画素データとして抽出し、 前記複数の関係式を生成する ことを特徴とする請求の範囲第 4 7項に記載の撮像装置。
5 2 . 前記関係式生成手段は、 前記注目画素に対応して、 前記前景オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前記複数のォ ブジェク トが混合状態にある混合画素データを抽出すると共に、 前記混合画素デ ータにの個々に対応して、 前記背景ォブジェク トの動きを基に、 前記混合画素デ ータが抽出されたフレームとは異なるフレームから、 前記背景オブジェトに相当 する前記背景画素データを抽出し、 複数の関係式を生成する
ことを特徴とする請求の範囲第 4 6項に記載の撮像装置。
5 3 . 前記関係式生成手段は、 前記混合画素データに対応する前記前景ォブジ エタ ト成分が等しいとする第 1の近似、 および前記注目フレームおよび前記周辺 フレームから抽出された前記混合画素データは一定であるとする第 2の近似に基 づいて、 複数の関係式を生成する
ことを特徴とする請求の範囲第 5 2項に記載の撮像装置。
5 4 . 前記関係式生成手段は、 前記注目画素に対応して、 前記前景オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前記複数のォ ブジェク 卜が混合状態にある混合画素データを抽出すると共に、 前記混合画素デ ータの個々に対応して、 前記背景オブジェク トの動きを基に、 前記混合画素デー タが抽出されたフレームの前のフレームから、 前記背景オブジェ卜に相当する前 記背景画素データを抽出し、 複数の関係式を生成し、
前記カバードバックグラウンド領域ァンカバードバックグラウンド領域特定手 段は、 前記予測誤差が所定の閾値以上である領域をアンカバードバックグラウン ド領域であると特定する
ことを特徴とする請求の範囲第 5 2項に記載の撮像装置。
5 5 . 前記関係式生成手段は、 前記注目画素に対応して、 前記前景オブジェク トの動きを基に、 前記注目フレームおよび前記周辺フレームから、 前記複数のォ ブジェク トが混合状態にある混合画素データを抽出すると共に、 前記混合画素デ ータの個々に対応して、 前記背景オブジェク トの動きを基に、 前記混合画素デー タが抽出されたフレームの次のフレームから、 前記背景オブジェトに相当する前 記背景画素データを抽出し、 複数の関係式を生成し、
前記カバードバックグラウンド領域ァンカバードバックグラウンド領域特定手 段は、 前記予測誤差が所定の閾値以上である領域をカバードバックグラウンド領 域であると特定する
ことを特徴とする請求の範囲第 5 2項に記載の撮像装置。
PCT/JP2002/006385 2001-06-27 2002-06-26 Image processing apparatus and method, and image pickup apparatus Ceased WO2003003307A1 (en)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020037002804A KR100894923B1 (ko) 2001-06-27 2002-06-26 화상 처리 장치, 방법 및 기록 매체와 촬상 장치
CA002420069A CA2420069C (en) 2001-06-27 2002-06-26 Image processing apparatus and method, and image pickup apparatus
US10/362,558 US7181080B2 (en) 2001-06-27 2002-06-26 Image processing apparatus and method, and image pickup apparatus
EP02741315A EP1400925A4 (en) 2001-06-27 2002-06-26 IMAGE PROCESSING APPARATUS AND METHOD AND IMAGING APPARATUS
MXPA03001576A MXPA03001576A (es) 2001-06-27 2002-06-26 Aparato y metodo de procesamiento de imagenes y aparato de captura de imagenes.

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001-194611 2001-06-27
JP2001194611A JP4840630B2 (ja) 2001-06-27 2001-06-27 画像処理装置および方法、記録媒体、並びにプログラム

Publications (1)

Publication Number Publication Date
WO2003003307A1 true WO2003003307A1 (en) 2003-01-09

Family

ID=19032715

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2002/006385 Ceased WO2003003307A1 (en) 2001-06-27 2002-06-26 Image processing apparatus and method, and image pickup apparatus

Country Status (8)

Country Link
US (1) US7181080B2 (ja)
EP (1) EP1400925A4 (ja)
JP (1) JP4840630B2 (ja)
KR (1) KR100894923B1 (ja)
CN (1) CN1313975C (ja)
CA (1) CA2420069C (ja)
MX (1) MXPA03001576A (ja)
WO (1) WO2003003307A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4596220B2 (ja) * 2001-06-26 2010-12-08 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
JP4192719B2 (ja) * 2003-08-22 2008-12-10 ソニー株式会社 画像処理装置および方法、並びにプログラム
CN100423557C (zh) * 2004-02-13 2008-10-01 索尼株式会社 图像处理装置以及图像处理方法
WO2005079061A1 (ja) * 2004-02-13 2005-08-25 Sony Corporation 画像処理装置と画像処理方法およびプログラム
US7710498B2 (en) 2004-02-13 2010-05-04 Sony Corporation Image processing apparatus, image processing method and program
US8265392B2 (en) * 2006-02-07 2012-09-11 Qualcomm Incorporated Inter-mode region-of-interest video object segmentation
US8265349B2 (en) * 2006-02-07 2012-09-11 Qualcomm Incorporated Intra-mode region-of-interest video object segmentation
US8150155B2 (en) 2006-02-07 2012-04-03 Qualcomm Incorporated Multi-mode region-of-interest video object segmentation
KR101225062B1 (ko) * 2006-03-10 2013-01-23 삼성전자주식회사 이미지 프레임의 선택적 출력 장치 및 방법
KR101299249B1 (ko) * 2008-08-29 2013-08-22 삼성테크윈 주식회사 디지털 촬영장치, 그 제어방법 및 제어방법을 실행시키기 위한 프로그램을 저장한 기록매체
CN101916449A (zh) * 2010-08-21 2010-12-15 上海交通大学 建立图像处理中基于运动信息的背景模型的方法
US10262421B2 (en) * 2014-08-04 2019-04-16 Nec Corporation Image processing system for detecting stationary state of moving object from image, image processing method, and recording medium
CN113223043B (zh) * 2021-03-26 2024-07-19 西安闻泰信息技术有限公司 一种移动目标的检测方法、装置、设备及介质
CN113129227A (zh) * 2021-03-29 2021-07-16 影石创新科技股份有限公司 图像处理方法、装置、计算机设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06113338A (ja) * 1992-09-30 1994-04-22 Fujitsu Ltd 多眼式立体映像の動き補償予測方法
JPH07336688A (ja) * 1994-06-06 1995-12-22 Nippon Hoso Kyokai <Nhk> アンカバー領域の検出方法
JPH10164436A (ja) * 1996-12-04 1998-06-19 Sony Corp 輪郭抽出装置、輪郭抽出方法、キー信号生成装置及びキー信号生成方法
EP0933727A2 (en) * 1998-01-29 1999-08-04 Canon Kabushiki Kaisha Image information processing apparatus and its method
JP2001250119A (ja) * 1999-12-28 2001-09-14 Sony Corp 信号処理装置および方法、並びに記録媒体
JP2002190028A (ja) * 2000-12-21 2002-07-05 Sony Corp 信号処理装置および方法、並びに記録媒体
JP2002190015A (ja) * 2000-12-21 2002-07-05 Sony Corp 画像処理装置および方法、並びに記録媒体
JP2002190016A (ja) * 2000-12-21 2002-07-05 Sony Corp 信号処理装置および方法、並びに記録媒体

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6054999A (en) * 1988-03-22 2000-04-25 Strandberg; Oerjan Method and apparatus for computer supported animation
GB2231752B (en) * 1989-04-27 1993-08-04 Sony Corp Motion dependent video signal processing
JPH05153493A (ja) * 1991-11-27 1993-06-18 Matsushita Electric Ind Co Ltd 映像信号合成装置
US5812787A (en) * 1995-06-30 1998-09-22 Intel Corporation Video coding scheme with foreground/background separation
US6259827B1 (en) * 1996-03-21 2001-07-10 Cognex Corporation Machine vision methods for enhancing the contrast between an object and its background using multiple on-axis images
JP2952226B2 (ja) * 1997-02-14 1999-09-20 日本電信電話株式会社 動画像の予測符号化方法および復号方法、動画像予測符号化または復号プログラムを記録した記録媒体、および、動画像予測符号化データを記録した記録媒体
US5933151A (en) * 1997-03-26 1999-08-03 Lucent Technologies Inc. Simulated natural movement of a computer-generated synthesized talking head
JP2000030040A (ja) * 1998-07-14 2000-01-28 Canon Inc 画像処理装置及びコンピュータ読み取り可能な記憶媒体
US6771834B1 (en) * 1999-07-02 2004-08-03 Intel Corporation Method for segmenting a digital image

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06113338A (ja) * 1992-09-30 1994-04-22 Fujitsu Ltd 多眼式立体映像の動き補償予測方法
JPH07336688A (ja) * 1994-06-06 1995-12-22 Nippon Hoso Kyokai <Nhk> アンカバー領域の検出方法
JPH10164436A (ja) * 1996-12-04 1998-06-19 Sony Corp 輪郭抽出装置、輪郭抽出方法、キー信号生成装置及びキー信号生成方法
EP0933727A2 (en) * 1998-01-29 1999-08-04 Canon Kabushiki Kaisha Image information processing apparatus and its method
JP2001250119A (ja) * 1999-12-28 2001-09-14 Sony Corp 信号処理装置および方法、並びに記録媒体
JP2002190028A (ja) * 2000-12-21 2002-07-05 Sony Corp 信号処理装置および方法、並びに記録媒体
JP2002190015A (ja) * 2000-12-21 2002-07-05 Sony Corp 画像処理装置および方法、並びに記録媒体
JP2002190016A (ja) * 2000-12-21 2002-07-05 Sony Corp 信号処理装置および方法、並びに記録媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1400925A4 *

Also Published As

Publication number Publication date
EP1400925A1 (en) 2004-03-24
US20040028259A1 (en) 2004-02-12
CN1471694A (zh) 2004-01-28
CA2420069C (en) 2010-03-09
JP4840630B2 (ja) 2011-12-21
US7181080B2 (en) 2007-02-20
CN1313975C (zh) 2007-05-02
EP1400925A4 (en) 2007-05-09
JP2003008991A (ja) 2003-01-10
MXPA03001576A (es) 2003-06-04
KR100894923B1 (ko) 2009-04-27
KR20040014951A (ko) 2004-02-18
CA2420069A1 (en) 2003-02-19

Similar Documents

Publication Publication Date Title
JP4596222B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4596202B2 (ja) 画像処理装置および方法、並びに記録媒体
JP4596220B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4596216B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4596221B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4106874B2 (ja) 画像処理装置および方法、並びに記録媒体
JP4596203B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
WO2003003306A1 (en) Image processing apparatus and method
JP4674408B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
WO2003003307A1 (en) Image processing apparatus and method, and image pickup apparatus
JP4596223B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4596219B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4596215B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4596217B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4596209B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4596218B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
JP4596205B2 (ja) 画像処理装置および方法、並びにプログラム
JP4596225B2 (ja) 画像処理装置および方法、記録媒体、並びにプログラム
WO2003001456A1 (en) Image processing apparatus and method, and image pickup apparatus

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CA CN IN KR MX SG US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR

WWE Wipo information: entry into national phase

Ref document number: 210/MUMNP/2003

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 2002741315

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2420069

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: PA/a/2003/001576

Country of ref document: MX

WWE Wipo information: entry into national phase

Ref document number: 1020037002804

Country of ref document: KR

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 028027655

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 10362558

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 1020037002804

Country of ref document: KR

WWP Wipo information: published in national office

Ref document number: 2002741315

Country of ref document: EP