WO2024122273A1 - 復号装置、符号化装置、復号方法、及び符号化方法 - Google Patents

復号装置、符号化装置、復号方法、及び符号化方法 Download PDF

Info

Publication number
WO2024122273A1
WO2024122273A1 PCT/JP2023/040738 JP2023040738W WO2024122273A1 WO 2024122273 A1 WO2024122273 A1 WO 2024122273A1 JP 2023040738 W JP2023040738 W JP 2023040738W WO 2024122273 A1 WO2024122273 A1 WO 2024122273A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
real space
detection information
image
mobile device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2023/040738
Other languages
English (en)
French (fr)
Inventor
ジンイン ガオ
ハン ブン テオ
チョン スン リム
プラビーン クマール ヤーダブ
清史 安倍
孝啓 西
正真 遠間
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Priority to EP23900394.0A priority Critical patent/EP4614989A4/en
Priority to CN202380083478.2A priority patent/CN120303945A/zh
Priority to JP2024562643A priority patent/JPWO2024122273A1/ja
Publication of WO2024122273A1 publication Critical patent/WO2024122273A1/ja
Priority to US19/223,418 priority patent/US20250294190A1/en
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/56Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
    • G06V20/58Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Definitions

  • This disclosure relates to a decoding device, an encoding device, a decoding method, and an encoding method.
  • Patent Document 1 discloses an autonomous vehicle equipped with an object detection unit and an autonomous module.
  • the object detection unit measures the detection distance using a camera or the like.
  • the autonomous module determines a control range limited within the detection distance, and reflects the learned driving tendencies of the user and driving tendencies defined by external data in the vehicle's driving control-related data.
  • the present disclosure aims to effectively utilize detection information regarding objects present around an autonomous driving device, thereby improving the safety of the autonomous driving device, such as its collision avoidance performance.
  • a decoding device includes a circuit and a memory connected to the circuit, and the circuit receives a bitstream from an autonomous driving device having a photographing unit, decodes an image captured by the photographing unit from the bitstream, decodes intra-image detection information, which is detection information within the image relating to an object included in the image, from the bitstream, and decodes real-space detection information, which is detection information in real space relating to the object, from the bitstream.
  • FIG. 1 is a diagram showing a simplified configuration of an information processing system according to a first embodiment of the present disclosure.
  • 13 is a flowchart showing the flow of processing executed by a circuit of the encoding device.
  • FIG. 2 is a diagram illustrating an example of a traveling situation of an autonomous traveling device.
  • FIG. 2 is a diagram illustrating an example of an image captured by a capturing section.
  • FIG. 10 is a diagram illustrating an example of an image analysis result.
  • 1A and 1B are diagrams illustrating simplified examples of real space detection information and in-image detection information related to an object.
  • FIG. 2 is a diagram illustrating an example of a coordinate system of an autonomous driving device.
  • FIG. 2 is a simplified diagram showing the data structure of a bitstream.
  • FIG. 13 is a simplified diagram illustrating an example of syntax.
  • 13 is a flowchart showing the flow of processing executed by a circuit of the decoding device.
  • FIG. 13 is a diagram showing a simplified example of a display image.
  • FIG. 13 is a diagram showing a simplified example of a display image.
  • FIG. 13 is a diagram showing a simplified example of a display image.
  • FIG. 14 is a diagram showing some figures extracted from the display image shown in FIG. 13 .
  • FIG. 13 is a diagram showing a simplified example of a display image.
  • FIG. 13 is a diagram showing a simplified configuration of an information processing system according to a modified example.
  • 13 is a flowchart showing the flow of processing executed by a circuit of the encoding device.
  • FIG. 13 is a diagram showing a simplified example of a display image.
  • FIG. 13 is a diagram showing a simplified example of a display image.
  • FIG. 13 is a diagram showing a simplified configuration of an information processing
  • FIG. 13 is a simplified diagram illustrating an example of syntax.
  • 13 is a flowchart showing the flow of processing executed by a circuit of the decoding device.
  • FIG. 13 is a diagram showing a simplified example of a display image.
  • FIG. 13 is a diagram showing a simplified example of a display image.
  • FIG. 11 is a diagram showing a simplified configuration of an information processing system according to a second embodiment of the present disclosure.
  • 13 is a flowchart showing the flow of processing executed by a circuit of the decoding device.
  • FIG. 2 is a diagram illustrating an example of an image captured by a capturing section.
  • FIG. 2 is a diagram showing a simplified example of a map.
  • the unmanned autonomous driving devices travel on sidewalks at the same speed as pedestrians to deliver products.
  • the autonomous driving devices are equipped with cameras, GPS receivers, obstacle sensors, etc., which complement each other in order to ensure safe driving.
  • the autonomous driving devices transmit images captured by their own cameras in real time to a monitoring center where an operator is always present.
  • the inventors discovered that the above problems could be solved by transmitting, from the autonomous mobile device to a monitoring center, and effectively utilizing, not only images captured by a camera, but also detection information in real space detected by sensors mounted on the autonomous mobile device, and came up with the present disclosure.
  • the decoding device includes a circuit and a memory connected to the circuit, and the circuit receives a bitstream from an autonomous driving device having a photographing unit, decodes an image captured by the photographing unit from the bitstream, decodes intra-image detection information, which is detection information within the image relating to an object included in the image, from the bitstream, and decodes real-space detection information, which is detection information in real space relating to the object, from the bitstream.
  • the decoding device can effectively utilize on-screen detection information and real-space detection information regarding objects present around the autonomous driving device, thereby improving the safety of the autonomous driving device, such as collision avoidance performance.
  • the in-image detection information regarding the object may include position information of the object within the image.
  • the position information of objects within an image can be effectively utilized on the decoding device side.
  • the real space detection information regarding the object may include at least one of position information of the object in the real space and movement information of the object in the real space.
  • the position information and movement information of the object in the real space can be effectively utilized on the decoding device side.
  • the position information of the object may include coordinate values in a circular coordinate system based on the autonomous mobile device, coordinate values in a Cartesian coordinate system based on the autonomous mobile device, or coordinate values in a geographic coordinate system.
  • the position of an object can be accurately identified using position information including coordinate values.
  • the movement information of the object may include at least one of the absolute speed of the object or the relative speed of the object with respect to the autonomous mobile device, and the absolute movement direction of the object or the relative movement direction of the object with respect to the autonomous mobile device.
  • At least one of the speed and the moving direction of an object can be accurately determined by movement information including at least one of absolute speed or relative speed and absolute moving direction or relative moving direction.
  • the circuit further decodes real-space detection information related to the autonomous driving device from the bit stream, and the real-space detection information related to the autonomous driving device may include position information of the autonomous driving device in the real space and movement information of the autonomous driving device in the real space.
  • the position information and movement information of the autonomous mobile device in the real space can be effectively utilized on the decoding device side.
  • the location information of the autonomous mobile device may include coordinate values in a geographic coordinate system.
  • the absolute position of the autonomous driving device can be accurately determined by using position information including coordinate values in a geographic coordinate system.
  • the movement information of the autonomous mobile device may include at least one of the absolute speed and absolute movement direction of the autonomous mobile device.
  • At least one of the absolute speed and absolute movement direction of the autonomous mobile device can be accurately determined using the movement information.
  • the circuit may decode the in-image detection information and the real-space detection information relating to the object, and the real-space detection information relating to the autonomous driving device from the SEI region of the bitstream.
  • the in-image detection information and real-space detection information related to the object and the real-space detection information related to the autonomous driving device are encoded in the SEI area of the bitstream, allowing for easy processing on the decoding device side.
  • the circuit may further generate a display image for human vision, and the display image may include the object and at least one of position information for displaying the object in the real space and movement information for displaying the object in the real space.
  • an operator can instantly and accurately grasp the situation around the autonomous mobile device.
  • the autonomous driving device includes a plurality of autonomous driving devices, and the circuit generates the display image based on a plurality of images decoded from a plurality of bitstreams received from the plurality of autonomous driving devices.
  • multiple images captured by multiple autonomous driving devices can complement each other's blind spots during capture, improving the convenience of the displayed images.
  • the circuit may use position information of the object in the real space, which is included in the real space detection information of the object decoded from the bit stream, as the display position information of the object, and may use movement information of the object in the real space, which is included in the real space detection information of the object decoded from the bit stream, as the display movement information of the object.
  • display position information and display movement information can be easily generated.
  • the circuit may further decode position information of the autonomous driving device in the real space and movement information of the autonomous driving device in the real space from the bit stream, calculate the display position information of the object by converting the position information of the object in the real space included in the real space detection information about the object decoded from the bit stream using the position information of the autonomous driving device in the real space decoded from the bit stream, and calculate the display movement information of the object by converting the movement information of the object in the real space included in the real space detection information about the object decoded from the bit stream using the movement information of the autonomous driving device in the real space decoded from the bit stream.
  • the relative position of an object can be converted to an absolute position and displayed, and the relative speed and relative movement direction of an object can be converted to an absolute speed and absolute movement direction and displayed.
  • the circuit may calculate the display movement information of the object based on multiple pieces of position information of the object in the real space at multiple times, which are included in the real space detection information regarding the object decoded from the bit stream.
  • the fourteenth aspect even if the bit stream received from the autonomous driving device does not include movement information of an object in real space, it is possible to appropriately calculate the display movement information of the object based on multiple pieces of position information of the object in real space at multiple times.
  • the decoding device is mounted on an autonomous driving device other than the autonomous driving device, and the circuitry further controls the operation of the other autonomous driving device based on the in-image detection information and the real-space detection information regarding the object decoded from the bit stream received from the autonomous driving device, and the in-image detection information and the real-space detection information regarding an object included in an image captured by a capture unit of the other autonomous driving device.
  • each autonomous driving device can effectively utilize the information received from other autonomous driving devices in controlling its own operation, thereby improving the safety of the autonomous driving devices, such as their collision avoidance performance.
  • the circuit may convert the real-space detection information about the object, decoded from the bit stream received from the autonomous driving device and using a coordinate system based on the autonomous driving device, into the real-space detection information about the object using a coordinate system based on the other autonomous driving device.
  • each autonomous driving device can use real-space detection information about an object detected by another autonomous driving device as real-space detection information about an object detected by its own autonomous driving device.
  • the encoding device is an encoding device mounted on an autonomous mobile device having an image capture unit, and includes a circuit and a memory connected to the circuit, and the circuit encodes an image captured by the image capture unit into a bit stream, encodes intra-image detection information, which is detection information within the image relating to an object included in the image, into the bit stream, and encodes real-space detection information, which is detection information in real space relating to the object, into the bit stream.
  • this information can be effectively utilized on the decoding device side that receives the bitstream, thereby improving the safety of the autonomous driving device, such as collision avoidance performance.
  • the in-image detection information regarding the object may include position information of the object within the image.
  • the position information of objects within an image can be effectively utilized on the decoding device side.
  • the real space detection information regarding the object may include at least one of position information of the object in the real space and movement information of the object in the real space.
  • the position information and movement information of the object in the real space can be effectively utilized on the decoding device side.
  • the position information of the object may include coordinate values in a circular coordinate system based on the autonomous mobile device, coordinate values in a Cartesian coordinate system based on the autonomous mobile device, or coordinate values in a geographic coordinate system.
  • the position of an object can be accurately identified using position information including coordinate values.
  • the movement information of the object may include at least one of the absolute speed of the object or the relative speed of the object with respect to the autonomous mobile device, and the absolute movement direction of the object or the relative movement direction of the object with respect to the autonomous mobile device.
  • At least one of the speed and the moving direction of an object can be accurately determined by movement information including at least one of absolute speed or relative speed and absolute moving direction or relative moving direction.
  • the circuit may further encode real-space detection information related to the autonomous driving device into the bit stream, and the real-space detection information related to the autonomous driving device may include position information of the autonomous driving device in the real space and movement information of the autonomous driving device in the real space.
  • the position information and movement information of the autonomous mobile device in the real space can be effectively utilized on the decoding device side.
  • the location information of the autonomous mobile device may include coordinate values in a geographic coordinate system.
  • the absolute position of the autonomous driving device can be accurately determined by position information including coordinate values in a geographic coordinate system.
  • the movement information of the autonomous mobile device may include at least one of the absolute speed and absolute movement direction of the autonomous mobile device.
  • At least one of the absolute speed and absolute movement direction of the autonomous mobile device can be accurately determined using the movement information.
  • the circuit may encode the intra-image detection information and the real-space detection information relating to the object into an SEI region of the bitstream.
  • intra-image detection information and real-space detection information relating to an object are encoded in the SEI region of the bitstream, allowing easy processing on the decoding device side.
  • the autonomous mobile device further has a detection unit that detects the object in the real space, and the circuit derives the real space detection information regarding the object based on a value obtained by converting a detection value by the detection unit from the coordinate system of the detection unit to the coordinate system of the autonomous mobile device.
  • real-space detection information regarding an object can be appropriately derived by converting the unique coordinate system of the detection unit into a common coordinate system of the autonomous driving device.
  • a decoding device receives a bitstream from an autonomous driving device having a capture unit, decodes an image captured by the capture unit from the bitstream, decodes intra-image detection information, which is detection information within the image relating to an object included in the image, from the bitstream, and decodes real-space detection information, which is detection information in real space relating to the object, from the bitstream.
  • the decoding device can effectively utilize on-screen detection information and real-space detection information regarding objects present around the autonomous driving device, thereby improving the safety of the autonomous driving device, such as collision avoidance performance.
  • an encoding device mounted on an autonomous driving device having an image capturing unit encodes an image captured by the image capturing unit into a bit stream, encodes intra-image detection information, which is detection information within the image relating to an object included in the image, into the bit stream, and encodes real-space detection information, which is detection information in real space relating to the object, into the bit stream.
  • this information can be effectively utilized on the decoding device side that receives the bitstream, thereby improving the safety of the autonomous driving device, such as collision avoidance performance.
  • First Embodiment 1 is a diagram showing a simplified configuration of an information processing system according to a first embodiment of the present disclosure.
  • the information processing system includes an autonomous mobile device 1, a transmission line NW, a decoding device 2, and a display device 3.
  • the autonomous mobile device 1 is, for example, an autonomous mobile vehicle that delivers goods unmanned in a product delivery system.
  • the autonomous mobile device 1 has an encoding device 11, a photographing unit 12, and an object detection unit 13. Although one autonomous mobile device 1 is shown in FIG. 1, there may be multiple autonomous mobile devices 1 with the same configuration.
  • the encoding device 11 includes a circuit 21 and a memory 22 connected to the circuit 21.
  • the circuit 21 is configured with a processor such as a CPU.
  • the memory 22 is configured with any recording medium such as a ROM, RAM, HDD, SSD, or semiconductor memory.
  • the memory 22 stores data to be processed by the circuit 21 or data in the middle of processing, etc.
  • the photographing unit 12 is configured with a camera having an optical system and a CMOS image sensor, etc.
  • the photographing unit 12 photographs the surroundings of the autonomous mobile device 1 (particularly the area ahead in the direction of movement).
  • the object detection unit 27 is configured with LiDAR (Light Detection And Ranging) and the like.
  • the object detection unit 27 detects objects that exist around the autonomous mobile device 1 in real space.
  • the object detection unit 27 inputs real-space detection information, which is detection information in real space regarding an object, to the circuit 21.
  • the real-space detection information includes the distance to the object, the direction in which the object is located, the shape of the object, etc.
  • the transmission line NW is the Internet, a WAN (Wide Area Network), a LAN (Local Area Network), or any combination of these. It is desirable for the transmission line NW to be a private network in which secure communication is ensured by access restrictions.
  • the decoding device 2 and the display device 3 are placed, for example, in a monitoring center where an operator who remotely monitors the autonomous mobile device 1 resides.
  • the decryption device 2 includes a circuit 31 and a memory 32 connected to the circuit 31.
  • the circuit 31 is configured with a processor such as a CPU.
  • the memory 32 is configured with any recording medium such as a ROM, RAM, HDD, SSD, or semiconductor memory.
  • the memory 32 stores data to be processed by the circuit 31 or data in the middle of processing.
  • the display device 3 is a liquid crystal display or an organic EL display, etc.
  • the circuit 21 of the encoding device 11 transmits the bit stream BS to the decoding device 2 via the transmission path NW.
  • the circuit 31 of the decoding device 2 receives the bit stream BS and generates a display image for human vision by an operator.
  • the display device 3 displays the display image.
  • FIG. 2 is a flowchart showing the flow of processing executed by circuit 21 of encoding device 11.
  • step SP11 the circuit 21 acquires an image captured by the image capture unit 12.
  • the image includes objects present around the autonomous mobile device 1.
  • FIG. 3 is a diagram showing a schematic example of a driving situation of the autonomous mobile device 1.
  • Autonomous mobile devices 1A and 1B and pedestrians 6A to 6C are present on a sidewalk 5.
  • Autonomous mobile device 1A is driving in the upward direction on the page.
  • Autonomous mobile device 1B is driving in the downward direction on the page, ahead of autonomous mobile device 1A in the direction of movement.
  • Pedestrian 6A is walking in the right direction on the page, ahead of autonomous mobile device 1A in the direction of movement.
  • Pedestrian 6B is walking in the downward direction on the page, ahead of autonomous mobile device 1A in the direction of movement.
  • Pedestrian 6C is walking in the upward direction on the page, behind autonomous mobile device 1A in the direction of movement.
  • FIG. 4 is a diagram showing a schematic example of an image 100 captured by the image capture unit 12 of the autonomous mobile device 1A.
  • the image 100 includes the autonomous mobile device 1B and pedestrian 6B moving toward the autonomous mobile device (autonomous mobile device 1A), and a pedestrian 6A crossing in front of the autonomous mobile device.
  • step SP12 the circuit 21 obtains real-space detection information about objects included in the image 100 from the object detection unit 13.
  • the real-space detection information about the objects includes, for each of the objects, the autonomous mobile device 1B and the pedestrians 6A and 6B, the distance to the object, the direction in which the object exists, the shape of the object, and the like.
  • Step SP12 may be executed simultaneously with step SP11.
  • the circuit 21 analyzes the image 100 acquired in step SP11.
  • the analysis of the image 100 includes object detection processing and object recognition processing, for example, using a machine-learned estimation model.
  • the circuit 21 generates in-image detection information, which is detection information within the image 100 regarding objects contained in the image 100.
  • the in-image detection information includes position information of objects within the image 100 as a result of the object detection processing.
  • the in-image detection information may also include attribute information of objects within the image 100 as a result of the object recognition processing.
  • the attributes represent the type of object, such as an autonomous driving device, a person, or a bicycle.
  • FIG. 5 is a diagram showing a schematic example of the analysis results of the image 100 by the circuit 21.
  • the circuit 21 sets a bounding box BB surrounding the object within the image 100 as position information of the object within the image 100. Specifically, the circuit 21 sets a bounding box BB1 surrounding the autonomous mobile device 1B, a bounding box BB2 surrounding the pedestrian 6A, and a bounding box BB3 surrounding the pedestrian 6B.
  • the circuit 21 specifies the position and shape of the bounding box BB using the coordinate values of a specific vertex of the bounding box BB (e.g., the vertex in the upper left corner) and the height and width of the bounding box BB.
  • the circuit 21 may specify the position and shape of the bounding box BB using the coordinate values of the center point of the bounding box BB and the height and width of the bounding box BB.
  • the circuit 21 may specify the position and shape of the bounding box BB using the coordinate values of the four vertices of the bounding box BB.
  • the circuit 21 may specify the position and shape of the bounding box BB using the coordinate values of two vertices located on the diagonal line of the bounding box BB.
  • the circuit 21 also associates objects in real space detected by the object detection unit 13 with objects in the image 100 detected by image analysis.
  • FIG. 6 is a simplified diagram showing an example of real-space detection information and in-image detection information related to an object.
  • the real-space detection information includes position information and movement information.
  • the position information includes distance and direction.
  • the movement information includes speed and movement direction.
  • the circuit 21 calculates the speed and movement direction of the object based on the position detection results of the object detection unit 13 at multiple times. However, the calculation of the movement information including the speed and movement direction of the object may be performed by the circuit 31 of the decoding device 2 instead of the circuit 21 of the encoding device 11.
  • the in-image detection information includes information indicating the position and shape of the corresponding bounding box BB.
  • the origin of the coordinate system of the object detection unit 13 is the center point of the object detection unit 13, and the origin of the coordinate system of the autonomous mobile device 1A is the center point of the autonomous mobile device 1A, and the two are different. Therefore, the circuit 21 derives real-space detection information related to the object based on the detection value by the object detection unit 13 converted from the unique coordinate system of the object detection unit 13 to the common coordinate system of the autonomous mobile device 1A.
  • FIG. 7 is a diagram showing an example of the coordinate system of the autonomous mobile device 1A.
  • the coordinate system of the autonomous mobile device 1A is a circular coordinate system, and the origin O of the coordinate system is the center point of the autonomous mobile device 1A.
  • An angle of 0° in the coordinate system corresponds to the movement direction of the autonomous mobile device 1A.
  • the position of an object is indicated by the distance coordinate value and the angle coordinate value in the circular coordinate system.
  • the movement direction of an object is indicated by the angle coordinate value in the circular coordinate system.
  • the distance, direction, speed, and direction of movement are the relative distance, relative direction, relative speed, and relative direction of movement of the object with respect to the autonomous mobile device 1A.
  • the corresponding bounding box BB is bounding box BB1
  • the relative distance is 5.0 m
  • the relative direction is 30.0°
  • the relative speed is 8.5 km/h
  • the relative movement direction is 180.0°.
  • the corresponding bounding box BB is bounding box BB2
  • the relative distance is 9.8 m
  • the relative direction is -28.5°
  • the relative speed is 7.7 km/h
  • the relative movement direction is -90.0°.
  • the corresponding bounding box BB is bounding box BB3
  • the relative distance is 13.1 m
  • the relative direction is 10.0°
  • the relative speed is 12.5 km/h
  • the relative movement direction is 180.0°.
  • the coordinate system of the autonomous mobile device 1A is not limited to the above circular coordinate system, and may be a Cartesian coordinate system.
  • the Cartesian coordinate system may indicate the position of an object by the X-axis value and the Y-axis value, with the forward/backward direction of the autonomous mobile device 1A as the X-axis, the left/right direction of the autonomous mobile device 1A as the Y-axis, and the center point of the autonomous mobile device 1A as the origin.
  • step SP14 the circuit 21 encodes the image 100 acquired in step SP11 into a bit stream BS.
  • FIG 8 is a simplified diagram showing the data structure of a bitstream BS.
  • the bitstream BS has a header 41 and a payload 42.
  • the header 41 includes an SEI (Supplemental Enhancement Information) area 43 for storing additional information.
  • SEI Supplemental Enhancement Information
  • the circuit 21 encodes the image 100 containing the object into the payload 42 of the bitstream BS.
  • the circuit 21 encodes the intra-image detection information relating to the object into a bit stream BS.
  • the circuit 21 encodes the intra-image detection information generated in step SP13 into a predetermined location in the header 41.
  • the predetermined location is the SEI region 43.
  • the predetermined location may be the VPS, SPS, PPS, PH, SH, APS, or a tile header, etc.
  • the predetermined location may be an ARSEI (annotated region SEI) region for storing bounding box information.
  • step SP16 the circuit 21 encodes the real space detection information related to the object into a bit stream BS.
  • the circuit 21 encodes the real space detection information acquired in step SP12 into a predetermined location in the header 41.
  • the predetermined location is the SEI area 43.
  • the predetermined location may be the VPS, SPS, PPS, PH, SH, APS, or a tile header, etc.
  • the predetermined location may be an ARSEI area for storing bounding box information. Note that steps SP14 to SP16 may be executed simultaneously.
  • FIG. 9 shows a simplified example of the syntax.
  • num_objects indicates the number of objects contained in the image 100.
  • first_information contains in-image detection information about the objects.
  • second_information contains real-space detection information about the objects.
  • step SP17 the circuit 21 transmits the bit stream BS to the decoding device 2.
  • FIG. 10 is a flowchart showing the flow of processing executed by the circuit 31 of the decoding device 2.
  • step SP21 the circuit 31 receives the bit stream BS from the autonomous mobile device 1A.
  • step SP22 the circuit 31 decodes the image 100 including the object from the payload 42 of the bitstream BS.
  • step SP23 the circuit 31 decodes intra-image detection information relating to the object from the header 41 of the bitstream BS. If the intra-image detection information is encoded in the SEI region 43 of the header 41, the circuit 31 decodes the intra-image detection information from the SEI region 43. If the intra-image detection information is encoded in the ARSEI region of the header 41, the circuit 31 decodes the intra-image detection information from the ARSEI region.
  • step SP24 the circuit 31 decodes real space detection information related to the object from the header 41 of the bit stream BS. If the real space detection information is encoded in the SEI region 43 of the header 41, the circuit 31 decodes the real space detection information from the SEI region 43. If the real space detection information is encoded in the ARSEI region of the header 41, the circuit 31 decodes the real space detection information from the ARSEI region. Note that steps SP22 to SP24 may be executed simultaneously.
  • step SP25 the circuit 31 generates a display image 200 for human vision by the operator based on the image and information decoded in steps SP22 to SP24.
  • FIG. 11 is a simplified diagram showing an example of a display image 200.
  • the display image 200 includes the image 100, display position information of an object in real space, and display movement information D1 to D3 of the object in real space.
  • the display position information includes frames F1 to F3 corresponding to bounding boxes BB1 to BB3, and distance information indicating the relative distance of each object to the autonomous mobile device 1A.
  • the circuit 31 uses the position information of the object in real space, which is included in the real space detection information decoded from the bit stream BS, as the display position information of the object.
  • the display movement information D1 to D3 includes relative speed information indicating the relative speed of each object with respect to the autonomous mobile device 1A, and relative movement direction information indicating the relative movement direction of each object with respect to the autonomous mobile device 1A.
  • the relative movement direction information is represented as a bold arrow.
  • the circuit 31 uses the movement information of the object in the real space, which is included in the real space detection information decoded from the bit stream BS, as the display movement information D1 to D3 of the object.
  • the circuit 31 also highlights, by using a thick line or coloring, frames F1, F3 that correspond to objects that may collide with or approach the host vehicle (autonomous mobile device 1A) among the multiple objects included in the display image 200.
  • the circuit 31 determines whether or not there is a possibility of a collision or approach with the host vehicle based on the relative position, relative distance, and relative movement direction of the object with respect to the host vehicle. This allows an operator viewing the display image 200 to quickly identify an object that should be closely monitored among the multiple objects included in the display image 200.
  • the encoding device 11 of this embodiment by encoding the on-screen detection information and real-space detection information regarding objects present around the autonomous driving device 1 into a bit stream BS, this information can be effectively utilized on the decoding device 2 side that receives the bit stream BS, thereby improving the safety of the autonomous driving device 1, such as collision avoidance performance.
  • the intra-image detection information includes position information of the object within the image 100, so that the position information of the object within the image 100 can be effectively utilized on the decoding device 2 side.
  • the real space detection information includes position information and movement information of the object in real space, so that the decoding device 2 can effectively utilize the position information and movement information of the object in real space. Note that one of the position information and movement information of the object in real space may be omitted.
  • the position information of an object includes coordinate values in a circular coordinate system based on the autonomous mobile device 1, so that the position of the object can be accurately identified by the position information including the coordinate values.
  • the object movement information includes the relative speed and relative movement direction of the object with respect to the autonomous mobile device 1, so that the speed and movement direction of the object can be accurately identified.
  • the in-image detection information and real-space detection information regarding the object can be encoded in the SEI region 43 of the bitstream, allowing easy processing on the decoding device 2 side.
  • real-space detection information regarding the object can be appropriately derived by a conversion process from the unique coordinate system of the object detection unit 13 to the common coordinate system of the autonomous mobile device 1.
  • the decoding device 2 can effectively utilize on-screen detection information and real-space detection information regarding objects present around the autonomous mobile device 1, thereby improving the safety of the autonomous mobile device 1, such as collision avoidance performance. It can also improve decision-making regarding the operation of the autonomous mobile device 1 to improve the safety of the autonomous mobile device 1 in complex environments.
  • the intra-image detection information includes position information of the object within the image 100, so that the position information of the object within the image 100 can be effectively utilized.
  • the real space detection information includes position information and movement information of an object in real space, so that the position information and movement information of an object in real space can be effectively utilized.
  • the position information of an object includes coordinate values in a circular coordinate system based on the autonomous mobile device 1, so that the position of the object can be accurately identified by the position information including the coordinate values.
  • the object movement information includes the object's relative speed and relative movement direction with respect to the autonomous mobile device 1, so that the object's speed and movement direction can be accurately identified.
  • the in-image detection information and real-space detection information relating to the object are encoded in the SEI region 43 of the bitstream, which allows easy processing on the decoding device 2 side.
  • the operator can instantly and accurately grasp the situation around the autonomous mobile device 1 by visually checking the display image 200, which includes display position information and display movement information of an object in real space.
  • the position information of the object included in the real space detection information is used as the display position information
  • the movement information of the object included in the real space detection information is used as the display movement information, so that the display position information and the display movement information can be easily generated.
  • the display image 201 includes a figure G0 imitating the autonomous mobile device 1A which is the vehicle itself, a figure G1 imitating the autonomous mobile device 1B which is an object, a figure G2 imitating a pedestrian 6A which is an object, a figure G3 imitating a pedestrian 6B which is an object, position information for display of the objects in real space, and movement information D1 to D3 for display of the objects in real space.
  • the display image 201 has a coordinate plane of a circular coordinate system with the position of the figure G0 as the origin O.
  • the display position information includes figures G1 to G3 and distance information indicating the relative distance of each object with respect to the autonomous mobile device 1A.
  • the distance coordinate value L1 and the angle coordinate value ⁇ 1 of the circular coordinate system for figure G1 correspond to the distance coordinate value and the angle coordinate value included in the real space detection information for the autonomous mobile device 1B.
  • the display movement information D1 to D3 includes relative speed information indicating the relative speed of each object with respect to the autonomous mobile device 1A, and relative movement direction information indicating the relative movement direction of each object with respect to the autonomous mobile device 1A.
  • the relative movement direction information is represented as a bold arrow graphic.
  • the circuit 31 may highlight the figures G1 and G3 that correspond to objects that may collide with or approach the player's aircraft by flashing or coloring them, among the multiple objects.
  • an operator viewing the display image 201 can quickly identify which of multiple objects should be the focus of attention for monitoring.
  • (Second Modification) 13 is a simplified diagram showing an example of a display image 202 as a modified example of the display image 200.
  • the display image 202 includes figures G0 to G3, display position information of objects in real space, and display movement information D1 to D3 of the objects in real space.
  • the display image 202 has a coordinate plane of a Cartesian coordinate system with the position of the figure G0 as the origin O.
  • the Cartesian coordinate system has orthogonal X-axis and Y-axis.
  • the coordinate system of the autonomous mobile device 1A is a Cartesian coordinate system
  • the origin O of the coordinate system is the center point of the autonomous mobile device 1A.
  • the X-axis of the coordinate system corresponds to the direction of movement of the autonomous mobile device 1A.
  • the position of an object is indicated by the X-coordinate value and the Y-coordinate value in the Cartesian coordinate system.
  • the display position information includes figures G1 to G3 and distance information indicating the relative distance of each object to the autonomous mobile device 1A.
  • the X coordinate value X1 and the Y coordinate value Y1 in the Cartesian coordinate system for figure G1 correspond to the X coordinate value and the Y coordinate value included in the real space detection information for the autonomous mobile device 1B.
  • the display movement information D1 to D3 includes relative speed information indicating the relative speed of each object with respect to the autonomous mobile device 1A, and relative movement direction information indicating the relative movement direction of each object with respect to the autonomous mobile device 1A.
  • the relative movement direction information is represented as a bold arrow graphic.
  • the circuit 31 may highlight the figures G1 and G3 that correspond to objects that may collide with or approach the player's aircraft by flashing or coloring them, among the multiple objects.
  • an operator viewing the display image 201 can quickly identify which of multiple objects should be the focus of attention for monitoring.
  • FIG. 14 is a diagram showing figure G1 extracted from the display image 202 shown in FIG. 13.
  • Circuit 31 calculates display movement information D1 for an object based on multiple pieces of position information at multiple times for the object corresponding to figure G1, which is included in the real space detection information decoded from the bit stream BS.
  • Circuit 31 calculates the movement distance and movement direction of the object in real space based on the X coordinate value X1(t) and Y coordinate value Y1(t) of the object at a certain time t, and the X coordinate value X1(t-1) and Y coordinate value Y1(t-1) of the object at an earlier time t-1.
  • Circuit 31 also calculates the speed of the object based on the calculated movement distance and the time difference ⁇ t between time t and time t-1.
  • Equation (1) shows an example of a formula for calculating the velocity V of an object.
  • Equation (2) shows an example of a formula for calculating the object's movement direction A.
  • the circuit 31 generates display movement information D1 that includes speed information indicating the calculated speed and movement direction information indicating the calculated movement direction. Note that, although the example shown in FIG. 14 is explained using a Cartesian coordinate system, similar processing is also possible for a circular coordinate system.
  • the circuit 31 can appropriately calculate the display movement information D1 to D3 of the object based on multiple pieces of position information of the object at multiple times in real space.
  • (Fourth Modification) 15 is a simplified diagram showing an example of the display image 201.
  • a boundary Z is set around the figure G0.
  • the boundary Z corresponds to a circle having a radius of, for example, 1 m and centered on the position of the autonomous mobile device 1A in real space.
  • circuit 31 determines that there is a high possibility that autonomous mobile device 1A will collide with the object, and displays an alert in display image 201. For example, when autonomous mobile device 1B corresponding to figure G1 enters boundary Z, circuit 31 highlights figure G0 and/or figure G1 by blinking or coloring, etc. Note that although the example shown in FIG. 15 describes a circular coordinate system, similar processing is also possible for a Cartesian coordinate system.
  • an operator viewing the display image 201 can quickly grasp the occurrence of a situation in which there is a high possibility that the autonomous mobile device 1A will collide with an object, and can perform collision avoidance control, such as an emergency stop of the autonomous mobile device 1A by remote control.
  • collision avoidance control may be performed by automatic control by the circuit 31, instead of manual operation by the operator.
  • (Fifth Modification) 16 is a diagram showing a simplified configuration of an information processing system according to Modification 5.
  • the autonomous mobile device 1 includes a position detection unit 14, a speed detection unit 15, and an orientation detection unit 16 in addition to the configuration shown in FIG.
  • the position detection unit 14, the speed detection unit 15, and the orientation detection unit 16 input real-space detection information, which is detection information in real space regarding the autonomous mobile device 1, to the circuit 21.
  • the real-space detection information includes position information and movement information.
  • the position information regarding the autonomous mobile device 1 includes an absolute position.
  • the movement information regarding the autonomous mobile device 1 includes an absolute speed and an absolute movement direction.
  • the position detection unit 14 is configured with a GPS receiver and the like.
  • the position detection unit 14 detects the absolute position of the autonomous mobile device 1 and inputs the detected value to the circuit 21.
  • the absolute position is a coordinate value (latitude and longitude) in a geographic coordinate system such as world coordinates.
  • the speed detection unit 15 is configured with a tachometer and the like. The speed detection unit 15 detects the absolute speed of the autonomous mobile device 1 and inputs the detected value to the circuit 21.
  • the orientation detection unit 16 is configured with an acceleration sensor, a gyro sensor, or the like.
  • the orientation detection unit 16 detects the forward direction or absolute movement direction of the autonomous mobile device 1, and inputs the detection value to the circuit 21.
  • the circuit 21 derives real-space detection information regarding the autonomous mobile device 1 based on values obtained by converting the detection values from the position detection unit 14, the speed detection unit 15, and the direction detection unit 16 from the unique coordinate system of each detection unit into the common coordinate system of the autonomous mobile device 1.
  • FIG. 17 is a flowchart showing the flow of processing executed by the circuit 21 of the encoding device 11. Explanations of processing similar to that shown in the flowchart in FIG. 2 will be omitted.
  • step SP31 the circuit 21 acquires real-space detection information regarding the autonomous mobile device 1A from the position detection unit 14, the speed detection unit 15, and the orientation detection unit 16.
  • step SP32 the circuit 21 encodes the real space detection information related to the autonomous mobile device 1A into a bit stream BS.
  • the circuit 21 encodes the real space detection information acquired in step SP31 into a predetermined location in the header 41.
  • the predetermined location is the SEI area 43.
  • the predetermined location may be the VPS, SPS, PPS, PH, SH, APS, or a tile header, etc. Alternatively, the predetermined location may be the ARSEI area.
  • FIG. 18 shows a simplified example of syntax.
  • third_information includes real-space detection information related to the autonomous mobile device 1A.
  • FIG. 19 is a flowchart showing the flow of processing executed by the circuit 31 of the decoding device 2. Explanations of processing similar to that shown in the flowchart in FIG. 10 will be omitted.
  • step SP33 the circuit 31 decodes the real space detection information related to the autonomous mobile device 1A from the header 41 of the bit stream BS.
  • step SP25 circuit 31 generates display image 200 for human vision by the operator based on the images and information decoded in steps SP22 to SP24 and SP33.
  • FIG. 20 is a simplified diagram showing an example of display image 200.
  • circuit 31 may convert relative position information of an object in real space decoded in step SP24 into absolute position information of the object in real space using absolute position information of autonomous mobile device 1A in real space decoded in step SP33.
  • the circuit 31 may also convert the relative movement information of the object in real space decoded in step SP24 into absolute movement information of the object in real space using the absolute movement information of the autonomous mobile device 1A in real space decoded in step SP33.
  • the relative speed of each object with respect to the autonomous mobile device 1A is converted into an absolute speed.
  • the circuit 31 may also include in the display image 200 the absolute movement information and absolute position information of the autonomous mobile device 1A in real space decoded in step SP33.
  • the display image 200 includes host information C0 indicating the absolute speed and absolute position of the autonomous mobile device 1A.
  • the host information C0 may further include the absolute movement direction of the autonomous mobile device 1A.
  • the absolute movement direction may be indicated, for example, by orientation information indicating the movement direction of the autonomous mobile device 1A.
  • processing according to this modified example may be applied not only to display image 200 but also to display images 201 and 202.
  • the absolute position information and absolute movement information of the autonomous mobile device 1A in real space can be effectively utilized on the decoding device 2 side.
  • FIG. 21 is a simplified diagram showing an example of a display image 203 as a modified example of the display image 202.
  • the display image 203 includes a figure G4 that resembles a pedestrian 6C, which is an object, in addition to the figures G0 to G3 shown in Fig. 13.
  • the pedestrian 6C is photographed by the imaging unit 12 of the autonomous mobile device 1B.
  • the circuit 21 of the encoding device 11 of the autonomous mobile device 1B encodes the image photographed by the imaging unit 12, intra-image detection information relating to objects contained in the image, and real-space detection information relating to the objects into a bit stream BS and transmits it to the decoding device 2.
  • the real-space detection information includes relative position information and relative movement information of the pedestrian 6C with respect to the autonomous mobile device 1B, and absolute position information and absolute movement information of the autonomous mobile device 1B.
  • the circuit 31 of the decoding device 2 receives multiple bit streams BS from multiple autonomous mobile devices 1A, 1B.
  • the circuit 31 generates a display image 203 based on multiple images decoded from the multiple bit streams BS.
  • the circuit 31 calculates absolute position information and absolute movement information of the pedestrian 6C by converting the relative position information and relative movement information of the pedestrian 6C with respect to the autonomous mobile device 1B using the absolute position information and absolute movement information of the autonomous mobile device 1B. This makes it possible to include in the display image 203 a figure G4 corresponding to the pedestrian 6C that cannot be photographed by the photographing unit 12 of the autonomous mobile device 1A.
  • the display movement information D0 to D4 includes absolute speed information indicating the absolute speed of each object and absolute movement direction information indicating the absolute movement direction of each object. Note that although the Cartesian coordinate system has been described in the example shown in FIG. 21, similar processing is also possible for a circular coordinate system.
  • multiple images captured by multiple autonomous mobile devices 1A and 1B can complement each other's blind spots during capture, improving the convenience of the display image 203.
  • FIG. 22 is a simplified diagram showing the configuration of an information processing system according to a second embodiment of the present disclosure.
  • the information processing system includes autonomous mobile devices 1A and 1B.
  • the autonomous mobile device 1A has an encoding device 11A, a photographing unit 12A, an object detection unit 13A, a position detection unit 14A, a speed detection unit 15A, an orientation detection unit 16A, a decoding device 2A, and a driving unit 17A.
  • the encoding device 11A includes a circuit 21A and a memory 22A.
  • the decoding device 2A includes a circuit 31A and a memory 32A.
  • the driving unit 17A is configured with the traveling motor of the autonomous mobile device 1A, etc.
  • the autonomous mobile device 1B has an encoding device 11B, a photographing unit 12B, an object detection unit 13B, a position detection unit 14B, a speed detection unit 15B, an orientation detection unit 16B, a decoding device 2B, and a driving unit 17B.
  • the encoding device 11B includes a circuit 21B and a memory 22B.
  • the decoding device 2B includes a circuit 31B and a memory 32B.
  • the driving unit 17B is configured with the traveling motor of the autonomous mobile device 1B, etc.
  • Circuit 21B of encoding device 11B transmits bit stream BSB, and circuit 31A of decoding device 2A receives bit stream BSB.
  • Encoding device 11A is mounted on autonomous mobile device 1B, and decoding device 2A is mounted on autonomous mobile device 1A that is different from autonomous mobile device 1B.
  • circuit 21A of encoding device 11A transmits bit stream BSA, and circuit 31B of decoding device 2B receives bit stream BSA.
  • FIG. 23 is a flowchart showing the flow of processing executed by circuit 31A of decoding device 2A.
  • step SP51 circuit 31A receives bit stream BSB from autonomous mobile device 1B.
  • circuit 31A decodes image 100B, which includes an object, from payload 42 of bitstream BSB.
  • FIG. 24 is a diagram showing an example of an image 100B captured by the image capture unit 12B of the autonomous mobile device 1B.
  • Image 100B includes, as objects, the autonomous mobile device 1A and a pedestrian 6C walking behind the autonomous mobile device 1A.
  • step SP53 circuit 31A decodes intra-image detection information relating to objects contained in image 100B from header 41 of bitstream BSB.
  • step SP54 circuit 31A decodes real space detection information regarding objects contained in image 100B from header 41 of bit stream BSB.
  • step SP55 the circuit 31A decodes the real space detection information related to the autonomous mobile device 1B from the header 41 of the bit stream BSB.
  • step SP56 the circuit 31A obtains from the circuit 21A the image 100 captured by the image capture unit 12A of the autonomous mobile device 1A, the intra-image detection information and real-space detection information relating to objects contained in the image 100, and the real-space detection information relating to the autonomous mobile device 1A.
  • circuit 31A controls the driving of autonomous mobile device 1A by drive unit 17A based on the in-image detection information and real-space detection information regarding the object decoded from bit stream BSB and the in-image detection information and real-space detection information regarding the object acquired from circuit 21A.
  • the circuit 31A generates a map 300 showing the position information and movement information of objects present around the autonomous mobile device 1A.
  • the circuit 31A converts the real space detection information of the object using a coordinate system based on the autonomous mobile device 1B, which is decoded from the bit stream BSB, into real space detection information of the object using a coordinate system based on the autonomous mobile device 1A.
  • the circuit 31A calculates the absolute position information and absolute movement information of the pedestrian 6C by converting the relative position information and relative movement information of the pedestrian 6C with respect to the autonomous mobile device 1B using the absolute position information and absolute movement information of the autonomous mobile device 1B.
  • the circuit 31A includes the absolute position information and absolute movement information of the object corresponding to the pedestrian 6C in the map 300.
  • the circuit 31A may calculate the relative position information and relative speed information of the pedestrian 6C with respect to the autonomous mobile device 1A by converting the absolute position information and absolute movement information of the pedestrian 6C using the absolute position information and absolute movement information of the autonomous mobile device 1A.
  • the circuit 31A may include in the map 300 the relative position information and relative movement information of the pedestrian 6C with respect to the autonomous mobile device 1A.
  • FIG. 25 is a diagram showing a simplified example of map 300.
  • Map 300 has a coordinate plane of a Cartesian coordinate system with the absolute position of autonomous mobile device 1A as origin O and the direction of movement of autonomous mobile device 1A as X-axis.
  • Map 300 includes absolute position information and absolute movement information of objects corresponding to autonomous mobile device 1B and pedestrians 6A and 6B, as well as absolute position information and absolute movement information of an object corresponding to pedestrian 6C.
  • a boundary Z is set around the autonomous mobile device 1A.
  • the boundary Z corresponds to a circle with a radius of, for example, 1 m, centered on the position of the autonomous mobile device 1A in real space.
  • the circuit 31 determines that there is a high possibility that the autonomous mobile device 1A will collide with the object, and performs collision avoidance control, such as bringing the autonomous mobile device 1A to an emergency stop using the drive unit 17A.
  • the circuit 31A may generate a table that lists the position information and movement information of objects present around the autonomous mobile device 1A.
  • multiple autonomous mobile devices 1A, 1B communicate with each other to exchange in-image detection information and real-space detection information related to objects, so that the autonomous mobile device 1A can effectively use this information received from another autonomous mobile device 1B in controlling the operation of its own vehicle, thereby improving the safety of the autonomous mobile device 1, such as its collision avoidance performance.
  • This disclosure is particularly useful for application to product delivery systems or transportation systems that use autonomous mobile devices.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

復号装置は、回路と、前記回路に接続されたメモリと、を備え、前記回路は、撮影部を有する自律走行機器からビットストリームを受信し、前記撮影部によって撮影された画像を、前記ビットストリームから復号し、前記画像に含まれるオブジェクトに関する、前記画像内における検出情報である画像内検出情報を、前記ビットストリームから復号し、前記オブジェクトに関する、実空間における検出情報である実空間検出情報を、前記ビットストリームから復号する。

Description

復号装置、符号化装置、復号方法、及び符号化方法
 本開示は、復号装置、符号化装置、復号方法、及び符号化方法に関する。
 特許文献1には、物体検出部と自律モジュールとを備える自律走行車両が開示されている。物体検出部は、カメラ等を用いて検知距離を測定する。自律モジュールは、検知距離内に制限された制御範囲を決定し、学習されたユーザの運転傾向と外部データによって規定された運転傾向とを車両の運転制御関連データに反映する。
米国特許出願公開第2021/0278840号明細書
 本開示は、自律走行機器の周囲に存在するオブジェクトに関する検出情報を有効に活用でき、それによって衝突回避性能等の自律走行機器の安全性を向上することを目的とする。
 本開示の一態様に係る復号装置は、回路と、前記回路に接続されたメモリと、を備え、前記回路は、撮影部を有する自律走行機器からビットストリームを受信し、前記撮影部によって撮影された画像を、前記ビットストリームから復号し、前記画像に含まれるオブジェクトに関する、前記画像内における検出情報である画像内検出情報を、前記ビットストリームから復号し、前記オブジェクトに関する、実空間における検出情報である実空間検出情報を、前記ビットストリームから復号する。
本開示の第1実施形態に係る情報処理システムの構成を簡略化して示す図である。 符号化装置の回路が実行する処理の流れを示すフローチャートである。 自律走行機器の走行状況の一例を模式的に示す図である。 撮影部によって撮影された画像の一例を模式的に示す図である。 画像の解析結果の一例を模式的に示す図である。 オブジェクトに関する実空間検出情報及び画像内検出情報の一例を簡略化して示す図である。 自律走行機器の座標系の一例を示す図である。 ビットストリームのデータ構造を簡略化して示す図である。 シンタックスの一例を簡略化して示す図である。 復号装置の回路が実行する処理の流れを示すフローチャートである。 表示画像の一例を簡略化して示す図である。 表示画像の一例を簡略化して示す図である。 表示画像の一例を簡略化して示す図である。 図13に示した表示画像から一部の図形を抜き出して示す図である。 表示画像の一例を簡略化して示す図である。 変形例に係る情報処理システムの構成を簡略化して示す図である。 符号化装置の回路が実行する処理の流れを示すフローチャートである。 シンタックスの一例を簡略化して示す図である。 復号装置の回路が実行する処理の流れを示すフローチャートである。 表示画像の一例を簡略化して示す図である。 表示画像の一例を簡略化して示す図である。 本開示の第2実施形態に係る情報処理システムの構成を簡略化して示す図である。 復号装置の回路が実行する処理の流れを示すフローチャートである。 撮影部によって撮影された画像の一例を模式的に示す図である。 マップの一例を簡略化して示す図である。
 (本開示の基礎となった知見)
 自律走行車等の自律走行機器を用いた商品配送システムでは、無人の自律走行機器が歩行者と同程度の速度で歩道を走行し、商品を配送する。自律走行機器には、カメラ、GPS受信機、及び障害物センサ等が搭載され、安全走行の実現のためにそれらが相互に機能を補完し合う。しかし、非常に複雑な環境下においても確実に安全走行を行うには技術的な限界があり、問題が発生した場合には遠隔操作による人間のオペレータの介入が必要となる。そのため、自律走行機器は、自機に搭載されたカメラによって撮影された画像を、オペレータが常駐している監視センタにリアルタイムで送信する。
 しかし、一人のオペレータが同時に複数の自律走行機器を監視する場合等には、オペレータは、自律走行機器から受信した画像を視認しても、自律走行機器の周囲の状況を瞬時かつ正確に把握することは困難である。
 かかる課題を解決するために、本発明者は、カメラによって撮影された画像のみならず、自律走行機器に搭載されているセンサによって検出された実空間における検出情報を、自律走行機器から監視センタに送信して有効活用することによって、上記問題を解決できるとの知見を得て、本開示を想到するに至った。
 次に、本開示の各態様について説明する。
 本開示の第1態様に係る復号装置は、回路と、前記回路に接続されたメモリと、を備え、前記回路は、撮影部を有する自律走行機器からビットストリームを受信し、前記撮影部によって撮影された画像を、前記ビットストリームから復号し、前記画像に含まれるオブジェクトに関する、前記画像内における検出情報である画像内検出情報を、前記ビットストリームから復号し、前記オブジェクトに関する、実空間における検出情報である実空間検出情報を、前記ビットストリームから復号する。
 第1態様によれば、自律走行機器の周囲に存在するオブジェクトに関する画面内検出情報及び実空間検出情報を復号装置側で有効活用でき、それによって衝突回避性能等の自律走行機器の安全性を向上できる。また、複雑な環境下において自律走行機器の安全性を向上させるための自律走行機器の動作の意思決定を向上できる。
 本開示の第2態様に係る復号装置は、第1態様において、前記オブジェクトに関する前記画像内検出情報は、前記画像内における前記オブジェクトの位置情報を含むと良い。
 第2態様によれば、画像内におけるオブジェクトの位置情報を復号装置側で有効活用できる。
 本開示の第3態様に係る復号装置は、第1又は第2態様において、前記オブジェクトに関する前記実空間検出情報は、前記実空間における前記オブジェクトの位置情報、及び、前記実空間における前記オブジェクトの移動情報の少なくとも一方を含むと良い。
 第3態様によれば、実空間におけるオブジェクトの位置情報及び移動情報を復号装置側で有効活用できる。
 本開示の第4態様に係る復号装置は、第3態様において、前記オブジェクトの前記位置情報は、前記自律走行機器を基準とした円座標系における座標値、前記自律走行機器を基準としたデカルト座標系における座標値、又は、地理座標系における座標値を含むと良い。
 第4態様によれば、座標値を含む位置情報によって、オブジェクトの位置を正確に特定できる。
 本開示の第5態様に係る復号装置は、第3又は第4態様において、前記オブジェクトの前記移動情報は、前記オブジェクトの絶対速度又は前記自律走行機器に対する前記オブジェクトの相対速度と、前記オブジェクトの絶対移動方向又は前記自律走行機器に対する前記オブジェクトの相対移動方向との少なくとも一方を含むと良い。
 第5態様によれば、絶対速度又は相対速度と絶対移動方向又は相対移動方向との少なくとも一方を含む移動情報によって、オブジェクトの速度及び移動方向の少なくとも一方を正確に特定できる。
 本開示の第6態様に係る復号装置は、第1~第5態様のいずれか一つにおいて、前記回路は、さらに、前記自律走行機器に関する実空間検出情報を前記ビットストリームから復号し、前記自律走行機器に関する前記実空間検出情報は、前記実空間における前記自律走行機器の位置情報、及び、前記実空間における前記自律走行機器の移動情報を含むと良い。
 第6態様によれば、実空間における自律走行機器の位置情報及び移動情報を復号装置側で有効活用できる。
 本開示の第7態様に係る復号装置は、第6態様において、前記自律走行機器の前記位置情報は、地理座標系における座標値を含むと良い。
 第7態様によれば、地理座標系における座標値を含む位置情報によって、自律走行機器の絶対位置を正確に特定できる。
 本開示の第8態様に係る復号装置は、第6又は第7態様において、前記自律走行機器の前記移動情報は、前記自律走行機器の絶対速度及び絶対移動方向の少なくとも一方を含むと良い。
 第8態様によれば、移動情報によって、自律走行機器の絶対速度及び絶対移動方向の少なくとも一方を正確に特定できる。
 本開示の第9態様に係る復号装置は、第6~第8態様のいずれか一つにおいて、前記回路は、前記オブジェクトに関する前記画像内検出情報及び前記実空間検出情報と、前記自律走行機器に関する前記実空間検出情報とを、前記ビットストリームのSEI領域から復号すると良い。
 第9態様によれば、オブジェクトに関する画像内検出情報及び実空間検出情報と自律走行機器に関する実空間検出情報とがビットストリームのSEI領域に符号化されていることにより、復号装置側で簡易に処理できる。
 本開示の第10態様に係る復号装置は、第1~第9態様のいずれか一つにおいて、前記回路は、さらに、ヒューマンビジョンのための表示画像を生成し、前記表示画像は、前記オブジェクトと、前記実空間における前記オブジェクトの表示用位置情報、及び、前記実空間における前記オブジェクトの表示用移動情報の少なくとも一方と、を含むと良い。
 第10態様によれば、実空間におけるオブジェクトの表示用位置情報及び表示用移動情報を含む表示画像を視認することによって、オペレータは自律走行機器の周囲の状況を瞬時かつ正確に把握できる。
 本開示の第11態様に係る復号装置は、第10態様において、前記自律走行機器は複数の自律走行機器を含み、前記回路は、前記複数の自律走行機器から受信した複数のビットストリームから復号した複数の画像に基づいて、前記表示画像を生成すると良い。
 第11態様によれば、複数の自律走行機器で撮影された複数の画像によって撮影時の死角を互いに補完できるため、表示画像の利便性を向上できる。
 本開示の第12態様に係る復号装置は、第10又は第11態様において、前記回路は、前記ビットストリームから復号された、前記オブジェクトに関する前記実空間検出情報に含まれる、前記実空間における前記オブジェクトの位置情報を、前記オブジェクトの前記表示用位置情報として用い、前記ビットストリームから復号された、前記オブジェクトに関する前記実空間検出情報に含まれる、前記実空間における前記オブジェクトの移動情報を、前記オブジェクトの前記表示用移動情報として用いると良い。
 第12態様によれば、表示用位置情報及び表示用移動情報を簡易に生成できる。
 本開示の第13態様に係る復号装置は、第10又は第11態様において、前記回路は、さらに、前記実空間における前記自律走行機器の位置情報と、前記実空間における前記自律走行機器の移動情報とを、前記ビットストリームから復号し、前記ビットストリームから復号された、前記オブジェクトに関する前記実空間検出情報に含まれる、前記実空間における前記オブジェクトの位置情報を、前記ビットストリームから復号された、前記実空間における前記自律走行機器の前記位置情報を用いて変換することにより、前記オブジェクトの前記表示用位置情報を算出し、前記ビットストリームから復号された、前記オブジェクトに関する前記実空間検出情報に含まれる、前記実空間における前記オブジェクトの移動情報を、前記ビットストリームから復号された、前記実空間における前記自律走行機器の前記移動情報を用いて変換することにより、前記オブジェクトの前記表示用移動情報を算出すると良い。
 第13態様によれば、オブジェクトの相対位置を絶対位置に変換して表示でき、オブジェクトの相対速度及び相対移動方向を絶対速度及び絶対移動方向に変換して表示できる。
 本開示の第14態様に係る復号装置は、第10又は第11態様において、前記回路は、前記ビットストリームから復号された、前記オブジェクトに関する前記実空間検出情報に含まれる、前記実空間における前記オブジェクトの複数の時刻における複数の位置情報に基づいて、前記オブジェクトの前記表示用移動情報を算出すると良い。
 第14態様によれば、自律走行機器から受信したビットストリームに、実空間におけるオブジェクトの移動情報が含まれていない場合であっても、実空間におけるオブジェクトの複数の時刻における複数の位置情報に基づいて、オブジェクトの表示用移動情報を適切に算出できる。
 本開示の第15態様に係る復号装置は、第1~第14態様のいずれか一つにおいて、前記復号装置は、前記自律走行機器とは別の自律走行機器に搭載され、前記回路は、さらに、前記自律走行機器から受信した前記ビットストリームから復号された、前記オブジェクトに関する前記画像内検出情報及び前記実空間検出情報と、前記別の自律走行機器が有する撮影部によって撮影された画像に含まれるオブジェクトに関する画像内検出情報及び実空間検出情報とに基づいて、前記別の自律走行機器の動作を制御すると良い。
 第15態様によれば、複数の自律走行機器間でオブジェクトに関する画像内検出情報及び実空間検出情報を相互に通信することにより、各自律走行機器は、別の自律走行機器から受信したこれらの情報を自機の動作制御に有効活用でき、それによって衝突回避性能等の自律走行機器の安全性を向上できる。
 本開示の第16態様に係る復号装置は、第15態様において、前記回路は、前記自律走行機器から受信した前記ビットストリームから復号された、前記自律走行機器を基準とした座標系を用いた、前記オブジェクトに関する前記実空間検出情報を、前記別の自律走行機器を基準とした座標系を用いた、前記オブジェクトに関する前記実空間検出情報に変換すると良い。
 第16態様によれば、座標系の変換処理によって、各自律走行機器は、別の自律走行機器で検出されたオブジェクトに関する実空間検出情報を、自機の自律走行機器で検出されたオブジェクトに関する実空間検出情報として使用できる。
 本開示の第17態様に係る符号化装置は、撮影部を有する自律走行機器に搭載される符号化装置であって、回路と、前記回路に接続されたメモリと、を備え、前記回路は、前記撮影部によって撮影された画像を、ビットストリームに符号化し、前記画像に含まれるオブジェクトに関する、前記画像内における検出情報である画像内検出情報を、前記ビットストリームに符号化し、前記オブジェクトに関する、実空間における検出情報である実空間検出情報を、前記ビットストリームに符号化する。
 第17態様によれば、自律走行機器の周囲に存在するオブジェクトに関する画面内検出情報及び実空間検出情報をビットストリームに符号化することにより、ビットストリームを受信する復号装置側でこれらの情報を有効活用でき、それによって衝突回避性能等の自律走行機器の安全性を向上できる。また、複雑な環境下において自律走行機器の安全性を向上させるための自律走行機器の動作の意思決定を向上できる。
 本開示の第18態様に係る符号化装置は、第17態様において、前記オブジェクトに関する前記画像内検出情報は、前記画像内における前記オブジェクトの位置情報を含むと良い。
 第18態様によれば、画像内におけるオブジェクトの位置情報を復号装置側で有効活用できる。
 本開示の第19態様に係る符号化装置は、第17又は第18態様において、前記オブジェクトに関する前記実空間検出情報は、前記実空間における前記オブジェクトの位置情報、及び、前記実空間における前記オブジェクトの移動情報の少なくとも一方を含むと良い。
 第19態様によれば、実空間におけるオブジェクトの位置情報及び移動情報を復号装置側で有効活用できる。
 本開示の第20態様に係る符号化装置は、第19態様において、前記オブジェクトの前記位置情報は、前記自律走行機器を基準とした円座標系における座標値、前記自律走行機器を基準としたデカルト座標系における座標値、又は、地理座標系における座標値を含むと良い。
 第20態様によれば、座標値を含む位置情報によって、オブジェクトの位置を正確に特定できる。
 本開示の第21態様に係る符号化装置は、第19又は第20態様において、前記オブジェクトの前記移動情報は、前記オブジェクトの絶対速度又は前記自律走行機器に対する前記オブジェクトの相対速度と、前記オブジェクトの絶対移動方向又は前記自律走行機器に対する前記オブジェクトの相対移動方向との少なくとも一方を含むと良い。
 第21態様によれば、絶対速度又は相対速度と絶対移動方向又は相対移動方向との少なくとも一方を含む移動情報によって、オブジェクトの速度及び移動方向の少なくとも一方を正確に特定できる。
 本開示の第22態様に係る符号化装置は、第17~第21態様のいずれか一つにおいて、前記回路は、さらに、前記自律走行機器に関する実空間検出情報を前記ビットストリームに符号化し、前記自律走行機器に関する前記実空間検出情報は、前記実空間における前記自律走行機器の位置情報、及び、前記実空間における前記自律走行機器の移動情報を含むと良い。
 第22態様によれば、実空間における自律走行機器の位置情報及び移動情報を復号装置側で有効活用できる。
 本開示の第23態様に係る符号化装置は、第22態様において、前記自律走行機器の前記位置情報は、地理座標系における座標値を含むと良い。
 第23態様によれば、地理座標系における座標値を含む位置情報によって、自律走行機器の絶対位置を正確に特定できる。
 本開示の第24態様に係る符号化装置は、第22又は第23態様において、前記自律走行機器の前記移動情報は、前記自律走行機器の絶対速度及び絶対移動方向の少なくとも一方を含むと良い。
 第24態様によれば、移動情報によって、自律走行機器の絶対速度及び絶対移動方向の少なくとも一方を正確に特定できる。
 本開示の第25態様に係る符号化装置は、第17~第24態様のいずれか一つにおいて、前記回路は、前記オブジェクトに関する前記画像内検出情報及び前記実空間検出情報を、前記ビットストリームのSEI領域に符号化すると良い。
 第25態様によれば、オブジェクトに関する画像内検出情報及び実空間検出情報をビットストリームのSEI領域に符号化することにより、復号装置側で簡易に処理できる。
 本開示の第26態様に係る符号化装置は、第17~第25態様のいずれか一つにおいて、前記自律走行機器は、前記実空間において前記オブジェクトを検出する検出部をさらに有し、前記回路は、前記検出部による検出値を前記検出部の座標系から前記自律走行機器の座標系に変換した値に基づいて、前記オブジェクトに関する前記実空間検出情報を導出すると良い。
 第26態様によれば、検出部の独自の座標系から自律走行機器の共通の座標系への変換処理によって、オブジェクトに関する実空間検出情報を適切に導出できる。
 本開示の第27態様に係る復号方法は、復号装置が、撮影部を有する自律走行機器からビットストリームを受信し、前記撮影部によって撮影された画像を、前記ビットストリームから復号し、前記画像に含まれるオブジェクトに関する、前記画像内における検出情報である画像内検出情報を、前記ビットストリームから復号し、前記オブジェクトに関する、実空間における検出情報である実空間検出情報を、前記ビットストリームから復号する。
 第27態様によれば、自律走行機器の周囲に存在するオブジェクトに関する画面内検出情報及び実空間検出情報を復号装置側で有効活用でき、それによって衝突回避性能等の自律走行機器の安全性を向上できる。また、複雑な環境下において自律走行機器の安全性を向上させるための自律走行機器の動作の意思決定を向上できる。
 本開示の第28態様に係る符号化方法は、撮影部を有する自律走行機器に搭載される符号化装置が、前記撮影部によって撮影された画像を、ビットストリームに符号化し、前記画像に含まれるオブジェクトに関する、前記画像内における検出情報である画像内検出情報を、前記ビットストリームに符号化し、前記オブジェクトに関する、実空間における検出情報である実空間検出情報を、前記ビットストリームに符号化する。
 第28態様によれば、自律走行機器の周囲に存在するオブジェクトに関する画面内検出情報及び実空間検出情報をビットストリームに符号化することにより、ビットストリームを受信する復号装置側でこれらの情報を有効活用でき、それによって衝突回避性能等の自律走行機器の安全性を向上できる。また、複雑な環境下において自律走行機器の安全性を向上させるための自律走行機器の動作の意思決定を向上できる。
 (本開示の実施形態)
 以下、本開示の実施形態について、図面を用いて詳細に説明する。なお、異なる図面において同一の符号を付した要素は、同一又は相応する要素を示すものとする。
 なお、以下で説明する実施形態は、いずれも本開示の一具体例を示すものである。以下の実施形態で示される数値、形状、構成要素、ステップ、ステップの順序等は、一例であり、本開示を限定する主旨ではない。また、以下の実施形態における構成要素のうち、最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また、全ての実施形態において、各々の内容を組み合わせることもできる。
 (第1実施形態)
 図1は、本開示の第1実施形態に係る情報処理システムの構成を簡略化して示す図である。情報処理システムは、自律走行機器1、伝送路NW、復号装置2、及び表示装置3を備えている。
 自律走行機器1は、例えば、商品配送システムにおいて無人で商品を配送する自律走行車両である。自律走行機器1は、符号化装置11、撮影部12、及びオブジェクト検出部13を有している。図1には一つの自律走行機器1を示したが、同一構成の複数の自律走行機器1が存在しても良い。
 符号化装置11は、回路21と、回路21に接続されたメモリ22とを含む。回路21は、CPU等のプロセッサを備えて構成されている。メモリ22は、ROM、RAM、HDD、SSD、又は半導体メモリ等の任意の記録媒体を備えて構成されている。メモリ22は、回路21による処理対象又は処理途中のデータ等を記憶する。
 撮影部12は、光学系及びCMOSイメージセンサ等を有するカメラを備えて構成されている。撮影部12は、自律走行機器1の周囲(特に移動方向前方)を撮影する。
 オブジェクト検出部27は、LiDAR(Light Detection And Ranging)等を備えて構成されている。オブジェクト検出部27は、実空間において自律走行機器1の周囲に存在するオブジェクトを検出する。オブジェクト検出部27は、オブジェクトに関する、実空間における検出情報である実空間検出情報を、回路21に入力する。実空間検出情報は、オブジェクトまでの距離、オブジェクトが存在する方向、及びオブジェクトの形状等を含む。
 伝送路NWは、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、又はこれらの任意の組合せである。伝送路NWは、アクセス制限によってセキュア通信が確保されたプライベートネットワーク等であることが望ましい。
 復号装置2及び表示装置3は、例えば、自律走行機器1を遠隔で監視するオペレータが常駐する監視センタに配置されている。
 復号装置2は、回路31と、回路31に接続されたメモリ32とを含む。回路31は、CPU等のプロセッサを備えて構成されている。メモリ32は、ROM、RAM、HDD、SSD、又は半導体メモリ等の任意の記録媒体を備えて構成されている。メモリ32は、回路31による処理対象又は処理途中のデータ等を記憶する。
 表示装置3は、液晶ディスプレイ又は有機ELディスプレイ等である。
 符号化装置11の回路21は、ビットストリームBSを、伝送路NWを介して復号装置2に送信する。復号装置2の回路31は、ビットストリームBSを受信し、オペレータによるヒューマンビジョンのための表示画像を生成する。表示装置3は、表示画像を表示する。
 図2は、符号化装置11の回路21が実行する処理の流れを示すフローチャートである。
 ステップSP11において回路21は、撮影部12によって撮影された画像を取得する。画像は、自律走行機器1の周囲に存在するオブジェクトを含む。
 図3は、自律走行機器1の走行状況の一例を模式的に示す図である。歩道5上に、自律走行機器1A,1Bと歩行者6A~6Cとが存在している。自律走行機器1Aは、紙面の上方向に走行している。自律走行機器1Bは、自律走行機器1Aの移動方向前方で、紙面の下方向に走行している。歩行者6Aは、自律走行機器1Aの移動方向前方で、紙面の右方向に歩行している。歩行者6Bは、自律走行機器1Aの移動方向前方で、紙面の下方向に歩行している。歩行者6Cは、自律走行機器1Aの移動方向後方で、紙面の上方向に歩行している。
 図4は、自律走行機器1Aの撮影部12によって撮影された画像100の一例を模式的に示す図である。画像100は、自機(自律走行機器1A)に向かって移動してくる自律走行機器1B及び歩行者6Bと、自機の前方を横切る歩行者6Aとを含む。
 ステップSP12において回路21は、画像100に含まれるオブジェクトに関する実空間検出情報を、オブジェクト検出部13から取得する。オブジェクトに関する実空間検出情報は、オブジェクトである自律走行機器1B及び歩行者6A,6Bの各々に関して、オブジェクトまでの距離、オブジェクトが存在する方向、及びオブジェクトの形状等を含む。ステップSP12は、ステップSP11と同時に実行されても良い。
 ステップSP13において回路21は、ステップSP11で取得した画像100を解析する。画像100の解析は、例えば機械学習済みの推定モデルを用いた、オブジェクト検出処理及びオブジェクト認識処理を含む。回路21は、画像100に含まれるオブジェクトに関する、画像100内における検出情報である画像内検出情報を生成する。画像内検出情報は、オブジェクト検出処理の結果として、画像100内におけるオブジェクトの位置情報を含む。画像内検出情報は、オブジェクト認識処理の結果として、画像100内におけるオブジェクトの属性情報等を含んでも良い。属性は、自律走行機器、人物、又は自転車等のオブジェクトの種別を表す。
 図5は、回路21による画像100の解析結果の一例を模式的に示す図である。回路21は、画像100内におけるオブジェクトの位置情報として、オブジェクトを囲むバウンディングボックスBBを画像100内に設定する。具体的に、回路21は、自律走行機器1Bを囲むバウンディングボックスBB1と、歩行者6Aを囲むバウンディングボックスBB2と、歩行者6Bを囲むバウンディングボックスBB3とを設定する。
 回路21は、バウンディングボックスBBの特定の頂点(例えば左上角の頂点)の座標値と、バウンディングボックスBBの高さ及び幅とによって、バウンディングボックスBBの位置及び形状を指定する。あるいは、回路21は、バウンディングボックスBBの中心点の座標値と、バウンディングボックスBBの高さ及び幅とによって、バウンディングボックスBBの位置及び形状を指定しても良い。あるいは、回路21は、バウンディングボックスBBの4つの頂点の座標値によって、バウンディングボックスBBの位置及び形状を指定しても良い。あるいは、回路21は、バウンディングボックスBBの対角線上に位置する2つの頂点の座標値によって、バウンディングボックスBBの位置及び形状を指定しても良い。
 また、回路21は、オブジェクト検出部13によって検出された実空間のオブジェクトと、画像解析によって検出された画像100内のオブジェクトとを対応付ける。
 図6は、オブジェクトに関する実空間検出情報及び画像内検出情報の一例を簡略化して示す図である。実空間検出情報は、位置情報及び移動情報を含む。位置情報は、距離及び方向を含む。移動情報は、速度及び移動方向を含む。回路21は、複数の時刻におけるオブジェクト検出部13の位置の検出結果に基づいて、オブジェクトの速度及び移動方向を算出する。但し、オブジェクトの速度及び移動方向を含む移動情報の算出は、符号化装置11の回路21に代えて、復号装置2の回路31が行っても良い。画像内検出情報は、対応するバウンディングボックスBBの位置及び形状を示す情報を含む。
 オブジェクト検出部13の座標系の原点はオブジェクト検出部13の中心点であり、自律走行機器1Aの座標系の原点は自律走行機器1Aの中心点であり、両者は異なる。そこで、回路21は、オブジェクト検出部13による検出値を、オブジェクト検出部13の独自の座標系から自律走行機器1Aの共通の座標系に変換した値に基づいて、オブジェクトに関する実空間検出情報を導出する。
 図7は、自律走行機器1Aの座標系の一例を示す図である。図7に示した例において、自律走行機器1Aの座標系は円座標系であり、座標系の原点Oは自律走行機器1Aの中心点である。座標系の角度0°は、自律走行機器1Aの移動方向に対応する。円座標系における距離座標値及び角度座標値によって、オブジェクトの位置が示される。また、円座標系における角度座標値によって、オブジェクトの移動方向が示される。
 図6に示した例では、距離、方向、速度、及び移動方向は、自律走行機器1Aに対するオブジェクトの相対距離、相対方向、相対速度、及び相対移動方向である。
 オブジェクトである自律走行機器1Bに関しては、対応するバウンディングボックスBBはバウンディングボックスBB1であり、相対距離は5.0mであり、相対方向は30.0°であり、相対速度は8.5km/hであり、相対移動方向は180.0°である。また、オブジェクトである歩行者6Aに関しては、対応するバウンディングボックスBBはバウンディングボックスBB2であり、相対距離は9.8mであり、相対方向は-28.5°であり、相対速度は7.7km/hであり、相対移動方向は-90.0°である。また、オブジェクトである歩行者6Bに関しては、対応するバウンディングボックスBBはバウンディングボックスBB3であり、相対距離は13.1mであり、相対方向は10.0°であり、相対速度は12.5km/hであり、相対移動方向は180.0°である。
 なお、自律走行機器1Aの座標系は、上記の円座標系に限らず、デカルト座標系であっても良い。デカルト座標系は、例えば、自律走行機器1Aの前後方向をX軸、自律走行機器1Aの左右方向をY軸、自律走行機器1Aの中心点を原点として、オブジェクトの位置をX軸の値とY軸の値とで示しても良い。
 ステップSP14において回路21は、ステップSP11で取得した画像100をビットストリームBSに符号化する。
 図8は、ビットストリームBSのデータ構造を簡略化して示す図である。ビットストリームBSは、ヘッダ41及びペイロード42を有する。ヘッダ41は、付加情報を格納するためのSEI(Supplemental Enhancement Information)領域43を含む。
 回路21は、オブジェクトを含む画像100を、ビットストリームBSのペイロード42に符号化する。
 ステップSP15において回路21は、オブジェクトに関する画像内検出情報をビットストリームBSに符号化する。回路21は、ステップSP13によって生成した画像内検出情報を、ヘッダ41の所定の箇所に符号化する。所定の箇所は、SEI領域43である。所定の箇所は、VPS、SPS、PPS、PH、SH、APS、又はタイルヘッダ等であっても良い。あるいは、所定の箇所は、バウンディングボックス情報を格納するためのARSEI(annotated region SEI)領域であっても良い。
 ステップSP16において回路21は、オブジェクトに関する実空間検出情報をビットストリームBSに符号化する。回路21は、ステップSP12で取得した実空間検出情報を、ヘッダ41の所定の箇所に符号化する。所定の箇所は、SEI領域43である。所定の箇所は、VPS、SPS、PPS、PH、SH、APS、又はタイルヘッダ等であっても良い。あるいは、所定の箇所は、バウンディングボックス情報を格納するためのARSEI領域であっても良い。なお、ステップSP14~SP16は同時に実行されても良い。
 図9は、シンタックスの一例を簡略化して示す図である。num_objectsは、画像100に含まれるオブジェクトの数を示す。first_informationは、オブジェクトに関する画像内検出情報を含む。second_informationは、オブジェクトに関する実空間検出情報を含む。
 ステップSP17において回路21は、ビットストリームBSを復号装置2に送信する。
 図10は、復号装置2の回路31が実行する処理の流れを示すフローチャートである。
 ステップSP21において回路31は、自律走行機器1AからビットストリームBSを受信する。
 ステップSP22において回路31は、ビットストリームBSのペイロード42から、オブジェクトを含む画像100を復号する。
 ステップSP23において回路31は、ビットストリームBSのヘッダ41から、オブジェクトに関する画像内検出情報を復号する。画像内検出情報がヘッダ41のSEI領域43に符号化されている場合には、回路31は、SEI領域43から画像内検出情報を復号する。画像内検出情報がヘッダ41のARSEI領域に符号化されている場合には、回路31は、ARSEI領域から画像内検出情報を復号する。
 ステップSP24において回路31は、ビットストリームBSのヘッダ41から、オブジェクトに関する実空間検出情報を復号する。実空間検出情報がヘッダ41のSEI領域43に符号化されている場合には、回路31は、SEI領域43から実空間検出情報を復号する。実空間検出情報がヘッダ41のARSEI領域に符号化されている場合には、回路31は、ARSEI領域から実空間検出情報を復号する。なお、ステップSP22~SP24は同時に実行されても良い。
 ステップSP25において回路31は、ステップSP22~SP24で復号した画像及び情報に基づいて、オペレータによるヒューマンビジョンのための表示画像200を生成する。
 図11は、表示画像200の一例を簡略化して示す図である。表示画像200は、画像100と、実空間におけるオブジェクトの表示用位置情報と、実空間におけるオブジェクトの表示用移動情報D1~D3とを含む。
 表示用位置情報は、バウンディングボックスBB1~BB3に対応する枠F1~F3と、自律走行機器1Aに対する各オブジェクトの相対距離を示す距離情報とを含む。回路31は、ビットストリームBSから復号された実空間検出情報に含まれる、実空間におけるオブジェクトの位置情報を、オブジェクトの表示用位置情報として用いる。
 表示用移動情報D1~D3は、自律走行機器1Aに対する各オブジェクトの相対速度を示す相対速度情報と、自律走行機器1Aに対する各オブジェクトの相対移動方向を示す相対移動方向情報とを含む。図11に示した例において、相対移動方向情報は、太線の矢印の図形として表されている。回路31は、ビットストリームBSから復号された実空間検出情報に含まれる、実空間におけるオブジェクトの移動情報を、オブジェクトの表示用移動情報D1~D3として用いる。
 また、回路31は、表示画像200に含まれる複数のオブジェクトのうち自機(自律走行機器1A)と衝突又は接近する可能性があるオブジェクトに対応する枠F1,F3を、太線又は着色等によって強調表示する。回路31は、自機に対するオブジェクトの相対位置、相対距離、及び相対移動方向に基づいて、自機と衝突又は接近する可能性の有無を判定する。これにより、表示画像200を視認するオペレータは、表示画像200に含まれる複数のオブジェクトのうち注目して監視すべきオブジェクトを速やかに特定することができる。
 本実施形態に係る符号化装置11によれば、自律走行機器1の周囲に存在するオブジェクトに関する画面内検出情報及び実空間検出情報をビットストリームBSに符号化することにより、ビットストリームBSを受信する復号装置2側でこれらの情報を有効活用でき、それによって衝突回避性能等の自律走行機器1の安全性を向上できる。また、複雑な環境下において自律走行機器1の安全性を向上させるための自律走行機器1の動作の意思決定を向上できる。
 また、本実施形態に係る符号化装置11によれば、画像内検出情報が画像100内におけるオブジェクトの位置情報を含むことにより、画像100内におけるオブジェクトの位置情報を復号装置2側で有効活用できる。
 また、本実施形態に係る符号化装置11によれば、実空間検出情報が実空間におけるオブジェクトの位置情報及び移動情報を含むことにより、実空間におけるオブジェクトの位置情報及び移動情報を復号装置2側で有効活用できる。なお、実空間におけるオブジェクトの位置情報及び移動情報の一方は省略されても良い。
 また、本実施形態に係る符号化装置11によれば、オブジェクトの位置情報が自律走行機器1を基準とした円座標系における座標値を含むことにより、当該座標値を含む位置情報によってオブジェクトの位置を正確に特定できる。
 また、本実施形態に係る符号化装置11によれば、オブジェクトの移動情報が自律走行機器1に対するオブジェクトの相対速度及び相対移動方向を含むことにより、オブジェクトの速度及び移動方向を正確に特定できる。
 また、本実施形態に係る符号化装置11によれば、オブジェクトに関する画像内検出情報及び実空間検出情報をビットストリームのSEI領域43に符号化することにより、復号装置2側で簡易に処理できる。
 また、本実施形態に係る符号化装置11によれば、オブジェクト検出部13の独自の座標系から自律走行機器1の共通の座標系への変換処理によって、オブジェクトに関する実空間検出情報を適切に導出できる。
 また、本実施形態に係る復号装置2によれば、自律走行機器1の周囲に存在するオブジェクトに関する画面内検出情報及び実空間検出情報を有効活用でき、それによって衝突回避性能等の自律走行機器1の安全性を向上できる。また、複雑な環境下において自律走行機器1の安全性を向上させるための自律走行機器1の動作の意思決定を向上できる。
 また、本実施形態に係る復号装置2によれば、画像内検出情報が画像100内におけるオブジェクトの位置情報を含むことにより、画像100内におけるオブジェクトの位置情報を有効活用できる。
 また、本実施形態に係る復号装置2によれば、実空間検出情報が実空間におけるオブジェクトの位置情報及び移動情報を含むことにより、実空間におけるオブジェクトの位置情報及び移動情報を有効活用できる。
 また、本実施形態に係る復号装置2によれば、オブジェクトの位置情報が自律走行機器1を基準とした円座標系における座標値を含むことにより、当該座標値を含む位置情報によってオブジェクトの位置を正確に特定できる。
 また、本実施形態に係る復号装置2によれば、オブジェクトの移動情報が自律走行機器1に対するオブジェクトの相対速度及び相対移動方向を含むことにより、オブジェクトの速度及び移動方向を正確に特定できる。
 また、本実施形態に係る復号装置2によれば、オブジェクトに関する画像内検出情報及び実空間検出情報がビットストリームのSEI領域43に符号化されることにより、復号装置2側で簡易に処理できる。
 また、本実施形態に係る復号装置2によれば、実空間におけるオブジェクトの表示用位置情報及び表示用移動情報を含む表示画像200を視認することによって、オペレータは自律走行機器1の周囲の状況を瞬時かつ正確に把握できる。
 また、本実施形態に係る復号装置2によれば、実空間検出情報に含まれるオブジェクトの位置情報を表示用位置情報として用い、実空間検出情報に含まれるオブジェクトの移動情報を表示用移動情報として用いることにより、表示用位置情報及び表示用移動情報を簡易に生成できる。
 以下、上記第1実施形態に関する様々な変形例について説明する。以下に述べる変形例は、任意に組み合わせて適用することが可能である。
 (第1変形例)
 図12は、表示画像200の変形例として表示画像201の一例を簡略化して示す図である。表示画像201は、自機である自律走行機器1Aを模した図形G0と、オブジェクトである自律走行機器1Bを模した図形G1と、オブジェクトである歩行者6Aを模した図形G2と、オブジェクトである歩行者6Bを模した図形G3と、実空間におけるオブジェクトの表示用位置情報と、実空間におけるオブジェクトの表示用移動情報D1~D3とを含む。表示画像201は、図形G0の位置を原点Oとする円座標系の座標平面を有している。
 表示用位置情報は、図形G1~G3と、自律走行機器1Aに対する各オブジェクトの相対距離を示す距離情報とを含む。例えば図形G1に関する円座標系の距離座標値L1及び角度座標値θ1は、自律走行機器1Bに関する実空間検出情報に含まれる距離座標値及び角度座標値に相当する。
 表示用移動情報D1~D3は、自律走行機器1Aに対する各オブジェクトの相対速度を示す相対速度情報と、自律走行機器1Aに対する各オブジェクトの相対移動方向を示す相対移動方向情報とを含む。相対移動方向情報は、太線の矢印の図形として表されている。
 回路31は、複数のオブジェクトのうち自機と衝突又は接近する可能性があるオブジェクトに対応する図形G1,G3を、点滅又は着色等によって強調表示しても良い。
 本変形例によれば、表示画像201を視認するオペレータは、複数のオブジェクトのうち注目して監視すべきオブジェクトを速やかに特定することができる。
 (第2変形例)
 図13は、表示画像200の変形例として表示画像202の一例を簡略化して示す図である。表示画像202は、図形G0~G3と、実空間におけるオブジェクトの表示用位置情報と、実空間におけるオブジェクトの表示用移動情報D1~D3とを含む。表示画像202は、図形G0の位置を原点Oとするデカルト座標系の座標平面を有している。デカルト座標系は、直交するX軸及びY軸を有する。
 本変形例において、自律走行機器1Aの座標系はデカルト座標系であり、座標系の原点Oは自律走行機器1Aの中心点である。座標系のX軸は、自律走行機器1Aの移動方向に対応する。デカルト座標系におけるX座標値及びY座標値によって、オブジェクトの位置が示される。
 表示用位置情報は、図形G1~G3と、自律走行機器1Aに対する各オブジェクトの相対距離を示す距離情報とを含む。例えば図形G1に関するデカルト座標系のX座標値X1及びY座標値Y1は、自律走行機器1Bに関する実空間検出情報に含まれるX座標値及びY座標値に相当する。
 表示用移動情報D1~D3は、自律走行機器1Aに対する各オブジェクトの相対速度を示す相対速度情報と、自律走行機器1Aに対する各オブジェクトの相対移動方向を示す相対移動方向情報とを含む。相対移動方向情報は、太線の矢印の図形として表されている。
 回路31は、複数のオブジェクトのうち自機と衝突又は接近する可能性があるオブジェクトに対応する図形G1,G3を、点滅又は着色等によって強調表示しても良い。
 本変形例によれば、表示画像201を視認するオペレータは、複数のオブジェクトのうち注目して監視すべきオブジェクトを速やかに特定することができる。
 (第3変形例)
 本変形例では、ビットストリームBSから復号された実空間検出情報に、オブジェクトの移動情報(速度及び移動方向)が含まれていない場合の対応について説明する。
 図14は、図13に示した表示画像202から図形G1を抜き出して示す図である。回路31は、ビットストリームBSから復号された実空間検出情報に含まれる、図形G1に対応するオブジェクトの複数の時刻における複数の位置情報に基づいて、オブジェクトの表示用移動情報D1を算出する。回路31は、ある時刻tにおけるオブジェクトのX座標値X1(t)及びY座標値Y1(t)と、それより前の時刻t-1におけるオブジェクトのX座標値X1(t-1)及びY座標値Y1(t-1)とに基づいて、実空間におけるオブジェクトの移動距離及び移動方向を算出する。また、回路31は、算出した移動距離と、時刻t及び時刻t-1間の時間差Δtとに基づいて、オブジェクトの速度を算出する。
 式(1)は、オブジェクトの速度Vの算出式の一例を示す。
Figure JPOXMLDOC01-appb-M000001
 式(2)は、オブジェクトの移動方向Aの算出式の一例を示す。
Figure JPOXMLDOC01-appb-M000002
 回路31は、算出した速度を示す速度情報と、算出した移動方向を示す移動方向情報とを含む表示用移動情報D1を生成する。なお、図14に示した例ではデカルト座標系について説明したが、円座標系についても同様の処理が可能である。
 本変形例によれば、自律走行機器1から受信したビットストリームBSに、実空間におけるオブジェクトの移動情報が含まれていない場合であっても、回路31は、実空間におけるオブジェクトの複数の時刻における複数の位置情報に基づいて、オブジェクトの表示用移動情報D1~D3を適切に算出できる。
 (第4変形例)
 図15は、表示画像201の一例を簡略化して示す図である。図形G0を中心として、その周囲に境界Zが設定されている。境界Zは、実空間において自律走行機器1Aの位置を中心とする半径が例えば1mの円に相当する。
 回路31は、あるオブジェクトが境界Z内に進入した場合には、自律走行機器1Aが当該オブジェクトに衝突する可能性が高いと判定して、表示画像201内でアラート表示を行う。例えば図形G1に対応する自律走行機器1Bが境界Z内に進入した場合には、回路31は、図形G0及び/又は図形G1を点滅又は着色等によって強調表示する。なお、図15に示した例では円座標系について説明したが、デカルト座標系についても同様の処理が可能である。
 本変形例によれば、表示画像201を視認するオペレータは、自律走行機器1Aがオブジェクトに衝突する可能性が高い状況の発生を速やかに把握でき、遠隔操作によって自律走行機器1Aを緊急停止させる等の衝突回避制御を行うことができる。なお、衝突回避制御は、オペレータによる手動操作に代えて、回路31による自動制御で実行されても良い。
 (第5変形例)
 図16は、第5変形例に係る情報処理システムの構成を簡略化して示す図である。自律走行機器1は、図1に示した構成に加えて、位置検出部14、速度検出部15、及び方位検出部16を備えている。
 位置検出部14、速度検出部15、及び方位検出部16は、自律走行機器1に関する、実空間における検出情報である実空間検出情報を、回路21に入力する。実空間検出情報は、位置情報及び移動情報を含む。自律走行機器1に関する位置情報は、絶対位置を含む。自律走行機器1に関する移動情報は、絶対速度及び絶対移動方向を含む。
 位置検出部14は、GPS受信機等を備えて構成されている。位置検出部14は、自律走行機器1の絶対位置を検出し、その検出値を回路21に入力する。絶対位置は、世界座標等の地理座標系における座標値(緯度及び経度)である。
 速度検出部15は、タキメータ等を備えて構成されている。速度検出部15は、自律走行機器1の絶対速度を検出し、その検出値を回路21に入力する。
 方位検出部16は、加速度センサ又はジャイロセンサ等を備えて構成されている。方位検出部16は、自律走行機器1の正面方向又は絶対移動方向を検出し、その検出値を回路21に入力する。
 回路21は、位置検出部14、速度検出部15、及び方位検出部16による各検出値を、各検出部の独自の座標系から自律走行機器1の共通の座標系に変換した値に基づいて、自律走行機器1に関する実空間検出情報を導出する。
 図17は、符号化装置11の回路21が実行する処理の流れを示すフローチャートである。図2に示したフローチャートと同様の処理については、説明を省略する。
 ステップSP31において回路21は、自律走行機器1Aに関する実空間検出情報を、位置検出部14、速度検出部15、及び方位検出部16から取得する。
 ステップSP32において回路21は、自律走行機器1Aに関する実空間検出情報をビットストリームBSに符号化する。回路21は、ステップSP31で取得した実空間検出情報を、ヘッダ41の所定の箇所に符号化する。所定の箇所は、SEI領域43である。所定の箇所は、VPS、SPS、PPS、PH、SH、APS、又はタイルヘッダ等であっても良い。あるいは、所定の箇所は、ARSEI領域であっても良い。
 図18は、シンタックスの一例を簡略化して示す図である。third_informationは、自律走行機器1Aに関する実空間検出情報を含む。
 図19は、復号装置2の回路31が実行する処理の流れを示すフローチャートである。図10に示したフローチャートと同様の処理については、説明を省略する。
 ステップSP33において回路31は、ビットストリームBSのヘッダ41から、自律走行機器1Aに関する実空間検出情報を復号する。
 ステップSP25において回路31は、ステップSP22~SP24,SP33で復号した画像及び情報に基づいて、オペレータによるヒューマンビジョンのための表示画像200を生成する。
 図20は、表示画像200の一例を簡略化して示す図である。表示画像200の生成にあたり、回路31は、ステップSP24で復号された実空間におけるオブジェクトの相対位置情報を、ステップSP33で復号された実空間における自律走行機器1Aの絶対位置情報を用いて、実空間におけるオブジェクトの絶対位置情報に変換しても良い。
 また、回路31は、ステップSP24で復号された実空間におけるオブジェクトの相対移動情報を、ステップSP33で復号された実空間における自律走行機器1Aの絶対移動情報を用いて、実空間におけるオブジェクトの絶対移動情報に変換しても良い。図20に示した表示用移動情報D1~D3の例では、自律走行機器1Aに対する各オブジェクトの相対速度が、絶対速度に変換されている。
 また、回路31は、ステップSP33で復号された実空間における自律走行機器1Aの絶対移動情報及び絶対位置情報を、表示画像200に含めても良い。図20に示した例では、表示画像200は、自律走行機器1Aの絶対速度及び絶対位置を示す自機情報C0を含む。自機情報C0は、自律走行機器1Aの絶対移動方向をさらに含んでも良い。絶対移動方向は、例えば、自律走行機器1Aの移動方向を示す方位情報によって示されても良い。
 なお、表示画像200に限らず表示画像201,202を対象として本変形例に係る処理を適用しても良い。
 本変形例によれば、実空間における自律走行機器1Aの絶対位置情報及び絶対移動情報を復号装置2側で有効活用できる。
 (第6変形例)
 図21は、表示画像202の変形例として表示画像203の一例を簡略化して示す図である。表示画像203は、図13に示した図形G0~G3に加えて、オブジェクトである歩行者6Cを模した図形G4を含む。
 歩行者6Cは、自律走行機器1Bが有する撮影部12によって撮影される。自律走行機器1Bが有する符号化装置11の回路21は、撮影部12によって撮影された画像と、当該画像に含まれるオブジェクトに関する画像内検出情報と、当該オブジェクトに関する実空間検出情報とを、ビットストリームBSに符号化して復号装置2に送信する。当該実空間検出情報は、自律走行機器1Bに対する歩行者6Cの相対位置情報及び相対移動情報と、自律走行機器1Bの絶対位置情報及び絶対移動情報とを含む。
 復号装置2の回路31は、複数の自律走行機器1A,1Bから複数のビットストリームBSを受信する。回路31は、複数のビットストリームBSから復号した複数の画像に基づいて、表示画像203を生成する。回路31は、自律走行機器1Bに対する歩行者6Cの相対位置情報及び相対移動情報を、自律走行機器1Bの絶対位置情報及び絶対移動情報を用いて変換することにより、歩行者6Cの絶対位置情報及び絶対移動情報を算出する。これにより、自律走行機器1Aの撮影部12によっては撮影できない歩行者6Cに対応する図形G4を、表示画像203に含めることができる。表示用移動情報D0~D4は、各オブジェクトの絶対速度を示す絶対速度情報と、各オブジェクトの絶対移動方向を示す絶対移動方向情報とを含む。なお、図21に示した例ではデカルト座標系について説明したが、円座標系についても同様の処理が可能である。
 本変形例によれば、複数の自律走行機器1A,1Bで撮影された複数の画像によって撮影時の死角を互いに補完できるため、表示画像203の利便性を向上できる。
 (第2実施形態)
 第2実施形態では、複数の自律走行機器1間での通信について説明する。
 図22は、本開示の第2実施形態に係る情報処理システムの構成を簡略化して示す図である。情報処理システムは、自律走行機器1A,1Bを備えている。
 自律走行機器1Aは、符号化装置11A、撮影部12A、オブジェクト検出部13A、位置検出部14A、速度検出部15A、方位検出部16A、復号装置2A、及び駆動部17Aを有している。符号化装置11Aは、回路21A及びメモリ22Aを含む。復号装置2Aは、回路31A及びメモリ32Aを含む。駆動部17Aは、自律走行機器1Aの走行モータ等を備えて構成されている。
 自律走行機器1Bは、符号化装置11B、撮影部12B、オブジェクト検出部13B、位置検出部14B、速度検出部15B、方位検出部16B、復号装置2B、及び駆動部17Bを有している。符号化装置11Bは、回路21B及びメモリ22Bを含む。復号装置2Bは、回路31B及びメモリ32Bを含む。駆動部17Bは、自律走行機器1Bの走行モータ等を備えて構成されている。
 符号化装置11Bの回路21BはビットストリームBSBを送信し、復号装置2Aの回路31AはビットストリームBSBを受信する。符号化装置11Aは自律走行機器1Bに搭載され、復号装置2Aは自律走行機器1Bとは別の自律走行機器1Aに搭載される。同様に、符号化装置11Aの回路21AはビットストリームBSAを送信し、復号装置2Bの回路31BはビットストリームBSAを受信する。
 図23は、復号装置2Aの回路31Aが実行する処理の流れを示すフローチャートである。
 ステップSP51において回路31Aは、自律走行機器1BからビットストリームBSBを受信する。
 ステップSP52において回路31Aは、ビットストリームBSBのペイロード42から、オブジェクトを含む画像100Bを復号する。
 図24は、自律走行機器1Bの撮影部12Bによって撮影された画像100Bの一例を模式的に示す図である。画像100Bは、オブジェクトとして、自律走行機器1Aと、自律走行機器1Aの後方を歩行する歩行者6Cとを含む。
 ステップSP53において回路31Aは、画像100Bに含まれるオブジェクトに関する画像内検出情報を、ビットストリームBSBのヘッダ41から復号する。
 ステップSP54において回路31Aは、画像100Bに含まれるオブジェクトに関する実空間検出情報を、ビットストリームBSBのヘッダ41から復号する。
 ステップSP55において回路31Aは、自律走行機器1Bに関する実空間検出情報を、ビットストリームBSBのヘッダ41から復号する。
 ステップSP56において回路31Aは、自律走行機器1Aの撮影部12Aによって撮影された画像100と、画像100に含まれるオブジェクトに関する画像内検出情報及び実空間検出情報と、自律走行機器1Aに関する実空間検出情報とを、回路21Aから取得する。
 ステップSP57において回路31Aは、ビットストリームBSBから復号された、オブジェクトに関する画像内検出情報及び実空間検出情報と、回路21Aから取得された、オブジェクトに関する画像内検出情報及び実空間検出情報とに基づいて、駆動部17Aによって自律走行機器1Aの駆動を制御する。
 具体的に、回路31Aは、自律走行機器1Aの周囲に存在するオブジェクトの位置情報及び移動情報を示すマップ300を生成する。その際、回路31Aは、ビットストリームBSBから復号された、自律走行機器1Bを基準とした座標系を用いた、オブジェクトに関する実空間検出情報を、自律走行機器1Aを基準とした座標系を用いた、オブジェクトに関する実空間検出情報に変換する。例えば、回路31Aは、自律走行機器1Bに対する歩行者6Cの相対位置情報及び相対移動情報を、自律走行機器1Bの絶対位置情報及び絶対移動情報を用いて変換することにより、歩行者6Cの絶対位置情報及び絶対移動情報を算出する。回路31Aは、歩行者6Cに対応するオブジェクトの絶対位置情報及び絶対移動情報を、マップ300に含める。さらに、回路31Aは、歩行者6Cの絶対位置情報及び絶対移動情報を、自律走行機器1Aの絶対位置情報及び絶対移動情報を用いて変換することにより、自律走行機器1Aに対する歩行者6Cの相対位置情報及び相対速度情報を算出しても良い。この場合、回路31Aは、自律走行機器1Aに対する歩行者6Cの相対位置情報及び相対移動情報を、マップ300に含めても良い。
 図25は、マップ300の一例を簡略化して示す図である。マップ300は、自律走行機器1Aの絶対位置を原点Oとし、自律走行機器1Aの移動方向をX軸とするデカルト座標系の座標平面を有している。マップ300は、自律走行機器1B及び歩行者6A,6Bに対応するオブジェクトの絶対位置情報及び絶対移動情報に加えて、歩行者6Cに対応するオブジェクトの絶対位置情報及び絶対移動情報を含む。
 また、マップ300には、自律走行機器1Aを中心として、その周囲に境界Zが設定されている。境界Zは、実空間において自律走行機器1Aの位置を中心とする半径が例えば1mの円に相当する。回路31は、あるオブジェクトが境界Z内に進入した場合には、自律走行機器1Aが当該オブジェクトに衝突する可能性が高いと判定して、駆動部17Aによって自律走行機器1Aを緊急停止させる等の衝突回避制御を行う。
 なお、図25に示した例ではデカルト座標系について説明したが、円座標系についても同様の処理が可能である。また、回路31Aは、マップ300の生成に代えて、自律走行機器1Aの周囲に存在するオブジェクトの位置情報及び移動情報を列挙した表を生成しても良い。
 本変形例によれば、複数の自律走行機器1A,1B間でオブジェクトに関する画像内検出情報及び実空間検出情報を相互に通信することにより、自律走行機器1Aは、別の自律走行機器1Bから受信したこれらの情報を自機の動作制御に有効活用でき、それによって衝突回避性能等の自律走行機器1の安全性を向上できる。
 本開示は、自律走行機器を用いた商品配送システム又は交通システム等への適用が特に有用である。

Claims (28)

  1.  回路と、
     前記回路に接続されたメモリと、
    を備え、
     前記回路は、
     撮影部を有する自律走行機器からビットストリームを受信し、
     前記撮影部によって撮影された画像を、前記ビットストリームから復号し、
     前記画像に含まれるオブジェクトに関する、前記画像内における検出情報である画像内検出情報を、前記ビットストリームから復号し、
     前記オブジェクトに関する、実空間における検出情報である実空間検出情報を、前記ビットストリームから復号する、
    復号装置。
  2.  前記オブジェクトに関する前記画像内検出情報は、前記画像内における前記オブジェクトの位置情報を含む、
    請求項1に記載の復号装置。
  3.  前記オブジェクトに関する前記実空間検出情報は、前記実空間における前記オブジェクトの位置情報、及び、前記実空間における前記オブジェクトの移動情報の少なくとも一方を含む、
    請求項1に記載の復号装置。
  4.  前記オブジェクトの前記位置情報は、
     前記自律走行機器を基準とした円座標系における座標値、
     前記自律走行機器を基準としたデカルト座標系における座標値、又は、
     地理座標系における座標値
    を含む、
    請求項3に記載の復号装置。
  5.  前記オブジェクトの前記移動情報は、
     前記オブジェクトの絶対速度又は前記自律走行機器に対する前記オブジェクトの相対速度と、前記オブジェクトの絶対移動方向又は前記自律走行機器に対する前記オブジェクトの相対移動方向との少なくとも一方を含む、
    請求項3に記載の復号装置。
  6.  前記回路は、さらに、前記自律走行機器に関する実空間検出情報を前記ビットストリームから復号し、
     前記自律走行機器に関する前記実空間検出情報は、前記実空間における前記自律走行機器の位置情報、及び、前記実空間における前記自律走行機器の移動情報を含む、
    請求項1に記載の復号装置。
  7.  前記自律走行機器の前記位置情報は、地理座標系における座標値を含む、
    請求項6に記載の復号装置。
  8.  前記自律走行機器の前記移動情報は、前記自律走行機器の絶対速度及び絶対移動方向の少なくとも一方を含む、
    請求項6に記載の復号装置。
  9.  前記回路は、前記オブジェクトに関する前記画像内検出情報及び前記実空間検出情報と、前記自律走行機器に関する前記実空間検出情報とを、前記ビットストリームのSEI(Supplemental Enhancement Information)領域から復号する、
    請求項6に記載の復号装置。
  10.  前記回路は、さらに、ヒューマンビジョンのための表示画像を生成し、
     前記表示画像は、
     前記オブジェクトと、
     前記実空間における前記オブジェクトの表示用位置情報、及び、前記実空間における前記オブジェクトの表示用移動情報の少なくとも一方と、
    を含む、
    請求項1に記載の復号装置。
  11.  前記自律走行機器は複数の自律走行機器を含み、
     前記回路は、前記複数の自律走行機器から受信した複数のビットストリームから復号した複数の画像に基づいて、前記表示画像を生成する、
    請求項10に記載の復号装置。
  12.  前記回路は、
     前記ビットストリームから復号された、前記オブジェクトに関する前記実空間検出情報に含まれる、前記実空間における前記オブジェクトの位置情報を、前記オブジェクトの前記表示用位置情報として用い、
     前記ビットストリームから復号された、前記オブジェクトに関する前記実空間検出情報に含まれる、前記実空間における前記オブジェクトの移動情報を、前記オブジェクトの前記表示用移動情報として用いる、
    請求項10に記載の復号装置。
  13.  前記回路は、
     さらに、前記実空間における前記自律走行機器の位置情報と、前記実空間における前記自律走行機器の移動情報とを、前記ビットストリームから復号し、
     前記ビットストリームから復号された、前記オブジェクトに関する前記実空間検出情報に含まれる、前記実空間における前記オブジェクトの位置情報を、前記ビットストリームから復号された、前記実空間における前記自律走行機器の前記位置情報を用いて変換することにより、前記オブジェクトの前記表示用位置情報を算出し、
     前記ビットストリームから復号された、前記オブジェクトに関する前記実空間検出情報に含まれる、前記実空間における前記オブジェクトの移動情報を、前記ビットストリームから復号された、前記実空間における前記自律走行機器の前記移動情報を用いて変換することにより、前記オブジェクトの前記表示用移動情報を算出する、
    請求項10に記載の復号装置。
  14.  前記回路は、前記ビットストリームから復号された、前記オブジェクトに関する前記実空間検出情報に含まれる、前記実空間における前記オブジェクトの複数の時刻における複数の位置情報に基づいて、前記オブジェクトの前記表示用移動情報を算出する、
    請求項10に記載の復号装置。
  15.  前記復号装置は、前記自律走行機器とは別の自律走行機器に搭載され、
     前記回路は、さらに、前記自律走行機器から受信した前記ビットストリームから復号された、前記オブジェクトに関する前記画像内検出情報及び前記実空間検出情報と、前記別の自律走行機器が有する撮影部によって撮影された画像に含まれるオブジェクトに関する画像内検出情報及び実空間検出情報とに基づいて、前記別の自律走行機器の動作を制御する、
    請求項1に記載の復号装置。
  16.  前記回路は、前記自律走行機器から受信した前記ビットストリームから復号された、前記自律走行機器を基準とした座標系を用いた、前記オブジェクトに関する前記実空間検出情報を、前記別の自律走行機器を基準とした座標系を用いた、前記オブジェクトに関する前記実空間検出情報に変換する、
    請求項15に記載の復号装置。
  17.  撮影部を有する自律走行機器に搭載される符号化装置であって、
     回路と、
     前記回路に接続されたメモリと、
    を備え、
     前記回路は、
     前記撮影部によって撮影された画像を、ビットストリームに符号化し、
     前記画像に含まれるオブジェクトに関する、前記画像内における検出情報である画像内検出情報を、前記ビットストリームに符号化し、
     前記オブジェクトに関する、実空間における検出情報である実空間検出情報を、前記ビットストリームに符号化する、
    符号化装置。
  18.  前記オブジェクトに関する前記画像内検出情報は、前記画像内における前記オブジェクトの位置情報を含む、
    請求項17に記載の符号化装置。
  19.  前記オブジェクトに関する前記実空間検出情報は、前記実空間における前記オブジェクトの位置情報、及び、前記実空間における前記オブジェクトの移動情報の少なくとも一方を含む、
    請求項17に記載の符号化装置。
  20.  前記オブジェクトの前記位置情報は、
     前記自律走行機器を基準とした円座標系における座標値、
     前記自律走行機器を基準としたデカルト座標系における座標値、又は、
     地理座標系における座標値
    を含む、
    請求項19に記載の符号化装置。
  21.  前記オブジェクトの前記移動情報は、
     前記オブジェクトの絶対速度又は前記自律走行機器に対する前記オブジェクトの相対速度と、前記オブジェクトの絶対移動方向又は前記自律走行機器に対する前記オブジェクトの相対移動方向との少なくとも一方を含む、
    請求項19に記載の符号化装置。
  22.  前記回路は、さらに、前記自律走行機器に関する実空間検出情報を前記ビットストリームに符号化し、
     前記自律走行機器に関する前記実空間検出情報は、前記実空間における前記自律走行機器の位置情報、及び、前記実空間における前記自律走行機器の移動情報を含む、
    請求項17に記載の符号化装置。
  23.  前記自律走行機器の前記位置情報は、地理座標系における座標値を含む、
    請求項22に記載の符号化装置。
  24.  前記自律走行機器の前記移動情報は、前記自律走行機器の絶対速度及び絶対移動方向の少なくとも一方を含む、
    請求項22に記載の符号化装置。
  25.  前記回路は、前記オブジェクトに関する前記画像内検出情報及び前記実空間検出情報と、前記自律走行機器に関する前記実空間検出情報とを、前記ビットストリームのSEI(Supplemental Enhancement Information)領域に符号化する、
    請求項22に記載の符号化装置。
  26.  前記自律走行機器は、前記実空間において前記オブジェクトを検出する検出部をさらに有し、
     前記回路は、前記検出部による検出値を前記検出部の座標系から前記自律走行機器の座標系に変換した値に基づいて、前記オブジェクトに関する前記実空間検出情報を導出する、
    請求項17に記載の符号化装置。
  27.  復号装置が、
     撮影部を有する自律走行機器からビットストリームを受信し、
     前記撮影部によって撮影された画像を、前記ビットストリームから復号し、
     前記画像に含まれるオブジェクトに関する、前記画像内における検出情報である画像内検出情報を、前記ビットストリームから復号し、
     前記オブジェクトに関する、実空間における検出情報である実空間検出情報を、前記ビットストリームから復号する、
    復号方法。
  28.  撮影部を有する自律走行機器に搭載される符号化装置が、
     前記撮影部によって撮影された画像を、ビットストリームに符号化し、
     前記画像に含まれるオブジェクトに関する、前記画像内における検出情報である画像内検出情報を、前記ビットストリームに符号化し、
     前記オブジェクトに関する、実空間における検出情報である実空間検出情報を、前記ビットストリームに符号化する、
    符号化方法。
PCT/JP2023/040738 2022-12-05 2023-11-13 復号装置、符号化装置、復号方法、及び符号化方法 Ceased WO2024122273A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP23900394.0A EP4614989A4 (en) 2022-12-05 2023-11-13 DECODING DEVICE, CODING DEVICE, DECODING METHOD, AND CODING METHOD
CN202380083478.2A CN120303945A (zh) 2022-12-05 2023-11-13 解码装置、编码装置、解码方法以及编码方法
JP2024562643A JPWO2024122273A1 (ja) 2022-12-05 2023-11-13
US19/223,418 US20250294190A1 (en) 2022-12-05 2025-05-30 Decoding device, encoding device, decoding method, and encoding method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202263430118P 2022-12-05 2022-12-05
US63/430,118 2022-12-05

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US19/223,418 Continuation US20250294190A1 (en) 2022-12-05 2025-05-30 Decoding device, encoding device, decoding method, and encoding method

Publications (1)

Publication Number Publication Date
WO2024122273A1 true WO2024122273A1 (ja) 2024-06-13

Family

ID=91378941

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/040738 Ceased WO2024122273A1 (ja) 2022-12-05 2023-11-13 復号装置、符号化装置、復号方法、及び符号化方法

Country Status (5)

Country Link
US (1) US20250294190A1 (ja)
EP (1) EP4614989A4 (ja)
JP (1) JPWO2024122273A1 (ja)
CN (1) CN120303945A (ja)
WO (1) WO2024122273A1 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018038131A1 (ja) * 2016-08-26 2018-03-01 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元情報処理方法及び三次元情報処理装置
WO2019215704A1 (en) * 2018-05-11 2019-11-14 Telefonaktiebolaget Lm Ericsson (Publ) Configurable dci formatting indicator
US20210217200A1 (en) * 2020-01-10 2021-07-15 Lg Electronics Inc. Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
US20210278840A1 (en) 2019-06-04 2021-09-09 Lg Electronics Inc. Autonomous vehicle and control method thereof

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10599150B2 (en) * 2016-09-29 2020-03-24 The Charles Stark Kraper Laboratory, Inc. Autonomous vehicle: object-level fusion
US20220103789A1 (en) * 2019-01-31 2022-03-31 Lg Electronics Inc. Method for sharing images between vehicles
GB2596464B (en) * 2019-02-25 2024-05-01 Mobileye Vision Technologies Ltd Systems and methods for vehicle navigation
CN115735168A (zh) * 2020-04-01 2023-03-03 移动眼视觉科技有限公司 用于对交通工具进行导航的控制回路
US12181878B2 (en) * 2020-10-22 2024-12-31 Waymo Llc Velocity estimation and object tracking for autonomous vehicle applications
CN117571001A (zh) * 2021-01-08 2024-02-20 御眼视觉技术有限公司 用于公共速度映射和导航的系统和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018038131A1 (ja) * 2016-08-26 2018-03-01 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 三次元情報処理方法及び三次元情報処理装置
WO2019215704A1 (en) * 2018-05-11 2019-11-14 Telefonaktiebolaget Lm Ericsson (Publ) Configurable dci formatting indicator
US20210278840A1 (en) 2019-06-04 2021-09-09 Lg Electronics Inc. Autonomous vehicle and control method thereof
US20210217200A1 (en) * 2020-01-10 2021-07-15 Lg Electronics Inc. Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP4614989A4

Also Published As

Publication number Publication date
CN120303945A (zh) 2025-07-11
JPWO2024122273A1 (ja) 2024-06-13
EP4614989A4 (en) 2026-03-25
EP4614989A1 (en) 2025-09-10
US20250294190A1 (en) 2025-09-18

Similar Documents

Publication Publication Date Title
KR102859653B1 (ko) 신호 처리 장치 및 신호 처리 방법, 컴퓨터 판독가능 매체, 그리고 이동체
JP7586689B2 (ja) LiDAR知覚のためのマルチビュー・ディープ・ニューラル・ネットワーク
US11249474B2 (en) Safety of autonomous vehicles using a virtual augmented support environment
CN112204343B (zh) 高清晰地图数据的可视化
US11373418B2 (en) Information processing apparatus, information processing method, program, and mobile object
US8564657B2 (en) Object motion detection system based on combining 3D warping techniques and a proper object motion detection
CN112665588B (zh) 一种基于增强现实的船舶航行态势感知方法
Kim et al. Multivehicle cooperative driving using cooperative perception: Design and experimental validation
JP7091485B2 (ja) 運動物体検出およびスマート運転制御方法、装置、媒体、並びに機器
EP3702864B1 (en) Accounting for latency in teleoperated remote driving
US12190463B2 (en) Synthesizing three-dimensional visualizations from perspectives of onboard sensors of autonomous vehicles
US20200012756A1 (en) Vision simulation system for simulating operations of a movable platform
Sridhar et al. Cooperative perception in autonomous ground vehicles using a mobile‐robot testbed
KR102749769B1 (ko) 노광 제어 장치, 노광 제어 방법, 프로그램, 촬영 장치, 및 이동체
JP2010282615A (ja) 3dワーピング手法と固有対象物運動(pom)の検出の組み合わせに基づく対象物の動き検出システム
US12333828B2 (en) Scalable and realistic camera blockage dataset generation
KR102065693B1 (ko) 자율주행 차량을 위한 기계학습 데이터 표준화 방법 및 시스템
US12548311B2 (en) Training a neural network using a data set with labels of multiple granularities
WO2024122273A1 (ja) 復号装置、符号化装置、復号方法、及び符号化方法
KR20230020933A (ko) 다중 세분성들의 라벨들이 있는 데이터 세트를 사용하는 뉴럴 네트워크 트레이닝
EP4520060A1 (en) Method and user device for detecting an environment of the user device
US20220281459A1 (en) Autonomous driving collaborative sensing
KR102888766B1 (ko) 디지털 트윈 기반 원격 주행을 위한 방법 및 장치
Dutta et al. Dynamic Real-Time Spatio-Temporal Acquisition and Rendering in Adverse Environments
Druml et al. A Smartphone-Based Virtual White Cane Prototype Featuring Time-of-Flight 3D Imaging

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23900394

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2024562643

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 202547053407

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 202380083478.2

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2023900394

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 202547053407

Country of ref document: IN

ENP Entry into the national phase

Ref document number: 2023900394

Country of ref document: EP

Effective date: 20250605

NENP Non-entry into the national phase

Ref country code: DE

WWP Wipo information: published in national office

Ref document number: 202380083478.2

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 2023900394

Country of ref document: EP