WO2013187551A1 - 아이콘텍이 가능한 3차원 원격회의 장치 및 이를 이용한 방법 - Google Patents

아이콘텍이 가능한 3차원 원격회의 장치 및 이를 이용한 방법 Download PDF

Info

Publication number
WO2013187551A1
WO2013187551A1 PCT/KR2012/005371 KR2012005371W WO2013187551A1 WO 2013187551 A1 WO2013187551 A1 WO 2013187551A1 KR 2012005371 W KR2012005371 W KR 2012005371W WO 2013187551 A1 WO2013187551 A1 WO 2013187551A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
participant
depth
icontec
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/KR2012/005371
Other languages
English (en)
French (fr)
Inventor
유범재
이은경
이지용
조재희
김신영
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Center Of Human Centered Interaction for Coexistence
Original Assignee
Center Of Human Centered Interaction for Coexistence
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Center Of Human Centered Interaction for Coexistence filed Critical Center Of Human Centered Interaction for Coexistence
Priority to EP12861050.8A priority Critical patent/EP2860969B1/en
Priority to JP2014521546A priority patent/JP5839427B2/ja
Priority to US13/885,998 priority patent/US9077974B2/en
Publication of WO2013187551A1 publication Critical patent/WO2013187551A1/ko
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two two-dimensional [2D] image sensors having a relative position equal to or related to the interocular distance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/271Image signal generators wherein the generated image signals comprise depth maps or disparity maps
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/142Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
    • H04N7/144Constructional details of the terminal equipment, e.g. arrangements of the camera and the display camera and display on the same optical axis, e.g. optically multiplexing the camera and display for eye to eye contact
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Definitions

  • the present invention relates to a three-dimensional teleconference system, and more particularly, to a teleconference system and a method using the same, in which two conference participants at a remote place can make eye-contact and interact with each other in real time. It is about.
  • This application claims the benefit of the filing date of Korean Patent Application No. 10-2012-0062200 filed with the Korean Intellectual Property Office on June 11, 2012, the entire contents of which are incorporated herein. Background Art
  • Teleconferencing system capable of conversing with a face-to-face conversation with a remotely located partner has been widely used.
  • Teleconferencing system can participate in several people together, can connect several regions at the same time, and delivers meeting information such as voice or video of other party in real time through network.
  • the teleconferencing system generally includes a camera for photographing the user at the top, bottom, or side of the screen, and the user's gaze looks at the screen. .
  • Eye-contact is a very important factor in immersing a conversation or giving a confidence to the other person in a conversation.
  • the direction of the user's gaze displayed on the screen is not the front.
  • the problem is that Icontec and the other party in the conversation are impossible. Icontec's impossibility in such a teleconferencing system has emerged as a critical limitation to the realization of the teleconferencing system, and in fact, many users have become an important element that feels awkward in conversations through teleconferencing.
  • U.S. Patent No. 6771303 sets up two cameras at the top and bottom of the monitor during video conferencing, calculates depth information of the video conferencing participants, identifies the participant's head position, and generates a gaze image that matches the current participant's position.
  • US Patent No. 6806898 uses a camera mounted on the top of the monitor to determine the position and direction of the current participant's head.
  • Korean Patent Publication No. 199 0057779 discloses a technique for generating three-dimensional images by displaying three-dimensional images to be displayed to each meeting participants using three cameras
  • Korean Patent Publication No. 2010—0028725 By allowing only the light-receiving unit to be moved separately from the coincidence camera, a technique is disclosed in which the opponent can achieve a line of sight even if not displayed in the center of the monitor.
  • Icontec support technologies for such a conventional remote-hee system only initiate a simple image acquisition by a simple movement considering only a fixed camera position or an opponent's on-screen position to obtain an Icontec image. It does not present any detailed description of the factors that need to be considered for acquiring image and how to operate the camera in consideration of them.
  • most of the conventional technologies adopt a technique for generating depth information through real-time depth calculation, and thus there is a problem that natural image generation is difficult because accuracy of depth information is not guaranteed.
  • the prior art does not refer to real-time interaction for more realistic teleconference, which is limited to a method of simply conducting a conference while watching a video.
  • the camera is operated to provide the optimal IconTek images and real-time interaction for more realistic teleconference is possible.
  • An object of the present invention is to define elements that must be considered in order to capture realistic IconTek images even when a video conference participant is standing up and conducting a meeting or shifting position. Participants will be able to conduct meetings naturally, as if they are actually in the same room.
  • an object of the present invention is to realize the teleconferencing system by giving the participants of the teleconferencing a real meeting in real time during the three-dimensional teleconferencing, as if meeting in the same space.
  • an object of the present invention is to provide a more realistic video conferencing system by normalizing the three-dimensional depth differently for each user using the test pattern, and generating a three-dimensional image reflecting the normalization result.
  • IconTec enabled three-dimensional teleconference apparatus for achieving the above object, taking into account the video taken by the video conference participants and the video corresponding to the other party of the video conference received through the network
  • An image acquiring unit which acquires depth images and color images by operating cameras in real time;
  • a front face generator configured to generate a final depth image and a final color image corresponding to the participant's front face for IconTek using the depth images and the color images;
  • a 3D image generating unit generating a 3D image corresponding to the counterpart and displaying the 3D image on the display device.
  • the image acquisition unit pan operation to rotate each of the cameras to the left and right, tilt operation to rotate each of the cameras up and down, and height to move the cameras up and down
  • the cameras can be operated in real time.
  • the image acquisition unit performs a pan operation of the cameras based on the captured image, performs a tilt operation by using the captured image and the image corresponding to the counterpart together, Height manipulation of the cameras may be performed based on a corresponding image.
  • the image acquisition unit performs a pan operation of the cameras based on the eye position of the participant detected in the captured image, and the eye position of the participant and the counterpart detected in the image corresponding to the counterpart. Perform the tilt manipulation based on the difference in eye position, Height manipulation of the cameras can be performed based on height.
  • IconTek capable three-dimensional teleconference device includes a gesture recognition unit for determining whether the participant has performed a predetermined operation using the captured image; And a gesture processor configured to perform a function corresponding to the preset operation.
  • the gesture processing unit may provide interaction feedback when it is determined that the predetermined operation is an interaction operation.
  • the interactive feedback may be visual feedback in which an image of a part of the participant's body corresponding to the interactive action is added to the 3D image.
  • the 3D image generator may measure the 3D recognition depth of the participant based on the reaction of the participant with respect to the 3D test image provided to the participant, and generate the 3D image in consideration of the 3D recognition depth.
  • the cameras may be provided integrally with the display device. At this time, the cameras may be attached to the display device to be movable and rotatable. In addition, the cameras may be provided to be movable and rotatable independently of the outside of the dispooling apparatus.
  • the front face generator may generate one final depth image and one final color image by performing depth noise removal and depth correction on the depth images and performing color correction on the color images. have.
  • the 3D image generating unit performs mesh hole filling on the final depth image and the final color image, which are sympathetic to the counterpart, to restore an image of a 3D mesh form corresponding to the counterpart, and to form the 3D mesh form.
  • the image of the 3D image can be generated to complement the other party.
  • the camera taking into account the video corresponding to the videoconferencing participants and video corresponding to the other party of the videoconferencing received through the network the real-time fan (an p), tilt (tilt), and height (height) operation to the depth image and the step of the color, obtaining a; Generating a final depth image and a final color image, which surface the front face of the participant for IconTek using the depth images and the color images; And generating and displaying the 3D image on the display device.
  • the obtaining of the depth images and the color images may be performed by a pan operation of the cameras based on the position of the participant's eye detected in the photographed image, and may be performed on the participant's eye position and the counterpart.
  • the tilt operation may be performed based on a difference in the eye position of the other party detected in a corresponding image, and the height operation of the cameras may be performed based on the eye height of the other party.
  • the icontec-enabled 3D remote method includes the steps of: judging whether the participant has performed a predetermined operation by using the captured image; And performing a function of interacting with the preset operation.
  • the performing of the function corresponding to the predetermined motion may include: when the predetermined motion is determined to be an interactive motion, an image of a part of the participant's body, which corresponds to the interactive motion, is added to the three-dimensional image. Provide visual feedback.
  • displaying on the display device may measure the 3D recognition depth of the participant based on the reaction of the participant with respect to the 3D test image provided to the participant, and generate the 3D image in consideration of the 3D recognition depth.
  • the camera properly tracks the participant so that the remote conference participant can actually proceed with the feeling that they are actually in the same space. Dimensional image generation is possible.
  • the present invention can realize the teleconference system by giving the remote conference participants the feeling of meeting in the same real space through the real-time interaction, such as shaking hands or high five during the three-dimensional teleconference.
  • the present invention solves the accuracy problem caused by real-time calculation of the three-dimensional depth information, it is possible to create a more realistic three-dimensional image.
  • the present invention normalizes the three-dimensional depth that users feel differently by using the test pattern, and generates a three-dimensional image by reflecting the normalization result, more realistic teleconference is possible.
  • FIG. 1 is a view showing an example of a system to which a three-dimensional teleconference apparatus capable of Icontec of the present invention is applied.
  • FIG. 2 is a view showing another example of a system to which the icontec-enabled three-dimensional teleconference apparatus of the present invention is applied.
  • Figure 3 is a block diagram showing a three-dimensional teleconference device capable of IconTek according to an embodiment of the present invention.
  • FIG. 4 is a block diagram illustrating an example of the image acquisition unit illustrated in FIG. 3.
  • FIG. 5 is a block diagram illustrating an example of the front face generation unit illustrated in FIG. 3.
  • FIG. 6 is a diagram illustrating an example of front face generation for IconTek.
  • FIG. 7 is a block diagram illustrating an example of the 3D image generating unit shown in FIG. 3.
  • FIG. 8 is a view showing the progress of the three-dimensional teleconference to which the present invention is applied. 9 illustrates an example of visual feedback for an interactive action according to the present invention.
  • 10 is an operation flowchart showing a method of 3D remote play capable of IconTek according to an embodiment of the present invention.
  • FIG. 1 is a view showing an example of a system to which a three-dimensional teleconference apparatus capable of Icontec of the present invention is applied.
  • the IconTec capable three-dimensional teleconference device includes a display device 110 for displaying a 3D image and cameras 121 and 122 for generating an IconTec image. That is, the system shown in FIG. 1 displays the 3D image of the counterpart of the videoconferencing through the display apparatus 110 and photographs the videoconferencing participant as the subject through the cameras 121 and 122. At this time, the cameras 121 and 122 may rotate and move to be suitable for generating a front stereoscopic image for Icontec in real time.
  • each of the cameras 121 and 122 may be a Kinect camera composed of an RGB camera that acquires a color image and an IR camera that produces a depth image. As illustrated in FIG. 1, the cameras 121 and 122 may be freely rotated and moved to track a user to be suitable for generating a front image for IconTek, independently of the display apparatus 110.
  • 2 is a view showing another example of a system to which the icontec-enabled three-dimensional teleconference apparatus of the present invention is applied.
  • the cameras 221 and 222 are installed in the display device 210.
  • the system shown in FIG. 2 displays a three-dimensional image of the other party in a video conference via the display device 210 and photographs a video conference participant as a subject through cameras 221 and 222.
  • the cameras 221 : 222 integrally provided in the display device 210 may rotate and move to be suitable for generating a front stereoscopic image for Icontec in real time.
  • each of the cameras 221 and 222 may be a Kinect camera composed of an RGB camera that acquires a color image and an IR camera that produces a depth image.
  • the cameras 221 and 222 may be integrally provided in the display device 210 and may be freely rotated and moved to track a user so as to be suitable for generating a front image for IconTek.
  • Figure 3 is a block diagram showing a three-dimensional teleconference device capable of IconTek according to an embodiment of the present invention.
  • an icontec-enabled 3D remote device may include an image acquirer 310 , a front face generator 320, a 3D image generator 330, and gesture recognition.
  • the unit 340 and the gesture processing unit 350 are included.
  • the image acquiring unit 310 performs real-time operation of the cameras in consideration of the captured image of the videoconferencing participant who is the subject and the image corresponding to the counterpart of the videoconferencing received through the network. + 2D).
  • the image acquisition unit 310 may include cameras, or may be implemented as a device independent of the camera.
  • the cameras may be two Kinect cameras.
  • the Kinect camera including the IR camera By using the Kinect camera including the IR camera to produce the depth image, it is possible to reduce the burden of calculating the depth information in real time and to generate more realistic three-dimensional images through more accurate depth information.
  • the camera may include an RGB camera for acquiring a color image.
  • the camera may be any kind of camera capable of acquiring color images and depth information at the same time, and the scope of the present invention should not be limited according to the type or type of camera.
  • the image acquisition unit 310 may include a pan operation of rotating each of the cameras left and right, a tilt operation of shifting each of the cameras up and down, and a height of moving the cameras up and down. Operation to operate the cameras in real time.
  • the image acquisition unit 310 performs a pan operation of the cameras based on the captured video of the videoconference participant, and uses the video corresponding to the videoconference participant and the video corresponding to the counterpart together.
  • the tilt operation may be performed, and the height operation of the cameras may be performed based on the image corresponding to the counterpart.
  • the image acquisition unit 310 detects the eye position of the participant in the captured image of the video conference participant, and performs a pan operation of the cameras based on the detected eye position of the participant. Can be. In this way, by rotating the left and right of the camera based on the participant's eye position it is possible to horizontally capture the image suitable for the front image synthesis of the participant.
  • the image acquisition unit 310 may determine the eye position of the video conference participant and the video conference counterpart. Tilt manipulation can be performed based on the difference in eye position. In this way, based on the difference between the participant's eye position and the opponent's eye position, the up / down rotation of the cameras is manipulated to reflect the situation where the meeting participants look at each other. Even in difficult situations, it is possible to shoot a video suitable for synthesizing the frontal image of the participant vertically.
  • the image acquisition unit 310 may perform height manipulation of the cameras based on the eye height of the other party. In this way, by adjusting the height of the cameras based on the eye height of the other party, it is possible to shoot the image according to the eye level of the actual conference participants.
  • the image acquisition unit 310 is the position most similar to the current gaze of the participant in consideration of the gaze of the meeting participant for the realistic progression of the meeting counterpart and IconTek to maximize the realism in the teleconference
  • the camera moves the camera position and rotates the camera's up / down and left / right angles so that the camera can acquire images.
  • the front face generator 320 generates a final depth image and a final color image 1C + 1D corresponding to the front face of the participant for IconTek using the depth images and the color images to generate the network 360. To the other party of the video conference.
  • the 3D image generator 330 receives a final depth image and a final color image 1C + 1D corresponding to the counterpart of the video conference through the network 360, and generates a 3D image corresponding to the counterpart using the same. Display on the display device.
  • the 3D image generator 330 measures the 3D recognition depth of the participant based on the reaction of the participant with respect to the 3D test image provided to the participant, and generates the 3D image in consideration of the 3D recognition depth. can do. That is, since the 3D image sensed by each person has a different depth, the 3D image generator 330 measures the depth of the 3D image felt by the user by providing a test stereoscopic image to the user and reflects the 3D image. By creating the 3D image of the videoconferencing system can be normalized.
  • the 3D image generating unit 330 performs mesh hole filling on the final depth image and the final color image, which are sympathized with the video conference counterpart,
  • the image of the 3D mesh form may be restored, and the 3D image corresponding to the counterpart may be generated by using the image of the 3D mesh form.
  • the gesture recognition unit 340 determines whether the participant has performed a predetermined operation by using the captured image.
  • the gesture processing unit 350 performs a function corresponding to the preset operation.
  • the gesture processing unit 350 may provide interactive feedback when it is determined that the predetermined operation is an interactive operation.
  • the interactive feedback may be visual feedback in which an image of a part of the participant's body, which corresponds to the interactive motion, is added to the 3D image.
  • the predetermined operation may be a handshake or a high five.
  • the interaction feedback may be visual feedback in which a part of his or her hand shaking with the other person or a part of his or her hand high five with the other person is added to the 3D image corresponding to the other person.
  • the 3D teleconference apparatus capable of IconTek shown in FIG. 3 enables gesture recognition of meeting participants through a gesture recognition unit 340 and a gesture processing unit 350, thereby enabling real-time information sharing during a video conference. Interactions such as hives and handshakes between meeting participants can be made to maximize the immersion of teleconferences. In addition, real-time operation such as reduction, enlargement, movement, and rotation of virtual objects through gesture recognition is possible during video conference, and interaction such as handshake or high five between video conference participants is also possible. 4 is a block diagram illustrating an example of the image acquisition unit illustrated in FIG. 3.
  • the image acquirer 310 illustrated in FIG. 3 includes an eye detector 410, a PTH parameter determiner 420, a camera move / rotator 430, and a depth / color image acquirer 440. Include.
  • the eye detector 410 finds the eye position of the current conference participant and acquires an icontec image, and operates the camera in consideration of the eye height of the current participant and the eye height of the conference counterpart.
  • the PTH parameter determiner 420 may determine the pan, tilt and height in consideration of the eye position of the conference participant and the eye position of the conference counterpart detected through the eye detector 410. Determine the parameters for the operation.
  • the camera movement / rotation unit 430 operates the camera using parameters for pan, tilt, and height manipulation determined by the PTH parameter determination unit 420. Even if the participant moves freely during the meeting, the participant can track the position of the participant while properly acquiring the video at the position most similar to the eye of the conference participant.
  • the depth / color image acquisition unit 440 generates depth images and color images (2C + 2D) from the camera at an optimal position for icontec between conference participants by the camera movement / rotation unit 430.
  • 5 is a block diagram illustrating an example of the front face generator shown in FIG. 3.
  • the front face generator 320 illustrated in FIG. 3 includes a depth information noise filter 510, a depth corrector 520, a color corrector 530, and a depth merger and hole filler 540. ).
  • the front face generator shown in FIG. 5 performs an algorithm for generating a 3D front face image using images acquired from two cameras in order to maintain icontec between videoconferencing participants.
  • the depth information noise filter 510 removes depth noise from the acquired depth image.
  • the depth correction unit 520 corrects the depth error that the depth camera has.
  • the color corrector 530 performs color correction to match color differences of images acquired at different positions.
  • the depth merging and hole filling unit 540 performs depth merging and hole filling to generate a front image of the conference participant and provides the final depth image and one final color image (1D + 1C). Each of the final depth image and the final color image is a result of generating a front face so that each meeting participant can do Icontec.
  • the final depth image and the final color image generated as described above may be transmitted to the counterpart in real time by performing image compression in the middleware step.
  • FIG. 6 is a diagram illustrating an example of front face generation for Icontec. Referring to FIG. 6, it can be seen that the image 610 captured by the camera generates a front face (front image) by the 3D image generator.
  • FIG. 7 is a block diagram illustrating an example of the 3D image generating unit shown in FIG. 3.
  • the 3D image generator 330 illustrated in FIG. 3 includes a 3D mesh modeling unit 710, a mesh hole filling unit 720, a depth correction and adjusting unit 730, and a stereoscopic 3D image generating unit. 740.
  • the 3D mesh modeling unit 710 performs 3D mesh modeling.
  • the mesh hole filling unit 720 performs mesh hole filling.
  • the depth correction and adjustment unit 730 provides a 3D test image to the video conference participant, measures the participant's 3D recognition depth based on the participant's reaction to the provided 3D test image, and uses the measured 3D recognition depth to correct the depth. Do this.
  • the stereoscopic 3D image generating unit 740 finally generates a 3D image composed of two color images to be displayed on the display.
  • the display device may be a large display, a home 3DTV, a 3D monitor for a computer, or a mobile device.
  • 8 is a view showing the progress of the three-dimensional teleconference to which the present invention is applied.
  • participants participating in the video conference are icontec while viewing the video conference counterparts provided in three dimensions through the display screen, respectively, and the participants' video is captured by a camera tracking an appropriate position of the participant.
  • the captured image is synthesized into a front face image and transmitted to the other party.
  • the video conference participant may interact with the other party, such as a high five or a handshake, or may interact with a virtual object by performing an operation of a predetermined pattern.
  • 9 illustrates an example of visual feedback for an interactive action according to the present invention.
  • the videoconferencing participant 913 may enter an interactive operation mode by performing an operation of a predetermined pattern during a meeting with the videoconferencing party 914.
  • the videoconferencing participant 913 may enter the interactive mode of operation for high five in an operation of lifting the hand with the palm toward the screen for the high five.
  • IconTec enabled three-dimensional teleconference device may detect the motion of the participant 913 to enter the interactive operation mode for high five.
  • the display apparatus may display a three-dimensional image 910 reciprocating to the video conferencing counterpart 914, and visual feedback corresponding to an interactive operation for high five is included in the three-dimensional image 910 for display.
  • the visual feedback may be an image showing a portion 911 of the hand lifted for high five of the videoconferencing participant 913.
  • an image corresponding to the interactive operation mode for high five is also displayed on the other side of the video conference. That is, the video conferencing party 923 is presented with a three-dimensional image 924 sang to the video conferencing participant 924, and the visual feedback against the interactive action for high five is included in the three-dimensional image 924. Can be displayed. In this case, the visual feedback may be an image representing a portion 921 of the hand lifted for high five of the video conferencing party 923.
  • 10 is a flowchart illustrating a three-dimensional teleconference method capable of IconTek according to an embodiment of the present invention.
  • IconTec capable 3D teleconference method includes a photographing image of a videoconferencing participant as a subject and an image corresponding to the counterpart of the videoconferencing received through a network.
  • the cameras are real-time pan, tilt, and height to acquire depth images and color images (S1010).
  • a pan operation of the cameras is performed based on the position of the participant's eye detected in the captured image, and the position detected by the participant's eye position and the image corresponding to the counterpart.
  • the tilt operation may be performed based on a difference in the eye position of the other party, and the height operation of the cameras may be performed based on the eye height of the other party.
  • IconTek capable three-dimensional teleconference method according to an embodiment of the present invention, the final depth image and the final color image to the front face of the participant for the icontec using the depth images and color images To generate (S1020).
  • the 3D teleconference method capable of IconTek generates a 3D image corresponding to the counterpart and displays the same on the display device (S1030).
  • step S1030 may measure the 3D recognition depth of the participant based on the participants' reaction to the 3D test image provided to the video conference participant, and generate the 3D image in consideration of the measured 3D recognition depth. have.
  • the 3D teleconference method capable of IconTek includes determining whether the participant has performed a predetermined operation by using the captured image; And performing a function corresponding to the preset operation.
  • the step of performing a function of requesting a preset motion may include a time when an image of a part of the participant's body corresponding to the interactive motion is added to the 3D image when the predetermined motion is determined to be an interactive motion. You can provide feedback.
  • the apparatus and method for a three-dimensional teleconference according to the present invention is not limited to the configuration and method of the embodiments described as described above, but the embodiments may be modified in various ways. All or part of these may be selectively combined.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Studio Devices (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Telephonic Communication Services (AREA)

Description

【명세서】
아이콘텍이 가능한 3차원 원격회의 장치 및 이를 이용한 방법
【기술분야】
본 발명은 3차원 원격회의 시스템에 관한 것으로, 특히 원격지의 두 회의 참가자가 서로의 3차원 정면 얼굴을 보며 아이콘텍 (eye-contact)을 하고 서로 실시간으로 상호작용할 수 있는 원격회의 시스템 및 이를 이용한 방법에 관한 것이다. 본 출원은 2012년 6월 11일에 한국 특허청에 제출된 한국 특허 출원 제 10- 2012-0062200호의 출원일의 이익을 주장하며, 그 내용 전부는 본 명세서에 포함된다. 【배경기술】
최근 멀티미디어 통신 서비스가 대증화되어감에 따라 지역적으로 멀리 떨어진 상대방과 얼굴을 마주하며 대화를 주고 받을 수 있는 원격회의 시스템이 널리 사용되고 있다. 원격회의 시스템은 여러 사람이 함께 참여할수도 있고, 여러 지역을 동시에 연결할 수도 있으며, 네트워크를 통해 상대방의 음성이나 영상 등의 회의 정보를 실시간으로 전달한다.
일반적으로, 원격회의 시스템은 사용자를 촬영하기 위한 카메라가 화면의 상단이나 하단 또는 측면에 위치하고 사용자의 시선은 화면을 웅시하므로 촬영된 사용자의 영상은 그 시선의 방향이 정면을 보고 있지 않은 것이 일반적이다.
대화에 있어서 아이콘텍 (eye-contact)은 대화에 몰입하거나 상대방에게 신뢰감을 주는데 아주 중요한 요소이나, 상술한 바와 같이 일반적으로 사용되는 원격회의 시스템에서는 화면에 표시되는 사용자의 시선 방향이 정면이 아니므로 대화의 상대방과 아이콘텍이 불가능하다는 문제가 있다. 이와 같은 원격회의 시스템에서 아이콘텍이 불가능한 문제는 원격회의 시스템의 현실화에 치명적인 한계로 대두되었고, 실제로 많은 사용자들이 원격회의를 통한 대화에서 어색함을 느끼는 중요한 요소가 되어왔다.
미국등록특허 제 6771303호는 화상회의 시 모니터의 상단과 하단에 두 대의 카메라를 설치하여 화상회의 참가자의 깊이 정보를 계산하고, 참가자의 머리 위치를 파악하여 현재 참가자의 위치에 맞는 시선 영상을 생성함으로써 대화 참가자들이 서로 시선을 교환할 수 있는 기술을 소개하였고, 미국등록특허 계 6806898호는 모니터 상단에 설치된 카메라를 통해 현재 원격회의 참가자의 머리 위치 및 방향을 분석하여 현재 참가자의 눈의 위치가 정면을 바라보도록 눈동자를 합성하여 원격회의 상대방과의 시선 맞춤을 가능하게 하는 기술을 소개하였다.
또한, 한국공개특허 제 199그 0057779호는 3대의 카메라를 이용하여 각 회의 참가자들에게 디스플레이해줄 3차원 영상들을 생성하여 3차원 디스플레이하는 기술을 개시하고 있고, 한국공개특허 제 2010— 0028725호는 시선일치 카메라에서 수광부만 별도로 이동시킬 수 있도록 함으로써 상대방이 모니터의 정증앙에 디스플레이되지 않더라도 적웅적으로 시선일치를 이롤 수 있도록 하는 기술을 개시하고 있다.
그러나, 이와 같은 종래의 원격희의 시스템을 위한 아이콘텍 지원기술들은 아이콘텍 영상을 획득하기 위해 고정된 카메라 위치 또는 상대방의 화면상 위치만을 고려한 단순한 이동에 의한 단순한 영상 획득만을 개시하고 있을 뿐, 최적의 아이콘텍 영상 획득을 위해 고려되어야 하는 요소 및 이들을 고려하여 어떤 방식으로 카메라를 조작할 것인지에 대해 구체적인 기술을 제시하고 있지 못하다. 또한, 종래 기술들은 대부분 실시간 깊이 계산을 통해 깊이 정보를 생성하는 기술을 채택하고 있어서 깊이 정보의 정확성이 보장되지 않기 때문에 자연스러운 영상 생성이 어렵다는 문제점이 있다. 나아가, 종래 기술들은 단순히 서로 영상을 보면서 회의를 진행하는 방식에 한정되는 기술들로 보다 실감나는 원격회의를 위한 실시간상호작용에 관해서는 언급하고 있지 않다.
따라서, 실감나는 아이콘텍 영상을 생성하기 위해 고려되어야 하는 요소들을 제시하고 이들 요소들올 적절히 활용하여 카메라를 조작함으로써 최적의 아이콘텍 영상을 제공하고, 보다 실감나는 원격회의를 위한 실시간 상호작용이 가능하며, 깊이카메라를 통해 획득된 깊이정보를 이용하여 보다 정확하고 실감나는 영상 생성이 가능한새로운 3차원 화상회의 기술의 필요성이 절실하게 대두된다.
【발명의 상세한설명】
【기술적 과제】
본 발명의 목적은 화상회의 참가자가 일어서서 회의를 진행하거나 위치를 이동하는 경우에도 실감나는 아이콘텍 영상을 촬영하기 위해 고려되어야 하는 요소들을 정의하고, 이들 요소들을 적절히 활용하여 카메라를 조작함으로써 원격회의 참가자들이 실제로 같은 공간에 있는 듯한 느낌으로 자연스럽게 회의를 진행할수 있도록 하는 것이다. 또한, 본 발명의 목적은 3차원 원격회의시 실시간 상호작용을 통해 원격회의 참가자들에게 실제 동일 공간에서 회의하는 것과 같은 느낌을 주어 원격회의 시스템을 현실화하는 것이다.
또한, 본 발명의 목적은 3차원 깊이 정보를 실시간 계산함으로써 야기되는 정확도 문제를 해결하여 보다 실감나는 영상 생성이 가능한 3차원 화상회의 시스템올 제공하는 것이다.
또한, 본 발명의 목적은 테스트 패턴을 이용하여 사용자마다 달리 느끼는 3차원 깊이를 정규화하고, 정규화 결과를 반영하여 3차원 영상을 생성함으로써 보다 실감나는 화상회의 시스템을 제공하는 것이다.
【기술적 해결방법】
상기한 목적올 달성하기 위한 본 발명에 따른 아이콘텍이 가능한 3차원 원격회의 장치는, 피사체인 화상회의 참가자를 촬영한 촬영 영상 및 네트워크를 통하여 수신된 상기 화상회의의 상대방에 해당하는 영상을 고려하여 카메라들을 실시간 조작하여 깊이 영상들 및 컬러 영상들을 획득하는 영상 획득부; 상기 깊이 영상들 및 컬러 영상들을 이용하여 아이콘텍을 위한 상기 참가자의 정면 얼굴에 상응하는 최종 깊이 영상 및 최종 컬러 영상을 생성하는 정면얼굴 생성부; 및 상기 상대방에 상응하는 3차원 영상을 생성하여 디스플레이 장치에 표시하는 3D 영상 생성부를 포함한다.
이 때, 영상 획득부는 상기 카메라들 각각을 좌 /우로 회전시키는 팬 (pan) 조작, 상기 카메라들 각각을 상 /하로 회전시키는 틸트 (tilt) 조작, 및 상기 카메라들을 상 /하로 이동시키는 높이 (height) 조작올 통해 상기 카메라들올 실시간 조작할 수 있다.
이 때, 영상 획득부는 상기 촬영 영상에 기반하여 상기 카메라들의 팬 (pan) 조작을 수행하고, 상기 촬영 영상 및 상기 상대방에 해당하는 영상을 함께 이용하여 틸트 (tilt) 조작을 수행하고, 상기 상대방에 해당하는 영상에 기반하여 상기 카메라들의 높이 (height) 조작을 수행할수 있다.
이 때, 영상 획득부는 상기 촬영 영상에서 검출된 상기 참가자의 눈 위치에 기반하여 상기 카메라들의 팬 (pan) 조작을 수행하고, 상기 참가자의 눈 위치 및 상기 상대방에 해당하는 영상에서 검출된 상기 상대방의 눈 위치의 차이 (difference)에 기반하여 상기 틸트 (tilt) 조작올 수행하고, 상기 상대방의 눈 높이에 기반하여 상기 카메라들의 높이 (height) 조작을 수행할수 있다.
이 때, 아이콘텍이 가능한 3차원 원격회의 장치는 상기 촬영 영상을 이용하여 상기 참가자가 기설정된 동작올 수행하였는지 여부를 판단하는 제스처 인식부; 및 상기 기설정된 동작에 상응하는 기능올 수행하는 제스처 처리부를 더 포함할 수 있다.
이 때, 제스처 처리부는 상기 기설정된 동작이 상호작용 동작으로 판단되는 경우상호작용 피드백을 제공할 수 있다.
이 때, 상호작용 피드백은 상기 3차원 영상에 상기 상호작용 동작에 상응하는 상기 참가자의 신체 일부의 영상이 부가된 시각 피드백일 수 있다.
이 때, 상기 3D 영상 생성부는 상기 참가자에게 제공된 3D 테스트 영상에 대한 상기 참가자의 리액션에 기반하여 상기 참가자의 3D 인식 깊이를 측정하고, 상기 3D 인식 깊이를 고려하여 상기 3차원 영상을 생성할수 있다.
이 때, 상기 카메라들은 상기 디스플레이 장치에 일체형으로 구비될 수 있다. 이 때, 카메라들은 이동 및 회전 가능하게 상기 디스플레이 장치에 부착될 수 있다. 또한, 상기 카메라들은 상기 디스풀레이 장치의 외부에 독립적으로 이동 및 회전 가능하도록 구비될 수 있다.
이 때, 상기 전면얼굴 생성부는 상기 깊이 영상들을 대상으로 깊이 노이즈 제거 및 깊이 보정을 수행하고 상기 컬러 영상들을 대상으로 색상 보정을 수행하여 1장의 상기 최종 깊이 영상 및 1장의 상기 최종 컬러 영상을 생성할수 있다.
이 때, 상기 3D 영상 생성부는 상기 상대방에 상웅하는 상기 최종 깊이 영상 및 상기 최종 컬러 영상에 대하여 메쉬 홀채움을 수행하여 상기 상대방에 상응하는 3차원 메쉬형태의 영상을 복원하고, 상기 3차원 메쉬형태의 영상을 이용하여 상기 상대방에 상웅하는 3차원 영상을 생성할수 있다.
또한, 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 방법은, 피사체인 화상회의 참가자를 촬영한 촬영 영상 및 네트워크를 통하여 수신된 상기 화상회의의 상대방에 해당하는 영상올 고려하여 카메라들을 실시간 팬 (pan), 틸트 (tilt) 및 높이 (height) 조작하여 깊이 영상들 및 컬러 ,상들을 획득하는 단계 ; 상기 깊이 영상들 및 컬러 영상들을 이용하여 아이콘텍을 위한 상기 참가자의 정면 얼굴에 상웅하는 최종 깊이 영상 및 최종 컬러 영상을 생성하는 단계; 및 상기 상대방에 상웅하는 3차원 영상을 생성하여 디스플레이 장치에 표시하는 단계를 포함한다.
이 때, 상기 깊이 영상들 및 컬러 영상들을 획득하는 단계는 상기 촬영 영상에서 검출된 상기 참가자의 눈 위치에 기반하여 상기 카메라들의 팬 (pan) 조작을 수행하고, 상기 참가자의 눈 위치 및 상기 상대방에 해당하는 영상에서 검출된 상기 상대방의 눈 위치의 차이 (difference)에 기반하여 상기 틸트 (tilt) 조작을 수행하고, 상기 상대방의 눈 높이에 기반하여 상기 카메라들의 높이 (height) 조작을수행할수 있다.
이 때, 상기 아이콘텍이 가능한 3차원 원격희의 방법은 상기 촬영 영상을 이용하여 상기 참가자가 기설정된 동작을 수행하였는지 여부를 관단하는 단계; 및 상기 기설정된 동작에 상웅하는 기능을 수행하는 단계를 더 포함할수 있다.
이 때, 상기 기설정된 동작에 상응하는 기능을 수행하는 단계는 상기 기설정된 동작이 상호작용 동작으로 판단되는 경우 상기 3차원 영상에 상기 상호작용 동작에 상웅하는 상기 참가자의 신체 일부의 영상이 부가된 시각 피드백을 제공할수 있다.
이 때, 상기 디스플레이 장치에 표시하는 단계는 상기 참가자에게 제공된 3D 테스트 영상에 대한 상기 참가자의 리액션에 기반하여 상기 참가자의 3D 인식 깊이를 측정하고, 상기 3D 인식 깊이를 고려하여 상기 3차원 영상을 생성할 수 있다. 【유리한 효과】
본 발명에 따르면, 화상회의 참가자가 일어서서 회의를 진행하거나 위치를 이동하는 경우에도 카메라가 적절히 참가자를 트랙킹 (tracking)함으로써 원격회의 참가자들이 실제로 같은 공간에 있는 듯한 느낌으로 자연스럽게 회의를 진행할 수 있는 3차원 이미지 생성이 가능하다.
또한, 본 발명은 3차원 원격회의시 악수나 하이파이브 등의 실시간 상호작용올 통해 원격회의 참가자들에게 실제 동일 공간에서 회의하는 것과 같은 느낌을주어 원격회의 시스템을 현실화할수 있다.
또한, 본 발명은 3차원 깊이 정보를 실시간 계산함으로써 야기되는 정확도 문제를 해결하여 보다실감나는 3차원 영상 생성이 가능하다.
또한, 본 발명은 테스트 패턴을 이용하여 사용자마다 달리 느끼는 3차원 깊이를 정규화하고, 정규화 결과를 반영하여 3차원 영상을 생성함으로써 보다 실감나는 원격 회의가 가능하다. 【도면의 간단한 설명】
도 1은 본 발명의 아이콘텍이 가능한 3차원 원격회의 장치가 적용된 시스템의 일 예를 나타낸 도면이다.
도 2는 본 발명의 아이콘텍이 가능한 3차원 원격회의 장치가 적용된 시스템의 다른 예를 나타낸 도면이다.
도 3은 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 장치를 나타낸 블록도이다.
도 4는 도 3에 도시된 영상 획득부의 일 예를 나타낸 블록도이다.
도 5는 도 3에 도시된 정면얼굴 생성부의 일 예를 나타낸 블록도이다.
도 6은 아이콘텍을 위한 정면얼굴 생성의 일 예를 나타낸 도면이다.
도 7은 도 3에 도시된 3D 영상 생성부의 일 예를 나타낸 블록도이다.
도 8은 본 발명이 적용된 3차원 원격회의 진행 상황올 나타낸 도면이다. 도 9는 본 발명에 따른 상호작용 동작에 대한 시각 피드백의 일 예를 나타낸 도면이다.
도 10은 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격희의 방법을 나타낸 동작흐름도이다.
【발명의 실시를 위한 형태】
본 발명을 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다. 여기서, 반복되는 설명, 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능, 및 구성에 대한 상세한 설명은 생략한다. 본 발명의 실시형태는 당 업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해서 제공되는 것이다. 따라서, 도면에서의 요소들의 형상 및 크기 등은보다 명확한 설명을 위해 과장될 수 있다. 이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다. 도 1은 본 발명의 아이콘텍이 가능한 3차원 원격회의 장치가 적용된 시스템의 일 예를 나타낸 도면이다.
도 1을 참조하면, 본 발명의 아이콘텍이 가능한 3차원 원격회의 장치는 3차원 영상을 디스플레이하는 디스플레이 장치 (110) 및 아이콘텍 영상을 생성하기 위한 카메라들 (121, 122)을포함한다. 즉, 도 1에 도시된 시스템은 화상회의의 상대방의 3차원 영상을 디스플레이 장치 (110)를 통하여 표시하고, 피사체인 화상회의 참가자를 카메라들 (121, 122)을 통하여 촬영한다. 이 때, 카메라들 (121, 122)은 실시간으로 아이콘텍을 위한 정면 입체 영상올 생성하기에 적합하도록 회전 및 이동할수 있다.
이 때, 카메라들 (121, 122) 각각은 컬러 영상을 획득하는 RGB 카메라와 깊이 영상올 만들어내는 IR카메라로 구성된 키넥트 카메라 (Kinect Camera)일 수 있다. 도 1에 도시된 바와 같이, 카메라들 (121, 122)은 디스플레이 장치 (110)와 독립적으로 구비되어 아이콘텍을 위한 정면 영상을 생성하기에 적합하도록 사용자를 트랙킹하기 위해 자유롭게 회전 및 이동할수 있다. 도 2는 본 발명의 아이콘텍이 가능한 3차원 원격회의 장치가 적용된 시스템의 다른 예를 나타낸 도면이다.
도 2를 참조하면, 카메라들 (221, 222)이 디스플레이 장치 (210)에 설치되어 있는 것을 알 수 있다.
도 2에 도시된 시스템은 화상회의의 상대방의 3차원 영상을 디스플레이 장치 (210)를 통하여 표시하고, 피사체인 화상회의 참가자를 카메라들 (221, 222)을 통하여 촬영한다. 이 때, 디스플레이 장치 (210)에 일체형으로 구비된 카메라들 (221: 222)은 실시간으로 아이콘텍을 위한 정면 입체 영상을 생성하기에 적합하도록 회전 및 이동할수 있다.
이 때, 카메라들 (221, 222) 각각은 컬러 영상을 획득하는 RGB 카메라와 깊이 영상을 만들어내는 IR카메라로 구성된 키넥트 카메라 (Kinect Camera)일 수 있다. 도 2에 도시된 바와 같이, 카메라들 (221, 222)은 디스플레이 장치 (210)에 일체형으로 구비되어 아이콘텍을 위한 정면 영상을 생성하기에 적합하도록 사용자를 트랙킹하기 위해 자유롭게 회전 및 이동할수 있다. 도 3은 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 장치를 나타낸 블톡도이다.
도 3을 참조하면, 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격희의 장치는 영상 획득부 (310), 정면얼굴 생성부 (320), 3D 영상 생성부 (330), 제스처 인식부 (340) 및 제스처 처리부 (350)를 포함한다. 영상 획득부 (310)는 피사체인 화상회의 참가자를 촬영한 촬영 영상 및 네트워크를 통하여 수신된 상기 화상회의의 상대방에 해당하는 영상을 고려하여 카메라들올 실시간조작하여 깊이 영상들 및 컬러 영상들 (2C+2D)을 획득한다.
이 때, 영상 획득부 (310)는 카메라들을 포함할 수도 있고, 카메라와 독립적인 장치로 구현될 수도 있다.
이 때, 카메라들은 두 개의 키넥트 카메라들일 수 있다. 이와 같이 깊이 영상을 만들어내는 IR 카메라를 포함하는 키넥트 카메라를 이용함으로써 깊이 정보를 실시간 계산하는 부담을 줄이고 보다 정확한 깊이 정보를 통해 보다 실감나는 3차원 영상 생성이 가능하다.
이 때, 카메라는 컬러 영상 획득을 위한 RGB카메라를 포함할 수 있다.
또한, 카메라는 색상 영상과 깊이 정보를 동시에 획득할 수 있는 모든 종류의 카메라일 수 있고, 카메라의 종류나 타입에 따라 본 발명의 권리범위가 제한되어서는 안된다.
회의 참가자가 회의를 일어서서 진행하거나, 회의 도중에 위치를 바꾸는 경우에도 아이콘텍을 위한 정면 영상을 생성하기 위해 카메라들이 최적의 위치로 이동할 필요가 있다.
영상 획득부 (310)는 카메라들 각각을 좌 /우로 회전시키는 팬 (pan) 조작, 상기 카메라들 각각을 상 /하로 희전시키는 틸트 (tilt) 조작, 및 상기 카메라들을 상 /하로 이동시키는 높이 (height) 조작을 통해 상기 카메라들을 실시간 조작할 수 있다.
이 때, 영상 획득부 (310)는 화상회의 참가자를 촬영한 촬영 영상에 기반하여 카메라들의 팬 (pan) 조작을 수행하고, 화상회의 참가자를 촬영한 촬영 영상 및 상대방에 해당하는 영상을 함께 이용하여 틸트 (tilt) 조작을 수행하고, 상대방에 해당하는 영상에 기반하여 카메라들의 높이 (height) 조작올 수행할 수 있다.
보다 구체적으로, 영상 획득부 (310)는 화상회의 참가자를 촬영한 촬영 영상에서 상기 참가자의 눈 위치를 검출하고, 검출된 상기 참가자의 눈 위치에 기반하여 상기 카메라들의 팬 (pan) 조작을 수행할 수 있다. 이와 같이 참가자의 눈 위치에 기반하여 카메라들의 좌 /우 회전을 조작하여 수평적으로 참가자의 정면 영상 합성에 적합한 영상을 촬영할수 있다.
또한, 영상 획득부 (310)는 화상회의 참가자의 눈 위치 및 화상회의 상대방의 눈 위치의 차이 (difference)에 기반하여 틸트 조작을 수행할 수 있다. 이와 같이 참가자의 눈 위치 및 상대방의 눈 위치 사이의 차이에 기반하여 카메라들의 상 /하 회전을 조작하여 회의 참가자들이 서로 서로를 바라보는 상황을 반영하여 회의 참가자들 간의 신장 (키) 차이에 의해 아이콘텍이 어려운 상황에서도 수직적으로 참가자의 정면 영상 합성에 적합한 영상을 촬영할 수 있다.
또한, 영상 획득부 (310)는 상대방의 눈 높이에 기반하여 카메라들이 높이 (height) 조작을 수행할 수 있다. 이와 같이 상대방의 눈 높이에 기반하여 카메라들의 높이를 조작하여 실제 회의 참가자의 눈높이에 맞춘 영상을 촬영할 수 있다.
이와 같이, 영상 획득부 (310)는 원격 화상회의에서 현실감을 극대화하기 위해 회의 상대방과 아이콘텍이 가능한 현실감 있는 희의 진행을 위해 회의 참가자가 바라보는 시선을 고려하여 참가자의 현재 시선과 가장 유사한 위치에서 카메라가 영상을 획득할 수 있도록 카메라의 위치를 이동시키고 카메라의 상 /하 및 좌 /우 각도를 회전시킨다.
정면 얼굴 생성부 (320)는 상기 깊이 영상들 및 컬러 영상들을 이용하여 아이콘텍을 위한상기 참가자의 정면 얼굴에 상응하는 최종 깊이 영상 및 최종 컬러 영상 (1C+1D)을 생성하여 네트워크 (360)를 통하여 상기 화상회의의 상대방에게 전송한다.
3D 영상 생성부 (330)는 네트워크 (360)를 통하여 상기 화상회의의 상대방에 대응하는 최종 깊이 영상 및 최종 컬러 영상 (1C+1D)을 수신하고, 이를 이용하여 상대방에 상응하는 3차원 영상을 생성하여 디스플레이 장치에 표시한다.
이 때, 3D 영상 생성부 (330)는 상기 참가자에게 제공된 3D 테스트 영상에 대한 상기 참가자의 리액션에 기반하여 상기 참가자의 3D 인식 깊이를 측정하고, 상기 3D 인식 깊이를 고려하여 상기 3차원 영상을 생성할 수 있다. 즉, 사람마다 느끼는 3차원 영상이 깊이가 상이하므로 3D 영상 생성부 (330)는 사용자들에게 테스트 입체영상을 제공하여 해당 사용자가 느끼는 3차원 영상의 깊이를 측정하고 이를 반영하여 상기 3차원 영상을 생성함으로써 화상회의 시스템의 3차원 영상을 정규화할수 있다.
3D 영상 생성부 (330)는 화상회의 상대방에 상웅하는 상기 최종 깊이 영상 및 상기 최종 컬러 영상에 대하여 메쉬 홀채움을 수행하여 상기 상대방에 상웅하는 3차원 메쉬형태의 영상을 복원하고, 상기 3차원 메쉬형태의 영상을 이용하여 상기 상대방에 상응하는 3차원 영상을 생성할수 있다.
제스처 인식부 (340)는 상기 촬영 영상을 이용하여 상기 참가자가 기설정된 동작을 수행하였는지 여부를 판단한다.
제스처 처리부 (350)는 상기 기설정된 동작에 상응하는 기능을 수행한다. 이 때, 제스처 처리부 (350)는 기설정된 동작이 상호작용 동작으로 판단되는 경우, 상호작용 피드백을 제공할 수 있다. 이 때, 상호작용 피드백은 3차원 영상에 상기 상호작용 동작에 상웅하는 상기 참가자의 신체 일부의 영상이 부가된 시각 피드백일 수 있다.
예를 들어, 기설정된 동작은 악수나 하이파이브 등일 수 있다. 예를 들어, 상호작용 피드백은 상대방과 악수하는 자신의 손의 일부 또는 상대방과 하이파이브하는 자신의 손의 일부 영상이 상대방에 해당하는 3차원 영상에 부가된 시각 피드백일 수 있다.
이와 같이, 도 3에 도시된 아이콘텍이 가능한 3차원 원격회의 장치는 제스처 인식부 (340) 및 제스처 처리부 (350)를 통해 회의 참가자 들의 제스처 인식이 가능하여 화상회의시 실시간 정보 공유가 가능하고, 회의 참가자 간의 하이프이브나 악수와 같은 상호작용이 가능하여 원격회의의 몰입감을 극대화시킬 수 있다. 또한, 화상회의 도중에 제스처 인식을 통한 가상 객체의 축소 /확대 /이동 /회전 등의 실시간 조작이 가능하며, 화상회의 참가자들 간의 악수나 하이파이브와 같은 상호작용도 가능하다. 도 4는 도 3에 도시된 영상 획득부의 일 예를 나타낸 블록도이다.
도 4를 참조하면, 도 3에 도시된 영상 획득부 (310)는 눈 검출부 (410), PTH 파라미터 결정부 (420), 카메라 이동 /회전부 (430) 및 깊이 /컬러 영상 획득부 (440)를 포함한다.
눈 검출부 (410)는 아이콘텍 영상을 획득하기 위해 현재 회의 참가자의 눈 위치를 찾아내고 현재 참가자의 눈 높이와 회의 상대방의 눈 높이를 고려하여 카메라를 조작할수 있도록 한다.
PTH 파라미터 결정부 (420)는 눈 검출부 (410)를 통해 검출된 회의 참가자의 눈 위치와 회의 상대방의 눈 위치를 고려하여 팬 (pan), 틸트 (tilt) 및 높이 (height) 조작올 위한 파라미터를 결정한다.
카메라 이동 /회전부 (430)는 PTH 파라미터 결정부 (420)에 의하여 결정된 팬 (pan), 틸트 (tilt) 및 높이 (height) 조작을 위한 파라미터를 이용하여 카메라를 조작한다ᄋ 이와 같은 조작을 통하여 회의 참가자가 회의 중에 자유롭게 움직이는 경우에도 참가자의 위치를 적절히 트랙킹 (tracking)하면서 회의 참가자의 시선과 가장유사한 위치에서 영상올 획득할 수 있다.
깊이 /컬러 영상 획득부 (440)는 카메라 이동 /회전부 (430)에 의하여 회의 참가자들 간의 아이콘텍을 위한 최적의 포지션에서 카메라로부터 깊이 영상들 및 컬러 영상들 (2C+2D)을 생성한다. 도 5는 도 3에 도시된 정면얼굴 생성부의 일 예를 나타낸 블특도이다.
도 5를 참조하면, 도 3에 도시된 정면얼굴 생성부 (320)는 깊이정보 노이즈 필터링부 (510), 깊이 보정부 (520), 색상 보정부 (530) 및 깊이병합 및 홀채움부 (540)를 포함한다.
도 5에 도시된 정면얼굴 생성부는 화상회의 참가자들 사이의 아이콘텍을 유지하기 위해 두 대의 카메라에서 획득한 영상을 이용하여 3차원 정면 얼굴 영상을 생성하기 위한 알고리즘을 수행한다.
깊이정보 노이즈 필터링부 (510)는 획득한 깊이 영상에서 깊이 노이즈를 제거한다.
깊이 보정부 (520)는 깊이 카메라가 가지고 있는 깊이 에러를 보정한다.
색상 보정부 (530)는 서로 다른 위치에서 획득한 영상의 색상 차를 맞추기 위한 색상보정을 수행한다.
깊이병합 및 홀채움부 (540)는 깊이병합 및 홀채움을 수행하여 회의 참가자의 정면 영상을 생성하여 1장의 최종 깊이 영상 및 1장의 최종 컬러 영상으로 제공한다 (1D+1C). 각각 1장의 최종 깊이 영상 및 최종 컬러 영상은 각각의 회의 참가자들이 아이콘텍을 할 수 있도록 하기 위해 정면 얼굴을 생성한 결과 영상이다. 이와 같이 생성된 최종 깊이 영상 및 최종 컬러 영상은 미들웨어 단계에서 영상압축을 실행하여 실시간으로 상대방에게 전송될 수 있다, 도 6은 아이콘텍을 위한 정면얼굴 생성의 일 예를 나타낸 도면이다. 도 6을 참조하면, 카메라에 의해 촬영된 영상 (610)이 3D 영상 생성부에 의해 정면 얼굴 (정면 영상)을 생성하는 것을 알 수 있다. 3D 영상 생성부는 화상 회의 참가자의 움직임에 따라 자동으로 적절한 위치로 카메라를 이동시켜 영상을 촬영하고, 촬영된 영상을 이용하여 참가자의 위치에 상응하는 정면 영상을 생성한다. 도 7은 도 3에 도시된 3D 영상 생성부의 일 예를 나타낸 블록도이다.
도 7을 참조하면, 도 3에 도시된 3D 영상 생성부 (330)는 3D 메쉬 모델링부 (710), 메쉬 홀채움부 (720), 깊이 보정 및 조절부 (730) 및 스테레오스코픽 3D 영상 생성부 (740)를 포함한다.
3D 메쉬 모델링부 (710)는 3차원 메쉬 모델링을 수행한다.
메쉬 홀채움부 (720)는 메쉬 홀채움을 수행한다.
깊이 보정 및 조절부 (730)는 화상회의 참가자에게 3D 테스트 영상을 제공하고 제공된 3D 테스트 영상에 대한 참가자의 리액션에 기반하여 참가자의 3D 인식 깊이를 측정하고, 측정된 3D 인식 깊이를 이용하여 깊이 보정을 수행한다.
스테레오스코픽 3D 영상 생성부 (740)는 최종적으로 디스플레이에 표시될 두 장의 색상영상으로 구성된 3차원 영상을 생성한다.
이 때, 디스플레이 장치는 대형 디스폴레이, 가정용 3DTV, 컴퓨터용 3D 모니터 또는 모바일 장치일 수 있다. 도 8은 본 발명이 적용된 3차원 원격회의 진행 상황을 나타낸 도면이다.
도 8을 참조하면, 화상회의에 참가하는 참가자들은 각각 디스플레이 화면올 통하여 3차원으로 제공되는 화상회의 상대방의 영상을 보면서 아이콘텍을 하고, 참가자의 영상은 참가자의 적절한 위치를 트랙킹하는 카메라에 의하여 촬영되고 촬영된 영상이 정면 얼굴 영상으로 합성되어 상대방에게 전달된다.
화상회의 도중에 화상회의 참가자는 상대방과 하이파이브나 악수 등의 상호작용을 할 수 있고, 기설정된 패턴의 동작을 수행함으로써 가상 객체를 상호 조작할수도 있다. 도 9는 본 발명에 따른 상호작용 동작에 대한 시각 피드백의 일 예를 나타낸 도면이다. 도 9를 참조하면, 화상회의 참가자 (913)는 화상회의 상대방 (914)과의 회의 도중에 기설정된 패턴의 동작을 수행함으로써 상호작용 동작 모드로 들어갈 수 있다. 도 9에 도시된 예에서 화상회의 참가자 (913)는 하이파이브를 위해 손바닥을 스크린 방향으로 하여 손을 들어을리는 동작으로 하이파이브를 위한 상호작용 동작 모드로 들어갈 수 있다. 아이콘텍이 가능한 3차원 원격회의 장치는 참가자 (913)의 동작을 감지하여 하이파이브를 위한상호작용 동작모드로 진입할 수 있다.
이 때, 디스플레이 장치에는 화상회의 상대방 (914)에 상웅하는 3차원 영상 (910)이 표시될 수 있고, 하이파이브를 위한 상호작용 동작에 해당하는 시각 피드백이 3차원 영상 (910)에 포함되어 표시될 수 있다. 이 때, 시각 피드백은 화상회의 참가자 (913)의 하이파이브를 위해 들어을린 손의 일부분 (911)을 나타내는 영상일 수 있다.
이 때, 화상회의 상대측에서도 하이파이브를 위한 상호작용 동작 모드에 해당하는 영상이 표시된다. 즉, 화상회의 상대방 (923)에게는 화상회의 참가자 (924)에 상웅하는 3차원 영상 (924)이 표시되고, 하이파이브를 위한 상호작용 동작에 대항하는 시각 피드백이 3차원 영상 (924)에 포함되어 표시될 수 있다. 이 때, 시각 피드백은 화상회의 상대방 (923)의 하이파이브를 위해 들어을린 손의 일부분 (921)을 나타내는 영상일 수 있다. 도 10은 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 방법을 나타낸 동작흐름도이다.
도 10을 참조하면, 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 방법은, 피사체인 화상회의 참가자를 촬영한 촬영 영상 및 네트워크를 통하여 수신된 상기 화상회의의 상대방에 해당하는 영상을 고려하여 카메라들을 실시간 팬 (pan), 틸트 (tilt) 및 높이 (height) 조작하여 깊이 영상들 및 컬러 영상들을 획득한다 (S1010).
이 때 ᅳ 단계 (S1010)는 상기 촬영 영상에서 검출된 상기 참가자의 눈 위치에 기반하여 상기 카메라들의 팬 (pan) 조작을 수행하고, 상기 참가자의 눈 위치 및 상기 상대방에 해당하는 영상에서 검출된 상기 상대방의 눈 위치의 차이 (difference)에 기반하여 상기 틸트 (tilt) 조작을 수행하고, 상기 상대방의 눈 높이에 기반하여 상기 카메라들의 높이 (height) 조작을 수행할수 있다. 또한, 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 방법은, 상기 깊이 영상들 및 컬러 영상들을 이용하여 아이콘텍을 위한 상기 참가자의 정면 얼굴에 상웅하는 최종 깊이 영상 및 최종 컬러 영상을 생성한다 (S1020).
또한, 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 방법은, 상기 상대방에 상응하는 3차원 영상을 생성하여 디스플레이 장치에 표시한다 (S1030).
이 때, 단계 (S1030)는 화상회의 참가자에게 제공된 3D 테스트 영상에 대한 참가자의 리액션 (reaction)에 기반하여 참가자의 3D 인식 깊이를 측정하고, 측정된 3D 인식 깊이를 고려하여 3차원 영상을 생성할수 있다.
도 10에는 도시되지 아니하였으나, 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 방법은 상기 촬영 영상을 이용하여 상기 참가자가 기설정된 동작을 수행하였는지 여부를 판단하는 단계; 및 상기 기설정된 동작에 상응하는 기능을 수행하는 단계를 더 포함할 수 있다.
이 때, 기설정된 동작에 상웅하는 기능을 수행하는 단계는 상기 기설정된 동작이 상호작용 동작으로 판단되는 경우 상기 3차원 영상에 상기 상호작용 동작에 상응하는 상기 참가자의 신체 일부의 영상이 부가된 시각 피드백을 제공할수 있다. 이상에서와 같이 본 발명에 따른 3차원 원격회의 장치 및 방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로조합되어 구성될 수도 있다.

Claims

【특허청구범위】
【청구항 1】
피사체인 화상회의 참가자를 촬영한 촬영 영상 및 네트워크를 통하여 수신된 상기 화상회의의 상대방에 해당하는 영상을 고려하여 카메라들을 실시간 조작하여 깊이 영상들 및 컬러 영상들을 획득하는 영상 획득부;
상기 깊이 영상들 및 컬러 영상들을 이용하여 아이콘텍을 위한 상기 참가자의 정면 얼굴에 상웅하는 최종 깊이 영상 및 최종 컬러 영상을 생성하는 정면얼굴 생성부; 및
상기 상대방에 상웅하는 3차원 영상을 생성하여 디스플레이 장치에 표시하는 3D 영상 생성부
를 포함하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.
【청구항 2]
청구항 1에 있어서,
상기 영상 획득부는
상기 카메라들 각각을 좌 /우로 회전시키는 팬 (pan) 조작, 상기 카메라들 각각올 상 /하로 회전시키는 틸트 (tilt) 조작, 및 상기 카메라들을 상 /하로 이동시키는 높이 (height) 조작을 통해 상기 카메라들을 실시간 조작하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.
【청구항 3】
청구항 2에 있어서,
상기 영상 획득부는
상기 촬영 영상에 기반하여 상기 카메라들의 팬 (pan) 조작을수행하고, 상기 촬영 영상 및 상기 상대방에 해당하는 영상을 함께 이용하여 틸트 (tilt) 조작을수행하고,
상기 상대방에 해당하는 영상에 기반하여 상기 카메라들의 높이 (height) 조작을 수행하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격희의 장치.
【청구항 4】
청구항 3에 있어서,
상기 영상 획득부는
상기 촬영 영상에서 검출된 상기 참가자의 눈 위치에 기반하여 상기 카메라들의 팬 (pan) 조작을 수행하고,
상기 참가자의 눈 위치 및 상기 상대방에 해당하는 영상에서 검출된 상기 상대방의 눈 위치의 차이 (difference)에 기반하여 상기 틸트 (tilt) 조작을 수행하고 상기 상대방의 눈 높이에 기반하여 상기 카메라들의 높이 (height) 조작을 수행하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.
I청구항 5]
청구항 4에 있어서,
상기 아이콘텍이 가능한 3차원 원격회의 장치는
상기 촬영 영상을 이용하여 상기 참가자가 기설정된 동작을 수행하였는지 여부를 판단하는 제스처 인식부; 및
상기 기설정된 동작에 상웅하는 기능을 수행하는 제스처 처리부
를 더 포함하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.
【청구항 6】
청구항 5에 있어서,
상기 제스처 처리부는
상기 기설정된 동작이 상호작용 동작으로 판단되는 경우
상호작용 피드백을 제공하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.
【청구항 7】
청구항 6에 있어서,
상기 상호작용 피드백은
상기 3차원 영상에 상기 상호작용 동작에 상웅하는 상기 참가자의 신체 일부의 영상이 부가된 시각 피드백인 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치 .
【청구항 8]
청구항 7에 있어서,
상기 3D 영상 생성부는
상기 참가자에게 제공된 3D 테스트 영상에 대한 상기 참가자의 리액션에 기반하여 상기 참가자의 3D 인식 깊이를 측정하고, 상기 3D 인식 깊이를 고려하여 상기 3차원 영상올 생성하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.
【청구항 9】
청구항 4에 있어서,
상기 카메라들은 상기 디스플레이 장치에 일체형으로 구비되는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.
【청구항 10】
청구항 4에 있어서,
상기 카메라들은 상기 디스플레이 장치의 외부에 독립적으로 구비되는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치 .
【청구항 11】
청구항 4에 있어서,
상기 정면얼굴 생성부는
상기 깊이 영상들을 대상으로 깊이 노이즈 제거 및 깊이 보정을 수행하고 상기 컬러 영상들을 대상으로 색상 보정을 수행하여 1장의 상기 최종 깊이 영상 및 1장의 상기 최종 컬러 영상을 생성하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치 .
【청구항 12】
청구항 4에 있어서,
상기 3D 영상 생성부는
상기 상대방에 상응하는 상기 최종 깊이 영상 및 상기 최종 컬러 영상에 대하여 메쉬 홀채움을 수행하여 상기 상대방에 상웅하는 3차원 메쉬형태의 영상을 복원하고, 상기 3차원 메쉬형태의 영상올 이용하여 상기 상대방에 상웅하는 3차원 영상을 생성하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.
【청구항 13】
피사체인 화상회의 참가자를 촬영한 촬영 영상 및 네트워크를 통하여 수신된 상기 화상회의의 상대방에 해당하는 영상올 고려하여 카메라들을 실시간 팬 (pan), 틸트 (tilt) 및 높이 (height) 조작하여 깊이 영상들 및 컬러 영상들을 획득하는 단계;
상기 깊이 영상들 및 컬러 영상들을 이용하여 아이콘텍을 위한 상기 참가자의 정면 얼굴에 상응하는 최종 깊이 영상 및 최종 컬러 영상을 생성하는 단계; 및
상기 상대방에 상웅하는 3차원 영상을 생성하여 디스플레이 장치에 표시하는 단계
를 포함하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 방법.
【청구항 14]
청구항 13에 있어서,
상기 깊이 영상들 및 컬러 영상들을 획득하는 단계는
상기 촬영 영상에서 검출된 상기 참가자의 눈 위치에 기반하여 상기 카메라들의 팬 (pan) 조작올 수행하고,
상기 참가자의 눈 위치 및 상기 상대방에 해당하는 영상에서 검출된 상기 상대방의 눈 위치의 차이 (difference)에 기반하여 상기 틸트 (tilt) 조작을 수행하고. 상기 상대방의 눈 높이에 기반하여 상기 카메라들의 높이 (height) 조작을 수행하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 방법.
【청구항 15】
청구항 14에 있어서,
상기 아이콘텍이 가능한 3차원 원격회의 방법은
상기 촬영 영상을 이용하여 상기 참가자가 기설정된 동작을 수행하였는지 여부를 판단하는 단계 ; 및
상기 기설정된 동작에 상웅하는 기능을수행하는 단계
를 더 포함하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 방법. 【청구항 16]
청구항 15에 있어서,
상기 기설정된 동작에 상웅하는 기능을수행하는 단계는
상기 기설정돤 동작이 상호작용 동작으로 판단되는 경우 상기 3차원 영상에 상기 상호작용 동작에 상웅하는 상기 참가자의 신체 일부의 영상이 부가된 시각 피드백을 제공하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 방법. 【청구항 17】
청구항 16에 있어서,
상기 디스플레이 장치에 표시하는 단계는
상기 참가자에게 제공된 3D 테스트 영상에 대한 상기 참가자의 리액션에 기 반하여 상기 참가자의 3D 인식 깊이를 측정하고, 상기 3D 인식 깊이를 고려하여 상기 3차원 영상을 생성하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 방법 .
PCT/KR2012/005371 2012-06-11 2012-07-06 아이콘텍이 가능한 3차원 원격회의 장치 및 이를 이용한 방법 Ceased WO2013187551A1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP12861050.8A EP2860969B1 (en) 2012-06-11 2012-07-06 Three-dimensional video conference device capable of enabling eye contact and method using same
JP2014521546A JP5839427B2 (ja) 2012-06-11 2012-07-06 アイコンタクトが可能な3次元遠隔会議装置およびこれを用いた方法
US13/885,998 US9077974B2 (en) 2012-06-11 2012-07-06 3D video-teleconferencing apparatus capable of eye contact and method using the same

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2012-0062200 2012-06-11
KR1020120062200A KR101350996B1 (ko) 2012-06-11 2012-06-11 아이콘텍이 가능한 3차원 원격회의 장치 및 이를 이용한 방법

Publications (1)

Publication Number Publication Date
WO2013187551A1 true WO2013187551A1 (ko) 2013-12-19

Family

ID=49758355

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2012/005371 Ceased WO2013187551A1 (ko) 2012-06-11 2012-07-06 아이콘텍이 가능한 3차원 원격회의 장치 및 이를 이용한 방법

Country Status (5)

Country Link
US (1) US9077974B2 (ko)
EP (1) EP2860969B1 (ko)
JP (1) JP5839427B2 (ko)
KR (1) KR101350996B1 (ko)
WO (1) WO2013187551A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100672A (zh) * 2014-05-09 2015-11-25 三星电子株式会社 显示装置及其视频通话执行方法
WO2017131672A1 (en) * 2016-01-27 2017-08-03 Hewlett Packard Enterprise Development Lp Generating pose frontalized images of objects

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014204362A1 (en) * 2013-06-19 2014-12-24 Telefonaktiebolaget L M Ericsson (Publ) Depth range adjustment of a 3d video to match the depth range permissible by a 3d display device
US9113036B2 (en) * 2013-07-17 2015-08-18 Ebay Inc. Methods, systems, and apparatus for providing video communications
WO2015034963A1 (en) * 2013-09-03 2015-03-12 Optimized Care Network, Llc System and method for providing healthcare services via telecommunication networks with enhanced interaction between healthcare providers and patients
CN106576153A (zh) * 2014-01-10 2017-04-19 旋转型机器人有限公司 用于在视频会议操作期间控制机器人支架的系统及方法
KR101643913B1 (ko) * 2014-09-25 2016-08-01 디노플러스 (주) 정보 이용자의 특성에 따른 정보 표시 위치 결정 시스템
JP6496172B2 (ja) * 2015-03-31 2019-04-03 大和ハウス工業株式会社 映像表示システム及び映像表示方法
US9894259B2 (en) * 2015-06-29 2018-02-13 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Movable image capture devices and methods for capture of images from behind a display screen
CN106488170B (zh) * 2015-08-28 2020-01-10 华为技术有限公司 视频通讯的方法和系统
KR20170028088A (ko) 2015-09-03 2017-03-13 주식회사 케이엠씨로보틱스 원격 화상 회의 및 모델하우스 시뮬레이션용 스마트 테이블 장치
CN105630175B (zh) * 2016-02-16 2018-12-21 广东小天才科技有限公司 一种虚拟现实设备及虚拟现实图像生成方法
WO2018005692A1 (en) * 2016-06-28 2018-01-04 Against Gravity Corp . Systems and methods for detecting collaborative virtual gestures
US20180077437A1 (en) * 2016-09-09 2018-03-15 Barrie Hansen Parallel Video Streaming
KR101892741B1 (ko) 2016-11-09 2018-10-05 한국전자통신연구원 희소 깊이 지도의 노이즈를 제거하는 장치 및 방법
CN110300950B (zh) 2017-02-06 2023-06-16 平蛙实验室股份公司 触摸感测系统中的光学耦合
CN111052058B (zh) 2017-09-01 2023-10-20 平蛙实验室股份公司 改进的光学部件
KR102034277B1 (ko) * 2017-12-06 2019-10-18 서울과학기술대학교 산학협력단 행사 실시간 스트리밍 방송 시스템
US11567610B2 (en) 2018-03-05 2023-01-31 Flatfrog Laboratories Ab Detection line broadening
CN108520264A (zh) * 2018-03-23 2018-09-11 上海数迹智能科技有限公司 一种基于深度图像的手部轮廓特征优化方法
GB201809960D0 (en) 2018-06-18 2018-08-01 Eyecon As Video conferencing system
CN112889016A (zh) 2018-10-20 2021-06-01 平蛙实验室股份公司 用于触摸敏感装置的框架及其工具
WO2020153890A1 (en) * 2019-01-25 2020-07-30 Flatfrog Laboratories Ab A videoconferencing terminal and method of operating the same
EP4066089B1 (en) 2019-11-25 2024-09-25 FlatFrog Laboratories AB A touch-sensing apparatus
WO2021158164A1 (en) 2020-02-08 2021-08-12 Flatfrog Laboratories Ab Touch apparatus with low latency interactions
CN115039063B (zh) 2020-02-10 2026-02-13 平蛙实验室股份公司 改进的触摸感测设备
WO2022185433A1 (ja) * 2021-03-03 2022-09-09 日本電信電話株式会社 端末装置、通信システム
KR102372107B1 (ko) * 2021-09-16 2022-03-10 주식회사 일루베이션 영상기반의 모돈 분만 알림 시스템

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970057779A (ko) 1995-12-14 1997-07-31 김광호 참가자간의 아이-콘텍(eye-contact)을 고려한 3차원 화상회의시스템
JP2001313917A (ja) * 2001-03-08 2001-11-09 Nec Corp ネットワーク会議画像処理装置
US6771303B2 (en) 2002-04-23 2004-08-03 Microsoft Corporation Video-teleconferencing system with eye-gaze correction
US6806898B1 (en) 2000-03-20 2004-10-19 Microsoft Corp. System and method for automatically adjusting gaze and head orientation for video conferencing
KR100691348B1 (ko) * 2005-12-21 2007-03-12 고정환 팬/틸트 제어기반의 스테레오 카메라를 이용한 이동표적추적방법 및 그 시스템
KR20100028725A (ko) 2008-09-05 2010-03-15 주식회사 케이티 시선일치 카메라 시스템 및 시선일치 방법
KR20110032429A (ko) * 2009-09-23 2011-03-30 삼성전자주식회사 휴대용 단말기에서 제스처를 인식하기 위한 장치 및 방법

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09154114A (ja) 1995-11-28 1997-06-10 Nec Corp 電子会議端末装置
US6545700B1 (en) * 1997-06-25 2003-04-08 David A. Monroe Virtual video teleconferencing system
JP2000165834A (ja) 1998-11-30 2000-06-16 Sanyo Electric Co Ltd 表示及び撮像装置
US7106358B2 (en) * 2002-12-30 2006-09-12 Motorola, Inc. Method, system and apparatus for telepresence communications
CN1914915A (zh) * 2004-04-23 2007-02-14 住友电气工业株式会社 活动图像数据的编码方法、解码方法及实施这些方法的终端装置、以及双向对话型系统
JP2008228170A (ja) 2007-03-15 2008-09-25 Seiko Epson Corp 画像表示装置及びテレビ電話装置
JP5147132B2 (ja) 2008-11-11 2013-02-20 日本放送協会 撮影カメラの位置算出装置
JP5319478B2 (ja) 2009-09-30 2013-10-16 株式会社昭特製作所 カメラ装置の位置算出方法
JP2011130234A (ja) 2009-12-18 2011-06-30 Canon Inc 放送用カメラシステム
JP4794678B1 (ja) 2010-05-24 2011-10-19 株式会社ソニー・コンピュータエンタテインメント 映像処理装置、映像処理方法、および映像通信システム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970057779A (ko) 1995-12-14 1997-07-31 김광호 참가자간의 아이-콘텍(eye-contact)을 고려한 3차원 화상회의시스템
US6806898B1 (en) 2000-03-20 2004-10-19 Microsoft Corp. System and method for automatically adjusting gaze and head orientation for video conferencing
JP2001313917A (ja) * 2001-03-08 2001-11-09 Nec Corp ネットワーク会議画像処理装置
US6771303B2 (en) 2002-04-23 2004-08-03 Microsoft Corporation Video-teleconferencing system with eye-gaze correction
KR100691348B1 (ko) * 2005-12-21 2007-03-12 고정환 팬/틸트 제어기반의 스테레오 카메라를 이용한 이동표적추적방법 및 그 시스템
KR20100028725A (ko) 2008-09-05 2010-03-15 주식회사 케이티 시선일치 카메라 시스템 및 시선일치 방법
KR20110032429A (ko) * 2009-09-23 2011-03-30 삼성전자주식회사 휴대용 단말기에서 제스처를 인식하기 위한 장치 및 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LEE, SANG BEOM ET AL., THE JOURNAL OF KOREA INFORMATION AND COMMUNICATIONS SOCIETY 12-04, vol. 37C, no. 4, 1 May 2012 (2012-05-01), pages 277 - 282, XP008171676 *
See also references of EP2860969A4

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100672A (zh) * 2014-05-09 2015-11-25 三星电子株式会社 显示装置及其视频通话执行方法
CN105100672B (zh) * 2014-05-09 2019-06-14 三星电子株式会社 显示装置及其视频通话执行方法
WO2017131672A1 (en) * 2016-01-27 2017-08-03 Hewlett Packard Enterprise Development Lp Generating pose frontalized images of objects

Also Published As

Publication number Publication date
EP2860969A1 (en) 2015-04-15
US9077974B2 (en) 2015-07-07
JP2014522622A (ja) 2014-09-04
US20140218467A1 (en) 2014-08-07
EP2860969A4 (en) 2015-07-22
KR20130138533A (ko) 2013-12-19
JP5839427B2 (ja) 2016-01-06
KR101350996B1 (ko) 2014-01-13
EP2860969B1 (en) 2018-09-12

Similar Documents

Publication Publication Date Title
KR101350996B1 (ko) 아이콘텍이 가능한 3차원 원격회의 장치 및 이를 이용한 방법
JP7697112B2 (ja) 通信端末装置
TW297985B (ko)
JP5208810B2 (ja) 情報処理装置、情報処理方法、情報処理プログラム、およびネットワーク会議システム
KR101665229B1 (ko) 증강된 가상 현실을 사용하는, 원격 참여자들 간의 개선된 통신의 제어
Zhang et al. Viewport: A distributed, immersive teleconferencing system with infrared dot pattern
EP4150880A1 (en) Method and system for virtual 3d communications
US9424678B1 (en) Method for teleconferencing using 3-D avatar
JP6229314B2 (ja) 情報処理装置、表示制御方法及びプログラム
KR20150053730A (ko) 시선 보정을 위한 화상 회의에서 영상 처리를 위한 방법 및 시스템
JP4144492B2 (ja) 画像表示装置
EP2661077A1 (en) System and method for eye alignment in video
JP2010250452A (ja) 任意視点画像合成装置
Jaklič et al. User interface for a better eye contact in videoconferencing
CN107533640A (zh) 视线校正
CN110413108A (zh) 虚拟画面的处理方法、装置、系统、电子设备及存储介质
TW201707444A (zh) 視線校正(一)
JP5478357B2 (ja) 表示装置および表示方法
JPWO2017141584A1 (ja) 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム
CN113112407B (zh) 基于电视的照镜视野生成方法、系统、设备及介质
KR101303203B1 (ko) 정면 영상 생성 영상통화 장치 및 방법
Zhu et al. 3D modeling and motion parallax for improved videoconferencing
TW201639347A (zh) 視線校正(二)
JP5485102B2 (ja) コミュニケーション装置、コミュニケーション方法、及びプログラム
WO2022180630A1 (en) Camera capture and communications system

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 13885998

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2014521546

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 2012861050

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12861050

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE