WO2013187551A1

WO2013187551A1 - 아이콘텍이 가능한 3차원 원격회의 장치 및 이를 이용한 방법

Info

Publication number: WO2013187551A1
Application number: PCT/KR2012/005371
Authority: WO
Inventors: 유범재; 이은경; 이지용; 조재희; 김신영
Original assignee: Center Of Human Centered Interaction for Coexistence
Current assignee: Center Of Human Centered Interaction for Coexistence
Priority date: 2012-06-11
Filing date: 2012-07-06
Publication date: 2013-12-19
Anticipated expiration: 2014-12-11
Also published as: EP2860969A1; US9077974B2; JP2014522622A; US20140218467A1; EP2860969A4; KR20130138533A; JP5839427B2; KR101350996B1; EP2860969B1

Description

【명세서】

아이콘텍이 가능한 3차원 원격회의 장치 및 이를 이용한 방법

【기술분야】

본 발명은 3차원 원격회의 시스템에 관한 것으로， 특히 원격지의 두 회의 참가자가 서로의 3차원 정면 얼굴을 보며 아이콘텍 (eye-contact)을 하고 서로 실시간으로 상호작용할 수 있는 원격회의 시스템 및 이를 이용한 방법에 관한 것이다. 본 출원은 2012년 6월 11일에 한국 특허청에 제출된 한국 특허 출원 제 10- 2012-0062200호의 출원일의 이익을 주장하며, 그 내용 전부는 본 명세서에 포함된다. 【배경기술】

최근 멀티미디어 통신 서비스가 대증화되어감에 따라 지역적으로 멀리 떨어진 상대방과 얼굴을 마주하며 대화를 주고 받을 수 있는 원격회의 시스템이 널리 사용되고 있다. 원격회의 시스템은 여러 사람이 함께 참여할수도 있고， 여러 지역을 동시에 연결할 수도 있으며， 네트워크를 통해 상대방의 음성이나 영상 등의 회의 정보를 실시간으로 전달한다.

일반적으로， 원격회의 시스템은 사용자를 촬영하기 위한 카메라가 화면의 상단이나 하단 또는 측면에 위치하고 사용자의 시선은 화면을 웅시하므로 촬영된 사용자의 영상은 그 시선의 방향이 정면을 보고 있지 않은 것이 일반적이다.

대화에 있어서 아이콘텍 (eye-contact)은 대화에 몰입하거나 상대방에게 신뢰감을 주는데 아주 중요한 요소이나， 상술한 바와 같이 일반적으로 사용되는 원격회의 시스템에서는 화면에 표시되는 사용자의 시선 방향이 정면이 아니므로 대화의 상대방과 아이콘텍이 불가능하다는 문제가 있다. 이와 같은 원격회의 시스템에서 아이콘텍이 불가능한 문제는 원격회의 시스템의 현실화에 치명적인 한계로 대두되었고， 실제로 많은 사용자들이 원격회의를 통한 대화에서 어색함을 느끼는 중요한 요소가 되어왔다.

미국등록특허 제 6771303호는 화상회의 시 모니터의 상단과 하단에 두 대의 카메라를 설치하여 화상회의 참가자의 깊이 정보를 계산하고, 참가자의 머리 위치를 파악하여 현재 참가자의 위치에 맞는 시선 영상을 생성함으로써 대화 참가자들이 서로 시선을 교환할 수 있는 기술을 소개하였고， 미국등록특허 계 6806898호는 모니터 상단에 설치된 카메라를 통해 현재 원격회의 참가자의 머리 위치 및 방향을 분석하여 현재 참가자의 눈의 위치가 정면을 바라보도록 눈동자를 합성하여 원격회의 상대방과의 시선 맞춤을 가능하게 하는 기술을 소개하였다.

또한， 한국공개특허 제 199그 0057779호는 3대의 카메라를 이용하여 각 회의 참가자들에게 디스플레이해줄 3차원 영상들을 생성하여 3차원 디스플레이하는 기술을 개시하고 있고, 한국공개특허 제 2010— 0028725호는 시선일치 카메라에서 수광부만 별도로 이동시킬 수 있도록 함으로써 상대방이 모니터의 정증앙에 디스플레이되지 않더라도 적웅적으로 시선일치를 이롤 수 있도록 하는 기술을 개시하고 있다.

그러나， 이와 같은 종래의 원격희의 시스템을 위한 아이콘텍 지원기술들은 아이콘텍 영상을 획득하기 위해 고정된 카메라 위치 또는 상대방의 화면상 위치만을 고려한 단순한 이동에 의한 단순한 영상 획득만을 개시하고 있을 뿐， 최적의 아이콘텍 영상 획득을 위해 고려되어야 하는 요소 및 이들을 고려하여 어떤 방식으로 카메라를 조작할 것인지에 대해 구체적인 기술을 제시하고 있지 못하다. 또한, 종래 기술들은 대부분 실시간 깊이 계산을 통해 깊이 정보를 생성하는 기술을 채택하고 있어서 깊이 정보의 정확성이 보장되지 않기 때문에 자연스러운 영상 생성이 어렵다는 문제점이 있다. 나아가, 종래 기술들은 단순히 서로 영상을 보면서 회의를 진행하는 방식에 한정되는 기술들로 보다 실감나는 원격회의를 위한 실시간상호작용에 관해서는 언급하고 있지 않다.

따라서， 실감나는 아이콘텍 영상을 생성하기 위해 고려되어야 하는 요소들을 제시하고 이들 요소들올 적절히 활용하여 카메라를 조작함으로써 최적의 아이콘텍 영상을 제공하고, 보다 실감나는 원격회의를 위한 실시간 상호작용이 가능하며， 깊이카메라를 통해 획득된 깊이정보를 이용하여 보다 정확하고 실감나는 영상 생성이 가능한새로운 3차원 화상회의 기술의 필요성이 절실하게 대두된다.

【발명의 상세한설명】

【기술적 과제】

본 발명의 목적은 화상회의 참가자가 일어서서 회의를 진행하거나 위치를 이동하는 경우에도 실감나는 아이콘텍 영상을 촬영하기 위해 고려되어야 하는 요소들을 정의하고, 이들 요소들을 적절히 활용하여 카메라를 조작함으로써 원격회의 참가자들이 실제로 같은 공간에 있는 듯한 느낌으로 자연스럽게 회의를 진행할수 있도록 하는 것이다. 또한， 본 발명의 목적은 3차원 원격회의시 실시간 상호작용을 통해 원격회의 참가자들에게 실제 동일 공간에서 회의하는 것과 같은 느낌을 주어 원격회의 시스템을 현실화하는 것이다.

또한， 본 발명의 목적은 3차원 깊이 정보를 실시간 계산함으로써 야기되는 정확도 문제를 해결하여 보다 실감나는 영상 생성이 가능한 3차원 화상회의 시스템올 제공하는 것이다.

또한, 본 발명의 목적은 테스트 패턴을 이용하여 사용자마다 달리 느끼는 3차원 깊이를 정규화하고， 정규화 결과를 반영하여 3차원 영상을 생성함으로써 보다 실감나는 화상회의 시스템을 제공하는 것이다.

【기술적 해결방법】

상기한 목적올 달성하기 위한 본 발명에 따른 아이콘텍이 가능한 3차원 원격회의 장치는， 피사체인 화상회의 참가자를 촬영한 촬영 영상 및 네트워크를 통하여 수신된 상기 화상회의의 상대방에 해당하는 영상을 고려하여 카메라들을 실시간 조작하여 깊이 영상들 및 컬러 영상들을 획득하는 영상 획득부; 상기 깊이 영상들 및 컬러 영상들을 이용하여 아이콘텍을 위한 상기 참가자의 정면 얼굴에 상응하는 최종 깊이 영상 및 최종 컬러 영상을 생성하는 정면얼굴 생성부; 및 상기 상대방에 상응하는 3차원 영상을 생성하여 디스플레이 장치에 표시하는 3D 영상 생성부를 포함한다.

이 때， 영상 획득부는 상기 카메라들 각각을 좌 /우로 회전시키는 팬 (pan) 조작， 상기 카메라들 각각을 상 /하로 회전시키는 틸트 (tilt) 조작， 및 상기 카메라들을 상 /하로 이동시키는 높이 (height) 조작올 통해 상기 카메라들올 실시간 조작할 수 있다.

이 때, 영상 획득부는 상기 촬영 영상에 기반하여 상기 카메라들의 팬 (pan) 조작을 수행하고， 상기 촬영 영상 및 상기 상대방에 해당하는 영상을 함께 이용하여 틸트 (tilt) 조작을 수행하고， 상기 상대방에 해당하는 영상에 기반하여 상기 카메라들의 높이 (height) 조작을 수행할수 있다.

이 때， 영상 획득부는 상기 촬영 영상에서 검출된 상기 참가자의 눈 위치에 기반하여 상기 카메라들의 팬 (pan) 조작을 수행하고， 상기 참가자의 눈 위치 및 상기 상대방에 해당하는 영상에서 검출된 상기 상대방의 눈 위치의 차이 (difference)에 기반하여 상기 틸트 (tilt) 조작올 수행하고， 상기 상대방의 눈 높이에 기반하여 상기 카메라들의 높이 (height) 조작을 수행할수 있다.

이 때, 아이콘텍이 가능한 3차원 원격회의 장치는 상기 촬영 영상을 이용하여 상기 참가자가 기설정된 동작올 수행하였는지 여부를 판단하는 제스처 인식부; 및 상기 기설정된 동작에 상응하는 기능올 수행하는 제스처 처리부를 더 포함할 수 있다.

이 때， 제스처 처리부는 상기 기설정된 동작이 상호작용 동작으로 판단되는 경우상호작용 피드백을 제공할 수 있다.

이 때， 상호작용 피드백은 상기 3차원 영상에 상기 상호작용 동작에 상응하는 상기 참가자의 신체 일부의 영상이 부가된 시각 피드백일 수 있다.

이 때， 상기 3D 영상 생성부는 상기 참가자에게 제공된 3D 테스트 영상에 대한 상기 참가자의 리액션에 기반하여 상기 참가자의 3D 인식 깊이를 측정하고， 상기 3D 인식 깊이를 고려하여 상기 3차원 영상을 생성할수 있다.

이 때， 상기 카메라들은 상기 디스플레이 장치에 일체형으로 구비될 수 있다. 이 때, 카메라들은 이동 및 회전 가능하게 상기 디스플레이 장치에 부착될 수 있다. 또한， 상기 카메라들은 상기 디스풀레이 장치의 외부에 독립적으로 이동 및 회전 가능하도록 구비될 수 있다.

이 때， 상기 전면얼굴 생성부는 상기 깊이 영상들을 대상으로 깊이 노이즈 제거 및 깊이 보정을 수행하고 상기 컬러 영상들을 대상으로 색상 보정을 수행하여 1장의 상기 최종 깊이 영상 및 1장의 상기 최종 컬러 영상을 생성할수 있다.

이 때， 상기 3D 영상 생성부는 상기 상대방에 상웅하는 상기 최종 깊이 영상 및 상기 최종 컬러 영상에 대하여 메쉬 홀채움을 수행하여 상기 상대방에 상응하는 3차원 메쉬형태의 영상을 복원하고， 상기 3차원 메쉬형태의 영상을 이용하여 상기 상대방에 상웅하는 3차원 영상을 생성할수 있다.

또한， 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 방법은, 피사체인 화상회의 참가자를 촬영한 촬영 영상 및 네트워크를 통하여 수신된 상기 화상회의의 상대방에 해당하는 영상올 고려하여 카메라들을 실시간 팬 (p_an), 틸트 (tilt) 및 높이 (height) 조작하여 깊이 영상들 및 컬러 ，상들을 획득하는 단계 ; 상기 깊이 영상들 및 컬러 영상들을 이용하여 아이콘텍을 위한 상기 참가자의 정면 얼굴에 상웅하는 최종 깊이 영상 및 최종 컬러 영상을 생성하는 단계; 및 상기 상대방에 상웅하는 3차원 영상을 생성하여 디스플레이 장치에 표시하는 단계를 포함한다.

이 때， 상기 깊이 영상들 및 컬러 영상들을 획득하는 단계는 상기 촬영 영상에서 검출된 상기 참가자의 눈 위치에 기반하여 상기 카메라들의 팬 (pan) 조작을 수행하고， 상기 참가자의 눈 위치 및 상기 상대방에 해당하는 영상에서 검출된 상기 상대방의 눈 위치의 차이 (difference)에 기반하여 상기 틸트 (tilt) 조작을 수행하고， 상기 상대방의 눈 높이에 기반하여 상기 카메라들의 높이 (height) 조작을수행할수 있다.

이 때， 상기 아이콘텍이 가능한 3차원 원격희의 방법은 상기 촬영 영상을 이용하여 상기 참가자가 기설정된 동작을 수행하였는지 여부를 관단하는 단계; 및 상기 기설정된 동작에 상웅하는 기능을 수행하는 단계를 더 포함할수 있다.

이 때， 상기 기설정된 동작에 상응하는 기능을 수행하는 단계는 상기 기설정된 동작이 상호작용 동작으로 판단되는 경우 상기 3차원 영상에 상기 상호작용 동작에 상웅하는 상기 참가자의 신체 일부의 영상이 부가된 시각 피드백을 제공할수 있다.

이 때, 상기 디스플레이 장치에 표시하는 단계는 상기 참가자에게 제공된 3D 테스트 영상에 대한 상기 참가자의 리액션에 기반하여 상기 참가자의 3D 인식 깊이를 측정하고， 상기 3D 인식 깊이를 고려하여 상기 3차원 영상을 생성할 수 있다. 【유리한 효과】

본 발명에 따르면， 화상회의 참가자가 일어서서 회의를 진행하거나 위치를 이동하는 경우에도 카메라가 적절히 참가자를 트랙킹 (tracking)함으로써 원격회의 참가자들이 실제로 같은 공간에 있는 듯한 느낌으로 자연스럽게 회의를 진행할 수 있는 3차원 이미지 생성이 가능하다.

또한, 본 발명은 3차원 원격회의시 악수나 하이파이브 등의 실시간 상호작용올 통해 원격회의 참가자들에게 실제 동일 공간에서 회의하는 것과 같은 느낌을주어 원격회의 시스템을 현실화할수 있다.

또한, 본 발명은 3차원 깊이 정보를 실시간 계산함으로써 야기되는 정확도 문제를 해결하여 보다실감나는 3차원 영상 생성이 가능하다.

또한， 본 발명은 테스트 패턴을 이용하여 사용자마다 달리 느끼는 3차원 깊이를 정규화하고， 정규화 결과를 반영하여 3차원 영상을 생성함으로써 보다 실감나는 원격 회의가 가능하다. 【도면의 간단한 설명】

도 1은 본 발명의 아이콘텍이 가능한 3차원 원격회의 장치가 적용된 시스템의 일 예를 나타낸 도면이다.

도 2는 본 발명의 아이콘텍이 가능한 3차원 원격회의 장치가 적용된 시스템의 다른 예를 나타낸 도면이다.

도 3은 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 장치를 나타낸 블록도이다.

도 4는 도 3에 도시된 영상 획득부의 일 예를 나타낸 블록도이다.

도 5는 도 3에 도시된 정면얼굴 생성부의 일 예를 나타낸 블록도이다.

도 6은 아이콘텍을 위한 정면얼굴 생성의 일 예를 나타낸 도면이다.

도 7은 도 3에 도시된 3D 영상 생성부의 일 예를 나타낸 블록도이다.

도 8은 본 발명이 적용된 3차원 원격회의 진행 상황올 나타낸 도면이다. 도 9는 본 발명에 따른 상호작용 동작에 대한 시각 피드백의 일 예를 나타낸 도면이다.

도 10은 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격희의 방법을 나타낸 동작흐름도이다.

【발명의 실시를 위한 형태】

본 발명을 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다. 여기서， 반복되는 설명, 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능, 및 구성에 대한 상세한 설명은 생략한다. 본 발명의 실시형태는 당 업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해서 제공되는 것이다. 따라서， 도면에서의 요소들의 형상 및 크기 등은보다 명확한 설명을 위해 과장될 수 있다. 이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다. 도 1은 본 발명의 아이콘텍이 가능한 3차원 원격회의 장치가 적용된 시스템의 일 예를 나타낸 도면이다.

도 1을 참조하면， 본 발명의 아이콘텍이 가능한 3차원 원격회의 장치는 3차원 영상을 디스플레이하는 디스플레이 장치 (110) 및 아이콘텍 영상을 생성하기 위한 카메라들 (121， 122)을포함한다. 즉， 도 1에 도시된 시스템은 화상회의의 상대방의 3차원 영상을 디스플레이 장치 (110)를 통하여 표시하고, 피사체인 화상회의 참가자를 카메라들 (121， 122)을 통하여 촬영한다. 이 때， 카메라들 (121， 122)은 실시간으로 아이콘텍을 위한 정면 입체 영상올 생성하기에 적합하도록 회전 및 이동할수 있다.

이 때， 카메라들 (121， 122) 각각은 컬러 영상을 획득하는 RGB 카메라와 깊이 영상올 만들어내는 IR카메라로 구성된 키넥트 카메라 (Kinect Camera)일 수 있다. 도 1에 도시된 바와 같이， 카메라들 (121， 122)은 디스플레이 장치 (110)와 독립적으로 구비되어 아이콘텍을 위한 정면 영상을 생성하기에 적합하도록 사용자를 트랙킹하기 위해 자유롭게 회전 및 이동할수 있다. 도 2는 본 발명의 아이콘텍이 가능한 3차원 원격회의 장치가 적용된 시스템의 다른 예를 나타낸 도면이다.

도 2를 참조하면， 카메라들 (221， 222)이 디스플레이 장치 (210)에 설치되어 있는 것을 알 수 있다.

도 2에 도시된 시스템은 화상회의의 상대방의 3차원 영상을 디스플레이 장치 (210)를 통하여 표시하고， 피사체인 화상회의 참가자를 카메라들 (221， 222)을 통하여 촬영한다. 이 때， 디스플레이 장치 (210)에 일체형으로 구비된 카메라들 (221_: 222)은 실시간으로 아이콘텍을 위한 정면 입체 영상을 생성하기에 적합하도록 회전 및 이동할수 있다.

이 때, 카메라들 (221， 222) 각각은 컬러 영상을 획득하는 RGB 카메라와 깊이 영상을 만들어내는 IR카메라로 구성된 키넥트 카메라 (Kinect Camera)일 수 있다. 도 2에 도시된 바와 같이， 카메라들 (221， 222)은 디스플레이 장치 (210)에 일체형으로 구비되어 아이콘텍을 위한 정면 영상을 생성하기에 적합하도록 사용자를 트랙킹하기 위해 자유롭게 회전 및 이동할수 있다. 도 3은 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 장치를 나타낸 블톡도이다.

도 3을 참조하면, 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격희의 장치는 영상 획득부 (₃₁₀), 정면얼굴 생성부 (320)， 3D 영상 생성부 (330)， 제스처 인식부 (340) 및 제스처 처리부 (350)를 포함한다. 영상 획득부 (310)는 피사체인 화상회의 참가자를 촬영한 촬영 영상 및 네트워크를 통하여 수신된 상기 화상회의의 상대방에 해당하는 영상을 고려하여 카메라들올 실시간조작하여 깊이 영상들 및 컬러 영상들 (2C+2D)을 획득한다.

이 때, 영상 획득부 (310)는 카메라들을 포함할 수도 있고, 카메라와 독립적인 장치로 구현될 수도 있다.

이 때， 카메라들은 두 개의 키넥트 카메라들일 수 있다. 이와 같이 깊이 영상을 만들어내는 IR 카메라를 포함하는 키넥트 카메라를 이용함으로써 깊이 정보를 실시간 계산하는 부담을 줄이고 보다 정확한 깊이 정보를 통해 보다 실감나는 3차원 영상 생성이 가능하다.

이 때, 카메라는 컬러 영상 획득을 위한 RGB카메라를 포함할 수 있다.

또한， 카메라는 색상 영상과 깊이 정보를 동시에 획득할 수 있는 모든 종류의 카메라일 수 있고， 카메라의 종류나 타입에 따라 본 발명의 권리범위가 제한되어서는 안된다.

회의 참가자가 회의를 일어서서 진행하거나， 회의 도중에 위치를 바꾸는 경우에도 아이콘텍을 위한 정면 영상을 생성하기 위해 카메라들이 최적의 위치로 이동할 필요가 있다.

영상 획득부 (₃₁₀)는 카메라들 각각을 좌 /우로 회전시키는 팬 (pan) 조작， 상기 카메라들 각각을 상 /하로 희전시키는 틸트 (tilt) 조작， 및 상기 카메라들을 상 /하로 이동시키는 높이 (height) 조작을 통해 상기 카메라들을 실시간 조작할 수 있다.

이 때， 영상 획득부 (310)는 화상회의 참가자를 촬영한 촬영 영상에 기반하여 카메라들의 팬 (pan) 조작을 수행하고， 화상회의 참가자를 촬영한 촬영 영상 및 상대방에 해당하는 영상을 함께 이용하여 틸트 (tilt) 조작을 수행하고， 상대방에 해당하는 영상에 기반하여 카메라들의 높이 (height) 조작올 수행할 수 있다.

보다 구체적으로， 영상 획득부 (310)는 화상회의 참가자를 촬영한 촬영 영상에서 상기 참가자의 눈 위치를 검출하고, 검출된 상기 참가자의 눈 위치에 기반하여 상기 카메라들의 팬 (pan) 조작을 수행할 수 있다. 이와 같이 참가자의 눈 위치에 기반하여 카메라들의 좌 /우 회전을 조작하여 수평적으로 참가자의 정면 영상 합성에 적합한 영상을 촬영할수 있다.

또한, 영상 획득부 (310)는 화상회의 참가자의 눈 위치 및 화상회의 상대방의 눈 위치의 차이 (difference)에 기반하여 틸트 조작을 수행할 수 있다. 이와 같이 참가자의 눈 위치 및 상대방의 눈 위치 사이의 차이에 기반하여 카메라들의 상 /하 회전을 조작하여 회의 참가자들이 서로 서로를 바라보는 상황을 반영하여 회의 참가자들 간의 신장 (키) 차이에 의해 아이콘텍이 어려운 상황에서도 수직적으로 참가자의 정면 영상 합성에 적합한 영상을 촬영할 수 있다.

또한， 영상 획득부 (310)는 상대방의 눈 높이에 기반하여 카메라들이 높이 (height) 조작을 수행할 수 있다. 이와 같이 상대방의 눈 높이에 기반하여 카메라들의 높이를 조작하여 실제 회의 참가자의 눈높이에 맞춘 영상을 촬영할 수 있다.

이와 같이, 영상 획득부 (310)는 원격 화상회의에서 현실감을 극대화하기 위해 회의 상대방과 아이콘텍이 가능한 현실감 있는 희의 진행을 위해 회의 참가자가 바라보는 시선을 고려하여 참가자의 현재 시선과 가장 유사한 위치에서 카메라가 영상을 획득할 수 있도록 카메라의 위치를 이동시키고 카메라의 상 /하 및 좌 /우 각도를 회전시킨다.

정면 얼굴 생성부 (320)는 상기 깊이 영상들 및 컬러 영상들을 이용하여 아이콘텍을 위한상기 참가자의 정면 얼굴에 상응하는 최종 깊이 영상 및 최종 컬러 영상 (1C+1D)을 생성하여 네트워크 (360)를 통하여 상기 화상회의의 상대방에게 전송한다.

3D 영상 생성부 (330)는 네트워크 (360)를 통하여 상기 화상회의의 상대방에 대응하는 최종 깊이 영상 및 최종 컬러 영상 (1C+1D)을 수신하고, 이를 이용하여 상대방에 상응하는 3차원 영상을 생성하여 디스플레이 장치에 표시한다.

이 때， 3D 영상 생성부 (330)는 상기 참가자에게 제공된 3D 테스트 영상에 대한 상기 참가자의 리액션에 기반하여 상기 참가자의 3D 인식 깊이를 측정하고， 상기 3D 인식 깊이를 고려하여 상기 3차원 영상을 생성할 수 있다. 즉， 사람마다 느끼는 3차원 영상이 깊이가 상이하므로 3D 영상 생성부 (330)는 사용자들에게 테스트 입체영상을 제공하여 해당 사용자가 느끼는 3차원 영상의 깊이를 측정하고 이를 반영하여 상기 3차원 영상을 생성함으로써 화상회의 시스템의 3차원 영상을 정규화할수 있다.

3D 영상 생성부 (330)는 화상회의 상대방에 상웅하는 상기 최종 깊이 영상 및 상기 최종 컬러 영상에 대하여 메쉬 홀채움을 수행하여 상기 상대방에 상웅하는 3차원 메쉬형태의 영상을 복원하고， 상기 3차원 메쉬형태의 영상을 이용하여 상기 상대방에 상응하는 3차원 영상을 생성할수 있다.

제스처 인식부 (340)는 상기 촬영 영상을 이용하여 상기 참가자가 기설정된 동작을 수행하였는지 여부를 판단한다.

제스처 처리부 (350)는 상기 기설정된 동작에 상응하는 기능을 수행한다. 이 때, 제스처 처리부 (350)는 기설정된 동작이 상호작용 동작으로 판단되는 경우， 상호작용 피드백을 제공할 수 있다. 이 때， 상호작용 피드백은 3차원 영상에 상기 상호작용 동작에 상웅하는 상기 참가자의 신체 일부의 영상이 부가된 시각 피드백일 수 있다.

예를 들어， 기설정된 동작은 악수나 하이파이브 등일 수 있다. 예를 들어， 상호작용 피드백은 상대방과 악수하는 자신의 손의 일부 또는 상대방과 하이파이브하는 자신의 손의 일부 영상이 상대방에 해당하는 3차원 영상에 부가된 시각 피드백일 수 있다.

이와 같이， 도 3에 도시된 아이콘텍이 가능한 3차원 원격회의 장치는 제스처 인식부 (340) 및 제스처 처리부 (350)를 통해 회의 참가자 들의 제스처 인식이 가능하여 화상회의시 실시간 정보 공유가 가능하고， 회의 참가자 간의 하이프이브나 악수와 같은 상호작용이 가능하여 원격회의의 몰입감을 극대화시킬 수 있다. 또한， 화상회의 도중에 제스처 인식을 통한 가상 객체의 축소 /확대 /이동 /회전 등의 실시간 조작이 가능하며, 화상회의 참가자들 간의 악수나 하이파이브와 같은 상호작용도 가능하다. 도 4는 도 3에 도시된 영상 획득부의 일 예를 나타낸 블록도이다.

도 4를 참조하면, 도 3에 도시된 영상 획득부 (310)는 눈 검출부 (410)， PTH 파라미터 결정부 (420)， 카메라 이동 /회전부 (430) 및 깊이 /컬러 영상 획득부 (440)를 포함한다.

눈 검출부 (410)는 아이콘텍 영상을 획득하기 위해 현재 회의 참가자의 눈 위치를 찾아내고 현재 참가자의 눈 높이와 회의 상대방의 눈 높이를 고려하여 카메라를 조작할수 있도록 한다.

PTH 파라미터 결정부 (420)는 눈 검출부 (410)를 통해 검출된 회의 참가자의 눈 위치와 회의 상대방의 눈 위치를 고려하여 팬 (pan), 틸트 (tilt) 및 높이 (height) 조작올 위한 파라미터를 결정한다.

카메라 이동 /회전부 (430)는 PTH 파라미터 결정부 (420)에 의하여 결정된 팬 (pan), 틸트 (tilt) 및 높이 (height) 조작을 위한 파라미터를 이용하여 카메라를 조작한다ᄋ 이와 같은 조작을 통하여 회의 참가자가 회의 중에 자유롭게 움직이는 경우에도 참가자의 위치를 적절히 트랙킹 (tracking)하면서 회의 참가자의 시선과 가장유사한 위치에서 영상올 획득할 수 있다.

깊이 /컬러 영상 획득부 (440)는 카메라 이동 /회전부 (430)에 의하여 회의 참가자들 간의 아이콘텍을 위한 최적의 포지션에서 카메라로부터 깊이 영상들 및 컬러 영상들 (2C+2D)을 생성한다. 도 5는 도 3에 도시된 정면얼굴 생성부의 일 예를 나타낸 블특도이다.

도 5를 참조하면， 도 3에 도시된 정면얼굴 생성부 (320)는 깊이정보 노이즈 필터링부 (510)， 깊이 보정부 (520)， 색상 보정부 (530) 및 깊이병합 및 홀채움부 (540)를 포함한다.

도 5에 도시된 정면얼굴 생성부는 화상회의 참가자들 사이의 아이콘텍을 유지하기 위해 두 대의 카메라에서 획득한 영상을 이용하여 3차원 정면 얼굴 영상을 생성하기 위한 알고리즘을 수행한다.

깊이정보 노이즈 필터링부 (510)는 획득한 깊이 영상에서 깊이 노이즈를 제거한다.

깊이 보정부 (520)는 깊이 카메라가 가지고 있는 깊이 에러를 보정한다.

색상 보정부 (530)는 서로 다른 위치에서 획득한 영상의 색상 차를 맞추기 위한 색상보정을 수행한다.

깊이병합 및 홀채움부 (540)는 깊이병합 및 홀채움을 수행하여 회의 참가자의 정면 영상을 생성하여 1장의 최종 깊이 영상 및 1장의 최종 컬러 영상으로 제공한다 (1D+1C). 각각 1장의 최종 깊이 영상 및 최종 컬러 영상은 각각의 회의 참가자들이 아이콘텍을 할 수 있도록 하기 위해 정면 얼굴을 생성한 결과 영상이다. 이와 같이 생성된 최종 깊이 영상 및 최종 컬러 영상은 미들웨어 단계에서 영상압축을 실행하여 실시간으로 상대방에게 전송될 수 있다， 도 6은 아이콘텍을 위한 정면얼굴 생성의 일 예를 나타낸 도면이다. 도 6을 참조하면， 카메라에 의해 촬영된 영상 (610)이 3D 영상 생성부에 의해 정면 얼굴 (정면 영상)을 생성하는 것을 알 수 있다. 3D 영상 생성부는 화상 회의 참가자의 움직임에 따라 자동으로 적절한 위치로 카메라를 이동시켜 영상을 촬영하고， 촬영된 영상을 이용하여 참가자의 위치에 상응하는 정면 영상을 생성한다. 도 7은 도 3에 도시된 3D 영상 생성부의 일 예를 나타낸 블록도이다.

도 7을 참조하면， 도 3에 도시된 3D 영상 생성부 (330)는 3D 메쉬 모델링부 (710), 메쉬 홀채움부 (720)， 깊이 보정 및 조절부 (730) 및 스테레오스코픽 3D 영상 생성부 (740)를 포함한다.

3D 메쉬 모델링부 (710)는 3차원 메쉬 모델링을 수행한다.

메쉬 홀채움부 (720)는 메쉬 홀채움을 수행한다.

깊이 보정 및 조절부 (730)는 화상회의 참가자에게 3D 테스트 영상을 제공하고 제공된 3D 테스트 영상에 대한 참가자의 리액션에 기반하여 참가자의 3D 인식 깊이를 측정하고， 측정된 3D 인식 깊이를 이용하여 깊이 보정을 수행한다.

스테레오스코픽 3D 영상 생성부 (740)는 최종적으로 디스플레이에 표시될 두 장의 색상영상으로 구성된 3차원 영상을 생성한다.

이 때， 디스플레이 장치는 대형 디스폴레이， 가정용 3DTV, 컴퓨터용 3D 모니터 또는 모바일 장치일 수 있다. 도 8은 본 발명이 적용된 3차원 원격회의 진행 상황을 나타낸 도면이다.

도 8을 참조하면, 화상회의에 참가하는 참가자들은 각각 디스플레이 화면올 통하여 3차원으로 제공되는 화상회의 상대방의 영상을 보면서 아이콘텍을 하고， 참가자의 영상은 참가자의 적절한 위치를 트랙킹하는 카메라에 의하여 촬영되고 촬영된 영상이 정면 얼굴 영상으로 합성되어 상대방에게 전달된다.

화상회의 도중에 화상회의 참가자는 상대방과 하이파이브나 악수 등의 상호작용을 할 수 있고， 기설정된 패턴의 동작을 수행함으로써 가상 객체를 상호 조작할수도 있다. 도 9는 본 발명에 따른 상호작용 동작에 대한 시각 피드백의 일 예를 나타낸 도면이다. 도 9를 참조하면， 화상회의 참가자 (913)는 화상회의 상대방 (914)과의 회의 도중에 기설정된 패턴의 동작을 수행함으로써 상호작용 동작 모드로 들어갈 수 있다. 도 9에 도시된 예에서 화상회의 참가자 (913)는 하이파이브를 위해 손바닥을 스크린 방향으로 하여 손을 들어을리는 동작으로 하이파이브를 위한 상호작용 동작 모드로 들어갈 수 있다. 아이콘텍이 가능한 3차원 원격회의 장치는 참가자 (913)의 동작을 감지하여 하이파이브를 위한상호작용 동작모드로 진입할 수 있다.

이 때, 디스플레이 장치에는 화상회의 상대방 (914)에 상웅하는 3차원 영상 (910)이 표시될 수 있고， 하이파이브를 위한 상호작용 동작에 해당하는 시각 피드백이 3차원 영상 (910)에 포함되어 표시될 수 있다. 이 때, 시각 피드백은 화상회의 참가자 (913)의 하이파이브를 위해 들어을린 손의 일부분 (911)을 나타내는 영상일 수 있다.

이 때， 화상회의 상대측에서도 하이파이브를 위한 상호작용 동작 모드에 해당하는 영상이 표시된다. 즉， 화상회의 상대방 (923)에게는 화상회의 참가자 (924)에 상웅하는 3차원 영상 (924)이 표시되고， 하이파이브를 위한 상호작용 동작에 대항하는 시각 피드백이 3차원 영상 (924)에 포함되어 표시될 수 있다. 이 때, 시각 피드백은 화상회의 상대방 (923)의 하이파이브를 위해 들어을린 손의 일부분 (921)을 나타내는 영상일 수 있다. 도 10은 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 방법을 나타낸 동작흐름도이다.

도 10을 참조하면， 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 방법은， 피사체인 화상회의 참가자를 촬영한 촬영 영상 및 네트워크를 통하여 수신된 상기 화상회의의 상대방에 해당하는 영상을 고려하여 카메라들을 실시간 팬 (pan), 틸트 (tilt) 및 높이 (height) 조작하여 깊이 영상들 및 컬러 영상들을 획득한다 (S1010).

이 때 ᅳ 단계 (S1010)는 상기 촬영 영상에서 검출된 상기 참가자의 눈 위치에 기반하여 상기 카메라들의 팬 (pan) 조작을 수행하고， 상기 참가자의 눈 위치 및 상기 상대방에 해당하는 영상에서 검출된 상기 상대방의 눈 위치의 차이 (difference)에 기반하여 상기 틸트 (tilt) 조작을 수행하고， 상기 상대방의 눈 높이에 기반하여 상기 카메라들의 높이 (height) 조작을 수행할수 있다. 또한, 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 방법은, 상기 깊이 영상들 및 컬러 영상들을 이용하여 아이콘텍을 위한 상기 참가자의 정면 얼굴에 상웅하는 최종 깊이 영상 및 최종 컬러 영상을 생성한다 (S1020).

또한， 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 방법은, 상기 상대방에 상응하는 3차원 영상을 생성하여 디스플레이 장치에 표시한다 (S1030).

이 때， 단계 (S1030)는 화상회의 참가자에게 제공된 3D 테스트 영상에 대한 참가자의 리액션 (reaction)에 기반하여 참가자의 3D 인식 깊이를 측정하고, 측정된 3D 인식 깊이를 고려하여 3차원 영상을 생성할수 있다.

도 10에는 도시되지 아니하였으나， 본 발명의 일실시예에 따른 아이콘텍이 가능한 3차원 원격회의 방법은 상기 촬영 영상을 이용하여 상기 참가자가 기설정된 동작을 수행하였는지 여부를 판단하는 단계; 및 상기 기설정된 동작에 상응하는 기능을 수행하는 단계를 더 포함할 수 있다.

이 때， 기설정된 동작에 상웅하는 기능을 수행하는 단계는 상기 기설정된 동작이 상호작용 동작으로 판단되는 경우 상기 3차원 영상에 상기 상호작용 동작에 상응하는 상기 참가자의 신체 일부의 영상이 부가된 시각 피드백을 제공할수 있다. 이상에서와 같이 본 발명에 따른 3차원 원격회의 장치 및 방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로조합되어 구성될 수도 있다.

Claims

【특허청구범위】

【청구항 1】

피사체인 화상회의 참가자를 촬영한 촬영 영상 및 네트워크를 통하여 수신된 상기 화상회의의 상대방에 해당하는 영상을 고려하여 카메라들을 실시간 조작하여 깊이 영상들 및 컬러 영상들을 획득하는 영상 획득부;

상기 깊이 영상들 및 컬러 영상들을 이용하여 아이콘텍을 위한 상기 참가자의 정면 얼굴에 상웅하는 최종 깊이 영상 및 최종 컬러 영상을 생성하는 정면얼굴 생성부; 및

상기 상대방에 상웅하는 3차원 영상을 생성하여 디스플레이 장치에 표시하는 3D 영상 생성부

를 포함하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.

【청구항 2]

청구항 1에 있어서，

상기 영상 획득부는

상기 카메라들 각각을 좌 /우로 회전시키는 팬 (pan) 조작， 상기 카메라들 각각올 상 /하로 회전시키는 틸트 (tilt) 조작， 및 상기 카메라들을 상 /하로 이동시키는 높이 (height) 조작을 통해 상기 카메라들을 실시간 조작하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.

【청구항 3】

청구항 2에 있어서,

상기 영상 획득부는

상기 촬영 영상에 기반하여 상기 카메라들의 팬 (pan) 조작을수행하고, 상기 촬영 영상 및 상기 상대방에 해당하는 영상을 함께 이용하여 틸트 (tilt) 조작을수행하고，

상기 상대방에 해당하는 영상에 기반하여 상기 카메라들의 높이 (height) 조작을 수행하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격희의 장치.

【청구항 4】

청구항 3에 있어서，

상기 영상 획득부는

상기 촬영 영상에서 검출된 상기 참가자의 눈 위치에 기반하여 상기 카메라들의 팬 (pan) 조작을 수행하고，

상기 참가자의 눈 위치 및 상기 상대방에 해당하는 영상에서 검출된 상기 상대방의 눈 위치의 차이 (difference)에 기반하여 상기 틸트 (tilt) 조작을 수행하고 상기 상대방의 눈 높이에 기반하여 상기 카메라들의 높이 (height) 조작을 수행하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.

I청구항 5]

청구항 4에 있어서，

상기 아이콘텍이 가능한 3차원 원격회의 장치는

상기 촬영 영상을 이용하여 상기 참가자가 기설정된 동작을 수행하였는지 여부를 판단하는 제스처 인식부； 및

상기 기설정된 동작에 상웅하는 기능을 수행하는 제스처 처리부

를 더 포함하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.

【청구항 6】

청구항 5에 있어서，

상기 제스처 처리부는

상기 기설정된 동작이 상호작용 동작으로 판단되는 경우

상호작용 피드백을 제공하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.

【청구항 7】

청구항 6에 있어서，

상기 상호작용 피드백은

상기 3차원 영상에 상기 상호작용 동작에 상웅하는 상기 참가자의 신체 일부의 영상이 부가된 시각 피드백인 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치 .

【청구항 8]

청구항 7에 있어서，

상기 3D 영상 생성부는

상기 참가자에게 제공된 3D 테스트 영상에 대한 상기 참가자의 리액션에 기반하여 상기 참가자의 3D 인식 깊이를 측정하고， 상기 3D 인식 깊이를 고려하여 상기 3차원 영상올 생성하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.

【청구항 9】

청구항 4에 있어서，

상기 카메라들은 상기 디스플레이 장치에 일체형으로 구비되는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.

【청구항 10】

청구항 4에 있어서，

상기 카메라들은 상기 디스플레이 장치의 외부에 독립적으로 구비되는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치 .

【청구항 11】

청구항 4에 있어서，

상기 정면얼굴 생성부는

상기 깊이 영상들을 대상으로 깊이 노이즈 제거 및 깊이 보정을 수행하고 상기 컬러 영상들을 대상으로 색상 보정을 수행하여 1장의 상기 최종 깊이 영상 및 1장의 상기 최종 컬러 영상을 생성하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치 .

【청구항 12】

청구항 4에 있어서，

상기 3D 영상 생성부는

상기 상대방에 상응하는 상기 최종 깊이 영상 및 상기 최종 컬러 영상에 대하여 메쉬 홀채움을 수행하여 상기 상대방에 상웅하는 3차원 메쉬형태의 영상을 복원하고, 상기 3차원 메쉬형태의 영상올 이용하여 상기 상대방에 상웅하는 3차원 영상을 생성하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 장치.

【청구항 13】

피사체인 화상회의 참가자를 촬영한 촬영 영상 및 네트워크를 통하여 수신된 상기 화상회의의 상대방에 해당하는 영상올 고려하여 카메라들을 실시간 팬 (pan), 틸트 (tilt) 및 높이 (height) 조작하여 깊이 영상들 및 컬러 영상들을 획득하는 단계;

상기 깊이 영상들 및 컬러 영상들을 이용하여 아이콘텍을 위한 상기 참가자의 정면 얼굴에 상응하는 최종 깊이 영상 및 최종 컬러 영상을 생성하는 단계; 및

상기 상대방에 상웅하는 3차원 영상을 생성하여 디스플레이 장치에 표시하는 단계

를 포함하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 방법.

【청구항 14]

청구항 13에 있어서，

상기 깊이 영상들 및 컬러 영상들을 획득하는 단계는

상기 촬영 영상에서 검출된 상기 참가자의 눈 위치에 기반하여 상기 카메라들의 팬 (pan) 조작올 수행하고，

상기 참가자의 눈 위치 및 상기 상대방에 해당하는 영상에서 검출된 상기 상대방의 눈 위치의 차이 (difference)에 기반하여 상기 틸트 (tilt) 조작을 수행하고. 상기 상대방의 눈 높이에 기반하여 상기 카메라들의 높이 (height) 조작을 수행하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 방법.

【청구항 15】

청구항 14에 있어서，

상기 아이콘텍이 가능한 3차원 원격회의 방법은

상기 촬영 영상을 이용하여 상기 참가자가 기설정된 동작을 수행하였는지 여부를 판단하는 단계 ; 및

상기 기설정된 동작에 상웅하는 기능을수행하는 단계

를 더 포함하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 방법. 【청구항 16]

청구항 15에 있어서,

상기 기설정된 동작에 상웅하는 기능을수행하는 단계는

상기 기설정돤 동작이 상호작용 동작으로 판단되는 경우 상기 3차원 영상에 상기 상호작용 동작에 상웅하는 상기 참가자의 신체 일부의 영상이 부가된 시각 피드백을 제공하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 방법. 【청구항 17】

청구항 16에 있어서，

상기 디스플레이 장치에 표시하는 단계는

상기 참가자에게 제공된 3D 테스트 영상에 대한 상기 참가자의 리액션에 기 반하여 상기 참가자의 3D 인식 깊이를 측정하고， 상기 3D 인식 깊이를 고려하여 상기 3차원 영상을 생성하는 것을 특징으로 하는 아이콘텍이 가능한 3차원 원격회의 방법 .