WO2017146454A1

WO2017146454A1 - 컨텐트를 인식하는 방법 및 장치

Info

Publication number: WO2017146454A1
Application number: PCT/KR2017/001933
Authority: WO
Inventors: 김상하; 장태권; 김성진; 김일구; 박성권; 박영오; 장원영
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2016-02-26
Filing date: 2017-02-22
Publication date: 2017-08-31
Anticipated expiration: 2018-08-26

Abstract

디바이스에서 제공되는 적어도 하나의 컨텐트를 제어하기 위한 제어 신호가 수신됨에 따라 디바이스의 화면을 캡쳐하고, 캡쳐된 화면이 템플릿 화면과 대응되는 경우, 캡쳐된 화면의 기 설정된 영역에서 컨텐트 정보를 포함한 문자열을 추출하며, 추출된 문자열과 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 컨텐트 정보와과 대응되는 텍스트를 검출하고, 검출된 텍스트를 기초로 디바이스의 화면에 표시된 컨텐트를 인식하는 디바이스가 개시된다.

Description

컨텐트를 인식하는 방법 및 장치

개시된 실시예는 디바이스가 컨텐트를 식별하는 방법, 서버가 컨텐트를 식별하는 방법, 컨텐트를 식별하는 디바이스 및 컨텐트를 식별하는 서버에 관한 것이다.

다양한 소비자의 니즈(needs)에 충족하기 위해 개개인의 요구에 맞춘(customized) 광고를 제공하기 위해서는 사용자가 어떤 컨텐트를 소비하고 있는지를 광고 제공자가 알 필요가 있다.

종래의 핑거프린트(fingerprint) 기반의 컨텐트 인식 기술은 TV와 같은 디스플레이 장치가 현재 재생 중인 컨텐트의 영상 또는 오디오에서 핑거프린트를 추출하고, 이것을 서버로 전송하여, 서버의 데이터베이스의 참조 데이터와 매칭하여 어떤 컨텐트인지 인식하였다. 이러한 결과를 바탕으로 해당 디스플레이 장치의 컨텐트 소비 또는 시청 패턴을 분석할 수 있고, 광고업자는 이 분석 결과에 기반하여 효과적으로 맞춤형 광고를 제공할 수 있다.

그러나, 이러한 핑거프린트 기반의 컨텐트 인식 기술은 디스플레이 장치가 디스플레이 하는 컨텐트에서 핑거프린트를 추출하고, 이를 서버에 전송하는 과정에서 추가적인 연산이나 데이터 전송 부담이 생길 뿐만 아니라, 별도의 데이터베이스 서버와 매칭 서버를 운영해야 하는 등 추가적인 하드웨어에 의한 경제적인 부담이 큰 단점이 있다. 따라서, 디스플레이 장치가 재생중인 컨텐트에 대한 정보를 빠르고 용이하게 검출할 수 있도록 하는 기술에 대한 필요성이 대두되었다.

개시된 실시예는 디바이스의 사용자가 시청하는 컨텐트의 정보를 캡쳐된 디바이스의 화면을 통해 획득함으로써, 보다 효율적으로 사용자가 시청하는 컨텐트의 정보를 획득할 수 있는 컨텐트를 제공하는 디바이스를 제어하는 방법, 그 디바이스 및 서버를 제공하고자 한다.

도 1은 일 실시예에 따라 컨텐트를 인식하는 시스템을 설명하기 위한 개념도이다.

도 2는 일 실시예에 따라 컨텐트를 제공하는 디바이스를 제어하는 방법을 설명하기 위한 흐름도이다.

도 3a 내지 도 3c는 컨텐트를 제공하는 컨텐트 서비스 별로 제공되는 템플릿 화면을 설명하기 위한 도면이다.

도 4는 다른 실시예에 따라, 컨텐트를 제공하는 디바이스가 캡쳐된 화면으로부터 컨텐트 정보를 추출하는 방법을 설명하기 위한 흐름도이다.

도 5는 다른 실시예에 따라, 디바이스가 캡쳐된 화면으로부터 컨텐트 정보를 추출하는 방법을 설명하기 위한 도면이다.

도 6은 일 실시예에 따른 디바이스가 기 설정된 의미 인식 모델을 이용하여 컨텐트를 인식하는 방법을 설명하기 위한 흐름도이다.

도 7은 일 실시예에 따른 디바이스가 컨텐트 서비스와 대응되는 템플릿 화면을 이용하여 컨텐트를 인식하는 방법을 설명하기 위한 흐름도이다.

도 8은 일 실시예에 따른 디바이스가 컨텐트를 인식하는 방법을 보다 구체적으로 설명하기 위한 흐름도이다.

도 9a 내지 도 9d는 일 실시예에 따라 디바이스가 의미 인식 모델을 이용하여 컨텐트를 인식하는 방법을 설명하기 위한 도면이다.

도 10a 및 도 10b는 일 실시예에 따라 컨텐트를 인식하는 디바이스의 블록도이다.

도 11은 일 실시예에 따른 의미 인식 서버가 디바이스에 제공되는 컨텐트를 인식하는 방법을 설명하기 위한 흐름도이다.

도 12는 일 실시예에 따라 디바이스에 제공되는 컨텐트를 인식하는 의미 인식 서버를 설명하기 위한 블록도이다.

도 13은 일 실시예에 따라 디바이스에 표시된 컨텐트를 인식하는 시스템을 설명하기 위한 개념도이다.

도 14는 일 실시예에 따라 의미 인식 서버의 프로세서에 포함된 의미 인식부의 동작을 보다 상세하게 설명하기 위한 블록도이다.

도 15는 일 실시예에 따라 의미 인식 서버의 의미 인식부에 포함된 컨텐트 데이터 관리 모듈의 동작을 보다 상세하게 설명하기 위한 블록도이다.

도 16은 일 실시예에 따라 의미 인식 서버에서 텍스트 형태의 컨텐트 데이터를 기초로 의미 인식 모델에 기초가 되는 텍스트를 가공하는 방법을 설명하기 위한 도면이다.

일 실시예에 따른 디바이스가 컨텐트를 인식하는 방법은, 디바이스에서 제공되는 적어도 하나의 컨텐트를 제어하기 위한 제어 신호가 수신됨에 따라 디바이스의 화면을 캡쳐하는 단계; 캡쳐된 화면이 템플릿 화면과 대응되는 경우, 캡쳐된 화면의 기 설정된 영역에서 컨텐트 정보를 포함하는 문자열을 추출하는 단계; 추출된 문자열과 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 컨텐트 정보와 대응되는 텍스트를 검출하는 단계; 및 검출된 텍스트를 기초로 디바이스의 화면에 표시된 컨텐트를 인식하는 단계를 포함한다.

일 실시예에 따른 서버가 컨텐트를 인식하는 방법은, 디바이스에서 캡쳐된 화면이 템플릿 화면과 대응됨에 따라, 캡쳐된 화면에서 추출된 컨텐트 정보를 포함하는 문자열을 디바이스로부터 수신하는 단계; 수신된 문자열과 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 컨텐트 정보와 대응되는 텍스트를 검출하는 단계; 및 검출된 텍스트를 기초로 디바이스의 화면에 표시된 컨텐트를 인식하는 단계를 포함한다.

일 실시예에 따른 서버가 컨텐트를 인식하는 방법은, 디바이스의 컨텐트를 시청하는 사용자의 음성 데이터를 수신하는 단계를 더 포함하고, 컨텐트를 인식하는 단계는, 검출된 텍스트 및 수신된 사용자의 음성 데이터를 기초로 상기 디바이스의 화면에 표시된 컨텐트를 인식한다.

일 실시예에 따른 서버가 컨텐트를 인식하는 방법은, 외부의 서버로부터 기 설정된 주기로 컨텐트 데이터를 획득하는 단계를 더 포함하고, 의미 인식 모델은, 기 설정된 주기로 획득된 컨텐트 데이터에 기초하여 업데이트 된다.

인식일 실시예에 따른 서버가 컨텐트를 인식하는 방법은, 적어도 하나의 컨텐트를 시청하는 사용자의 정보, 디바이스의 정보, 적어도 하나의 인식하고자 하는 컨텐트의 시청 시간, 적어도 하나의 컨텐트를 제공하는 컨텐트 서비스의 인식 정보 및 컨텐트 정보를 포함한 문자열에서 각각의 문자의 크기 정보 중 적어도 하나를 포함하는 부가 정보를 획득한다.

일 실시예에 따른 서버가 컨텐트를 인식하는 방법에 있어서, 텍스트를 검출하는 단계는, 추출된 컨텐트 정보와 적어도 하나의 텍스트를 비교하여, 적어도 하나의 텍스트 각각이 추출된 컨텐트 정보에 대응될 확률값을 산출하는 단계; 및 산출된 확률값을 기초로 적어도 하나의 텍스트 중 어느 하나를 검출하는 단계를 포함한다.

일 실시예에 따른 서버가 컨텐트를 인식하는 방법에 있어서, 검출된 텍스트가 존재하지 않는 경우, 디바이스로부터 상기 템플릿 화면과 대응되는 다른 캡쳐 화면에서 추출된 상기 컨텐트 정보를 포함한 문자열을 수신하는 단계를 더 포함한다.

일 실시예에 따른 서버가 컨텐트를 인식하는 방법에 있어서, 컨텐트를 인식하는 단계는, 추출된 컨텐트 정보에서 검출된 텍스트와 대응되지 않는 정보를 검출된 텍스트를 기초로 변경하는 단계를 포함한다.

일 실시예에 따른 서버가 컨텐트를 인식하는 방법은, 컨텐트 인식 결과를 시청 패턴 분석 서버에 전송하는 단계를 더 포함한다.

일 실시예에 따른 서버가 컨텐트를 인식하는 방법은, 컨텐트 인식 결과를 기초로 시청 패턴 분석 서버에서 생성된 디바이스의 사용자의 시청 패턴 히스토리 정보를 시청 패턴 분석 서버로부터 수신하는 단계를 더 포함한다.

일 실시예에 따른 컨텐트를 인식하는 디바이스는, 적어도 하나의 컨텐트를 수신하는 통신부; 적어도 하나의 컨텐트 중 어느 하나를 디스플레이 하는 디스플레이부; 및 적어도 하나의 컨텐트를 제어하기 위한 제어 신호가 수신됨에 따라 디바이스의 화면을 캡쳐하고, 캡쳐된 화면이 템플릿 화면과 대응되는 경우, 캡쳐된 화면의 기 설정된 영역에서 컨텐트 정보를 포함하는 문자열을 추출하며, 추출된 문자열과 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 컨텐트 정보와 대응되는 텍스트를 검출하고, 검출된 텍스트를 기초로 디바이스의 화면에 표시된 컨텐트를 인식하는 프로세서를 포함한다.

일 실시예에 따른 컨텐트를 인식하는 서버는, 디바이스에서 캡쳐된 화면이 템플릿 화면과 대응됨에 따라, 캡쳐된 화면에서 추출된 컨텐트 정보를 포함하는 문자열을 상기 디바이스로부터 수신하는 통신부; 및 수신된 컨텐트 정보와 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 컨텐트 정보와 대응되는 텍스트를 검출하고, 검출된 텍스트를 기초로 상기 디바이스의 화면에 표시된 컨텐트를 인식하는 프로세서를 포함한다.

일 실시예에 따른 컨텐트를 인식하는 서버에 있어서, 통신부는, 디바이스의 컨텐트를 시청하는 사용자의 음성 데이터를 수신하고, 프로세서는, 검출된 텍스트 및 수신된 사용자의 음성 데이터를 기초로 디바이스의 화면에 표시된 컨텐트를 인식한다.

일 실시예에 따른 컨텐트를 인식하는 서버에 있어서, 통신부는, 외부의 서버로부터 기 설정된 주기로 컨텐트 데이터를 획득하고, 의미 인식 모델은, 기 설정된 주기로 획득된 컨텐트 데이터에 기초하여 업데이트 되는 컨텐트를 인식한다.

인식일 실시예에 따른 컨텐트를 인식하는 서버에 있어서, 통신부는, 적어도 하나의 컨텐트를 시청하는 사용자의 정보, 디바이스의 정보, 적어도 하나의 인식하고자 하는 컨텐트의 시청 시간,적어도 하나의 컨텐트를 제공하는 컨텐트 서비스의 인식 정보 및 컨텐트 정보를 포함한 문자열에서 각각의 문자의 크기 정보 중 적어도 하나를 포함하는 부가 정보를 획득한다.

일 실시예에 따른 컨텐트를 인식하는 서버에 있어서, 프로세서는, 추출된 컨텐트 정보와 적어도 하나의 텍스트를 비교하여, 적어도 하나의 텍스트 각각이 상기 추출된 컨텐트 정보에 대응될 확률값을 산출하는 단계; 및 산출된 확률값을 기초로 적어도 하나의 텍스트 중 어느 하나를 검출한다.

일 실시예에 따른 컨텐트를 인식하는 서버에 있어서, 프로세서는, 검출된 텍스트가 존재하지 않는 경우, 디바이스로부터 템플릿 화면과 대응되는 다른 캡쳐 화면에서 추출된 상기 컨텐트 정보를 포함한 문자열을 수신하는 단계를 더 포함한다.

일 실시예에 따른 컨텐트를 인식하는 서버에 있어서, 프로세서는, 추출된 컨텐트 정보에서 상기 검출된 텍스트와 대응되지 않는 정보를 검출된 텍스트를 기초로 변경한다.

일 실시예에 따른 컨텐트를 인식하는 서버에 있어서, 통신부는, 컨텐트 인식 결과를 시청 패턴 분석 서버에 전송한다.

일 실시예에 따른 컨텐트를 인식하는 서버에 있어서, 통신부는, 컨텐트 인식 결과를 기초로 상기 시청 패턴 분석 서버에서 생성된 디바이스의 사용자의 시청 패턴 히스토리 정보를 시청 패턴 분석 서버로부터 수신하는 컨텐트를 인식한다.

본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.

본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.

명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기재된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다.

아래에서는 첨부한 도면을 참고하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.

도 1에 도시된 바와 같이, 디바이스(100)는 TV일 수 있으나, 이는 일 실시예에 불과하며, 디스플레이를 포함하는 전자 장치로 구현될 수 있다. 예를 들어, 디바이스(100)는 휴대폰, 태블릿 PC, 디지털 카메라, 캠코더, 노트북 컴퓨터(laptop computer), 태블릿 PC, 데스크탑, 전자책 단말기, 디지털 방송용 단말기, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 네비게이션, MP3 플레이어, 착용형 기기(wearable device) 등과 같은 다양한 전자 장치로 구현될 수 있다. 특히, 실시예들은 TV와 같이 디스플레이가 대형인 디스플레이 장치에서 용이하게 구현될 수 있으나, 이에 한정되는 것은 아니다. 또한, 디바이스(100)는 고정형 또는 이동형일 수 있으며, 디지털 방송 수신이 가능한 디지털 방송 수신기일 수 있다.

일 실시예에 따른 디바이스(100)는 셋탑 박스(10)를 통해 컨텐트 서비스를 제공받을 수 있다. 예를 들어, 컨텐트 서비스는 지상파 방송 신호, 케이블 방송 셋톱박스, IPTV 셋톱박스 등이 제공하는 실시간 방송 컨텐트 서비스 뿐만 아니라, 넷플릭스, 유투브와 같은 웹 어플리케이션 형태의 컨텐트 서비스 등을 포함할 수 있으나 이는 일 실시예일 뿐 컨텐트 서비스가 이에 한정되는 것은 아니다.

일 실시예에 따른 디바이스(100)는 서비스 제공 장치(10)로부터 적어도 하나의 컨텐트를 수신할 수 있다. 디바이스(100)는 수신한 적어도 하나의 컨텐트 중에서 디바이스(100)의 사용자가 선택한 컨텐트를 디바이스(100)의 화면에 표시할 수 있다. 예를 들어, 디바이스(100)의 사용자는 디바이스(100)에서 제공되는 적어도 하나의 컨텐트를 제어하는 제어 신호를 디바이스(100)에 전송할 수 있다. 여기에서, 제어 신호는 리모컨 신호, 스마트 폰 및 웨어러블 디바이스의 터치 신호, 음성 명령, 제스처 인식 신호, 복합 센서 신호 등을 포함할 수 있으나, 이는 일 실시예일 뿐, 본 발명의 제어 신호가 이에 한정되는 것은 아니다.

일 실시예에 따른 디바이스(100)는 제어 신호가 수신됨에 따라, 컨텐트가 표시되는 디바이스(100)의 화면을 캡쳐할 수 있다. 예를 들어, 디바이스(100)는 제어 신호가 수신됨에 따라 기 설정된 시간 단위로 컨텐트가 표시되는 디바이스(100)의 화면을 캡쳐할 수 있다.

또한, 디바이스(100)는 기 저장된 템플릿 화면과 캡쳐된 화면이 서로 대응되는지 여부를 판단할 수 있다. 여기에서, 템플릿 화면에는 화면 상에서 컨텐트에 관한 정보가 표시되는 텍스트 영역에 관한 정보가 미리 설정될 수 있다. 또한, 템플릿 화면은 디바이스(100)에 컨텐트를 전송하는 컨텐트 서비스의 종류에 따라 상이할 수 있다. 예를 들어. 컨텐트 서비스 A에 대한 템플릿 화면과 컨텐트 서비스 B에 대한 템플릿 화면이 서로 상이할 수 있다.

한편, 디바이스(100)는 컨텐트 서비스의 종류를 확인하고, 기 확인된 컨텐트 서비스의 템플릿을 선택한다. 선택된 템플릿 화면과 대응되는 화면이 캡쳐되는 시점까지 컨텐트가 표시되는 화면을 캡쳐하는 동작을 반복적으로 수행할 수 있다. 디바이스(100)는 템플릿 화면과 대응되는 화면이 캡쳐되는 경우, 디바이스(100)의 화면을 캡쳐하는 동작을 중단할 수 있다.

디바이스(100)는 템플릿 화면과 대응되는 캡쳐된 화면 상에서, 기 설정된영역으로부터 컨텐트 정보를 포함한 문자열을 추출할 수 있다. 기 설정된 영역은 컨텐트의 제목명 또는 채널명 등의 컨텐트 정보를 포함하고 있는 영역이다. 여기에서, 컨텐트 정보는 텍스트 형태로 표시될 수 있다. 디바이스(100)는 기 설정된 영역에 표시된 텍스트를 인식하여, 컨텐트 정보를 포함한 문자열을 추출할 수 있다. 예를 들어, 디바이스(100)는 OCR(Optical Character Reader)을 이용하여, 캡쳐된 화면의 기 설정된 영역 상에서 텍스트를 판독하여, 컨텐트의 종류, 제목 및 장르에 관한 정보를 추출할 수 있다.

또한, 디바이스(100)는 추출된 문자열을 의미 인식 서버(200)에 전송할 수 있다. 일 실시예에 따른 의미 인식 서버(200)는 디바이스(100)로부터 수신된 문자열을 기초로 디바이스(100)의 사용자가 시청하는 컨텐트를 인식할 수 있다.

한편, 다른 실시예에 따라 디바이스(100)는 컨텐트 정보를 포함한 문자열과 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 컨텐트 정보와 대응되는 텍스트를 검출할 수 있다. 또한, 디바이스(100)는 검출된 텍스트를 기초로 디바이스(100)의 화면에 표시된 컨텐트를 인식할 수 있다. 디바이스(100)는 기 설정된 의미 인식 모델을 이용함으로써, 컨텐트 인식의 정확도를 보다 높일 수 있다.

일 실시예에 따른 의미 인식 서버(200)는 기 설정된 의미 인식 모델과 수신된 문자열을 비교하여, 컨텐트를 인식할 수 있다. 예를 들어, 의미 인식 서버(200)는 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트 중에서, 수신된 문자열에 포함된 컨텐트 정보와 대응되는 텍스트를 선택할 수 있다. 의미 인식 서버(200)는 선택된 텍스트를 이용하여 컨텐트를 인식할 수 있다. 여기에서 선택된 텍스트는, 예를 들어, 컨텐트의 제목 및 컨텐트가 제공되는 채널의 종류 중 적어도 하나를 나타내는 텍스트일 수 있다.

일 실시예에 따른 의미 인식 서버(200)는 컨텐트 인식 결과를 시청 패턴 분석 서버(300)에 전송할 수 있다. 시청 패턴 분석 서버(300)는 기 설정된 기간 동안 의미 인식 서버(200)로부터 컨텐트 인식 결과를 획득하여, 획득된 컨텐트 인식 결과를 분석함으로써, 사용자의 시청 패턴을 결정할 수 있다.

도 2는 일 실시예에 따라 컨텐트를 제공하는 디바이스(100, 이하 디바이스)를 제어하는 방법을 설명하기 위한 흐름도이다.

단계 S210에서, 디바이스(100)는 디바이스(100)에서 제공되는 적어도 하나의 컨텐트를 제어하기 위한 제어 신호를 수신한다.

일 실시예에 따른 디바이스(100)는 입력 장치로부터 디바이스(100)에서 제공하는 적어도 하나의 컨텐트를 제어하기 위한 제어 신호를 수신할 수 있다. 예를 들어, 디바이스(100)는 리모컨으로부터 디바이스(100)에서 제공되는 적어도 하나의 컨텐트를 제어하기 위한 제어 신호를 수신할 수 있다. 여기에서, 제어 신호는 디바이스(100)의 채널 변경 신호, 디바이스(100)의 전원 온(on) 신호, 다른 디바이스와 디바이스(100) 간의 연결 신호, 디바이스(100)의 메뉴 선택 신호 및 적어도 하나의 컨텐트 정보에 대한 요청 신호 중 하나일 수 있다.

단계 S220에서, 디바이스(100)는 제어 신호가 수신됨에 따라, 기 설정된 주기로 디바이스(100)의 화면을 캡쳐한다.

일 실시예에 따른 디바이스(100)는 제어 신호가 수신되는 경우, 컨텐트가 표시되는 디바이스(100)의 화면을 캡쳐할 수 있다. 여기에서, 디바이스(100)의 화면에는 디바이스(100)에서 제공되는 적어도 하나의 컨텐트의 제목명 도는 채널명, 컨텐트 리스트, 컨텐트 관련 부가 정보 및 컨텐트를 선택하기 위한 유저 인터페이스인식 중 적어도 하나가 표시될 수 있으나, 이는 일 실시예일 뿐, 디바이스(100)의 화면에 표시되는 정보가 이에 한정되는 것은 아니다.

또한, 일 실시예에 다른 디바이스(100)는 기 설정된 주기에 따라 반복적으로 디바이스(100)의 화면을 캡쳐할 수 있다. 예를 들어, 디바이스(100)는 제어 신호가 수신된 시점으로부터 2초 간격으로 디바이스(100)의 화면을 캡쳐할 수 있다.

단계 S230에서, 디바이스(100)는 캡쳐된 화면이 템플릿 화면과 대응되는 경우, 캡쳐된 화면의 기 설정된 영역에서 컨텐트 정보를 포함한 문자열을 추출한다. 여기에서, 템플릿 화면은 디바이스(100)에 적어도 하나의 컨텐트를 제공하는 컨텐트 서비스의 종류에 따라 상이할 수 있다. 또한, 템플릿 화면에는 특정 컨텐트 서비스에서 제공하는 컨텐트 정보가 표시되는 영역에 관한 정보가 미리 설정될 수 있다. 예를 들어, A 컨텐트 서비스에 대한 템플릿 화면의 경우, 화면의 좌측 상단에 컨텐트 정보가 표시되는 영역이라는 정보가 미리 설정될 수 있다.

일 실시예에 따른 디바이스(100)는 템플릿 화면과 대응되는 화면이 캡쳐되는 경우, 화면을 캡쳐하는 동작을 중단할 수 있다. 템플릿 화면과 대응되는 화면은 템플릿 화면에 표시되는 이미지 및 텍스트 중 적어도 하나의 위치와 대응되는 위치에 이미지 및 텍스트 중 적어도 하나가 표시되는 화면일 수 있다. 예를 들어, 디바이스(100)는 템플릿 화면에서 미리 설정된 영역과 대응되는 위치에 텍스트가 표시된 화면이 캡쳐되는 경우, 화면을 캡쳐하는 동작을 중단할 수 있다.

일 실시예에 따른 디바이스(100)는 템플릿 화면과 대응되는 캡쳐된 화면의 기 설정된 영역에 표시된 컨텐트 정보를 포함한 문자열을 추출할 수 있다.

단계 S240에서, 디바이스(100)는 추출된 문자열에 포함된 컨텐트 정보를 기초로 디바이스(100)의 화면에 표시된 컨텐트를 인식한다.

예를 들어, 디바이스(100)는 OCR을 이용하여, 추출된 문자열에 표시된 텍스트를 판독할 수 있다. 여기에서, 컨텐트 정보는 컨텐트의 제목, 종류 및 장르에 관한 정보 등을 포함할 수 있다. 다만, 이는 일 실시예일 뿐 컨텐트 정보가 이에 한정되는 것은 아니다.

도 3a를 참고하면, 컨텐트를 제공하는 디바이스(100, 이하 디바이스)는 입력 장치로부터 제어 신호가 수신됨에 따라, 템플릿 화면(320)에 대응되는 화면(310)이 캡쳐되는 시점까지 기 설정된 주기에 따라 화면을 캡쳐할 수 있다. 여기에서, 디바이스(100)는 컨텐트를 제공하는 A 컨텐트 서비스에 대해 미리 저장된 템플릿 화면(320)을 선택할 수 있다. 실시간 방송에서는, 채널 전환 시 방송 채널에 대한 정보가 화면 하단에 바운딩 박스(bounding box) 내에 요약되어 표시되는 경우가 많다. 이 경우에는 바운딩 박스가 A 컨텐트 서비스의 템플릿이 될 수 있다. 따라서, 디바이스(100)는 주기적으로 캡쳐된 화면을 바운딩 박스 형태의 템플릿에 매칭한 결과, 캡쳐된 화면과 템플릿이 일치하면 기 설정된 컨텐트 정보 표시 영역(322)으로부터 텍스트를(312)를 추출하여 컨텐트 정보를 포함한 문자열을 추출할 수 있다.

한편, 도 3b를 참고하면, 디바이스(100)는 입력 장치로부터 제어 신호가 수신됨에 따라, 템플릿 화면(340)에 대응되는 화면(330)이 캡쳐되는 시점까지 기 설정된 주기에 따라 화면을 캡쳐할 수 있다. 여기에서, 디바이스(100)는 컨텐트를 제공하는 B 컨텐트 서비스에 대해 미리 저장된 템플릿 화면(330)을 선택할 수 있다. 넷플릭스와 같이 스마트 TV 또는 스마트폰 내의 웹 어플리케이션 형태의 컨텐트 서비스의 경우, 재생되는 컨텐트의 종류에 상관 없이, 동일한 UI 레이아웃을 갖는 화면을 가질 수 있는데, 이 화면에서 특징적인 부분을 반영하여 템플릿으로 만들 수 있다. 일 실시예로 컨텐트가 재생되기 직전 화면의 UI 레이아웃으로부터 템플릿을 만들 수 있다. 이 템플릿을 주기적으로 캡쳐된 화면과 매칭하여, 일치하면 기 설정된 컨텐트 정보 표시 영역(342)으로부터 텍스트를 인식하여, 컨텐트 정보를 포함하는 문자열을 추출할 수 있다.

일 실시예에 따른 디바이스(100)는 캡쳐된 화면(330)이 컨텐트 서비스 종류에 맞는 템플릿과 일치하게 되면 컨텐트 정보 표시 영역(342)과 대응되는 좌측 상단 영역으로부터 텍스트(332)를 추출할 수 있다. 또한, 디바이스(100)는 추출된 텍스트(432)를 판독하여 디바이스(100)에 표시되는 컨텐트를 인식할 수 있다.

한편, 도 3c를 참고하면, 디바이스(100)는 제어 신호가 수신됨에 따라, 템플릿 화면(360)에 대응되는 화면(350)이 캡쳐되는 시점까지 기 설정된 주기에 따라 화면을 캡쳐할 수 있다. 여기에서, 디바이스(100)는 컨텐트를 제공하는 C 컨텐트 서비스에 대해 미리 저장된 템플릿 화면(350)을 선택할 수 있다. 일 실시예에 따르면 디바이스(100는 컨텐트가 재생되기 이전의 특정 시점에서의 UI 레이아웃 화면으로부터 템플릿을 만들 수 있다. 이렇게 만들어진 템플릿 화면(360)은 디바이스(100)에 저장될 수 있으며, 이 템플릿 화면(360)을 제어 신호가 수신됨에 따라 주기적으로 캡쳐된 화면(350)과 매칭하고, 일치하면 기 설정된 컨텐트 정보 표시 영역(362)로부터, 텍스트를 추출하여 컨텐트를 인식할 수 있다.

도 4는 다른 실시예에 따라, 컨텐트를 제공하는 디바이스(100, 이하 디바이스)가 캡쳐된 화면으로부터 컨텐트 정보를 추출하는 방법을 설명하기 위한 흐름도이다.

단계 S410에서, 디바이스(100)는 디바이스(100)에서 제공되는 적어도 하나의 컨텐트를 제어하기 위한 제어 신호를 수신할 수 있다.

단계 S420에서, 디바이스(100)는 수신된 제어 신호가 디바이스(100)의 화면을 포인팅하는 제어 신호인 경우, 포인팅된 지점의 주변 영역을 검출할 수 있다.

일 실시예에 따른 디바이스(100)는 수신된 제어 신호가 디바이스(100)의 화면을 포인팅하는 제어 신호인지 여부를 판단할 수 있다. 디바이스(100)는 수신된 제어 신호가 디바이스(100)의 화면을 포인팅하는 제어 신호인 것으로 판단됨에 따라, 포인팅된 지점으로부터 기 설정된 범위 내에 위치하는 주변 영역을 검출할 수 있다. 단계 S430에서, 디바이스(100)는 검출된 영역에서 컨텐트 정보를 포함한문자열을 추출할수 있다.

단계 S440에서, 디바이스(100)는 추출된 문자열을 기초로 디바이스(100)의 화면에 표시된 컨텐트를 인식할 수 있다.

일 실시예에 따른 디바이스(100)는 OCR 등의 텍스트 판독 기술을 이용하여, 추출된 문자열에 표시된 텍스트를 판독할 수 있다. 다만, 이는 일 실시예일 뿐, 디바이스(100)에서 추출된 문자열을 기초로 컨텐트를 인식하는 방법이 전술한 예에 한정되는 것은 아니다.

도 5는 다른 실시예에 따라, 디바이스(100)가 캡쳐된 화면으로부터 컨텐트 정보를 추출하는 방법을 설명하기 위한 도면이다.

도 5를 참고하면, 일 실시예에 따른 디바이스(100)는 디바이스(100)에서시 제공되는 적어도 하나의 컨텐트를 제어하는 제어 신호(512)를 수신할 수 있다. 또한, 디바이스(100)는 수신된 제어 신호(512)가 디바이스(100)의 화면을 포인팅하는 제어 신호(512)인 경우, 포인팅된 지점의 주변 영역(522)을 검출할 수 있다.

일 실시예에 따른 디바이스(100)는 수신된 제어 신호(512)가 디바이스(100)의 화면을 포인팅하는 제어 신호인지 여부를 판단할 수 있다. 디바이스(100)는 수신된 제어 신호(512)가 디바이스(100)의 화면을 포인팅하는 제어 신호인 것으로 판단됨에 따라, 포인팅된 지점으로부터 기 설정된 범위 내에 위치하는 주변 영역(522)을 검출할 수 있다.

일 실시예에 따른 디바이스(100)는 검출된 주변 영역(522)에서 추출된 컨텐트 정보를 판독하여, 컨텍트에 관한 정보를 나타내는 텍스트를 인식할 수 있다. 예를 들어, 디바이스(100)는 컨텐트에 관한 정보를 나타내는 텍스트를 인식하여, 컨텐트의 제목이 쿵푸 OO 2라는 것을 확인할 수 있다.

도 6은 일 실시예에 따른 디바이스(100)가 기 설정된 의미 인식 모델을 이용하여 컨텐트를 인식하는 방법을 설명하기 위한 흐름도이다.

단계 S610에서, 디바이스(100)는 디바이스(100)에서 제공되는 적어도 하나의 컨텐트를 제어하기 위한 제어 신호가 수신됨에 따라 디바이스(100)의 화면을 캡쳐한다.

일 실시예에 따른 디바이스(100)는 적어도 하나의 컨텐트를 제어하기 위한 제어 신호를 수신할 수 있다. 또한, 디바이스(100)는 수신한 제어 신호를 기초로, 디바이스(100)에 적어도 하나의 컨텐트를 제공하는 컨텐트 서비스의 종류를 결정할 수 있다. 여기에서 컨텐트 서비스의 종류는, 웹 기반 VOD(Video On Demand) 서비스, 라이브(Live) 서비스 및 애플리케이션 기반 서비스 중 어느 하나일 수 있으나, 이는 일 실시예일 뿐, 본 발명에서 적어도 하나의 컨텐트를 제공하는 컨텐트 서비스의 종류가 이에 한정되는 것은 아니다. 따라서, 컨텐트 서비스의 종류의 따라 템플릿 화면이 선택되고, 템플릿 화면과 캡쳐된 화면의 매칭이 수행될 수 있다.

한편, 일 실시예에 따른 디바이스(100)는 제어 신호가 수신됨에 따라, 디바이스(100)의 화면을 기 설정된 주기로 캡쳐할 수 있다. 디바이스(100)는 캡쳐된 화면이 템플릿 화면과 대응되는지 여부를 판단할 수 있다. 여기에서, 템플릿 화면은 컨텐트 서비스의 종류에 따라 상이할 수 있다.

단계 S620에서, 디바이스(100)는 캡쳐된 화면이 템플릿 화면과 대응되는 경우, 캡쳐된 화면의 기 설정된 영역에서 컨텐트 정보를 포함한 문자열을 추출한다.

일 실시예에 따른 따른 디바이스(100)는 템플릿 화면에서 컨텐트 정보가 표시되는 것으로 설정된 영역과 대응되는 캡쳐된 화면의 영역으로부터 컨텐트 정보를 포함한 문자열을 추출할 수 있다. 여기에서, 컨텐트 정보는 예를 들어, 컨텐트의 제목 및 컨텐트가 제공되는 채널의 이름 또는 번호 등의 텍스트를 포함할 수 있다.

단계 S630에서, 디바이스(100)는 추출된 문자열과 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 컨텐트 정보와 대응되는 텍스트를 검출한다.

일 실시예에 따른 디바이스(100)는 의미 인식 모델을 기 설정할 수 있다. 의미 인식 모델은 컨텐트를 인식하기 위한 적어도 하나의 텍스트를 포함할 수 있다. 예를 들어, 의미 인식 모델에는 현재 제공되고 있는 컨텐트의 제목 및 컨텐트가 제공되고 있는 채널 이름 또는 번호 등을 나타내는 적어도 하나의 텍스트가 포함될 수 있다.

또한, 다른 예에 따라, 의미 인식 모델은 디바이스의 ID 및 사용자의 ID에 따라 상이하게 설정될 수 있다. 예를 들어, 사용자가 20대 여성인 경우, 디바이스(100)는 복수의 의미 인식 모델 중 20대 여성이 선호하는 컨텐트의 제목 및 채널의 종류 등을 나타내는 적어도 하나의 텍스트를 포함한 의미 인식 모델을 선택할 수 있다.

일 실시예에 따른 디바이스(100)는 추출된 문자열로부터 템플릿 화면에 대해 기 설정된 포맷 패턴을 이용하여, 문자열에 포함된 텍스트를 검출할 수 있다. 여기에서, 기 설정된 포맷 패턴은 의미 인식 모델에 포함될 수 있다. 예를 들어,포맷 패턴이 채널명 및 제목명 순서로 설정된 경우, 디바이스(100)는 추출된 문자열로부터 채널명 및 제목명에 대응되는 텍스트를 검출할 수 있다. 한편, 다른 예에 따라, 디바이스(100)는 추출된 문자열에 포함된 적어도 하나의 텍스트가 템플릿에 대해 기 설정된 포맷 패턴과 대응되지 않을 수 있다. 이러한 경우, 디바이스(100)는 문자열 내에서 주변 단어들의 관계를 확률적으로 산출한 확률 모델을 이용하여 문자열로부터 텍스트를 검출할 수 있다. 예를 들어, 디바이스(100)는 A 주연의 B 독점 방송이라는 문자열로부터 확률 모델을 기초로 배우의 이름이 A이고, 방송명이 B인 것으로 텍스트를 추출할 수 있다.

단계 S640에서, 디바이스(100)는 검출된 텍스트를 기초로 디바이스(100)의 화면에 표시된 컨텐트를 인식한다.

일 실시예에 따른 디바이스(100)는 검출된 텍스트를 디바이스(100)의 화면에 표시된 컨텐트의 제목으로 결정할 수 있다.

또한, 일 실시예에 따른 디바이스(100)는 기 설정된 의미 인식에 포함된 적어도 하나의 텍스트 중 검출된 텍스트와 유사도가 가장 높은 텍스트를 비교하여, 검출된 텍스트의 정확도를 검증할 수 있다. 여기에서, 유사도는 텍스트 간의의 자음 및 모음의 종류 및 결합 관계 등과 일치 비율에 따라 결정될 수 있다. 예를 들어, 컨텐트 정보에 포함된 텍스트가 훙푸인 경우, 디바이스(100)는 의미 인식 모델에 포함된 적어도 하나의 텍스트 중 유사도가 가장 높은 쿵푸를 검출할 수 있다. 디바이스(100)는 캡쳐된 화면으로부터 추출된 컨텐트 정보와 의미 인식 모델을 비교하여 의미 인식 모델로부터 텍스트를 검출함으로써, 수신한 컨텐트 정보에 포함된 오기 등을 정정할 수 있다.

또한, 다른 실시예에 따라, 디바이스(100)는 수신한 부가 정보를 기초로 검출된 텍스트를 검증할 수 있다. 예를 들어, 컨텐트의 제목으로 쿵푸가 검출된 경우, 디바이스(100)는 부가 정보에 포함된 시청 시간에 관한 정보를 기초로, 시청 시간에 쿵푸가 방영되는 시간인지 여부를 판단하여, 검출된 텍스트를 검증할 수 있다.

또 다른 실시예에 따라, 디바이스(100)는 감지된 음성 데이터를 기초로 검출된 텍스트를 검증할 수 있다. 예를 들어, 컨텐트의 제목으로 쿵푸가 검출된 반면에, 디바이스(100)에 감지된 음성 데이터가 쿵푸를 나타내고 있는지 여부를 판단하여 검출된 텍스트를 검증할 수 있다.

일 실시예에 따른 디바이스(100)는 검출된 텍스트를 검증한 결과, 검출된 텍스트가 컨텐트를 인식하기에 적절한 정보가 아니라고 판단되는 경우, 전술한 단계 S1120을 반복적으로 수행할 수 있다. 또한, 다른 예에 따라, 디바이스(100)는 디바이스(100)의 화면을 다시 캡쳐하는 것을 요청할 수 있다.

도 7은 일 실시예에 따른 디바이스(100)가 컨텐트 서비스와 대응되는 템플릿 화면을 이용하여 컨텐트를 인식하는 방법을 설명하기 위한 흐름도이다.

단계 S710에서, 디바이스(100)는 디바이스(100)에서 제공되는 적어도 하나의 컨텐트를 제어하기 위한 제어 신호를 수신할 수 있다.

단계 S720에서, 디바이스(100)는 수신된 제어 신호를 기초로 디바이스(100)에 적어도 하나의 컨텐트를 제공하는 컨텐트 서비스의 종류를 결정할 수 있다.

일 실시예에 따른 디바이스(100)는 수신한 제어 신호를 기초로, 디바이스(100)에 적어도 하나의 컨텐트를 제공하는 컨텐트 서비스의 종류를 결정할 수 있다. 여기에서 컨텐트 서비스의 종류는, 웹 기반 VOD(Video On Demand) 서비스, 라이브(Live) 서비스 및 애플리케이션 기반 서비스 중 어느 하나일 수 있으나, 이는 일 실시예일 뿐, 본 발명에서 적어도 하나의 컨텐트를 제공하는 컨텐트 서비스의 종류가 이에 한정되는 것은 아니다.

단계 S730에서, 디바이스(100)는 컨텐트가 표시되는 디바이스(100)의 화면을 캡쳐할 수 있다.

일 실시예에 따른 디바이스(100)는 제어 신호가 수신됨에 따라 컨텐트가 표시되는 디바이스(100)의 화면을 캡쳐할 수 있다.

단계 S740에서, 디바이스(100)는 결정된 컨텐트 서비스의 종류에 따라 템플릿 화면을 선택할 수 있다.

여기에서, 템플릿 화면은 디바이스(100)에 적어도 하나의 컨텐트를 제공하는 컨텐트 서비스의 종류에 따라 상이할 수 있다. 예를 들어, 컨텐트 서비스의 종류에 따라, 템플릿 화면 상에 컨텐트 정보가 표시되는 영역, 컨텐트 정보를 구성하는 텍스트의 크기, 색상, 모양 등이 상이할 수 있다.

한편, 단계 S730 및 단계 S740은 설명의 편의를 위해 병렬적인 프로세스로 기재하였으나, 각 단계는 서로 시간적인 선후관계를 가지며 수행될 수도 있다.

단계 S750에서, 디바이스(100)는 캡쳐된 화면이 템플릿 화면에 대응되는지 여부를 판단할 수 있다.

디바이스(100)는 캡쳐된 화면이 템플릿 화면에 대응되지 않는 경우, 전술한 단계 S710을 수행하여 전술한 S710 내지 S740의 단계를 반복적으로 수행할 수 있다.

단계 S760에서, 디바이스(100)는 캡쳐된 화면의 기 설정된 영역으로부터 컨텐트 정보를 포함하는 문자열 데이터를 추출할 수 있다.

일 실시예에 따른 디바이스(100)는 캡쳐된 화면이 템플릿 화면에 대응되는 경우, 캡쳐된 화면의 기 설정된 영역으로부터 컨텐트 정보를 포함하는 문자열 데이터를 추출할 수 있다.

단계 S770에서, 디바이스(100)는 추출된 문자열 데이터 정보와 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 추출된 컨텐트 정보와 대응되는 텍스트를 검출할 수 있다.

한편, 단계 S770은 도 6을 참조하여 전술한 단계 S630과 대응될 수 있다.

단계 S780에서, 디바이스(100)는 검출된 텍스트를 기초로 디바이스(100)의 화면에 표시된 컨텐트를 인식할 수 있다.

한편, 단계 S780은 도 6을 참조하여 전술한 단계 S640과 대응될 수 있다.

도 8은 일 실시예에 따른 디바이스(100)가 컨텐트를 인식하는 방법을 보다 구체적으로 설명하기 위한 흐름도이다.

단계 S810에서, 디바이스(100)는 디바이스(100)에서 제공되는 적어도 하나의 컨텐트를 제어하기 위한 제어 신호를 수신할 수 있다.

한편, 단계 S810은 도 2를 참고하여 전술한 단계 S210과 대응될 수 있다.

단계 S820에서, 디바이스(100)는 제어 신호가 수신됨에 따라 기 설정된 주기로 컨텐트가 표시되는 디바이스(100)의 화면을 캡쳐할 수 있다.

단계 S830에서, 디바이스(100)는 캡쳐된 화면이 템플릿 화면과 대응되는 지 여부를 판단할 수 있다.

일 실시예에 따른 디바이스(100)는 캡쳐된 화면이 템플릿 화면과 대응되지 않는 경우, 단계 S810의 디바이스(100)의 화면을 캡쳐하는 동작을 반복적으로 수행할 수 있다.

단계 S840에서, 디바이스(100)는 캡쳐된 화면의 기 설정된 영역에서 컨텐트 정보를 포함한 문자열을 추출할 수 있다.

일 실시예에 따른 디바이스(100)는 캡쳐된 화면이 템플릿 화면과 대응되는 경우, 캡쳐된 화면의 기 설정된 영역에서 컨텐트 정보를 포함한 문자열을 추출할 수 있다. 예를 들어, 디바이스(100)는 캡쳐된 화면에서, 템플릿 화면에 미리 설정된 컨텐트 정보 표시 영역과 대응되는 영역에서 텍스트를 추출할 수 있다.

단계 S850에서, 디바이스(100)는 의미 인식 모델에 포함된 적어도 하나의 텍스트 중 컨텐트 정보와 대응되는 텍스트가 존재하는지 여부를 판단할 수 있다. 한편, 일 실시예에 따른 디바이스(100)는 컨텐트 정보와 대응되는 텍스트가 검출되지 않은 경우, 단계 S720의 디바이스(100)의 화면을 캡쳐하는 동작을 반복적으로 수행할 수 있다.

단계 S860에서, 디바이스(100)는 의미 인식 모델에 포함된 적어도 하나의 텍스트 중 컨텐트 정보와 대응되는 텍스트를 검출할 수 있다.

단계 S860은 도 6을 참조하여 전술한 단계 S630과 대응될 수 있다.

단계 S870에서, 디바이스(100)는 검출된 텍스트를 기초로 디바이스(100)의 화면에 표시된 컨텐트를 인식할 수 있다.

단계 S870은 도 6을 참조하여 전술한 단계 S640과 대응될 수 있다.

도 9a 내지 도 9d는 일 실시예에 따라 디바이스(100)가 의미 인식 모델을 이용하여 컨텐트를 인식하는 방법을 설명하기 위한 도면이다.

도 9a를 참고하면, 일 실시예에 따른 디바이스(100)는 디바이스(100)에서 재생되는 컨텐트를 제어하기 위한 제어 신호를 수신할 수 있다. 디바이스(100)는 수신된 제어 신호를 기초로, 컨텐트를 식별하는데 이용되는 템플릿 화면을 제 1 템플릿 화면으로 결정할 수 있다.

한편, 일 실시예에 따른 디바이스(100)는 결정된 제 1 템플릿 화면에 대응되는 화면(910a)을 캡쳐할 수 있다. 디바이스(100)는 제 1 템플릿 화면을 이용하여, 캡쳐된 화면(910a)으로부터, 컨텐트 정보를 포함한 이미지(912a)를 검출할 수 있다.

일 실시예에 따른 디바이스(100)는 검출된 이미지(912a)를 판독하여, 컨텐트에 관한 정보를 나타내는 텍스트(914a)를 인식할 수 있다. 또한, 디바이스(100)는 기 설정된 의미인식 모델을 이용하여, 컨텐트를 식별하는데 필요한 정보를 인식된 텍스트(914a)로부터 결정할 수 있다. 예를 들어, 디바이스(100)는 인식된 텍스트(914a) 상에 포함된 컨텐트의 제목을 나타내는 텍스트를 선택할 수 있다. 또한, 디바이스(100)는 인식된 텍스트(914a)와 기 설정된 의미 인식 모델을 비교하여, 오기로 판단되는 '훙푸'를 '쿵푸'로 정정할 수 있다. 디바이스(100)는 오기가 정정된 텍스트(916a)를 기초로 채널의 종류 및 컨텐트의 제목을 결정할 수 있다.

도 9b를 참고하면, 일 실시예에 따른 디바이스(100)는 제어 신호를 기초로 결정된 제 2 템플릿 화면에 대응되는 화면(910b)을 캡쳐할 수 있다. 디바이스(100)는 제 2 템플릿 화면을 이용하여, 캡쳐된 화면(910b)으로부터, 컨텐트 정보를 포함한 이미지(912b)를 검출할 수 있다.

일 실시예에 따른 디바이스(100)는 검출된 이미지(912b)를 판독하여, 컨텐트에 관한 정보를 나타내는 텍스트(914b)를 인식할 수 있다. 또한, 디바이스(100)는 기 설정된 의미인식 모델을 이용하여, 컨텐트를 식별하는데 필요한 정보를 인식된 텍스트(914b)로부터 결정할 수 있다. 예를 들어, 디바이스(100)는 인식된 텍스트(914b) 상에 포함된 컨텐트의 제목을 나타내는 텍스트를 선택할 수 있다. 또한, 디바이스(100)는 인식된 텍스트(914b)와 기 설정된 의미 인식 모델을 비교하여, 오기로 판단되는 '지고' 및 '기'를 '지코' 및 'ZI'로 정정할 수 있다. 디바이스(100)는 오기가 정정된 텍스트(916b)를 기초로 컨텐트의 제목을 결정할 수 있다.

도 9c를 참고하면, 일 실시예에 따른 디바이스(100)는 제어 신호를 기초로 결정된 제 3 템플릿 화면에 대응되는 화면(910c)을 캡쳐할 수 있다. 디바이스(100)는 제 3 템플릿 화면을 이용하여, 캡쳐된 화면(910c)으로부터, 컨텐트 정보를 포함한 이미지(912c)를 검출할 수 있다.

일 실시예에 따른 디바이스(100)는 검출된 이미지(912c)를 판독하여, 컨텐트에 관한 정보를 나타내는 텍스트(914c)를 인식할 수 있다. 또한, 디바이스(100)는 기 설정된 의미인식 모델을 이용하여, 컨텐트를 식별하는데 필요한 정보를 인식된 텍스트(914c)로부터 결정할 수 있다. 예를 들어, 디바이스(100)는 인식된 텍스트(914c) 상에 포함된 컨텐트의 제목을 나타내는 텍스트인 '기술조F들'을 선택할 수 있다. 또한, 디바이스(100)는 인식된 텍스트(914c)와 기 설정된 의미 인식 모델을 비교하여, 오기로 판단되는 '조F'를 '자'로 정정할 수 있다.

디바이스(100)는 오기가 정정된 텍스트(916c)를 기초로 컨텐트의 제목을 결정할 수 있다.

도 9d를 참고하면, 일 실시예에 따른 디바이스(100)는 제어 신호를 기초로 결정된 제 4 템플릿 화면에 대응되는 화면(910d)을 캡쳐할 수 있다. 디바이스(100)는 제 4 템플릿 화면을 이용하여, 캡쳐된 화면(910d)으로부터, 컨텐트 정보를 포함한 이미지(912d)를 검출할 수 있다.

일 실시예에 따른 디바이스(100)는 검출된 이미지(912d)를 판독하여, 컨텐트에 관한 정보를 나타내는 텍스트(914d)를 인식할 수 있다. 또한, 디바이스(100)는 기 설정된 의미인식 모델을 이용하여, 컨텐트를 식별하는데 필요한 정보를 인식된 텍스트(914d)로부터 결정할 수 있다. 예를 들어, 디바이스(100)는 인식된 텍스트(914d) 상에 포함된 컨텐트의 제목 및 채널 정보를 나타내는 텍스트인 '041', 'K E35joy' 및 '개그콘서트'를 선택할 수 있다. 또한, 디바이스(100)는 인식된 텍스트(914d)와 기 설정된 의미 인식 모델을 비교하여, 오기로 판단되는 'K E35'를 'KBS'로 정정할 수 있다.

디바이스(100)는 오기가 정정된 텍스트(916d)를 기초로 채널의 종류 및 컨텐트의 제목을 결정할 수 있다.

일 실시예에 따른 디바이스(100)는 도 9a 내지 도 9d를 참고하여 전술한 바와 같이 기 설정된 의미 인식 모델을 이용함으로써, 보다 정확하게 컨텐트를 인식할 수 있다.

도 10a 및 도 10b는 일 실시예에 따라 컨텐트를 인식하는 디바이스(100)의 블록도이다.

도 10a를 참조하면, 일 실시예에 따른 디바이스(100)는 통신부(110), 제어부(130) 및 디스플레이부(120)를 포함할 수 있다. 그러나 도시된 구성요소 모두가 필수구성요소인 것은 아니다. 도시된 구성요소보다 많은 구성요소에 의해 디바이스(100)가 구현될 수도 있고, 그보다 적은 구성요소에 의해서도 디바이스(100)는 구현될 수 있다.

예를 들어, 도 10b에 도시된 바와 같이, 일 실시예에 따른 디바이스(100)는, 통신부(110), 디스플레이부(120) 및 제어부(130) 이외에, 오디오 처리부(115), 오디오 출력부(125), 감지부(140), 튜너부(150), 전원부(160), 입/출력부(170), 비디오 처리부(180) 및 저장부(190)를 더 포함할 수도 있다.

이하 상기 구성요소들에 대해 차례로 살펴본다.

통신부(110)는 제어부(130)의 제어에 의해 디바이스(100)를 외부 장치(예를 들어, 입력 장치, 서비스 제공 장치 및 서버 등)와 연결할 수 있다. 예를 들어, 제어부(130)는 통신부(110)를 통해 연결된 서비스 제공 장치로 컨텐트를 송/수신, 서비스 제공 장치에서부터 어플리케이션(application)을 다운로드 하거나 또는 웹 브라우징을 할 수 있다. 통신부(110)는 디바이스(100)의 성능 및 구조에 대응하여 무선 랜(111), 블루투스(112), 및 유선 이더넷(Ethernet, 113) 중 하나를 포함할 수 있다. 또한, 통신부(110)는 무선랜(111), 블루투스(112), 및 유선 이더넷(Ethernet, 113)의 조합을 포함할 수 있다. 통신부(110)는 제어부(130)의 제어에 의해 입력 장치의 제어 신호를 수신할 수 있다. 제어 신호는 블루투스 타입, RF 신호 타입 또는 와이파이 타입으로 구현될 수 있다.

통신부(110)는 블루투스 외에 다른 근거리 통신(예를 들어, NFC(near field communication, 도시되지 아니함), BLE(bluetooth low energy, 도시되지 아니함)를 더 포함할 수 있다.

일 실시예에 따른 통신부(110)는 디바이스(100)에서 제공되는 적어도 하나의 컨텐트를 제어하기 위한 제어 신호를 수신한다. 이러한 경우, 통신부(110)는 후술할 감지부(140)의 기능과 대응되는 기능을 수행할 수 있다.

통신부(110)는 추출된 컨텐트 정보를 서버에 전송할 수 있다. 또한, 통신부(110)는 서버(200)로부터 추출된 컨텐트 정보를 기초로 결정된 디바이스(100)의 사용자의 컨텐트 시청 패턴 정보를 수신할 수 있다.

디스플레이부(120)는, 제어부(140)에서 처리된 영상 신호, 데이터 신호, OSD 신호, 제어 신호 등을 변환하여 구동 신호를 생성한다. 디스플레이부(120)는 PDP, LCD, OLED, 플렉시블 디스플레이(flexible display)등으로 구현될 수 있으며, 또한, 3차원 디스플레이(3D display)로 구현될 수 있다. 또한, 디스플레이부(120)는, 터치 스크린으로 구성되어 출력 장치 이외에 입력 장치로 사용되는 것도 가능하다.

일 실시예에 따른 디스플레이부(120)는 컨텐트를 표시한다. 본 명세서에서 디스플레이부(120)는 컨텐트가 표시된다는 점에서 화면과 대응되는 구성일 수 있다.

제어부(130)는 통상적으로 디바이스(100)의 전반적인 동작을 제어한다. 예를 들어, 제어부(130)는, 저장부(190)에 저장된 프로그램들을 실행함으로써, 통신부(110), 디스플레이부(120), 오디오 처리부(115), 오디오 출력부(125), 감지부(140), 튜너부(150), 전원부(160), 입/출력부(170), 비디오 처리부(180) 및 저장부(190) 등을 전반적으로 제어할 수 있다.

일 실시예에 따른 제어부(130)는 제어 신호가 수신됨에 따라, 기 설정된 주기로 디바이스(100)의 화면을 캡쳐한다. 또한, 제어부(130)는 캡쳐된 화면이 템플릿 화면과 대응되는 경우, 캡쳐된 화면의 기 설정된 영역에서 컨텐트 정보를 포함한 문자열을 추출한다. 제어부(130)는 추출된 문자열에 포함된 컨텐트 정보를 기초로 디스플레이부(120)에 표시된 컨텐트를 인식한다.

일 실시예에 따른 제어부(130)는 디바이스(100)에 적어도 하나의 컨텐트를 제공하는 컨텐트 서비스의 종류를 결정할 수 있다. 제어부(130)는 결정된 컨텐트 서비스의 종류에 따라 템플릿 화면을 선택할 수 있다.

일 실시예에 따른 제어부(130)는 캡쳐된 화면이 템플릿 화면과 대응되는 경우, 컨텐트가 표시되는 화면의 캡쳐를 중단할 수 있다. 또한, 제어부(130)는 컨텐트 서비스의 종류 및 제어 신호의 타입을 결정할 수 있다. 제어부(130)는 결정된 컨텐트 서비스의 종류 및 제어 신호의 타입에 기초하여, 기 설정된 주기로 컨텐트가 표시되는 디바이스(100)의 화면을 캡쳐할 수 있다.

다른 실시예에 따른 제어부(130)는 수신한 제어 신호가 디바이스(100)의 화면을 포인팅하는 신호인지 여부를 판단하여, 화면에서 포인팅된 지점으로부터 기 설정된 영역을 검출할 수 있다. 또한, 제어부(130)는 검출된 영역에서 컨텐트 정보를 포함하는 문자열을 추출할 수 있다. 제어부(130)는 컨텐트 정보를 기초로 디스플레이부(120)에 표시된 컨텐트를 인식할 수 있다.

다른 실시예에 따라, 제어부(130)는 추출된 컨텐트 정보와 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 추출된 컨텐트 정보와 대응되는 텍스트를 검출한다. 또한, 제어부(130)는 의미 인식 모델을 기 설정할 수 있다. 제어부(130)는 의미 인식 모델에 포함된 적어도 하나의 텍스트 중 추출된 컨텐트 정보에 포함된 텍스트와 유사도가 가장 높은 텍스트를 검출할 수 있다.

제어부(130)는 검출된 텍스트를 기초로 디바이스(100)의 화면에 표시된 컨텐트를 인식한다. 예를 들어, 제어부(130)는 검출된 텍스트를 디바이스(100)의 화면에 표시된 컨텐트의 제목으로 결정할 수 있다. 다른 예에 따라, 디바이스(100)는 부가 정보를 기초로 검출된 텍스트를 검증할 수 있다. 또 다른 예에 따라, 디바이스(100)는 감지된 음성 데이터를 기초로 검출된 텍스트를 검증할 수 있다.

오디오 처리부(115)는 오디오 데이터에 대한 처리를 수행한다. 오디오 처리부(115)에서는 오디오 데이터에 대한 디코딩이나 증폭, 노이즈 필터링 등과 같은 다양한 처리가 수행될 수 있다. 한편, 오디오 처리부(115)는 복수의 컨텐트에 대응되는 오디오를 처리하기 위해 복수의 오디오 처리 모듈을 구비할 수 있다.

오디오 출력부(125)는 제어부(180)의 제어에 의해 튜너부(140)를 통해 수신된 방송 신호에 포함된 오디오를 출력한다. 오디오 출력부(125)는 통신부(150) 또는 입/출력부(170)를 통해 입력되는 오디오(예를 들어, 음성, 사운드)를 출력할 수 있다. 또한, 오디오 출력부(125)는 제어부(110)의 제어에 의해 저장부(190)에 저장된 오디오를 출력할 수 있다. 오디오 출력부(125)는 스피커(126), 헤드폰 출력 단자(127) 또는 S/PDIF(Sony/Philips Digital Interface: 출력 단자(128) 중 적어도 하나를 포함할 수 있다. 오디오 출력부(125)는 스피커(126), 헤드폰 출력 단자(127) 및 S/PDIF 출력 단자(128)의 조합을 포함할 수 있다.

일 실시예에 따른 감지부(140)는, 사용자 입력을 감지하여, 감지된 신호를 제어부(130)로 전달할 수 있다. 또한, 감지부(140)는 전원 온/오프, 채널 선택, 채널-업/다운, 화면 설정을 위한 사용자 입력을 감지할 수 있다. 또한, 일 실시예에 따른 감지부(140)는 디스플레이부(120)에 표시되는 커서를 이동시키기 위한 사용자 입력, 후보 아이템들 간에 포커스를 이동시키기 위한 방향 키 입력을 감지할 수 있다. 또한, 감지부(140)는 사용자의 음성, 사용자의 영상 또는 사용자의 인터랙션을 감지한다.

마이크(141)는 사용자의 발화(utterance)된 음성을 수신한다. 마이크(141)는 수신된 음성을 전기 신호로 변환하여 제어부(130)로 출력할 수 있다.

마이크(141)는 디바이스(100)와 일체형 또는 분리형으로 구현될 수 있다. 분리된 마이크(141)는 통신부(110) 또는 입/출력부(170)를 통해 영상 표시 장치(100b)와 전기적으로 연결될 수 있다. 디바이스(100)의 성능 및 구조에 따라 마이크(141)가 제외될 수 있다는 것은 당해 기술 분야에서 통상의 지식을 가진 자에게 용이하게 이해될 것이다.

카메라부(142)는 제어부(130)의 제어에 따라 수신된 영상을 전기 신호로 변환하여 제어부(130)로 출력할 수 있다.

광 수신부(143)는 외부의 입력 장치에서부터 수신되는 광 신호(제어 신호를 포함)를 디스플레이부(120)의 베젤의 광창(도시되지 아니함) 등을 통해 수신한다. 광 수신부(143)는 입력 장치로부터 사용자 입력(예를 들어, 터치, 눌림, 터치 제스처, 음성, 또는 모션)에 대응되는 광 신호를 수신할 수 있다. 수신된 광 신호로부터 제어부(130)의 제어에 의해 제어 신호가 추출될 수 있다.

튜너부(150)는 유선 또는 무선으로 수신되는 방송 신호를 증폭(amplification), 혼합(mixing), 공진(resonance)등을 통하여 많은 전파 성분 중에서 디스플레이 장치(100)에서 수신하고자 하는 채널의 주파수만을 튜닝(tuning)시켜 선택할 수 있다. 방송 신호는 오디오(audio), 비디오(video) 및 부가 정보(예를 들어, EPG(Electronic Program Guide))를 포함한다.

튜너부(150)는 사용자 입력(예를 들어, 제어 장치(200)로부터 수신되는 제어 신호, 예컨대, 채널 번호 입력, 채널의 업다운(up-down) 입력 및 EPG 화면에서 채널 입력)에 따라 채널 번호(예를 들어, 케이블 방송 506번)에 대응되는 주파수 대역에서 방송 신호를 수신할 수 있다.

튜너부(150)는 지상파 방송, 케이블 방송, 위성 방송, 인터넷 방송 등과 같이 다양한 소스로부터 방송 신호를 수신할 수 있다. 튜너부(150)는 아날로그 방송 또는 디지털 방송 등과 같은 소스로부터 방송 신호를 수신할 수도 있다. 튜너부(150)를 통해 수신된 방송 신호는 디코딩(decoding, 예를 들어, 오디오 디코딩, 비디오 디코딩 또는 부가 정보 디코딩)되어 오디오, 비디오 및/또는 부가 정보로 분리된다. 분리된 오디오, 비디오 및/또는 부가 정보는 제어부(130)의 제어에 의해 저장부(190)에 저장될 수 있다.

전원부(160)는 제어부(130)의 제어에 의해 디바이스(100) 내부의 구성 요소들로 외부의 전원 소스에서부터 입력되는 전원을 공급한다. 또한, 전원부(160)는 제어부(130)의 제어에 의해 디바이스(100) 내부에 위치하는 하나 또는 둘 이상의 배터리(도시되지 아니함)에서부터 출력되는 전원을 내부의 구성 요소들에게 공급할 수 있다.

입/출력부(170)는 제어부(130)의 제어에 의해 디바이스(100)의 외부에서부터 비디오(예를 들어, 동영상 등), 오디오(예를 들어, 음성, 음악 등) 및 부가 정보(예를 들어, EPG 등) 등을 수신한다. 입/출력부(170)는 HDMI 포트(High-Definition Multimedia Interface port, 171), 컴포넌트 잭(component jack, 172), PC 포트(PC port, 173), 및 USB 포트(USB port, 174) 중 하나를 포함할 수 있다. 입/출력부(170)는 HDMI 포트(171), 컴포넌트 잭(172), PC 포트(173), 및 USB 포트(174)의 조합을 포함할 수 있다.

입/출력부(170)의 구성 및 동작은 본 발명의 실시예에 따라 다양하게 구현될 수 있다는 것은 당해 기술 분야의 통상의 지식을 가진 자에게 용이하게 이해될 것이다.

비디오 처리부(180)는, 디바이스(100)가 수신한 비디오 데이터에 대한 처리를 수행한다. 비디오 처리부(180)에서는 비디오 데이터에 대한 디코딩, 스케일링, 노이즈 필터링, 프레임 레이트 변환, 해상도 변환 등과 같은 다양한 이미지 처리를 수행할 수 있다.

제어부(130)는 디바이스(100)의 외부에서부터 입력되는 신호 또는 데이터를 저장하거나, 디바이스(100)에서 수행되는 다양한 작업에 대응되는 저장 영역으로 사용되는 램(RAM, 181), 영상 표시 장치(100b)의 제어를 위한 제어 프로그램이 저장된 롬(ROM, 182) 및 프로세서(Processor, 183)를 포함할 수 있다.

프로세서(183)는 비디오에 대응되는 그래픽 처리를 위한 그래픽 프로세서(Graphic Processing Unit, 도시되지 아니함)를 포함할 수 있다. 프로세서(183)는 코어(core, 도시되지 아니함)와 GPU(도시되지 아니함)를 통합한 SoC(System On Chip)로 구현될 수 있다. 프로세서(183)는 싱글 코어, 듀얼 코어, 트리플 코어, 쿼드 코어 및 그 배수의 코어를 포함할 수 있다.

또한, 프로세서(183)는 복수의 프로세서를 포함할 수 있다. 예를 들어, 프로세서(183)는 메인 프로세서(main processor, 도시되지 아니함) 및 슬립 모드(sleep mode)에서 동작하는 서브 프로세서(sub processor, 도시되지 아니함)로 구현될 수 있다.

그래픽 처리부(184)는 연산부(미도시) 및 렌더링부(미도시)를 이용하여 아이콘, 이미지, 텍스트 등과 같은 다양한 객체를 포함하는 화면을 생성한다. 연산부는 감지부(130)를 통해 감지된 사용자 입력을 이용하여 화면의 레이아웃에 따라 각 객체들이 표시될 좌표값, 형태, 크기, 컬러 등과 같은 속성값을 연산한다. 렌더링부는 연산부에서 연산한 속성값에 기초하여 객체를 포함하는 다양한 레이아웃의 화면을 생성한다. 렌더링부에서 생성된 화면은 디스플레이부(120)의 디스플레이 영역 내에 표시된다.

제1 내지 n 인터페이스(185-1 내지 185-n)는 상술한 각종 구성요소들과 연결된다. 인터페이스들 중 하나는 네트워크를 통해 외부 장치와 연결되는 네트워크 인터페이스가 될 수도 있다.

램(181), 롬(182), 프로세서(183), 그래픽 처리부(184), 제1 내지 n 인터페이스(185-1 내지 185-n)는 내부 버스(bus)(186)를 통해 상호 연결될 수 있다.

본 실시예에서 "제어부"라는 용어는 프로세서(183), 롬(182) 및 램(181)을 포함한다.

저장부(190)는 제어부(130)의 제어에 의해 디바이스(100)를 구동하고 제어하기 위한 다양한 데이터, 프로그램 또는 어플리케이션을 저장할 수 있다. 예를 들어, 저장부(190)는 디바이스(100) 및 제어부(130)의 제어를 위한 제어 프로그램, 제조사에서 최초 제공되거나 외부에서부터 다운로드 받은 어플리케이션, 어플리케이션과 관련된 GUI(graphical user interface), GUI를 제공하기 위한 오브젝트(예를 들어, 이미지 텍스트, 아이콘, 버튼 등), 사용자 정보, 문서, 데이터베이스들 또는 관련 데이터들을 저장할 수 있다.

일 실시예에서 "저장부" 라는 용어는 저장부(190), 제어부의 롬(182), 램(181) 또는 디바이스(100)에 장착되는 메모리 카드(예를 들어, micro SD 카드, USB 메모리, 도시되지 아니함)를 포함한다. 또한, 저장부(190)는 비휘발성 메모리, 휘발성 메모리, 하드 디스크 드라이브(HDD) 또는 솔리드 스테이트 드라이브(SSD)를 포함할 수 있다.

저장부(190)는 도시되지 아니한 방송 수신 모듈, 채널 제어 모듈, 볼륨 제어 모듈, 통신 제어 모듈, 음성 인식 모듈, 모션 인식 모듈, 광 수신 모듈, 디스플레이 제어 모듈, 오디오 제어 모듈, 외부 입력 제어 모듈, 전원 제어 모듈, 무선(예를 들어, 블루투스)으로 연결되는 외부 장치의 전원 제어 모듈, 음성 데이터베이스(DB), 또는 모션 데이터베이스(DB)를 포함할 수 있다. 저장부(190)의 도시되지 아니한 모듈들 및 데이터 베이스는 디바이스(100)에서 방송 수신의 제어 기능, 채널 제어 기능, 볼륨 제어 기능, 통신 제어 기능, 음성 인식 기능, 모션 인식 기능, 광 수신 제어 기능, 디스플레이 제어 기능, 오디오 제어 기능, 외부 입력 제어 기능, 전원 제어 기능 또는 무선(예를 들어, 블루투스)으로 연결되는 외부 장치의 전원 제어 기능을 수행하기 위하여 소프트웨어 형태로 구현될 수 있다. 제어부(130)는 저장부(190)에 저장된 이들 소프트웨어를 이용하여 각각의 기능을 수행할 수 있다.

도 11은 일 실시예에 따른 의미 인식 서버(200)가 디바이스(100)에 제공되는 컨텐트를 인식하는 방법을 설명하기 위한 흐름도이다.

단계 S1110에서, 의미 인식 서버(200)는 디바이스(100)에서 캡쳐된 화면이 템플릿 화면과 대응됨에 따라 캡쳐된 화면에서 추출된 컨텐트 정보를 포함하는 문자열을 디바이스(100)로부터 수신한다.

일 실시예에 따라 의미 인식 서버(200)에 수신된 문자열에는 캡쳐된 화면에서 템플릿 화면과 대응되는 기 설정된 영역에 표시된 텍스트 데이터가 포함될 수 있다. 예를 들어, 캡쳐된 화면이 A 컨텐트의 시작 화면인 경우, 컨텐트 정보에는 A 컨텐트의 제목 및 A 컨텐트가 제공되는 채널의 종류에 관한 정보가 포함될 수 있다. 다만, 이는 일 실시예일 뿐, 컨텐트 정보가 전술한 예에 한정되는 것은 아니다.

다른 실시예에 따라 의미 인식 서버(200)는 디바이스(100)로부터 문자열과 함께 부가 정보를 수신할 수 있다. 여기에서, 부가 정보에는 디바이스(100)에서 컨텐트가 표시된 시간, 디바이스(100)의 사용자, 컨텐트 서비스의 종류 및 캡쳐된 화면에 표시된 텍스트 데이터의 크기, 위치 및 색상 등에 관한 정보가 포함될 수 있다.

또 다른 실시예에 따라 의미 인식 서버(200)는 디바이스(100)로부터 컨텐트 정보와 함께 디바이스(100)에서 감지된 음성 데이터를 수신할 수 있다. 여기에서, 음성 데이터는 디바이스(100)에 표시된 컨텐트를 시청하는 사용자의 음성 데이터를 포함할 수 있다. 다만, 이는 일 실시예일 뿐, 의미 인식 서버(200)는 문자열 및 음성 데이터를 전술한 부가 정보와 함께 수신할 수도 있다.

단계 S1120에서, 의미 인식 서버(200)는 수신된 문자열과 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 컨텐트 정보와 대응되는 텍스트를 검출한다.

일 실시예에 따른 의미 인식 서버(200)는 의미 인식 모델을 기 설정할 수 있다. 의미 인식 모델은 디바이스(100)로부터 수신한 컨텐트 정보로부터 컨텐트를 인식하기 위한 적어도 하나의 텍스트를 포함할 수 있다. 예를 들어, 의미 인식 모델에는 현재 제공되고 있는 컨텐트의 제목 및 컨텐트가 제공되고 있는 채널의 종류 등을 나타내는 적어도 하나의 텍스트가 포함될 수 있다. 또한, 의미 인식 모델에는 문자열에서 컨텐트 정보를 추출하기 위해, 템플릿 화면 별로 기 설정된 포맷 패턴 및 문자열 내의 단어들의 관계에 따라 확률을 산출한 확률 모델ㅇ 중 적어도 하나를 포함할 수 있다.

또한, 다른 예에 따라, 의미 인식 모델은 디바이스의 ID 및 사용자의 ID에 따라 상이하게 설정될 수 있다. 예를 들어, 사용자가 20대 여성인 경우, 의미 인식 서버(200)는 복수의 의미 인식 모델 중 20대 여성이 선호하는 컨텐트의 제목 및 채널의 종류 등을 나타내는 적어도 하나의 텍스트를 포함한 의미 인식 모델을 선택할 수 있다.

일 실시예에 따른 의미 인식 서버(200)는 추출된 문자열로부터 템플릿 화면에 대해 기 설정된 포맷 패턴을 이용하여, 문자열에 포함된 텍스트를 검출할 수 있다. 여기에서, 기 설정된 포맷 패턴은 의미 인식 모델에 포함될 수 있다. 예를 들어,포맷 패턴이 채널명 및 제목명 순서로 설정된 경우, 디바이스(100)는 추출된 문자열로부터 채널명 및 제목명에 대응되는 텍스트를 검출할 수 있다. 한편, 다른 예에 따라, 디바이스(100)는 추출된 문자열에 포함된 적어도 하나의 텍스트가 템플릿에 대해 기 설정된 포맷 패턴과 대응되지 않을 수 있다. 이러한 경우, 디바이스(100)는 문자열 내에서 주변 단어들의 관계를 확률적으로 산출한 확률 모델을 이용하여 문자열로부터 텍스트를 검출할 수 있다. 예를 들어, 디바이스(100)는 A 주연의 B 독점 방송이라는 문자열로부터 확률 모델을 기초로 배우의 이름이 A이고, 방송명이 B인 것으로 텍스트를 추출할 수 있다.

단계 S1130에서, 의미 인식 서버(200)는 검출된 텍스트를 기초로 디바이스(100)의 화면에 표시된 컨텐트를 인식한다.

일 실시예에 따른 의미 인식 서버(200)는 검출된 텍스트를 디바이스(100)의 화면에 표시된 컨텐트의 제목으로 결정할 수 있다.

또한, 다른 실시예에 따라, 의미 인식 서버(200)는 디바이스(100)로부터 수신한 부가 정보를 기초로 검출된 텍스트를 검증할 수 있다. 의미 인식 모델에 포함된 적어도 하나의 텍스트 중 추출된 컨텐트 정보에 포함된 텍스트와 유사도가 가장 높은 텍스트를 검출할 수 있다. 여기에서, 유사도는 컨텐트 정보에 포함된 텍스트의 자음 및 모음의 종류 및 결합 관계 등과 의미 인식 모델에 포함된 적어도 하나의 텍스트 간의 일치 비율에 따라 결정될 수 있다. 예를 들어, 컨텐트 정보에 포함된 텍스트가 훙푸인 경우, 의미 인식 서버(200)는 의미 인식 모델에 포함된 적어도 하나의 텍스트 중 유사도가 가장 높은 쿵푸를 검출할 수 있다. 의미 인식 서버(200)는 디바이스(100)로부터 수신한 컨텐트 정보와 의미 인식 모델을 비교하여 의미 인식 모델로부터 텍스트를 검출함으로써, 수신한 컨텐트 정보에 포함된 오기 등을 정정할 수 있다.

또 다른 실시예에 따라, 의미 인식 서버(200)는 디바이스(100)로부터 수신한 음성 데이터를 기초로 검출된 텍스트를 검증할 수 있다. 예를 들어, 컨텐트의 제목으로 쿵푸가 검출된 반면에, 의미 인식 서버(200)에 수신된 음성 데이터가 쿵푸를 나타내고 있는지 여부를 판단하여 검출된 텍스트를 검증할 수 있다.

일 실시예에 따른 의미 인식 서버(200)는 검출된 텍스트를 검증한 결과, 검출된 텍스트가 컨텐트를 인식하기에 적절한 정보가 아니라고 판단되는 경우, 전술한 단계 S1120을 반복적으로 수행할 수 있다. 또한, 다른 예에 따라, 의미 인식 서버(200)는 디바이스(100)에 디바이스(100)의 화면을 다시 캡쳐하는 것을 요청할 수 있다.

한편, 일 실시예에 따른 의미 인식 서버(200)는 컨텐트 인식 결과를 시청 패턴 분석 서버(300)에 전송할 수 있다. 여기에서, 시청 패턴 분석 서버(300)는 디바이스(100)의 사용자가 빈번하게 시청하는 채널 및 컨텐트의 종류와 컨텐트 시청 시간 등에 관한 정보를 포함하는 시청 패턴을 결정할 수 있다. 일 실시예에 따라, 시청 패턴에 관한 정보는 컨텐트 서비스 제공자 또는 광고 제공자의 서버에 전송될 수 있다.

도 12는 일 실시예에 따라 디바이스(100)에 제공되는 컨텐트를 인식하는 의미 인식 서버(200)를 설명하기 위한 블록도이다.

도 12를 참조하면, 일 실시예에 따른 의미 인식 서버(200)는 통신부(210), 프로세서(220) 및 저장부(230)를 포함할 수 있다. 그러나 도시된 구성요소 모두가 필수구성요소인 것은 아니다. 도시된 구성요소보다 많은 구성요소에 의해 의미 인식 서버(200)가 구현될 수도 있고, 그보다 적은 구성요소에 의해서도 의미 인식 서버(200)는 구현될 수 있다.

이하 상기 구성요소들에 대해 차례로 살펴본다.

통신부(210)는 프로세서(220)의 제어에 의해 의미 인식 서버(200)를 외부 장치(예를 들어, 디바이스(100), 시청 패턴 분석 서버 등)와 연결할 수 있다. 예를 들어, 프로세서(220)는 통신부(210)를 통해 연결된 디바이스(100)로부터 컨텐트 정보를 포함한 문자열을 수신할 수 있다. 또한, 통신부(210)는 외부의 웹 서버(미도시)로부터 기 설정된 주기로 컨텐트 데이터를 수신할 수 있다. 여기에서, 컨텐트 데이터는 의미 인식 모델을 생성하는데 이용될 수 있다. 다른 예에 따라, 프로세서(220)는 통신부(210)를 통해 시청 패턴 분석 서버(미도시)에 디바이스(100)의 화면에 표시된 컨텐트의 인식 정보를 전송할 수 있다.

또한, 일 실시예에 따른 통신부(210)는 디바이스(110)에서 감지된 사용자의 음성 데이터를 수신할 수 있다. 여기에서, 음성 데이터는 사용자가 디바이스(100)에 표시되는 컨텐트를 시청하는 동안 감지된 음성 데이터를 포함할 수 있다.

프로세서(220)는 통상적으로 의미 인식 서버(200)의 전반적인 동작을 제어한다. 예를 들어, 프로세서(220)는, 저장부(230)에 저장된 프로그램들을 실행함으로써, 통신부(210) 및 저장부(230) 등을 전반적으로 제어할 수 있다.

일 실시예에 따른 프로세서(220)는 통신부(210)를 통해 수신한 문자열과 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교한다. 또한, 프로세서(220)는 비교 결과에 기초하여, 컨텐트 정보와 대응되는 텍스트를 적어도 하나의 텍스트 중에서 검출한다. 예를 들어, 프로세서(220)는 추출된 문자열로부터 템플릿 화면에 대해 기 설정된 포맷 패턴을 이용하여, 문자열에 포함된 텍스트를 검출할 수 있다. 한편, 다른 예에 따라, 디바이스(100)는 추출된 문자열에 포함된 적어도 하나의 텍스트가 템플릿에 대해 기 설정된 포맷 패턴과 대응되지 않을 수 있다. 이러한 경우, 디바이스(100)는 문자열 내에서 주변 단어들의 관계를 확률적으로 산출한 확률 모델을 이용하여 문자열로부터 텍스트를 검출할 수 있다.

일 실시예에 따른 프로세서(220)는 검출된 텍스트를 기초로 디바이스(100)의 화면에 표시된 컨텐트를 인식한다. 다른 실시예에 따라, 프로세서(220)는 통신부(210)를 통해 수신한 부가 정보를 기초로 검출된 텍스트를 검증할 수 있다. 또한, 다른 예에 따라, 프로세서(220)는 추출된 컨텐트 정보와 적어도 하나의 텍스트를 비교한 결과 유사도가 임계값 이상인 적어도 하나의 후보 텍스트를 선택한 경우, 적어도 하나의 후보 텍스트와 부가 정보를 비교하여 어느 하나를 선택함으로써 컨텐트 인식에 대한 정확도를 높일 수 있다.

일 실시예에 따른 프로세서(220)는 검출된 텍스트 및 통신부(210)를 통해 수신된 사용자의 음성 데이터를 기초로 디바이스(100)의 화면에 표시된 컨텐트를 인식할 수 있다.

일 실시예에 따른 프로세서(220)는 기 설정된 주기로 획득되는 적어도 하나의 컨텐트 데이터를 기초로 의미 인식 모델을 업데이트 할 수 있다. 또한, 일 실시예에 따른 프로세서(220)는 사용자의 나이, 성별 및 직업 중 적어도 하나를 포함하는 사용자의 프로파일에 따라 의미 인식 모델을 선택할 수 있다.

저장부(230)는 프로세서(220)의 제어에 의해 의미 인식 서버(200)를 구동하고 제어하기 위한 다양한 데이터, 프로그램 또는 어플리케이션을 저장할 수 있다. 예를 들어, 저장부(230)는 적어도 하나의 의미 인식 모델을 저장할 수 있다. 또한, 저장부(230)는 웹 서버(미도시)로부터 수신한 컨텐트 데이터를 저장할 수도 있다.

도 13은 일 실시예에 따라 디바이스(100)에 표시된 컨텐트를 인식하는 시스템(이하, 컨텐트 인식 시스템)을 설명하기 위한 개념도이다.

일 실시예에 따른 컨텐트 인식 시스템은 디바이스(100) 및 의미 인식 서버(200)를 포함할 수 있다.

도 13을 참조하면, 일 실시예에 따른 디바이스(100)는 제어부(130) 및 감지부(140)를 포함할 수 있다. 다만, 이는 본 실시예를 설명하기 위해 필요한 일부 구성요소 만을 도시한 것일 뿐, 디바이스(100)에 포함된 구성 요소가 전술한 예에 한정되는 것은 아니다.

일 실시예에 따른 제어부(130)는 컨텐트가 표시된 디바이스(100)의 화면을 디바이스(100)에 제어 신호가 수신됨에 따라 캡쳐할 수 있다. 제어부(130)는 캡쳐된 화면이 기 저장된 템플릿 화면에 대응되는 경우, 캡쳐된 화면으로부터 컨텐트 정보를 포함한 문자열을 추출할 수 있다.

또한, 제어부(130)는 추출된 문자열을 의미 인식 서버(200)에 전송할 수 있다.

일 실시예에 따른 감지부(140)는 디바이스(140)에 수신된 적어도 하나의 컨텐트를 시청하는 사용자의 음성 데이터를 감지할 수 있다. 예를 들어, 디바이스(100)에 수신되는 적어도 하나의 컨텐트 중 어느 하나를 선택하는 사용자의 음성 데이터 및 디바이스(100)에 표시된 컨텐트를 평가하는 사용자의 음성 데이터 등이 감지될 수 있다.

또한, 감지부(140)는 음성 데이터를 의미 인식 서버(200)에 전송할 수 있다.

일 실시예에 따른 의미 인식 서버(200)는 통신부(210), 프로세서(220) 및저장부(230)를 포함할 수 있다. 다만, 이는 본 실시예를 설명하기 위해 필요한 일부 구성요소 만을 도시한 것일 뿐, 의미 인식 서버(200)에 포함된 구성 요소가 전술한 예에 한정되는 것은 아니다.

일 실시예에 따른 통신부(210)는 디바이스(100)로부터 추출된 문자열 및 음성 데이터를 수신할 수 있다.

일 실시예에 따른 프로세서(220)는 의미 인식부(222) 및 음성 인식부(224)를 포함할 수 있다.

의미 인식부(222)는 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트 중에서, 컨텐트 정보에 대응되는 텍스트를 검출할 수 있다.

음성 인식부(224)는 수신된 음성 데이터를 분석한 결과를 의미 인식부(222)에 제공할 수 있다. 이에 따라, 의미 인식부(222)는 음성 인식부(224)로부터 제공된 음성 데이터 분석 결과와 검출된 텍스트를 비교하여, 검출된 텍스트를 검증할 수 있다. 또한, 다른 예에 따라, 의미 인식부(222)는 수신한 텍스트와 대응되는 복수의 텍스트가 검출된 경우, 음성 데이터 분석 결과와 검출된 복수의 텍스트를 비교하여 어느 하나를 선택할 수 있다.

일 실시예에 따라, 의미 인식부(222)에서 검출된 텍스트는 통신부(210)를 통해 시청 패턴 분석 서버(300)에 전송될 수 있다. 시청 패턴 분석 서버(300)는 기 설정된 기간 동안 의미 인식 서버(200)로부터 수신한 텍스트를 이용하여, 디바이스(100)의 사용자의 시청 패턴을 분석할 수 있다.

도 14는 일 실시예에 따라 의미 인식 서버(200)의 프로세서(220)에 포함된 의미 인식부(1400)의 동작을 보다 상세하게 설명하기 위한 블록도이다.

도 14를 참조하면, 일 실시예에 따른 의미 인식부(1400)는 컨텐트 데이터관리 모듈(1410), 업데이트 모듈(1420) 및 의미 인식 엔진(1430)을 포함할 수 있다. 그러나 도시된 구성요소 모두가 필수구성요소인 것은 아니다. 예를 들어, 도시된 구성 요소들은 하나의 모듈에서 기능이 수행될 수도 있고, 도시된 구성 요소들보다 많은 모듈에서 기능이 수행될 수도 있다.

일 실시예에 따른 컨텐트 데이터 관리 모듈(1410)은 외부의 웹 서버(50)로부터 컨텐트 데이터를 수신할 수 있다. 예를 들어, 컨텐트 데이터 관리 모듈(1410)은 웹 서버(50)로부터 컨텐트 제공 서비스의 종류, 컨텐트 제공 서비스로부터 제공되고 있는 컨텐트의 제목, 컨텐트의 내용 및 컨텐트가 제공되는 채널의 종류 등을 웹 서버(50)로부터 수신할 수 있다. 또한 컨텐트 데이터 관리 모듈(1410)은 수신한 컨텐트 데이터 중에서 컨텐트의 제목, 채널의 종류 등에 관한 컨텐트 데이터를 업데이트 모듈(1420)에 전송할 수 있다.

일 실시예에 따른 업데이트 모듈(1420)은 컨텐트 데이터 관리 모듈(1410)로부터 수신한 컨텐트의 제목, 채널의 종류 등에 관한 컨텐트 데이터를 기초로 의미 인식 모델을 생성할 수 있다. 또한, 업데이트 모듈(1420)은 디바이스(100)로부터 수신한 부가 정보를 이용하여, 디바이스(100)의 사용자에 대응되는 의미 인식 모델을 생성할 수 있다. 예를 들어, 업데이트 모듈(1420)은 디바이스(100)로부터 수신한 사용자의 성별, 연령 및 나이 등에 관한 정보를 기초로 개인화된 의미 인식 모델을 생성할 수 있다.

일 실시예에 따른 의미 인식 엔진(1430)은 업데이트 모듈(1420)로부터 제공되는 의미 인식 모델을 기초로 디바이스(100)로부터 수신한 문자열을 이용하여 디바이스(100)의 화면에 표시된 컨텐트를 인식할 수 있다. 또한, 의미 인식 엔진(1430)은 수신한 문자열로부터 컨텐트의 제목으로 예측되는 단어를 추출한 후에, 컨텐트 데이터 관리 모듈(1410)에 전송할 수 있다. 여기에서, 컨텐트 데이터 관리 모듈(1410)은 추출된 단어에 오기가 존재하는지 또는 추출된 단어가 컨텐트의 제목을 인식하기에 적절한 지 여부를 검증할 수 있다. 컨텐트 데이터 관리 모듈(1410)로부터 검증된 단어는 시청 패턴 분석 서버(300)로 전송될 수 있다.

한편, 이는 일 실시예일 뿐, 의미 인식 엔진(1430)은 컨텐트를 인식한 결과 도출된 컨텐트의 제목 및 컨텐트가 제공된 채널의 종류에 관한 정보의 신뢰도 가 높다고 판단되는 경우, 컨텐트 데이터 관리 모듈(1410)에서의 검증 프로세스를 거치지 않고, 시청 패턴 분석 서버(300)에 검출된 추출된 단어를 전송할 수 있다. 한편, 시청 패턴 분석 서버(300)는 의미 인식 엔진(1430)으로부터 수신한 컨텐트 인식 결과에 기초하여, 사용자의 시청 패턴을 분석할 수 있다. 또한, 시청 패턴 분석 서버(300)는 분석 결과를 업데이트 모듈(1420)에 제공할 수 있다. 이에 따라, 업데이트 모듈(1420)은 수신한 시청 패턴 분석 결과를 기초로 디바이스(100)의 사용자에 대응되는 의미 인식 모델을 업데이트 할 수 있다.

도 15는 일 실시예에 따라 의미 인식 서버(200)의 의미 인식부(220)에 포함된 컨텐트 데이터 관리 모듈(1410)의 동작을 보다 상세하게 설명하기 위한 블록도이다.

도 15를 참조하면, 일 실시예에 따른 컨텐트 데이터 관리 모듈(1410)은 웹 크롤러(1412), 텍스트 가공 모듈(1414), 컨텐트 데이터 베이스 관리 모듈(1416) 및 컨텐트 데이터베이스(1418)를 포함할 수 있다. 그러나 도시된 구성요소 모두가 필수구성요소인 것은 아니다. 예를 들어, 도시된 구성 요소들은 하나의 모듈에서 기능이 수행될 수도 있고, 도시된 구성 요소들보다 많은 모듈에서 기능이 수행될 수도 있다.

일 실시예에 따른 웹 크롤러(1412)는 웹 서버에서 제공되는 데이터 중 컨텐트 데이터를 획득할 수 있다. 예를 들어, 웹 크롤러(1412)는 컨텐트 서비스에서 제공하는 웹 페이지 또는 포탈 사이트의 웹 페이지 등을 방문하여, 웹 페이지에 기록된 컨텐트 데이터를 획득할 수 있다.

일 실시예에 따른 텍스트 가공 모듈(1414)는 웹 크롤러(1412)가 획득한 컨텐트 데이터를 텍스트 형태로 가공할 수 있다. 예를 들어, 텍스트 가공 모듈(1414)은 웹 크롤러(1412)가 획득한 웹 페이지의 이미지로부터 텍스트를 추출할 수 있다.

일 실시예에 따른 컨텐트 데이터 베이스 관리 모듈(1416)은 텍스트 가공 모듈(1414)로부터 획득한 텍스트 형태의 컨텐트 데이터를 컨텐트 서비스의 종류 및 시청 시간에 따라 분류하여 컨텐트 데이터 베이스(1418)에 저장할 수 있다.

또한, 컨텐트 데이터 베이스 관리 모듈(1416)은 도 14를 참조하여 전술한 업데이트 모듈(1420) 및 의미 인식 엔진(1430)에 각각 텍스트 형태의 컨텐트 데이터를 제공할 수 있다.

한편, 도 15에서는 컨텐트 데이터 베이스(1418)가 컨텐트 정보 관리 모듈(1410)에 포함되는 것으로 도시되어 있으나, 이는 일 실시예일 뿐, 다른 예에 따라 컨텐트 데이터 베이스(1418)는 도 12를 참조하여 전술한 저장부(230)에 포함될 수도 있다.

도 16은 일 실시예에 따라 의미 인식 서버(200)에서 텍스트 형태의 컨텐트 데이터를 기초로 의미 인식 모델에 기초가 되는 텍스트를 가공하는 방법을 설명하기 위한 도면이다.

일 실시예에 따른 의미 인식 서버(200)는 텍스트 형태의 컨텐트 데이터(1610)로부터 컨텐트를 인식할 수 있는 적어도 하나의 텍스트를 검출할 수 있다. 의미 인식 서버(200)은 기 설정된 템플릿 코퍼스(1620)를 이용하여, 텍스트 형태의 컨텐트 데이터로부터 컨텐트를 인식하는데 이용 가능한 적어도 하나의 텍스트를 추출할 수 있다. 여기에서, 템플릿 코퍼스(1620)는 컨텐트를 인식하는데 이용될 수 있는 단어들로 구성될 수 있다. 예를 들어, 영화 제목, 드라마 제목, 영화 채널 및 방송 시간 등이 일 실시예에 따른 템플릿 코퍼스에 포함될 수 있다.

일 실시예에 따른 의미 인식 서버(200)는 검출된 텍스트를 템플릿 코퍼스 항목에 따라 분류할 수 있다. 분류된 텍스트(1630)에는 템플릿 코퍼스가 인덱스 형태로 함께 저장될 수 있다. 또한, 의미 인식 서버(200)는 분류된 텍스트(1630)를 기초로 의미 인식 모델을 생성할 수 있다.

한편, 도 16에서 전술한 예는 의미 인식 모델을 생성하기 위한 방법들 중 일 예일 뿐, 본 발명에서 의미 인식 모델을 생성하는 방법이 코퍼스를 이용하는데 한정되는 것은 아니다.

본 발명의 일 실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.

실시 예에 따른 장치는 프로세서, 프로그램 데이터를 저장하고 실행하는 메모리, 디스크 드라이브와 같은 영구 저장부(permanent storage), 외부 장치와 통신하는 통신 포트, 터치 패널, 키(key), 버튼 등과 같은 사용자 인터페이스 장치 등을 포함할 수 있다. 소프트웨어 모듈 또는 알고리즘으로 구현되는 방법들은 상기 프로세서상에서 실행 가능한 컴퓨터가 읽을 수 있는 코드들 또는 프로그램 명령들로서 컴퓨터가 읽을 수 있는 기록 매체 상에 저장될 수 있다. 여기서 컴퓨터가 읽을 수 있는 기록 매체로 마그네틱 저장 매체(예컨대, ROM(read-only memory), RAM(random-access memory), 플로피 디스크, 하드 디스크 등) 및 광학적 판독 매체(예컨대, 시디롬(CD-ROM), 디브이디(DVD: Digital Versatile Disc)) 등이 있다. 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템들에 분산되어, 분산 방식으로 컴퓨터가 판독 가능한 코드가 저장되고 실행될 수 있다. 매체는 컴퓨터에 의해 판독가능하며, 메모리에 저장되고, 프로세서에서 실행될 수 있다.

도면에 도시된 실시 예들에서 참조 부호를 기재하였으며, 실시 예들을 설명하기 위하여 특정 용어들을 사용하였으나, 특정 용어에 의해 본 발명이 한정되는 것은 아니며, 실시 예는 당업자에 있어서 통상적으로 생각할 수 있는 모든 구성 요소들을 포함할 수 있다.

실시 예는 기능적인 블록 구성들 및 다양한 처리 단계들로 나타내어질 수 있다. 이러한 기능 블록들은 특정 기능들을 실행하는 다양한 개수의 하드웨어 또는/및 소프트웨어 구성들로 구현될 수 있다. 예를 들어, 실시 예는 하나 이상의 마이크로프로세서들의 제어 또는 다른 제어 장치들에 의해서 다양한 기능들을 실행할 수 있는, 메모리, 프로세싱, 로직(logic), 룩 업 테이블(look-up table) 등과 같은 직접 회로 구성들을 채용할 수 있다. 또한, 실시예는 동종의 또는 서로 다른 종류의 코어들, 서로 다른 종류의 CPU들을 채용할 수도 있다. 본 발명에의 구성 요소들이 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있는 것과 유사하게, 실시 예는 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler) 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다. 또한, 실시 예는 전자적인 환경 설정, 신호 처리, 및/또는 데이터 처리 등을 위하여 종래 기술을 채용할 수 있다. “매커니즘”, “요소”, “수단”, “구성”과 같은 용어는 넓게 사용될 수 있으며, 기계적이고 물리적인 구성들로서 한정되는 것은 아니다. 상기 용어는 프로세서 등과 연계하여 소프트웨어의 일련의 처리들(routines)의 의미를 포함할 수 있다.

실시 예에서 설명하는 특정 실행들은 일 실시 예들로서, 어떠한 방법으로도 실시 예의 범위를 한정하는 것은 아니다. 명세서의 간결함을 위하여, 종래 전자적인 구성들, 제어 시스템들, 소프트웨어, 상기 시스템들의 다른 기능적인 측면들의 기재는 생략될 수 있다. 또한, 도면에 도시된 구성 요소들 간의 선들의 연결 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것으로서, 실제 장치에서는 대체 가능하거나 추가의 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들로서 나타내어질 수 있다. 또한, “필수적인”, “중요하게” 등과 같이 구체적인 언급이 없다면 본 발명의 적용을 위하여 반드시 필요한 구성 요소가 아닐 수 있다.

실시 예의 명세서(특히 특허청구범위에서)에서 “상기”의 용어 및 이와 유사한 지시 용어의 사용은 단수 및 복수 모두에 해당하는 것일 수 있다. 또한, 실시 예에서 범위(range)를 기재한 경우 상기 범위에 속하는 개별적인 값을 적용한 발명을 포함하는 것으로서(이에 반하는 기재가 없다면), 상세한 설명에 상기 범위를 구성하는 각 개별적인 값을 기재한 것과 같다. 마지막으로, 실시 예에 따른 방법을 구성하는 단계들에 대하여 명백하게 순서를 기재하거나 반하는 기재가 없다면, 상기 단계들은 적당한 순서로 행해질 수 있다. 반드시 상기 단계들의 기재 순서에 따라 실시 예들이 한정되는 것은 아니다. 실시 예에서 모든 예들 또는 예시적인 용어(예들 들어, 등등)의 사용은 단순히 실시 예를 상세히 설명하기 위한 것으로서 특허청구범위에 의해 한정되지 않는 이상 상기 예들 또는 예시적인 용어로 인해 실시 예의 범위가 한정되는 것은 아니다. 또한, 당업자는 다양한 수정, 조합 및 변경이 부가된 특허청구범위 또는 그 균등물의 범주 내에서 설계 조건 및 팩터에 따라 구성될 수 있음을 알 수 있다.

Claims

디바이스에서 캡쳐된 화면이 템플릿 화면과 대응됨에 따라, 상기 캡쳐된 화면에서 추출된 컨텐트 정보를 상기 디바이스로부터 수신하는 단계;

상기 수신된 컨텐트 정보와 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 추출된 컨텐트 정보와 대응되는 텍스트를 검출하는 단계; 및

상기 검출된 텍스트를 기초로 상기 디바이스의 화면에 표시된 컨텐트를 인식하는 단계를 포함하는 서버가 컨텐트를 인식하는 방법.
제 1 항에 있어서,

상기 디바이스의 컨텐트를 시청하는 사용자의 음성 데이터를 수신하는 단계를 더 포함하고,

상기 컨텐트를 인식하는 단계는,

상기 수신된 사용자의 음성 데이터를 기초로 상기 디바이스의 화면에 표시된 컨텐트를 인식하는 서버가 컨텐트를 인식하는 방법.
제 1 항에 있어서, 상기 텍스트를 검출하는 단계는,

상기 추출된 컨텐트 정보와 상기 적어도 하나의 텍스트를 비교하여, 상기 적어도 하나의 텍스트 각각이 상기 추출된 컨텐트 정보에 대응될 확률값을 산출하는 단계; 및

상기 산출된 확률값을 기초로 상기 적어도 하나의 텍스트 중 어느 하나를 검출하는 단계를 포함하는 서버가 컨텐트를 인식하는 방법.
제 1 항에 있어서, 상기 검출된 텍스트가 존재하지 않는 경우, 상기 디바이스로부터 상기 템플릿 화면과 대응되는 다른 캡쳐 화면에서 추출된 상기 컨텐트 정보를 포함한 문자열을 수신하는 단계를 더 포함하는 서버가 컨텐트를 인식하는 방법.
제 1 항에 있어서, 상기 컨텐트를 인식하는 단계는,

상기 추출된 컨텐트 정보에서 상기 검출된 텍스트와 대응되지 않는 정보를 상기 검출된 텍스트를 기초로 변경하는 단계를 포함하는 서버가 컨텐트를 인식하는 방법.
제 1 항에 있어서,

상기 컨텐트 인식 결과를 시청 패턴 분석 서버에 전송하는 단계; 및

상기 컨텐트 인식 결과를 기초로 상기 시청 패턴 분석 서버에서 생성된 상기 디바이스의 사용자의 시청 패턴 히스토리 정보를 상기 시청 패턴 분석 서버로부터 수신하는 단계를 더 포함하는 서버가 컨텐트를 인식하는 방법.
적어도 하나의 컨텐트를 수신하는 통신부;

상기 적어도 하나의 컨텐트 중 어느 하나를 디스플레이 하는 디스플레이부; 및

상기 적어도 하나의 컨텐트를 제어하기 위한 제어 신호가 수신됨에 따라 상기 디바이스의 화면을 캡쳐하고, 상기 캡쳐된 화면이 템플릿 화면과 대응되는 경우, 상기 캡쳐된 화면의 기 설정된 영역에서 컨텐트 정보를 포함하는 문자열을 추출하며, 상기 추출된 문자열과 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 상기 컨텐트 정보와 대응되는 텍스트를 검출하고, 상기 검출된 텍스트를 기초로 상기 디바이스의 화면에 표시된 컨텐트를 인식하는 프로세서를 포함하는 컨텐트를 인식하는 디바이스.
디바이스에서 캡쳐된 화면이 템플릿 화면과 대응됨에 따라, 상기 캡쳐된 화면에서 추출된 컨텐트 정보를 포함하는 문자열을 상기 디바이스로부터 수신하는 통신부; 및

상기 수신된 컨텐트 정보와 기 설정된 의미 인식 모델에 포함된 적어도 하나의 텍스트를 비교하여, 컨텐트 정보와 대응되는 텍스트를 검출하고, 상기 검출된 텍스트를 기초로 상기 디바이스의 화면에 표시된 컨텐트를 인식하는 프로세서를 포함하는 컨텐트를 인식하는 서버.
제 8 항에 있어서, 상기 통신부는,

상기 디바이스의 컨텐트를 시청하는 사용자의 음성 데이터를 수신하고,

상기 프로세서는,

상기 수신된 사용자의 음성 데이터를 기초로 상기 디바이스의 화면에 표시된 컨텐트를 인식하는 컨텐트를 인식하는 서버.
제 8 항에 있어서, 상기 프로세서는,

상기 추출된 컨텐트 정보와 상기 적어도 하나의 텍스트를 비교하여, 상기 적어도 하나의 텍스트 각각이 상기 추출된 컨텐트 정보에 대응될 확률값을 산출하는 단계; 및상기 산출된 확률값을 기초로 상기 적어도 하나의 텍스트 중 어느 하나를 검출하는 컨텐트를 인식하는 서버.
제 8 항에 있어서, 상기 프로세서는,

상기 검출된 텍스트가 존재하지 않는 경우, 상기 디바이스로부터 상기 템플릿 화면과 대응되는 다른 캡쳐 화면에서 추출된 상기 컨텐트 정보를 포함한 문자열을 수신하는 단계를 더 포함하는 컨텐트를 인식하는 서버.
제 8 항에 있어서, 상기 프로세서는,

상기 추출된 컨텐트 정보에서 상기 검출된 텍스트와 대응되지 않는 정보를 상기 검출된 텍스트를 기초로 변경하는 컨텐트를 인식하는 서버.
제 8 항에 있어서, 상기 통신부는,

상기 컨텐트 인식 결과를 시청 패턴 분석 서버에 전송하고, 상기 컨텐트 인식 결과를 기초로 상기 시청 패턴 분석 서버에서 생성된 상기 디바이스의 사용자의 시청 패턴 히스토리 정보를 수신하는 컨텐트를 인식하는 서버.
제 1 항의 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.