JP7596105B2 - Viewing state estimation device, robot system, viewing state estimation method, and viewing state estimation program - Google Patents
Viewing state estimation device, robot system, viewing state estimation method, and viewing state estimation program Download PDFInfo
- Publication number
- JP7596105B2 JP7596105B2 JP2020162380A JP2020162380A JP7596105B2 JP 7596105 B2 JP7596105 B2 JP 7596105B2 JP 2020162380 A JP2020162380 A JP 2020162380A JP 2020162380 A JP2020162380 A JP 2020162380A JP 7596105 B2 JP7596105 B2 JP 7596105B2
- Authority
- JP
- Japan
- Prior art keywords
- viewer
- viewing
- television
- distance
- robot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Manipulator (AREA)
- Image Analysis (AREA)
Description
本発明は、テレビ視聴者の状態を推定するための装置、方法及びプログラムに関する。 The present invention relates to an apparatus, method, and program for estimating the state of a television viewer.
従来、視聴者と一緒にテレビ番組等の映像を視聴するロボットにおいて、視聴者の視聴状態に応じて動作を制御する技術が研究されている。
視聴状態を推定する技術として、例えば、テレビを視聴するような室内において、視聴者が向いている方向を検出するために、カメラを設置して観測する方法、又は視聴者に眼鏡型の視線方向取得装置を装着させて、視聴者の視線方向データを取得する方法がある。
2. Description of the Related Art Conventionally, for a robot that watches a television program or other video together with a viewer, technology has been researched for controlling the movement of the robot in accordance with the viewing state of the viewer.
Techniques for estimating the viewing state include, for example, a method of installing a camera to observe in a room where a television is being watched in order to detect the direction in which the viewer is facing, or a method of having the viewer wear a glasses-type gaze direction acquisition device to acquire gaze direction data of the viewer.
さらに、推定された視聴状態に応じた制御として、例えば、特許文献1では、ユーザの視線方向を検出し、画像投影デバイスから映像を投影する表示位置を決定すると共に、表示画像の幾何補正を行い表示させることで、ユーザが見やすい画像を表示する装置が提案されている。
また、特許文献2では、コンテンツを視聴中の視聴者を含む画像から、視聴状態を検出し、視聴しているコンテンツの開始時からの経過時間に関連付ける装置が提案されている。
Furthermore, as a control according to the estimated viewing state, for example,
Moreover,
視聴状態を推定する従来の方法のうち、天井、壁面、又はテレビの上等にカメラを設置した実験室のような特定の場所で、視聴者の映像から視線方向を推定する方法は、実験的に一定期間のみ実施されるものである。したがって、日常的な視聴環境において視聴者の視線方向を推定することは困難である。
また、眼鏡型の視線方向取得装置を視聴者の頭部に装着させる方法は、日常的な視聴状況とは異なり、装着することによる違和感が生じ視聴の負担ともなる。したがって、これも日常的な視聴環境においては困難な方法である。
Among conventional methods for estimating the viewing state, a method for estimating the gaze direction from the viewer's video in a specific location, such as a laboratory with cameras installed on the ceiling, wall, or above the television, is only carried out experimentally for a certain period of time, and therefore it is difficult to estimate the viewer's gaze direction in an everyday viewing environment.
In addition, the method of having the viewer wear a glasses-type gaze direction acquisition device on their head is different from everyday viewing conditions, and wearing the device creates a sense of discomfort and puts a strain on the viewer. Therefore, this method is also difficult to use in everyday viewing environments.
特許文献1の方法では、室内の天井部分の四隅に撮像デバイスが設けられ、撮像デバイスから取得される撮像画像に基づき、ユーザの視線方向が推定される。この場合、室内に撮像デバイスを設置する必要があるが、家庭の室内に設置することは困難である。また、室内全体を撮像するために撮像デバイスが複数台必要である。
In the method of
特許文献2の方法では、視聴者を含むカメラ画像から抽出した視聴者のバイタル情報に基づいて、視聴者の視聴状態を判定しているが、カメラをディスプレイ上部等に設置する必要があり、日常的な視聴状況とは異なってしまう。また、この方法では、視聴者がディスプレイではなく他者の方を向いて会話をしている等の情報は取得できず、実際には視聴していないときのバイタル情報をも反映させてしまい適切な視聴状態を判定できなくなってしまう。
In the method of
本発明は、追加のカメラ等の装置を用いることなく、ロボットにおいて視聴者の視聴状態を推定できる視聴状態推定装置、視聴状態推定方法及び視聴状態推定プログラムを提供することを目的とする。 The present invention aims to provide a viewing state estimation device, a viewing state estimation method, and a viewing state estimation program that can estimate the viewing state of a viewer using a robot without using additional devices such as cameras.
本発明に係る視聴状態推定装置は、ロボットの周囲を撮像した画像から合成された、全方位のパノラマ画像を取得するパノラマ画像部と、前記パノラマ画像の各画素と対応した距離データを画素値とする距離パノラマ画像を生成する距離パノラマ画像部と、前記パノラマ画像から、テレビ位置を検出するテレビ検出部と、前記パノラマ画像から、視聴者の顔位置を検出する視聴者検出部と、前記距離パノラマ画像から、前記テレビ位置及び前記顔位置における距離をそれぞれ取得する距離取得部と、前記パノラマ画像のサイズ、前記テレビ位置及び前記顔位置に基づいて、前記ロボットから見たテレビと視聴者との間の角度を算出することにより、前記ロボット、前記視聴者及び前記テレビの位置関係を特定し、前記顔位置の画像から得られる前記視聴者の顔方向角度に基づいて、前記パノラマ画像から前記視聴者の視聴方向角度にある視聴方向画像を取得する視聴方向検出部と、前記視聴方向画像に含まれる物体を検出し、当該物体の種類に基づいて、前記視聴者の状態を判定する視聴状態判定部と、を備える。 The viewing state estimation device according to the present invention includes a panoramic image unit that acquires an omnidirectional panoramic image synthesized from images captured around the robot, a distance panoramic image unit that generates a distance panoramic image in which distance data corresponding to each pixel of the panoramic image is used as a pixel value, a television detection unit that detects the position of the television from the panoramic image, a viewer detection unit that detects the position of the viewer's face from the panoramic image, a distance acquisition unit that acquires the distances at the television position and the face position from the distance panoramic image, a viewing direction detection unit that calculates the angle between the television and the viewer as seen by the robot based on the size of the panoramic image, the television position, and the face position to identify the positional relationship between the robot, the viewer, and the television, and acquires a viewing direction image at the viewing direction angle of the viewer from the panoramic image based on the face direction angle of the viewer obtained from the image of the face position, and a viewing state determination unit that detects an object included in the viewing direction image and determines the state of the viewer based on the type of the object.
前記視聴方向検出部は、前記視聴者から視聴方向位置までの距離を、前記ロボットから前記視聴者までの距離と、前記ロボットから前記視聴方向位置までの距離との和で近似してもよい。 The viewing direction detection unit may approximate the distance from the viewer to the viewing direction position by the sum of the distance from the robot to the viewer and the distance from the robot to the viewing direction position.
前記視聴状態判定部は、前記視聴者の状態の一定時間内における統計情報に基づいて、視聴状態を算出してもよい。 The viewing state determination unit may calculate the viewing state based on statistical information about the viewer's state within a certain period of time.
前記視聴状態判定部は、前記視聴状態として、前記テレビを視聴している割合を示す視聴度を算出してもよい。 The viewing state determination unit may calculate a viewing degree indicating the proportion of the television being watched as the viewing state.
前記視聴状態判定部は、前記視聴状態として、前記テレビを見ている状態、及び他者を見ている状態含む複数の状態を判定してもよい。 The viewing state determination unit may determine a plurality of viewing states, including a state of watching the television and a state of watching someone else, as the viewing state.
本発明に係るロボットシステムは、前記視聴状態推定装置と、前記視聴状態推定装置から出力された前記視聴度を、所定の閾値と比較した結果により、前記ロボットの動作を制御する動作制御部と、を備える。 The robot system according to the present invention includes the viewing state estimation device, and an operation control unit that controls the operation of the robot based on the result of comparing the viewing degree output from the viewing state estimation device with a predetermined threshold value.
前記動作制御部は、複数の閾値に基づいて、前記ロボットの制御を段階的に変更してもよい。 The operation control unit may gradually change the control of the robot based on multiple thresholds.
本発明に係るロボットシステムは、前記視聴状態推定装置と、前記視聴状態推定装置から出力された前記複数の状態の区分に応じて、前記ロボットの動作を制御する動作制御部と、を備える。 The robot system according to the present invention includes the viewing state estimation device and an operation control unit that controls the operation of the robot in accordance with the classification of the plurality of states output from the viewing state estimation device.
本発明に係る視聴状態推定方法は、ロボットの周囲を撮像した画像から合成された、全方位のパノラマ画像を取得するパノラマ画像生成ステップと、前記パノラマ画像の各画素と対応した距離データを画素値とする距離パノラマ画像を生成する距離パノラマ画像生成ステップと、前記パノラマ画像から、テレビ位置を検出するテレビ検出ステップと、前記パノラマ画像から、視聴者の顔位置を検出する視聴者検出ステップと、前記距離パノラマ画像から、前記テレビ位置及び前記顔位置における距離をそれぞれ取得する距離取得ステップと、前記パノラマ画像のサイズ、前記テレビ位置及び前記顔位置に基づいて、前記ロボットから見たテレビと視聴者との間の角度を算出することにより、前記ロボット、前記視聴者及び前記テレビの位置関係を特定し、前記顔位置の画像から得られる前記視聴者の顔方向角度に基づいて、前記パノラマ画像から前記視聴者の視聴方向角度にある視聴方向画像を取得する視聴方向検出ステップと、前記視聴方向画像に含まれる物体を検出し、当該物体の種類に基づいて、前記視聴者の状態を判定する視聴状態判定ステップと、をコンピュータが実行する。 The viewing state estimation method according to the present invention includes a panoramic image generation step of acquiring an omnidirectional panoramic image synthesized from images of the robot's surroundings, a distance panoramic image generation step of generating a distance panoramic image in which distance data corresponding to each pixel of the panoramic image is used as a pixel value, a television detection step of detecting a television position from the panoramic image, a viewer detection step of detecting a face position of the viewer from the panoramic image, a distance acquisition step of acquiring the distances at the television position and the face position from the distance panoramic image, a viewing direction detection step of calculating the angle between the television and the viewer as seen by the robot based on the size of the panoramic image, the television position, and the face position, thereby identifying the positional relationship between the robot, the viewer, and the television, and acquiring a viewing direction image at the viewing direction angle of the viewer from the panoramic image based on the face direction angle of the viewer obtained from the image of the face position, and a viewing state determination step of detecting an object included in the viewing direction image and determining the state of the viewer based on the type of the object.
本発明に係る視聴状態推定プログラムは、前記視聴状態推定装置としてコンピュータを機能させるためのものである。 The viewing state estimation program according to the present invention is for causing a computer to function as the viewing state estimation device.
本発明によれば、追加のカメラ等の装置を用いることなく、ロボットにおいて視聴者の視聴状態を推定できる。 According to the present invention, the robot can estimate the viewer's viewing state without using additional cameras or other devices.
以下、本発明の実施形態の一例について説明する。
図1は、本実施形態における視聴状態推定装置10が組み込まれたロボット1の利用シーンを説明する図である。
An example of an embodiment of the present invention will now be described.
FIG. 1 is a diagram illustrating a usage scene of a
ロボット1は、例えば、テレビを視聴する視聴者の側にある卓上等に設置される。ロボット1は、視聴状態推定装置10の他、撮像部20及び距離検出部30を備え、さらに、視聴状態推定装置10により推定された視聴状態に応じて発話等の動作を行う動作制御部40を備える。
The
視聴状態推定装置10は、撮像部20から得られるロボット周囲の画像データと、距離検出部30から得られる距離データとを取得し、後述の手法により、ロボット1からテレビまでの距離、ロボット1から視聴者までの距離、視聴者の視聴方向を求め、さらに、視聴者の視聴方向の画像を取得することで視聴状態を推定する。
The viewing
撮像部20は、ロボット1に搭載され、画像を取得するためのカメラであり、モータにより水平方向に回転し、ロボット1の周囲を撮影するものであってよい。
なお、撮像部20は、回転しつつ画像を取得する手法に限らず、例えば、複数個のカメラからなるカメラアレイをロボット1に搭載して画像を取得するものであってもよい。
The
The
距離検出部30は、照射部から照射した赤外線光と、対象物に反射して受光部へ到達した光に基づいて距離データを取得する。赤外線の照射方式は、例えば、パターン方式又はTOF(Time Of Flight)方式による。距離検出部30は、撮像部20により画像を取得した際に、時刻同期して、また、画像の各画素に対応する方向の距離データを取得する。
The
ここで、視聴状態は、例えば、テレビを見ている、他者を見ている、その他を見ている等、視聴方向の区分を示す。
動作制御部40は、視聴状態推定装置10により推定された視聴状態に応じて、ロボット1による発話等の動作を変化させる。
Here, the viewing state indicates a category of viewing direction, such as watching television, watching someone else, or watching something else.
The
図2は、本実施形態における視聴状態推定装置10の機能構成を示すブロック図である。
視聴状態推定装置10は、制御部、記憶部、及び入出力インタフェース等を備えた情報処理装置(コンピュータ)であり、記憶部に格納されたソフトウェア(視聴状態推定プログラム)を制御部が実行することにより、次の各機能部として動作する。
視聴状態推定装置10は、パノラマ画像部11と、距離パノラマ画像部12と、視聴者検出部13と、テレビ検出部14と、距離取得部15と、視聴方向検出部16と、視聴状態判定部17とを備える。
FIG. 2 is a block diagram showing a functional configuration of the viewing
The viewing
The viewing
パノラマ画像部11は、撮像部20により取得したロボット1の周囲の複数枚の画像を重ね合わせて、ロボット1から見た水平全方位のパノラマ画像を生成する。なお、パノラマ画像を生成するためのソフトウェアとして、オープンソースOpenCV・Stitcherクラスを利用できるが、生成手法はこれに限られない。
The
また、パノラマ画像部11は、複数枚の画像を合成した際の合成位置データDcを出力する。
図3は、本実施形態における合成位置データDcを例示する図である。
合成位置データDcは、パノラマ画像を生成するとき、画像を張り合わせた複数枚の画像の番号と、合成位置の座標とで構成される。
例えば、1番目の画像の座標(150,10)に2番目の画像の座標(0,0)が張り合わされ、n番目の画像の座標(xn,yn)に1番目の画像の座標(0,0)が張り合わされる。
また、この例では、同期して取得された距離画像の番号が対応付けられている。
The
FIG. 3 is a diagram illustrating the composite position data Dc in this embodiment.
The synthesis position data Dc is composed of the numbers of the multiple images that are stitched together when generating a panoramic image, and the coordinates of the synthesis position.
For example, the coordinates (150, 10) of the first image are pasted onto the coordinates (0, 0) of the second image, and the coordinates (0, 0) of the first image are pasted onto the coordinates (x n , yn ) of the nth image.
In this example, the numbers of the distance images acquired synchronously are associated with each other.
距離パノラマ画像部12は、距離検出部30で取得した距離データを用いて、パノラマ画像部11で生成されるパノラマ画像と同様に、距離データを画素値とした距離パノラマ画像を生成する。
The distance
図4は、本実施形態における距離パノラマ画像部12の機能構成を示す図である。
距離パノラマ画像部12は、距離画像合成部121と、重複区間算出部122とを備え、合成位置データDcが入力され、距離パノラマ画像データDpを出力する。
FIG. 4 is a diagram showing the functional configuration of the distance
The distance
距離画像合成部121は、パノラマ画像部11から入力された合成位置データDcを用いて、パノラマ画像部11で合成された複数枚の画像と同位置に、距離検出部30より得られた複数枚の距離画像を合成する。
ここで、撮像された画像の各画素に対応する距離データは、距離画像データベース12Aに保存されている。なお、距離画像データベース12Aは、視聴状態推定装置10の記憶部に格納されてもよいし、ロボット1の各部がアクセス可能な共通の記憶部に設けられてもよい。
The distance
Here, distance data corresponding to each pixel of the captured image is stored in
重複区間算出部122は、合成した距離画像が重複する区間(画素)において、重複している複数個の距離データを平均し、画素毎の距離データを決定する。
なお、距離データの決定方法はこれに限られず、いずれかの距離画像のデータを代表として決定してもよい。
The overlapping
The method of determining the distance data is not limited to this, and data from any of the distance images may be determined as a representative.
図5は、本実施形態における距離画像合成部121の動作内容を例示する図である。
例えば、撮像部20で画像1と画像2とが順に取得され、画像2を画像1における合成位置Pc1(150,0)で合成した場合、距離画像合成部121は、画像1及び画像2と同時に取得された距離画像1及び距離画像2も同様に合成し、距離画像データベース12Aから取得した距離データを各画素にマッピングする。
FIG. 5 is a diagram illustrating the operation of the distance
For example, if
図6は、本実施形態における重複区間算出部122の動作内容を例示する図である。
例えば、前述の図5のように距離画像1と距離画像2とを合成するとき、距離画像1における座標P1(150,159)の距離データが1.50、距離画像2における座標P2(0,159)の距離データが1.60であったとする。この場合、重複区間算出部122は、平均値(1.50+1.60)/2=1.55を、距離パノラマ画像の位置(150,159)における距離データとして決定する。
あるいは、重複区間算出部122は、距離画像2のP2(0,159)の距離データ1.60を、距離パノラマ画像の距離データとして採用してもよい。
FIG. 6 is a diagram illustrating an example of the operation of the overlapping
5, suppose that the distance data at coordinate P1 (150,159) in
Alternatively, the overlapping
同様に、重複区間算出部122は、重複区間の全体について、各画素に対応する距離データを決定する。
決定された距離データは、記憶部の距離パノラマ画像データベース12Bに記憶される。
Similarly, the overlapping
The determined distance data is stored in the distance
図7は、本実施形態における距離画像データベース12Aを例示する図である。
距離画像データベース12Aでは、距離画像番号nd毎に、距離画像内の位置(座標xd,yd)と、距離データldとが対応付けられ、各距離画像における各画素の距離データが格納されている。
FIG. 7 is a diagram illustrating an example of
In
図8は、本実施形態における距離パノラマ画像データベース12Bを例示する図である。
距離パノラマ画像データベース12Bには、パノラマ画像の画像番号np、位置(座標xp,yp)、距離データlpで構成される距離パノラマ画像データが格納されている。
FIG. 8 is a diagram illustrating an example of the distance
The distance
視聴者検出部13は、パノラマ画像部11により生成されたパノラマ画像から、視聴者の顔位置を検出し、パノラマ画像上の顔位置を取得する。
The
図9は、本実施形態における視聴者検出部13の機能構成を示す図である。
視聴者検出部13は、人検出部131と、顔検出部132とを備える。
FIG. 9 is a diagram showing the functional configuration of the
The
人検出部131は、パノラマ画像部11より取得したパノラマ画像から人検出を行う。人検出の手段として、例えば、オープンソースのOpenCV(Haarcascade検出器fullbodyモデル)又はFaster-RCNN等のソフトウェアを利用できるが、検出手法はこれらに限られない。
人検出部131は、人を検出した場合、視聴者フラグfh=1を、人を検出しなかった場合、視聴者フラグfh=0を出力する。
The
If the
顔検出部132は、人検出部131により人、すなわち視聴者が検出されたとき(fh=1)、パノラマ画像部11により生成されたパノラマ画像から顔検出を行い、パノラマ画像上の顔位置を取得する。一方、視聴者が検出されなかったとき(fh=0)には、顔検出部132は、顔検出を行わないこととし、撮像部20から新たな画像を取得する処理に進み高速化を図る。
顔検出の手段には、例えば、オープンソースのOpenCV(Haar-cascade検出器)又はOpenFace等のソフトウェアを利用できるが、検出手法はこれらに限られない。
When the
As a means for face detection, for example, open source software such as OpenCV (Haar-cascade detector) or OpenFace can be used, but the detection method is not limited to these.
ここで、顔位置は、顔部分が四角枠で検出され、顔検出部132は、四角枠の始点Psf(xsf,ysf)及び終点Pef(xef,yef)から中心点Pf(xf,yf)を算出する。顔の中心点Pfは、顔位置の距離取得に用いられる。
顔検出部132は、顔を検出した場合に顔フラグff=1を、顔を検出しなかった場合に顔フラグff=0を出力する。
Here, the face position is determined by detecting the face portion in a rectangular frame, and the
The
テレビ検出部14は、パノラマ画像部11により生成されたパノラマ画像からテレビ検出を行い、パノラマ画像上のテレビ位置を取得する。
テレビ検出の手段には、例えば、オープンソースのFaster-RCNN等のソフトウェアを利用できるが、検出手法はこれに限られない。
The
As a means for detecting a television, for example, open source software such as Faster-RCNN can be used, but the detection method is not limited to this.
ここで、テレビ位置は、テレビ部分が四角枠で検出され、テレビ検出部14は、四角枠の始点Pstv(xstv,ystv)及び終点Petv(xetv,yetv)から中心点Ptv(xtv,ytv)を算出する。テレビの中心点Ptvは、テレビ位置の距離取得に用いられる。
テレビ検出部14は、テレビを検出した場合にテレビフラグftv=1を、テレビを検出しなかった場合にテレビフラグftv=0を出力する。
Here, the television position is detected by detecting the television portion as a rectangular frame, and the
The
距離取得部15は、検出された視聴者及びテレビの各位置における距離データを距離パノラマ画像から取得する。
具体的には、距離取得部15は、顔検出部132から顔中心点Pfと、テレビ検出部14からテレビ中心点Ptvとを取得し、距離パノラマ画像データベース12Bに格納している距離データのうち、ロボット1から視聴者の顔までの距離dfと、ロボット1からテレビまでの距離dtvとを取得する。
例えば、顔中心点Pfが(1000,200)の場合、距離パノラマ画像における点(1000,200)における距離データldを取得し、df=ldとする。テレビ中心点Ptvが(3000,150)の場合、パノラマ距離画像における点(3000,150)における距離データldを取得し、dtv=ldとする。
The
Specifically, the
For example, when the face center point Pf is (1000, 200), distance data ld at point (1000, 200) in the distance panoramic image is obtained, and df = ld . When the television center point Ptv is (3000, 150), distance data ld at point (3000, 150) in the panoramic distance image is obtained, and dtv = ld .
視聴方向検出部16は、ロボット1から視聴者の顔までの距離、ロボット1からテレビまでの距離、及びロボット1から見た視聴者とテレビとの間の角度を取得することにより、ロボット1、視聴者及びテレビの位置関係を特定し、視聴者の顔方向角度から視聴方向及び視聴画像を取得する。
The viewing
図10は、本実施形態における視聴方向検出部16の機能構成を示す図である。
視聴方向検出部16は、テレビ-視聴者間角度算出部161と、テレビ-視聴者間距離算出部162と、ロボット-テレビ間角度算出部163と、顔方向角度取得部164と、視聴方向角度算出部165と、視聴方向画像取得部166とを備える。
FIG. 10 is a diagram showing the functional configuration of the viewing
The viewing
図11は、本実施形態におけるロボット1、テレビ、視聴者の位置関係を示す図である。
ロボット1(点A)、視聴者(点B)及びテレビ(点C)からなる三角形において、BC=r、AB=r1、AC=r2が固定されている。
また、ロボット1から見た視聴者とテレビとの間の角度(∠BAC)=θr、視聴者から見たロボットとテレビとの間の角度∠ABC=θh、テレビから見たロボット1と視聴者との間の角度∠ACB=θtvが固定されている。
FIG. 11 is a diagram showing the positional relationship between the
In the triangle consisting of robot 1 (point A), viewer (point B) and TV (point C), BC=r, AB=r 1 , and AC=r 2 are fixed.
In addition, the angle between the viewer and the television as seen by the robot 1 (∠BAC) = θr , the angle between the robot and the television as seen by the viewer, ∠ABC = θh , and the angle between the
この位置関係において、視聴者がロボット1から顔方向角度θh’ずれた方向に顔を向けている場合、視聴者は、視聴方向位置(点D)を見ていると仮定する。ここで、AD=AC=r2と仮定する。また、BD=r’である。
このとき、ロボット1から見た視聴者と視聴方向位置との間の角度∠BAD=θr’となる。
In this positional relationship, when the viewer faces in a direction shifted by a facial direction angle θ h ' from the
At this time, the angle between the viewer and the viewing direction position as seen by the
テレビ-視聴者間角度算出部161は、ロボット1から見たテレビと視聴者との間の角度θrを算出する。
図12は、本実施形態におけるテレビ-視聴者間の角度θrの算出方法を説明する図である。
The television-viewer
FIG. 12 is a diagram for explaining a method for calculating the angle θr between the television and the viewer in this embodiment.
まず、テレビ-視聴者間角度算出部161は、顔中心点Pf(xf,yf)及びテレビ中心点Ptv(xtv,ytv)から、パノラマ画像におけるテレビと視聴者との間の画素数d1を次のように算出する。
d1=|xtv-xf|
次に、テレビ-視聴者間角度算出部161は、パノラマ画像のサイズ(Xp,Yp)から、パノラマ画像におけるテレビと視聴者との間の画素数d2を次のように算出する。
d2=|Xp-d1|
First, the television-viewer
d 1 = |x tv −x f |
Next, the television-viewer
d 2 = |X p −d 1 |
そして、テレビ-視聴者間角度算出部161は、テレビと視聴者との間の画素数d1とd2とを比較し、
d=min(d1,d2)
とする。
Then, the television-viewer
d=min(d 1 , d 2 )
Let us assume that.
テレビ-視聴者間角度算出部161は、パノラマ画像におけるx軸のサイズXpをロボット1の周囲の角度360度に換算し、テレビと視聴者との間の画素数dから、ロボット1から見たテレビと視聴者との間の角度θrを次のように算出する。
θr=d×角度a
角度a=360/Xp
The television-viewer
θr = d × angle a
Angle a=360/X p
例えば、パノラマ画像において、x軸のサイズXp=4320、テレビ位置のx軸値xtv=3541、顔位置のx軸値xf=713であったとき、ロボット1から見たテレビと視聴者との間の角度θrは、次のように算出される。
d1=3541-713=2828
d2=4320-2828=1492
d=d2=1492
θr=1492×360/4320≒124度
For example, in a panoramic image, when the x-axis size Xp = 4320, the x-axis value of the television position xtv = 3541, and the x-axis value of the face position xf = 713, the angle θr between the television and the viewer as seen by the
d 1 =3541-713=2828
d2 =4320-2828=1492
d = d2 = 1492
θ r =1492×360/4320≒124 degrees
テレビ-視聴者間距離算出部162は、ロボット1から見たテレビと視聴者との間の角度θr、ロボット1から視聴者までの距離r1=df、ロボット1からテレビまでの距離r2=dtvを用いて、テレビと視聴者との間の距離rを次のように算出する。
r=√(r1
2+r2
2-2r1r2cosθr)
The television-viewer
r=√(r 1 2 + r 2 2 -2r 1 r 2 cosθ r )
ロボット-テレビ間角度算出部163は、ロボット1とテレビとの間の角度θhを、余弦定理を用いて次のように算出する。
r2
2=r2+r1
2-2rr1cosθh
θh=cos-1[(r2+r1
2-r2
2)/(2rr1)]
The robot-television
r 2 2 = r 2 + r 1 2 -2rr 1 cosθ h
θ h =cos −1 [(r 2 +r 1 2 −r 2 2 )/(2rr 1 )]
顔方向角度取得部164は、顔検出部132により検出された顔画像に基づいて、ロボット1から見た視聴者の顔方向角度θh’を推定し、時刻Tと共に取得する。
The face direction
図13は、本実施形態における顔方向角度θh’を説明する図である。
顔方向角度θh’は、視聴者の顔がロボット1に正対している状態(A)を基準とし、(B)のように基準の方向(y軸)から、視聴者の顔が向いている方向(yh軸)までの角度である。
なお、顔方向角度θh’を推定するためには、例えば、オープンソースのOpenFace等のソフトウェアを利用できるが、推定手法はこれに限られない。
FIG. 13 is a diagram illustrating the face direction angle θ h ′ in this embodiment.
The face direction angle θ h ′ is based on the state (A) in which the viewer's face is facing directly at the
In order to estimate the face direction angle θ h ′, for example, open source software such as OpenFace can be used, but the estimation method is not limited to this.
視聴方向角度算出部165は、ロボット1から見た視聴者と、視聴者が見ている先(視聴方向位置)との間の視聴方向角度θr’を、余弦定理を用いて次のように算出する。
r2
2=r’2+r1
2-2r’r1cosθh’
r’2=r1
2+r2
2-2r1r2cosθr’
θr’=cos-1[(r1/r2)-(r’/r2)cosθh’]
ここで、視聴者から視聴方向位置までの距離r’は、例えば、次のように近似して求めることができる。
The viewing direction
r 2 2 = r' 2 + r 1 2 -2r'r 1 cosθ h '
r' 2 = r 1 2 + r 2 2 -2r 1 r 2 cosθ r '
θ r ′=cos −1 [(r 1 /r 2 )−(r′/r 2 )cos θ h ′]
Here, the distance r' from the viewer to the viewing direction position can be calculated, for example, by approximation as follows.
図14は、本実施形態におけるロボット1、視聴者、及び視聴方向位置の位置関係を示す図である。
ここで、ロボット1(点A)は、例えば、視聴者(点B)とテレビとの間のテーブル等に置かれており、視聴方向位置を点Dとしたとき、点Aと線分BDとの距離が十分に近いこととする。
この場合、点Aから線分BDへ下した垂線の足をEとし、BE=r1’,DE=r2’とすると、
r’=|r1
2-r2
2|/|r1’-r2’|
に対して、
r1’≒r1,r2’≒r2
と近似でき、すなわち、
r’=r1+r2
と算出される。
FIG. 14 is a diagram showing the positional relationship between the
Here, the robot 1 (point A) is placed, for example, on a table between the viewer (point B) and the television, and when the viewing direction position is point D, the distance between point A and line segment BD is sufficiently close.
In this case, let E be the foot of the perpendicular line drawn from point A to line segment BD, and let BE = r 1 ', DE = r 2 '.
r'=|r 1 2 - r 2 2 |/|r 1 '-r 2 '|
In contrast,
r 1 '≒ r 1 , r 2 '≒ r 2
can be approximated as follows:
r′=r 1 +r 2
It is calculated as follows.
視聴方向画像取得部166は、視聴方向角度θr’、テレビ-視聴者間角度θr、パノラマ画像におけるテレビ中心点Ptv(xtv,ytv)を用いて、視聴方向位置Pv(xv)を次のように算出し、視聴方向画像を取得する。
xv=xtv-(θr’-θrに相当する画素数)
The viewing direction
x v = x tv - (number of pixels corresponding to θ r '-θ r )
このとき、視聴方向画像取得部166は、例えば、撮像部20の水平画角θcを画角画素数dcに変換し、視聴方向位置Pv(xv)を中心に(xv-(dc/2)、xv+(dc/2))、又は(xv-(dc/2)、xv+(dc/2)-1)等の範囲の画像を取得する。
dc=(Xp/360)×θc
あるいは、視聴方向画像取得部166は、撮像部20による撮像画像のサイズ(画素数)が既知の場合に、この画素数をdcとして用いてもよい。
At this time, the viewing direction
d c = (X p /360) x θ c
Alternatively, if the size (number of pixels) of the image captured by the
図15は、本実施形態における視聴方向画像の取得方法を例示する図である。
例えば、カメラの水平画角θc=40、パノラマ画像のx軸のサイズXp=4320、テレビ中心点のx座標xtv=3800、θr’-θr=0の場合、dc=(4320/360)×40=480、xv=3800-0=3800となるので、視聴方向画像取得部166は、(3800-240、3800+240)=(3560、4040)の範囲の画像を取得する。
また、例えば、θr’-θr=35の場合、dc=(4320/360)×40=480、xv=3800-((4320/360)×35)=3380となるので、視聴方向画像取得部166は、(3380-240、3380+240)=(3140、3620)の範囲の画像を取得する。
FIG. 15 is a diagram illustrating a method for acquiring a viewing direction image in this embodiment.
For example, if the camera's horizontal angle of view θ c = 40, the x-axis size of the panoramic image X p = 4320, the x-coordinate of the television center point x tv = 3800, and θ r ' - θ r = 0, then d c = (4320/360) × 40 = 480, x v = 3800 - 0 = 3800, and the viewing direction
Also, for example, when θr ' - θr = 35, dc = (4320/360) x 40 = 480, xv = 3800 - ((4320/360) x 35) = 3380, so the viewing direction
また、視聴方向画像取得部166は、テレビ中心点Ptvではなく、視聴者の顔中心点Pf(xf,yf)を用いて、次のように視聴方向位置Pv(xv)を算出してもよい。
xv=xf-(θr’に相当する画素数)
Furthermore, the viewing direction
x v = x f - (number of pixels corresponding to θ r ')
視聴状態判定部17は、視聴方向画像を一定時間取得し統計処理することにより、視聴者がテレビを視聴しているか否かといった視聴状態を判定する。
本実施形態では、視聴状態として視聴度を定義する。
視聴度は、テレビ視聴時におけるユーザの視聴度合いの指標であり、値が大きいほどテレビを視聴していること、逆に、値が小さいほどテレビを視聴していないことを示す。
The viewing
In this embodiment, the viewing level is defined as the viewing state.
The viewing intensity is an index of the degree to which a user watches television. A larger value indicates that the user is watching more television, and conversely, a smaller value indicates that the user is not watching television.
図16は、本実施形態における視聴状態判定部17の機能構成を示す図である。
視聴状態判定部17は、視聴方向物体検出部171と、視聴度算出部172とを備え、視聴方向画像が入力されることにより、視聴度Iwを出力する。
FIG. 16 is a diagram showing the functional configuration of the viewing
The viewing
視聴方向物体検出部171は、入力された視聴方向画像から物体検出を行い、キーワードを抽出する。物体検出の手段として、例えば、オープンソースのFaster-RCNN等のソフトウェアを利用できるが、検出手法はこれに限られない。
The viewing direction
視聴度算出部172は、視聴方向物体検出部171で抽出されたキーワードを用いて、視聴者が実際にテレビを視聴している度合いを表す指標として、視聴度Iw(T)を算出する。
The
図17は、本実施形態における視聴度Iw(T)の算出例を示す図である。
時刻Tにおいて、視聴方向物体検出部171により「テレビ」、「テレビジョン」、「モニタ」等の映像視聴デバイスを示す種類のキーワードが抽出された場合、視聴度算出部172は、視聴状態を「テレビ」とする。また、一緒にテレビを視聴している人が検出された場合、視聴度算出部172は、視聴状態を「他者」とする。これら以外の場合の視聴状態は、「その他」と定義される。
FIG. 17 is a diagram showing an example of calculation of the viewer intensity I w (T) in this embodiment.
At time T, when the viewing direction
本実施形態では、一定時間Tfにおいて、検出回数に占める「テレビ」の視聴状態の割合を視聴度Iwとした。図17の例では、視聴度Iw=0.6であり、他者又はその他に視線を移しつつも、テレビに注目していることが分かる。 In this embodiment, the ratio of the "television" viewing state to the number of detections during a certain time Tf is defined as the viewing level Iw . In the example of Fig. 17, the viewing level Iw = 0.6, which shows that the subject is paying attention to the television while shifting his/her gaze to other people or other objects.
この場合、動作制御部40は、例えば、ロボットが視聴者へ話し掛けるための閾値を0.5とし、視聴度Iwが所定以上に高いことから、ロボット1が視聴者へ話し掛ける制御を行ってもよい。
また、例えば、算出した視聴度Iwが0.8等、「テレビ」の視聴状態割合が特に高かったときは、集中してテレビを視聴している可能性が高いため、動作制御部40は、ロボット1が視聴者に話し掛けるのを控えるように制御してもよい。
In this case, the
In addition, when the calculated viewing level Iw is, for example, 0.8, and the viewing state ratio of "television" is particularly high, it is highly likely that the viewer is concentrating on watching television. Therefore, the
逆に、Iwが0.3、すなわちテレビ方向を視聴している時間が10分当たり3分間程度のように、テレビの視聴状態割合が低かったときは、テレビへの関心を抱かせるために、動作制御部40は、ロボット1が視聴者への話し掛けや身振り手振りを用いた動作を行うように制御してもよい。
例えば、視聴者がテレビ方向を見ていないときに、ロボット1が視聴者や周囲を見まわす動作をしながら、「この場所にぜひとも行ってみたい。」、「チャンネルを変えてみますか?」等、テレビへの関与を促す発話をする。
このように、閾値を段階的に設定し、例えば、Iwが高い時は発話のみ、Iwが低い時は発話と共に身振り手振りによる動作を実施する等、動作制御部40は、視聴者毎に適宜ロボット1を制御してよい。
Conversely, when Iw is 0.3, that is, when the ratio of the television viewing state is low, such as when the time spent watching the television direction is about 3 minutes per 10 minutes, the
For example, when the viewer is not looking in the direction of the television, the
In this way, the threshold value may be set in stages, and the
また、視聴状態として、「テレビ」、「他者」、「その他」といった視聴方向を示す複数種類の区分が取得された場合、動作制御部40は、この区分に応じてロボット1の動作を変更してもよい。例えば、テレビ番組の内容に関して、開示、質問、確認、情報、応答等の発話種別それぞれの発話頻度が次のように調整されてもよい。
In addition, when multiple types of classifications indicating the viewing direction, such as "television," "others," and "other," are acquired as the viewing state, the
視聴方向が「テレビ」であることが多い場合、視聴者はテレビを注視している状態と考えられるので、動作制御部40は、視聴者の中止状態を妨げるような、回答を求める質問又は確認の発話頻度を低くする。
視聴方向が「他者」であることが多い場合、視聴者は他者とのコミュニケーションを多く取っている状態と考えられるので、動作制御部40は、他者とのコミュニケーションの邪魔をしないように、全ての発話種別の発話頻度を低くする。
視聴方向が「その他」であることが多い場合、視聴者はテレビを注視していないし、他者とのコミュニケーションも取っていないと考えられるので、動作制御部40は、テレビ視聴への関心を促すため、開示又は質問の発話頻度を高くする。
When the viewing direction is often toward the television, it is assumed that the viewer is watching the television, so the
When the viewing direction is often toward "other people," it is considered that the viewer is in a state of frequent communication with others, so the
When the viewing direction is often "other," it is considered that the viewer is not paying attention to the television and is not communicating with others, so the
本実施形態によれば、視聴状態推定装置10は、ロボット1の周囲全方位のパノラマ画像から視聴者の顔及びテレビを検出し、両者の画像上の距離とパノラマ画像のサイズとから、ロボット1から見たテレビと視聴者との間の角度を算出する。さらに、視聴状態推定装置10は、検出したテレビ及び視聴者のロボット1からの距離を測定することにより、ロボット1、視聴者及びテレビの位置関係を特定する。そして、視聴状態推定装置10は、顔位置の画像から得られる視聴者の顔方向角度に基づいて、パノラマ画像から視聴者の視聴方向角度にある視聴方向画像に含まれる物体を検出し、この物体の種類に基づいて、視聴者の状態を判定する。
According to this embodiment, the viewing
したがって、視聴状態推定装置10は、家庭内の天井等にカメラ等の撮像デバイスを設置することなく、また、視聴者に視線方向取得装置を装着させることなく、卓上等に設置したロボット1において、パノラマ画像に基づいて、視聴方向画像内の物体を検出することで視聴者の視聴状態を推定できる。
この結果、ロボット1は、視聴者がテレビを視聴しているときは話し掛けない配慮をしたり、テレビを視聴していないときはテレビへの関与を促す発話や、身振り手振りの仕草をしたりといった、視聴状態に応じた動作を実現できる。
Therefore, the viewing
As a result, the
視聴状態推定装置10は、視聴者から視聴方向位置までの距離を、ロボット1から視聴者までの距離と、ロボット1から視聴方向位置までの距離との和で近似することにより、容易に視聴方向位置を特定して、視聴状態を推定できる。
The viewing
視聴状態推定装置10は、視聴者の状態の一定時間内における統計情報に基づいて、視聴状態を算出するので、視聴方向位置の算出誤差を低減し、判定される視聴状態の信頼性を向上できる。
The viewing
視聴状態推定装置10は、視聴状態として、テレビを視聴している割合を示す視聴度を算出するので、動作制御部40は、視聴者が実際にテレビを注視している度合いを把握し、この度合いに応じてロボット1の動作を視聴者の状態に適切に合わせることができる。
このとき、動作制御部40は、算出された視聴度を所定の閾値と比較した結果により、容易にロボット1の動作を制御できる。
また、動作制御部40は、複数の閾値に基づいて制御を段階的に変更することにより、ロボット1の動作バリエーションを視聴者の状態に合わせて適切に設定できる。
The viewing
At this time, the
Furthermore, the
視聴状態推定装置10は、視聴状態として、テレビを見ている状態、及び他者を見ている状態含む複数の状態を判定するので、動作制御部40は、視聴者が見ている物体の種類を把握し、この種類に応じてロボット1の動作を視聴者の状態に適切に合わせることができる。
The viewing
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、前述の実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、実施形態に記載されたものに限定されるものではない。 Although the embodiments of the present invention have been described above, the present invention is not limited to the above-described embodiments. Furthermore, the effects described in the above-described embodiments are merely a list of the most favorable effects resulting from the present invention, and the effects of the present invention are not limited to those described in the embodiments.
前述の実施形態では、視聴状態推定装置10は、視聴方向画像の物体検出により視聴者が見ている物体の種類を推定したが、テレビを見ているか否かに関しては、視聴者の顔方向角度に基づいて判定されてもよい。
具体的には、例えば、顔方向角度θh’が、
θh-α<θh’<θh+α
の条件を満たす場合に、視聴者がテレビの方向を向いていると判断してもよい。なお、αは、テレビの大きさ及び視聴者からの距離に基づいて設定される調整角度(例えば、テレビの視角の半分)である。
In the above-described embodiment, the viewing
Specifically, for example, the face direction angle θ h ′ is
θ h −α<θ h '<θ h +α
It may be determined that the viewer is facing the television when the above condition is satisfied. Here, α is an adjustment angle (e.g., half the viewing angle of the television) that is set based on the size of the television and the distance from the viewer.
また、前述の実施形態では、顔方向角度θh’に基づいて視聴方向角度θr’を算出したが、算出方法はこれに限られない。
例えば、θh’が適切に取得できない場合には、
θr’=cos-1[(r1
2+r2
2-r’2)/(2r’r1)]
のように、θh’を用いずにθr’を求めてもよい。
In addition, in the above embodiment, the viewing direction angle θ r ′ is calculated based on the face direction angle θ h ′, but the calculation method is not limited to this.
For example, if θ h ' cannot be obtained properly,
θ r '=cos -1 [(r 1 2 + r 2 2 - r' 2 )/(2r'r 1 )]
As shown above, θ r ' may be calculated without using θ h '.
また、前述の実施形態では、ロボット1から視聴方向位置までの距離をロボット1からテレビまでの距離r2と等しいとしたが、仮定する条件はこれに限られない。
例えば、θh’の正負又は値の範囲等に基づいて、該当の距離にr1を用いたり、r2を用いたり、あるいは他の値を用いたりと、状況に応じて適宜設定されてもよい。
In the above embodiment, the distance from the
For example, depending on the positive/negative or value range of θ h ′, r 1 , r 2 , or another value may be used for the relevant distance, and the value may be set appropriately according to the situation.
本実施形態では、主に視聴状態推定装置10の構成と動作について説明したが、本発明はこれに限られず、各構成要素を備え、視聴状態を推定するための方法、又はプログラムとして構成されてもよい。
In this embodiment, the configuration and operation of the viewing
さらに、視聴状態推定装置10の機能を実現するためのプログラムをコンピュータで読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。
Furthermore, the functions of the viewing
ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータで読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。 The term "computer system" here includes hardware such as the OS and peripheral devices. Additionally, "computer-readable recording media" refers to portable media such as flexible disks, optical magnetic disks, ROMs, and CD-ROMs, as well as storage devices such as hard disks built into computer systems.
さらに「コンピュータで読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時刻の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時刻プログラムを保持しているものも含んでもよい。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。 Furthermore, "computer-readable recording medium" may include something that dynamically holds a program for a short period of time, such as a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line, or something that holds a program for a fixed period of time, such as volatile memory within a computer system that serves as a server or client in such a case. Furthermore, the above program may be one that realizes part of the functions described above, or may be one that can realize the functions described above in combination with a program already recorded in the computer system.
1 ロボット
10 視聴状態推定装置
11 パノラマ画像部
12 距離パノラマ画像部
12A 距離画像データベース
12B 距離パノラマ画像データベース
13 視聴者検出部
14 テレビ検出部
15 距離取得部
16 視聴方向検出部
17 視聴状態判定部
20 撮像部
30 距離検出部
40 動作制御部
121 距離画像合成部
122 重複区間算出部
131 人検出部
132 顔検出部
161 テレビ-視聴者間角度算出部
162 テレビ-視聴者間距離算出部
163 ロボット-テレビ間角度算出部
164 顔方向角度取得部
165 視聴方向角度算出部
166 視聴方向画像取得部
171 視聴方向物体検出部
172 視聴度算出部
LIST OF
Claims (10)
前記パノラマ画像の各画素と対応した距離データを画素値とする距離パノラマ画像を生成する距離パノラマ画像部と、
前記パノラマ画像から、テレビ位置を検出するテレビ検出部と、
前記パノラマ画像から、視聴者の顔位置を検出する視聴者検出部と、
前記距離パノラマ画像から、前記テレビ位置及び前記顔位置における距離をそれぞれ取得する距離取得部と、
前記パノラマ画像のサイズ、前記テレビ位置及び前記顔位置に基づいて、前記ロボットから見たテレビと視聴者との間の角度を算出することにより、前記ロボット、前記視聴者及び前記テレビの位置関係を特定し、前記顔位置の画像から得られる前記視聴者の顔方向角度に基づいて、前記パノラマ画像から前記視聴者の視聴方向角度にある視聴方向画像を取得する視聴方向検出部と、
前記視聴方向画像に含まれる物体を検出し、当該物体の種類に基づいて、前記視聴者の状態を判定する視聴状態判定部と、を備える視聴状態推定装置。 a panoramic image unit for acquiring an omnidirectional panoramic image synthesized from images captured around the robot;
a distance panorama image unit for generating a distance panorama image in which distance data corresponding to each pixel of the panorama image is used as a pixel value;
a television detection unit that detects a television position from the panoramic image;
a viewer detection unit that detects a face position of a viewer from the panoramic image;
a distance acquisition unit that acquires distances at the television position and the face position from the distance panoramic image;
a viewing direction detection unit that specifies a positional relationship between the robot, the viewer, and the television by calculating an angle between the television and the viewer as seen by the robot based on a size of the panoramic image, the television position, and the face position, and obtains a viewing direction image at the viewing direction angle of the viewer from the panoramic image based on a face direction angle of the viewer obtained from the image of the face position;
a viewing state determination unit that detects an object included in the viewing direction image and determines a state of the viewer based on a type of the object.
前記視聴状態推定装置から出力された前記視聴度を、所定の閾値と比較した結果により、前記ロボットの動作を制御する動作制御部と、を備えるロボットシステム。 The viewing state estimating device according to claim 4 ;
a motion control unit that controls the motion of the robot based on a result of comparing the viewing degree output from the viewing state estimation device with a predetermined threshold.
前記視聴状態推定装置から出力された前記複数の状態の区分に応じて、前記ロボットの動作を制御する動作制御部と、を備えるロボットシステム。 The viewing state estimating device according to claim 5 ;
and an operation control unit that controls an operation of the robot in accordance with the classification of the plurality of states output from the viewing state estimation device.
前記パノラマ画像の各画素と対応した距離データを画素値とする距離パノラマ画像を生成する距離パノラマ画像生成ステップと、
前記パノラマ画像から、テレビ位置を検出するテレビ検出ステップと、
前記パノラマ画像から、視聴者の顔位置を検出する視聴者検出ステップと、
前記距離パノラマ画像から、前記テレビ位置及び前記顔位置における距離をそれぞれ取得する距離取得ステップと、
前記パノラマ画像のサイズ、前記テレビ位置及び前記顔位置に基づいて、前記ロボットから見たテレビと視聴者との間の角度を算出することにより、前記ロボット、前記視聴者及び前記テレビの位置関係を特定し、前記顔位置の画像から得られる前記視聴者の顔方向角度に基づいて、前記パノラマ画像から前記視聴者の視聴方向角度にある視聴方向画像を取得する視聴方向検出ステップと、
前記視聴方向画像に含まれる物体を検出し、当該物体の種類に基づいて、前記視聴者の状態を判定する視聴状態判定ステップと、をコンピュータが実行する視聴状態推定方法。 a panoramic image generating step of acquiring an omnidirectional panoramic image synthesized from images captured around the robot;
a distance panoramic image generating step of generating a distance panoramic image in which distance data corresponding to each pixel of the panoramic image is used as a pixel value;
a television detection step of detecting a television position from the panoramic image;
a viewer detection step of detecting a face position of a viewer from the panoramic image;
a distance acquisition step of acquiring distances at the television position and the face position from the distance panoramic image;
a viewing direction detection step of calculating an angle between the television and the viewer as seen by the robot based on the size of the panoramic image, the television position, and the face position, thereby specifying a positional relationship between the robot, the viewer, and the television, and acquiring a viewing direction image at the viewing direction angle of the viewer from the panoramic image based on the face direction angle of the viewer obtained from the image of the face position;
a viewing state determination step of detecting an object included in the viewing direction image and determining a state of the viewer based on a type of the object, the viewing state determination method being executed by a computer.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020162380A JP7596105B2 (en) | 2020-09-28 | 2020-09-28 | Viewing state estimation device, robot system, viewing state estimation method, and viewing state estimation program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020162380A JP7596105B2 (en) | 2020-09-28 | 2020-09-28 | Viewing state estimation device, robot system, viewing state estimation method, and viewing state estimation program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022055029A JP2022055029A (en) | 2022-04-07 |
| JP7596105B2 true JP7596105B2 (en) | 2024-12-09 |
Family
ID=80997772
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020162380A Active JP7596105B2 (en) | 2020-09-28 | 2020-09-28 | Viewing state estimation device, robot system, viewing state estimation method, and viewing state estimation program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7596105B2 (en) |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015082247A (en) | 2013-10-23 | 2015-04-27 | 日本放送協会 | Electronic device, determination method and program |
| JP2016100033A (en) | 2014-11-19 | 2016-05-30 | シャープ株式会社 | Playback control device |
| JP2018005892A (en) | 2016-06-23 | 2018-01-11 | 株式会社ガイア・システム・ソリューション | Engagement value processing system and engagement value processing device |
| JP2018180472A (en) | 2017-04-21 | 2018-11-15 | 日本放送協会 | Control device, control method and control program |
| JP2020119364A (en) | 2019-01-25 | 2020-08-06 | Necパーソナルコンピュータ株式会社 | Interactive robot and its control device |
-
2020
- 2020-09-28 JP JP2020162380A patent/JP7596105B2/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015082247A (en) | 2013-10-23 | 2015-04-27 | 日本放送協会 | Electronic device, determination method and program |
| JP2016100033A (en) | 2014-11-19 | 2016-05-30 | シャープ株式会社 | Playback control device |
| JP2018005892A (en) | 2016-06-23 | 2018-01-11 | 株式会社ガイア・システム・ソリューション | Engagement value processing system and engagement value processing device |
| JP2018180472A (en) | 2017-04-21 | 2018-11-15 | 日本放送協会 | Control device, control method and control program |
| JP2020119364A (en) | 2019-01-25 | 2020-08-06 | Necパーソナルコンピュータ株式会社 | Interactive robot and its control device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022055029A (en) | 2022-04-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20240137461A1 (en) | Eye contact enabling device for video conferencing | |
| US6931596B2 (en) | Automatic positioning of display depending upon the viewer's location | |
| US10182720B2 (en) | System and method for interacting with and analyzing media on a display using eye gaze tracking | |
| US20120133754A1 (en) | Gaze tracking system and method for controlling internet protocol tv at a distance | |
| US9030532B2 (en) | Stereoscopic image display | |
| US9424467B2 (en) | Gaze tracking and recognition with image location | |
| JP3579218B2 (en) | Information display device and information collection device | |
| US20060140420A1 (en) | Eye-based control of directed sound generation | |
| US9495936B1 (en) | Image correction based on projection surface color | |
| KR20140125183A (en) | Eye-glasses which attaches projector and method of controlling thereof | |
| CN107439002A (en) | Depth imaging | |
| US20220036779A1 (en) | Information processing apparatus, information processing method, and recording medium | |
| GB2607573A (en) | Video-conference endpoint | |
| JP2011097447A (en) | Communication system | |
| JP2012175136A (en) | Camera system and control method of the same | |
| WO2018198499A1 (en) | Information processing device, information processing method, and recording medium | |
| JP4934158B2 (en) | Video / audio processing apparatus, video / audio processing method, video / audio processing program | |
| US9329679B1 (en) | Projection system with multi-surface projection screen | |
| JPWO2009119288A1 (en) | Communication system and communication program | |
| US20040057622A1 (en) | Method, apparatus and system for using 360-degree view cameras to identify facial features | |
| JP7596105B2 (en) | Viewing state estimation device, robot system, viewing state estimation method, and viewing state estimation program | |
| US20070013778A1 (en) | Movie antipirating | |
| US12260490B2 (en) | Three-dimensional image processing apparatus, system, and method thereof | |
| JP3954439B2 (en) | Video recording system, program, and recording medium | |
| US12405662B2 (en) | Screen interaction using EOG coordinates |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230828 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240517 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240521 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240712 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20241029 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20241127 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7596105 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |