JP2016200860A - 情報処理装置、情報処理装置の制御方法、およびプログラム - Google Patents

情報処理装置、情報処理装置の制御方法、およびプログラム Download PDF

Info

Publication number
JP2016200860A
JP2016200860A JP2015078384A JP2015078384A JP2016200860A JP 2016200860 A JP2016200860 A JP 2016200860A JP 2015078384 A JP2015078384 A JP 2015078384A JP 2015078384 A JP2015078384 A JP 2015078384A JP 2016200860 A JP2016200860 A JP 2016200860A
Authority
JP
Japan
Prior art keywords
annotation
area
handwritten
display
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015078384A
Other languages
English (en)
Other versions
JP2016200860A5 (ja
Inventor
佑治 名屋
Yuji Naya
佑治 名屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2015078384A priority Critical patent/JP2016200860A/ja
Priority to US15/091,115 priority patent/US20160300321A1/en
Publication of JP2016200860A publication Critical patent/JP2016200860A/ja
Publication of JP2016200860A5 publication Critical patent/JP2016200860A5/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/03Arrangements for converting the position or the displacement of a member into a coded form
    • G06F3/033Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor
    • G06F3/0354Pointing devices displaced or positioned by the user, e.g. mice, trackballs, pens or joysticks; Accessories therefor with detection of two-dimensional [2D] relative movements between the device, or an operating part thereof, and a plane or surface, e.g. 2D mice, trackballs, pens or pucks
    • G06F3/03547Touch pads, in which fingers can move on a surface
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04842Selection of displayed objects or displayed text elements
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/169Annotation, e.g. comment data or footnotes
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/171Editing, e.g. inserting or deleting by use of digital ink

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Processing Or Creating Images (AREA)

Abstract

【課題】画像データにユーザが手書きアノテーションを入力した場合、手書きアノテーションに基づいて画像の表示を動的に変更して表示する情報処理装置を提供する。【解決手段】複数のオブジェクトを含む画像を画面に表示する表示手段と、オブジェクトを属性ごとに分割したブロックの情報を示すブロック情報を生成する生成手段と、画像上に手書きしたアノテーションの筆跡を認識する入力手段と、筆跡に基づいて、アノテーションの種別を検出する検出手段と、ブロック情報と筆跡との関係に基づいて着目する部分領域を推定し、アノテーションの種別に応じて、部分領域の表現を動的に変更して表示する表示変更手段とを有する。【選択図】図3

Description

本発明は、情報処理装置、情報処理装置の制御方法、およびプログラムに関する。
近年、文書をデジタル化して画像データにしたものを画像表示装置(例えば、スマートフォンやタブレット型PC)で閲覧する機会が増加している。また、画像表示装置で閲覧中の画像データを、プロジェクタでスクリーンに投影(又は、大型ディスプレイなどに表示)し、複数人で閲覧共有する機会が増加している。そして、特許文献1では、文書の画像データを表示する際に、画像データに含まれるオブジェクトを認識した上で、各オブジェクトの大きさに応じて個別に拡大して表示する方法が開示されている。これにより、ユーザは、デジタル化された文書に含まれる各オブジェクトの内容を、手動による倍率操作などを必要とせず、自動的に見やすく拡大して閲覧することができる。
また、特許文献2では、文書データを画面に表示し、スタイラス等のデジタイザを用いて手書き情報(電子インク)を書き込み可能な装置において、文書データの削除・移動などの変更に合わせて、手書き情報の位置を動的に変更する方法が開示されている。これにより、文書データを変更しても手書き情報の位置がずれないので、効率よく文書データを変更することができる。さらに、特許文献3では、文書データに手書き入力された注釈のそれぞれの価値を判断し、該文書データの各ページの縮小画像を表示する際に、高価値の注釈が記載されているページの縮小画像にアイコン等を付加して表示する技術が開示されている。なお、以下の説明では、手書き情報(電子インク、デジタルインク)のことを、手書きアノテーションと呼ぶ。
特開2010−61623号公報 特開2010−205290号公報 特開2004−110825号公報
しかしながら、特許文献1では画像データにユーザが手書きアノテーションを入力することを想定しておらず、手書きアノテーションに基づいて画像の表示を動的に変更して表示する方法について言及されていない。また、特許文献2では、画像の表示中に、その画像上に加えられる手書きアノテーションから説明者の意図をくみ取り、その意図に合わせた表現によって画像の部分領域の表現を動的に変更して表示することはできない。また、特許文献3では、画像の縮小表示時に手書き入力された注釈を強調して表示することはできるが、画像の表示中に、画像の部分領域の表現を動的に変更して表示することはできない。
本発明は、上記課題を鑑みてなされたものであり、画像データにユーザが手書きアノテーションを入力した場合、手書きアノテーションに基づいて画像の表示を動的に変更して表示する情報処理装置を提供することを目的とする。
複数のオブジェクトを含む画像を画面に表示する表示手段と、前記オブジェクトを属性ごとに分割したブロックの情報を示すブロック情報を生成する生成手段と、前記画像上に手書きしたアノテーションの筆跡を認識する入力手段と、前記筆跡に基づいて、前記アノテーションの種別を検出する検出手段と、前記ブロック情報と前記筆跡との関係に基づいて着目する部分領域を推定し、前記アノテーションの種別に応じて、前記部分領域の表現を動的に変更して表示する表示変更手段とを有することを特徴とする。
本発明の情報処理装置によれば、説明者により画像上に手書きアノテーションが加えられた場合、手書きアノテーションに基づいて説明者の意図をくみ取り、その意図に合わせた表現によって画像の部分領域の表現を動的に変更して表示することができる。
画像表示装置を使用してプレゼンテーションを行う場合の概略図である。 画像表示装置のハードウェアブロック図である。 画像表示装置のソフトウェアブロック図である。 画像表示装置のタッチUIの画面表示例を示す図である。 オブジェクト分割した結果の一例を示す図である。 各属性のブロック情報および入力ファイル情報を示す表である。 手書きアノテーションの一例を示す図である。 アプリケーション画像データを再生する際のフローチャートである。 手書きアノテーションを書き込む際のフローチャートである。 生成された手書きアノテーションの属性情報の一例を示す表である。 手書きアノテーション表現変更処理のフローチャートである。 手書きアノテーションを書き込んだときの表示例を示す図である。 手書きアノテーションを書き込んだときの表示例を示す図である。 囲み線のアノテーション表現変更処理のフローチャートである。 囲み線のアノテーションを書き込んだときの表示例を示す図である。 リアルタイムに表示を変更する処理のフローチャートである。 リアルタイムに表示を変更する場合の表示例を示す図である。
以下、本発明を実施するための形態について図面などを参照して説明する。
(第1実施形態)
図1は、本実施形態に係る画像表示装置100を用いてプレゼンテーションを行う際のイメージ図である。本実施形態では、オフィス内の会議室でプレゼンテーションを行うことを想定する。画像表示装置100は、スマートフォンやタブレット型PCなどの携帯情報端末などの情報処理装置であってよい。説明者は、画像表示装置100のアプリケーションを操作することによって、所定のフォーマットのデータ(以下ではアプリケーション画像データと呼ぶ)を表示する。アプリケーションの操作方法については後述するため、ここでの詳細な説明を割愛する。画像表示装置100で表示しているアプリケーション画像データは、RGB((赤(RED)、緑(GREEN)、青(BLUE))信号としてプロジェクタに出力される。具体的には、プロジェクタと画像表示装置100はRGBケーブルによって接続され、画像表示装置100から出力されたRGB信号は、RGBケーブルを介してプロジェクタに入力される。プロジェクタは、入力されたRGB信号をスクリーンに投影する。
本実施形態では、画像表示装置100で表示しているアプリケーション画像データと同じアプリケーション画像データがスクリーンに映し出される。従って、視聴者はスクリーンを見ることで、画像表示装置100に表示されているアプリケーション画像データを複数人で共有して閲覧することができる。ただし、説明者用および視聴者用の2つのアプリケーション画像データを表示するように、画像表示装置100およびプロジェクタからスクリーンに投影するアプリケーション画像データをそれぞれ別に生成出力するようにしてもよい。
なお、本実施形態では、視聴者はスクリーンを通してアプリケーション画像データを閲覧するとしているが、画像表示装置100に内包されるディスプレイを通して閲覧してもよい。また、本実施形態では入力手段としてタッチパネルを内包する画像表示装置100を想定している。しかしながら、画像表示装置100の操作およびアプリケーション画像データへアノテーション書き込みとアノテーションの認識が可能であれば、タッチパネルに限定せず他の入力手段であってもよい。
図2は、本実施形態に係る画像表示装置100のハードウェア構成を示すブロック図である。画像表示装置100は、メインボード200、LCD201、タッチパネル202、ボタンデバイス203から構成される。また、本実施形態では、LCD201とタッチパネル202をまとめてタッチUI204とする。メインボード200の構成要素は、CPU205、無線LANモジュール206、電源コントローラ207、ディスプレイコントローラ(DISPC)208を含む。また、パネルコントローラ(PANELC)209、ROM210、RAM211、二次電池212、タイマ213、RGB出力コントローラ214を含む。なお、それぞれの構成要素は、バス(不図示)によって接続されている。
CPU(Central Processing Unit)205は、バスに接続される各デバイスを制御し、ROM(Read Only Memory)210に記憶されたソフトウェアモジュール300を、RAM211に展開して実行する。RAM(Random Access Memory)211は、CPU205のメインメモリ、ワークエリア、LCD201に表示するビデオイメージ用エリア、およびアプリケーション画像データの保存領域として機能する。
ディスプレイコントローラ(DISPC)208は、CPU205の要求に応じて、RAM211に展開されたビデオイメージ出力を高速に切り替えるとともに、LCD201に同期信号を出力する。その結果として、RAM211のビデオイメージが、DISPC208の同期信号に同期してLCD201に出力され、LCD201上にイメージが表示される。
パネルコントローラ(PANELC)209は、CPU205の要求に応じて、タッチパネル202およびボタンデバイス203を制御する。これにより、タッチパネル202上の指又はスタイラスペンなどの指示物の押下位置や、ボタンデバイス203上の押下されたキーコードなどが、CPU205に通知される。押下位置情報は、タッチパネル202の横方向の絶対位置を示す座標値(以下x座標)と、縦方向の絶対位置を示す座標値(以下y座標)から成る。タッチパネル202は、ユーザの操作を認識し、複数ポイントの押下を検知することが可能で、その場合CPU205には押下点数分の押下位置情報が通知される。
電源コントローラ207は、外部電源(不図示)と接続され、電力の供給を受ける。これにより、電源コントローラ207に接続された二次電池212を充電しながら、画像表示装置100全体に電力を供給する。外部電源から電力が供給されないときは、二次電池212からの電力を画像表示装置100全体に供給する。
無線LANモジュール206は、CPU205の制御に基づいて、オフィス(施設など)内に構築されたLAN(不図示)に接続された無線アクセスポイント(不図示)上の無線LANモジュールとの無線通信を確立し、画像表示装置100との通信を仲介する。無線LANモジュール206は、例えばIEEE802.11bなどであってよい。
タイマ213は、CPU205の制御に基づいて、ジェスチャイベント発生部301へのタイマ割込を発生させる。また、画像表示装置100には地磁気センサ(不図示)や加速度センサ(不図示)を備え、それぞれバスに接続されている。タイマ213は、CPU205の制御に基づいて、画像表示装置100の傾きを検知し、画像表示装置100が所定以上の傾きを得ると、画像表示装置100の向きを変更し、描画部303にLCD201への描画の指示を送る。CPU205は、前記画像表示装置100の向きが変更されると、LCD201の幅および高さを入れ替えて、以降の処理を行う。
すなわち、RGB出力コントローラ214は、RAM211に展開されたビデオイメージ出力を高速に切り替えるとともに、プロジェクタなどの外部表示装置へRGBビデオイメージ信号を転送する。結果として、RAM211のビデオイメージが、プロジェクタなどの外部表示装置に出力され、プロジェクタの投影しているスクリーン上にLCD201と同じイメージが表示される。
次に、図3、図4および図6を用いて、本実施形態に係る画像表示装置100のアプリケーション画像データの操作制御に関わるソフトウェアモジュールについて説明する。図3は、画像表示装置100のCPU205で実行処理されるソフトウェアモジュール300の構成を示すブロック図である。また、図4は、本実施形態に係る画像表示装置100のタッチUI204の画面表示例である。そして、図6は、手書きアノテーション種別の一例を示す表である。
まず、ソフトウェアモジュール300を構成する各モジュールについて説明する。ジェスチャイベント発生部301は、ユーザのタッチ入力を受けて、各種ジェスチャイベントを発生させ、発生したジェスチャイベントを、ジェスチャイベント処理部302へ送信する。なお、各種ジェスチャイベントとは、タッチ押下イベント、タッチ解除イベント、シングルタップイベント、ダブルタップイベント、スワイプイベント、ピンチインイベント、ピンチアウトイベントなどのジェスチャイベントのことである。ここで、各種ジェスチャイベントについて説明する。
タッチ押下イベントは、最新のタッチ座標の座標値とタッチ座標数がジェスチャイベント処理部302へ送信される。なお、タッチ座標とは、タッチパネル202にユーザの指が触れている1点の座標のことで、x座標とy座標で表される1組の座標値を有する。また、タッチ座標数とは、タッチパネル202にユーザの指が接触したタッチ座標の数を示している。なお、タッチ座標は、タッチパネル202へユーザの指が触れたとき、指が移動したとき、指が離れたとき、タイマ213からの割り込みが発生したときに更新される。
タッチ解除イベントは、タッチパネル202からユーザの指が離れたときの最新のタッチ座標の座標値、及び、座標数がジェスチャイベント処理部302へ送信される。シングルタップイベントは、最新のタッチ座標の座標値がジェスチャイベント処理部302へ送信される。シングルタップとは、前述のタッチ押下イベントの後、所定の時間内にタッチ解除イベントが発生したことを言う。ダブルタップイベントは、最新のタッチ座標の座標値がジェスチャイベント処理部302へ送信される。ダブルタップとは、所定の時間内に前述のシングルタップイベントが2回発生したことを示す。
次に、スワイプイベントは、最新のタッチ座標の座標値と、最新と直前の座標値の差分から計算した移動距離が送信される。スワイプとは、指先をタッチパネル202に接触させたまま、1方向への移動(滑らすような)動作である。ピンチインイベントは、最新の2点のタッチ座標の中心座標値および2点のタッチ座標を結ぶ直線の縮小距離から計算したピンチインの縮小率が送信される。ピンチインとは、2つの指先をタッチパネル202に接触させたまま、互いに近づける(つまむような)動作である。ピンチアウトイベントは、最新の2点のタッチ座標の中心座標値および2点のタッチ座標を結ぶ直線の拡大距離から計算したピンチアウトの拡大率が送信される。ピンチアウトとは、2つの指先をタッチパネル202に接触させたまま、互いに遠ざける(指を広げるような)動作である。なお、前述のジェスチャイベント発生の仕組みは公知の技術であるため、これ以上の詳細な説明は割愛する。
ジェスチャイベント処理部302は、ジェスチャイベント発生部301で発生したジェスチャイベントを受信して、各ジェスチャイベントと、前記アプリケーション画像データに記述された文書構造に応じた操作制御を実行する。描画部303は、ジェスチャイベント処理部302の実行結果に応じて、前記アプリケーション画像データをLCD201へ描画する。アプリケーション画像データの表示の方法については後述する。
シングルタップイベント処理部304は、シングルタップイベントを受信すると、シングルタップイベントのタッチ座標の座標値が、図4に示すモード切替ボタン401、描くボタン402の何れかの上にあるかを判定する。そして、シングルタップイベントのタッチ座標がモード切替ボタン401上である場合は、後述するモード切替処理を行う。また、前記タッチ座標が描くボタン402上である場合は、後述するアノテーション処理を行う。アノテーション処理は、アノテーション処理部305において行われる。
アノテーション処理部305は、シングルタップイベント処理部304で描くボタン402がシングルタップされた場合に、図4に示すページ400上のタッチ押下イベント及びタッチ解除イベントを受信する。そして、各イベントの座標データ(すなわち説明者の筆跡)に基づいて、手書きアノテーションに関わる処理を行う。
アノテーション検出部306は、タッチ押下イベント及びタッチ解除イベントの各座標データ(説明者の筆跡)に基づいて、手書きアノテーションの種別を検出する。具体的には、手書きアノテーションの種別には、文字列、下線、取り消し線、及び囲み線がある。ただし、手書きアノテーションの種別はこれらに限られるものではなく、矢印や引き出し線なども検出できる。
そして、手書きアノテーション種別の検出は、手書きアノテーションの座標データに基づいて、その形状を判定することにより行われる。具体的には、囲み線であれば手書きアノテーションが一画であるか否かを判定する。そして、一画であればその手書きアノテーションの座標値の始点と終点の距離を計算し、その距離が手書きアノテーションのストローク全長と比較して小さい場合、閉ループ(囲み線)であると判定される。また、閉ループと判定されなかった場合には、認識された筆跡が直線であるかを公知の直線回帰問題を解くことにより判定することができる。さらに直線の傾きの絶対値が一定値以下であるか否かを求めることにより、直線が横線であるか否かを判定することができる。
そして、横線と判定された場合には、横線の近傍上部あるいは近傍中部に文字列オブジェクト(着目する部分領域)があるか否かを判定する。横線の近傍上部に文字列オブジェクトがある場合、手書きアノテーションは前記文字列オブジェクトに対する下線であると判定される。そして、横線の近傍中部文字列オブジェクトがある場合は、手書きアノテーションは前記文字列オブジェクトに対する取り消し線であると判定される。横線の近傍上部あるいは近傍中部に文字列オブジェクトがあるか否かは、後述するアプリケーション画像データ生成の際に検出される文字列オブジェクトの位置情報から求めることができる。
すなわち、文字列オブジェクトの座標データ及び大きさと、横線の座標データを比較し、横線の座標データが文字列オブジェクトの下部よりすべて下にある場合、下線であると判定する。また、横線の座標データが文字列オブジェクトの中部座標データの上下所定値以内に収まっている場合、取り消し線であると判定する。なお、手書きアノテーションの種別を検出する方法は、公知の技術(特開2014−102669)であるため、これ以上の詳細な説明を割愛する。
ここで、図7について説明する。図7は手書きアノテーション種別の一例を示す図である。図7は、TEXTというアプリケーション画像データ上の文字列オブジェクトに対して各手書きアノテーションが付けられており、図7(A)は下線、図7(B)は取り消し線、図7(C)は囲み線を示している。これらは、前述の手書きアノテーション種別の検出によって分類される。
ここで、図3の説明に戻る。アノテーション表示制御部307は、タッチ押下イベント及びタッチ解除イベントの各座標値(説明者の筆跡)に基づいた手書きアノテーションの描画処理およびアノテーション検出部306で検出された手書きアノテーションの種別に応じた表示変更処理を行う。詳細は後述するため、ここでの説明は割愛する。アノテーション生成部308は、タッチ押下イベント及びタッチ解除イベントの各イベントの座標値(説明者の筆跡)およびアノテーション検出部306で検出された手書きアノテーションの種別に基づいてアノテーションオブジェクトを生成する。
スワイプイベント処理部309は、スワイプイベントに対する処理を行う。ジェスチャイベント処理部302がスワイプイベントを受信すると、スワイプイベントの移動距離に応じて、タッチUI204上の座標において、ページ400の始点を移動させる。そして、その上でタッチUI204の表示状態を更新する。拡大・縮小イベント処理部310は、ピンチインイベントと、ピンチアウトイベントに対する処理を行う。ジェスチャイベント処理部302は、ピンチインイベントやピンチアウトイベントを受信すると、前述の二つのイベントの縮小率もしくは拡大率に応じてページ400のページ始点および表示倍率を制御した後、タッチUI204の表示状態を更新する。
次に、画像表示装置100で表示するための所定のフォーマットのデータであるアプリケーション画像データの生成方法について説明する。アプリケーション画像データは、複数種類の機能(複写機能、印刷機能、送信機能等)を実現する複合機であるMFP(不図示)の画像読み取り部により取得される。または、クライントPC(不図示)上においてアプリケーションソフトで作成されたドキュメントをMFP内部でレンダリングして生成される。MFPおよびクライアントPCは、オフィス(施設など)内に構築されたLAN(不図示)に接続され、互いにデータを送受信することができる。
まず、MFPの画像読み取り部で取得された、または、クライアントPC上のアプリケーションで作成されたビットマップ画像データを属性毎のオブジェクトに分割するオブジェクト分割処理を行う。オブジェクト分割後のオブジェクトの属性種類は、文字、写真、グラフィック(図面、線画、表、ライン)を指す。分割された各々のオブジェクトに対して、オブジェクトの種類(文字、写真、グラフィック)を判定する。
次に、該オブジェクトが文字であるか判定し、文字の場合には、更にOCR処理を施し、文字コード化されたデータ(OCR結果の文字コードデータ)を取得する。なお、OCRは公知の技術であるため、詳細な説明は割愛する。分割した各々のオブジェクトに対して、オブジェクトの位置情報を用いてビットマップ画像データから該オブジェクトの領域を切り出し、オブジェクト画像を生成する。オブジェクト画像は、データ量を抑えつつ好適な画質を維持するよう、オブジェクトの属性種類に応じた解像度変換が行われる。
次に、ビットマップ画像データを解像度変換して、ビットマップ画像データよりも解像度の低い背景画像を生成する。本実施形態では、ニアレストネイバー法を用いて1/4の解像度、すなわち、ビットマップ画像データが600dpiである場合に、150dpiの背景画像を生成する。
なお、解像度変換の方法は、ニアレストネイバー法に限るものではなく、例えば、バイリニア法やバイキュービック法といった高精度な補間方法を用いてもよい。そして、生成されたビットマップ画像データよりも解像度の低い背景画像を用いて、JPEG圧縮した背景画像を生成する。後述する文書構造ツリーを元に各オブジェクトのデータと、背景画像のデータと、文字コードデータを取得し、画像表示装置100が表示可能なアプリケーション画像データを生成する。なお、アプリケーション画像データの生成方法は公知の技術(特開2013−190870)であるため、これ以上の詳細な説明を割愛する。
図5と図6を用いて、オブジェクト分割について、詳細に説明する。図5は、オブジェクト分割処理によって、ビットマップ画像データを複数のオブジェクトに分割した結果の一例を示す図である。図6は、オブジェクト分割したときの各オブジェクトのブロック情報および入力ファイル情報を示す表である。
まず、入力画像(図5の左側)に対してオブジェクト分割処理を行うことにより、属性ごとに矩形ブロックに分割する(図5の右側)。前述のように、矩形ブロックの属性としては、文字、写真、グラフィック(図面、線画、表、ライン)等がある。オブジェクト分割処理の一手法としては、例えば、以下のような手法がある。
まず、MFP内のRAM(不図示)に格納されたイメージデータを白黒に2値化し、黒画素輪郭で囲まれる画素塊を抽出する。そして、黒画素塊の大きさを評価し、大きさが所定値以上の黒画素塊の内部にある白画素塊に対する輪郭追跡を行う。白画素塊に対する大きさ評価、内部黒画素塊の追跡というように、内部の画素塊が所定値以上である限り、再帰的に内部画素塊の抽出、輪郭追跡を行う。画素塊の大きさは、例えば、画素塊の面積によって評価される。このようにして得られた画素塊に外接する矩形ブロックを生成し、矩形ブロックの大きさ、形状に基づき属性を判定する。
例えば、縦横比が1に近く、大きさが一定の範囲の矩形ブロックは文字領域矩形ブロックの可能性がある文字相当ブロックとする。また、近接する文字相当ブロックが規則正しく整列しているときに、これら文字相当ブロックを纏めた新たな矩形ブロックを生成し、新たな矩形ブロックを文字領域矩形ブロックとする。また扁平な画素塊、もしくは、一定大きさ以上でかつ四角形の白画素塊を整列よく内包する黒画素塊をグラフィック領域矩形ブロック、それ以外の不定形の画素塊を写真領域矩形ブロックとする。
以上のように生成された矩形ブロックのそれぞれについて、図6に示す、属性等のブロック情報および入力ファイル情報を生成する。図6において、ブロック情報には、各ブロックの属性、位置の座標X、座標Y、幅W、高さH、OCR情報が含まれる。属性は1〜3の数値で与えられる。本実施形態では、1は文字領域矩形ブロック、2は写真領域矩形ブロック、3はグラフィック領域矩形ブロックを示す。
座標X、座標Yは入力画像における各矩形ブロックの始点のX、Y座標(左上角の座標)である。幅W、高さHは矩形ブロックのX座標方向の幅、Y座標方向の高さである。OCR情報は、OCR処理で文字コード化されたデータへのポインタ情報の有無を示す。さらに、入力ファイル情報として矩形ブロックの個数を示すブロック総数Nも保存される。
これらの矩形ブロックごとのブロック情報は、アプリケーション画像データ生成に利用される。またブロック情報によって、特定領域とその他の領域を重ねる際の相対位置関係を特定でき、入力画像のレイアウトを損なわずに各領域を重ねることが可能となる。なお、オブジェクト分割の方法は公知の技術(特開2013−190870)であるため、これ以上の詳細な説明を割愛する。
次に、図4および図8を用いて、本実施形態における画像表示装置100の前記アプリケーション画像データ再生時の処理について説明する。図8は、画像表示装置100がアプリケーション画像データを再生する際のフローチャートである。まず、ステップS801において、画像表示装置100は、無線LANモジュール206を介してMFPから前記アプリケーション画像データを受信すると、RAM211に受信したアプリケーション画像データを保存する。
次に、ステップS802において、RAM211に保存したアプリケーション画像データの構文を解析し、先頭ページを読み込む。次に、ステップS803において、描画部303は読み込んだ先頭ページに含まれる背景を、領域情報の始点の座標と幅、高さに応じてレンダリングしてタッチUI204の表示状態を更新する。このとき、先頭ページは、図4のページ400に示すように、ページ400の高さがタッチUI204の高さに、または、ページ400の幅がタッチUI204の幅に合うように表示倍率が制御される。また、前記表示倍率に縮小したときのページの幅、もしくは高さがタッチUI204よりも小さい場合は、タッチUI204の中央に表示されるように、タッチUI204上の座標において、ページ400の始点が制御される。
次に、図9、図10、図12および図13を用いて、アノテーション書き込み時の動作について説明する。図9は、アノテーションを書き込む時のフローチャートである。図10は、本実施形態における手書きアノテーション属性情報の一例を示す表である。図12、図13は、本実施形態においてアプリケーション画像データの表示中に、手書きアノテーションを書き込んだときに画像中の部分領域の表現を動的に変更表示する例を示す図である。なお、図9のステップS901〜ステップS914はソフトウェアモジュール300により実行処理される。
まず、ステップS901において、タッチUI204上の描くボタン402がシングルタップされたか否かを判定する。描くボタン402がタップされた場合は(YES)、ステップS902へ進む。一方、描くボタン402がタップされていない場合は(NO)、処理を終了する。次に、ステップS902において、アノテーション書き込みモードへ移行する。アノテーション書き込みモード時には、ページ400上へのジェスチャ操作を全て手書きアノテーションの書き込みと判定する。
また、アノテーション書き込みモードでないときは、ページ400上への手書きアノテーション書き込みを行うことはできず、スワイプイベントやピンチアウトイベントなどを受信する。アノテーション書き込みモードへの移行およびアノテーション書き込みモードの終了は、描くボタン402のシングルタップにより行うことができる。
次に、ステップS903は、モード分岐である。通常モードのときはステップS904へ、アノテーション表現変更モードのときはステップS908へ処理を進める。ここで、通常モードとは、アノテーションにより画像の部分領域の表現を動的に変更しないモードのことを示す。すなわち、ユーザがページ400上に指で触れた際の軌跡が、ページ400上に筆跡として、そのまま変更せずに残るモードである。具体的には、図12及び図13に示すアノテーション1206、1207、1301、1302が、ページ400上に指で触れた際の筆跡として残された手書きアノテーションの一例である。
筆跡の太さや色は、予めユーザが設定しておくことにより自由に選ぶことができる。一方、アノテーション表現変更モードとは、画像上に加えられる手書きアノテーション及びオブジェクトの属性から説明者の意図を汲み取り、その意図に合わせた表現になるよう画像の部分領域の表現を動的に変更するモードのことである。アノテーション表現変更モードの詳細は後述するため、ここでの説明は割愛する。なお、通常モードとアノテーション表現変更モードは、タッチUI204上のモード切替ボタン401をシングルタップすることにより、任意のタイミングで交互に切り替えることができる。
次に、ステップS904において、ページ400上へのユーザのタッチを検出する。タッチを検出した場合は(YES)、ステップS905へ処理を進める。一方、タッチを検出していない場合は(NO)、ステップS906へ処理を進める。そして、ステップS905において、アノテーション表示制御部307によりタッチUI204のタッチされた箇所に対し、描画処理を行う。尚、タッチUI204上へのタッチを検出し、タッチ箇所に対してLCD201へ描画処理を行う技術は公知の技術であるため詳細な説明は割愛する。
次に、ステップS906において、タッチUI204上の描くボタン402が再度シングルタップされたか否かを検出する。描くボタン402がシングルタップされた場合は(YES)、ステップS907へ処理を進める。一方、描くボタン402がタップされていない場合は(NO)、ステップS903へ戻る。そして、ステップS907において、アノテーション生成部308によってアノテーションオブジェクトを生成する。例えば、図12(B)の1206がアノテーションオブジェクトの一例を示す。また、アノテーションオブジェクトは図10に示すような属性情報を有する。
ここで、図10に示すアノテーション属性情報について説明する。アノテーションオブジェクトの領域は、書き込まれたアノテーションの座標データの上下両端と左右両端に接する矩形で表され、図10に示す座標X、座標Yは、該矩形の左上端の位置を示す。また、幅W、高さHは、それぞれアノテーションオブジェクトを表す矩形のX軸方向の長さと、Y軸方向の長さを表す。図10に示すアノテーション種別は、アノテーション表現変更モード時において、ステップS910で検出された手書きアノテーション種別を表す。なお、ステップS907においては、アノテーション検出処理を行っていないため、アノテーション種別は空となる。
また、図10に示すアノテーションID01、02、03、04は、それぞれ図12,図13に示すアノテーション1206、1207、1301、1302に対応する。なお、アノテーションオブジェクトは、図5、図6で説明したアプリケーション画像データに含まれるオブジェクトとは異なり、アプリケーション画像データのレイヤに重なる別のレイヤに表示している手書きアノテーションのことを言う。以後、簡単のため、単に手書きアノテーション又はアノテーションと呼ぶ場合はアノテーションオブジェクトのことを指し、オブジェクトと呼ぶ場合はアプリケーション画像データに含まれるオブジェクトのことを指すこととする。
ここで、図9の説明に戻る。ステップS908において、アノテーション表現変更モード時のページ400上へのユーザのタッチを検出する。タッチを検出した場合は(YES)、ステップS909へ処理を進める。一方、タッチを検出していない場合は(NO)、ステップS911へ処理を進める。そして、ステップS909では、ステップS905と同様にしてタッチUI204上のタッチされた箇所に対し、描画処理を行う。ステップS910において、アノテーション検出部305によって手書きアノテーションの検出処理を行う。具体的な検出処理については、前述のアノテーション検出部305で説明したため、ここでの説明を割愛する。なお、検出された結果は後述のステップS912のアノテーションオブジェクト生成時に利用される。
次に、ステップS911において、タッチUI204上の描くボタン402が再度シングルタップされたか否かを検出する。描くボタン402がシングルタップされた場合は(YES)、ステップS912へ処理を進める。一方、描くボタン402がシングルタップされていない場合は、ステップS903へ戻る。そして、ステップS912では、ステップS907と同様にしてアノテーション生成部308によりアノテーションオブジェクトを生成する。また、ステップS912においては、ステップS907の処理に加えて、ステップS910のアノテーション検出処理の結果を加えてアノテーション属性情報を生成する。
次に、ステップS913において、アノテーション表現変更処理を行う。アノテーション表現変更処理は、ページ400上のオブジェクトの属性情報(図6の属性)及びアノテーションの属性情報(図10の属性)に応じて行われる。詳細は図11のフローチャートで説明するため、ここでの説明を割愛する。そして、ステップS914において、アノテーション書き込みモードを終了し、本処理を終了する。
次に、図10、図11、図12および図13を用いて、アノテーション表現変更処理について説明する。図11は、図9に示すステップS913のアノテーション表現変更処理の詳細を説明するフローチャートである。図11に示すステップS1101〜S1107はアノテーション表示制御部307によって実行処理される。
まず、図11に示すステップS1101において、図10に示される手書きアノテーションの属性情報に基づいて、手書きアノテーションの種別が表現変更対象か否かを判定する。具体的には、手書きアノテーションの種別が下線、取り消し線、囲み線のいずれかであれば表現変更対象であり、それ以外は表現変更対象外となる。そして、手書きアノテーションの種別が表現変更対象である場合(YES)、ステップS1102へ処理を進める。一方、手書きアノテーションの種別が表現変更対象でない場合は(NO)、本処理を終了する。
次に、ステップS1102は、手書きアノテーション種別による分岐である。図10に示す手書きアノテーションの種別が下線であればステップS1103へ、取り消し線であればステップS1104へ、囲み線であればステップS1105へ処理を進める。そして、ステップS1103においては、ステップS910で検出した下線に対応する文字をハイライト表示する。
具体的には、元々の手書き入力のアノテーションを消去し、対応する文字領域の背景色を有彩色に変えることにより、文字領域をより目立たせるように表示する。例えば、図12(D)に示す部分領域1208は、図12(B)に示す手書き入力である下線の手書きアノテーション1206をハイライト表示した例を示す。つまり、図12(B)に示す手書きアノテーション1206の下線は、アノテーション検出処理によって“Point3”と書かれた文字列に対する下線であると判定されるため、“Point3”をハイライトして表示する。
ここで、下線に対応する文字列をハイライト表示する理由について説明する。一般的に、資料上のある文字列に対する下線のような手書きのアノテーションが加えられた場合、その文字列を強調したい、目立たせたいというのが説明者の意図である。従って、その文字列の領域と加えられた手書きアノテーションとの位置関係に基づいて、その文字列を強調して見せるようにその文字列の表現に動的な調整・変更を施す。この表現効果として施される調整・変更の一例として、その文字列に対して美しい直線の下線を付す場合がある。
また、本実施形態のように、その文字列の背景色を変えて目立たせる場合もある。また、前景色(つまり文字色)を変更して目立たせる場合もある。さらに別の例として、その文字列以外の領域の彩度または明度を下げることにより、その文字列を相対的に目立たせる場合もある。以上のように、下線が付された文字列をハイライトする表現方法は、文字列を目立たせるあらゆる方法を適用できるものであり、本実施形態の方法に限られない。
次に、ステップS1104においては、ステップS910で検出した取り消し線に対応する文字列の背景色を暗くして表示する。具体的には、元々の手書き入力のアノテーションを直線に置き換え、さらに対応する文字領域の背景色をグレーなどの無彩色に変えることにより、取り消し線の表現を変更する。例えば、図12(E)に示す1209は、図12(C)に示す手書き入力である取り消し線のアノテーション1207を暗くして表示した例を示す。
また、図12(C)に示す手書きアノテーション1207の取り消し線は、アノテーション検出処理によって“Point5”と書かれた文字列に対する取り消し線であると判定されるため、“Point5”の背景色を暗くして表示する。ここで、一般的に、資料上のある文字列に対する取り消し線のような手書きのアノテーションが加えられた場合、その文字列を訂正・消去したい、あるいは目立たないようにしたいというのが説明者の意図である。従って、その文字列の領域と加えられた手書きアノテーションとの位置関係に基づいて、その文字列を目立たなく見せるようにその文字列の表現に動的な調整・変更を施す。
次に、ステップS1105において、オブジェクト領域に対する囲み線領域の占める面積が所定以上であるか否かを判定する。具体的には、囲み線の手書きアノテーション領域と、オブジェクトの領域の重なりを算出し、オブジェクト領域全体に対して囲み線の手書きアノテーション領域が70%以上を占めていれば所定以上であると判定する。また、囲み線の領域にオブジェクトが存在しない場合は、各領域の重なりが0%であると判定される。
例えば、図13(B)に示す手書きアノテーション1302は、オブジェクト1203の領域(破線の領域)の所定面積(70%)以上を占めると判定される。また、図13(A)に示す手書きアノテーション1301は、オブジェクト1203の領域の所定面積以上を占めると判定されない。なお、所定の面積はユーザによって自由に変更できるものであり、70%に限るものではない。囲み線アノテーションがオブジェクトの所定面積以上を占める場合は(YES)、ステップS1106へ処理を進める。一方、囲み線アノテーションがオブジェクトの所定面積以上を占めていない場合は(所定面積未満の場合)(NO)、ステップS1107へ処理を進める。
次に、ステップS1106において、囲み線の手書きアノテーションが所定面積以上占めると判定されたオブジェクトの領域外をグレーアウトして表示する。具体的には、図13(D)に示すようにオブジェクト1304の領域以外をグレーアウトして表示することにより、オブジェクト1304をより目立たせて表示する。また、ステップS1107においては、囲み線の手書きアノテーション領域以外をグレーアウトして表示する。具体的には、図13(C)に示すように手書きアノテーション1303の領域以外をグレーアウトして表示することにより、手書きアノテーションで囲まれた領域をより目立たせて表示する。
前述のステップS1105〜ステップS1107の処理は、オブジェクト全体が囲み線によって指定されていると判定された場合は、オブジェクト全体を強調表示する。そして、オブジェクトの中の部分領域が指定されていると判定された場合はオブジェクトの部分領域を強調表示するものである。なお、一般的に、資料上のある領域に対する囲み線のような手書きのアノテーションが加えられた場合、その領域を強調したい、あるいは目立たせるようにしたいというのが説明者の意図である。従って、その領域と手書きアノテーションとの位置関係に基づいて、その領域を強調して見せるようにその領域の表現に動的な調整・変更を施す。
以上のように、本実施形態によれば、画像上に加えられるアノテーションとオブジェクトの属性に基づいて、説明者の意図に合わせた表現になるように画像の部分領域の表示を動的に変更可能であり、プレゼンテーションに適した効果的な表示ができる。
(第2実施形態)
第1実施形態では、アノテーション処理部305において、オブジェクトの属性及びアノテーションの種別に応じて画像の部分領域の表現を動的に変更する例を説明した。これにより、説明者の意図に合わせた表現ができるので、プレゼンテーションに適した効果的な表示ができる。本実施形態では、囲み線が文字領域又は写真領域、グラフィック領域にある場合において、画像の部分領域の表現を動的に変更する例を説明する。
以下、第1実施形態との差分を中心に、図14と図15を用いて説明する。図14は、本実施形態において図9のステップS913のアノテーション表現変更処理の詳細を説明するフローチャートである。図14のステップS1401〜ステップS1410は、アノテーション表示制御部307によって実行処理される。また、図15は、本実施形態においてアプリケーション画像データの表示中に、手書きの囲み線アノテーションを書き込んだときに画像中の部分領域の表現を動的に変更表示する例を示している。
図14に示すステップS1401〜ステップS1404およびステップS1410は、それぞれ図9に示すステップS1101〜ステップS1104およびステップS1107と同様の処理であるため、詳細な説明を割愛する。まず、ステップS1405において、囲み線の領域が文字領域矩形ブロックにあるか否かを判定する。例えば、図15(A)、図15(B)に示すページ400上のオブジェクト1204は文字領域矩形ブロックであり、手書きの囲み線アノテーション1501および1502の領域は、文字領域矩形ブロックにあると判定される。
具体的には、手書きの囲み線アノテーションの領域の80%以上が文字領域矩形ブロックに含まれれば、文字領域矩形ブロックにあると判定される。ただし、前記閾値は任意に変更できる値であり80%に限定するものではない。文字領域矩形ブロックにあると判定された場合(YES)、ステップS1406へ処理を進める。一方、文字領域矩形ブロックにないと判定された場合(NO)ステップS1407へ処理を進める。
次に、ステップS1406においては、ステップS910で検出した手書きの囲み線アノテーションに対応する文字領域をハイライト表示する。具体的には、元の手書きアノテーションを消去し、対応する文字領域の背景色を有彩色に変えることにより、文字領域をより目立たせるように表示する。
例えば、図15(D)に示す文字領域1507は、図15(A)に示す手書きの囲み線アノテーション1501をハイライト表示した例である。また、図15(E)に示す文字領域1508は、図15(B)に示す手書きの囲み線アノテーション1502をハイライト表示した例である。図15(E)に示す例においては、手書きアノテーション1502に対応する文字領域が複数行にわたるため、説明者の強調したい領域が囲み線に含まれる複数行全体であると推定される。従って、図15(E)のように、アノテーション1502が含む文字領域の行全体を強調して表示する。
次に、ステップS1407においては、囲み線の領域が写真領域矩形ブロック(図画領域)またはグラフィック領域矩形ブロック(図画領域)にあるか否かを判定する。例えば、図15(C)、図15(F)に示すページ401上のオブジェクト1503は、写真領域矩形ブロックであり、手書きの囲み線アノテーション1506の領域は写真領域矩形ブロックにあると判定される。
具体的には、手書きの囲み線アノテーションの領域の80%以上が写真またはグラフィック矩形領域ブロックに含まれれば、囲み線アノテーションが写真またはグラフィック領域矩形ブロックにあると判定される。ただし、前記閾値は任意に変更できる値であり80%に限定するものではない。囲み線アノテーションが写真またはグラフィック領域矩形ブロックにあると判定される場合(YES)、ステップS1408へ処理を進める。一方、囲み線アノテーションが写真またはグラフィック領域矩形ブロックにないと判定された場合(NO)、ステップS1410へ処理を進める。
次に、ステップS1408においては、写真またはグラフィック領域矩形ブロックに含まれるオブジェクト(図画オブジェクト)を抽出する。例えば、図15(C)に示すページ401上の囲み線アノテーション1506の領域から、コピー機であるオブジェクト1505を抽出する。オブジェクトの抽出手法は、公知の特徴量を用いたパターンマッチングによる。
本実施形態では、手書きアノテーションの領域1506より一回り大きい領域を抜き出し、抜き出した領域に対して予め保存してある画像データベースとのパターンマッチングを行うことで、オブジェクト抽出を行う。なお、特徴量によるオブジェクト抽出手法は公知の技術であるため、これ以上の詳細な説明は割愛する。また、オブジェクトの抽出方法は、輝度値ヒストグラムや画像のエッジに基づいて行ってもよく、特徴量のパターンマッチングに限定されない。
次に、ステップS1409においては、元の手書きアノテーションを消去し、ステップS1408で抽出されたオブジェクト領域以外をグレーアウトして表示する。具体的には、図15(F)に示すようにオブジェクト1505の領域以外をグレーアウトして表示することにより、手書きアノテーション1506で囲まれたオブジェクトの領域をより目立たせて表示する。
以上のように、本実施形態では、第1実施形態の表現方法に加え、囲み線の囲う領域の画像データの属性情報を用いることで、説明者の意図に合った効果的な表現によって画像の部分領域の表現を変更して表示することができる。
(第3実施形態)
第1実施形態では、アノテーション処理部305において、オブジェクトの属性及びアノテーションの種別に応じて画像の部分領域の表現を動的に変更する例を説明した。また、第2実施形態では、手書きの囲み線アノテーションの領域が、文字またはグラフィック領域矩形ブロックの場合の例を説明した。これらにより、説明者の意図に合わせた表現ができるので、プレゼンテーションに適した効果的な表示ができる。
本実施形態では、説明者がアノテーションを書き込み中に、リアルタイムに画像の部分領域の表現を変更する例を説明する。以下、第1及び第2実施形態との差分を中心に、図16と図17を用いて説明する。まず、図16は、本実施形態におけるアノテーションを書き込む時のフローチャートである。図17は、本実施形態におけるアプリケーション画像データの表示中にアノテーションを書き込んだときに、画像中の部分領域をリアルタイムに変更表示する例を示している。
図16に示すステップS1601〜ステップS1615はソフトウェアモジュール300によって実行処理される。ステップS1601〜ステップS1610およびステップS1617は、それぞれ図9に示すステップS901〜ステップS910およびステップS914と同様の処理であるため、詳細な説明を割愛する。まず、ステップS1611において、アノテーション検出部305によって検出された手書きアノテーションの検出結果を一時保存する。
次に、ステップS1612では、前述の図11または図14で示したアノテーション表現変更処理を行う。アノテーション表現変更処理は、手書きアノテーションの属性情報に応じて行われるが、本実施形態ではステップS1611で検出された直後に検出結果を用いて、リアルタイムに画像の部分領域の表現を変更する。
例えば、図17(A)に示す手書きの下線アノテーションの表現変更処理は、図17(B)に示す部分領域1702のように、説明者がアノテーションを書き込んでいる最中にもステップS1611の検出結果にもとづいて随時行われる。なお、本実施形態での表現変更処理は、説明者が使っている画像表示装置100上のLCD201に対してのみ行われ、視聴者が閲覧しているスクリーンには出力しないこととする。これは、視聴者に編集途中の結果を見せないためであるが、説明者が見ている表示と同じものを出力することも可能である。
次に、ステップS1613では、ステップS1611の最新の検出結果に基づいたアノテーションの変更表現を表示し、それ以前の変更表現を元に戻す。例えば、図17(C)に示すアノテーション1703は、図17(B)に示す部分領域1702の表現変更表示後に、説明者が指を離さずに連続して書き込んだ手書きアノテーションである。しかしながら、このとき部分領域1702の変更表現は元の手書きアノテーションに戻されている。
つまり、図17(C)示す時点では、ステップS1611の最新のアノテーション検出結果が、下線、取り消し線又は囲み線ではないため、何も変更表示されていない通常の手書きアノテーションの表示となる。本実施形態では、図17(C)の後、続けて図17(D)の指の位置まで説明者がアノテーション1704の手書き入力を行ったこととする。このとき、ステップS1614で描くボタン402のタップを検出する前の画像表示装置100の表示は、図17(E)となる。これは、手書きアノテーション1704のアノテーション検出結果が、オブジェクト1503に対する囲み線となるためであり、オブジェクト1503以外の領域がグレーアウト表示される。
次に、ステップS1614において、UI204上の描くボタン402がシングルタップされたか否かを検出する。描くボタン402がシングルタップされた場合は(YES)、ステップS1615へ処理を進める。一方、描くボタン402がシングルタップされていない場合(NO)、ステップS1603へ戻る。次に、ステップS1615において、ステップS912と同様にしてアノテーション生成部308によってアノテーションオブジェクトを生成する。ステップS1615においては、ステップS1611で一時保存された検出結果にもとづいてアノテーション属性情報を生成する。
次に、ステップS1616において、確定した手書きアノテーションの変更表現結果を、RGB出力コントローラ214を介して外部出力する。本実施形態では、図17(E)に示す表示結果が出力される。
以上のように、本実施形態では、手書きアノテーションの書き込み中に、リアルタイムにアノテーションの表現変更を画像表示装置100に反映するので、説明者は反映結果を確認しながら、アノテーションを書き込むことができる。これにより、説明者は、より簡単に説明者の意図に沿ったアノテーションの書き込みを行うことができる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
また、本発明の好ましい実施形態について説明したが、本発明は、これらの実施形態に限定されず、その要旨の範囲内で種々の変形および変更が可能である。

Claims (11)

  1. 複数のオブジェクトを含む画像を画面に表示する表示手段と、
    前記オブジェクトを属性ごとに分割したブロックの情報を示すブロック情報を生成する生成手段と、
    前記画像上に手書きしたアノテーションの筆跡を認識する入力手段と、
    前記筆跡に基づいて、前記アノテーションの種別を検出する検出手段と、
    前記ブロック情報と前記筆跡との関係に基づいて着目する部分領域を推定し、前記アノテーションの種別に応じて、前記部分領域の表現を動的に変更して表示する表示変更手段とを有する
    ことを特徴とする情報処理装置。
  2. 前記検出手段が、前記アノテーションが前記部分領域の文字領域に対する下線であることを検出した場合、前記表示変更手段は前記文字領域を強調して表示する
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記検出手段が、前記アノテーションが前記部分領域の文字領域に対する取り消し線であることを検出した場合、前記表示変更手段は前記文字領域を目立たないように表示する
    ことを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記検出手段が、前記アノテーションが前記部分領域に対する囲み線であることを検出した場合、前記表示変更手段は前記部分領域を強調して表示する
    ことを特徴とする請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記表示変更手段は、前記囲み線が囲う領域の面積が、前記部分領域の所定の面積以上を占める場合、前記部分領域の全体を強調して表示する
    ことを特徴とする請求項4に記載の情報処理装置。
  6. 前記表示変更手段は、前記囲み線が囲う領域の面積が、前記部分領域の所定の面積未満である場合、前記囲み線が囲う領域のみを強調して表示する
    ことを特徴とする請求項4または5に記載の情報処理装置。
  7. 前記表示変更手段は、前記囲み線が囲う領域が、前記部分領域の文字領域に存在する場合、前記囲み線が囲う前記文字領域を強調して表示する
    ことを特徴とする請求項4乃至6のいずれか1項に記載の情報処理装置。
  8. 前記表示変更手段は、前記囲み線が囲う領域が、前記部分領域の図画領域に存在する場合、前記囲み線が囲う図画オブジェクトを抽出し、強調して表示する
    ことを特徴とする請求項4乃至7のいずれか1項に記載の情報処理装置。
  9. 前記表示変更手段は、前記検出手段が前記アノテーションの種別を検出した直後に、前記種別に応じて変更した表現を前記画面に表示し、変更が確定した表現を外部出力する
    ことを特徴とする請求項1乃至8のいずれか1項に記載の情報処理装置。
  10. 複数のオブジェクトを含む画像を画面に表示する表示工程と、
    前記オブジェクトを属性ごとに分割したブロックの情報を示すブロック情報を生成する生成工程と、
    前記画像上に手書きしたアノテーションの筆跡を認識する入力工程と、
    前記筆跡に基づいて、前記アノテーションの種別を検出する検出工程と、
    前記ブロック情報と前記筆跡との関係に基づいて着目する部分領域を推定し、前記アノテーションの種別に応じて、前記部分領域の表現を動的に変更して表示する表示変更工程とを有する
    ことを特徴とする情報処理装置の制御方法。
  11. 請求項1乃至9のいずれか1項に記載の情報処理装置の各手段としてコンピュータを機能させるためのプログラム。
JP2015078384A 2015-04-07 2015-04-07 情報処理装置、情報処理装置の制御方法、およびプログラム Pending JP2016200860A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015078384A JP2016200860A (ja) 2015-04-07 2015-04-07 情報処理装置、情報処理装置の制御方法、およびプログラム
US15/091,115 US20160300321A1 (en) 2015-04-07 2016-04-05 Information processing apparatus, method for controlling information processing apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015078384A JP2016200860A (ja) 2015-04-07 2015-04-07 情報処理装置、情報処理装置の制御方法、およびプログラム

Publications (2)

Publication Number Publication Date
JP2016200860A true JP2016200860A (ja) 2016-12-01
JP2016200860A5 JP2016200860A5 (ja) 2018-05-17

Family

ID=57111956

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015078384A Pending JP2016200860A (ja) 2015-04-07 2015-04-07 情報処理装置、情報処理装置の制御方法、およびプログラム

Country Status (2)

Country Link
US (1) US20160300321A1 (ja)
JP (1) JP2016200860A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020016963A (ja) * 2018-07-23 2020-01-30 株式会社リコー 配信装置、プログラム、配信システム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6717141B2 (ja) * 2016-09-20 2020-07-01 コニカミノルタ株式会社 文書閲覧装置及びプログラム
US9965695B1 (en) * 2016-12-30 2018-05-08 Konica Minolta Laboratory U.S.A., Inc. Document image binarization method based on content type separation
CN111142731B (zh) * 2019-12-27 2021-07-20 维沃移动通信有限公司 一种显示方法及电子设备
CN113178900B (zh) * 2021-03-15 2023-02-17 荣耀终端有限公司 无线充电系统、芯片和无线充电电路
WO2022222096A1 (zh) * 2021-04-22 2022-10-27 京东方科技集团股份有限公司 手绘图形识别方法、装置和系统,以及计算机可读存储介质
CN113963366B (zh) * 2021-10-19 2025-05-09 杭州睿胜软件有限公司 图像处理方法及装置、电子设备和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007066081A (ja) * 2005-08-31 2007-03-15 Casio Comput Co Ltd 電子会議装置及び電子会議装置制御プログラム
WO2011090176A1 (ja) * 2010-01-22 2011-07-28 京セラ株式会社 投影制御装置及び投影制御方法
WO2013021878A1 (ja) * 2011-08-11 2013-02-14 シャープ株式会社 情報処理装置、操作画面表示方法、制御プログラムおよび記録媒体
WO2014189812A2 (en) * 2013-05-20 2014-11-27 Microsoft Corporation Ink to text representation conversion

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7259753B2 (en) * 2000-06-21 2007-08-21 Microsoft Corporation Classifying, anchoring, and transforming ink
US7616333B2 (en) * 2003-08-21 2009-11-10 Microsoft Corporation Electronic ink processing and application programming interfaces
US20060197756A1 (en) * 2004-05-24 2006-09-07 Keytec, Inc. Multi-mode optical pointer for interactive display system
JP2006277167A (ja) * 2005-03-29 2006-10-12 Fuji Xerox Co Ltd アノテーションデータ処理プログラム、装置、方法
US10365819B2 (en) * 2011-01-24 2019-07-30 Apple Inc. Device, method, and graphical user interface for displaying a character input user interface
JP2014102669A (ja) * 2012-11-20 2014-06-05 Toshiba Corp 情報処理装置、情報処理方法およびプログラム
US9372543B2 (en) * 2013-12-16 2016-06-21 Dell Products, L.P. Presentation interface in a virtual collaboration session
US9934212B2 (en) * 2014-02-26 2018-04-03 Xerox Corporation Methods and systems for capturing, sharing, and printing annotations

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007066081A (ja) * 2005-08-31 2007-03-15 Casio Comput Co Ltd 電子会議装置及び電子会議装置制御プログラム
WO2011090176A1 (ja) * 2010-01-22 2011-07-28 京セラ株式会社 投影制御装置及び投影制御方法
WO2013021878A1 (ja) * 2011-08-11 2013-02-14 シャープ株式会社 情報処理装置、操作画面表示方法、制御プログラムおよび記録媒体
JP2013041332A (ja) * 2011-08-11 2013-02-28 Sharp Corp 情報処理装置、操作画面表示方法、制御プログラムおよび記録媒体
WO2014189812A2 (en) * 2013-05-20 2014-11-27 Microsoft Corporation Ink to text representation conversion

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020016963A (ja) * 2018-07-23 2020-01-30 株式会社リコー 配信装置、プログラム、配信システム
JP7159669B2 (ja) 2018-07-23 2022-10-25 株式会社リコー 配信装置、プログラム、配信システム

Also Published As

Publication number Publication date
US20160300321A1 (en) 2016-10-13

Similar Documents

Publication Publication Date Title
US10222971B2 (en) Display apparatus, method, and storage medium
JP2016200860A (ja) 情報処理装置、情報処理装置の制御方法、およびプログラム
CN109739372B (zh) 用于手写输入设备的图形绘制方法及手写阅读设备
US20180082663A1 (en) Information processing apparatus, image displaying method, and non-transitory computer readable medium
TWI714513B (zh) 書籍顯示程式產品及書籍顯示裝置
JP5664164B2 (ja) 電子情報ボード装置、情報表示方法、プログラム
KR102373021B1 (ko) 글로벌 특수 효과의 전환 방법, 전환 장치, 단말 설비 및 저장 매체
US9880721B2 (en) Information processing device, non-transitory computer-readable recording medium storing an information processing program, and information processing method
US9177405B2 (en) Image processing apparatus, computer program product, and image processing system
WO2014122794A1 (ja) 電子機器および手書き文書処理方法
JP4021249B2 (ja) 情報処理装置及び情報処理方法
US9098947B2 (en) Image processing apparatus and image processing system
US9753548B2 (en) Image display apparatus, control method of image display apparatus, and program
JP7732283B2 (ja) 表示装置、表示システム、表示制御方法、及びプログラム
JP2013196100A (ja) 図面表示装置、及び図面表示プログラム
JP2012178175A (ja) 表示制御装置、電子機器、表示制御方法、およびプログラム
US20160132478A1 (en) Method of displaying memo and device therefor
CN112860157B (zh) 显示元素调整方法、装置、设备及存储介质
US10545649B2 (en) Information processing apparatus, display control method for information processing apparatus, and storage medium
CN110737417B (zh) 一种演示设备及其标注线的显示控制方法和装置
JP5414920B2 (ja) 表示制御装置、表示制御方法、およびプログラム
CN112860165B (zh) 文本信息的获取方法、装置
JP7683253B2 (ja) 表示装置、プログラム、変換方法、表示システム
CN108932054B (zh) 显示装置、显示方法和非暂时性的记录介质
JP2014160416A (ja) 閲覧システム及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180323

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180323

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190312

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190702

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190902

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200210