JPH09331385A - 音声画像通信システムおよび画像情報検索システム - Google Patents

音声画像通信システムおよび画像情報検索システム

Info

Publication number
JPH09331385A
JPH09331385A JP8150933A JP15093396A JPH09331385A JP H09331385 A JPH09331385 A JP H09331385A JP 8150933 A JP8150933 A JP 8150933A JP 15093396 A JP15093396 A JP 15093396A JP H09331385 A JPH09331385 A JP H09331385A
Authority
JP
Japan
Prior art keywords
voice
image
input
telephone number
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8150933A
Other languages
English (en)
Inventor
Hitoshi Sato
均 佐藤
Toshiyuki Matsuda
俊幸 松田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8150933A priority Critical patent/JPH09331385A/ja
Publication of JPH09331385A publication Critical patent/JPH09331385A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

(57)【要約】 【課題】 1つの音声キーワードに、複数の画像情報と
相手電話番号を対応付けて記憶することで、音声認識し
て得られる複数の電話番号を容易に確認できる、使い勝
手のよい音声画像通信システムを提供すること。 【解決手段】 音声画像通信システムに、音声が入力さ
れる音声入力部104と、キーまたはマウスにより電話
番号が入力されるキー入力部100と、キー入力部より
入力される電話番号を再ダイヤル用に記憶する電話番号
記憶部と、相手静止画像を取り込む画像記憶部と、再ダ
イヤル用に記憶される電話番号と相手静止画像と音声入
力部より入力される音声とを対応づけて記憶する記憶部
107とを、設ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声画像通信シス
テムおよび画像情報検索システムに係り、特に、コンピ
ュータや電話機、画像の送受信機能、テレビ放送受信機
能などが統合されたマルチメディア機能を備えたシステ
ムの技術に関する。
【0002】
【従来の技術】従来、音声認識を用いて電話をかける音
声ダイヤル機能を備えた電話機やコマンド制御などが提
案されている。例えば、音声ダイヤルの場合には、予め
電話番号に対応した単語を発声し、音声分析処理して得
られる特徴量を標準パタンとして、単語レベルで電話番
号に対応付けてメモリに登録しておく。発信する時に、
電話番号をキー入力する代わりに、その電話番号に対応
する単語を発声し、音声分析処理して得られる特徴量と
標準パタンをマッチングすることで単語認識を行い、認
識結果に対応付けられた番号情報を電話回線に発信する
ようにした方法が提案されている(特開平2−1436
51号公報参照)。そして、現状の画像表示ディスプレ
イを持たない電話機のみでは、音声認識の結果確認手段
としては音声出力あるいは文字出力を用いている。
【0003】ところで最近では、ISDN(Integrated
Services Digital Network )の普及などから、パーソ
ナルコンピュータ(パソコン;PC)やワークステーシ
ョン(WS)とカメラ入力とが一体となったデスクトッ
プ型のテレビ電話やテレビ会議システムなどが普及しつ
つある。そして、相手と回線を接続するためには、例え
ばスター型の多地点間のテレビ会議では、複数の相手を
選ぶのに個々の電話番号をキー入力したり、あるいはあ
らかじめ登録してある名前や電話番号等を選択する方法
を用いている。
【0004】また、電話をかける以外に、最近ではディ
ジタル・スチルカメラやディジタル・ビデオカメラなど
ディジタルで画像情報を入力して、記録する方法が提案
されている。これらのディジタル情報は、パソコンやワ
ークステーションに取り込まれ、その情報は加工,修
正,変更等の編集に用いられるなど、その用途は広く考
えられる。検索する場合、現在は画像情報に日付やN
o.などの時系列の付加情報があれば、これを利用して
キーボードやマウスを使って検索を行うことができる。
【0005】
【発明が解決しようとする課題】これまで知られてきた
方法では、音声ダイヤル機能を利用して通話する前の準
備として、予め登録操作が必要であり、この登録は、1
つの音声キーワードに対して1つの電話番号を対応付け
るものである。このようにする所以は、従来の方法で
は、結果確認の手段に制約があり、1つの音声キーワー
ドで複数の電話番号を割り当てることが困難であったた
めである。そのため、複数の相手に発信する際には、各
々異なった音声キーワードを覚えておいて、これを音声
入力しなければならず、ユーザにとっては面倒で、使い
勝手が悪いという問題がある。
【0006】なお、1つの音声キーワードで複数の電話
番号を対応付けた場合には、音声認識して得られる複数
の電話番号を、どのようにして確認するかという問題を
生じる。
【0007】一方、画像などのディジタル情報は、日付
や時間、No.などの時系列の付加情報だけでは、一度
パソコンまたはワークステーションに取り込んだ後、ユ
ーザが撮影した日付や時間などを特定できない場合に、
検索をすることは容易ではない。そのため、メモリに蓄
積する画像などの情報量が増大するのに従って、検索の
ための確認作業の手間が増え、ユーザーにとっては煩わ
しく、本来目的とした編集作業が十分に行えない可能性
が生じるという問題がある。
【0008】本発明の目的は、1つの音声キーワードに
複数の電話番号を対応付けて登録を行っても、所望する
電話番号の特定が、画像情報を利用することにより確実
・容易に行える、使い勝手のよい音声画像通信システム
を提供することにある。
【0009】また、本発明の目的は、パソコンまたはワ
ークステーションに画像情報を取り込む際に、画像情報
に音声情報インデックスを付けて登録することで、検索
と確認を容易に行える、画像情報など視覚的な情報と音
声情報とを組み合わせた画像情報検索システムを提供す
ることにある。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、本発明の音声画像通信システムには、音声が入力さ
れる音声入力部と、キーまたはマウスにより電話番号が
入力されるキー入力部と、キー入力部より入力される電
話番号を再ダイヤル用に記憶する電話番号記憶部と、相
手静止画像を取り込む画像記憶部と、再ダイヤル用に記
憶される電話番号と相手静止画像と音声入力部より入力
される音声とを対応づけて記憶する記憶部とを、設け
た。
【0011】また、本発明の音声画像通信システムに
は、キーワード登録の際、音声キーワードとそれに対応
する複数の画像情報とを対応付けて記憶する記憶部を設
けた。
【0012】また、本発明の音声画像通信システムに
は、認識結果をディスプレイに表示する際、複数の画像
に対応した音声キーワードが入力された場合、記憶部か
ら対応する画像情報を読み出し複数分割して表示できる
画像表示部を設けた。これにより、ユーザは視覚的に確
認を容易にできるものである。
【0013】また、本発明の画像情報検索システムに
は、画像情報にインデックスとしてそれに対応する音声
キーワードを登録する記憶部と、記憶部から対応する画
像情報を読み出し複数分割して表示できる画像表示部と
を設けた。
【0014】
【発明の実施の形態】以下、本発明の実施の形態を、図
面を参照して説明する。図1は、本発明の1実施形態に
係る音声画像通信システムの端末装置(電話機能付き端
末装置)のブロック図である。
【0015】図1において、100は電話番号を入力す
るキー入力部、101は電話番号やその他のメッセージ
を表示する表示部、102は静止画や動画などを入力す
るための画像入力部、103は通話相手もしくは自己の
画像を出力する画像表示部、104は音声を入力するた
めの音声入力部、105は通話相手もしくは自己の音
声、または登録の確認メッセージ等の何らかの音声を出
力する音声出力部、106は端末装置内の各部を制御す
る制御部、107は音声キーワード,画像情報,電話番
号情報のデータベース、及びそれらの対応関係のデータ
ベースが記憶される記憶部、108は入力された画像を
分析処理する画像処理部、109は画像を伝送するため
の画像CODEC、110は入力された音声を分析処理
する音声処理部、111は音声を伝送するための音声C
ODEC、112は公衆回線網等の回線網と接続するた
めの回線接続部であり、本実施形態の電話機能付き端末
装置は、上記の各部100〜112を中心に構成され
る。なお、113は広く普及している公衆電話回線網あ
るいはISDNなどの回線網である。
【0016】本実施形態では、まずオフフック状態で、
テンキーパッド等のキー入力部100から電話番号を入
力する。このときに入力された電話番号は、一時的に再
ダイヤル用のメモリに記憶される。次に、入力された電
話番号は、制御部106により制御される回線接続部1
12から回線網113に発信し、一般的な電話交換局に
送られ通話相手と接続される。そして、相手がオフフッ
クして画像情報が送信されてきた間のある時間の情報を
静止画像として取り込むことで、再度電話をかける時の
視覚的な確認用データとして用いる。また、音声入力部
104から入力された音声信号を、音声処理部110で
分析し特徴パラメータに変換する。そして、この特徴パ
ラメータとキー入力部100から入力された電話番号と
取り込んだ静止画像とを対応させて記憶することで、登
録が完了する。
【0017】オフフック状態で、かつキー入力部100
から電話番号を入力していない状態で、音声入力部10
4から音声が入力されると、音声処理部110で特徴パ
ラメータを求め、記憶部107にある音声キーワードの
標準パタンと類似度を計算し、一番類似度が大きい単語
を求める。その後、求めたキーワード単語に対応する画
像情報を記憶部107から参照し、制御部106から画
像処理部108に複数のデータを送り、画像表示部10
3で画面上に分割してマルチ表示する。表示された画面
により選択あるいは確認を行い、選択された画像に対応
する電話番号を記憶部107から制御部106に読み込
み、その電話番号を回線接続部112に送り、回線網1
13に発信する。
【0018】図2に示すように、記憶部107には、音
声キーワード200に対応してデータベース201が連
結して記憶されている。
【0019】また図3に示すように、記憶部107のデ
ータベース201には、画像情報のデータベース300
が格納されていて、1つの音声キーワードに複数の画像
情報が対応して格納されている。また、1つの画像情報
に対して複数の音声キーワードが対応して格納されてい
る。
【0020】さらに図4に示すように、記憶部107の
データベース201には、画像情報のデータベース30
0と、それに対応する電話番号のデータベース400と
が格納されている。そして、1つの音声キーワードに複
数の画像情報が対応していて、また、1つの電話番号
は、複数の画像情報とリンクさせて対応付けることがで
きるようになっている。このように、1つの電話番号に
複数のキーワードを対応させておけば、検索するある1
つの音声キーワードを忘れた場合でも対処できるので、
音声による検索語彙を制限することなく、幅広い検索シ
ステムを構築できることになる。
【0021】図5は、上記の記憶部107をサーバ50
0側に持つことで、データベースサーバ501に、複数
のクライアント504からLAN503と公衆回線50
2を通して共有してアクセスできることを示す。
【0022】図6は、本実施形態を適用したテレビ電話
やテレビ会議システムなどにおいて、電話番号情報に音
声キーワード及び画像情報を登録するシーケンスのフロ
ー図である。
【0023】まず、ステップ600のオフフック状態か
ら、ステップ601でキー入力部100から電話番号を
入力するとステップ602に進み、電話番号は記憶部1
07の電話番号データベース400に格納される。入力
された電話番号は、制御部106により制御される回線
接続部112から回線網113に発信し、一般的な電話
交換局に送られ通話相手と接続される。そして、ステッ
プ603では、相手の電話機がビデオ信号を送受信でき
る電話機であるかどうかを判断し、ビデオ信号を送受信
できる電話機であればステップ604に進み、相手がオ
フフックした後に送信してくるビデオ信号を受信する。
その後、ステップ605で、受信されたビデオ信号を画
像CODEC109を通して画像処理部108から静止
画として取り込む処理を行う。この処理は、相手から送
信されてくる画像のある時間の情報を制御部106によ
り静止画像として取り込む。例えば、相手がオフフック
した後、声を発声している音声区間を音声処理部110
で判定し、制御部106が、その時点の受信画像を画像
処理部108から自動的に取り込む。あるいは、ユーザ
ーがキー入力部100から選択キーなどを用いて、任意
の受信画像を記憶部107に登録できるようにすること
も可能である。また、相手から選択された画像を送信し
てもらうことによる、画像登録も可能である。取り込ま
れた画像情報は、ステップ608で画像データベース3
00に格納され、ステップ609に進む。
【0024】一方、ステップ603で、かけた相手先が
ビデオ信号を送受信できる電話機でないと判断した場合
は、ステップ606に進み、画像情報を登録するかどう
かをユーザーに選択させる。画像を登録する場合、ステ
ップ607に進み、写真や絵などの静止画像を画像入力
部102から自分で入力する。あるいは、画像を取り込
む代わりに、それに代わる文字の情報をマウス等を用い
てキー入力部100から入力して記憶することで、後で
確認できるようにすることも可能である。
【0025】通話が終了した後、ステップ609に進ん
でオンフックを行い、ステップ610では、音声入力部
104から入力される音声キーワードをメモリに格納す
る。音声キーワードの登録に関しては、従来音声認識を
用いる場合には認識する単語を音声で登録して特定話者
用の標準パタンを作成する必要があったが、最近ではテ
キストデータから自由に登録して不特定話者用の標準パ
タンを作成できる方式もある。そこで、インデックスの
登録は、キー入力部100からキーボードやマウスを用
いてテキスト入力することや、音声を入力してテキスト
データに変換する方法や、あるいは音声情報そのものを
記憶部107に格納しておくことが可能である。その後
ステップ611に進み、画像情報と電話番号情報とに、
音声キーワードを対応させて記憶部107に格納する。
【0026】図7は動画から静止画像を取り込む方法の
例を示す。静止画像の取り込みは、ユーザに対してあま
り操作を意識させずに簡単に行えることが重要である。
また、取り込んだ画像では相手を識別できないといった
場合や、ユーザの意図した画像情報でない場合に、再度
やり直さなければならないといった失敗をできるだけ回
避して、確実に取り込めることも重要である。
【0027】そこで、通常相手の顔を見ながら対話する
ことを考えると、テレビ電話やテレビ会議などにおいて
も、声を発声している時は、正面を向いた状態でカメラ
あるいは画面上に映し出された映像を見ている可能性が
高いと考えられる。よって、相手が話している間に送信
されてくる音声信号を、音声CODEC111を通して
音声処理部110で音声区間701を検出する。そし
て、そこで相手から送信されてくる動画に対して、その
音声区間内で例えば一定の周期Tで画像を取り込む。取
り込まれた画像データは、一時的に記憶するメモリ70
3を用意しておいて、順次格納していく。メモリ703
の容量には制約があるので、メモリ703がいっぱいに
なったら、時間的に新しい情報を上書きして常に新しい
情報を格納しておくことで、メモリを節約できる。
【0028】そして、このメモリ703の情報を制御部
106によって順次取り出して、画像処理部108にデ
ータを送り、画像表示部103でマルチ画面に時系列に
複数表示する。そして、ユーザに確認及び選択させるこ
とで確定した静止画像を、メモリ703から記憶部10
7に記憶する。このように、メモリ703に一時的に格
納しておくので、通話開始後だけでなく通話終了後で
も、簡単にしかも確実に静止画像を登録できる。
【0029】図8は、本実施形態を適用したテレビ電話
やテレビ会議システムになどおいて、音声キーワードを
発声して認識処理を行い、発信するシーケンスのフロー
図である。
【0030】まず、ステップ800のオフフック状態か
ら、ステップ801で音声キーワードを発声すると音声
入力部104でこれを取り込み、ステップ802に進
む。ステップ802では、音声処理部110で処理を行
い、認識結果を制御部106に送る。ステップ803で
は、制御部106で認識結果からそれに対応する情報を
記憶部107から参照する。そして、ステップ804で
は、画像データベース300に参照された画像情報があ
るかどうかを確認する。もしあればステップ805に進
み、なければステップ810に進む。
【0031】ステップ805では、さらに1つの音声キ
ーワードに複数の画像情報及び電話番号が対応している
かどうかを判断する。もし複数の画像情報が対応してい
ればステップ806に、そうでなければステップ807
に進む。
【0032】ステップ806では、制御部106から画
像処理部108に複数のデータを送り、画像表示部10
3で画面上に分割してマルチ表示して、ステップ808
に進む。このことにより、ユーザーにとって視覚的に確
認し易くなる。
【0033】一方、ステップ807では、同様に制御部
106から画像処理部108にデータを送り、画像表示
部103で1画面上に表示する。この時もし、認識処理
の結果得られる類似度が一番大きいキーワードに対応す
る画像情報だけでなく、次候補の情報も同時にマルチ画
面表示する場合、個々の画面表示の大きさを類似度の大
きさに比例して分割することで、より視覚的に確認しや
すくすることも可能である。
【0034】ステップ808では、表示された画像によ
り選択あるいは確認を行い、ステップ809で、記憶部
107の電話番号データベース400から選択された画
像に対応する電話番号を読み込み、ステップ810で、
制御部106から対応する電話番号を回線接続部112
に送り、回線網113に発信する。
【0035】以上のように、1つの音声キーワードに対
応する画像情報を画面に複数表示することで、例えばパ
ソコンやワークステーションでの多地点間のTV会議シ
ステムにおいて複数の相手に同時に発信するような場合
に、1つのキーワードを発声するだけの操作で発信でき
ることから、各々選択する手間が省ける。また、1つの
キーワードに対して1つの電話番号が対応している場
合、認識処理の結果得られる類似度などにより画面表示
の大きさを次候補よりも大きくすることで、より視覚的
に確認しやすくすることができる。あるいは、ビデオ信
号を送受信できる電話機の場合では、相手の画像情報を
保持しておけば、発信の際に相手の顔は覚えているが電
話番号は覚えていないといったケースで、音声キーワー
ドを発声し画像を表示して相手を確認することができる
ので、誤まった発信を避けることができる。そのため、
この方法では複数の相手に同一の音声キーワードをつけ
るような場合、例えば名前が同じようなケースでは、電
話番号では確認できなくても画像であれば確認できるな
どその利点は多い。以上のように画像情報を用いること
で、視覚的に確認を容易にでき、同じ音声キーワードに
対しても複数の電話番号を対応付けることが可能とな
り、ユーザに各々選択操作させる負担を軽減できる。
【0036】かように、音声によるダイヤリングを、画
像情報を参照することと組み合わせて実現でき、大いに
利便性が向上する。
【0037】次に、本発明のシステムのダイヤリングを
する以外での用途として、画像情報検索システムが考え
られる。例えば、画像情報をイメージスキャナ等を利用
してパソコンやワークステーションに取り込んで編集作
業を行うような場合、メモリに格納している情報量が多
くなるにしたがい、検索機能が必要になってくる。ま
た、頻繁に参照するような情報についても検索までの時
間を短縮して、効果的に編集作業を行いたい願望が強
い。そのような場合、画像情報に対応した音声インデッ
クスが付加されていれば、検索を容易にできる。
【0038】図9に、本発明の他の実施形態としての画
像情報検索システムにおける、登録シーケンスのフロー
図を示す。なお、本画像情報検索システムの構成は、前
記図1の構成と同様であり、外部と回線網113を通し
て通信を行う必要のない場合には、前記回線接続部11
2は割愛することも可能である。
【0039】まず、ステップ900で、画像情報をイメ
ージスキャナ等の画像入力部102から、パソコンやワ
ークステーションに入力する。その後、ステップ901
で、記憶部107の画像データベース300にこのディ
ジタルデータを記憶して、ステップ902に進む。ここ
で、動画像から静止画像を取り込む場合には、動画像デ
ータと時間的に同期して録音されている音声があれば、
図7で説明したように、その音声区間を検出して、それ
に同期して複数の静止画像に分割することも可能であ
る。ステップ902では、取り込んだ画像データに対し
て音声インデックスを付加するかどうか確認する。イン
デックスを付加する場合は、ステップ903に進みイン
デックスを付加する。音声インデックスの付け方として
は、キーボードやマウスを用いてテキスト入力すること
や、音声を入力してテキストデータに変換する方法、あ
るいは音声情報そのものを記憶部107に格納しておく
ことが可能である。その後、ステップ904で、入力し
た画像情報とインデックス情報の対応づけを記憶部10
7に記憶して、登録を終了する。また、一度取り込んだ
データをオリジナル情報として記憶しておけば、例えば
オリジナルの情報を加工や編集した場合には、その都度
インデックス情報を付加しなくても、自動的にオリジナ
ルと同一のものを付加することもできる。
【0040】図10に、本発明の他の実施形態としての
画像情報検索システムにおける、認識シーケンスのフロ
ー図を示す。
【0041】図10における処理の流れは、図8で説明
したなかでの、ステップ800のオフフック、ステップ
804の画像情報があるかどうかの確認、ステップ80
9のデータベースからの電話番号読み込み、ステップ8
10の回線網113に発信するところを除いて、共通な
処理である。
【0042】以上のような画像情報検索システムでは、
編集作業である画面を見ながら違う画像情報を参照する
ような場合に、音声キーワードでの検索を行える。ま
た、同一のカテゴリーやディレクトリの中などを参照す
るのに、キーあるいはマウス操作を不要とし、情報量の
増大に伴って階層が深くなるような場合でも、音声で検
索可能であるから階層間の操作や確認作業に手間がかか
らない。さらに、例えば、オリジナルの画像に対して音
声インデックスが付加されていれば、編集後に検索する
場合も、オリジナルの画像情報にツリー状にリンクして
表示することで、どのオリジナルの画像から編集したの
かを確認することもできるし、また、オリジナル画像に
関連した他の情報も同時に検索できる。このことによ
り、検索の自由度がさらに広がる。また、以上で説明し
てきた以外にも、もちろんディジタル・カメラやディジ
タル・ビデオカメラ端末で画像情報を記憶する時に、デ
ータ形式として同時に音声キーワードを付加しておき、
そのままパソコン等に取り込んで利用することもでき
る。
【0043】また、上述してきた画像情報検索システム
を用いることで、次の用途も考えられる。例えば、オー
ディオグラフィックス会議の際の説明資料を画面に表示
させるような場合、予め音声キーワードと画像情報を対
応付けて記憶部107に格納しておけば、必要な時に記
憶部107から参照し、時間をかけずに音声で検索でき
る。さらに、不特定話者用の音声キーワードを用いれ
ば、相手の端末に画像情報とともにそのインデックスで
ある音声キーワードも同時に送信することで、他の使用
者が自分の端末でそのキーワードを用いることが可能に
なる。これにより、新たに自分で登録する手間がかから
ず、検索時間を大幅に短縮できるなどその利点は大き
い。あるいはさらに、端末側で個々に音声キーワードと
画像情報を対応付けた記憶部107を保持しておかなく
ても、サーバ側で不特定話者用のデータベースを保持し
ておくことで、多くのユーザが共通にアクセスして使用
できるようにすることも考えられる。
【0044】さらにまた、医療分野のサービスも考えら
れる。例えば、医療用の画像データベースに対しても、
音声キーワードを対応させておくことで、検索を容易に
することができる。したがって、遠隔地の病院と都市部
の専門病院などをISDN回線で結んで、患者の診断デ
ータを転送してやり取りする病理診断などに利用でき
る。
【0045】以上、いくつかの例によって本発明を説明
したが、本発明の精神を逸脱しない範囲内で、その他の
種々の変形が可能であることは言うまでもない。
【0046】
【発明の効果】以上詳細に説明したように、本発明によ
れば、複数対象を1つの音声キーワードにより検索で
き、それに対応した画像情報などの視覚情報を提供する
ことで、ユーザに対する検索及び確認作業の負担を軽減
することができる。
【図面の簡単な説明】
【図1】本発明の1実施形態に係る音声画像通信システ
ムの端末装置(電話機能付き端末装置)のブロック図で
ある。
【図2】図1中の記憶部の説明図である。
【図3】図2の記憶部内の画像データベースを示す説明
図である。
【図4】図2の記憶部内の画像情報データベースと電話
番号情報データベースを示す説明図である。
【図5】本発明の1実施形態に係る音声画像通信システ
ムにおける、ネットワーク構成の1例を示す説明図であ
る。
【図6】本発明の1実施形態における、登録シーケンス
の1例を示すフロー図である。
【図7】本発明の1実施形態における、登録時の静止画
像の取り込み例を示す説明図である。
【図8】本発明の1実施形態の適用例としてのテレビ電
話やテレビ会議システムなどにおける、音声キーワード
を発声して認識処理を行い、発信するシーケンスのフロ
ー図である。
【図9】本発明の他の実施形態に係る画像情報検索シス
テムにおける、登録シーケンスのフロー図である。
【図10】本発明の他の実施形態に係る画像情報検索シ
ステムにおける、認識シーケンスのフロー図である。
【符号の説明】
100 キー入力部 101 表示部 102 画像入力部 103 画像表示部 104 音声入力部 105 音声出力部 106 制御部 107 記憶部 108 画像処理部 109 画像CODEC 110 音声処理部 111 音声CODEC 112 回線接続部 113 回線網

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 音声を用いて電話番号を発信する音声画
    像通信システムにおいて、 音声が入力される音声入力部と、 電話番号が入力されるキー入力部と、 画像が入力される画像入力部と、 前記キー入力部より入力される電話番号を再ダイヤル用
    に記憶する記憶部と、 前記画像入力部からの画像を記憶する記憶部と、 前記音声入力部から入力される音声キーワードと、前記
    画像入力部から入力される画像と、前記キー入力部より
    入力される電話番号とを対応付けて記憶する記憶部と
    を、有することを特徴とする音声画像通信システム。
  2. 【請求項2】 音声を用いて電話番号を発信する音声画
    像通信システムにおいて、 音声が入力される音声入力部と、 電話番号が入力されるキー入力部と、 画像が入力される画像入力部と、 前記キー入力部より入力される電話番号を再ダイヤル用
    に記憶する記憶部と、 前記画像入力部からの画像を記憶する記憶部と、 前記音声入力部から入力される音声キーワード1つに対
    して、前記画像入力部から入力される複数の画像情報
    と、それに対応する前記キー入力部より入力される電話
    番号とを対応付けて記憶する記憶部とを、有することを
    特徴とする音声画像通信システム。
  3. 【請求項3】 音声を用いて電話番号を発信する音声画
    像通信システムにおいて、 音声が入力される音声入力部と、 電話番号が入力されるキー入力部と、 画像が入力される画像入力部と、 前記キー入力部より入力される電話番号を再ダイヤル用
    に記憶する記憶部と、 前記画像入力部からの画像を記憶する記憶部と、 前記音声入力部から入力される音声キーワードと、前記
    画像入力部から入力される画像と、前記キー入力部より
    入力される電話番号とを対応付けて記憶する記憶部と、 複数の画像情報を同時にマルチ表示できる画像表示部と
    を、有することを特徴とする音声画像通信システム。
  4. 【請求項4】 音声を用いて画像情報を検索する画像情
    報検索システムにおいて、 画像が入力される画像入力部と、 音声が入力される音声入力部と、 入力された音声を音声キーワードとして記憶する記憶部
    と、 前記画像入力部からの画像を記憶する記憶部と、 前記音声入力部から入力される音声キーワード1つに対
    して、複数の画像情報を対応付けて記憶する記憶部と、 複数の画像情報を同時にマルチ表示できる画像表示部と
    を、有することを特徴とする画像情報検索システム。
JP8150933A 1996-06-12 1996-06-12 音声画像通信システムおよび画像情報検索システム Pending JPH09331385A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8150933A JPH09331385A (ja) 1996-06-12 1996-06-12 音声画像通信システムおよび画像情報検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8150933A JPH09331385A (ja) 1996-06-12 1996-06-12 音声画像通信システムおよび画像情報検索システム

Publications (1)

Publication Number Publication Date
JPH09331385A true JPH09331385A (ja) 1997-12-22

Family

ID=15507592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8150933A Pending JPH09331385A (ja) 1996-06-12 1996-06-12 音声画像通信システムおよび画像情報検索システム

Country Status (1)

Country Link
JP (1) JPH09331385A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001273215A (ja) * 2000-03-24 2001-10-05 Dream Technologies Kk ネットワーク場所指定システム及び方法、電話番号指定システム及び方法並びに記録媒体
JP2007329632A (ja) * 2006-06-07 2007-12-20 Sony Ericsson Mobilecommunications Japan Inc 情報処理装置、情報処理方法、情報処理プログラム、及び携帯端末装置
JP2011065237A (ja) * 2009-09-15 2011-03-31 Konica Minolta Business Technologies Inc 画像送信装置、画像送信方法および画像送信プログラム
JP2019161258A (ja) * 2018-03-07 2019-09-19 沖電気工業株式会社 通信装置、通信システム、通信方法およびプログラム
WO2022009682A1 (ja) * 2020-07-06 2022-01-13 株式会社VICode 画像コード読み取りシステム、画像コード読み取り方法、およびプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001273215A (ja) * 2000-03-24 2001-10-05 Dream Technologies Kk ネットワーク場所指定システム及び方法、電話番号指定システム及び方法並びに記録媒体
JP2007329632A (ja) * 2006-06-07 2007-12-20 Sony Ericsson Mobilecommunications Japan Inc 情報処理装置、情報処理方法、情報処理プログラム、及び携帯端末装置
US8228361B2 (en) 2006-06-07 2012-07-24 Sony Mobile Communications Japan, Inc. Information processing device, information processing method, information processing program, and portable terminal device
JP2011065237A (ja) * 2009-09-15 2011-03-31 Konica Minolta Business Technologies Inc 画像送信装置、画像送信方法および画像送信プログラム
US8615395B2 (en) 2009-09-15 2013-12-24 Konica Minolta Business Technologies, Inc. Generating a display screen in response to detecting keywords in speech
JP2019161258A (ja) * 2018-03-07 2019-09-19 沖電気工業株式会社 通信装置、通信システム、通信方法およびプログラム
WO2022009682A1 (ja) * 2020-07-06 2022-01-13 株式会社VICode 画像コード読み取りシステム、画像コード読み取り方法、およびプログラム

Similar Documents

Publication Publication Date Title
JP3620855B2 (ja) オーディオおよびマルチメディア会議を記録して索引をつける方法と装置
US5907604A (en) Image icon associated with caller ID
US9414013B2 (en) Displaying participant information in a videoconference
US8487976B2 (en) Participant authentication for a videoconference
US8125509B2 (en) Facial recognition for a videoconference
US8120638B2 (en) Speech to text conversion in a videoconference
US20050192808A1 (en) Use of speech recognition for identification and classification of images in a camera-equipped mobile handset
US20030025786A1 (en) Method and system for saving and applying a video address from a video conference
EP2491533A2 (en) Automatic labeling of a video session
JP2000196776A (ja) テレビ電話機能付きディスプレイ装置、テレビ電話機能付きディスプレイ装置の制御方法及び記憶媒体
JP5152045B2 (ja) 電話装置、画像表示方法及び画像表示処理プログラム
US20100322401A1 (en) Methods for transmitting image of person, displaying image of caller and retrieving image of person, based on tag information
US7129969B2 (en) Telephone unit having telephone directory with picture data and method for generating telephone directory with picture data
JPH09331385A (ja) 音声画像通信システムおよび画像情報検索システム
WO2002039422A2 (en) Voice telephone book service system using voice recognition and method thereof
JPH0289482A (ja) テレビ電話装置
JPH07123389A (ja) 通信会議端末装置及び通信会議装置
US20060257003A1 (en) Method for the automatic identification of entities in a digital image
CN100562031C (zh) 在无线终端中搜索电话号码的方法
WO2006028181A1 (ja) 通信端末とその通信方法
JP2019135609A (ja) 文字入力支援システム、文字入力支援制御装置、文字入力支援プログラム
JP2777012B2 (ja) 通信端末装置
JPH04310053A (ja) テレビ電話装置
JPH10107889A (ja) テレビ電話装置および通話相手検索方法
JPH08130720A (ja) テレビ電話装置