JP2003143256A - 端末装置と通信制御方法 - Google Patents

端末装置と通信制御方法

Info

Publication number
JP2003143256A
JP2003143256A JP2001332769A JP2001332769A JP2003143256A JP 2003143256 A JP2003143256 A JP 2003143256A JP 2001332769 A JP2001332769 A JP 2001332769A JP 2001332769 A JP2001332769 A JP 2001332769A JP 2003143256 A JP2003143256 A JP 2003143256A
Authority
JP
Japan
Prior art keywords
voice
signal
text data
terminal
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001332769A
Other languages
English (en)
Inventor
Naoki Hikishima
直樹 疋島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001332769A priority Critical patent/JP2003143256A/ja
Priority to US10/282,094 priority patent/US7489767B2/en
Priority to CNB021602530A priority patent/CN1253040C/zh
Priority to GB0225247A priority patent/GB2382208A/en
Publication of JP2003143256A publication Critical patent/JP2003143256A/ja
Priority to HK03106967.3A priority patent/HK1054834B/xx
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72475User interfaces specially adapted for cordless or mobile telephones specially adapted for disabled users
    • H04M1/72478User interfaces specially adapted for cordless or mobile telephones specially adapted for disabled users for hearing-impaired users
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6058Portable telephones adapted for handsfree use involving the use of a headset accessory device connected to the portable telephone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. short messaging services [SMS] or e-mails
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72439User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for image or video messaging
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/18Information format or content conversion, e.g. adaptation by the network of the transmitted or received information for the purpose of wireless delivery to users or terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 【課題】音声認識を利用することで、相手の会話の内容
を明確に知ることができ、聴き取りが困難な環境下でも
通話可能とする端末装置及び通信制御方法の提供。 【解決手段】圧縮符号化されて伝送された通話相手の音
声信号を受信回路8で受信し、復調回路9及び伸長回路
10で復調及び伸長されたデジタル音声信号を受け取っ
て音声認識し、テキストデータに変換する音声認識回路
15を備え、制御部14は、音声認識回路15で変換さ
れたテキストデータを受けとり該テキストデータを表示
部16に表示させる制御を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、移動体通信システ
ムに関し、特に、移動体通信網等において通話相手の会
話を音声認識する機能を具備した端末装置及び通信制御
方法に関する。
【0002】
【従来の技術】移動体通信設備をなす基地局と無線回線
にて接続し交換局、電話網等を介して接続相手の電話端
末と接続する携帯電話装置(移動局(MS(mobile stat
ion)),あるいは「mobile phone」ともいう)等の通
信端末装置を用いて、騒音環境で通話する場合、接続相
手の通話内容が周囲騒音に妨害され、聞き取りにくい場
合がある。騒音環境下でも、相手の会話の内容を知るこ
とができ、聞き取りが困難な環境下でも通話可能とした
携帯電話装置の実現により、その利用範囲、利便性を増
大する。
【0003】なお、音声信号を文字データに変換する音
声認識手段を備えた携帯電話装置として、例えば特開平
11−168552号公報には、通話中の会話の内容等
を録音する音声メモ機能を有する携帯電話装置におい
て、音声データを文字データに変換する音声認識手段を
備え、変換された文字データをメモリに書き込むこと
で、一件あたりの音声メモに必要なデータサイズを大幅
に縮減するようにした携帯電話装置が開示されている。
上記特開平11−168552号公報に記載された装置
は、音声メモ用のメモリの有効利用を図るために、文字
データに変換してメモリに格納するというものであり、
利用者が相手の会話を即時に出力するための手段を欠い
ている。
【0004】
【発明が解決しようとする課題】したがって、本発明が
解決しようとする課題は、音声認識を利用することで、
相手の会話の内容を明確に知ることができ、例えば聞き
取りが困難な環境下でも通話可能とする端末装置及び通
信制御方法を提供することにある。
【0005】
【課題を解決するための手段】上記課題を解決するため
の手段を提供する本発明に係る装置は、接続相手の端末
と通話接続時に、音声認識モードに設定されている場
合、前記接続相手の端末から送信された通話相手の音声
をデジタル音声信号として受け取って音声認識しテキス
トデータに変換する音声認識手段と、前記音声認識手段
で変換されたテキストデータを出力手段から出力させる
制御を行う制御手段と、を備えている。
【0006】本発明に係る装置においては、音声認識の
開始を指示するための操作キーを備え、前記操作キーの
操作を受けて、前記操作キーの操作時点から、前記通話
相手の会話を、前記音声認識手段にて音声認識し、テキ
ストデータへの変換を開始するように制御する手段を備
えた構成としてもよい。
【0007】本発明に係る装置においては、接続相手の
音声信号を音声認識してテキストデータに変換する音声
認識手段と、前記接続相手の音声信号の音声認識結果の
テキストデータを前記接続相手の端末に送信する手段
と、を備え、前記接続相手の端末から送信された音声認
識結果のテキストデータを表示手段に表示する構成とし
てもよい。
【0008】本発明に係る装置においては、利用者が音
声入力手段より入力した音声を音声認識してテキストデ
ータに変換する音声認識手段と、前記音声認識結果であ
るテキストデータを接続相手の端末に送信する手段と、
を備えた構成としてもよい。
【0009】本発明の他のアスペクトに係るシステム
は、一の端末と他の端末との間で送受される音声信号を
伝送する通信網上の少なくとも一のノードが、前記伝送
される音声信号を受け取って音声認識しテキストデータ
に変換する手段を備え、前記変換されたテキストデータ
が、前記通信網上のノードから前記音声信号の受け手側
の端末、又は、前記音声信号の受け手と送り手側の双方
の端末に伝送される、構成とされている。
【0010】本発明の他のアスペクトに係る通信制御方
法は、互いに通信接続する複数の端末のうちの一の端末
が、他の端末から送信された通話相手の音声を復調及び
伸張してなるデジタル音声信号を受け取って音声認識し
テキストデータに変換するステップと、前記一の端末に
おいて前記テキストデータを出力手段から出力するステ
ップと、を有する。
【0011】以下の実施の形態の説明からも、当業者に
は明らかであるように、上記課題は、特許請求の範囲の
各請求項の発明によっても同様にして解決される。
【0012】
【発明の実施の形態】本発明の実施の形態について説明
する。本発明に係る端末装置は、その好ましい一実施の
形態において、図1を参照すると、接続相手の端末と通
話接続時、受信回路で受信された通話相手の会話の音声
信号を、復調回路及び伸張回路で復調及び伸張したデジ
タル音声信号を受け取って音声認識し、テキストデータ
に変換する音声認識手段(15)を備え、音声認識手段
(15)から出力されるテキストデータを受け取り、表
示手段(16)に供給して表示するように制御する制御
手段(14)を備えている。
【0013】より詳細には、本発明に係る端末装置は、
その好ましい一実施の形態において、図1を参照する
と、音声入力手段(図1の7、28)から入力されデジ
タル信号に変換された音声信号を圧縮して出力する音声
圧縮手段(5)と、音声圧縮手段(5)からの出力信号
を変調して出力する変調手段(4)と、変調手段の出力
信号を受けて無線送信する無線送信手段(3、2、1)
と、無線受信手段(1、2、8)で受信された信号を復
調して出力する復調手段(9)と、復調手段(9)で復
調された信号を受け取って伸張しデジタル音声信号を出
力する音声伸張手段(10)と、音声伸張手段(10)
から出力されるデジタル音声信号を音声認識してテキス
トデータに変換して出力する音声認識手段(15)と、
前記音声伸張手段(10)から出力されるデジタル音声
信号をアナログ信号に変換した信号を受け取って音声出
力する音声出力手段(12、28)と、音声認識モード
に設定されている場合に、前記音声伸張手段(10)で
伸張されたデジタル音声信号は、音声認識手段(15)
に入力されて音声認識が行われ、音声認識手段(15)
から出力されるテキストデータを、表示手段(16)に
供給して表示させる制御を行う制御手段(14)と、を
備えている。
【0014】本発明に係る端末装置は、その好ましい一
実施の形態において、操作キーとして、音声認識開始ボ
タン(17)を備えており、音声認識開始ボタン(1
7)が押下された際に、制御手段(14)は、このボタ
ンの押下時点からの通話相手の会話を、音声認識手段
(15)にて音声認識し、テキストデータへの変換を開
始するように制御する。
【0015】あるいは、本発明に係る端末装置は、その
好ましい一実施の形態において、周囲の騒音レベルを監
視し騒音レベルが所定の閾値を超えたと判断したとき、
自動で、音声認識手段(15)による音声認識処理を起
動する構成としてもよい。
【0016】さらに、本発明に係る端末装置は、その好
ましい別の実施の形態において、図3を参照すると、通
話相手の会話を音声認識してテキストデータに変換する
音声認識手段(15)と、通話相手の会話の音声認識結
果を、テキストデータにて通話相手の端末に送信する手
段(14、24)を備え、テキストデータを受け取った
通話相手の端末では、その表示手段(16)に、前記テ
キストデータが表示される。本発明に係る端末装置は、
その好ましい別の実施の形態において、携帯テレビ電話
機能付きである場合に、音声認識結果のテキストデータ
を接続相手の端末に送信される映像情報に多重して、前
記接続相手の端末に送信する。
【0017】より詳細には、本発明に係る端末装置の別
の実施の形態において、図3を参照すると、入力された
音声信号を音声認識しテキストデータに変換して出力す
る音声認識手段(15)と、音声認識結果のテキストデ
ータと、映像入力手段(21)から入力され第1のアナ
ログデジタル変換手段(20)でデジタル信号に変換さ
れた映像情報とを入力しこれらを多重して出力する第1
の多重手段(24)と、第1の多重手段(24)の出力
を受けて圧縮する映像圧縮手段(19)と、音声入力手
段(7、28)から入力され第2のアナログデジタル変
換手段(6)でデジタル信号に変換された音声信号を圧
縮する音声圧縮手段(5)と、映像圧縮手段(19)の
出力と音声圧縮手段(5)の出力とを入力しこれらを多
重して出力する第2の多重手段(18)と、第2の多重
手段(18)の出力を変調する変調手段(4)と、変調
手段(4)の出力を受けて無線送信する無線送信手段
(3、2、1)と、無線受信手段(1、2、8)で受信
された信号を復調する復調手段(9)と、復調手段
(9)で復調された信号を入力し映像信号と音声信号と
に分離して出力する分離手段(22)と、分離手段(2
2)で分離された映像信号を受け取り該映像信号を伸張
して出力する映像伸張手段(23)と、分離手段(2
2)で分離された前記音声信号を受け取り前記音声信号
を伸張して出力する音声伸張手段(10)と、映像伸張
手段(23)で伸張されたデジタル映像信号をアナログ
映像信号に変換する第1のデジタルアナログ変換手段
(25)と、第1のデジタルアナログ変換手段(25)
からのアナログ映像信号を表示する表示手段(16)
と、音声伸張手段(10)で伸張されたデジタル音声信
号をアナログ音声信号に変換する第2のデジタルアナロ
グ変換手段(11)と、第2のデジタルアナログ変換手
段(11)からの音声信号を出力する音声出力手段(1
2、28)と、を備え、音声認識モードに設定されてい
る場合、音声伸張手段(10)で伸張されたデジタル音
声信号は、音声認識手段(15)に入力されて音声認識
が行われ、音声認識手段(15)から出力されるテキス
トデータを、第1の多重手段(24)に供給するように
制御する制御手段(14)を備えている。この実施の形
態においても、音声認識開始ボタン(17)が押下され
た場合に、音声認識手段(15)によって音声認識が行
われる。
【0018】本発明は、第3の実施の形態において、図
7を参照すると、音声入力手段(7、28)から入力さ
れアナログデジタル変換手段(6)でデジタル信号に変
換された音声信号を圧縮して出力する音声圧縮手段
(5)と、デジタル信号に変換された音声信号を音声認
識してテキストデータに変換して出力する音声認識手段
(15)と、音声圧縮手段(5)の出力を変調する第1
の変調手段(4)と、テキストデータを変調する第2の
変調手段(31)と、第1、第2の変調手段(4、3
1)の出力を受けて多重する多重手段(30)と、多重
手段(30)の出力を受けて無線送信する無線送信手段
(3、2、1)と、無線受信手段(1、2、8)で受信
された信号をテキストデータと音声データに分離する分
離手段(33)と、分離手段(33)で分離された前記
音声信号を受け取り前記音声信号を復調する第1の復調
手段(9)と、分離手段(33)で分離された前記テキ
ストデータを受け取り復調する第2の復調手段(32)
と、前記第1の復調手段の出力を伸張して出力する音声
伸張手段(10)と、音声伸張手段(10)で伸張され
たデジタル音声信号をデジタルアナログ変換手段(1
1)でアナログ信号に変換した信号を入力して出力する
音声出力手段(12、28)と、を備え、第2の復調手
段(32)は復調したテキストデータを、制御手段(1
4)にわたし、制御手段(14)は、第2の復調手段
(32)で復調したテキストデータを受け取り、表示手
段(16)にテキストデータを表示し、前記第2の変調
手段(31)に供給し、音声認識手段(15)からのテ
キストデータを前記第2の変調手段(31)に供給する
制御を行う。
【0019】さらに本発明は、第4の実施の形態におい
て、図10を参照すると、音声入力手段(7、28)か
ら入力されアナログデジタル変換手段(6)でデジタル
信号に変換された音声信号を圧縮して出力する音声圧縮
手段(5)と、デジタル信号に変換された音声信号を音
声認識してテキストデータに変換して出力する音声認識
手段(15)と、前記テキストデータと、映像入力手段
(21)から入力されアナログデジタル変換手段(2
0)でデジタル信号に変換された映像情報と、を入力
し、これらを多重して出力する第1の多重手段(24)
と、第1の多重手段(24)の出力を受けて圧縮して出
力する映像圧縮手段(19)と、前記映像圧縮手段の出
力と前記音声圧縮手段の出力とを入力し、これらを多重
して出力する第2の多重手段(18)と、第2の多重手
段(18)の出力を変調する変調手段(4)と、変調手
段(4)の出力を受けて無線送信する無線送信手段
(3、2、1)と、無線受信手段(1、2、8)で受信
された信号を復調する復調手段(9)と、復調手段
(9)で復調された信号を入力し映像信号と音声信号と
に分離して出力する分離手段(22)と、分離手段(2
2)で分離された前記映像信号を受け取り前記映像信号
を伸張して出力する映像伸張手段(23)と、分離手段
(22)で分離された前記音声信号を受け取り前記音声
信号を伸張して出力する音声伸張手段(10)と、映像
伸張手段(23)で伸張されたデジタル映像信号をデジ
タルアナログ変換手段(25)でアナログ信号に変換し
た信号を入力して表示する表示手段(16)と、前記音
声伸張手段で伸張されたデジタル音声信号をデジタルア
ナログ変換手段(11)でアナログ信号に変換した信号
を入力して出力する音声出力手段(12)と、音声認識
モードに設定されている場合、音声認識手段(15)に
入力されて音声認識が行われたテキストデータを入力し
前記第1の多重手段(24)に供給する制御を行う制御
手段(14)を備えている。制御手段(14)は、テキ
ストデータを表示手段(16)にも出力する。
【0020】本発明は、第5の実施の形態において、図
13を参照すると、通信網上の一ノードをなす交換局
(36)で、音声通話接続がなされている音声信号を入
力して音声認識し、音声認識結果であるテキストデータ
を、音声信号に多重して、音声信号の受け手側の端末
と、音声信号の送り手側の端末に送信する手段(42、
43、38、39)を備えている。あるいは、音声認識
を端末側で行い、端末のバットリ残量あるいは負荷状況
に応じて、もしくは端末からの要求に応じて、通信網上
で音声認識を行うように切替制御する構成としてもよ
い。
【0021】本発明に係る方法は、その一実施の形態に
おいて、以下のステップよりなる。
【0022】ステップ1:互いに通信接続する複数の端
末のうち一の端末が、他の端末から送信された通話相手
の音声を復調及び伸張してなるデジタル音声信号を受け
取って音声認識しテキストデータに変換する。
【0023】ステップ2:一の端末においてテキストデ
ータを表示部に表示する。
【0024】さらに次のステップ3を有する構成として
もよい。
【0025】ステップ3:前記一の端末が前記テキスト
データを前記他の端末に送信する。これにより、通話相
手の会話を音声認識した結果が前記通話相手に返送さ
れ、通話相手は、端末上で、通話相手の会話の内容を確
認することができる。
【0026】本発明に係る方法は、他の実施の形態にお
いて、以下のステップよりなる。
【0027】ステップ1:利用者の端末より利用者が入
力した音声を音声認識してテキストデータに変換する。
【0028】ステップ2:前記音声認識結果であるテキ
ストデータを接続相手の端末に送信する。
【0029】本発明に係る方法の前記他の実施の形態に
おいて、上記音声認識結果であるテキストデータは、利
用者の端末の表示部に表示される。また接続相手の端末
では、前記利用者の端末より送信されたテキストデータ
が表示部に表示される。また利用者の端末より、音声認
識結果であるテキストデータは、接続相手の端末に送信
される音声信号又は映像信号に多重して、接続相手の端
末に送信される。
【0030】
【実施例】本発明の実施の形態についてさらに詳細に説
明すべく、本発明の実施例について図面を参照して説明
する。以下では、本発明が実施される端末装置として携
帯電話装置を用いた例に即して説明する。図1は、本発
明の第1の実施例の構成を示す図である。
【0031】図1を参照すると、本発明の第1の実施例
をなす携帯電話装置は、送受信兼用のアンテナ1と、送
信信号と受信信号を切り換えるアンテナスイッチ2と、
送信する音声信号を入力するマイクロホン7と、マイク
ロホン7からのアナログ音声信号をデジタル変換するA
/Dコンバータ6と、A/Dコンバータ6から出力され
るデジタル音声信号を圧縮する音声圧縮回路5と、音声
圧縮回路5から出力される送信信号をQPSK(Quadra
ture Phase Shift Keying)変調する変調回路4と、
変調回路4から出力される送信信号を送信周波数に変換
する送信部3と、を備えている。さらに、本発明の第1
の実施例をなす携帯電話装置は、受信電波の増幅と周波
数同調検波を行う受信回路8と、受信回路8からの信号
をQPSK復調する復調回路9と、復調回路9から出力
される圧縮音声信号を伸張する音声伸張回路10と、音
声伸張回路10から出力されるデジタル受信音声信号を
アナログ音声信号に変換するD/Aコンバータ11と、
D/Aコンバータ11から出力されるアナログ信号を受
け、音声信号を出力するスピーカ12と、音声伸張回路
10で伸張された信号(通話相手からのデジタル受信音
声信音)を入力して音声認識を行いテキストデータに変
換する音声認識回路15と、制御部14からの文字や画
像を表示するLCD(Liquid Crystal Display)等の
表示部16と、全体の制御を行う制御部14と、キー、
ボタン等を有する操作部13と、音声認識を開始する音
声認識開始ボタン17と、周囲騒音が大きいときに、利
用者が装着して通話を行うためのイヤホンマイク28
と、を備えている。以下の実施例において、音声認識回
路15は、音響特徴量を抽出し辞書とのマッチングをと
る公知の音声認識エンジンよりなり、特定話者、及び不
特定話者に対応可能な構成とされている。
【0032】図2は、本発明の一実施例の携帯電話装置
の外観を示す正面図である。図2において、騒音環境等
で通話する通話者の携帯電話端末26であり、参照符号
は、図1と対応しており、1は送受信兼用のアンテナ、
7はマイクロホン、12はスピーカ、13は操作部、1
6は表示部、17は音声認識開始ボタン、28はイヤホ
ンである。通話相手の話す音声信号を音声認識により、
テキストに変換して、表示部16に27(「さんじにあ
おう」)のように表示を行う。
【0033】本発明の一実施例の携帯電話装置の動作に
ついて説明する。まず、本発明の一実施例の携帯電話装
置の送信動作について説明する。この携帯電話装置は、
基地局、基地局制御局を介して移動体交換局との間で通
話チャネルが確立され、さらに接続先と通信接続がなさ
れているものとする。図1において、マイクロホン7、
イヤホンマイク28からのアナログ音声信号はA/Dコ
ンバータ6でデジタル音声信号に変換され、音声圧縮回
路5で帯域圧縮され、変調回路4でQPSK変調され、
送信回路3で送信周波数に変換され増幅され、アンテナ
スイッチ2を経由してアンテナ部1より無線送信され
る。
【0034】次に、本発明の一実施例の携帯電話装置の
受信動作について説明する。アンテナ1で受信された通
信電波は、アンテナスイッチ2を経て、受信回路8に入
力され、受信回路8にて、受信電波の増幅と周波数同調
が行われ、受信回路8から取り出された変調信号は、復
調回路9に送られる。
【0035】復調回路9でQPSK復調されたデジタル
音声信号は、伸張回路10で伸張され、D/Aコンバー
タ11でアナログ音声信号に変換されてスピーカ12か
ら出力される。
【0036】図5は、本発明の一実施例の携帯電話装置
を用いて音声認識を行う場合の通話開始からの動作を示
したフローチャートである。図1及び図5を参照して、
本発明の一実施例の携帯電話装置で音声認識を行う場合
の処理を説明する。通話を開始したとき、騒音環境か否
かを通話者が判断し(ステップS1)、騒音環境にな
く、通話相手の会話が明瞭に聞き取ることができるとき
は、そのまま通話を継続する(ステップS3)。
【0037】一方、通話者が騒音環境にあると判断した
ときには、通話者は、イヤホンマイク28を装着する
(ステップS2)。イヤホンマイク28を装着したと
き、通話相手の会話が明瞭に聞こえるときは、そのまま
会話を続ける(ステップS6)。
【0038】通話者がイヤホンマイク28を使っても、
通話相手の声が明瞭に聞き取ることができないときは、
通話者は音声認識開始ボタン17を押下し(ステップS
5)、音声認識部15で通話相手の声の音声認識を開始
し、認識結果を、テキスト表示27として、携帯電話装
置の表示部16の画面に表示する(ステップS7)。
【0039】このとき、通話相手の通話データが、受信
回路8で受信され、復調回路9でQPSK復調された
後、伸張回路10で帯域伸張され、伸張されたデジタル
音声データが音声認識部15に入力されて、音声認識処
理が行われ、その音声認識結果は、制御部14により、
表示部16の画面上に、図2の27のようにテキスト表
示される。
【0040】なお、音声認識開始ボタン17の押下によ
って音声認識部15での音声認識を起動するというマニ
ュアル操作の代わりに、携帯電話装置内部で背景の騒音
の音量(雑音レベル)等を監視し、雑音レベルを予め定
められた閾値と比較判定し、雑音レベルが閾値を超えて
いる場合に、音声認識部15による音声認識とテキスト
表示を行うように自動で制御する構成としてもよい。あ
るいは、イヤホンマイクの装着を検出し、音声認識部1
5による音声認識とテキスト表示を行うようにしてもよ
い。
【0041】テキスト表示は、表示部16の一行に横ス
クロールで表示する代わりに、表示画面中の所定のウイ
ンドウに複数行にわたって縦にスクロール表示するよう
にしてもよい。
【0042】さらに音声認識結果であるテキストデータ
を、図示されないメモリに格納しておき、後に、電子メ
ールで送信する等の機能を具備してもよい。
【0043】次に、本発明の第2の実施例について説明
する。本発明の第2の実施例の携帯電話装置は、携帯テ
レビ電話を用いて、音声認識を用いた騒音環境にある携
帯テレビ電話を実現したものである。図3は、本発明の
第2の実施例の携帯電話装置の構成を示す図であり、図
4は、その外観を示す正面図である。
【0044】図3を参照すると、本発明の第2の実施例
をなす携帯テレビ電話装置は、送受信兼用のアンテナ1
と、送信信号と受信信号を切り換えるアンテナスイッチ
2と、送信するための映像を撮影するカメラ21と、カ
メラ21からのアナログ映像信号をデジタル信号に変換
するA/Dコンバータ20と、音声認識の結果得られた
テキストデータを映像信号に重畳する(例えばテキスト
データを予め決められたタイミング(画面上の位置及び
大きさ)でビデオ信号にスーパーインポーズする)多重
回路24と、A/Dコンバータ20から出力されるデジ
タル映像信号を圧縮する映像圧縮回路19と、送信する
音声信号を入力するマイクロホン7と、マイクロホン
7、イヤホンマイク28からのアナログ音声信号をデジ
タル変換するA/Dコンバータ6と、A/Dコンバータ
6から出力されるデジタル音声信号を圧縮する音声圧縮
回路5と、映像圧縮回路19からの映像信号と音声圧縮
回路5からの音声信号を多重する多重回路18と、多重
回路18から出力される送信信号をQPSK変調する変
調回路4と、変調回路4から出力される送信信号を送信
周波数に変換する送信回路3と、を備えている。
【0045】さらに、第2の実施例の携帯テレビ電話装
置は、受信電波の増幅と周波数同調検波を行う受信回路
8と、受信回路8からの信号をQPSK復調する復調回
路9と、復調回路9で復調された信号を入力し音声信号
と映像信号を分離する分離回路22と、分離回路22で
分離された圧縮音声信号を伸張する音声伸張回路10
と、音声伸張回路10から出力されるデジタル化されて
いる受信音声信号をアナログ音声信号に変換するD/A
コンバータ11と、音声信号を出力するスピーカ12
と、分離回路22で分離された圧縮映像信号を伸張する
映像伸張回路23と、映像伸張回路23から出力される
デジタル化されている受信映像信号をアナログ映像信号
に変換するD/Aコンバータ25と、受信映像や制御部
14からの文字や映像を表示する表示部16と、全体の
制御を行う制御部14と、携帯電話の操作回路13と、
通話相手からのデジタル音声信号を音声認識を行うこと
により、テキストデータに変換する音声認識回路15
と、音声認識を開始する音声認識開始ボタン17と、を
備えている。
【0046】図4には、本発明の第2の実施例として、
騒音環境で通話する通話者の携帯テレビ電話装置26A
(図4(b)参照)と、通話相手の携帯テレビ電話装置
26B(図4(a)参照)が示されている。携帯テレビ
電話装置26Aは、通話相手の話す音声信号を音声認識
により、テキストデータに変換して、表示部16に符号
27に示すように表示を行うと同時に、通話相手の携帯
テレビ電話装置26Bにテキストデータを送信し、携帯
テレビ電話装置26Bにも、表示部16に符号29に示
すように表示を行う。
【0047】本発明の第2の実施例の携帯テレビ電話装
置の動作について、図3を参照して説明する。本発明の
第2の実施例における携帯テレビ電話装置の送信動作は
次のようにして行われる。マイクロホン7、イヤホンマ
イク28からのアナログ音声信号はA/Dコンバータ6
でデジタル信号に変換され、音声圧縮回路5で帯域圧縮
される。ビデオカメラ21で撮影されたアナログ映像信
号は、A/Dコンバータ20でデジタル信号に変換さ
れ、映像圧縮回路19で帯域圧縮される。帯域圧縮され
た映像信号は、多重回路18で、圧縮された音声信号と
多重され、以降は、音声通話のみの前記実施例の場合と
同様の経路で送信される。
【0048】次に本発明の第2の実施例における携帯テ
レビ電話装置の受信動作について説明する。受信された
音声信号は、受信回路8、復調回路9を経て、分離回路
22を経由し、分離回路22で分離された音声信号は音
声伸張回路10で伸張され、D/Aコンバータ11でア
ナログ音声信号に変換されてスピーカ12から出力され
る。
【0049】分離回路22で音声信号から分離された映
像信号は、映像伸張回路23で、送信時圧縮された映像
信号を伸張する。
【0050】映像伸張回路23で伸張されたデジタル映
像信号は、D/Aコンバータ25でアナログ映像信号に
変換され、表示部16に表示される。
【0051】図6は、本発明の第2の実施例の携帯テレ
ビ電話装置が、通話開始からの動作を示したフローチャ
ートである。図3、図4、及び図6を参照して、本発明
の第2の実施例の動作について説明する。通話を開始し
たとき、騒音環境かどうかを通話者が判断し(図6のス
テップS1)、騒音環境になく、通話相手の会話が明瞭
に聞き取ることができるときは、そのまま通話を継続す
る(ステップS3)。騒音環境にあると判断したときに
は、通話者はイヤホンマイク28を装着する(ステップ
S2)。通話者がイヤホンマイク28を装着したとき、
通話相手の会話が明瞭に聞こえるときはそのまま会話を
続ける(ステップS6)。
【0052】通話者がイヤホンマイク28を使っても通
話相手の声が明瞭に聞き取ることができないときは(ス
テップS4のNO分岐)、音声認識開始ボタン17を押
下して(ステップS5)、通話相手の声の音声認識を開
始し、その結果をテキスト表示27として携帯電話装置
26の表示部16に表示する(ステップS7)。
【0053】通話相手の通話データが、受信回路8で受
信され、復調回路9でQPSK復調された後、伸張回路
10で帯域伸張され、伸張されたデジタル音声データ
は、音声認識部15で音声認識処理が行われ、その結果
は、制御部14により、表示部16において、図4
(b)の27のようにテキスト表示される。
【0054】また、テレビ電話モードに設定されている
場合において(ステップS8のYES分岐)、送信映像
にテキストを重畳する場合(ステップS9のYES分
岐)、制御部14により、ビデオカメラ21で撮影さ
れ、A/Dコンバータ20でデジタル変換された映像信
号に、音声認識されたテキスト信号がテキスト多重回路
24で、重畳される。
【0055】テキストが重畳された映像信号は、通話相
手の携帯電話装置に送られ、図4(a)の29のように
表示される(ステップS10)。テレビ電話モードに設
定されていない場合(ステップS8のNO分岐)と、テ
レビ電話モードに設定されているが、送信映像に重畳し
ない場合(ステップS9のNO分岐)、テキストの映像
信号への重畳、通話相手の携帯電話装置への送信は行わ
れない(ステップS11)。
【0056】なお上記実施例において、音声認識開始ボ
タン17を再度押下することで、音声認識機能を停止さ
せるように制御してもよいことは勿論である。
【0057】上記した本発明の第1、第2の実施例の作
用効果について説明する。
【0058】本発明の実施例においては、デジタル移動
体通信網を介して伝送された通話相手の音声信号から、
テキストデータに変換する音声認識手段を備え、通話相
手の音声は、圧縮符号化されたデジタルデータとして伝
送されてくるため、アナログからデジタルに変換する必
要がなく、そのまま、音声認識し、テキストデータに変
換することができる。
【0059】音声信号から、音声認識手段により変換さ
れた、テキストデータを表示手段で表示することによ
り、通話相手の会話内容を理解するための補助データと
することができ、騒音環境でも会話を行うことができ
る。
【0060】通話中に、操作キーを制御することによ
り、その時点からの通話相手の会話を音声認識によりテ
キストデータへの変換を開始する操作キーを備え、騒音
環境で通話中、相手の会話内容が聞き取ることができな
い場合、キー入力により簡易に、音声認識を開始するこ
とができる。
【0061】上記実施例によれば、通話相手の会話を音
声認識によりテキストデータへの変換をし、表示部に表
示することにより、騒音環境下で音声通話の理解しにく
い部分を、音声認識されたテキスト表示を見ることによ
り、通話相手の会話の内容の理解を助けることができ
る。また、かかるテキスト表示機能は、聴覚障害者、難
聴のユーザに対しても、携帯電話装置の利便性を向上し
ている。
【0062】通話相手の会話を音声認識によりテキスト
データへの変換をし、そのテキストデータを通話相手に
も伝送し、通話相手の端末の表示部に表示することがで
きる構成とされ、騒音環境下にいる通話者の携帯電話装
置に表示されている相手の通話を音声認識し変換後のテ
キストデータを通話相手の電話機に伝送して表示し、通
話相手側でも、自分が話した内容を、テキストに変換さ
れている内容を通して確認することができる。
【0063】携帯テレビ電話装置を利用したテレビ会議
等において、通話相手の音声認識結果であるテキストデ
ータを、図示されないメモリに格納しておき,後に、会
議の議事録の一部として利用することもできる。このテ
キストデータを電子メールで配布してもよい。
【0064】なお、接続相手に伝送される音声認識結果
のテキストデータは、音声情報、映像情報等に多重化し
て情報チャネル(TCH)を用いて転送される。音声認
識結果のテキストデータは例えば日本語1文字(例えば
JIS)で2バイト、英数字等は1文字で1バイトと、
そのデータ容量(バイト数)は小さいことから、情報チ
ャネルで本来転送されるべき情報を圧迫することはな
い。また音声認識結果のテキストデータは、基地局と携
帯電話装置との間の無線チャネルのうち、制御チャネル
(CCH)等に付加して伝送してもよい。
【0065】次に本発明の第3の実施例について説明す
る。前記第1及び第2の実施例では、騒音環境下にある
携帯電話装置の側で受信音声の音声認識を行っている
が、送信側の端末で話者が入力した音声を認識し、音声
認識の結果得たテキストデータを、制御チャネルを用い
て、あるいは、音声信号に多重し、騒音環境下の携帯電
話に送り、表示するようにしている。
【0066】図7は、本発明の第3の実施例の構成を示
す図である。図7を参照すると、本発明の第3の実施例
をなす携帯電話装置は、送受信兼用のアンテナ1と、送
信信号と受信信号を切り換えるアンテナスイッチ2と、
送信する音声信号を入力するマイクロホン7と、マイク
ロホン7からのアナログ音声信号をデジタル変換するA
/Dコンバータ6と、A/Dコンバータ6から出力され
るデジタル音声信号を圧縮する音声圧縮回路5と、音声
圧縮回路5から出力される送信信号を例えばQPSK変
調する変調回路4と、制御部14から出力されるテキス
トデータを受け取り変調する変調回路31と、変調回路
4からの信号と変調回路31から出力されるテキスト変
調信号を入力して多重化して出力する多重回路30と、
多重回路30から出力される送信信号を送信周波数に変
換する送信部3と、を備えている。
【0067】さらに、この第3の実施例の携帯電話装置
は、受信電波の増幅と周波数同調検波を行う受信回路8
と、受信回路8からの信号を音声変調信号とテキスト変
調信号に分離する分離回路33と、分離回路33で分離
された音声変調信号をQPSK復調する復調回路9と、
分離回路33で分離されたテキスト変調信号を復調する
復調回路32と、復調回路9から出力される圧縮音声信
号を伸張する音声伸張回路10と、音声伸張回路10か
ら出力されるデジタル受信音声信号をアナログ音声信号
に変換するD/Aコンバータ11と、D/Aコンバータ
11から出力されるアナログ信号を受け、音声信号を出
力するスピーカ12と、A/Dコンバータ6から出力さ
れるデジタル音声信号を入力して音声認識を行いテキス
トデータに変換する音声認識回路15と、制御部14か
らの文字や画像を表示する、LCD(Liquid Crystal
Display)等の表示部16と、キー、ボタン等を有す
る操作部13と、音声認識を開始する音声認識開始ボタ
ン17と、利用者が装着して通話を行うためのイヤホン
マイク28と、全体の制御を行う制御部14とを備えて
いる。制御部14は、音声認識開始ボタン17の入力、
操作部13の入力を受け取る。また制御部14は、復調
回路32で復調されたテキストデータを受け取り、表示
部16への表示を制御する。また制御部14は、音声認
識回路15で音声認識されたテキストデータを受け取
り、表示部16へ出力する。制御部14は、音声認識回
路15で音声認識されたテキストデータを変調回路31
へ出力する。
【0068】図8は、本発明の第3の実施例の携帯電話
装置の外観を示す図である。図8の26Cは、マイクロ
ホン7からの音声入力を音声認識して送信する側の携帯
電話装置、26Dは、騒音下にありイヤホンマイク28
を用いて通話し、携帯電話装置26Cから音声認識され
たテキストデータを表示部16に表示している携帯電話
装置である。なお、携帯電話装置の参照符号は図5に示
したものと同様とされる。図9は、本発明の第3の実施
例の動作を説明するための流れ図である。
【0069】図7乃至図9を参照すると、騒音環境にあ
り、イヤホンマイク28を装着した状態で、相手の声が
明瞭に聞こえない場合(図9のステップS4がNOの場
合)、通話相手の携帯電話装置の音声認識開始ボタン1
7を押してもらう(ステップS12)。
【0070】すると、相手端末において、マイクロホン
7からのアナログ音声信号がA/Dコンバータ6でデジ
タル変換された後、音声認識部15で音声認識され、認
識された結果であるテキストデータは制御部14を経由
し、図8(a)に示すように、端末26Cにおいて、表
示部16に、符号29で示すように表示される(ステッ
プS13)。
【0071】テキストデータは、変調回路31で変調さ
れ多重回路30で変調された音声信号と多重される。多
重された信号は送信回路3で送信周波数に変換され、増
幅されてアンテナスイッチ2を経由してアンテナ部1よ
り送信される。
【0072】騒音環境下の端末では、アンテナ1で受信
した通信電波はアンテナスイッチ2を経て受信回路8に
入力される。受信回路8で受信電波の増幅と周波数同調
が行われる。受信回路8から取り出された後、変調信号
は分離回路33で音声変調信号とテキスト変調信号とに
分離される。分離されたテキスト変調信号は、復調回路
32でテキストデータに復調され、復調されたテキスト
データは、図8(b)に示すように、端末26Dにおい
て、制御部14を経由して表示部16で符号27で示す
ように表示される。
【0073】次に、本発明の第4の実施例について説明
する。この第4の実施例は、前記第3の実施例の機能
を、携帯テレビ電話の場合に適用したものである。図1
0は、本発明の第4の実施例の携帯電話装置の構成を示
す図であり、図11は、その外観の一例を示す正面図で
ある。
【0074】図10を参照すると、本発明の第4の実施
例をなす携帯テレビ電話装置は、送受信兼用のアンテナ
1と、送信信号と受信信号を切り換えるアンテナスイッ
チ2と、送信するための映像を撮影するビデオカメラ2
1と、ビデオカメラ21からのアナログ映像信号をデジ
タル信号に変換するA/Dコンバータ20と、送信する
音声信号を入力するマイクロホン7と、マイクロホン7
又はイヤホンマイク28からのアナログ音声信号をデジ
タル変換するA/Dコンバータ6と、A/Dコンバータ
6から出力されるデジタル音声信号を圧縮する音声圧縮
回路5と、A/Dコンバータ6から出力されるデジタル
音声信号を音声認識してテキストデータに変換し制御部
14に出力する音声認識回路15と、制御部14から供
給される音声認識結果であるテキストデータを、A/D
コンバータ20から出力されるデジタル映像信号に重畳
するテキスト多重回路24と、テキスト多重回路24か
ら出力されるデジタル映像信号を圧縮する映像圧縮回路
19と、映像圧縮回路19からの映像信号と、音声圧縮
回路5からの音声信号を多重する多重回路18と、多重
回路18から出力される送信信号をQPSK変調する変
調回路4と、変調回路4から出力される送信信号を送信
周波数に変換する送信回路3と、を備えている。
【0075】さらに、この第4の実施例の携帯電話装置
は、受信電波の増幅と周波数同調検波を行う受信回路8
と、受信回路8からの信号をQPSK復調する復調回路
9と、復調回路9で復調された信号を入力し音声信号と
映像信号を分離する分離回路22と、分離回路22で分
離された圧縮音声信号を伸張する音声伸張回路10と、
音声伸張回路10から出力されるデジタル化されている
受信音声信号をアナログ音声信号に変換するD/Aコン
バータ11と、音声信号を出力するスピーカ12と、分
離回路22で分離された圧縮映像信号を伸張する映像伸
張回路23と、映像伸張回路23から出力されるデジタ
ル化されている受信映像信号をアナログ映像信号に変換
するD/Aコンバータ25と、受信映像や制御部14か
らの文字や映像を表示する表示部16と、全体の制御を
行う制御部14と、携帯電話の操作回路13と、音声認
識を開始する音声認識開始ボタン17と、を備えてい
る。
【0076】図12は、本発明の第4の実施例の動作を
説明するための流れ図である。図10乃至図12を参照
して、本発明の第4の実施例の動作について説明する。
騒音環境下で、通話相手の声が明瞭に聞こえない場合
(図12のステップS4のNO)で、テレビ電話モード
の場合(ステップS14のYES)、通話相手に、音声
認識開始ボタン17を押してもらう(ステップS1
5)。
【0077】通話相手の端末では、マイクロホン7から
のアナログ音声信号をA/Dコンバータ6でデジタル変
換されたデジタル音声信号は、音声認識回路15で音声
認識される。
【0078】音声認識の結果として出力されるテキスト
データは、図11(a)の装置26Eにおいて、制御部
14を経由して表示部16に29のように表示する(ス
テップS16)。音声認識の結果として制御部14から
出力されるテキストデータはテキスト重畳回路24に入
力され、ビデオカメラ21で撮影され、A/Dコンバー
タ20でデジタル変換された映像信号に重畳される。そ
の後、テキスト重畳された映像信号は、映像圧縮回路1
9で帯域圧縮された後、多重回路18で音声信号と多重
されて相手端末に送信される。
【0079】次に、テキストデータと映像信号と音声信
号が多重化されて伝送される信号を受け取る側の端末の
受信動作の経路について説明する。受信回路8、復調回
路9を経て、分離回路22を経由し、デジタルの映像信
号と音声信号に分離され、映像信号は、映像伸張回路2
3で、送信時圧縮された映像信号を伸張する。伸張され
た映像信号はD/Aコンバータ25でアナログ映像信号
に変換され、表示部16に表示される。映像信号に多重
されたテキストデータは、図11(b)の装置26Fに
おいて、表示部16に27のように表示される(ステッ
プ12のS17)。
【0080】この実施例では、話者側で音声認識した結
果のテキストデータを相手側端末に送信する構成とした
ことにより、伝送系等でのノイズを受けることなく、相
手側端末に表示させることができる。
【0081】次に、第5の実施例について説明する。前
記各実施例では、通信端末側で音声認識を行っている
が、端末間の通信網で音声信号の音声認識を行ってもよ
いことは勿論である。音声認識の開始は、通信端末から
の指示で行う場合、通信事業者が通信網で常時行うよう
にしてもよい。あるいは、通信端末と通信網側で分散処
理して行ってもよい。
【0082】図13は、本発明の第5の実施例として、
交換局36で音声認識を行う場合の構成の一例を示して
いる。交換局36は、基地局35に接続する側から、交
換局インタフェース37、交換機40、交換局インタフ
ェース41を備え、交換機40と交換局インタフェース
37の間の双方の経路に、音声認識回路42による音声
認識結果をテキスト変換回路43でテキストデータに変
換したものと音声信号を多重する多重回路38、39を
備えている。
【0083】騒音環境下の端末26と通話している端末
26’からの音声データは、交換機40で交換された
後、音声認識回路42で、音声認識され、テキスト変換
回路43でテキストデータに変換され、多重回路38
で、交換機40から出力された音声信号と多重される。
【0084】テキストデータが多重された音声信号は、
交換局インタフェース37を経由して騒音環境下の端末
26に送られ、前記第1の実施例と同様にして、端末2
6の表示部にテキストデータが表示される。
【0085】交換局36で、騒音環境下の端末26から
の音声信号に、テキスト変換回路43からのテキストデ
ータが重畳され、端末26’の表示部でも、テキストデ
ータが表示され、端末26’側の話者も音声認識結果を
確認することができる。なお、騒音環境下の端末26
が、前記第1の実施例の携帯電話装置よりなり、交換局
36側では、端末26の負荷状況に基づき、あるいは、
端末26からの要求により、音声認識回路42で音声認
識を行い、テキスト変換回路43でテキストデータに変
換する構成としてもよい。
【0086】現在のPDC移動体パケット通信システム
(第2世代)、及び次世代移動通信IMT−2000で
はインターネットへの簡易なアクセス能力が提供され
る。したがって、本発明において、音声認識が行われる
通信網上のノードとしては、上記した交換局に限定され
るものでなく、音声信号等をパケット化して伝送するゲ
ートウエイ、ルータ等で音声認識を行い、音声認識結果
をパケットに挿入して相手端末宛てに経路選択して伝送
構成としてもよい。例えば3GPP(Third Generatio
n Partnership Project)のコアネットワーク方式で
は、図14に示すように、回線交換機能(MSC(Mobi
le services Switching Center)/GMSC(Gatew
ay MSC))とパケット交換機能(PDSN(Packet D
ata Serving Node)/PDGN(Packet Data Gate
way Node))を単一ノードに統合化することで、音声
トラフィックから各種メディアを統合的に交換・伝送で
きることが知られている。ユーザIP(internet prot
ocol)パケットをノードATM(Asynchronous Transf
er Mode)アドレスに基づくATM−SVC(Switched
Virtual Connection)によりトネリングし、QoS(Qual
ity of Services)を提供しているが、このコアネッ
トワークで音声の認識を行い、回線交換又はパケット交
換で交換・伝送される音声データに、音声認識結果であ
るテキストデータを付加して宛先端末に伝送するように
してもよい。図14に示したコアネットワークは、立川
敬二監修、「W−CDMA移動通信方式」、丸善(株)
発行、平成13年6月25日発行の第239頁の図4.
2、あるいは、木下 耕太著、「やさしいIMT−20
00 第3世代移動通信方式」、電気通信協会、平成1
3年5月10日発行、第81頁の図5.2が参照され
る。
【0087】上記実施例によれば、通信網側で、音声認
識した結果のテキストデータを接続先端末に送信する構
成としたことにより、音声認識処理を実行するDSP
(デジタル信号プロセッサ)等の処理負荷を削減し、バ
ッテリ駆動の端末の消費電流の増大を抑止することがで
きる。
【0088】上記した各実施例では、携帯電話装置の構
成として、表示部と音声通話部とが一体型とされた例に
基づき説明したが、音声通話部と、映像表示のための表
示部とを着脱自在な構成とし、音声通話部と、表示部を
分離し単独に使用可能とした構成としてもよい。音声通
話部を映像表示/撮像部から分離独立させた携帯電話装
置については、本願発明者による特開2000−502
23号公報等が参照される。映像表示/撮像部と、音声
通話部は、赤外線、Bluetooth等の無線で通信する構成
としてもよい。音声通話部と、表示部を分離し単独に使
用可能とした構成の場合、利用者はイヤホンマイクを装
着することなく、表示部に表示されるテキストを見るこ
とができる。
【0089】携帯電話装置は、PHS(Personal Hand
yphone System)端末、携帯情報端末(PDA)等であ
ってもよいことは勿論である。あるいは、VoIP(Voice
OverIP)機能を備えたパソコン等の端末であってもよ
い。以上本発明を上記実施例に即して説明したが、本発
明は、上記実施例の構成にのみ限定されるものでなく、
特許請求の範囲の各請求項の発明の範囲内で、当業者で
あればなし得るであろう各種変形、修正を含むことは勿
論である。
【0090】
【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。
【0091】本発明によれば、通話相手の音声信号をテ
キストデータに変換する音声認識手段を備えたことによ
り、通話相手の会話内容の理解を助け、例えば騒音環境
でも会話を行うことができる、という効果を奏する。
【0092】本発明によれば、通話中に、キーの操作時
点からの通話相手の会話を音声認識によりテキストデー
タへの変換を開始する操作キーを備え、騒音環境で通話
中、相手の会話内容が聞き取ることができない場合、キ
ー入力により簡易に、音声認識を開始することができ
る、という効果を奏する。
【0093】さらに、本発明によれば、通話相手の会話
を音声認識によりテキストデータへ変換して、該テキス
トデータを通話相手に伝送し、通話相手の端末の表示部
にも表示できるようにしたことにより、通話相手側でも
自分が話した内容を、テキストに変換されている内容を
通して知ることができ、利便性を向上している。
【0094】本発明によれば、話者側で音声認識した結
果のテキストデータを相手側端末に送信する構成とした
ことにより、伝送系等でのノイズを受けることなく、相
手側端末に表示させることができる。
【0095】本発明によれば、通信網側で、音声認識し
た結果のテキストデータを接続先端末に送信する構成と
したことにより、端末での処理負荷を低減し、バッテリ
駆動の端末の消費電力の増大を抑止低減することができ
る。
【図面の簡単な説明】
【図1】本発明の第1の実施例の携帯電話装置の構成を
示す図である。
【図2】本発明の第1の実施例の携帯電話装置の外観を
示す図である。
【図3】本発明の第2の実施例の携帯電話装置の構成を
示す図である。
【図4】本発明の第2の実施例の携帯電話装置の外観を
示す図である。
【図5】本発明の第1の実施例の携帯電話装置の動作を
説明するための流れ図である。
【図6】本発明の第2の実施例の携帯電話装置の動作を
説明するための流れ図である。
【図7】本発明の第3の実施例の携帯電話装置の構成を
示す図である。
【図8】本発明の第3の実施例の携帯電話装置の外観を
示す図である。
【図9】本発明の第3の実施例の携帯電話装置の動作を
説明するための流れ図である。
【図10】本発明の第4の実施例の携帯電話装置の構成
を示す図である。
【図11】本発明の第4の実施例の携帯電話装置の外観
を示す図である。
【図12】本発明の第4の実施例の携帯電話装置の動作
を説明するための流れ図である。
【図13】本発明の第5の実施例の交換局の構成を示す
図である。
【図14】本発明が適用される3GPPコアネットワーク
の構成を示す図である。
【符号の説明】
1 送受信兼用のアンテナ 2 アンテナスイッチ 3 送信部 4 変調回路 5 音声圧縮回路 6、20 A/Dコンバータ 7 マイクロホン 8 受信回路 9 復調回路 10 音声伸張回路 11、25 D/Aコンバータ 12 スピーカ 13 操作部 14 制御部 15 音声認識回路 16 表示部 17 音声認識開始ボタン 18 多重回路 19 映像圧縮回路 21 ビデオカメラ 22 分離回路 23 映像伸張回路 24 多重回路 26、26C、26D 携帯電話装置 26A、26B、26E、26F 携帯テレビ電話装置 27、29 テキスト表示 28 イヤホンマイク 30 多重回路 31 変調回路 32 復調回路 33 分離回路 35 基地局 36 交換局 37、41 交換局インタフェース 38、39 多重回路 40 交換機 42 音声認識回路 43 テキスト変換回路

Claims (38)

    【特許請求の範囲】
  1. 【請求項1】接続相手の端末と通話接続時に、音声認識
    モードに設定されている場合、前記接続相手の端末から
    送信された通話相手の音声をデジタル音声信号として受
    け取って音声認識しテキストデータに変換する音声認識
    手段と、 前記音声認識手段で変換されたテキストデータを出力手
    段から出力させる制御を行う制御手段と、 を備えている、ことを特徴とする端末装置。
  2. 【請求項2】前記出力手段が、表示手段よりなり、前記
    テキストデータが前記表示手段に表示される、ことを特
    徴とする請求項1に記載の端末装置。
  3. 【請求項3】前記出力手段として、前記音声認識手段か
    ら出力される前記テキストデータを前記接続相手の端末
    に送信する手段を備えている、ことを特徴とする請求項
    1又は2に記載の端末装置。
  4. 【請求項4】接続相手の端末から送信された音声信号を
    音声認識してテキストデータに変換する音声認識手段
    と、 前記音声認識結果のテキストデータを前記接続相手の端
    末に送信する手段と、 を備えている、ことを特徴とする端末装置。
  5. 【請求項5】請求項4に記載の前記端末装置と通信接続
    する端末装置であって、 請求項4に記載の前記端末装置から送信される前記テキ
    ストデータを受け取り表示手段に表示する制御を行う手
    段を備えている、ことを特徴とする端末装置。
  6. 【請求項6】接続相手の端末から送信された音声信号を
    音声認識してテキストデータに変換する音声認識手段
    と、 前記音声認識結果のテキストデータを前記接続相手の端
    末に送信する手段と、 接続相手の端末から送信された信号からテキストデータ
    を取りだし前記テキストデータを表示手段に表示させる
    制御を行う手段と、 を備えている、ことを特徴とする端末装置。
  7. 【請求項7】前記音声認識結果のテキストデータを、前
    記接続相手の端末に送信される信号に多重して前記接続
    相手の端末に送信する手段を備えている、ことを特徴と
    する請求項6に記載の端末装置。
  8. 【請求項8】前記音声認識結果のテキストデータを、前
    記接続相手の端末に送信される映像情報に多重して前記
    接続相手の端末に送信する手段を備えている、ことを特
    徴とする請求項6に記載の端末装置。
  9. 【請求項9】前記音声認識手段は、前記接続相手の端末
    から送信された通話相手の音声を復調手段で復調し伸張
    手段で伸張してなるデジタル音声信号を入力として受け
    取り音声認識を行う、ことを特徴とする請求項1乃至
    4、請求項6乃至8のいずれか一に記載の端末装置。
  10. 【請求項10】音声入力手段から入力されデジタル信号
    に変換された音声信号を圧縮して出力する音声圧縮手段
    と、 前記音声圧縮手段からの出力信号を変調して出力する変
    調手段と、 前記変調手段の出力信号を受けて無線送信する無線送信
    手段と、 無線受信手段で受信された信号を復調して出力する復調
    手段と、 前記復調手段で復調された信号を受け取って伸張しデジ
    タル音声信号を出力する音声伸張手段と、 前記音声伸張手段から出力されるデジタル音声信号を音
    声認識してテキストデータに変換して出力する音声認識
    手段と、 前記音声伸張手段から出力されるデジタル音声信号をア
    ナログ信号に変換した信号を受け取って音声出力する音
    声出力手段と、 音声認識モードに設定されている場合に、前記音声伸張
    手段で伸張された前記デジタル音声信号は、前記音声認
    識手段に入力されて音声認識が行われ、前記音声認識手
    段から出力されるテキストデータを、表示手段に供給し
    て表示させる制御を行う制御手段と、 を備えている、ことを特徴とする端末装置。
  11. 【請求項11】入力された音声信号を音声認識してテキ
    ストデータに変換して出力する音声認識手段と、 前記音声認識手段から出力される音声認識結果のテキス
    トデータと、映像入力手段から入力されデジタル信号に
    変換された映像情報とを入力し、これらを多重して出力
    する第1の多重手段と、 前記第1の多重手段の出力信号を受け圧縮して出力する
    映像圧縮手段と、 音声入力手段から入力されデジタル信号に変換された音
    声信号を圧縮して出力する音声圧縮手段と、 前記映像圧縮手段からの出力信号と前記音声圧縮手段か
    らの出力信号とを入力し、これらの信号を多重して出力
    する第2の多重手段と、 前記第2の多重手段の出力信号を変調して出力する変調
    手段と、 前記変調手段の出力信号を受けて無線送信する無線送信
    手段と、 無線受信手段で受信された信号を復調して出力する復調
    手段と、 前記復調手段で復調された信号を入力し映像信号と音声
    信号とに分離して出力する分離手段と、 前記分離手段で分離された前記映像信号を受け取って伸
    張しデジタル映像信号を出力する映像伸張手段と、 前記分離手段で分離された前記音声信号を受け取って伸
    張しデジタル音声信号を出力する音声伸張手段と、 前記映像伸張手段から出力されるデジタル映像信号をア
    ナログ信号に変換した信号を受け取って表示する表示手
    段と、 前記音声伸張手段から出力されるデジタル音声信号をア
    ナログ信号に変換した信号を受け取って音声出力する音
    声出力手段と、 音声認識モードに設定されている場合に、前記音声伸張
    手段で伸張された前記デジタル音声信号は、前記音声認
    識手段に入力されて音声認識が行われ、前記音声認識手
    段から出力されるテキストデータを、前記第1の多重手
    段に供給する制御を行う制御手段と、 を備えている、ことを特徴とする端末装置。
  12. 【請求項12】前記制御手段が、前記音声認識手段から
    出力されるテキストデータを表示手段に供給して表示さ
    せるように制御する手段を備えている、ことを特徴とす
    る請求項11に記載の端末装置。
  13. 【請求項13】利用者が音声入力手段より入力した音声
    を音声認識してテキストデータに変換する音声認識手段
    と、 前記音声認識結果であるテキストデータを接続相手の端
    末装置に送信する手段と、 を備えている、ことを特徴とする端末装置。
  14. 【請求項14】前記音声認識結果であるテキストデータ
    が表示手段に表示される、ことを特徴とする端末装置。
  15. 【請求項15】請求項13又は14に記載の端末装置に
    接続する前記接続相手の端末装置であって、 請求項13又は14に記載の前記端末装置から送信され
    た信号からテキストデータを抽出し前記テキストデータ
    を表示手段に表示する制御を行う手段を備えている、こ
    とを特徴とする端末装置。
  16. 【請求項16】前記音声認識結果であるテキストデータ
    を、前記接続相手の端末装置に送信する音声信号、又
    は、前記接続相手の端末装置に送信する映像信号に多重
    して前記接続相手の端末装置に送信する手段を備えてい
    る、ことを特徴とする請求項13又は14に記載の端末
    装置。
  17. 【請求項17】音声入力手段から入力されデジタル信号
    に変換された音声信号を圧縮して出力する音声圧縮手段
    と、 前記音声入力手段から入力されデジタル信号に変換され
    た音声信号を音声認識してテキストデータに変換して出
    力する音声認識手段と、 前記音声圧縮手段の出力信号を変調して出力する第1の
    変調手段と、 入力されたテキストデータを変調して出力する第2の変
    調手段と、 前記第1及び第2の変調手段の出力信号を受け、これら
    の信号を多重して出力する多重手段と、 前記多重手段の出力信号を受けて無線送信する無線送信
    手段と、 無線受信手段で受信された信号をテキスト信号と音声信
    号に分離して出力する分離手段と、 前記分離手段で分離された前記音声信号を受け取り前記
    音声信号を復調して出力する第1の復調手段と、 前記分離手段で分離された前記テキスト信号を受け取り
    前記テキスト信号を復調しテキストデータを出力する第
    2の復調手段と、 前記第1の復調手段の出力信号を受け取って伸張しデジ
    タル音声信号を出力する音声伸張手段と、 前記音声伸張手段で伸張されたデジタル音声信号をアナ
    ログ信号に変換した信号を受け取り音声出力する音声出
    力手段と、 を備え、 前記第2の復調手段は、復調した前記テキストデータを
    制御手段に受けわたし、 前記制御手段は、前記第2の復調手段で復調された前記
    テキストデータを受け取り、表示手段に前記テキストデ
    ータを表示するとともに、前記第2の変調手段に供給
    し、 さらに、前記制御手段は、前記音声認識手段からのテキ
    ストデータを受け取り前記第2の変調手段に供給する制
    御を行う、ことを特徴とする端末装置。
  18. 【請求項18】音声入力手段から入力されデジタル信号
    に変換された音声信号を圧縮して出力する音声圧縮手段
    と、 前記音声入力手段から入力されデジタル信号に変換され
    た音声信号を音声認識してテキストデータに変換して出
    力する音声認識手段と、 前記テキストデータと、映像入力手段から入力されデジ
    タル信号に変換された映像情報とを入力し、これらを多
    重して出力する第1の多重手段と、 前記第1の多重手段の出力信号を受け取り圧縮した映像
    信号を出力する映像圧縮手段と、 前記映像圧縮手段からの出力信号と前記音声圧縮手段か
    らの出力信号とを入力し、これらの信号を多重して出力
    する第2の多重手段と、 前記第2の多重手段の出力信号を変調して出力する変調
    手段と、 前記変調手段の出力信号を受けて無線送信する無線送信
    手段と、 無線受信手段で受信された信号を復調して出力する復調
    手段と、 前記復調手段で復調された信号を入力し映像信号と音声
    信号とに分離して出力する分離手段と、 前記分離手段で分離された前記映像信号を受け取って伸
    張しデジタル映像信号を出力する映像伸張手段と、 前記分離手段で分離された前記音声信号を受け取って伸
    張しデジタル音声信号を出力する音声伸張手段と、 前記映像伸張手段で伸張されたデジタル映像信号をアナ
    ログ信号に変換した信号を受け取り表示する表示手段
    と、 前記音声伸張手段で伸張されたデジタル音声信号をアナ
    ログ信号に変換した信号を受け取り音声出力する音声出
    力手段と、 音声認識モードに設定されている場合に、前記音声認識
    手段で音声認識が行われて出力されるテキストデータを
    前記第1の多重手段に供給する制御を行う制御手段と、 を備えている、ことを特徴とする端末装置。
  19. 【請求項19】前記制御手段が、前記テキストデータ
    を、前記表示手段に供給して表示する、ことを特徴とす
    る請求項18に記載の端末装置。
  20. 【請求項20】音声認識の開始を指示するための操作キ
    ーを備え、 前記操作キーの所定の操作が行われた際に、前記音声認
    識手段による音声のテキストデータへの変換処理を開始
    させる手段を備えている、ことを特徴とする請求項1乃
    至4、請求項6乃至14、請求項16乃至19のいずれ
    か一に記載の端末装置。
  21. 【請求項21】監視対象の所定の信号の状態が予め定め
    られた条件を満たしている場合に、前記音声認識手段に
    よる音声のテキストデータへの変換処理を開始させる手
    段を備えている、ことを特徴とする請求項1乃至4、請
    求項6乃至14、請求項16乃至19のいずれか一に記
    載の端末装置。
  22. 【請求項22】一の端末と他の端末との間で送受される
    音声信号を伝送する通信網上の少なくとも一のノード
    が、前記伝送される音声信号を受け取って音声認識しテ
    キストデータに変換する手段を備え、 前記変換されたテキストデータが、前記通信網上の前記
    一のノードから前記音声信号の受け手側の端末、又は、
    前記音声信号の受け手と送り手側の双方の端末に伝送さ
    れる、ことを特徴とする通信システム。
  23. 【請求項23】前記音声信号の受け手、又は、前記音声
    信号の受け手と送り手の端末が、音声信号を音声認識し
    てテキストデータに変換する手段を備え、 前記音声信号の受け手及び/又は送り手の端末の負荷状
    況に基づき、あるいは、前記音声信号の受け手及び/又
    は送り手の端末からの要求により、前記通信網側で音声
    認識を行う、ことを特徴とする請求項22に記載の通信
    システム。
  24. 【請求項24】請求項1乃至4、請求項6乃至14、請
    求項16乃至21のいずれか一に記載の端末装置におい
    て、 前記端末装置が、基地局と無線通信する移動局である、
    ことを特徴とする端末装置。
  25. 【請求項25】請求項22又は23に記載の前記通信網
    に接続する端末が、基地局と無線通信する移動局であ
    る、ことを特徴とする端末装置。
  26. 【請求項26】請求項1乃至4、請求項6乃至14、請
    求項16乃至21のいずれか一に記載の端末装置におい
    て、 音声入力手段と音声出力手段とを備えた第1のユニット
    と、 表示手段を備えた第2のユニットとに互いに分離自在と
    されている、ことを特徴とする端末装置。
  27. 【請求項27】互いに通信接続する複数の端末のうち一
    の端末が、他の端末から送信された通話相手の音声を復
    調及び伸張してなるデジタル音声信号を受け取って音声
    認識しテキストデータに変換するステップと、 前記一の端末において前記テキストデータを出力手段か
    ら出力するステップと、 を含む、ことを特徴とする通信制御方法。
  28. 【請求項28】前記テキストデータを、前記一の端末に
    おいて前記出力手段をなす表示部に表示する、ことを特
    徴とする請求項27に記載の通信制御方法。
  29. 【請求項29】前記一の端末が前記テキストデータを前
    記他の端末に送信するステップを有し、通話相手の会話
    を音声認識した結果が前記通話相手に返送される、こと
    を特徴とする請求項27又は28に記載の通信制御方
    法。
  30. 【請求項30】前記他の端末において、前記一の端末か
    ら送信される前記テキストデータを前記他の端末の表示
    部に表示するステップを有する、ことを特徴とする請求
    項27又は28に記載の通信制御方法。
  31. 【請求項31】前記一の端末上での予め定められた所定
    の操作キーの操作により、あるいは、予め定められた監
    視対象の信号が所定の条件を満たしている場合に、前記
    一の端末において、通話相手の会話を音声認識し、テキ
    ストデータへの変換を開始するように制御する、ことを
    特徴とする請求項27乃至30のいずれか一に記載の通
    信制御方法。
  32. 【請求項32】一の端末が、接続相手の端末から送信さ
    れた音声信号を音声認識してテキストデータに変換する
    ステップと、 前記一の端末が、音声認識結果のテキストデータを、前
    記接続相手の端末に送信するステップと、 前記一の端末が、接続相手の端末から送信された音声認
    識結果のテキストデータを表示手段に表示させる制御を
    行うステップと、 を含む、ことを特徴とする通信制御方法。
  33. 【請求項33】前記各端末が携帯テレビ電話機能付きの
    端末よりなり、 前記一の端末は、前記音声認識結果のテキストデータを
    前記接続相手の端末に送信される映像情報に多重して前
    記接続相手の端末に送信する、ことを特徴とする請求項
    32記載の通信制御方法。
  34. 【請求項34】利用者が一の端末より入力した音声を音
    声認識してテキストデータに変換するステップと、 前記音声認識結果であるテキストデータを接続相手の端
    末に送信するステップと、 を含む、ことを特徴とする通信制御方法。
  35. 【請求項35】前記音声認識結果であるテキストデータ
    が前記一の端末の表示部に表示される、ことを特徴とす
    る請求項34記載の通信制御方法。
  36. 【請求項36】前記接続相手の端末では、前記一の端末
    より送信されたテキストデータを表示部に表示する、こ
    とを特徴とする請求項34又は35記載の通信制御方
    法。
  37. 【請求項37】前記一の端末より、音声認識結果である
    テキストデータを、前記接続相手の端末に送信される音
    声信号又は映像信号に多重して、前記接続相手の端末に
    送信するステップを含む、ことを特徴とする請求項34
    又は35記載の通信制御方法。
  38. 【請求項38】少なくとも話者の音声信号を伝送する送
    信側端末と受信側端末との間の通信網に設けられている
    音声認識装置が前記音声信号を受け取って音声認識しテ
    キストデータに変換するステップと、 前記通信網上の音声認識装置で変換されたテキストデー
    タが、受信側の端末、又は、受信側の端末と送信側の端
    末に伝送されるステップと、 を含む、ことを特徴とする通信制御方法。
JP2001332769A 2001-10-30 2001-10-30 端末装置と通信制御方法 Pending JP2003143256A (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2001332769A JP2003143256A (ja) 2001-10-30 2001-10-30 端末装置と通信制御方法
US10/282,094 US7489767B2 (en) 2001-10-30 2002-10-29 Terminal device and communication control method
CNB021602530A CN1253040C (zh) 2001-10-30 2002-10-30 终端装置和通信控制方法
GB0225247A GB2382208A (en) 2001-10-30 2002-10-30 Terminal device with speech recognition
HK03106967.3A HK1054834B (en) 2001-10-30 2003-09-26 Terminal device and communication control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001332769A JP2003143256A (ja) 2001-10-30 2001-10-30 端末装置と通信制御方法

Publications (1)

Publication Number Publication Date
JP2003143256A true JP2003143256A (ja) 2003-05-16

Family

ID=19148142

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001332769A Pending JP2003143256A (ja) 2001-10-30 2001-10-30 端末装置と通信制御方法

Country Status (4)

Country Link
US (1) US7489767B2 (ja)
JP (1) JP2003143256A (ja)
CN (1) CN1253040C (ja)
GB (1) GB2382208A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006081061A (ja) * 2004-09-13 2006-03-23 Alpine Electronics Inc 音声出力装置及び音声/映像出力装置
JP2008534999A (ja) * 2005-03-22 2008-08-28 ソニー エリクソン モバイル コミュニケーションズ, エービー 音声−テキスト変換機能を有する無線通信装置
JP2009527822A (ja) * 2006-02-16 2009-07-30 ハネウェル・インターナショナル・インコーポレーテッド 航空交通管制のための改良されたシステムおよび方法
JP2012005010A (ja) * 2010-06-21 2012-01-05 Nec Corp 情報処理システム、電話機、情報処理方法及び情報処理プログラム
US8433369B2 (en) 2009-03-16 2013-04-30 Fujitsu Mobile Communications Limited Mobile terminal and method of using text data obtained as result of voice recognition
JP2017163212A (ja) * 2016-03-07 2017-09-14 レノボ・シンガポール・プライベート・リミテッド 情報処理装置、音声通信システム、音声通信方法、及びプログラム
JP2020150550A (ja) * 2011-12-14 2020-09-17 エイディシーテクノロジー株式会社 音声再生装置、及び車両
FR3120491A1 (fr) * 2021-03-05 2022-09-09 Orange Procédé de rendu de flux audiovisuel, terminal électronique et produit programme d’ordinateur correspondant

Families Citing this family (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050048992A1 (en) * 2003-08-28 2005-03-03 Alcatel Multimode voice/screen simultaneous communication device
US7519042B2 (en) * 2003-09-12 2009-04-14 Motorola, Inc. Apparatus and method for mixed-media call formatting
JP4277207B2 (ja) * 2004-04-06 2009-06-10 日本電気株式会社 携帯型tv電話の送受信方法および携帯型tv電話端末
KR100689396B1 (ko) * 2004-10-29 2007-03-02 삼성전자주식회사 음성 인식을 이용한 통화 내역 관리 장치 및 방법
TW200625788A (en) * 2005-01-13 2006-07-16 Inventec Appliances Corp Telephony device with pitch shift function and ptich shift method
JP2006240826A (ja) * 2005-03-03 2006-09-14 Mitsubishi Electric Corp エレベータかご内表示装置
KR100690800B1 (ko) * 2005-06-10 2007-03-09 엘지전자 주식회사 음성인식을 이용한 음성 정보 저장 장치 및 방법
US9009265B2 (en) * 2005-09-28 2015-04-14 Photobucket Corporation System and method for automatic transfer of data from one device to another
US9049243B2 (en) * 2005-09-28 2015-06-02 Photobucket Corporation System and method for allowing a user to opt for automatic or selectively sending of media
BRPI0616699A2 (pt) * 2005-09-28 2011-06-28 Ontela Inc método e sistema para estabelecer um ambiente de execução de serviço-aplicação em um sistema de computação distribuìda heterogênea e uma aplicação de serviço de transferência de dados amigável ao usuário dentro do ambiente de execução do serviço-aplicação
US11128745B1 (en) * 2006-03-27 2021-09-21 Jeffrey D. Mullen Systems and methods for cellular and landline text-to-audio and audio-to-text conversion
KR20080002081A (ko) * 2006-06-30 2008-01-04 삼성전자주식회사 VoIP를 이용한 화상통신장치 및 그 운용방법
JP2008042290A (ja) * 2006-08-02 2008-02-21 Fujitsu Ltd 交換機、交換機制御プログラム、交換機制御方法
US9424270B1 (en) 2006-09-28 2016-08-23 Photobucket Corporation System and method for managing media files
GB2444755A (en) * 2006-12-11 2008-06-18 Hutchison Whampoa Three G Ip Improved message handling for mobile devices
KR20080079098A (ko) * 2007-02-26 2008-08-29 (주)씨컴인터내셔널 통화중 양방향 배경영상 제공 이동통신 단말기
WO2008109826A1 (en) 2007-03-07 2008-09-12 Personics Holdings Inc. Acoustic dampening compensation system
US11750965B2 (en) * 2007-03-07 2023-09-05 Staton Techiya, Llc Acoustic dampening compensation system
US8054954B1 (en) * 2007-06-20 2011-11-08 Avaya Inc. One touch voice memo
US8856003B2 (en) * 2008-04-30 2014-10-07 Motorola Solutions, Inc. Method for dual channel monitoring on a radio device
JP2010081457A (ja) * 2008-09-29 2010-04-08 Hitachi Ltd 情報記録再生装置およびビデオカメラ
JP4775432B2 (ja) * 2008-12-11 2011-09-21 ソニー株式会社 送信装置、受信装置、通信システム、通信方法、及びプログラム
KR101605306B1 (ko) * 2009-08-24 2016-03-22 삼성전자주식회사 이동통신 단말기에서 음성을 이용한 다이얼 입력 방법 및 장치
KR101612788B1 (ko) 2009-11-05 2016-04-18 엘지전자 주식회사 이동 단말기 및 그 제어 방법
CN116312567A (zh) * 2010-02-18 2023-06-23 株式会社尼康 便携式装置以及信息处理系统
US8805683B1 (en) * 2012-02-24 2014-08-12 Google Inc. Real-time audio recognition protocol
US8531536B2 (en) * 2011-02-17 2013-09-10 Blackberry Limited Apparatus, and associated method, for selecting information delivery manner using facial recognition
US8583431B2 (en) * 2011-08-25 2013-11-12 Harris Corporation Communications system with speech-to-text conversion and associated methods
US20130079029A1 (en) * 2011-09-28 2013-03-28 Royce A. Levien Multi-modality communication network auto-activation
US9788349B2 (en) 2011-09-28 2017-10-10 Elwha Llc Multi-modality communication auto-activation
US9794209B2 (en) 2011-09-28 2017-10-17 Elwha Llc User interface for multi-modality communication
US9503550B2 (en) 2011-09-28 2016-11-22 Elwha Llc Multi-modality communication modification
US9699632B2 (en) * 2011-09-28 2017-07-04 Elwha Llc Multi-modality communication with interceptive conversion
US9906927B2 (en) 2011-09-28 2018-02-27 Elwha Llc Multi-modality communication initiation
US9477943B2 (en) 2011-09-28 2016-10-25 Elwha Llc Multi-modality communication
US9280599B1 (en) 2012-02-24 2016-03-08 Google Inc. Interface for real-time audio recognition
US9208225B1 (en) 2012-02-24 2015-12-08 Google Inc. Incentive-based check-in
US9082413B2 (en) 2012-11-02 2015-07-14 International Business Machines Corporation Electronic transaction authentication based on sound proximity
US9286889B2 (en) * 2013-01-29 2016-03-15 International Business Machines Corporation Improving voice communication over a network
CN104023150A (zh) * 2013-02-28 2014-09-03 联想(北京)有限公司 一种信息处理方法及电子设备
CN104092712B (zh) * 2013-05-22 2016-03-23 腾讯科技(深圳)有限公司 一种基于音频信号传输文件的方法及系统
CN104216717A (zh) * 2013-05-29 2014-12-17 腾讯科技(深圳)有限公司 智能终端的控制方法和装置
US9854439B2 (en) 2014-02-07 2017-12-26 First Principles, Inc. Device and method for authenticating a user of a voice user interface and selectively managing incoming communications
WO2015199731A1 (en) * 2014-06-27 2015-12-30 Nuance Communications, Inc. System and method for allowing user intervention in a speech recognition process
CN104601880B (zh) * 2014-12-11 2018-03-27 广东欧珀移动通信有限公司 一种生成全景照片的方法及移动终端
CN104618872B (zh) * 2015-01-06 2019-05-14 深圳市金立通信设备有限公司 一种信息处理方法
US20180025175A1 (en) 2015-01-15 2018-01-25 Nec Corporation Information output device, camera, information output system, information output method, and program
US9870755B2 (en) * 2015-05-22 2018-01-16 Google Llc Prioritized display of visual content in computer presentations
EP3217638B1 (en) * 2016-03-11 2019-11-20 Sony Mobile Communications Inc Transferring information from a sender to a recipient during a telephone call under noisy environment
US20180025731A1 (en) * 2016-07-21 2018-01-25 Andrew Lovitt Cascading Specialized Recognition Engines Based on a Recognition Policy
US10546578B2 (en) 2016-12-26 2020-01-28 Samsung Electronics Co., Ltd. Method and device for transmitting and receiving audio data
KR102458343B1 (ko) * 2016-12-26 2022-10-25 삼성전자주식회사 음성 데이터를 송수신하는 디바이스 및 방법
US10748531B2 (en) * 2017-04-13 2020-08-18 Harman International Industries, Incorporated Management layer for multiple intelligent personal assistant services
US10930276B2 (en) * 2017-07-12 2021-02-23 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
US11489691B2 (en) 2017-07-12 2022-11-01 Universal Electronics Inc. Apparatus, system and method for directing voice input in a controlling device
CN118347156A (zh) * 2017-07-14 2024-07-16 大金工业株式会社 设备控制系统
WO2020245630A1 (en) * 2019-06-04 2020-12-10 Naxos Finance Sa Mobile device for communication with transcription of vocal flows

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1169969A (en) 1980-08-20 1984-06-26 Gregor N. Neff Dictation system and method
GB2183880A (en) 1985-12-05 1987-06-10 Int Standard Electric Corp Speech translator for the deaf
WO1987005735A1 (fr) 1986-03-19 1987-09-24 Zestermann, Hanno Procede et systeme de transmission de donnees sans cable
US6075842A (en) * 1988-10-11 2000-06-13 Ultratec, Inc. Text enhanced telephony
JPH0463044A (ja) 1990-06-29 1992-02-28 Fujitsu General Ltd 電話装置
JPH04222152A (ja) 1990-12-21 1992-08-12 Fujitsu General Ltd 電話装置
US5283833A (en) * 1991-09-19 1994-02-01 At&T Bell Laboratories Method and apparatus for speech processing using morphology and rhyming
JP3330183B2 (ja) * 1993-04-13 2002-09-30 松下電器産業株式会社 画像通信端末装置
JPH06303314A (ja) 1993-04-16 1994-10-28 Casio Comput Co Ltd テレビ電話装置
GB2285895A (en) * 1994-01-19 1995-07-26 Ibm Audio conferencing system which generates a set of minutes
US5651056A (en) * 1995-07-13 1997-07-22 Eting; Leon Apparatus and methods for conveying telephone numbers and other information via communication devices
US5774857A (en) 1996-11-15 1998-06-30 Motorola, Inc. Conversion of communicated speech to text for tranmission as RF modulated base band video
JP3402100B2 (ja) 1996-12-27 2003-04-28 カシオ計算機株式会社 音声制御ホスト装置
US5889852A (en) * 1997-02-10 1999-03-30 Nokia Mobile Phones Limited Photo screen scroll graphic user interface
GB2323693B (en) 1997-03-27 2001-09-26 Forum Technology Ltd Speech to text conversion
US6078886A (en) 1997-04-14 2000-06-20 At&T Corporation System and method for providing remote automatic speech recognition services via a packet network
US6393014B1 (en) * 1997-06-03 2002-05-21 At&T Wireless Services, Inc. Method and system for providing data communication with a mobile station
GB2327173B (en) * 1997-07-09 2002-05-22 Ibm Voice recognition of telephone conversations
US6222909B1 (en) * 1997-11-14 2001-04-24 Lucent Technologies Inc. Audio note taking system and method for communication devices
US6366651B1 (en) * 1998-01-21 2002-04-02 Avaya Technology Corp. Communication device having capability to convert between voice and text message
US5995590A (en) * 1998-03-05 1999-11-30 International Business Machines Corporation Method and apparatus for a communication device for use by a hearing impaired/mute or deaf person or in silent environments
ES2198758T3 (es) * 1998-09-22 2004-02-01 Nokia Corporation Procedimiento y sistema de configuracion de un sistema de reconocimiento por voz.
JP4266411B2 (ja) * 1998-10-19 2009-05-20 キヤノン株式会社 情報処理装置及びその制御方法、情報伝送システム、記憶媒体
JP2000196730A (ja) * 1998-12-25 2000-07-14 Nec Saitama Ltd 無線通信機
US6377822B1 (en) * 1999-04-28 2002-04-23 Avaya Technology Corp. Wireless telephone for visually displaying progress messages
US6829243B1 (en) * 1999-05-26 2004-12-07 Nortel Networks Limited Directory assistance for IP telephone subscribers
US6947890B1 (en) * 1999-05-28 2005-09-20 Tetsuro Kitazoe Acoustic speech recognition method and system using stereo vision neural networks with competition and cooperation
US6292781B1 (en) * 1999-05-28 2001-09-18 Motorola Method and apparatus for facilitating distributed speech processing in a communication system
KR20010019786A (ko) * 1999-08-30 2001-03-15 윤종용 이동통신 시스템에서 음성인식 및 문자표시 장치 및 방법
FI19992350L (fi) * 1999-10-29 2001-04-30 Nokia Mobile Phones Ltd Parannettu puheentunnistus
US6775651B1 (en) 2000-05-26 2004-08-10 International Business Machines Corporation Method of transcribing text from computer voice mail
GB2372864B (en) 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US6820055B2 (en) * 2001-04-26 2004-11-16 Speche Communications Systems and methods for automated audio transcription, translation, and transfer with text display software for manipulating the text
JP2003018283A (ja) * 2001-07-05 2003-01-17 Nec Corp 電話システム用発信元識別方法、及びそれを適用した発信元識別機能付き電話システム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006081061A (ja) * 2004-09-13 2006-03-23 Alpine Electronics Inc 音声出力装置及び音声/映像出力装置
JP2008534999A (ja) * 2005-03-22 2008-08-28 ソニー エリクソン モバイル コミュニケーションズ, エービー 音声−テキスト変換機能を有する無線通信装置
JP2009527822A (ja) * 2006-02-16 2009-07-30 ハネウェル・インターナショナル・インコーポレーテッド 航空交通管制のための改良されたシステムおよび方法
US8433369B2 (en) 2009-03-16 2013-04-30 Fujitsu Mobile Communications Limited Mobile terminal and method of using text data obtained as result of voice recognition
JP2012005010A (ja) * 2010-06-21 2012-01-05 Nec Corp 情報処理システム、電話機、情報処理方法及び情報処理プログラム
JP2020150550A (ja) * 2011-12-14 2020-09-17 エイディシーテクノロジー株式会社 音声再生装置、及び車両
JP2017163212A (ja) * 2016-03-07 2017-09-14 レノボ・シンガポール・プライベート・リミテッド 情報処理装置、音声通信システム、音声通信方法、及びプログラム
FR3120491A1 (fr) * 2021-03-05 2022-09-09 Orange Procédé de rendu de flux audiovisuel, terminal électronique et produit programme d’ordinateur correspondant

Also Published As

Publication number Publication date
US7489767B2 (en) 2009-02-10
CN1422098A (zh) 2003-06-04
HK1054834A1 (en) 2003-12-12
GB0225247D0 (en) 2002-12-11
GB2382208A (en) 2003-05-21
US20030081739A1 (en) 2003-05-01
CN1253040C (zh) 2006-04-19

Similar Documents

Publication Publication Date Title
US7489767B2 (en) Terminal device and communication control method
JP3475809B2 (ja) 携帯型テレビ無線電話
JP4277207B2 (ja) 携帯型tv電話の送受信方法および携帯型tv電話端末
EP1677493A1 (en) Method for offering TTY/TTD service in a wireless terminal and wireless terminal implementing the same
KR20070024262A (ko) 발신자 정보 음성 출력 기능을 가지는 무선통신 단말기 및그 방법
WO2004084527A1 (ja) 放送受信機能及び電話通信機能を有する携帯機器
JP3487280B2 (ja) 画像送信機能付き携帯電話端末
JP2000253455A (ja) 無線携帯端末
JP2003009104A (ja) テレビ電話機能付き電話機
CN1780438B (zh) 在移动通信终端中执行相机功能的方法
JP2002077840A (ja) 通信端末装置
JPH1132115A (ja) 携帯端末
JP3630948B2 (ja) 携帯用公衆テレビ電話システム
JP4600643B2 (ja) 文字表示機能を有するテレビ電話装置及びテレビ電話装置における音声の文字変換表示方法
JP3373941B2 (ja) ドアホン装置
JP4110564B2 (ja) Tv電話の音声変換システム、及び、その音声変換方法
JP4327741B2 (ja) 携帯電話機
JP2005252774A (ja) テレビ付き携帯電話機
JPH06292197A (ja) 携帯無線式tv電話
JPH07183970A (ja) 携帯電話システム
KR100450137B1 (ko) 음성 메시지 전송 방법
KR200370611Y1 (ko) 청각 장애자를 위한 진동 기능을 갖는 화상 전화기
KR20020080072A (ko) 무선 전화 기능을 갖는 영상 전화기
JP2003125453A (ja) 移動通信端末
JP2004032804A (ja) テレビ電話機能付携帯電話機。

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050329

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050530

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050920