JPH0876783A - 音声処理装置および携帯機器 - Google Patents

音声処理装置および携帯機器

Info

Publication number
JPH0876783A
JPH0876783A JP6219701A JP21970194A JPH0876783A JP H0876783 A JPH0876783 A JP H0876783A JP 6219701 A JP6219701 A JP 6219701A JP 21970194 A JP21970194 A JP 21970194A JP H0876783 A JPH0876783 A JP H0876783A
Authority
JP
Japan
Prior art keywords
voice
basic
extracted
unit
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6219701A
Other languages
English (en)
Inventor
Yasuhiro Tsutsumi
康弘 堤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP6219701A priority Critical patent/JPH0876783A/ja
Publication of JPH0876783A publication Critical patent/JPH0876783A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Transceivers (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

(57)【要約】 【目的】 装置の大型化、高コスト化を最小限に抑え
て、音声のみを強調することができるようにする。 【構成】 マイク10に入力された音声が、アンテナ7
から中継局に伝送される。この場合、指定ボタン12を
操作しながら、マイク10に入力された音声は、強調区
間の音声とされ、その後、指定ボタン12を操作せず
に、マイク10に入力された音声が、強調区間の音声
に、同期をとって重畳され、これにより音声が強調され
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば携帯電話機など
に用いて好適な音声処理装置、並びに携帯機器に関す
る。
【0002】
【従来の技術】例えば、携帯電話機などを用いて、路上
などで通話を行う場合、周囲の雑音(以下、適宜、環境
雑音という)が大きい場合には、話者が大声で話すこと
により、S/Nを向上させている。
【0003】しかしながら、例えば通話内容が、機密事
項や、プライベートな内容で、無関係な周囲の人間に聞
かれたくないようなものである場合、話者が大声で話す
と、それらが周囲の人間に聞こえてしまい、好ましくな
い。
【0004】そこで、環境雑音を除去し、S/Nを向上
させる方法がある。しかしながら、環境雑音が小さい場
合、人間の聴覚(および脳)は、あまり大きな声でなく
ても、その声を聞き取ることが可能であり、従って、話
者は、周囲の人間に聞こえないように、非常に小さな声
で話す必要がある。しかしながら、この場合、電話の相
手にも、話者の声が聞こえなくなることがある。
【0005】そこで、例えば話者の音声のみを増幅する
などして強調する方法がある。この場合、ゲインを大き
くすることにより、非常に小さな声であっても、電話の
相手に聞こえるようにすることができる。
【0006】
【発明が解決しようとする課題】しかしながら、環境雑
音が大きい場合、それには、予測が困難な複数の周波数
成分が含まれ、さらにその周波数成分は、時間とともに
変化する。従って、環境雑音が大きい場合、音声と環境
雑音とを分離し、音声のみを強調するのが困難な課題が
あった。
【0007】そこで、複数のマイクを異なる位置に設置
して、各マイクの出力の位相差を利用して、環境雑音を
含む音声から、その音声と、環境雑音とを分離する方法
があるが、この場合、複数のマイクと、その出力を処理
するアナログ装置が必要となり、従ってハードウェアが
大規模なものになるとともに、装置が高コスト化する課
題があった。
【0008】本発明は、このような状況に鑑みてなされ
たものであり、装置の大型化、高コスト化を最小限に抑
えて、音声のみを強調することができるようにするもの
である。
【0009】
【課題を解決するための手段】請求項1に記載の音声処
理装置は、入力された音声を強調する音声処理装置であ
って、音声を入力する入力手段(例えば、図3に示すマ
イク10など)と、音声を強調する区間である強調区間
を指定する指定手段(例えば、図3に示す指定ボタン1
2など)と、強調区間の音声と、入力手段から入力され
た音声とを、それらを同期させて重畳する重畳手段(例
えば、図3に示す重畳平滑化処理部28など)とを備え
ることを特徴とする。
【0010】請求項2に記載の携帯機器は、請求項1に
記載の音声処理装置を有する携帯機器であって、所定の
入力を行うときに操作される操作部(例えば、図2に示
す指定ボタン12など)と、音声を入力するためのマイ
ク(例えば、図2に示すマイク10など)とを備え、入
力手段は、マイクでなり、指定手段は、操作部でなるこ
とを特徴とする。
【0011】請求項3に記載の携帯機器は、音声処理装
置における重畳手段により重畳された音声を送信する送
信手段(例えば、図2に示す通信処理部8など)をさら
に備えることを特徴とする。
【0012】
【作用】請求項1に記載の音声処理装置においては、マ
イク10から入力された音声を強調する区間である強調
区間が指定され、その後にマイク10から入力された音
声と、強調区間の音声とが、それらを同期させて重畳さ
れる。従って、例えばマイク10などを複数設けること
なく、音声の強調を行うことができる。
【0013】請求項2に記載の携帯機器においては、請
求項1に記載の音声処理装置、所定の入力を行うときに
操作される操作部、および音声を入力するためのマイク
を有している。そして、音声処理装置の入力手段または
指定手段として、マイクまたは操作部がそれぞれ用いら
れている。従って、装置の大型化を抑えることができ
る。
【0014】請求項3に記載の携帯機器においては、音
声処理装置における重畳手段により重畳された音声が送
信される。従って、S/Nの良い音声を送信することが
できる。
【0015】
【実施例】図1は、本発明を適用した携帯電話機の一実
施例の外観構成を示している。この携帯電話機によれ
ば、操作ボタン5を操作して、相手の電話番号を入力す
ることにより、中継局を介して、その相手と通話するこ
とができるようになされている。装置の使用者(話者)
の音声は、マイク10に入力されて伝送され、また伝送
されてきた相手の音声は、アンテナ7で受信され、スピ
ーカ9から出力されるようになされている。そして、こ
の携帯電話機では、通話の際、指定ボタン12を操作し
ながら(押しながら)、強調したい音声を発話し、その
後、指定ボタン12を操作せずに、同一の音声を発話す
ると(繰り返し発話すると)、それらが重畳されること
により音声の強調が行われるようになされている。
【0016】図2は、図1の携帯電話機の電気的構成例
を示している。CPU1は、ROM2に記憶されている
システムプログラムおよびアプリケーションプログラム
(装置を携帯電話機として動作させるためのプログラム
やその他のプログラム)にしたがって、装置を構成する
各ブロックを制御するようになされている。
【0017】ICカードインターフェイス2には、IC
カードを装着することができるようになされている。I
Cカードインターフェイス2にICカードを装着した場
合には、そこに記録されたプログラムやデータなどを用
いて、CPU1に拡張処理を行わせることができる。
【0018】ROM3には、システムプログラムやアプ
リケーションプログラム、その他必要なデータが記憶さ
れている。RAM4は、CPU1の動作上必要なデータ
を記憶するようになされている。
【0019】操作ボタン5は、上述したように電話番号
を入力するときや、その他のデータを入力するときに操
作される。表示パネル6は、CPU1の制御にしたがっ
て、文字や画像を表示するようになされている。即ち、
表示パネル6には、例えば操作ボタン5のうちの操作さ
れたものがエコーバックされて表示される。
【0020】通信処理部8は、音声処理部11を介し
て、マイク10から供給された音声を変調し、アンテナ
7を介して送信するとともに、アンテナ7で受信された
信号を復調し、その復調結果である音声をスピーカ9か
ら出力するようになされている。
【0021】マイク10は、入力された音声を電気信号
である音声信号に変換して音声処理部11に出力するよ
うになされている。音声処理部11は、マイク10から
の音声を、必要に応じて強調して通信処理部8に出力す
るようになされている。指定ボタン12は、マイク10
から入力された音声を強調する区間である強調区間を指
定するときに操作される。
【0022】図3は、音声処理部11の詳細構成を示し
ている。マイク10に入力された音声は、A/D変換器
21でA/D変換されることによりディジタル信号とさ
れ、選択回路22に入力される。選択回路22では、指
定ボタン12の操作に対応して、入力された音声が、例
えばFIFO(First In First Out)方式のメモリ23
または24に出力される。
【0023】即ち、強調したい音声を、最初に発話する
場合、使用者は、指定ボタン12を操作しながら(指定
ボタン12をON状態にして)発話を行う。この場合、
選択回路22は、メモリ23を選択する。これにより、
最初に発話された強調したい音声(以下、適宜、基本音
声という)は、マイク10,A/D変換器21、および
選択回路22を介して、メモリ23に供給されて記憶さ
れる。
【0024】ここで、メモリ23(メモリ24における
場合も同様)に、音声を記憶させる場合に、そのレベル
が充分小さい部分は、最低レベルの数値に置き換えて記
憶させるようにすることができる。この場合、音声に含
まれるレベルの小さいノイズを除去することができる。
【0025】メモリ23に記憶された基本音声は、音素
切り出し部25に読み出され、そこで音素に分解される
(基本音声から音素が切り出される)。
【0026】なお、音声の音素への分解は、後述する重
畳平滑化処理部28で重畳する音声どうしの同期をとる
ために行うので、音素切り出し部25(後述する音素切
り出し部26における場合も同様)では、音声が、必ず
しも正確に音素単位に分解される必要はない。即ち、音
声が、「通信装置」(tsuushiNsouchi)であった場合
に、これが、音素ts・u・u・sh・i・N・s・o・u・ch・iに、必ずし
も分解されなくても良い。但し、同一の音声が入力され
た場合に、それらが同じように分解されるようにする必
要がある。即ち、音声「通信装置」が、例えばts・uu・sh
i・N・s・ou・ch・iに分解された場合には、その後に、「通
信装置」と音声入力があったときに、それが同じように
ts・uu・shi・N・s・ou・ch・iに分解される必要がある。
【0027】従って、音声の音素への分解方法として
は、音声を、正確に音素単位に分解することのできる方
法よりも、同一発話を同一に分解することのできる方法
が好ましい。
【0028】ここで、図4は、上から順番に、音声「朝
鮮南部に」の音声波形、短時間平均パワー、スペクトル
の変化量、基本周波数(変形相関関数(いわゆる予測残
差の相関関数))、サウンドスペクトログラムを示して
おり、図5は、音声「高原に広が」のスペクトル包絡
線、短時間平均パワー、基本周波数(ピッチ周波数)を
示している。
【0029】図4および図5から、例えば短時間平均パ
ワーの変化点が音素の切れ目になっていることがわか
る。
【0030】そこで、音素切り出し部25では、メモリ
23に記憶された音声の短時間平均パワーが求められ、
その変化点を音素の切れ目とするように、音声が音素に
分解される。そして、各音素の音声区間が、重畳平滑化
処理部28に出力される。
【0031】以上の処理により、例えば基本音声として
「端末」が入力された場合には、重畳平滑化処理部28
に、例えばその音素「タ」、「ン」、「マ」、「ツ」そ
れぞれの音声区間が供給されることになる。
【0032】なお、音素切り出し部25では、音声の短
時間平均パワーの変化点を抽出する他、例えば音声の所
定の周波数成分(ある1つの周波数成分でも良いし、複
数の周波数成分でも良い)のレベルの変化点を抽出する
ようにし、それを音素の切れ目とするようにすることな
ども可能である。
【0033】使用者は、強調する音声を繰り返し発話す
る場合、意識して、同じように発話を行うと予想される
から、上述した方法により、充分な精度で、同一発話を
同一に分解することができる。
【0034】次に、強調したい音声の、2回目以降の発
話は、指定ボタン12を操作せずに(指定ボタン12を
OFF状態にして)行う。この場合、選択回路22は、
メモリ24を選択する。これにより、2回目以降に発話
された強調したい音声(以下、適宜、抽出音声という)
は、マイク10,A/D変換器21、および選択回路2
2を介して、メモリ24に供給されて記憶される。
【0035】ここで、メモリ24の記憶容量は、メモリ
23の記憶容量と同一か、あるいはそれより大きい方が
望ましい。
【0036】メモリ24に抽出音声が記憶されると、パ
ターンマッチング部27では、メモリ23に記憶された
基本音声と、メモリ24に記憶された抽出音声とのパタ
ーンマッチングが行われる。なお、この場合、基本音声
および抽出音声には雑音が含まれており、従って雑音が
含まれた状態で、基本音声と抽出音声のパターンマッチ
ングが行われる。但し、基本音声および抽出音声から、
雑音を除去することが可能であれば、基本音声および抽
出音声から雑音を除去した後、パターンマッチング処理
を行うようにすることができる。
【0037】パターンマッチング部27では、まず最初
に、メモリ23に記憶された信号(音声)の、例えばパ
ワーが所定値以上の部分(パワーが短い期間だけ所定値
以下になる場合には、その部分を含む)が基本音声とさ
れ、その基本音声のパターンと、抽出音声のパターンと
の距離(パターン間距離)が、両者をマッチングする位
置をずらしながら計算される。そして、基本音声のパタ
ーンと、抽出音声のパターンとの距離が最も小さくなっ
た場合の、例えばその距離の逆数に対応する値が、基本
音声と抽出音声の一致度(抽出音声が、基本音声に類似
している度合い)とされ、重畳平滑化処理部28に出力
される。
【0038】なお、パターンマッチング部27において
は、メモリ23または24それぞれに記憶されている信
号のパターンどうしが部分的に連続して一致している
(一致しているとみなせる)部分を求め、その部分どう
しの距離の逆数に対応する値を、一致度とするようにす
ることが可能である。
【0039】さらに、パターンマッチング部27におい
ては、基本音声のパターンと、抽出音声のパターンとの
距離が最も小さくなった場合の、両者をマッチングした
位置が、ピーク位置として音素切り出し部26に出力さ
れる。
【0040】即ち、例えば強調する音声が「端末」であ
った場合、図3に示すように、メモリ23または24に
は、それぞれ基本音声または抽出音声として音声「タン
マツ」が記憶されるが、この場合、メモリ23に記憶さ
れた基本音声「タンマツ」の開始位置(アドレス)と、
メモリ24に記憶された抽出音声「タンマツ」の開始位
置(アドレス)とは、通常異なる。そこで、基本音声の
パターンと、抽出音声のパターンとの距離が最も小さく
なった場合、基本音声の開始位置とマッチングされた抽
出音声の位置が、その抽出音声の開始位置とされ、これ
が、ピーク位置として音素切り出し部26に出力され
る。
【0041】なお、基本音声と抽出音声のパターンマッ
チング後、そのマッチング結果に基づいて、メモリ23
に記憶された基本音声を修正することが可能である。即
ち、メモリ23に記憶された基本音声の音声区間は、実
際の音声区間に、環境雑音のみが存在する区間を付加し
たものであると考えられるから、マッチング結果に基づ
いて、メモリ23に記憶された基本音声の音声区間のう
ち、環境雑音のみが存在すると考えられる区間を削除す
る。これにより、以降のマッチングで用いる基本音声の
音声区間が短くなるので、処理の高速化を図ることがで
きる。
【0042】また、パターンマッチング部27において
は、基本音声を増幅(減衰を含む)してから、抽出音声
とのパターンマッチングを行うようにすることが可能で
ある。
【0043】具体的には、増幅前または後の基本音声を
それぞれSi(t)またはSo(t)とした場合(但
し、tは時間)、式 So(t)=Ks×Si(t) Ks=α×Ps/Pm にしたがって、基本音声を増幅するようにする。但し、
αは、例えば0.8などの所定の係数であり、Psは、
所定の基準レベルである。また、Pmは、基本音声の発
話開始時から所定期間(例えば、数百ms程度)の平均
レベルである。
【0044】上式によれば、基本音声の発話開始時から
所定期間の平均レベルが、所定の基準レベルより大きい
または小さいとき、基本音声は、それぞれ減衰または増
幅されることになる。
【0045】音素切り出し部26は、上述した音素切り
出し部25と同様に構成され、パターンマッチング部2
7からピーク位置が供給されると、メモリ24に記憶さ
れた抽出音声を読み出し、その抽出音声を音素単位に分
解する。この場合、音素切り出し部26では、メモリ2
4に記憶されている音声のうち、ピーク位置が示すアド
レス以降に記憶されている部分(図中、Tで示す部分)
が、音素単位に分解する処理の対象とされる。
【0046】そして、抽出音声を構成する各音素の音声
区間が、重畳平滑化処理部28に出力される。
【0047】以上の処理により、例えば抽出音声として
「端末」が入力された場合には、重畳平滑化処理部28
に、例えばその音素「タ」、「ン」、「マ」、「ツ」そ
れぞれの音声区間が供給されることになる。
【0048】なお、音素切り出し部26に、音素切り出
し部25による基本音声を構成する音素の音声区間を、
図中点線で示すように供給するようにし、この基本音声
の音素の音声区間に基づいて、抽出音声を音素に分解さ
せるようにすることが可能である。
【0049】即ち、基本音声と抽出音声が同一発話であ
れば基本音声を構成する各音素の音声区間それぞれと、
抽出音声を構成する各音素の音声区間それぞれとは、そ
れほど大きな違いがないと考えられる。そこで、基本音
声の短時間平均パワーが、例えば図6に示すようなもの
であり、その変化点に基づいて、同図に示すように音素
1乃至6が切り出され、それぞれの音声区間が、図7に
示すようなもの(図7の「基本音声」の行に示すもの)
であった場合、この基本音声の音素1乃至6の音声区間
それぞれと、抽出音声の音素の音声区間それぞれとが大
きく異ならないように、基本音声の入力後に入力され
る、例えば抽出音声1乃至4それぞれを音素に分解する
ようにする。
【0050】具体的には、図7に示す場合、基本音声の
最初の音素1の音声区間は、35msであるから、抽出
音声1乃至4の始まりから、例えば35ms付近に、そ
の短時間平均パワーの変化点があるときには、その変化
が、ごく微小なものであっても、そこを音素の区切りと
するようにする。また、この場合、抽出音声1乃至4の
始まりから、例えば35msより大きく離れたところ
に、その短時間平均パワーの変化点があるときには、そ
の変化が、多少大きなものであっても、そこを音素の区
切りとせず無視するようにする。
【0051】このようにすることにより、音素切り出し
部26における抽出音声の音素への分解処理の精度を向
上させることができる(音素切り出し部26で、音素切
り出し部25と異なる音素の切り出しが行われることを
防止することができる)。
【0052】一方、重畳平滑化処理部28には、上述し
たように、音素切り出し部25または26から基本音声
または抽出音声の音素の音声区間がそれぞれ供給される
とともに、パターンマッチング部27から一致度が供給
される他、選択回路22から基本音声または抽出音声が
供給されるようになされている。
【0053】重畳平滑化処理部28は、例えば図8に示
すように構成され、選択回路22からの基本音声と抽出
音声とを、それらを同期させて重畳するようになされて
いる。即ち、選択回路22からの基本音声または抽出音
声は、メモリ35またはメモリ36にそれぞれ供給され
て記憶される。さらに、基本音声は、基本周波数(ピッ
チ周波数)抽出部31に供給され、そこで基本周波数成
分だけが抽出される。基本音声の基本周波数成分は、B
PF(バンドバスフィルタ)32に供給され、そこでノ
イズ成分が取り除かれて、位相検出部33に出力され
る。位相検出部33では、基本音声の基本周波数成分の
位相が検出され、位相記憶部34に供給されて記憶され
る。
【0054】選択回路22から、基本音声が供給された
後は、上述したようにマイク10に抽出音声が入力され
て供給される。抽出音声は、メモリ36に記憶されると
ともに、基本音声と同様に、基本周波数抽出部31,B
PF32、位相検出部33に順次供給されていき、これ
により抽出音声の基本周波数成分の位相が検出される。
この抽出音声の基本周波数成分の位相は、位相制御部3
7に出力される。
【0055】位相制御部37は、位相検出部33から抽
出音声の基本周波数成分の位相が供給されると、位相記
憶部34に記憶された基本音声の基本周波数成分の位相
を読み出すとともに、メモリ36に記憶された抽出音声
を読み出す。そして、抽出音声の基本周波数成分の位相
が、基本音声の基本周波数成分の位相に一致するよう
に、メモリ36から読み出した抽出音声の位相制御を行
い、重畳部38に出力する。
【0056】即ち、例えば基本音声が、図9(a)に示
すようなもので、抽出音声が、図9(b)に示すよう
に、基本音声より、基本周波数の高いものである場合、
例えば補間が行われることにより、抽出音声が、図9
(c)に示すように、基本音声と同期するように変形さ
れる。また、例えば例えば基本音声が、図10(a)に
示すようなもので、抽出音声が、図10(b)に示すよ
うに、基本音声より、基本周波数の低いものである場
合、例えば間引きが行われることにより、抽出音声が、
図10(c)に示すように、基本音声と同期するように
変形される。
【0057】以上のように変形された抽出音声は、重畳
部38に供給される。
【0058】なお、位相制御部37は、抽出音声を重畳
部38に出力する際、所定のタイミング信号をメモリ3
5に出力し、メモリ35から、そこに記憶された基本音
声を、重畳部38に出力させる。これにより、重畳部3
8には、基本音声と、変形された抽出音声(以下、適
宜、変形抽出音声という)とが、それぞれの開始位置が
あったタイミングで供給されるようになされている。即
ち、重畳部38には、基本音声と、変形抽出音声とが同
期がとられた状態で供給される。
【0059】重畳部38では、基本音声に、変形抽出音
声が重畳され、これにより基本音声を強調した重畳音声
が選択回路40に出力される。
【0060】ここで、基本音声の各音素の音声区間それ
ぞれと、抽出音声の各音素の音声区間それぞれとは、一
致しているとは限らず、むしろ異なることが多い。従っ
て、重畳部38において、基本音声と変形抽出音声とを
そのまま重畳したのでは、異なる音素が重なり合い、重
畳音声が聞きにくいものとなる恐れがある。即ち、基本
音声と抽出音声が、例えばtaNmatsu(端末)であった場
合に、基本音声の最初の音素tの音声区間が、変形抽出
音声の最初の音素tの音声区間より短い場合、これらを
そのまま重畳すると、変形抽出音声の最初の音素tの終
わり部分と、基本音声の2番目の音素aとが重畳される
こととなり、これにより重畳音声が聞きにくいものとな
る。
【0061】そこで、重畳部38では、音素同期制御部
39から供給される重畳実行信号に基づいて、基本音声
と変形抽出音声との重畳を行うようになされている。
【0062】即ち、音素同期制御部39には、音声切り
出し部25または26より、基本音声または抽出音声そ
れぞれの各音素の音声区間が供給されるようになされて
いる。そして、音素同期制御部39は、基本音声の各音
素の音声区間と、抽出音声の各音素の音声区間とが一致
するタイミングで重畳実行信号を、重畳部38に出力す
る。
【0063】重畳部38は、音素同期制御部39から供
給される重畳実行信号のタイミングで、即ち音素単位の
同期をとって、基本音声と変形抽出音声との重畳を行
う。これにより、例えば基本音声または変形抽出音声
が、それぞれ図11(a)または図11(b)に示すよ
うなものであり、基本音声の最初の音素である子音の音
声区間が、変形抽出音声の最初の音素である子音の音声
区間より短い場合、変形抽出音声(図11(b))の、
図中Dで示す区間が無視されて、基本音声と変形抽出音
声の最初の音素どうしが重畳される。
【0064】そして、基本音声または変形抽出音声の2
番目の音素である母音どうしが、その始まり部分が一致
するように重畳される。
【0065】従って、重畳部38では、図11(b)に
示した変形抽出信号が、図11(c)に示すように、図
中Dで示す区間が削除された信号とされて、基本音声
(図11(a))に重畳される。よって、異なる音素が
重なり合い、重畳音声が聞きにくいものとなることを防
止することができる。
【0066】以上のように、重畳平滑化処理部28で
は、基本音声と抽出音声とが、それらの基本周波数の同
期と音素単位の同期の、いわば階層的な同期をとって重
畳される。
【0067】重畳音声は、重畳部38から選択回路40
に出力される。選択回路40には、重畳音声の他、図3
の選択回路22から抽出音声と、選択信号生成部41か
ら選択信号が供給されるようになされている。選択回路
40では、選択信号生成部41から出力される選択信号
に対応して、重畳音声および抽出音声のいずれか一方が
選択され、通信処理部8に出力される。
【0068】選択信号生成部41には、自身が出力する
選択信号Fと、パターンマッチング部27(図3)が出
力する一致度とが入力されるようになされており、例え
ば図12に示す特性で、0および1のうちのいずれか
を、選択信号Fとして出力するようになされている。
【0069】即ち、選択信号生成部41は、いま自身が
出力している選択信号Fが1である場合、図12に実線
で示すように、一致度が所定の値S1以下である(より
小さい)ときは0を、また一致度が所定の値S1より大
きい(以上である)ときは1を、それぞれ選択信号Fと
して出力する。さらに、選択信号生成部41は、いま自
身が出力している選択信号Fが0である場合、図12に
点線で示すように、一致度が、上述した所定の値S1よ
り大きい所定の値S2以下である(より小さい)場合は
0を、また一致度が所定の値S2より大きい(以上であ
る)場合は1を、それぞれ選択信号Fとして出力する。
【0070】選択回路40では、選択信号Fが、0およ
び1のうちの、例えば1の場合は重畳音声を、選択信号
Fが0の場合は抽出信号を、それぞれ選択して、通信処
理部8へ出力するようになされている。
【0071】従って、いま選択信号Fが1であり、選択
回路40で重畳音声が選択されている場合、基本音声と
抽出音声との一致度が所定の値S1以下にならない限
り、選択信号Fは1のままであり、選択回路40では、
重畳音声が選択され続けることとなる。そして、基本音
声と抽出音声との一致度が所定の値S1以下になった場
合、即ち、例えばいまメモリ23に記憶されている基本
音声と同一の音声でない音声が発話され、これが抽出音
声とされた場合、選択回路40からは抽出音声が選択さ
れて出力されるようになる。
【0072】また、いま選択信号Fが0であり、選択回
路40で抽出音声が選択されている場合、基本音声と抽
出音声との一致度が所定の値S1より高い所定の値S2
より大きくならない限り、選択信号Fは0のままであ
り、選択回路40では、抽出音声が選択され続けること
となる。そして、基本音声と抽出音声との一致度が所定
の値S2より大きい値になった場合、即ち、例えばいま
メモリ23に記憶されている基本音声と同一の音声が発
話され、これが抽出音声とされた場合、選択回路40か
らは、上述したようにして得られる重畳音声が選択され
て出力されるようになる。
【0073】従って、この場合、重畳音声または抽出音
声が選択されているときには、それぞれ重畳音声または
抽出音声が選択され続けられ易くなるので、重畳音声と
抽出音声が、頻繁に切り換えられて出力されることによ
り、受信側で、通話内容が聞き取りにくくなることを防
止することができる。
【0074】選択回路40において重畳音声が選択され
た場合、この重畳音声が、通信処理部8およびアンテナ
7を介して送信される。重畳音声を生成する際の基本音
声および抽出音声は、雑音を含んでいるが、雑音どうし
は、いわば非同期であるから、これらを重畳することに
より、その振幅が増大することもあれば、減少すること
もあり、従って重畳音声に含まれる雑音の平均レベル
は、基本音声や抽出音声に含まれる雑音の平均レベルと
ほぼ同一となる。
【0075】一方、基本音声および抽出音声に含まれる
音声信号成分は、上述したように同期をとって重畳され
るから、重畳音声に含まれる音声信号成分の平均レベル
は、基本音声および抽出音声に含まれる音声信号成分の
平均レベルの加算値に対応したものとなる。
【0076】従って、複数のマイクや、それらの出力を
処理するブロックを設けることなく、即ち装置の大型
化、高コスト化を最小限に抑えて、音声のみを強調する
ことができる。また、周囲の人間に聞かれたくないよう
な通話内容を、小声で話しても、S/Nが良く、レベル
の大きい音声を、通話する相手に送信することができ
る。これにより、通話する相手は、使用者が小声で発話
しても、その内容を、確実に聞き取ることができる。
【0077】以上、本発明を携帯電話機に適用した場合
について説明したが、本発明は、この他、音声が入力可
能な電子手帳装置などの携帯機器や、その他の機器に適
用可能である。
【0078】なお、本実施例では、指定ボタン12を操
作することにより、強調区間を指定するようにしたが、
この他、例えば音声で強調区間を指定するようにするこ
となどが可能である。即ち、例えば装置に音声認識を行
うブロックを設け、例えば音声「開始」および「終了」
などを音声認識するようにし、「開始」と発話されてか
ら「終了」と発話されるまでを、強調区間とすることが
できる。また、例えば発話が繰り返されている部分を認
識するようにし、そのうちの、例えば最初の発話の音声
区間を、強調区間とすることができる。
【0079】さらに、本実施例においては、基本音声
に、1つの抽出音声を重畳するようにしたが、抽出音声
を繰り返し発話し、基本音声に、繰り返し発話された抽
出音声を重畳するようにすることができる。これは、例
えば基本音声に抽出音声を重畳した重畳音声を、一時記
憶しておくようにし、その重畳音声に、その後に発生さ
れた抽出音声を重畳することを繰り返すようにすれば良
い。
【0080】但し、この場合、基本音声に、複数の抽出
音声を重畳すると、その結果得られる重畳音声の平均レ
ベルが大きくなりすぎることがあるので、重畳音声の平
均レベルを抑制する必要がある。即ち、基本音声に、n
−1個の抽出音声を重畳するときには、例えば次式など
にしたがって、重畳音声を求めるようにする。
【0081】So(n,t)=So(n−1,t)×n
/(n+1)+Ks’×Si(n,t)/(n+1) =Σ(Ks’×Si(k,t)/(n+1))+So
(0,t)/(n+1) 但し、So(n,t)は、基本音声に、n−1個の抽出
音声を重畳した重畳音声である(但し、So(0,t)
は、基本音声である)。また、Si(n,t)は、n個
目の(n回目に発話された)抽出音声である。さらに、
Σは、kを1乃至nに変化させてのサメーションを意味
し、Ks’は、上述したKsより大きな値である。
【0082】パターンマッチング部27において、基本
音声を上述したように増幅する場合には、Ks’>Ks
とすることにより、基本音声に、抽出音声を重畳するご
とに得られる重畳音声の平均レベルは、少しずつ大きく
なる。
【0083】一方、上述したように、基本音声や抽出音
声に含まれる雑音を、そのまま重畳した場合には、その
平均レベルは変化しないが、上式にしたがって、基本音
声と抽出音声との重畳を、いわばゲイン付きで行うこと
により、雑音の平均レベルは徐々に減衰するので、これ
によりさらにS/Nの良い重畳音声を得ることができ
る。
【0084】即ち、抽出音声(抽出音声の音声信号成分
および雑音成分)が、例えば図13(a)に示すような
ものである場合、これを位相制御部37(図8)で変形
したものは、例えば図13(b)に示すようになる。こ
の変形抽出音声を、基本音声に、ゲインなしで重畳した
場合には、図13(c)に示すように、重畳音声に含ま
れる雑音の平均レベルは、基本音声や抽出音声に含まれ
る雑音の平均レベルと変わらない。しかしながら、変形
抽出音声を、基本音声に、ゲイン付きで重畳した場合に
は、図13(d)に示すように、重畳音声に含まれる雑
音の平均レベルは、基本音声や抽出音声に含まれる雑音
の平均レベルより低減される。
【0085】
【発明の効果】以上の如く、本発明によれば、装置の大
型化、高コスト化を最小限に抑えて、音声のみを強調す
ることができる。
【図面の簡単な説明】
【図1】本発明を適用した携帯電話機の一実施例の外観
構成を示す図である。
【図2】図1の携帯電話機の電気的構成例を示すブロッ
ク図である。
【図3】図2の音声処理部11の詳細構成を示すブロッ
ク図である。
【図4】音声の分析結果を示す図である。
【図5】音声の分析結果を示す図である。
【図6】基本音声から音素を切り出した結果を示す図で
ある。
【図7】基本音声の音素の音声区間の特定結果と、抽出
音声1乃至4それぞれの音素の音声区間の特定結果とを
示す図である。
【図8】図3の重畳平滑化処理部28の詳細構成を示す
ブロック図である。
【図9】位相制御部34の動作を説明する図である。
【図10】位相制御部34の動作を説明する図である。
【図11】音素単位の同期がとられる様子を示す図であ
る。
【図12】選択信号生成部41の動作を説明する図であ
る。
【図13】重畳信号に含まれる雑音の平均レベルが減衰
されることを説明する図である。
【符号の説明】
1 CPU 2 ICカードインターフェイス 3 ROM 4 RAM 5 操作ボタン 6 表示パネル 7 アンテナ 8 通信処理部 9 スピーカ 10 マイク 11 音声処理部 12 指定ボタン 21 A/D変換器 22 選択回路 23,24 メモリ 25,26 音素切り出し部 27 パターンマッチング部 28 重畳平滑化処理部 31 基本周波数抽出部 32 バンドバスフィルタ 33 位相検出部 34 位相記憶部 35,36 メモリ 37 位相制御部 38 重畳部 39 音素同期制御部 40 選択回路 41 選択信号生成部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声を強調する音声処理装置
    であって、 前記音声を入力する入力手段と、 前記音声を強調する区間である強調区間を指定する指定
    手段と、 前記強調区間の音声と、前記入力手段から入力された音
    声とを、それらを同期させて重畳する重畳手段とを備え
    ることを特徴とする音声処理装置。
  2. 【請求項2】 請求項1に記載の音声処理装置を有する
    携帯機器であって、 所定の入力を行うときに操作される操作部と、 音声を入力するためのマイクとを備え、 前記入力手段は、前記マイクでなり、 前記指定手段は、前記操作部でなることを特徴とする携
    帯機器。
  3. 【請求項3】 前記音声処理装置における重畳手段によ
    り重畳された音声を送信する送信手段をさらに備えるこ
    とを特徴とする請求項2に記載の携帯機器。
JP6219701A 1994-06-28 1994-09-14 音声処理装置および携帯機器 Withdrawn JPH0876783A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6219701A JPH0876783A (ja) 1994-06-28 1994-09-14 音声処理装置および携帯機器

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP14586294 1994-06-28
JP6-145862 1994-06-28
JP6219701A JPH0876783A (ja) 1994-06-28 1994-09-14 音声処理装置および携帯機器

Publications (1)

Publication Number Publication Date
JPH0876783A true JPH0876783A (ja) 1996-03-22

Family

ID=26476876

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6219701A Withdrawn JPH0876783A (ja) 1994-06-28 1994-09-14 音声処理装置および携帯機器

Country Status (1)

Country Link
JP (1) JPH0876783A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002330194A (ja) * 2001-04-27 2002-11-15 Kenwood Corp 電話装置、音声合成システム、音素情報登録装置、音素情報登録・音声合成装置
JP2009020387A (ja) * 2007-07-13 2009-01-29 Yamaha Corp 楽曲を制作するための装置およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002330194A (ja) * 2001-04-27 2002-11-15 Kenwood Corp 電話装置、音声合成システム、音素情報登録装置、音素情報登録・音声合成装置
JP2009020387A (ja) * 2007-07-13 2009-01-29 Yamaha Corp 楽曲を制作するための装置およびプログラム

Similar Documents

Publication Publication Date Title
US8768701B2 (en) Prosodic mimic method and apparatus
EP1994529B1 (en) Communication device having speaker independent speech recognition
JP6708035B2 (ja) 発話内容認識装置
US20030061049A1 (en) Synthesized speech intelligibility enhancement through environment awareness
WO2004049304A1 (ja) 音声合成方法および音声合成装置
US20130226589A1 (en) Control using temporally and/or spectrally compact audio commands
CN110875036A (zh) 语音分类方法、装置、设备及计算机可读存储介质
JP4973664B2 (ja) 文書読上げ装置、文書読上げ装置を制御する制御方法及び文書読上げ装置を制御する制御プログラム
JPH0876783A (ja) 音声処理装置および携帯機器
JP4752516B2 (ja) 音声対話装置および音声対話方法
JP2000338991A (ja) 認識率信頼性表示機能付き音声操作電話装置及びその音声認識方法
JPH05307395A (ja) 音声合成装置
JP3106543B2 (ja) 音声信号処理装置
JP3068370B2 (ja) 携帯用音声認識出力補助装置
JP2011180416A (ja) 音声合成装置、音声合成方法およびカーナビゲーションシステム
CN111179943A (zh) 一种对话辅助设备及获取信息的方法
JPH11109989A (ja) 音声認識装置
JP2001142477A (ja) 有声音形成装置とそれを用いた音声認識装置
JP2019035894A (ja) 音声処理装置および音声処理方法
JP2000310995A (ja) 音声合成方法及び音声合成装置、並びに音声合成装置を備えた電話機
JPH1078798A (ja) 音声信号処理装置
JPS6367400B2 (ja)
JP2004205624A (ja) 音声処理システム
JP2025155320A (ja) 収音装置、収音方法、およびプログラム
JPH08297673A (ja) 音声入力翻訳装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20011120