JPH0467200B2 - - Google Patents

Info

Publication number
JPH0467200B2
JPH0467200B2 JP58010647A JP1064783A JPH0467200B2 JP H0467200 B2 JPH0467200 B2 JP H0467200B2 JP 58010647 A JP58010647 A JP 58010647A JP 1064783 A JP1064783 A JP 1064783A JP H0467200 B2 JPH0467200 B2 JP H0467200B2
Authority
JP
Japan
Prior art keywords
signal
generating
step size
adaptive
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58010647A
Other languages
English (en)
Other versions
JPS58217998A (ja
Inventor
Rooton Furanagan Jeemusu
Deiuitsudo Jonsuton Jeemusu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Technologies Inc filed Critical AT&T Technologies Inc
Priority to JP58010647A priority Critical patent/JPS58217998A/ja
Publication of JPS58217998A publication Critical patent/JPS58217998A/ja
Publication of JPH0467200B2 publication Critical patent/JPH0467200B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 技術の分野 本発明はスピーチの処理に関し、特にスピーチ
信号符号化装置に関する。 発明の背景 公知の様に、通常のスピーチには伝達される知
能の一部を構成するための無声期間を含んでい
る。無声期間は文章間、節間、語間、ならびに語
内で生ずるものである。元来、無声期間はスピー
チの自然的属性であるとして聴取者に受容れられ
るものである。しかしながら、無声はスピーチパ
ターンの重要な部分を表わすものである。通信チ
ヤネル上で伝送するため、あるいは記憶装置内へ
記憶するためにスピーチ信号が符号化されている
場合には、無声部分に相当する符号列は、他の目
的に使用する様に除去されることができるか、あ
るいは他の目的に使用することができる様な符号
化信号の断片を占めるものである。メツセージを
理解するためには、スピーチパターンにおける適
切な位置に無声信号を再生する必要があることは
勿論である。しかし、記憶されたデジタル信号、
あるいは伝達されたデジタル信号がはるかに簡便
に作れる様に、無声のための符号化を簡易化する
ことができる。この様にして、通信システムの効
率が向上している。 デジタル的にスピーチ信号を符号化する場合に
は、多くの方法が可能である。標本化されたスピ
ーチを直接二進形に変換することはパルス符号変
調により実施できる。変換過程は各スピーチ標本
を個別の各レベルの組に量子化するための過程
と、選択されている量子化レベルを符号化するた
めの過程とを含むものである。適応形のパルス変
調においては、スピーチ信号標本の量子化は入力
信号レベルに適応しているが、この形のパルス変
調ではデジタル標本あたりのビツト数がきわめて
少なく、性能が改善されている。斯かる適応形の
装置においては、量子化装置におけるステツプサ
イズが入力信号の統計的特性に合致するように変
化させることができる。差動形パルス変調系は符
号化効率を改善するために入力信号それ自身を標
本化するよりも、入力信号標本間の差を符号化す
るものである。しかしながら、これらの符号化装
置では入力信号の活性化部分と、非活性化部分と
を正確に区別するものではない。結果的には、信
号の無声期間は知能の伝送効率に逆の影響を与え
る。 米国特許第4280192号は、アナログ情報をデジ
タル的に記憶するための空間を最小化するための
構成を開示したものであり、スピーチのようなア
ナログ入力信号を連続的に傾斜率の変化する形式
のデルタ変調(ADM)符号の流れに変換するも
のである。肉声動作形スイツチは、アナログ信号
があらかじめ定められたレベル以下に下降した時
に休止期間の開始を検出するものである。スピー
チ信号があらかじめ定められたレベル以上に上昇
した時に動作を停止するためのカウンタにより休
止時間が決定される。タイミング情報を含む特殊
な休止符号は、そこでデジタル符号流に挿入され
る。肉声動作形スイツチとタイミング装置との組
合せは、アナログ信号の休止期間における繰返し
符号を除去するためのものである。 公知のように肉声動作形スイツチは句節間でク
リツピングが起らないように低速で動作するよう
に設計され、短かい無声期間の検出を禁止するた
めの装置を含むものである。その結果、米国特許
第4280192号に記載された系では、データ流の適
切な位置に休止符号が挿入されるのを容易にする
ための補償形遅延を活用している。しかし、肉声
動作形スイツチには本質的に遅延が存在するた
め、言語の速度より高い速度で起る短期間の無声
期間を検出することは困難である。 米国特許第4053712号は適応形のデジタル符号
化装置ならびに解読装置を開示したものであり、
全体のビツト速度の減ずるために、特殊な符号化
ビツトパターンをCVSD出力ビツト流のアイドル
パターンに置換している。CVSD出力をアナログ
信号に変換すると共にアナログ信号を固定振幅の
閾値と比較することにより、アイドルパターンの
検出が行われる。無声の検出するためのアナログ
スピーチ信号の再生成には、符号化の原価を増加
させることになる解読装置を追加しなければなら
ない。直接的に振幅閾値が存在すると、無声検出
における速度上の制限を比較的受け難い構成であ
る反面、ノイズに対する感度が増加する。結果的
には、無声状態と発音とを区別することは困難で
あり、装置のスピーチクリツピングに対する許容
性が大きくなつている。 本発明の目的は、速度に制限を加えることなく
無声期間を経済的に除去するための改良形デジタ
ル符号化装置を提供することにある。 発明の概要 従来技術の無声除去方式の問題点は、無声期間
を検出するための適応形のパルス変調法において
すでに生成されているステツプサイズ関係信号を
使用することにより、本発明によつて解決するこ
とができる。これらのステツプサイズ関係信号は
印加されたスピーチ信号のエネルギ内容を表わす
ものであるが、肉声動作形スイツチに存在する遅
延装置により影響されることはない。その結果、
アナログ信号処理過程が除去されるが、無声期間
の検出があらかじめ定められた速度には制限され
ず、無声期間符号を適当に配置するための装置は
必要がなくなる。 本発明はスピーチパターンを適応形のデジタル
符号列に変換するためのスピーチ処理装置を指向
したものである。これは、パターンの無声期間を
検出し、各無声期間を表わすデジタル符号を発生
させるものである。スピーチパターンを表わすデ
ジタル信号を形成するためには、適応形のデジタ
ル符号と無声期間符号とを組合せる。パターンを
適応形のデジタル符号へ変換する過程には、各デ
ジタル符号に対する適応ステツプサイズに相当し
た信号を形成する過程を含む。そこで、第1およ
び第2の閾値信号が生成される。無声期間の検出
には適応ステツプサイズ相当信号が第1の閾値よ
り小さく消滅した時に無声期間信号を発生させる
ため過程と、無声期間に第2の閾値より大きく適
応ステツプサイズ関係信号が増加した時に無声期
間信号を終端するための過程とを含む。 詳細な説明 第1図は本発明によるデジタル式音声通信装置
を示す図である。第1図を参照すれば、スピーチ
パターンをマイクロホン101に加え、マクロホ
ン101から得られたスピーチ信号を低減波器
と標本化回路103に加えてある。回路103に
よれば、公知の方法により印加したスピーチ信号
を低減波すると共に、クロツク信号発生器10
7によりあらかじめ与えられた速度で信号を標本
化することができる。低域波器のカツトオフ周
波数を例えば3.2kHzとすると、標本化の速度は、
例えば、8kHzとすることができる。回路103
からのスピーチ標本の例はスピーチ信号の波形を
表わすものである。 アナログ・デジタル変換器105は回路103
から連続するスピーチ標本を受信し、各スピーチ
標本をスピーチ標本の振幅に相当する値を有する
デジタル式符号化信号に変換する。変換器105
からのエジタル符号化信号は適応形のエンコーダ
110の入力へ印加される。従来技術から公知の
ように、適応形のエンコーダは変換器105から
のデジタル信号をS/N比が良好な、従来よりも
効率よく符号化された信号に変換することができ
る。 第1図の回路に使用することができる適応形の
エンコーダを、第2図の論理図に示す。第2図は
適応形の差動パルル符号変調(adaptive
differential pulse code modulation:ADPCM)
用符号化装置を示す図であるが、他の形式の適応
形の符号変調器も使用できるものと理解すべきで
ある。差動パルス符号変調においては、各標本
Xnと過去の標本に基づいた前記標本Xn)の予測
値との間の相違は、伝送のために量子化し符号化
することにある。量子化装置のレベル数によれ
ば、スピーチ信号に対する段階波近似信号が生成
される。差動符号化においては、冗長度の信号に
対してとりすぎない様にして、従来のPCM符号
化よりも標本化あたり2ビツトだけビツト速度が
低くてすむ効果が得られるようにすることができ
る。 一般に、差動符号化には固定されたステツプサ
イズを有する量子化装置を使用している。適応形
の装置には、符号化装置からのデジタル出力を監
視するための装置を具備している。出力における
差動信号振幅に応答できるように、量子化装置で
は実効的なステツプサイズを変えることができ
る。この方法においては、入力信号の量子化は最
適化されている。 第2図を参照すれば、アナログからデジタルへ
の変換器回路105のデジタル信号Xnの列は加
算器201のひとつの入力端子に加えられてい
る。加算器201の他の入力では前の信号列
Xn-1、Xn-2、…に基づいて現在のデジタル信号
Xnの予測値を受信する。現在の信号Xnと予測信
号Xnとの間の相違は加算器201の出力に現れ、
これは量子化装置203に供給される。量子化装
置は、加算器201からの差動信号をあらかじめ
設定された量子化装置レベルの組と比較し、最近
接の量子化装置レベルに相当する信号を発生す
る。量子化装置203の出力に現れている量子化
差信号はエンコーダ207に加えられ、エンコー
ダ207は供給された量子化信号レベルに相当し
てデジタル符号Cnを形成するように適応した動
作をする。 エンコーダ207の出力は、スピーチ信号標本
とその予測値との間の量子化された差を表わすデ
ジタル符号の列である。量子化装置203の出力
における量子化された差信号も加算器209のひ
とつの入力端子に加えられ、これは予測装置20
5から得られた予測標本値を使つて加算器209
において加算される。加算器回路209からの和
信号は予測装置205の入力端子に供給される。
その結果、予測装置205の出力は次のスピーチ
標本信号Xn+1の予測値を表わすように更新され
る。 ステツプサイズ発生器回路210はエンコーダ
出力符号Cnを受信する。また、Cnの相対振幅に
従つて量子化装置203におけるレベルを調整す
るために、上記符号Cnに対して応答可能なステ
ツプサイズ発生回路210はステツプサイズ信号
Δnを標本化する。Cnが大きい場合には、ステツ
プサイズ信号Δnは量子化装置203におけるス
テツプサイズを伸張するために効果的であり、こ
れによつて量子化装置は高振幅信号と適合性がよ
い。Cnが小さな値の場合には、量子化装置が低
振幅の信号に適合するようにステツプサイズを一
致させる。この方法においては、量子化装置は入
力信号を期待したレベルに適合せしめるためのも
のである。適応形のエンコーダと差動形のエンコ
ーダとを組立てて使用することは、エル・アー
ル・ラビナ(L.R.Rabiner)、アール・ダブリユ
ウ・シエフア(R.W.Schafer)共著の、「スピー
チ信号のデジタル処理(“Digital Processing of
Speech Signals”)」(1978年、プレンテイスホー
ル(Prentice Hall)社発刊、版権所有:ベル電
話研究所)において説明されている。 次に、適応形のエンコーダ110はモートロー
ラ社から1980年に出された“MC68000の設計モ
ジユール ユーザガイド”(MC68000 Design
Module Use′s Guide、Motorola Inc.、1980)
に記載されているモートローラ社の68000形マイ
クロプロセツサから成立つ。このマイクロプロセ
ツサは読取り専用記憶装置に記憶された、あらか
じめ定められた一連の命令に従つて動作するもの
である。付録Aはフオートラン言語
(FORTRAN)においてA/D変換器105から
のADPCMエンコード信号に必要とされる永久記
憶形命令の一覧表を示したものである。 第2図においてステツプサイズ発生器210は do=βdo-1+mCo (1) により動作するものであり、上式はエンコーダ2
07の最後の出力(Co-1)に対して応答可能なス
テツプサイズの対数に相当した信号doを形成する
ためのものである。βは誤差の消滅に関係した定
数であり、例えば β=1−2-6 (2) である。do-1は前回の対数ステツプサイズ信号で
あり、mは信号のダイナミツクレンジの期待値と
量子化装置のレベルの数とに関係してステツプサ
イズの大きさを調整するための倍率である。 第2図において、デジタル符号化信号Cnは倍
率発生器211のアドレス入力端子に加えられ、
倍率発生器211はそのアドレス入力に加えられ
たそれぞれのデジタル符号入力Cnに対して、あ
らかじめ割当てられた出力mCnが得られるよう
に従来の公知の方法により採用されているプログ
ラムマブル読取り専用記憶装置(PROM)から
成立つ。mは m=logQM (3) ここで、最低の4レベルに対しては、mが0.85
であり、第5および第6のレベルに対しては1.2
である。また、 M=1.6(第7のレベル) 2.4(第8のレベル) Q=D1/S である。Dは入力信号Xnのダイナミツクレンジ
であり、はステツプサイズの数である。 遅延レジスタ215は前回の対数ステツプサイ
ズ信号do-1を保持するものである。n番目の入力
に対するクロツク信号発生器107からのクロツ
ク信号CLTに応答して、信号do-1はシフタ217
に供給されると共に、減算器219のひとつの入
力端子に供給される。シフタ217は符号化信号
do-1を右へ6桁だけシフトして信号2-6do-1を形
成し、符号化信号ビツトを再割当てするための配
線構成をとることができる。 減算器219は信号do-1をレジスタ215から
受取り、さらに信号2-6do-1をシフタ217から
受取つて、差動信号(1−26)do-1を生成する様
に動作するものである。減算器219の出力は加
算器212において信号mCoに加算され、得られ
たdo信号はクロツクパルスCLTによりレジスタ
215に置数される。レジスタ215における信
号doは、量子化装置203に供給された符号化装
置のステツプサイズΔnの対数を表わすものであ
る。Δn信号を形成するために、デジタル符号do
はステツプサイズ信号形成装置221のアドレス
入力端子に印加される。形成装置221はプログ
ラマブル読取り専用記憶装置(PROM)であり、
PROMにdoとΔnとの関係の一覧表が記憶されて
いる。それぞれのdoのアドレス入力に対して、相
当するΔnのステツプサイズ信号はPROMから出
力される。 対数ステツプサイズ信号doはスピーチ標本Xn
の列のエネルギを表わすものであり、スピーチ信
号における無声期間を決定するために使用するこ
とができる。肉声動作スイツチと他のスピーチ現
存信号検出器とに対比して、ノイズまたはスピー
チクリツピングが得られた符号化スピーチ信号に
混入されることなく、句節の速度よりもはるかに
速い速度で対数ステツプサイズ信号が変化する。
その結果、対数ステツプサイズ信号の変化に応答
可能な無声期間の検出は、事実上速度上の制限を
受けることなく本発明により実施される。 無声期間の検出は、第3図にさらに詳細に示す
無声検出器115において実施されている。第3
図を参照して、適応形のエンコーダ110からの
信号doは振幅比較器301の入力端子と振幅比
較器305の入力端子とに加えられる。doの信
号が閾値レベル信号TH1より小さな値に消滅し
た時には比較器305がイネーブルされる。比較
器305からのイネーブルされた出力は、ORゲ
ート315を介してフリツプフロツプ320に加
えられ、このフリツプフロツプをセツトする。セ
ツトされると、フリツプフロツプ320は無声期
間が開始したことを示すためのイネーブル化SF
信号を出力する。比較器301の出力はANDゲ
ート310に加えられているが、信号SFはAND
ゲート310に警告を与える。比較器301のB
入力端子に印加された閾値信号TH2はスピーチ
のオンセツトレベルに相当するものである。信号
doが閾値信号TH2より大きい時には、比較器3
01がイネーブルされる。無声期間においては、
対数のステツプサイズ信号doが閾値TH2よりも
大きく増加する時に限つて、フリツプフロツプ3
20はANDゲート310とORゲート315とを
介してリセツトされる。 入力スピーチ信号のダイナミツクレンジが第1
図におけるマイクロホン101とフイルタ付き標
本化回路103との間に接続された信号圧縮装置
によりプリセツトされている場合には、閾値信号
TH1,TH2は固定電圧レベルとすることがで
きる。しかしながら、斯かる圧縮装置はスピーチ
信号を警告として送出し、話し手の声の特性が不
自然になる。その結果、再生したスピーチパター
ンはその話し手のようにはきこえない可能性があ
る。本発明によれば、通常採用されているような
スピーチ信号圧縮装置は、第1図の適応形の閾値
発生器112の使用により除去されている。適応
形の閾値発生器は閾値信号TH1,TH2を変更
するものである。閾値信号TH1,TH2は対数
ステツプサイズ信号により変化することが可能で
あり、これにより話し手の声の特性は無声除去に
必要な装置により変化することはない。 適応形の閾値発生器112を第4図にさらに詳
細に示す。第4図を参照して、レベル信号発生器
401は、第1図の回路に入力された能動スピー
チ信号と合致性のある最低対数ステツプサイズ信
号の期待値に相当するプリセツト制限信号Lと、
dnaxと無声閾値との間で通常期待されている差の
量に相当するプリセツトレベル信号HW1,HW
2とを生成するものである。一般にdnaxは適応形
のエンコーダ110からのdo信号列の最大値であ
る。レジスタ427は最初Lにセツトされ、標本
Xo-1までの対数ステツプサイズ信号の最大値を
記憶する。レジスタ427からのdnax信号は、振
幅比較器403において、現在の対数ステツプサ
イズ信号doと比較される。doがdnaxよりも大きい
場合には、比較器はイネーブルされる。比較器4
03からのイネーブル信号は三値スイツチ409
を開放せしめると共に三値スイツチ405を閉塞
せしめ、これによつてdnaxよりも大きいdoを表わ
す信号が引算器415の入力端子とシフタ41
2とに供給される。信号dnaxが信号doよりも大き
い場合には、比較器403はデイスエーブルされ
たままで、レジスタ427からのdnax信号は三値
スイツチ409を介して通過し、減算器415の
a入力とシフタ412の入力とに供給される。 シフタ412は入力を10桁だけ右へシフトし、
減算器415は信号 dnax(1−2-10) を比較器418の入力と三ウエイスイツチ42
5の入力とに与える。比較器418に加えられた
L制限信号が減算器415の出力よりも大きい場
合には、比較器418がイネーブルされる。その
場合には、三値スイツチ420がターンオンし、
制限信号Lはレジスタ427に置数される。減算
器415の出力が制限信号Lより小さい場合に
は、比較器418はデイスエーブルされたままで
ある。三値スイツチ425がターンオンし、レジ
スタ427の内容は対数ステツプサイズ信号do
下で、これを含んでいる最大値の対数ステツプサ
イズ信号を受信する。 レジスタ427からの信号dnaxは減算器430
に供給され、減算器430は信号dnax−HW1を
形成するために動作する。この閾値レベルは最大
対数ステツプサイズ信号dnaxによつて変化し、無
声閾値は適応形の変化をする。減算器440は信
号TH2=dnax−HW2を形成し、スピーチオン
セツト閾値は最大対数ステツプサイズ信号により
適応形の変化をすることができる。このようにし
て、スピーチ信号の無声期間は話し手の特性を変
えることなく検出される。 無声検出器115のSF出力は、第5図にさら
に詳細に示すように無声カウンタ120に供給さ
れる。第5図を参照して、SF信号はANDゲート
505のひとつの入力端子に加えられると共に、
インバータ507の入力端子にも加えられてい
る。通常のスピーチの期間には信号SFがデイス
エーブルされ、インバータ507の出力はカウン
タ510をその零位置にプリセツトする。無声期
間の開始に際して信号SFがイネーブルされ、符
号クロツク信号CLTはANDゲート505を通を
通つてカウンタ510に入力される。無声期間の
終端が検出されるまではカウンタ510の内容が
増分する。ラツチ515は無声期間の終端におい
てイネーブルされ、これにより無声期間カウント
信号はカウンタ510からラツチ515へ転送さ
れる。ラツチ515からの無声期間カウント信号
SCTは符号処理装置125の入力に供給され、
符号処理装置125は適応形のエンコーダ110
において生成したCo符号と検出器115からの
SF信号とを共に受信する。 符号処理装置125は出力符号Coと無声期間
符号との組合せから成立つメツセージを形成し、
必要に応じて通信網140にメツセージを供給す
る様に適応化されている。処理装置125は上記
1980年にモートローラ社から出版された
MC68000の設計モジユールユーザガイド
(MC68000 Design Module User s Guide、
Motorola、Inc.、1980)に記載されているモー
トローラ社の68000形マイクロプロセツサから成
立つ。処理装置125の符号の組合せ読取り専用
記憶装置(ROM)に記憶され、固定された一連
の命令により実行される。これらの命令は付録B
におけるフオートラン言語(FORTRAN)によ
り表わされている。 スピーチ信号から除去された無声期間は、無声
カウンタ120からの無声カウント信号SCTの
先に現れる特殊な無声符号SCにより表わされて
いる。第1図の回路において、無声符号は適応形
のエンコーダの最大振幅出力として選択されてい
る。4ビツトのADPCM符号構成に対して、最大
振幅出力の組合せは8716である。この符号はその
生起確率が低いゆえに選択されている。無声期間
の偽の検出を避けるため、Coに生起している最
大振幅出力符号を置換しなければならない。第1
図の符号変更回路は、9616の組合せにより87の符
号の組合せを置換するように動作し、信号の歪を
最低にする。 符号変更回路を第6図にさらに詳細に示す。第
6図を参照して、適応形のエンコーダ110の出
力は各クロツクパルスCLTにおいてレジスタ6
10に供給される。レジスタ610におけるCo
符号は通常、順次三値スイツチ615を介してレ
ジスタ625に転送され、レジスタ625におけ
るCo-1符号は三値スイツチ601の出力に現れ
る。現在の一対の符号化装置の信号を表わしてい
るレジスタ610,625の出力は、比較器63
5において符号の組合せ8716と比較される。これ
らの符号は従来技術において公知のように、信号
発生器632により供給される。レジスタ61
0,625における8716の列の検出に際して、比
較器635の出力がイネーブルされ、インバータ
637の出力がデイスエーブルされる。デイスエ
ーブルされた信号CCに応答して、三値スイツチ
605,620が信号CCによりイネーブルされ
ている期間には三値スイツチ601,615はデ
イスエーブルされている。発生器632からの
916信号はそれによりレジスタ625に挿入され、
発生器632からの616信号は三値スイツチ60
5を介してデータ流に挿入されている。符号変更
器130の出力はそこで必要に応じて変えること
ができる。 第7図の流れ図は第1図において実行された動
作の列を表わし、第8図に示す波形は第1図の回
路における種々の点で、信号と符号とを図示した
ものである。マイクロホン101におけるスピー
チ信号の受信に先立ち、無声カウンタ120は零
状態にリセツトされる。無声検出器115からの
信号SFはデイスエーブルされ、閾値発生器11
2において記憶されている最大対数ステツプサイ
ズ信号dnaxは零に設定される。これらの動作は指
標過程701に指示されている。波形801上で
時刻t0と時刻t1との間に表示されているスピーチ
信号は無声期間には相当しない。その結果、スピ
ーチ波形(波形805上に示されている)から得
られる対数ステツプサイズ信号doは波形809の
閾値信号TH1よりも大きい。無声検出器115
からの無声フラグ信号SFがリセツトされ、出力
符号Coは符号変更器回路130を介して符号処
理装置125に供給される。これらの符号C1
C2,…Coは通常のスピーチに相当し、波形81
3に示されている。 第7図を参照すると、各符号クロツクパルス
CLTの生成に際して待合せ過程708が励起さ
れる。符号クロツクパルスCLTに応答し、適応
形のエンコーダ110は過程710に示されてい
るように、次の適応形のエンコーダ出力信号Co
を形成する。対数ステツプサイズ信号doとステツ
プサイズ信号Δnとは、過程712により適応形
のエンコーダにおいて形成され、do信号とdnax
号とは決定過程715により適応形の閾値発生器
112において比較される。対数のステツプサイ
ズ信号doがdnaxよりも大きい場合には、dnax信号
は現在のdo信号(過程718)に置換される。 そこで、do信号を無声検出器115において試
験し、do信号が閾値発生器112からの低い方の
閾値信号より小さいか、あるいは両者が等しいか
を決定する。(決定過程720参照。)第8図にお
ける時刻t0と時刻t1との間で、対数ステツプサイ
ズ信号(波形805)が適応形の閾値信号TH1
(波形809)よりも大きく、もし無声フラグ信
号SFがセツトされていれば決定過程723は決
定を開始する。時刻t0と時刻t1との間でSF信号は
イネーブルされていないため、この期間には、各
CLTクロツプパルスに対して過程725が入れ
られる。決定過程725により、符号変更器13
0において現在の符号化信号Coは無声符号SCと
して試験される。符号化信号Coが逆無声符号SC
に等しい場合には、Coは回路130の変更器論
理により変化する。(過程729参照。)さもなけ
れば、変更されていないCo符号は、伝送または
記憶に際して符号処理装置125のなかに置数さ
れる。 時刻t1に到達した時には、符号化装置の動作が
変化する。符号化信号Co,do,Δoは箱710,
712に示したようにして発生し、適応形の閾値
回路112に記憶されたdnax信号とdo信号とが比
較される。(過程715参照。)しかしながら、時
刻t1における信号doの値は適応形の閾値信号TH
1より小さいため、無声フラグ設定過程735は
決定過程720を介して入れられている。信号
SFは無声検出器115においてイネーブルされ
ていて、無声カウンタ120の内容は過程738
により増分する。待ちの過程708は、次のスピ
ーチ信号符号に対してクロツプパルス信号CLを
検出するために入れられている。 時刻t1とt2との間では、対数ステツプサイズ信
号doの値は閾値信号TH2の値よりも小さい。結
果的には、無声カウンタ増分過程738は無声フ
ラグ設定過程735、あるいは決定過程723を
介して入れられているので、無声期間は過程73
8に指示されているようにして時間を刻み続けて
いる。時刻t2に到着した時には、対数ステツプサ
イズ信号doの値は決定過程740におけるスピー
チオンセツト閾値TH2の値よりも大きくなる。
無声フラグリセツト過程742は決定過程72
0,723,740を含む経路を介して動作して
いる。そこで検出器115における無声期間信号
SFはリセツトされ、無声期間が終端する。無声
先頭信号(SC=8716)と無声カウント信号
(SCT)とは、信号SFの再セツテイングに応答可
能な符号処理装置125において形成されてい
る。そこで、無声カウンタの内容は過程746に
よつて零にクリアされる。無声符号試験と符号変
更回路130における過程725,729による
順序変更との後で、現在のCo符号を符号処理装
置125に置数する。 無声符号SCと無声カウントSCTとは、時刻t2
と時刻t3との間の波形813に示されているよう
に、符号処理装置125に記憶されているデータ
流のなかに置かれる。その結果、無声期間がこれ
以上検出されないため、符号変更装置130から
のCo符号はデータ流に加えられている。無声と
無声カウント符号とを含み、処理装置125にお
いて取扱われるデータ流の符号は波形815に図
示してある。 第1図の回路は肉声記憶系を構成し、肉声記憶
系において、回路網140は符号処理装置125
から受信された無声編集符号を記憶するための構
成を有するデジタル式処理装置である。波形80
1のスピーチ信号に応答して、815に示すデジ
タル符号列を回路網140の処理装置に置数す
る。波形815に示すように、時刻t1と時刻t2
の間の無声期間は無声カウントSCTの前に置か
れた無声符号SCに置換される。この様にして、
回路網140に対する記憶上の要求は事実上減ぜ
られる。 回路網140からのデジタル符号は解読器15
0に加えられ、無声期間を含み、元来マイクロホ
ン101に供給されているスピーチパターンのレ
プリカを形成するように解読器150は動作す
る。解読器150においては、適応形のデジタル
符号化信号は無声符号検出器と、カウンタ152
と、選択器回路160とに対して、フアーストイ
ン・フアーストアウト形のシフトレジスタ150
を介して加えられている。検出器152と選択器
160とに対してデジタル符号化信号列を加える
ための発生器153からのクロツクパルスCLR
に対してシフトレジスタ151は応答可能であ
り、これにより動作することができる。スピーチ
標本への変換のための適応形の解読器165に対
して直接、符号Coを通過させるように選択器1
60は通常動作させることができる。ジエー・ア
ール・ボデイら(J.R.Boddieet al.)により、ベ
ル電話研究所技術雑誌(Bell System Technical
Jurnal)の1981年9月号(第60巻第7号)に掲載
された「適応形差動パルス符号変調の符号化
(“Adaptive Differential Pulse Code
Modulation Coding”)」と題する論文において
記載されている形のADPCM解読器により解読器
165が構成されている。代りに、読取り専用記
憶装置に記載されている命令に従つて動作する上
記モートローラ社(Motorola)の6800形マイク
ロプロセツサを使用して解読器を構成することも
できる。フオートラン言語(FORTRAN)にお
ける符号化したADPCM信号を解読するために必
要な、永久に記憶されている命令の一覧表を付録
Cに示す。検出回路152における無声符号の検
出に際して、選択器160は符号発生器155を
適応形の解読器165に接続する。無声カウント
符号SCTに設定されている時間間隔に対して、
発生器155は無声期間と等価なCo符号を生成
する。無声期間は無声カウンタ152によつてク
ロツクされて決定されている。この方法において
は、無声期間は符号流に再挿入されている。適応
形の解読器165からの標本化信号列は、元来、
無声期間を含んだ原符号化スピーチ波形に相当す
るものである。標本化スピーチ信号はD/A変換
器170と低域波器175とを介してアナログ
形式の信号に変換され、スピーチパターンが変換
器180において生成される。 無声符号検出器とカウンタとの回路152を、
第9図にさらに詳細に示す。第9図を参照して、
回路網140から送出された適応形の符号化信号
列は、多段シフトレジスタ905の入力端子に加
えられている。レジスタ905からの符号は比較
器915の入力端子に供給され、比較器915に
おいては、それらの符号は符号発生器920にお
いて発生した8716の無声符号と比較されている。
シフトレジスタ905からの符号8716の検出に際
しては、比較器915がイネーブルされる。比較
器915からのイネーブルされた信号SLは、
ANDゲート930に警告を発して線路927上
の無声カウント符号に対してカウンタ940をプ
リセツトしている。イネーブルされた信号SLは
フリツプフロツプ925をセツトせしめ、フリツ
プフロツプ925からの信号SL1は線路181
を適応形の解読器165の入力から分離し、無声
符号発生器155を適応形の解読器の入力端子に
接続している。信号SL1もANDゲート156か
らの出力を禁止することができ、この場合には無
声カウントダウント期間を通してFIFOシフトレ
ジスタ151は符号化信号を与えることはない。
零カウントに到達するまでは、後続するクロツク
パルスCLRがANDゲート935を介して加えら
れ、カウンタ940の内容のカウントを減分す
る。その時には、カウンタ940の借り出力は無
声期間フリツプフロツプ925をリセツトし、信
号SL1はデイスエーブルされる。選択器160
は線路181を適応形の解読器165に接続し、
FIFOレジスタ151から送出された適応形の符
号流を解読器165に供給している。 解読回路150の動作シーケンスは第10図の
流れ図に示してあり、この動作に関連した波形は
第11図に示してある。第11図の波形1101
は回路網140から送出されて受信された適応形
の符号化信号列を示す。時刻t0と時刻t1との間
で、適応形のデジタル符号C1〜Coは順次、解読
器150に加えられている。符号Coの後で、無
声カウント符号SCTの前に置かれた無声符号SC
は波形1101のデータ流に現れる。これらの2
つの符号はスピーチ信号における無声期間を表わ
している。無声期間に続いて、符号Co+1から始ま
る適応形のデジタル符号列が現れる。 第10図において、解読器150のレジスタ
と、フリツプフロツプと、ラツチとは動作過程1
001によつて初期にリセツトされる。過程10
07はクロツク待ち過程1005を介して、次の
クロツクパルスCLRが送出される時に入れられ
る。第1図における時刻t0と時刻t1との間で、ス
ピーチ符号C1,C2…Coに回路網140から受信
される。各受信パルスに対して、出力標本は動作
過程1007によつて解読装置165において形
成される。決定過程1009においては、フリツ
プフロツプ925からのSL1信号は検査される。
(決定過程1009参照。)時刻t0から時刻t1まで
のスピーチ期間においては、信号SL1セツトさ
れず、FIFO150からの次の入力符号が受信さ
れる。(過程1020参照。)入力符号が無声符号
ではないため、過程1029は決定過程1025
を介して入れられ、入力標本を解読している。 時刻t1に到達した時には、入力符号が無声符号
SCである。SC符号は比較器915において検出
され、過程1034は決定過程1025を介して
入れられている。過程1034によつてシフトレ
ジスタ905からの無声カウントM(波形110
7)が送出されるごとに、カウンタ940はロー
ドされる。無声符号発生器155は、イネーブル
された信号SL1(波形1105)により解読器
165に接続されている。 次のクロツクパルスCLの発生に際して、過程
1040は決定過程1009を介して入れられ、
無声カウンタの内容は過程1040において減分
されている。無声カウンタの内容は時刻t2に到る
まで零より大きい。結果的には、過程1042を
介して過程1036を実行させることができ、発
生器155からの無声符号列は解読器165に加
えられている。時刻t2においては、無声カウント
は零に減分し(波形1107参照)、フリツプフ
ロツプ925は過程1042を介して過程104
4によりリセツトれる。時刻t2の後では、入力符
号上の通常の動作は過程1005,1007,1
009,1020,1025,1029を含む通
路を介して回復される。波形1109に示したよ
うな解読器165に対する入力は、時刻t1と時刻
t2との間の無声期間を含むものであり、波形11
01におけるSCと無声カウント符号とに応答可
能なように再構成することができる。 本明細書では特定実施例を参照して本発明を説
明したが、本発明の精神と範囲とを越えることな
く種々の変化をさせることができることは当業者
において明らかである。例えば本明細書において
説明したADPCM形のエンコーダと解読器とは、
他の形の適応形のPCMのような方法による適応
形のデジタルエンコーダ装置と解読器装置とによ
り置換することができる。 【表】 【表】 【表】
【図面の簡単な説明】
第1図は本発明によるデジタル式音声通信回路
のブロツク図、第2図は第1図の回路において有
用な適応形のエンコーダの詳細なブロツク図、第
3図は第1図の回路において有用な無声検出器の
詳細なブロツク図、第4図は第1図の回路におい
て有用な適応形の閾値発生器の詳細なブロツク
図、第5図は第1図の回路において有用な無声カ
ウンタ装置の詳細なブロツク図、第6図は第1図
の回路において有用な符号変更回路の詳細なブロ
ツク図、第7図ならびに第10図は第1図の回路
の動作を示すフローチヤート図、第8図ならびに
第11図は第1図の回路の動作を示す波形図、第
9図は第1図の回路において有用な無声符号検出
器とカウンタ装置との詳細なブロツク図である。 〔主要部分の符号の説明〕、103……低域波
器と標本化装置、105,170……A/D変換
器、110……エンコーダ、112……閾値発生
器、115……無声検出器、120……無声カウ
ンタ、125……符号処理装置、130……符号
変更装置、140……回路網、150,165…
…解読器、151……シフトレジスタ、152…
…無声符号検出器とカウンタ、155……無声符
号発生器、160……選択器、107,153…
…クロツク信号発生器、210……ステツプサイ
ズ発生器。

Claims (1)

  1. 【特許請求の範囲】 1 スピーチパターンを適応形のデジタル符号化
    信号列に変換するための手段と前記スピーチパタ
    ーンにおける無声期間を検出するための手段とを
    有するスピーチ処理システムにおいて、 各検出された無声期間に応答し無声期間を表す
    デジタル符号化信号を発生するための手段と、 前記適応形デジタル符号化信号と前記無声期間
    を表すデジタル符号化信号とを組合せて前記パタ
    ーンに相当するデジタル信号を形成するための手
    段と、 前記変換手段は、各適応形デジタル符号化信号
    に対して適応ステツプサイズの対数を表す信号を
    形成する手段からなる適応ステツプサイズに相当
    する信号を形成するための手段と、第1の閾値信
    号と前記第1の閾値信号よりも大きい第2の閾値
    信号とを発生するための手段とからなり、 前記無声期間検出手段は、前記第1の閾値信号
    より小さく減少する適応ステツプサイズ相当信号
    に応答し無声期間を表す信号を発生するための手
    段と、前記無声期間信号と前記第2の閾値信号よ
    り大きく増加する前記適応ステツプサイズ相当信
    号とに応答し前記無声期間信号を終端するための
    手段とからなる手段であり、前記無声期間信号発
    生手段は、前記ステツプサイズ相当信号より大き
    な値の前記第1の閾値信号に応答し第3の信号を
    発生するための手段と、前記第3の信号に応答し
    前記無声期間信号を初期化するための手段と、前
    記第2の閾値信号より大きな前記ステツプサイズ
    相当信号に応答し第4の信号を発生するための手
    段と、前記無声期間信号と前記第4の信号とに対
    して共に応答し前記無声期間信号を終端するため
    の手段とからなる手段であることを特徴とするス
    ピーチ処理システム。 2 特許請求の範囲第1項に記載のスピーチ処理
    システムにおいて、 前記閾値信号発生手段は第1及び第2の予め定
    められたレベルの信号を発生するための手段と、
    前記ステツプサイズ相当信号の列に応答し前記ス
    テツプサイズ相当信号の列において最大ステツプ
    サイズ相当信号を表す信号を発生するための手段
    と、前記最大ステツプサイズ相当信号と前記予め
    定められた第1のレベル信号とに対して共に応答
    し適応形第1閾値レベル信号を発生するための手
    段と、前記最大ステツプサイズレベル信号と前記
    第2の予め定められたレベル信号とに対して共に
    応答し適応形第2閾値レベル信号を発生する手段
    とからなることを特徴とするスピーチ処理システ
    ム。 3 特許請求の範囲第1項又は第2項に記載のス
    ピーチ処理システムにおいて、 前記適応形のデジタル符号化信号と前記無声期
    間符号化信号とに応答し前記スピーチを表すデジ
    タル符号化信号列を記憶するための手段を有する
    ことを特徴とするスピーチ処理システム。 4 特許請求の範囲第3項に記載のスピーチ処理
    システムにおいて、 記憶されたデジタル符号列に応答し前記スピー
    チに相当する前記スピーチパターンを構成するた
    めの手段を有することを特徴とするスピーチ処理
    システム。 5 スピーチパターンを適応形のデジタル符号化
    信号の列に変換するための過程と前記スピーチパ
    ターンにおける無声期間を検出するための過程と
    からなるスピーチを処理する方法において、 各検出された無声期間を表すデジタル符号化信
    号を発生すると共に、前記スピーチパターンを表
    すデジタル信号を形成するために前記適応形のデ
    ジタル符号化信号と前記無声期間表示符号化信号
    とを組合せ、 前記スピーチパターンを変換するための過程
    が、各適応形のデジタル符号化信号に対して前記
    適応ステツプサイズの対数を表す信号を形成する
    過程からなる適応ステツプサイズに相当する信号
    を形成するための過程と、第1の閾値信号と前記
    第1の閾値信号より大きい第2の閾値信号とを発
    生するための過程とからなり、 前記無声期間を検出するための過程は、前記第
    1の閾値信号より小さく減少する前記適応ステツ
    プサイズ相当信号に応答し前記無声期間を示す信
    号を発生するための過程と、前記無声閾値信号と
    前記第2の閾値信号より大きく増加する前記適応
    ステツプサイズ相当信号とに応答し前記無声期間
    信号を終端するための過程とからなる過程であ
    り、前記無声期間信号を発生する過程は、前記ス
    テツプサイズ相当信号より大きな前記第1の閾値
    信号に応答し第3の信号を発生するための過程
    と、前記第3の信号に応答し前記無声期間を初期
    化するための過程と、前記第2の閾値信号より大
    きな前記ステツプサイズ相当信号に応答し第4の
    信号を発生するための過程と、前記無声期間信号
    と前記第4の信号とに対して共に応答し前記無声
    期間信号を終端するための過程とからなる過程で
    あることを特徴とする方法。 6 特許請求の範囲第5項に記載の方法におい
    て、 前記閾値信号を発生するための過程が第1及び
    第2の予め定められたレベルの信号を発生するた
    め過程と、前記ステツプサイズ相当信号の列にお
    ける前記最大ステツプサイズ相当信号を表す信号
    を生成するための過程と、前記最大のステツプサ
    イズ相当信号と前記予め定められた第1のレベル
    の信号とに対して共に応答し適応形の第1の閾値
    信号を生成するための過程と、前記最大のステツ
    プサイズ相当信号と前記第2の予め定められたレ
    ベルの閾値信号とに応答し適応形の第2のレベル
    の閾値信号を生成するための過程とからなること
    を特徴とする方法。
JP58010647A 1982-01-27 1983-01-27 スピ−チ処理システムと方法 Granted JPS58217998A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58010647A JPS58217998A (ja) 1982-01-27 1983-01-27 スピ−チ処理システムと方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US343238 1982-01-27
JP58010647A JPS58217998A (ja) 1982-01-27 1983-01-27 スピ−チ処理システムと方法

Publications (2)

Publication Number Publication Date
JPS58217998A JPS58217998A (ja) 1983-12-19
JPH0467200B2 true JPH0467200B2 (ja) 1992-10-27

Family

ID=11756007

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58010647A Granted JPS58217998A (ja) 1982-01-27 1983-01-27 スピ−チ処理システムと方法

Country Status (1)

Country Link
JP (1) JPS58217998A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0414420D0 (en) * 2004-06-28 2004-07-28 Cambridge Silicon Radio Ltd Speech activity detection

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5433487A (en) * 1977-08-18 1979-03-12 Setonaikai Tank Kuriiningu Kk Composite plant ship for processing oily wastes
CA1130920A (en) * 1979-03-05 1982-08-31 William G. Crouse Speech detector with variable threshold
JPS57192997A (en) * 1981-05-22 1982-11-27 Nippon Telegraph & Telephone Detection of existance of voice

Also Published As

Publication number Publication date
JPS58217998A (ja) 1983-12-19

Similar Documents

Publication Publication Date Title
US4449190A (en) Silence editing speech processor
US5717823A (en) Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
KR950014622B1 (ko) 입력 신호처리 방법
US5251261A (en) Device for the digital recording and reproduction of speech signals
US4412306A (en) System for minimizing space requirements for storage and transmission of digital signals
US4280192A (en) Minimum space digital storage of analog information
US3909532A (en) Apparatus and method for determining the beginning and the end of a speech utterance
US5991725A (en) System and method for enhanced speech quality in voice storage and retrieval systems
US4382160A (en) Methods and apparatus for encoding and constructing signals
US6029127A (en) Method and apparatus for compressing audio signals
JP3158932B2 (ja) 信号符号化装置及び信号復号化装置
EP0234354B1 (en) Apparatus for decoding a digital signal
US6480550B1 (en) Method of compressing an analogue signal
JPH0411054B2 (ja)
JPH0467200B2 (ja)
JP3227929B2 (ja) 音声符号化装置およびその符号化信号の復号化装置
Flanagan et al. Digital voice storage in a microprocessor
GB2084433A (en) Methods and apparatus or encoding and constructing signals
JPH0588697A (ja) 欠落音声補間方式
JPS5866440A (ja) 波形符号化方式
JPH0518119B2 (ja)
JP2848610B2 (ja) 音声分析合成装置
KR0141237B1 (ko) 음성신호 기록/재생방법 및 그 장치
JP3330178B2 (ja) 音声符号化装置および音声復号化装置
KR0125861Y1 (ko) 디지탈신호 감쇄회로