JPH03254223A - Analog data transmission system - Google Patents
Analog data transmission systemInfo
- Publication number
- JPH03254223A JPH03254223A JP5133490A JP5133490A JPH03254223A JP H03254223 A JPH03254223 A JP H03254223A JP 5133490 A JP5133490 A JP 5133490A JP 5133490 A JP5133490 A JP 5133490A JP H03254223 A JPH03254223 A JP H03254223A
- Authority
- JP
- Japan
- Prior art keywords
- data
- band
- transmission
- neural network
- analog data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 claims abstract description 33
- 238000000034 method Methods 0.000 claims description 17
- 230000015572 biosynthetic process Effects 0.000 abstract 1
- 238000003786 synthesis reaction Methods 0.000 abstract 1
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 5
- 230000006866 deterioration Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Landscapes
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Description
【発明の詳細な説明】
[産業上の利用分野コ
本発明はアナログデータ伝送方式、特に伝送信号の帯域
制限を行うことによってデータ圧縮し、伝送路の負担を
軽減可能な改良されたアナログデータ伝送方式に関する
。[Detailed Description of the Invention] [Industrial Application Fields] The present invention relates to an analog data transmission system, particularly an improved analog data transmission system that compresses data by band-limiting the transmission signal and reduces the burden on the transmission path. Regarding the method.
[従来の技術]
近年、音声あるいは画像デー′夕を伝送する必要性が著
しく増大し、例えば電話回線網、テレビ通信システムあ
るいは各種データベースを利用した通信システムとして
極めて多岐に亘る伝送手段が実用化されている。[Prior Art] In recent years, the need to transmit audio or image data has increased significantly, and a wide variety of transmission means have been put into practical use, such as communication systems using telephone lines, television communication systems, or various databases. ing.
このような伝送情報としてアナログデータを扱う場合、
その帯域が問題となる。When handling analog data as such transmission information,
The problem is the bandwidth.
伝送路の要求からすれば、アナログデータはできるだけ
狭帯域であることが望ましく、実際上アナログデータは
その保有する帯域が広いにも拘らず伝送路による帯域制
限で一部の特に高帯域成分が捨てられてしまうことが知
られている。Considering the requirements of the transmission path, it is desirable for analog data to have as narrow a band as possible, and in reality, even though analog data has a wide band, some particularly high band components are discarded due to the band limitation of the transmission path. It has been known that it can get lost.
また、アナログデータを保存するための各種のメディア
として例えば磁気テープなどが用いられるか、このよう
な記憶あるいは伝送メディアに対してもその小型軽量化
の面からアナログデータは常に帯域制限を受けることと
なる。In addition, various types of media such as magnetic tape are used to store analog data, and analog data is always subject to bandwidth limitations due to the need to reduce the size and weight of such storage or transmission media. Become.
一方、このような帯域制限はアナログデータ自体に対し
ては極めて深刻な特性劣化となり、通常の場合前記帯域
制限は高周波成分に対してデータが欠落する結果を招く
。そして、このような高域遮断されたアナログデータで
は、信号波形の鈍化が生じ、ひいては音がこもるあるい
は立上りのスピード感がなくなるなどの著しい音質劣化
を招くことが知られている。On the other hand, such band limitation causes extremely serious characteristic deterioration for analog data itself, and in normal cases, band limitation results in data loss for high frequency components. It is known that analog data with such high frequencies cut off causes a slowing of the signal waveform, which in turn leads to significant deterioration in sound quality, such as muffled sound or loss of sense of speed at rise.
例えば、一般的な音声を例にとると、これらのアナログ
音声データは通常3.4kHzまでの高帯域を有するが
、通常の伝送路によれば例えば帯域0.8kHzに制限
されてしまい、この結果音声の本来前する細い高域成分
が失われて大幅になまった波形に歪む。このような波形
劣化により、音源のピッチを表す基本的な周波数情報は
残るものの、音質的には声色が濁って不愉快にこもった
音になってしまう。また、前述した如く、音の立上りが
鈍くなるので、スピード感も損われる欠点がある。For example, taking general audio as an example, these analog audio data usually have a high band of up to 3.4 kHz, but using a normal transmission path, the band is limited to, for example, 0.8 kHz, and as a result, The thin high-frequency components that normally precede the sound are lost, resulting in a distorted waveform that becomes significantly dull. Due to such waveform deterioration, although basic frequency information representing the pitch of the sound source remains, the tone becomes muddy and unpleasantly muffled. Furthermore, as mentioned above, the rise of the sound becomes slow, which impairs the sense of speed.
更に、子音部の認識が部分的に困難になるだけでなく、
時には母音部においても第2ホルマントの欠落が起り、
誤認識の原因にもなっていた。Furthermore, not only does recognition of consonants become partially difficult;
Sometimes the second formant is missing even in the vowel part,
It also caused misunderstandings.
従って、アナログデータ処理において、伝送路あるいは
伝送機器の要求とデータ品質の要求とが常に矛盾し、こ
れらの調整が極めて困難であった。Therefore, in analog data processing, the requirements of the transmission line or transmission equipment and the requirements of data quality always conflict, and it has been extremely difficult to adjust them.
従来において、前記帯域制限されたアナログデータの復
元には等花器が用いられている。Conventionally, an analog device has been used to restore the band-limited analog data.
すなわち、等花器は帯域制限された例えば音声アナログ
データの明瞭度を上げるために、制限された周波数帯域
の増幅度を上げて、アナログ波形を復元し、これによっ
て等花器の強調増幅作用によりデータ受信側において原
データに近い復元データを得ることができる。In other words, in order to improve the clarity of band-limited audio analog data, for example, Tokagi increases the degree of amplification in the limited frequency band and restores the analog waveform, thereby enhancing data reception through the emphasized amplification effect of Tokagi. On the other hand, restored data close to the original data can be obtained.
従来における前記等化器による復元技術は例えばそれ以
外にも線形的な手法を用いた信号再生方式としていくつ
か実用化され、いずれも帯域制限を受けている高域成分
の僅かな残留データを利用するものである。The conventional restoration technique using an equalizer has been put into practical use as a signal regeneration method using a linear method, for example, and all of them utilize a small amount of residual data of high-frequency components that are subject to band limitations. It is something to do.
[発明が解決しようとする課題]
しかしながら、前記従来における復元技術では必ずしも
十分な品質の受信データを得ることができないという問
題があった。[Problems to be Solved by the Invention] However, the conventional restoration techniques described above have a problem in that received data of sufficient quality cannot necessarily be obtained.
すなわち、等花器を用いた場合、伝送路特性に応じて定
められた等花器の逆特性によって波形が復元できるはず
であるが、この場合には、所望の高帯域において僅かで
もデータが伝送されていることが必要である。すなわち
、完全に高帯域成分のデータが失われている場合には、
従来における等花器はほとんどその機能を果すことがで
きずデータ復元は不可能となる。In other words, when using an isoflower, the waveform should be able to be restored using the inverse characteristics of the isoflower determined according to the transmission path characteristics, but in this case, even a small amount of data is transmitted in the desired high band. It is necessary to be present. In other words, if high band component data is completely lost,
Conventional flower vases are almost unable to perform their functions, making data recovery impossible.
また、従来における線形的な手法を用いた信号再生方式
においても、例えば音声処理の分野では完全な極零型線
形モデルが未だ発見されておらず、もともとデータ量の
少ない音声しか受信側に得られない状況では実際上デー
タ復元はほとんど不可能であった。Furthermore, even in conventional signal reproduction methods that use linear methods, for example, in the field of audio processing, a perfect pole-zero linear model has not yet been discovered, and originally only audio with a small amount of data can be obtained on the receiving side. In situations where there is no such thing, data recovery is virtually impossible.
従来において、音声などに限定して、受信側でのデータ
が完全に欠落した場合においても、スペクトル推定技術
によって失われた高域成分データを修復する技術が提案
されているが、このようなスペクトル推定でも、音声の
子音情報まで推定することは困難であり、更にアナログ
データの保有している位相情報が全く無視されてしまう
ので、音質の変化が生じてしまうという欠点があった。In the past, technology has been proposed that uses spectrum estimation technology to restore lost high-frequency component data even when data on the receiving side is completely lost, limited to audio data. Even with estimation, it is difficult to estimate the consonant information of the voice, and furthermore, the phase information possessed by the analog data is completely ignored, resulting in a change in sound quality.
本発明は上記従来の課題に鑑みなされたものであり、そ
の目的は、高帯域データが完全に欠落した場合において
も、受信側において高い忠実度でデータ復元を可能とし
た改良されたアナログデータ伝送方式を提供することに
ある。The present invention was made in view of the above-mentioned conventional problems, and its purpose is to provide an improved analog data transmission that enables data recovery with high fidelity on the receiving side even when high-band data is completely lost. The goal is to provide a method.
[課題を解決するための手段]
上記目的を達成するために、本発明は、劣悪なアナログ
データが基本的な情報を比較的低帯域に保有しており、
高帯域成分は低帯域成分に比して固有差が少なく、この
結果、低帯域成分から比較的容易に学習できることに着
目したことを特徴とする。[Means for Solving the Problem] In order to achieve the above object, the present invention solves the problem that poor analog data retains basic information in a relatively low band,
It is characterized by focusing on the fact that high-band components have fewer inherent differences than low-band components, and as a result, learning can be done relatively easily from low-band components.
このために、本発明では、アナログデータを伝送する際
に伝送されるデータを積極的に帯域制限してしまい、高
帯域成分を自発的に欠落させてしまう。For this reason, in the present invention, when transmitting analog data, the transmitted data is actively band-limited, and high-band components are spontaneously dropped.
この結果、データ伝送路あるいは伝送機器は狭帯域で良
いために小型軽量となりあるいは伝送密度を著しく改善
できるという利点を生ずる。As a result, the data transmission path or the transmission equipment needs only a narrow band, so it has the advantage of being smaller and lighter, and the transmission density can be significantly improved.
そして、本発明においては、受信側においてニューラル
ネットワークを用いた復元処理を行い、これによって前
記欠落した高帯域成分を受信時に付加することを特徴と
する。The present invention is characterized in that a restoration process using a neural network is performed on the reception side, thereby adding the missing high-band components at the time of reception.
前記ニューラルネットワークは勿論予め処理するアナロ
グデータ毎に学習されており、これによって、受信した
低帯域領域のアナログデータからこれに対応した高帯域
成分をニューラルネットワークで作成して忠実度の高い
復元を行うことができる。The neural network is, of course, trained in advance for each analog data to be processed, so that the neural network creates high-band components corresponding to the received low-band analog data and performs high-fidelity restoration. be able to.
すなわち、本発明によれば、前述した如く、アナログデ
ータ中の高帯域成分が比較的固有差か少なく、低帯域成
分から比較的容易に推定可能であることを利用し、高帯
域成分が完全に欠落している状態でもニューラルネット
ワークの学習によって忠実度の高い復元作用を可能とし
た。That is, according to the present invention, as described above, the high band components in analog data have relatively small inherent differences and can be estimated relatively easily from the low band components, and the high band components are completely Even in the missing state, neural network learning enables high-fidelity restoration.
勿論、本発明の特徴である前述した高帯域成分の除去は
帯域制限器を用いても良く、あるいは伝送路自体の狭帯
域特性で実現しても良い。Of course, the above-mentioned removal of high band components, which is a feature of the present invention, may be achieved by using a band limiter or by using the narrow band characteristics of the transmission path itself.
[作用]
従って、本発明によれば、音声あるいは画像などのアナ
ログデータは予め送信側あるいは伝送路において積極的
に帯域制限されて送られる。[Operation] Therefore, according to the present invention, analog data such as audio or images is actively band-limited beforehand on the transmitting side or on the transmission path before being sent.
そして、受信側に設けられているニューラルネットワー
クは予め処理対象となるアナログデータに対してパック
プロパゲーションなどを用いて学習され、ニューラルネ
ットワークの入出力特性が定められる。The neural network provided on the receiving side is trained in advance using pack propagation or the like on the analog data to be processed, and the input/output characteristics of the neural network are determined.
このよにして学習されたニューラルネットワークに帯域
制限されたアナログデータが供給されると、ニューラル
ネットワークからは低帯域情報から高帯域データを作り
出し、これによって原データに近い受信データを復元す
ることが可能となる。When a neural network trained in this way is supplied with band-limited analog data, the neural network generates high-band data from low-band information, which makes it possible to restore received data that is close to the original data. becomes.
前記ニューラルネットワークによるデータ復元は受信デ
ータそのものを復元データに変換しても良く、あるいは
失われた高域成分のみを時間差分から復元してこれに受
信データを合成することも可能である。Data restoration using the neural network may be performed by converting the received data itself into restored data, or by restoring only the lost high frequency component from the time difference and combining the received data with this.
[実施例] 以下図面に基づいて本発明の好適な実施例を説明する。[Example] Preferred embodiments of the present invention will be described below based on the drawings.
第1図には本発明が適用された伝送システムの全体構成
が示されている。FIG. 1 shows the overall configuration of a transmission system to which the present invention is applied.
送信されるアナログデータ100は例えば図において帯
域3.4 kHzを有する音声「女性の「あ」」として
示され、この送信アナログデータ100は送信側におい
てローパスフィルタからなる帯域制限器10により帯域
0.8kf(zに狭帯域化される。勿論、この帯域制限
周波数は伝送路あるいは伝送機器によって任意に選択可
能であり、後に詳述する如く、実験によれば帯域周波数
が変化しても、本発明における復元作用に大きな影響は
見られない。For example, the analog data 100 to be transmitted is shown in the figure as a voice "female's 'a'" having a band of 3.4 kHz, and this analog data 100 to be transmitted is reduced to a band of 0.5 kHz by a band limiter 10 consisting of a low-pass filter on the transmitting side. The band is narrowed to 8 kf (z). Of course, this band-limiting frequency can be arbitrarily selected depending on the transmission line or transmission equipment, and as will be detailed later, experiments have shown that even if the band frequency changes, the present invention No significant effect was seen on the restoring effect.
高帯域成分が除去された波形110は図示の如く基本ピ
ッチのみを残した大幅に情報量の欠落した信号として示
されている。As shown in the figure, the waveform 110 from which the high band components have been removed is shown as a signal with a large amount of information missing, leaving only the basic pitch.
このような狭帯域信号110は実施例において送信機1
2により伝送路14に送り込まれ、受信側では受信機1
6にて受信される。Such a narrowband signal 110 is transmitted to the transmitter 1 in the embodiment.
2 to the transmission line 14, and on the receiving side, the receiver 1
Received at 6.
本発明において、このような伝送系に関しては、アナロ
グあるいはデジタル処理でもあるいは有線あるいは無線
を問わず任意に利用可能であり、本発明の特徴は送信側
あるいは伝送器においてアナログ信号の段階で狭帯域制
限を施すことによってアナログデータそのもののデータ
圧縮を可能とすることにある。In the present invention, such a transmission system can be arbitrarily used regardless of whether it is analog or digital processing, wired or wireless, and the feature of the present invention is that narrow band limitation is applied at the analog signal stage on the transmitting side or transmitter. The objective is to enable data compression of the analog data itself by applying .
前記受信機16の出力は第1図において狭帯域化された
信号110とほぼ同一であると考える。Consider that the output of the receiver 16 is approximately the same as the narrowband signal 110 in FIG.
そして、この受信信号は実施例においてそのまま合成器
20へ供給されると共に、失われた高域成分を復元する
ためにニューラルネットワークにて復元が行われる。In this embodiment, this received signal is supplied as it is to the synthesizer 20, and is restored by a neural network in order to restore the lost high-frequency components.
受信データ200はまずサンプル回路22へ供給され、
サンプリングクロックによってデータのサンプリングが
行われる。実施例において、サンプリングクロックは1
0kHzの周波数を有し、40個で1フレームを形成す
る。すなわち、この40個は、後述するニューラルネッ
トワークが4層パーセプトロン構成を有し、各層が40
個のユニットを有しており、前記40個のサンプリング
データがそれぞれ各入力層のニューラルユニットに割り
付けられる。The received data 200 is first supplied to the sample circuit 22,
Data is sampled by the sampling clock. In the example, the sampling clock is 1
It has a frequency of 0 kHz, and 40 pieces form one frame. That is, these 40 neural networks have a 4-layer perceptron configuration, and each layer has 40 perceptrons.
The 40 sampling data are allocated to the neural units of each input layer, respectively.
以上のようにしてサンプリングされたデータは次に差分
器24へ供給され、実施例においては時間差分値が出力
される。The data sampled as described above is then supplied to the differentiator 24, and in the embodiment, a time difference value is output.
勿論、本発明においてサンプリングされた波形データそ
のものをニューラルネットワークに供給することも可能
であるが、実施例においては、高帯域を強調するために
前述した如く時間差分値がニューラルネットワークの人
力データとして用いられる。Of course, it is also possible to supply the sampled waveform data itself to the neural network in the present invention, but in the embodiment, the time difference value is used as manual data for the neural network as described above in order to emphasize high bands. It will be done.
そして、前記差分データはニューラルネットワーク26
によって所定の変換処理を受ける。Then, the difference data is stored in the neural network 26.
undergoes a predetermined conversion process.
すなわち、二二−ラルネットワーク26は自ら学習によ
って生成した変換規則に従って、受信データと送信デー
タとの誤差を予測し、その値を出力する。That is, the 22-ral network 26 predicts the error between the received data and the transmitted data according to the conversion rule generated by learning itself, and outputs the value.
実施例においては、この予測値は前述した合成器20の
他方の入力に供給され、この結果合成器20は前記受信
データ200をニューラルネットワーク26から得られ
る予測値と合成して図の符号210で示される合成デー
タとして出力する。In the illustrative embodiment, this predicted value is provided to the other input of the synthesizer 20 described above, so that the synthesizer 20 combines the received data 200 with the predicted value obtained from the neural network 26 and generates the predicted value at 210 in the figure. Output as the composite data shown.
以上のようにして、本発明によれば送信されるデータは
予めアナログ状態でデータ圧縮を受け、これをニューラ
ルネットワークを用いて受信側にて復元することを特徴
とし、伝送路あるいは伝送機器の負担を軽減しながらか
つ高忠実度のデータ伝送を可能とする利点がある。As described above, according to the present invention, data to be transmitted is compressed in advance in an analog state, and this is restored on the receiving side using a neural network, thereby burdening the transmission line or transmission equipment. This has the advantage of enabling high-fidelity data transmission while reducing data transmission.
前述したニューラルネットワーク26は周知の如く学習
と実行の2段階のプロセスを有し、本発明によれば、処
理対象となるアナログデータによって復元に必要な変換
規則を学習し、次に前述した如く受信データを入力して
前記学習した変換規則に従った予測値の出力を実行段階
として行う。As is well known, the neural network 26 described above has a two-step process of learning and execution, and according to the present invention, it learns the conversion rules necessary for restoration based on the analog data to be processed, and then performs the reception as described above. As an execution step, data is input and a predicted value according to the learned conversion rule is output.
すなわち、学習段階においては、帯域制限を受けて劣化
した受信データから、帯域制限を受ける以前の本来の送
信データと受信データとの誤差を推定する変換規則を経
験的にニューラルネットワークに学習させる。That is, in the learning stage, the neural network is made to empirically learn a conversion rule for estimating the error between the original transmission data before the band limitation and the received data from the received data degraded due to the band limitation.
そして、実行段階では、未知の受信データ入力に対して
、本来の送信データとの推定誤差を出力し、実施例によ
れば前述した如く受信データにこの誤差予測値を加算す
ることによって合成波形を得ることとなる。Then, in the execution stage, the estimated error with respect to the original transmitted data is output for the unknown received data input, and according to the embodiment, the synthesized waveform is created by adding this predicted error value to the received data as described above. You will get it.
以下には前記ニューラルネットワーク26の内容を詳細
に説明する。The contents of the neural network 26 will be explained in detail below.
第2図には一般的なニューロンのモデルが示され、通常
ユニットと呼ばれるニューロンの動作を情報処理の機能
素子としてモデル化した工学モデルを示す。FIG. 2 shows a general neuron model, and shows an engineering model in which the operation of a neuron, usually called a unit, is modeled as an information processing functional element.
ユニットは入力側からの信号を重み付けによる多数決論
理で処理し、1つの出力信号を発生する。The unit processes the signals from the input side using weighted majority logic and produces one output signal.
そして、この出力信号を次層の複数のユニットの入力信
号として用い、多層階層による学習及び実行処理を行う
。このモデルは、入力信号と重みとの積和演算と、その
積和演算結果に対する閾値処理の2つの処理をニューロ
ンの基本性質として捕えたものである。シグモイド関数
を用いると、ユニットの人出力特性が次のように定式化
される。Then, this output signal is used as an input signal for a plurality of units in the next layer to perform learning and execution processing using a multilayer hierarchy. This model captures two processes as the basic properties of a neuron: a product-sum operation of an input signal and a weight, and a threshold value process for the result of the product-sum operation. Using the sigmoid function, the human output characteristics of the unit can be formulated as follows.
o 、−f−(net −)
(2)1)J J pJf
、 (x)=1/ (1+exp (−x+θ)
)(3)
前述した多数のユニットにニューロン)を相互に結合す
ることによってニューラルネットワークが構成され、そ
の結合形態によってさまざまなバリエーションが生まれ
る。o, -f-(net-)
(2)1) J J pJf
, (x)=1/ (1+exp (-x+θ)
) (3) A neural network is constructed by interconnecting the aforementioned large number of units (neurons), and various variations are created depending on the form of the connection.
第3図には本発明に係るニューラルネットワークの原理
的な構造が示されており、入力層、2層の中間層及び出
力層の4層からなるネットワーク構造を有する。FIG. 3 shows the basic structure of the neural network according to the present invention, which has a network structure consisting of four layers: an input layer, two intermediate layers, and an output layer.
階層ネットワークにおける各ユニットは、人力層から中
間層、中間層から出力層という向きに結合しており、各
層内での結合及び出力層から人力層へと向う結合は存在
しない。Each unit in the hierarchical network is connected in the direction from the human-powered layer to the intermediate layer and from the intermediate layer to the output layer, and there are no connections within each layer or from the output layer to the human-powered layer.
人力層に人カバターンが与えられると、入力層の各ユニ
ットはその人力信号を中間層へ渡し、中間層の各ユニッ
トは前述した(1)式及び(2)式に基づいて動作し、
出力層の各ユニットに出力信号を供給する。When a human cover turn is given to the human power layer, each unit of the input layer passes the human power signal to the middle layer, and each unit of the middle layer operates based on the above-mentioned equations (1) and (2),
An output signal is supplied to each unit of the output layer.
そして、最終的には、ネットワークの出カバターンが出
力層の各ユニットから出力される。Finally, the output pattern of the network is output from each unit of the output layer.
従って、このネットワークは、入力を常に前向きに処理
することによって、ユニット間の結合の重みWから決定
される一定の変換規則(データ処理法)を入カバターン
に適応し、出力層にそのパターンを出力する。Therefore, by always processing the input forward, this network applies a certain transformation rule (data processing method) determined from the weight W of connections between units to the input cover pattern, and outputs that pattern to the output layer. do.
前述した一般的なニューラルネットワークを動作させる
場合、前述した変換規則を与えなければならず、このた
めにネットワークの学習が必要である。このネットワー
クの学習とは、与えられる個々の入カバターンに対して
、ネットワークが実際に出力する出カバターンと望まし
い出カバターン(教師信号)とが一致するまたは十分に
似ているようなユニット間の結合の重みWの集合を見つ
け出すことである。When operating the general neural network described above, the transformation rules described above must be provided, and the network needs to be trained for this purpose. This network learning is the process of determining connections between units such that, for each given input pattern, the output pattern actually output by the network and the desired output pattern (teacher signal) match or are sufficiently similar. The purpose is to find a set of weights W.
このような階層ネットワークの学習アルゴリズムとして
はルーメルハートらが提案したバックプロパゲーション
法が知られている。バックプロパゲーション法は、階層
ネットワークに実際の出カバターンと望ましい出カバタ
ーン(教師信号)との誤差をフィードバックし、これに
基づいて結合の重みWとバイアス値θとで以下の(4)
式に基づいて適応的に自動調整する。As a learning algorithm for such a hierarchical network, the backpropagation method proposed by Rumelhart et al. is known. In the backpropagation method, the error between the actual output pattern and the desired output pattern (teacher signal) is fed back to the hierarchical network, and based on this, the connection weight W and bias value θ are determined as shown in (4) below.
Adaptively auto-adjust based on the formula.
Δ wo、寥ηδ 、i 、
(4)1)Jl pJ p1
出力層のユニットに関するδ 、は
l
δ 、 −(t 、−o 、) f 、
(nepj pJ I)j
J中間層のユニットに関するδptは
δ−=f−,(net 、)ΣδpkWkjpJ
J pjのように計算される
。Δ wo, ηδ , i ,
(4)1) Jl pJ p1 δ for the output layer unit is l δ , −(t , −o ,) f ,
(nepj pJ I)j
δpt for the unit of J middle layer is δ−=f−, (net,)ΣδpkWkjpJ
It is calculated as J pj.
以上の結果、ネットワークは入カバターンと出カバター
ンとの間の連合を学習、し、適応的なデータ処理を実現
できるようになる。As a result of the above, the network learns the association between input and output patterns, and can realize adaptive data processing.
本発明において、前述した第1図から明らかなように、
ニューラルネットワークには帯域制限を受けた受信デー
タの時間差分値が与えられ、その差分値を一定の長さの
フレーム(実施例において40サンプル分)毎にニュー
ラルネットワーク26の人力層の各ユニットに与え、出
力層より出された信号と、之の信号と帯域制限された受
信データの差との数値的隔りを再消化する方向でネット
ワークの結合の重みWの学習が進められる。In the present invention, as is clear from FIG. 1 mentioned above,
The neural network is given the time difference value of the received data subject to the band limit, and the difference value is given to each unit of the human layer of the neural network 26 for every frame of a certain length (40 samples in the embodiment). , learning of the network connection weights W proceeds in a direction that re-digests the numerical gap between the signal output from the output layer and the difference between this signal and the band-limited received data.
従って、以上の学習を経た後、ニューラルネットワーク
26は帯域制限され高帯域が除去されたデータを復元す
るために最適な結合の重みWを有することとなる。Therefore, after the above learning, the neural network 26 will have the optimum combination weight W for restoring the band-limited data from which high bands have been removed.
t 、) (5)
pJ
(6)
第4図には本実施例におけるニューラルネットワーク2
6のデータ復元作用が示されており、帯域制限された受
信データは以下の条件下で学習及び復元動作が行われる
。t, ) (5) pJ (6) Figure 4 shows the neural network 2 in this embodiment.
6, the learning and restoring operations are performed on band-limited received data under the following conditions.
サンプリング周波数 : 10kHzフレーム長
:4m5(40個)フレームシフト :
2m5(20個)サンプルポイント数 二6000個
(母音):2000個
(子音十母音)
蓄積フレーム数 :50個(母音)=25個(子
音十母音)
学習効率定数(η) +0.002(母音):0.
004
(子音十母音)
安定化係数(α):o、c+
構成 、4層バーセプトロン。Sampling frequency: 10kHz frame length
:4m5 (40 pieces) Frame shift:
2m5 (20 pieces) Number of sample points 26000 pieces (vowels): 2000 pieces (consonants and 10 vowels) Number of accumulated frames: 50 pieces (vowels) = 25 pieces (consonants and 10 vowels) Learning efficiency constant (η) +0.002 (vowels) ):0.
004 (consonant ten vowels) Stabilization coefficient (α): o, c+ configuration, 4-layer berseptron.
(40,40,40,40)
入力信号 : 013kl(z帯域信号の差分希望出
力信号: 0.1ikHz帯域信号と3.4kHz帯域
信帯域差
ここでサンプルポイント数とは、ニューラルネットワー
クの学習に用いたポイントの数を表す。(40, 40, 40, 40) Input signal: 013kl (difference between z-band signal Desired output signal: 0.1ikHz band signal and 3.4kHz band difference) Here, the number of sample points is the difference between the z-band signal and the 3.4kHz band signal. Represents the number of points earned.
ここでは母音のみの場合は初めの0.6秒間を、子音を
含む音節の場合には初めの0,2秒間を学習に用いてい
る。また、蓄積フレーム数とは、学習の際にユニットの
誤差をある一定のフレーム数分たけ蓄積した後、誤差伝
播し、ネットワークの重みの更新を行うので、そのフレ
ームの数を表したものである。ユニットの誤差を蓄積す
ることにより、ネットワークは個々のフレームのデータ
に固執せずに、全データについて広く一般化を行い、最
適解を求めることができる。この値が小さすぎると、ネ
ットワークは個々のデータに依存し易くなり、全データ
に対する最適解の探索に多くの時間を要するようになる
。逆にこの値が大きいと、波形の細かい特徴がとらえに
くくなる。Here, the first 0.6 seconds are used for learning in the case of only vowels, and the first 0.2 seconds in the case of syllables containing consonants. In addition, the number of accumulated frames refers to the number of frames since the unit error is accumulated for a certain number of frames during learning, and then the error is propagated and the network weights are updated. . By accumulating unit errors, the network can broadly generalize across all data to find the optimal solution, rather than fixating on individual frame data. If this value is too small, the network becomes dependent on individual data, and it takes a lot of time to search for the optimal solution for all data. Conversely, if this value is large, it becomes difficult to capture the fine features of the waveform.
表3・表4に主観評価結果(MOS :MEANOPI
NION 5CORE)を示す。Tables 3 and 4 show the subjective evaluation results (MOS: MEANOPI
NION 5CORE).
表3
文章発声における主観評価結果
(学習話者)
表4 文章発声における主観評価結果
(未学習話者)
この評価では、3.4kHz帯域信号を原音(4点に相
当)と考え、0点(非常に悪い音質)から4点(原音と
同じ)の5段階で10人に音質の評価をしてもらい、そ
の平均の点数をつけである。各帯域の信号と合成音との
比較を行うと、帯域0.8kHzの信号を使って合成し
た信号は、学習話者、未学習話者ともに受信信号である
0、8kHz帯域の信号を上回るのは勿論、2 、0k
Hz帯域の信号よりも良いスコアが得られた。これによ
り、損失情報を予測して信号帯域を拡張した効果が示さ
れた。Table 3 Subjective evaluation results for sentence utterances (learning speakers) Table 4 Subjective evaluation results for sentence utterances (untrained speakers) In this evaluation, the 3.4kHz band signal is considered to be the original sound (equivalent to 4 points), and 0 points ( Ten people were asked to rate the sound quality on a five-point scale from 4 points (very poor sound quality) to 4 points (same as the original sound), and the average score was given. Comparing the signals in each band and the synthesized sound, the signal synthesized using the 0.8 kHz band signal exceeds the received signal in the 0 and 8 kHz bands for both trained and untrained speakers. Of course, 2,0k
A better score was obtained than the signal in the Hz band. This demonstrated the effectiveness of predicting loss information and expanding the signal band.
本実施例においては、0 、11kHz帯域信号を入力
として仮定しているが、伝送路の周波数特性の変動に対
する検討として、学習話者において帯域0.7kHzに
制限された信号をもとに合成した信号についても評価を
行った。その結果を表3の最下掴に併記する。前述した
0、8kHz帯域信号をもとに合成した音に比べ、多少
の劣化はみられるものの、2.0kHz帯域信号に迫る
スコアが得られた。従って、伝送路の周波数特性の多少
の変動にも、本発明で提案した方式が適応できることが
判明した。In this example, it is assumed that a signal in the 0 and 11 kHz band is input, but in order to consider fluctuations in the frequency characteristics of the transmission path, a signal synthesized based on a signal whose band is limited to 0.7 kHz in the learning speaker is used. Signals were also evaluated. The results are also listed at the bottom of Table 3. Although there was some deterioration compared to the sound synthesized based on the 0.8 kHz band signal mentioned above, a score close to that of the 2.0 kHz band signal was obtained. Therefore, it has been found that the method proposed by the present invention can be applied even to slight variations in the frequency characteristics of the transmission path.
[発明の効果]
以上説明したように、本発明によれば、アナログデータ
を伝送する際に、送信側あるいは伝送路においてアナロ
グデータの圧縮を帯域制限にて行い、これによって伝送
路及び伝送機器の構成を極めて簡単にすることが可能と
むる。[Effects of the Invention] As explained above, according to the present invention, when transmitting analog data, the analog data is compressed by band limiting on the transmitting side or on the transmission path, thereby reducing the speed of the transmission path and transmission equipment. It is possible to make the configuration extremely simple.
また、受信側では、ニューラルネットワークによる予め
さだめられた変換規則に則ったデータ復元が行われ、こ
れによって極めて忠実度の高いデータ受信が可能となる
。Furthermore, on the receiving side, data is restored in accordance with preset conversion rules using a neural network, thereby making it possible to receive data with extremely high fidelity.
1fi1図は本発明に係るアナログデータ伝送方式の好
適な実施例を示す概略構成図、
第2図は本発明に用いられるニューロンの原理を示す説
明図、
第3図は本発明に用いられるニューラルネットワークの
階層構造を示す説明図、
第4図は本発明に係るニューラルネットワークの動作を
説明する図である。
10 ・・・ 帯域制限器
14
伝送路
6
ニューラルネットワークFigure 1fi1 is a schematic configuration diagram showing a preferred embodiment of the analog data transmission system according to the present invention, Figure 2 is an explanatory diagram showing the principle of a neuron used in the present invention, and Figure 3 is a neural network used in the present invention. FIG. 4 is a diagram illustrating the operation of the neural network according to the present invention. 10...Band limiter 14 Transmission line 6 Neural network
Claims (1)
おいて予めデータ特性に合せて学習されたニューラルネ
ットワークにて高帯域成分を復元することを特徴とする
アナログデータ伝送方式。An analog data transmission method characterized by transmitting analog data after removing high-band components, and restoring the high-band components on the receiving side using a neural network trained in advance according to data characteristics.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5133490A JPH03254223A (en) | 1990-03-02 | 1990-03-02 | Analog data transmission system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5133490A JPH03254223A (en) | 1990-03-02 | 1990-03-02 | Analog data transmission system |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH03254223A true JPH03254223A (en) | 1991-11-13 |
Family
ID=12884025
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5133490A Pending JPH03254223A (en) | 1990-03-02 | 1990-03-02 | Analog data transmission system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH03254223A (en) |
Cited By (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2002009092A1 (en) * | 2000-07-21 | 2002-01-31 | Kabushiki Kaisha Kenwood | Frequency interpolating device for interpolating frequency component of signal and frequency interpolating method |
| WO2002035517A1 (en) * | 2000-10-24 | 2002-05-02 | Kabushiki Kaisha Kenwood | Apparatus and method for interpolating signal |
| WO2002050814A1 (en) * | 2000-12-07 | 2002-06-27 | Kabushiki Kaisha Kenwood | System and method for signal interpolation |
| WO2003003345A1 (en) * | 2001-06-29 | 2003-01-09 | Kabushiki Kaisha Kenwood | Device and method for interpolating frequency components of signal |
| US7805293B2 (en) | 2003-02-27 | 2010-09-28 | Oki Electric Industry Co., Ltd. | Band correcting apparatus |
| WO2011043227A1 (en) * | 2009-10-07 | 2011-04-14 | ソニー株式会社 | Frequency band enlarging apparatus and method, encoding apparatus and method, decoding apparatus and method, and program |
| JP2013515287A (en) * | 2009-12-21 | 2013-05-02 | マインドスピード テクノロジーズ インコーポレイテッド | Voice bandwidth extension method and voice bandwidth extension system |
| TWI484482B (en) * | 2010-04-13 | 2015-05-11 | Sony Corp | Signal processing apparatus and method, coding apparatus and method, decoding apparatus and method, and signal processing program |
| US9390717B2 (en) | 2011-08-24 | 2016-07-12 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| US9406312B2 (en) | 2010-04-13 | 2016-08-02 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US9583112B2 (en) | 2010-04-13 | 2017-02-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US9767824B2 (en) | 2010-10-15 | 2017-09-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| JP2017207765A (en) * | 2008-12-19 | 2017-11-24 | 株式会社半導体エネルギー研究所 | Driving method of liquid crystal display device |
| US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| WO2018062021A1 (en) * | 2016-09-27 | 2018-04-05 | パナソニックIpマネジメント株式会社 | Audio signal processing device, audio signal processing method, and control program |
| WO2018138597A1 (en) * | 2017-01-26 | 2018-08-02 | 株式会社半導体エネルギー研究所 | Semiconductor device, and electronic apparatus |
| JP2018120217A (en) * | 2017-01-20 | 2018-08-02 | 株式会社半導体エネルギー研究所 | Display system and electronic apparatus |
| JP2018136528A (en) * | 2017-01-26 | 2018-08-30 | 株式会社半導体エネルギー研究所 | Semiconductor device and electronic device having the semiconductor device |
| US10692511B2 (en) | 2013-12-27 | 2020-06-23 | Sony Corporation | Decoding apparatus and method, and program |
| WO2021090465A1 (en) * | 2019-11-08 | 2021-05-14 | 日本電信電話株式会社 | Band extension device, band extension method, and program |
-
1990
- 1990-03-02 JP JP5133490A patent/JPH03254223A/en active Pending
Cited By (50)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6879265B2 (en) | 2000-07-21 | 2005-04-12 | Kabushiki Kaisha Kenwood | Frequency interpolating device for interpolating frequency component of signal and frequency interpolating method |
| WO2002009092A1 (en) * | 2000-07-21 | 2002-01-31 | Kabushiki Kaisha Kenwood | Frequency interpolating device for interpolating frequency component of signal and frequency interpolating method |
| WO2002035517A1 (en) * | 2000-10-24 | 2002-05-02 | Kabushiki Kaisha Kenwood | Apparatus and method for interpolating signal |
| WO2002050814A1 (en) * | 2000-12-07 | 2002-06-27 | Kabushiki Kaisha Kenwood | System and method for signal interpolation |
| WO2003003345A1 (en) * | 2001-06-29 | 2003-01-09 | Kabushiki Kaisha Kenwood | Device and method for interpolating frequency components of signal |
| US7400651B2 (en) | 2001-06-29 | 2008-07-15 | Kabushiki Kaisha Kenwood | Device and method for interpolating frequency components of signal |
| US7805293B2 (en) | 2003-02-27 | 2010-09-28 | Oki Electric Industry Co., Ltd. | Band correcting apparatus |
| US11300832B2 (en) | 2008-12-19 | 2022-04-12 | Semiconductor Energy Laboratory Co., Ltd. | Method for driving liquid crystal display device |
| JP2017207765A (en) * | 2008-12-19 | 2017-11-24 | 株式会社半導体エネルギー研究所 | Driving method of liquid crystal display device |
| US10578920B2 (en) | 2008-12-19 | 2020-03-03 | Semiconductor Energy Laboratory Co., Ltd. | Method for driving liquid crystal display device |
| US10254586B2 (en) | 2008-12-19 | 2019-04-09 | Semiconductor Energy Laboratory Co., Ltd. | Method for driving liquid crystal display device |
| US11899311B2 (en) | 2008-12-19 | 2024-02-13 | Semiconductor Energy Laboratory Co., Ltd. | Method for driving liquid crystal display device |
| CN103996402A (en) * | 2009-10-07 | 2014-08-20 | 索尼公司 | Encoding device and encoding method |
| AU2021215291B2 (en) * | 2009-10-07 | 2023-02-23 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
| US9208795B2 (en) | 2009-10-07 | 2015-12-08 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
| AU2019206091B2 (en) * | 2009-10-07 | 2021-05-13 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
| CN102576544A (en) * | 2009-10-07 | 2012-07-11 | 索尼公司 | Band extension device and method, encoding device and method, decoding device and method, and program |
| US9691410B2 (en) | 2009-10-07 | 2017-06-27 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
| AU2016253695B2 (en) * | 2009-10-07 | 2019-04-18 | Sony Corporation | Frequency band extending device and method, encoding device and method, decoding device and method, and program |
| WO2011043227A1 (en) * | 2009-10-07 | 2011-04-14 | ソニー株式会社 | Frequency band enlarging apparatus and method, encoding apparatus and method, decoding apparatus and method, and program |
| JP2013515287A (en) * | 2009-12-21 | 2013-05-02 | マインドスピード テクノロジーズ インコーポレイテッド | Voice bandwidth extension method and voice bandwidth extension system |
| US10546594B2 (en) | 2010-04-13 | 2020-01-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US10297270B2 (en) | 2010-04-13 | 2019-05-21 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| TWI484482B (en) * | 2010-04-13 | 2015-05-11 | Sony Corp | Signal processing apparatus and method, coding apparatus and method, decoding apparatus and method, and signal processing program |
| US9406312B2 (en) | 2010-04-13 | 2016-08-02 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US9583112B2 (en) | 2010-04-13 | 2017-02-28 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US10224054B2 (en) | 2010-04-13 | 2019-03-05 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US9659573B2 (en) | 2010-04-13 | 2017-05-23 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US9679580B2 (en) | 2010-04-13 | 2017-06-13 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US10381018B2 (en) | 2010-04-13 | 2019-08-13 | Sony Corporation | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program |
| US9767824B2 (en) | 2010-10-15 | 2017-09-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| US10236015B2 (en) | 2010-10-15 | 2019-03-19 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| US9390717B2 (en) | 2011-08-24 | 2016-07-12 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| US10692511B2 (en) | 2013-12-27 | 2020-06-23 | Sony Corporation | Decoding apparatus and method, and program |
| US12183353B2 (en) | 2013-12-27 | 2024-12-31 | Sony Group Corporation | Decoding apparatus and method, and program |
| US11705140B2 (en) | 2013-12-27 | 2023-07-18 | Sony Corporation | Decoding apparatus and method, and program |
| US11507807B2 (en) | 2016-09-27 | 2022-11-22 | Panasonic Intellectual Property Management Co., Ltd. | Audio signal processing device, audio signal processing method, and control program |
| CN109791772A (en) * | 2016-09-27 | 2019-05-21 | 松下知识产权经营株式会社 | Audio-signal processing apparatus, audio signal processing method and control program |
| CN109791772B (en) * | 2016-09-27 | 2023-07-04 | 松下知识产权经营株式会社 | Sound signal processing device, sound signal processing method, and recording medium |
| WO2018062021A1 (en) * | 2016-09-27 | 2018-04-05 | パナソニックIpマネジメント株式会社 | Audio signal processing device, audio signal processing method, and control program |
| JPWO2018062021A1 (en) * | 2016-09-27 | 2019-08-08 | パナソニックIpマネジメント株式会社 | Audio signal processing apparatus, audio signal processing method, and control program |
| JP2018120217A (en) * | 2017-01-20 | 2018-08-02 | 株式会社半導体エネルギー研究所 | Display system and electronic apparatus |
| US11676558B2 (en) | 2017-01-20 | 2023-06-13 | Semiconductor Energy Laboratory Co., Ltd. | Display system and electronic device |
| JP2018136528A (en) * | 2017-01-26 | 2018-08-30 | 株式会社半導体エネルギー研究所 | Semiconductor device and electronic device having the semiconductor device |
| US11373612B2 (en) | 2017-01-26 | 2022-06-28 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device and electronic device including the semiconductor device |
| US11509918B2 (en) | 2017-01-26 | 2022-11-22 | Semiconductor Energy Laboratory Co., Ltd. | Semiconductor device, and electronic device |
| JPWO2018138597A1 (en) * | 2017-01-26 | 2019-11-14 | 株式会社半導体エネルギー研究所 | Semiconductor device and electronic device |
| WO2018138597A1 (en) * | 2017-01-26 | 2018-08-02 | 株式会社半導体エネルギー研究所 | Semiconductor device, and electronic apparatus |
| WO2021090465A1 (en) * | 2019-11-08 | 2021-05-14 | 日本電信電話株式会社 | Band extension device, band extension method, and program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH03254223A (en) | Analog data transmission system | |
| CN113470667B (en) | Voice signal encoding and decoding method, device, electronic device and storage medium | |
| CN112567459B (en) | Sound separation device, sound separation system, sound separation method and storage medium | |
| US5532950A (en) | Dynamic digital filter using neural networks | |
| EP4229629B1 (en) | Real-time packet loss concealment using deep generative networks | |
| JP4504414B2 (en) | Redundancy reduction method | |
| JP5371931B2 (en) | Encoding device, decoding device, and methods thereof | |
| TWI708243B (en) | System and method for supression by selecting wavelets for feature compression and reconstruction in distributed speech recognition | |
| WO1996016533A2 (en) | Method for transforming a speech signal using a pitch manipulator | |
| US11790926B2 (en) | Method and apparatus for processing audio signal | |
| Uncini | Audio signal processing by neural networks | |
| CN111986112B (en) | A Deep Full Convolutional Neural Network Image Denoising Method Based on Soft Attention Mechanism | |
| CN118248159A (en) | A joint training method for speech enhancement model based on frequency subband | |
| CN114267372A (en) | Voice noise reduction method, system, electronic device and storage medium | |
| EP1426926B1 (en) | Apparatus and method for changing the playback rate of recorded speech | |
| US5828993A (en) | Apparatus and method of coding and decoding vocal sound data based on phoneme | |
| Raj et al. | Multilayered convolutional neural network-based auto-CODEC for audio signal denoising using mel-frequency cepstral coefficients | |
| US5692098A (en) | Real-time Mozer phase recoding using a neural-network for speech compression | |
| Rajaratnam et al. | Speech coding and audio preprocessing for mitigating and detecting audio adversarial examples on automatic speech recognition | |
| Asad et al. | Noise Suppression Using Gated Recurrent Units and Nearest Neighbor Filtering | |
| CN101770777B (en) | A linear predictive coding frequency band extension method, device and codec system | |
| EP4481740A1 (en) | Method for speech enhancement | |
| JP3084721B2 (en) | Noise removal circuit | |
| Parisae et al. | Single channel speech enhancement using CNN with frequency dimension adaptive attention based squeeze-TCN | |
| Returi et al. | A method of speech signal analysis using multi-level wavelet transform |