BESCHREIBUNG
Verfahren und Anordnung zum Bilden der Summe einer Kette von Produkten
Die Erfindung betrifft ein Verfahren zum Bilden der Summe einer Kette von Produkten aus je zwei Zahlen, die nachein¬ ander zugeführt werden, wobei jedes Zwischenergebnis der Summenbildung zwischengespeichert wird, sowie eine Anord¬ nung zum Bilden der Summe einer Kette von Produkten aus jeweils einem ersten und einem zweiten Wert, mit einer Speicheranordnung zum Speichern einer Anzahl von Werten mit einer vorgegebenen ersten Anzahl Bits, einer taktge¬ steuerten Steueranordnung zum Steuern des Einschreibens von Werten in Register, einer ersten Registeranordnung zum Aufnehmen von jeweils zwei miteinander zu multipli- zierenden Werten, einer Multiplizieranordnung mit zwei
Eingängen, die mit der ersten Registeranordnung verbunden sind, und einem nachgeschalteten Produktregister mit einem Ausgang für die doppelte erste Anzahl Bits, einer Addier¬ anordnung mit zwei Summeneingängen für je die erste Anzahl Bits, von denen der eine mit dem Ausgang des Produkt¬ registers koppelbar ist, und einem nachgeschalteten Sum¬ menregister aus wenigstens zwei Teilsummenregistern für je die erste Anzahl Bits, mit einem Ausgang, der mit dem anderen Eingang der Addieranordnung koppelbar ist.
Derartige Verfahren treten häufig auf bei der digitalen Signalverarbeitung, beispielsweise beim Filtern von Signalverläufen, und derartige Anordnungen werden bei vielen Vielzweck-Signalprozessoren verwendet. Um Signal- folgen mit hoher Frequenz verarbeiten
~ ιx können, weisen übliche SignalProzessoren zwei Datenbusse auf, um in jeder Taktzeit ein
Produkt bilden zu können. Da dieses Produkt außerdem die doppelte Anzahl Bits, d.h. die doppelte Wortbreite aufweist, ist die Addieranordnung auch
für die doppelte Wortbreite ausgelegt. Dies stellt jedoch einen relativ hohen Aufwand dar.
Aufgabe der Erfindung ist es, ein Verfahren der eingangs genannten Art anzugeben, die die Bildung der Summe einer Kette von Produkten mit wenig Aufwand bei nur wenig ver¬ ringerter Geschwindigkeit ermöglicht.
Diese Aufgabe wird erfindungsgemäß dadurch gelöst, daß das bei jeder einzelnen Multiplikation entstehende Produkt in zwei Schritten zum Zwischenergebnis addiert wird, indem im ersten Schritt nur die Stellen niedrigster Wertigkeit des Produkts zu den entsprechenden Stellen des Zwischener¬ gebnisses addiert und die dabei entstehende erste Teil- summe zwischengespeichert wird und im zweiten Schritt die restlichen Stellen höherer Wertigkeit des Produkts zu den entsprechenden restlichen Stellen der Zwischensumme und dem Übertrag der ersten Teilsumme addiert und die dabei entstehende zweite Teilsumme zwischengespeichert wird, wobei in jedem Schritt eine andere der unmittelbar anschließend zu multiplizierenden Zahlen zugeführt wird.
Eine weitere Aufgabe der Erfindung besteht darin, eine Anordnung der eingangs genannten Art anzugeben, die das Bilden der Summe einer Kette von Produkten mit weniger Aufwand bei nur wenig verringerter Geschwindigkeit ermöglicht.
Diese Aufgabe wird erfindungsgemäß dadurch gelöst, daß die Speicheranordnung (12) über nur einen Datenbus (14) für die erste Anzahl Bits mit der ersten egisteranordnung (16,18) verbunden ist und daß die Steueranordntiag (10) eingerichtet .Eist, um abwechselnd in einer ersten und einer zweiten Taktzsit zu arbeiten und in der ersten Taktzeit die erste Anzahl Bits niedrigster Wertigkeit am Ausgang
des Produktregisters (22) und den Inhalt des zweiten Teil¬ summenregisters (32) den Eingängen der Addieranordnung (26) zuzuführen und am Ende dieser Taktzeit einen der ersten Werte (Bj) in die Registeranordnung (16) und die am Ausgang der Addieranordnung (26) vorhandene neue Teilsumme in das zweite Teilsummenregister (32) einzuschreiben und in der zweiten Taktzeit die erste Anzahl Bits höchster Wertigkeit am Ausgang des Produktregisters (22) und den Inhalt des ersten Teilsummenregisters sowie einen zwi- schengespeicherten Übertrag der Addieranordnung (26) zuzu¬ führen und am Ende dieser Taktzeit einen der zweiten Werte (Ai+1) in die Registeranordnung (16,18) und die am Ausgang der Addieranordnung (26) vorhandene zweite Teilsumme in das erste Teilsummenregister sowie das von der Multipli- zieranordnung (20) gebildete Produkt in das Produktre¬ gister (22) einzuschreiben.
Jede vollständige Teilsumme wird dabei also in zwei Takt¬ zeiten gebildet, so daß die Verarbeitungsgeschwindigkeit insgesamt halbiert ist. Dafür ist jedoch nur ein einfacher Datenbus erforderlich, über den die zu verarbeitenden Werte nacheinander übertragen werden, und es ist ferner auch eine Addieranordnung mit nur der einfachen Wortbreite ausreichend, die die Teilsummen in den beiden Taktzeiten nacheinander bestimmt. Da zunächst nur die Teilsumme aus den Bits niedrigster Wertigkeit gebildet wird, steht für die Bildung der zweiten Teilsumme der Übertrag aus der ersten Teilsumme jeweils zur Verfügung. Dadurch entstehen keine Rundungsfehler, da alle vorhandenen Stellen tatsäch- lieh ausgewertet werden, während das genaue Ergebnis schließlich dem zweiten Teilsummenregister entnommen -werden"kann.
Ein Ausführungsbeispiel der Erfindung-wird nachstehend anhand der Zeichnung näher erläutert», Es zeigen
Fig. 1 ein Blockschaltbild der wichtigsten Teile einer erfindungsgemäßen Anordnung,
Fig. 2 die zeitliche Folge der einzelnen Werte, die an verschiedenen Stellen innerhalb des Blockschaltbildes nach Fig. 1 auftreten.
In Fig. 1 erzeugt eine Steueranordnung 10 zwei Steuer¬ signale Tl und T2 auf den Leitungen 8 und 9, die sich zyklisch abwechseln. Ferner erzeugt die Steueranordnung 10 an einem Ausgang 11 Adressen zur Adressierung einer
Speicheranordnung 12. Die Verbindung 11 ist hier doppelt gezeichnet, da diese tatsächlich aus einer Anzahl paralleler Leitungen besteht, über die die Bits einer Adresse parallel übertragen werden. Dies gilt auch für die ebenfalls doppelt gezeichneten Datenverbindungen, die ebenfalls tatsächlich aus mehreren Leitungen bestehen, über die die Bits jeweils eines Datenworts parallel über¬ tragen werden.
Der Datenanschluß der Speicheranordnung 12, die auch aus mehreren einzelnen Speichern einschließlich gegebenenfalls Festwertspeichern bestehen kann, ist mit einem Datenbus 14 verbunden, an den außer weiteren, nicht dargestellten Einrichtungen eines Prozessors die beiden Register 16 und 18 parallel angeschlossen sind. Das Einschreiben in diese Register wird durch Steuersignale auf den Leitungen 8 und 9 gesteuert.
Die Ausgänge 17 und 19 der Register 16 und 18, die zum Aufnehmen der miteinander zu multiplizierenden Faktoren bestimmt sind, sind mit den Eingängen einer Multip}izier- anordnung"20 verbunden, die innerhal -einer Taktzeit-das voll-ständige Produkt der beiden über die Verbindungen 17 :und 19 zugeführten Werte bildsefc und das Produkt am Aus- gang 21 abgibt. Dieses weist die doppelte Wortbreite, d.h.
die doppelte Anzahl Bits der zugeführten Faktoren auf. Dies ist die einzige Stelle innerhalb der Anordnung nach Fig. 1, an der eine doppelte Wortbreite auftritt, und die Verbindung 21 ist mit dem Eingang eines Produkt- registers 22 verbunden, das ebenfalls für diese doppelte Wortbreite ausgelegt ist.
An das Produktregister 22 sind ausgangsseitig zwei Ver¬ bindungen 23 und 29 angeschlossen, von denen die Ver- bindung 23 die Bits höchster Wertigkeit und die Verbin¬ dung 29 die Bits niedrigster Wertigkeit führt, d.h. jede Verbindung hat die einfache Wortbreite. Die Verbin¬ dungen 23 und 29 führen auf einen Multiplexer, der über ein Steuersignal auf der Leitung 8 gesteuert die Verbin- düng 23 oder die Verbindung 29 mit einem Eingang 25 einer Addieranordnung 26 verbindet. Der andere Eingang 35 der Addieranordnung 26 ist mit dem Ausgang eines zweiten Multiplexers 34 verbunden.
Der Summenausgang 27 des Addierers 26 führt parallel auf die Eingänge zweier TeilSummenregister 30 und 32, die über die Steuerleitungen 8 und 9 abwechselnd zum Einschreiben angesteuert werden. Bei dem zweiten TeilSummenregister 32 ist ferner ein Ubertragspeicher 28 vorgesehen, in den parallel zum zweiten Summenregister der am Ausgang 27a der Addieranordnung 26 auftretende Übertrag über die Steuer¬ leitung 8 eingeschrieben wird.
Die Ausgänge 31 und 33 der Teilsummenregister 30 und 32 führen auf die beiden Eingänge des Multiplexers 34, der über die Steuerleitung 8 gesteuert entweder den Ausgang 31 ^ sai-ünen mit de Ausgang 37 des Ubertragspeichers 28 oder den Ausgang 33 mit dem zweiten Eingang 35 der Addieranord¬ nung 26 verbindet. Der Ausgang 31 führt ferner aππ EJa e der Verarbeitung der Kette von Produkten die gesucht® Stimme.
Es ist jedoch häufig zweckmäßig, wenn auch der Inhalt des Registers 32 ausgelesen und anderen Elementen zugeführt werden kann.
Die Funktion der Anordnung nach Fig. 1 wird nun anhand des schematischen Zeitdiagramms in Fig. 2 erläutert, in der die Zahlen vor den einzelnen Zeilen die Signale bzw. Werte auf den Verbindungen bzw. die Inhalte der Blöcke mit den betreffenden Bezugszeichen angeben. Mit der Anordnung nach Fig. 1 sollen Skalarprodukte, also Ausdrücke der Form
-V
*=Σ , B± i=l ermittelt werden. Die einzelnen Werte Ai und B^ liegen gespeichert vor, da sie zu definierten Zeitpunkten benötigt werden. Die Zwischensummen, die nach der Auf- summierung jedes neuen Produktes Pi = A • B^ entstehen, werden jeweils zwischengespeichert, wobei die vorher¬ gehenden Zwischensumme überschrieben wird. Die nach dem letzten Produkt gebildete Zwischensumme ist dann gleich¬ zeitig das Endergebnis.
Bei dem Zeitdiagramm in Fig. 2 wird zunächst davon ausge¬ gangen, daß die ersten Produkte bereits verarbeitet sind und die entsprechende Zwischensumme gebildet ist. Der
Zeitpunkt t0 am Ende einer zweiten Taktzeit T2 stellt also einen willkürlich gewählten Zeitpunkt innerhalb der Ver¬ arbeitung der Kette von Produkten dar. Zu diesem Zeit¬ punkt tQ wird der eine Faktor Ai des aktuell zu bildenden Produkts P-, der während dieser Taktzeit T2 aus der
Speicheranordnung 12 ausgelesen wurde, in das Register 16 eingeschrieben,*und zwar durch das ansteigende Signal auf der Leitung, 8 für die erste Taktzeit Tl. Gleichzeitig wird das in der Multiplizieranordnung 20 ge-feildete vorher- gehende Produkt Pi.1 in das ProduktregÜster 22 einge- .
schrieben. Die Teilsummenregister 30 und 32 werden an dieser Stelle noch nicht näher betrachtet.
In der folgenden Taktzeit Tl nach dem Zeitpunkt t0 wird der zweite Wert Bi des zu bildenden Produktes aus der Speicher¬ anordnung 12 ausgelesen und über den Datenbus 14 dem Ein¬ gang des Registers 18 zugeführt. Durch das niedrige Signal auf der Steuerleitung 9 während dieser Taktzeit wird der Multiplexer 24 so gesteuert, daß die Verbindung 29 mit den Bits niedrigster Wertigkeit des Produktes P dem Ein¬ gang 25 der Addieranordnung 26 gekoppelt ist, und gleichzeitig wird über den in gleicher Weise gesteuerten Multiplexer 34 der Ausgang 33 des Teilsummenregisters 32 mit dem Eingang 35 der Addieranordnung 26 gekoppelt. Diese bildet während der Taktzeit Tl die Teilsumme SL i.1 und gibt diese gegen Ende der Taktzeit Tl am Ausgang 27 ab.
Am Ende der Taktzeit Tl, nämlich zum Zeitpunkt t.,, wenn das Signal auf der Steuerleitung 8 niedrig und auf der Steuer- leitung 9 hoch wird, wird die so gebildete Hälfte niedrigster Wertigkeit der Teilsumme in das zweite Summen¬ register 32 eingeschrieben, und gleichzeitig wird das über den Ausgang 27a abgegebene Übertragsignal in den Übertrag¬ speicher 28 eingeschrieben. Außerdem wird der zweite Faktor Bj des zu bildenden Produktes in das Register 18 eingeschrieben. Ferner werden die beiden Multiplexer 24 und 34 umgeschaltet, so daß nun der Eingang 25 der Addier¬ anordnung 26 die Bits höchster Wertigkeit des Produktes Pi.1 am Ausgang 23 des Produktregisters 22, dessen Inhalt unverändert geblieben ist, empfängt, und gleichzeitig empfängt der Eingang 35 der Addieranordnung 26 die im ersten Teilsummenreg,i_st«r 3,Q enthaltenen Bits höherer Wertigkeit der vorhergehenden Teilsumme sowie außerdem den am Aufgang 37 abgegebenen Übertrag aus dem Übertrag- Speicher 28, so daß nun der Teil höchster Wertigkeit der
neuen Zwischensumme in der Addieranordnung 26 gebildet und am Ausgang 27 abgegeben wird, und gleichzeitig bildet die Multiplizieranordnung 20 das nächste Produkt P,, da nun beide Werte Ai und B1 in den Registern 16 und 18 vorliegen. Außerdem adressiert die Steueranordnung 10 den ersten
Wert Ai+1 für das folgende Produkt Pi+1 und führt diesen Wert über den Bus 14 u.a. dem Register 16 zu.
Am Ende der Taktzeit T2, zum Zeitpunkt t2, wird nun das Steuersignal auf der Leitung 8 hoch, so daß der Wert Ai+1 in das Register 16 eingeschrieben wird, und gleichzeitig wird das vom Multiplizierer 20 am Ausgang 21 abgegebene Produkt Pf in das Produktregister 22 eingeschrieben, und ferner wird der Teil höchster Wertigkeit der vorhergehenden Zwischensumme S1^, in das erste Teilsummenregister 30 eingeschrieben. Damit ist die Verarbeitung des Pro¬ duktes P1.1 abgeschlossen, und das nun im Produktregister 22 enthaltene Produkt Pi kann weiterverarbeitet werden.
Dies geschieht in der zweiten dargestellten Taktphase Tl, in der der Multiplexer 24 wieder umgeschaltet wird und die Bits niedrigster Wertigkeit des Produktes P, am Ausgang 29 des Produktregisters 22 dem Eingang 25 der Addieranord¬ nung 26 zuführt. Gleichzeitig erhält der andere Eingang 35 der Addieranordnung 26 die vorhergehende Teilsumme SL i.1 über den Multiplexer 34 vom Ausgang 33 des zweiten Teil¬ summenregisters 32, und die neue Teilsumme niedrigster Wertigkeit S1, wird am Ausgang 27 der Addieranordnung 26 erzeugt und am Ende der Taktzeit Tl, zum Zeitpunkt t3, in das zweite Teilsummenregister 32 eingeschrieben. Gleich¬ zeitig wird im übrigen der zweite ^Wert Bi+1, der während der Taktze-it Tl ausgelesen wurde, in .das Register 1° einge¬ schrieben.
In der dritten dargestellten Taktzeit T2 wird nun am
Ausgang 21 des Multiplizierers 20 das folgende gültige Produkt Pi+1 gebildet, und gleichzeitig werden dem Ein¬ gang 25 der Addieranordnung 26 die Bits höchster Wertig¬ keit aus dem Produktregister 22 und dem Eingang 35 die vorhergehende Teilsumme höchster Wertigkeit S1^.., des ersten Teilsummenregisters 30 sowie das Übertragsignal vom Über- tragspeicher 28 zugeführt, so daß die neue Teilsumme höchster Wertigkeit S^ am Ausgang 27 der Addieranord¬ nung 26 gebildet wird. Diese wird am Ende der dritten dargestellten Taktzeit T2 wieder in das erste Teilsummen¬ register 30 eingeschrieben.
Dieser Vorgang setzt sich zyklisch fort, bis alle Produkte der Kette berechnet und durch Aufakkumulieren in die Teil- Summenregister verarbeitet sind. Wie aus Fig. 2 zu erkennen ist, erfolgt die Verarbeitung dabei nach dem Fließbandprinzip, d.h. während ein Produkt gebildet wird, wird gleichzeitig die vorhergehende Teilsumme gebildet und die Werte des nachfolgenden Produktes zugeführt. Am Anfang, d.h. bei der Bildung des ersten Produktes Plf sind daher einige Verarbeitungsschritte vorab erforderlich.
Diese sind aus Fig. 2 ersichtlich, wenn i = 1 gesetzt wird. Das bedeutet, daß vor dem Zeitpunkt t0 zunächst der eine Wert A1 ausgelesen und zum Zeitpunkt tQ in das
Register eingeschrieben werden muß. Danach wird der zweite Wert B1 ausgelesen und zum Zeitpunkt t1 in das Register 18 eingeschrieben. Danach kann das erste Produkt P1 gebildet werden, das zum Zeitpunkt t2 in das Produktregister 22 eingeschrieben wird. Nun kann das Produkt P1 in der bereits beseht--!e enen Jtfeise verarbeitet werden, wobei während dieser vorhergehenden1 Verarbeitung^schritte dio To.il- , Summenregister 30 und 32 selbstverständlich gelöscht sein müssen, d.h. sie müssen den Wert Null enthalten.
Auf diese Weise wird die Summe einer Kette von Produkten gebildet, wobei die volle Genauigkeit ohne Rundungsfehler erhalten bleibt und dennoch nur ein Addierer für die ein¬ fache Wortbreite erforderlich ist.