DE69122017T2

DE69122017T2 - Verfahren und vorrichtung zur signalerkennung

Info

Publication number: DE69122017T2
Application number: DE69122017T
Authority: DE
Inventors: Stephen Kenyon
Original assignee: BROADCAST DATA SYSTEMS Ltd PAR
Current assignee: BROADCAST DATA SYSTEMS Ltd PAR
Priority date: 1990-05-02
Filing date: 1991-05-02
Publication date: 1997-04-10
Anticipated expiration: 2011-05-03
Also published as: CA2041754C; EP0480010A1; JPH05501166A; CA2041754A1; US5210820A; HK133697A; EP0480010B1; DE69122017D1; ES2091328T3; ATE142815T1; JP3130926B2; WO1991017540A1

Description

HINTERGRUND DER ERFINDUNG

Diese Erfindung betrifft eine Vorrichtung und ein Verfahren zur Erkennung von Signalen, insbesondere eine Vorrichtung und ein Verfahren zur Erkennung von Signalen durch Verwendung statistischer Momente abgetasteter Signalwerte zur Erzeugung von Merkmalsvektoren und zur Quantisierung der Merkmalsvektoren zum Vergleichen des Signals mit einer vorbestimmten Signaldatenbank und zum Ableiten der Signaldatenbank.
Obgleich die vorliegende Erfindung in Bezug auf ein System zur Erkennung von Rundfunksignalen wie beispielsweise Musik beschrieben wird, ist dies so zu verstehen, daß die Lehren dieser Anmeldung auf ein breites Spektrum von Signalerkennungsgebieten anwendbar sind.
Die genaue Erkennung von Rundfunksignalen ist für Marketingleiter, Lizenzsammlungsagenturen, Musikpromotor usw. wichtig. Es ist wohlbekannt, daß eine breite Mannigfaltigkeit an Rechts-, Wirtschafts- und Sozialunternehmer die reguläre Überwachung von Rundfunkinformation benötigen. Alle diese Erfordernisse teilen ein gemeinsames Bedürfnis nach einer gewissen Information, beispielsweise welche Information rundfunkgesendet wird und wann. Bekanntermaßen wurden Rundfunkstationen manuell durch mehrere Hörer überwacht, welche das Rundfunkprogramm wahmehmend überwachten und manuell tabellarisierten, welche Information zu welcher Zeit rundfunkgesendet wurde. Zuverlässigkeits und Kostenprobleme haben die Anstrengungen in Richtung einer Realisierung von automatisierten Rundfunksignalerkennungssystemen angeregt. Ein anfängliches automatisiertes Verfahren umfaßte die Kodierung eines einzigen Stichwortsignals in jedem Lied und dann die Überwachung jeder Rundfunkstation, um das Stichwortsignal zu detektieren. Die zugeordnete Kodierungs- und Dekodierungsschaltung ist jedoch teuer und kompliziert und staatliche Durchführungsämter sind gegen eine Bereitstellung zusätzlicher Bandbreite, die zum Vorsehen einer großen Anzahl einziger Stichwortsignale notwendig ist.
Ein weiterer Fortschritt auf dem Gebiet der automatisierten Rundfunksignalerkennung geht aus dem Moon et al. erteilten US-Patent Nr. 3 919 479 hervor. Bei Moon et al. wird ein Audiosignal digital abgetastet, um ein Referenzsignalsegment zu erzeugen, welches in einer Referenzbibliothek gespeichert wird. Wenn dann das Audiosignal rundfunkgesendet wird, werden sukzessive Abschnitte des Signals digitalisiert und mit dem Referenzsegment in der Bibliothek verglichen. Der Vergleich wird in einem Korrelationsprozeß ausgeführt, der ein Korrelationsfunktionssignal erzeugt. Wenn das Referenz- und Rundfunksignalsegment nicht gleich sind, resultiert eine Korrelationsfunktion relativ kleiner Amplitude. Wenn andererseits das Referenz- und Rundfunksignalsegment relativ gleich sind, wird ein großes Korrelationsfunktionssignal erzeugt. Die Amplitude des Korrelationsfunktionssignals wird abgetastet, um ein Erkennungssignal zu erzeugen, wenn die Amplitude einen vorbestimmten Schwellenpegel überschreitet.
Das Einzelsegment-Korrelationssystem nach Moon et al. erleidet jedoch einem Signalausfall, der das System gänzlich un brauchbar macht. Auch ist das System nach Moon et al. relativ empfindlich für Zeitachsenvariationen in der Rundfunkinformation selbst. Beispielsweise ist bekannt, daß viele Diskjokkeys Rundfunklieder durch Beschleunigen des Antriebsmechanismus "komprimieren". Es ist auch bekannt, daß andere Diskjokkeys Rundfunkinformation "komprimieren" und/oder "strecken", um gewisse gewünschte Effekte bei der Hörerschaft zu erzeugen. Moon et al. versuchen, solcher Zeitachsenvariationen dadurch Herr zu werden, daß die Bandbreite des Rundfunksignals durch Hüllkurvengleichrichtung des Rundfunksignals reduziert und Hüllkurvensignale mit im wesentlichen niedrigen Signalfrequenzkomponenten, vorzugsweise im Subaudiobereich, bereitgestellt werden. Es wurde entdeckt, daß bei Verwendung des Hüllkurvensignais bei Subaudiofrequenzen während des Korrelationsprozesses die digital abgetasteten Wellenformen weniger empfindlicher für Zeitachsenvariationen sind. Jedoch sind die Verbesserungen, die durch eine solche Lösung erreicht werden können, sehr begrenzt und arbeiten nur bei Rundfunksignalen, die um einen kleinen Betrag "komprimiert" oder "gestreckt" worden sind. Außerdem ist eine solche Lösung hohen Fehlalarmraten unterworfen. Diese Nachteile machen das System nach Moon et al. für ein schnelles, genaues und billiges automatisches Rundfunksignalerkennungssystem weniger als erwünscht.
Ein weiterer Fortschritt auf dem Gebiet der automatischen Signalerkennung geht aus dem Kenyon et al. erteilten US-Patent Nr. 4 450 531 hervor. Der gleiche Herr Kenyon ist der einzige Erfinder der vorliegenden Erfindung. Das System des '531- Patents widmet sich erfolgreich den Zuverlässigkeitsproblemen eines Einzelsegmentkorrelationssystems und den Zeitachsenvariationsproblemen, die bei bekannten Systemen in Erfahrung gebracht worden sind. Im '531-Patent wird eine Anzahl Referenzsignalsegmente aus einer Programmeinheit (Lied) extrahiert, digitalisiert, fouriertransformiert und in einer Referenzbibliothek in einem komplexen Frequenzdomänenspektrum gespeichert. Das empfangene Rundfunksignal wird dann vorgefiltert, um einen Frequenzabschnitt des Audiospektrums auszuwählen, der stabile Charakteristiken für eine Unterscheidung aufweist. Nach einer weiteren Filterung und Umwandlung in ein digitales Signal wird das Rundfunksignal fouriertransformiert und einem komplexen Multiplikationsprozeß mit Referenzsignalsegmenten unterworfen, um ein Vektorprodukt zu erhalten. Die Ergebnisse des komplexen Multiplikationsprozesses werden dann einem inversen Fouriertransformationsschritt unterworfen, um eine Korrelationsfunktion zu erhalten, die von der Frequenzin die Zeitdomäne transformiert worden ist. Diese Korrelationsfunktion wird dann normiert und die Korrelationsspitze für jedes Segment ausgewählt und der Spitzenabstand mit der Segmentlänge verglichen. Gleichzeitig wird die RMS-Leistung des mit dem Korrelationsspitzensegment komzidierenden Segments abgetastet, um das Segmentpunktleistungsmuster zu bestimmen. Infolgedessen beseitigt das '531-Patent die Nachteile eines Einzelsegment-Korrelationssystems durch das Vorsehen einer Anzahl Korrelationssegmente und Messen der Abstände zwischen den Korrelationsspitzen. Wo die Abstände passen, wird das Rundfunksignal als ähnlich dem in der Referenzbibliothek gespeicherten Signalsegment erklärt. Außerdem arbeitet der RMS- Wertvergleich so, daß er die unter Verwendung der Signalsegmente ausgeführte Klassifikation bestätigt.
Zur Beseitigung des Zeitachsenvariationsproblems verwendet das '531-Patent einen Hüllkurvengleichrichter und ein Bandpaßfilter für die Rundfunkinformation. Das System nach dem '531-Patent ist jedoch rechenerisch sehr anspruchsvoll. Beispielsweise erfordert die Ausführung der verschiedenen Multisegmentkorrelationen einen großen Teil an Computerleistung. Da eine große Zahl an Segmenten abgetastet wird, benötigt das System nach dem '531-Patent einen guten Teil an Zeit und benötigt die Verwendung teuerer leistungsfähiger Computer.
Ein automatisiertes Verfahren für Sprachmustererkennung geht aus dem Sakoe erteilten US-Patent Nr. 4 282 403 hervor. Sakoe offenbart ein Spracherkennungssystem, bei welchem eine Zeitfolgeeingabe aus Mustermerkmalsvektoren in eine Referenzbibliothek eingegeben wird. Das empfangene Sprachsignal wird dann einer Spektralanalyse, einer Abtastung und einer Digitalisierung unterworfen, um in eine Zeitfolge von Vektoren transformiert zu werden, welche Merkmale des Sprachtons bei jeweiligen Abtastmomenten darstellen. Für jedes Referenzmuster kann eine Zeitverzerrungsfunktion durch die Verwendung von Merkmalsvektorkomponenten weniger Kanäle verwendet werden. Die Zeitverzerrungsfunktion für jeden Referenzmuster- Merkmalsvektor wird zum Korrelieren des Eingangsmuster- Merkmalsvektors und des Referenzmuster-Merkmalsvektors verwendet. Die Eingangsmuster-Merkmalsvektorfolge wird dann mit der Referenzmuster-Merkmalsvektorfolge in Bezug auf die Zeitverzerrungsfunktion verglichen, um das gesprochene Wort zu identifizieren. Das System nach Sakoe zeitzerrt jedoch die Referenzmuster und nicht das Eingangssignal und folglich muß eine Anzahl Muster für jedes Referenzmuster berechnet werden, wodurch die Speicher- und Rechenanforderungen des Systems erhöht werden.
Ein weiteres Signalerkennungssystem geht aus dem an Bunge erteilten US-Patent Nr. 4 432 096 hervor. Bei Bunge werden Tonund/oder Sprachsignale in ein elektrisches Signal umgewandelt und in einer Filterbank in mehrere Spektralkomponenten unterteilt. Diese Komponenten werden dann über eine kurze Zeitperiode integriert, um das Kurzzeitspektrum des Signals zu erzeugen. Die Spektralkomponenten des Signals werden an eine Zahl Musterdetektoren gegeben, welche ein Ausgangssignal nur abgeben, wenn das Kurzzeitspektrum mit dem im relevanten Musterdetektor eingestellten Muster korrespondiert. Jeder Musterdetektor hat zwei Schwellenwertdetektoren, welche ein Signal erzeugen, wenn die angelegte Eingabe zwischen den einstellbaren Schwellenwerten liegt. Infolgedessen liefern die Musterdetektoren ein Ausgangssignal nur, wenn alle Schwellenwertdetektoren aktiviert sind. Für jeden Sprachton ist ein Musterdetektor vorgesehen. Beim Erkennen einer Reihe von Tönen wird die Reihe von Adressen der Musterdetektoren, die erfolgreich ein Ausgangssignal erzeugt haben, gespeichert und danach an den Computer zum Vergleich gegeben. Es ist leicht einzusehen, daß ein derartiges System eine Zahl Musterdetektoren und eine korrespondierende leistungsfähige Berechnungseinrichtung erfordert. Überdies leidet das System nach Bunge, obgleich es eine Filterbank zum Bereitstellen eines niedrigfrequenten Ausgangssignals, das relativ unempfindlich für Zeitachsenvariationen ist, verwendet, noch an Zeitverzerrungsproblemen und einer hohen Fehlalarmrate.
Ein neuerdings kommerzialisiertes automatisches Rundfunksignalerkennungssystem geht aus dem an Kenyon et al. erteilten US-Patent Nr. 4 843 562 hervor. Wiederum ist der gleiche Mr. Kenyon der einzige Erfinder der vorliegenden Erfindung. Tatsächlich sind spezielle Lehren aus dem '562-Patent in weiteren Abschnitten des vorliegenden Patents inkorporiert. Das '562-Patent beschreibt ein zweistufiges (grobes und feines) Klassifikationssystem unter Verwendung weniger Prozessorquellen. Gemäß dem '562-Patent wird das Rundfunksignal bandpaßgefiltert, gleichgerichtet und tiefpaßgefiltert, um mehrere Wellenformen niedriger Bandbreite zu erzeugen. Die Wellenformen werden abgetastet und die Samples werden zum Erzeugen eines Spektrogramms verwendet, welches dann mit mehreren Referenzspektrogrammen verglichen wird, die in einer Referenzbibliothek erster Stufe gespeichert sind. Die erststufigen Referenzspektrogramme werden dann in der Ordnung ihrer Ähnlichkeit mit dem erzeugten Spektrogramm aufgereiht. Als nächstes werden mehrere Referenzmuster zweiter Stufe, die mit den aufgereihten erststufigen Referenzspektrogrammen korrespondieren mit einer der analysierten Wellenformen in der vorher hergestellten Reihenfolge korreliert. Für jedes in der Referenzbibliothek zweiter Stufe gespeicherte zweitstufige Referenzmuster wird ein Korrelationswert vorgesehen. Wenn festgestellt wird, daß ein Korrelationswert einen Schwellenwert überschreitet, wird eine Erkennung erklärt und das Rundfunksignal als ähnlich mit dem zweitstufigen Referenzmuster klassifiziert, dessen Korrelationswert den Schwellenwert überschreitet. Die bei der zweitstufigen Klassifikation verwendete analysierte Wellenform ist zeitverzerrt, um Geschwindigkeitsfluktuationen im Rundfunksignal Rechnung zu tragen.
Obgleich das System gemäß dem '562-Patent erfolgreich ist, ist es in seiner Fähigkeit der Erkennung einer großen Zahl Lieder etwas beschränkt. Beispielswiese kann das System gemäß dem '562-Patent jedes beliebiges von 600 Liedern auf einem einzelnen Kanal mit hoher Zuverlässigkeit erkennen. Das System kann gleichzeitig 5 verschiedene Kanäle überwachen. Jedoch würde ein System, welches jedes von dreitausend Liedern auf jeder von fünf gleichzeitigen Rundfunkstationen mit hoher Zuverlässigkeit identifizieren kann, ein sehr attraktives und kommerziell erfolgreiches Signalerkennungssystem darstellen. Ferner benötigt das System gemäß dem '562-Patent annähernd 64 Sekunden zum Detektieren und Klassifizieren eines Rundfunkliedes. Es wird gewünscht, diese Zeit auf 28 Sekunden zu reduzieren, um die Identifikation von Aufzeichnungen kürzerer Dauer, beispielsweise Werbung, zu ermöglichen. Bei Erhöhung der Leistungsfähigkeit ist es wichtig, die günstige kompakte Architektur des '562-Patents beizubehalten.
Was infolgedessen benötigt wird, ist ein verbessertes System zur genauen Erkennung und Klassifizierung einer großen Zahl einmaliger Rundfunksignale auf mehreren Rundfunkkanälen gleichzeitig und mit hoher Zuverlässigkeit. Das System muß klein, billig und leicht zu betreiben sein.

ZUSAMMENFASSUNG DER ERFINDUNG

Die vorliegende Erfindung ist zum Beseitigen der Nachteile bekannter automatischer Rundfunksignalerkennungssysteme ausgebildet, während sie gleichzeitig die oben diskutierten Aufgaben löst. Außerdem ist die Erfindung auf einer breiten Mannigfaltigkeit von Signalerkennungsgebieten und nicht gerade zur Erkennung von Runfunksignalen anwendbar.
Der Erfinder der vorliegenden Erfindung hat ein verbessertes Verfahren zur Signalerkennung entdeckt, bei welchem ein Signal empfangen und an mehreren Abtastpunkten abgetastet wird, um mehrere Signalwerte zu erzeugen. Ein statistisches Moment der Signalwerte wird dann gemäß der Formel
berechnet, wobei N die Zahl der Abtastpunkte
1 < n < N
X den Signalwert des Signals an einem Ab tastpunkt,
µ ein Mittel der Signalwerte,
eine Standardabweichung des Signalwer tes und
k eine ganze Zahl < 1 bedeuten.
Das berechnete statistische Element wird mit mehreren gespeicherten Signalidentifikationen verglichen und das empfangene Signal wird dann als ähnlich wenigstens einer der gespeicherten Signalidentifikationen erkannt.
Vorzugsweise wird das empfangene Signal bandpaßgefiltert, gleichgerichtet und tiefpaßgefiltert, um mehrere Wellenformen niedriger Frequenz zu erzeugen. Dann werden die Wellenformen niedriger Frequenz zu mehreren Linearkombinationen von ihnen kombiniert. Jede Linearkombination wird dann abgetastet, um die mehreren Signalwerte zu erzeugen, die zum Berechnen des statistischen Moments verwendet werden.
Vorzugsweise werden zwei statistische Momente (Asymmetrie und Wölbung) für die abgetasteten Werte jeder Linearkombination berechnet. Dann können mehrere Merkmalsvektoren abgeleitet werden, wobei jeder Merkmalsvektor den Asymmetrie- und Wölbungswert für alle Linearkombinationen innerhalb einer vorbestimmten Abtastzeitperiode enthält.
Jeder Merkmalsvektor kann dann durch Ersetzen der Gleitkommawerte von Asymmetrie und Wölbung mit einzelnen ganzen Zahlen entsprechend einem vorbestimmten Quantisierungsmuster quantisiert werden. Nach der Quantisierung kann eine gewichtete Summe des quantisierten Vektors unter Verwendung einer nichtdezimalen Grundzahl berechnet werden. Der gewichtete Summenwert kann dann zum Adressieren einer Datenbank verwendet werden, der Signalidentifikationen entsprechend der Adresse speichert.
Die vorliegende Erfindung schlägt auch ein System zur Erzeugung der Signaldatenbank vor, auf die zum Erkennen des empfangenen Signals zugegriffen wird. Der Prozeß der Erzeugung der Datenbank ist sehr ähnlich dem Prozeß der Erkennung des obengenannten Signals. Jedoch wird das Ziel- bzw. Sollsignal zuerst zum Bestimmen eines spektral unterschiedenen Abschnitts dieses Signals analysiert. Der spektral unterschiedene Abschnitt des Signals wird dann bandpaßgefiltert, gleichgerichtet und tiefpaßgefiltert, um die Wellenformen niedriger Frequenz zu erzeugen, von denen mehrere Linearkombinationen abgeleitet werden. Die Linearkombinationen des Spektral unterschiedenen Abschnitts werden dann einer modifizierten Abtastprozedur unterworfen, wodurch jede Linearkombination eine Anzahl mal mit einem Bewegungsfenster abgetastet wird. Die abgetasteten Werte werden dann zum Berechnen von Asymmetrie und Wölbung verwendet, so daß mehrere Referenzmerkmalsvektoren für den spektral unterschiedenen Abschnitt des Signals erzeugt werden.
Die mehreren Merkmalsvektoren werden quantisiert, um ihre Werte durch Verbreiterung der Abstände zwischen den Vektoren in dem Merkmalshyperraum unterscheidbarer zu machen. Es sind zwei Prozeduren zur Quantisierung möglich. Als erstes kann ein Nichtüberlappungs-Quantisierungsschema angenommen werden, bei welchem die Merkmalsvektor-Signalwertpopulation gerade in mehrere Segmente, beispielsweise 5, unterteilt wird. Dann wird jeder Wert der Asymmetrie oder Wölbung in jedem Merkmalsvektor aufgenommen und einer der fünf Werte ausgezeich net. Infolgedessen wird eine Anzahl quantisierter Vektoren für jedes abgetastete Signal erzeugt. Ebenfalls möglich ist eine Überlappungsmethode der Quantisierung, bei welcher die Signalwertpopoulation der Asymmetrie und Wölbung in eine Anzahl überlappter Bereiche unterteilt wird, wobei ein Asymmetrie- oder Wölbungswert zwei Bereichen zugeordnet sein kann. Jeder Merkmalsvektor wird dann aufgenommen und es werden zwei quantisierte Vektoren erzeugt, da jeder Asymmetrie- oder Wölbungswert zwei Werte annehmen kann. Die zwei quantisierten Merkmalsvektoren werden dann permutiert, um eine weitere Anzahl quantisierter Merkmalsvektoren für die Referenzdatenbank zu erzeugen.
Welches Quantisierungsschema auch immer angenommen wird, es wird vorzugsweise eine gewichtete Summe jedes quantisierten Vektors unter Verwendung einer nicht dezimalen Grundzahl erzeugt. Die gewichtete Summe wird dann als eine Adresse zum Zugriff auf eine Datenbank verwendet, in welcher ein Zeiger gespeichert ist, wobei der Zeiger auf eine weitere Datenbankstelle zeigt, bei welcher der Identifikationskode des Sollsignals gespeichert ist.

KURZE BESCHREIBUNG DER ZEICHNUNGEN

Die vorteilhaften Merkmale und Eigenschaften der vorliegenden Erfindung können leicht aus der folgenden Beschreibung der gegenwärtig bevorzugten exemplarischen Ausführungsform verstanden werden, wenn diese zusammen mit den beigefügten Zeichnungen gelesen wird, in denen:
Figur 1 ein das System gemäß der gegenwärtig bevorzugten Ausführungsform zeigendes Blockschaltbild ist,
Figur 2 ein das Prinzip der Filterung des empfangenen Signals in vier verschiedene Frequenzbänder zeigendes Blockschaltbild ist,
Figur 3 eine Reihe von Wellenformen darstellt, welche die in dem Prozessor nach Figur 1 ausgeführte Wellenformung zeigt,
Figur 4 eine Reihe aus Wellenformen ist, welche vier durch den Prozessor erzeugte Merkmalsfolgen zeigt,
Figur 5 ein Diagramm ist, welche die Überlappungsabtastung eines spektral unterschiedenen Abschnitts des Signals zur Erzeugung der Referenzbibliotheken zeigt,
Figur 6 die durch die in Figur 5 ausgeführte Abtastung erzeugten Merkmalsvektoren darstellt,
Figur 7 eine die Zahl unterschiedlicher Identitäten für eine gegebene Zahl von Quantisierungspegeln und einer gegebenen Zahl von Merkmalen zeigenden Vektorquantisierungstabelle ist,
Figur 8 die Quantisierung eines Merkmalsvektors zeigt,
Figur 9 eine Darstellung des in einem dreidimensionalen Raum aufgezeichneten quantisierten Merkmalsvektors ist,
Figur 10 die Populationsdichte von bei einer nicht gleichförmigen Vektorquantisierung ohne Überlappung verwendeten Wölbungswerten darstellt,
Figur 11 zeigt, wie die Merkmalsvektorquantitäten quantisierten Werten in der Population nach Figur 10 zugeordnet sind,
Figur 12 die Populationsdichte von bei einer nicht gleichförmigen überlappungskodierten Vektorquantisierung verwendeten Wölbungswerten zeigt,
Figur 13 zeigt, wie Merkmalsvektorquantitäten quantisierten Werten in der Population nach Figur 12 zugeordnet sind,
Figur 14 zeigt, wie der Merkmalsvektor im überlappungskodierten Vektorquantisierungsschema quantisiert ist,
Figur 15 zeigt, wie der quantisierte Vektor in eine gewichtete Summe umgewandelt wird, die zum Adressieren einer Datenbank zum Identifizieren eines Signals verwendet wird,
Figur 16 ein Spitzenpegel-Flußdiagramm ist, welches ein Verfahren gemäß der bevorzugten Ausführungsform zeigt,
Figur 17 ein Flußdiagramm ist, welches zeigt, wie die statistischen Momente berechnet werden, und
Figur 18 ein Flußdiagramm ist, welches den Bestätigungsschritt nach Figur 16 zeigt.

DETAILLIERTE BESCHREIBUNG DER GEGENWÄRTIG BEVORZUGTEN EXEMPLARISCHEN AUSFÜHRUNGSFORM

Obgleich die vorliegende Erfindung bezüglich einer Verbesserung des im '562-Patent beschriebenen Systems ist, erkennt der Fachmann durchschnittlichen Könnens auf diesem Gebiet, daß die Lehren dieser Erfindung bei einer breiten Mannigfaltigkeit von Signalerkennungsgegebenheiten angewendet werden kann. Beispielsweise findet die vorliegende Erfindung Anwendung bei Stimmenverarbeitungssystemen, Spracherkennungssystemen, akustischen Kommunikationssystemen usw..
Zunächst wird zum Zweck von Klarstellungen ein Überblick über die Erfindung gegeben. Das '562-Patent beschreibt eine Vorrichtung und ein Verfahren, bei denen Rundfunkinformation un ter Verwendung eines zweistufigen Klassifikationsprozesses erkannt wird. Bei dem ersten Schritt wird das Eingangssignal mit einer Bibliothek erster Stufe verglichen und eine grobe Spektralanalyse ausgeführt. Der erststufige Vergleich erzeugt eine Reihe von Signalidentifikationen aus der erststufigen Referenzbibliothek entsprechend der groben Spektralanalyse. Dann wird in der zweiten Stufe eine feinere Korrelation in der bei der ersten Stufe hergestellten Reihenfolge ausgeführt. Die vorliegende Erfindung schlägt eine Verbesserung beim erststufigen Klassifikationsprozeß derart vor, daß die Erkennungszeit und die Zahl von Eintritten in die erststufige Reihe reduziert wird. Tatsächlich hat die vorliegende Erfindung eine derart hohe Effizienz gezeigt, daß sie ohne die zweite Stufe bei gewissen Sigualerkennungssystemen anwendbar ist.
Die erststufige Analyse schirmt das Eingangssignal ab und eliminiert bei der in der zweiten Stufe ausgeführten rechnerisch anspruchsvollen, zeitverzerrten Korrelation eine große Zahl von Kandidatensignalen aus der Betrachtung. Wenn die erststufige Effizienz von 80 % auf 90 % erhöht werden kann, wird die Systemkapazität verdoppelt. Ein Prototyp der vorhe genden Erfindung hat eine Effizienz von über 98 % bei der Ausscheidung von Fehlalarm gezeigt. Infolgedessen kann in dem System gemäß dem '562-Patent eine Verbesserung um einen Faktor 10 erreicht werden.
Im '531-Patent ist ein effizientes Signalerkennungssystem offenbart, das ein ausreichendes Zeit-Bandbreite-Produkt aufrecht erhält, um eine genaue Unterscheidung von Signalsignaturen zu ermöglichen, wobei ein Mittel bereitgestellt ist, welches das System unempfindlich für Rundfunkgeschwindig keitsvariationen und Übertragungsabweichungen macht. Diese als segmentierte Korrelation bekannte Technik und die anderen Implementierungsdetails, die im '531-Patent beschrieben sind, stellen ein sehr empfindliches System bereit, welches jedes beliebige von 25 Liedern auf einem einzelnen Kanal mit hoher Zuverlässigkeit erkennen kann. Die vorliegende Erfindung hat als ein Ziel die Fähigkeit, jedes beliebige von sechstausend aufgezeichneten Signalen auf jeden von fünf gleichzeitigen Rundfunkkanälen mit vergleichbarer Zuverlässigkeit zu identifizieren. Eine zusätzliche Systemabstimmung und eine Prototypausbildung sollten die Kapazität auf annähernd zehntausend Lieder pro Kanal erhöhen.
Zentral in den durch die Erfindung nach dem '562-Patent verkörperten Konzepten ist eine Technik zur Kompensation von Rundfunkgeschwindigkeitsvariationen, die als lineare Zeitverzerrungskorrelation bekannt ist. Diese Technik ist robuster als das vorhergehende segmentierte Korrelationsverfahren, indem sie eine stärkere Beziehung zwischen Abschnitten des Merkmalsvektors beibehält, die von verschiedenen Abschnitten der Aufzeichnung abgeleitet wurden. Außerdem dient eine hierarchische Erkennungsprozedur zum Multiplizieren der verfügbaren Verarbeitungskapazität durch Abschirmung der Kandidatenerkennungen unter Verwendung eines groben Sortierungsalgorithmus. Diese Technik verbraucht weniger Berechnungsmittel zum Abtasten der ganzen Signaldatenbank unter Ausschluß von Kandidaten, die klar nicht zu den zweitstufigen Erkennungskriterien passen. Diejenigen, die beim erststufigen Prozeß akzeptabel sind (typischerweise 10 bis 20 %) werden durch die rechnerisch intensive lineare Zeitverzerrungskorrelationsprozedur der zweiten Stufe in der in der ersten Stufe hergestellten Ordnung der Wahrscheinlichkeit der Erkennung (Reihe) analysiert. Neben der großen Erhöhung der Systemkapazität reduziert die Erfindung nach dem '562-Patent die Referenzmusterdauer von den bisherigen 64 Sekunden auf 28 Sekunden, um die Identifikation von Signalen kürzerer Dauer, beispielsweise von Werbung, zu ermöglichen.
Nun wird der zum gegenwärtig vorgeschlagenen System führende technische Lösungsweg beschrieben. Bei Gegebenheit der oben erwähnten Systemaufgaben zeigen sich zwei Probleme von selbst. Als erstes müssen mehr verschiedene Merkmalsvektoren für die erststufige Analyse bereitgestellt werden und als zweites muß die neue Architektur kompatibel mit der in dem '562-Patent beschriebenen Architektur sein. D.h. der erststufige Klassifikationsprozeß muß den gleichen Satz aus den beim '562-Patent verwendeten vier Hüllkurven gleichgerichteten Frequenzbändern akzeptieren. Das Ausgangssignal des erststufigen Klassifizierers muß eine Liste aus im zweitstufigen Korrelator entwickelten Musternummern sein.
Um effektiv zu sein, müssen die erststufigen Algorithmen Geschwindigkeitsvariationen und andere Abweichungen tolerieren, während sie eine hohe Unterscheidung zwischen Mustern bereitstellen. Die Fehlalarmrate muß ohne Verursachung fehlender Detektionen minimiert werden. Tatsächlich muß der erststufige Klassifizierer so voreingestellt sein, daß nur Signaturen, die klar inkorrekt sind, verworfen werden. Dies resultiert üblicherweise in einer Zunahme der Fehlalarmrate. Es ist schwierig, diese beiden Funktionsparameter gleichzeitig zu optimieren.
Ein Merkmalsvektor kann zum Definieren eines Merkmalsraums mit einer der Zahl an Merkmalen im Vektor gleichen Zahl Dimensionen zu definieren. Ein solcher Merkmalsraum kann als "Hyperraum" bezeichnet werden. Die Merkmalsvektoren jedes Solisignais werden im Hyperraum entsprechend ihrer berechneten Werte gespeichert. Bei der Erkennung wird der vom empfangenen Signal abgeleitete Merkmalsvektor zum Suchen des Hyperraums zur Entdeckung des Signals oder der Signale verwendet, deren Signaturen in einem besonderen Bereich des Hyperraums gespeichert sind. Der Hyperraum kann mehrere "Cluster" enthaltenf in denen die Merkmalsvektoren einer Anzahl Signale gespeichert werden können. Beispielsweise können ähnliche Signale ähnliche Merkmalsvektoren erzeugen, die in enger Nachbarschaft zueinandner im Hyperraum gespeichert werden. Wenn der Zwischenraum zwischen solchen Signalclustern im Hyperraum relativ zur Größe der Cluster groß ist, ist es möglich, einen Unsicherheitsbereich um jeden Merkmalsvektor im Hyperraum vorzusehen, der eine minimale Überlappung anderer Bereiche im Hyperraum aufweist. Ein Verfahren zur Ausführung dieser verstärkten Trennung liegt darin, die Dimensionalität des Merkmalshyperraums zu erhöhen. Der Wert jedes Merkmals wird als Koordinate im Hyperraum behandelt. Wenn beispielsweise und wie in Figur 9 gezeigt drei Merkmale verwendet werden, bilden sie einen Merkmalsvektor, der eine Position im dreidimensionalen Raum spezifiziert. Wenn der Merkmalsvektor dann quantisiert wird (einer auf dem detektierten Merkmalswert basierenden besonderen Kategorie zugeordnet), kann jede Komponente einen von einer Anzahl diskreter Werte, beispielsweise 5, annehmen. Dann enthält der Raum 125 diskrete Stellen. Wenn jeder Stelle ein Signalidentifikationskode zugeordnet wird, ist es möglich, die gleichen Merkmale aus einem empfangenen Signal zu extrahieren und quantisieren, der Merkmalsvektor kann auf die gleiche Stelle im dreidimensionalen Raum abgebildet werden, und der betreffende bzw. geeignete Signalidentifizierer kann wiedergewonnen werden. Dies ermöglicht einen eindeutigen Zugriff auf 125 Signale, wenn ihre Merkmalsvektorwerte nach der Quantisierung eindeutig sind. Leider sind die gemessenen Merkmale nicht eindeutig. Mehrere verschiedene Signale können den gleichen Merkmalsvektor erzeugen. Dies kann durch Zuordnung einer Liste von Wahrscheinlichkeiten zu jeder Stelle im Hyperraum behandelt werden. Die Figur 9 zeigt ein Beispiel eines dreidimensionalen Hyperraums, bei welchem jedes der drei Merkmale fünf Werte annehmen kann. Ein "Cluster" 40 ist darin bei der Stelle S(4-3) = 3, S(2-1) = 2, S(3-2) = 0 zentriert dargestellt.
Ein zweites Problem liegt darin, daß ein zu erkennendes Signal oder Muster aufgrund einer Zeitkompression oder anderen Übertragungsabweichungen nicht den geeigneten Vektor erzeugen kann. Infolgedessen muß die Variabilität der Merkmale studiert und bestimmt werden, wie die resultierenden Merkmalsvektoren verschiedene Bereiche im Hyperraum spezifizieren. Die Suche nach unterschiedlichen Merkmalen basiert auf dem Kriterium, daß sie unter dem Einfluß erwarteter Abweichungen stabil sind und daß sie unterscheidbar sind. Wenn anzunehmen ist, daß die individuellen Merkmale, aus denen der Merkmalsvektor besteht, unabhängig sind, kann durch Erhöhung der Zahl an Merkmalen die Trennung zwischen Clustern im Hyperraum ohne Erhöhung der Clustergröße dramatisch erhöht werden. Um in den quantisierten-Merkmalen Variationen zu ermöglichen und um das Erfordernis einer Zeitausrichtung zu reduzieren, können bei verschiedenen Zeitverschiebungen mehrfache Merkmalsvektoren erzeugt werden, durch welche jedes Signal einen Bereich des Hyperraums, den es einnimmt, überstreichen kann. Die Suche nach solchen unterscheidbaren zeitinvarianten Merkmalsvektoren wird unten beschrieben.
Einer der wichtigsten Aspekte jedes Mustererkennungssystems ist die Identifikation, Erzeugung und Auswahl von Merkmalen, die stabil sind, wenn eine besondere Signatur vorhanden ist, jedoch verschiedene Anzeigen bereitstellen, wenn die Signatur nicht vorhanden ist. Bei der Entwicklung dieser Erfindung wurden Audiosignale von Aufzeichnungen, Bändern und Airplay mit einer Rate von 2500 Samples pro Sekunde digitalisiert, nachdem sie mit einer Grenzfrequenz von 1,0 kHz tiefpaßgefiltert wurden. Es hat sich gezeigt, daß die Frequenzen unter 1 kHz durch die von Rundfunksendern verwendeten spektralen Modifikationen relativ unbeeinflußt bleiben. Annähernd 65 Sekunden Audio aus diesen Signalen wurden von 75 Liedern digitalisiert und als eine experimentelle Datenbank gespeichert. Jede dieser Dateien wurde dann durch eine Softwaresimulation des Prozessors am vorderen Ende verarbeitet, der die Hüllkurven von vier Frequenzbändern bildet. Die Ausgabe aus dem Simulator war ein Satz gemultiplexter Gleitkommadateien, die auf einem Graphikendgerät aufgezeichnet oder von einem Programm verarbeitet werden können, um Charakteristiken der Daten zu bestimmen, die zur Bildung guter Merkmale für die Merkmalsvektoren ausgewertet werden können. Ein Spektralanalyseprogramm berechnete das Leistungssprektrum, das logarithmische Leistungsspektrum, das Cepstrum bzw. die Silbenvertauschung des Spektrums und die Autokorrelationsfunktionen jedes Frequenzbandes. Das Leistungsspektrum und logarithmische Leistungsspektrum sind Funktionen der Frequenzdomäne, während das Cepstrum und die Autokorrelationsfunktionen Funktionen der Zeitdomäne sind. Als nächstes wurde ein statistisches Programm zum Berechnen statistischer Momente der Signalwerte der vier Bänder des empfangenen Signals verwendet. Solche statistischen Momente umfassen das Mittel bzw. den Mittelwert, Varianz, Asymmetrie und Wölbung. Außerdem wurde die kovariante Matrix der vier Bänder berechnet.
Beim Prüfen der Leistungsspektren und der logarithmischen Leistungsspektren wurde entdeckt, daß, oblgeich verschiedene Lieder spektrale Spitzen bei verschiedenen Frequenzen hatten, es nicht klar war, wie eine kleine Zahl spektraler Komponenten, die zwischen den verschiedenen Liedern zuverlässig unterscheiden können, auszuwählen sind. Dies gilt sowohl für die linearen als auch logarithmischen Leistungsspektren. Jedoch liefert die Berechnung der Signalbandbreite jedes Bandes einen Satz aus vier Zahlen, die bezüglich Geschwindigkeitsvariatonen stabil sein sollten. Diese Merkmale wurden unter Verwendung von acht verschiedenen Zeitverzögerungen entwikkelt.
Beim Prüfen der Autokorrelationsfunktionen wurde entdeckt, daß die einzigen stabilen Merkmale, die abgeleitet werden konnten, eng auf die früher diskutierten Bandbreitenmessungen bezogen waren. Dies ist zu erwarten, da das Leistungsspektrum und die Autokorrelationsfunktion ein Fouriertransformationspaar sind. Aus der Autokorrelationsfunktion abgeleitete Merkmale wurden deshalb so betrachtet, daß sie redundant sind, und wurden zugunsten der vom Leistungsspektrum abgeleiteten beiseite gelegt. Das Cepstrum wurde geprüft und gefunden, daß es keine brauchbaren stabilen Merkmale aufweist. Dies deshalb, weil das Cepstrum das Vorhandensein harmonisch bezogener Signalstrukturen zur Bestimmung der Periode der zusammengesetzten Wellenform ausnutzt. Es wurde gefunden, daß diese harmonischen Strukturen nicht in den Hüllkurven des bandpaßgefilterten Audios vorhanden sind.
Bei der Untersuchung des Verhaltens der durch das Statistikprogramm erzeugten Merkmale wurde entdeckt, daß Asymmetrie- und Wölbungswerte zwischen Liedern unterscheidbar und relativ stabil waren, wenn sie in Zeitverschiebungen in den Liedern berechnet wurden. Es gibt zwei andere Charakteristiken dieser Merkmale, die als attraktiv befunden wurden. Als erstes sind sowohl Asymmetrie als auch Wölbung selbstnormierend, d.h., ihr Wert ist unabhängig von der Lautstärke. Zweitens sind ihre Werte virtuell unbeeinflußt von Geschwindigkeitsvariationen bei der Aufzeichnung. Dies deshalb, weil ihre Berechnung nicht explizit die Zeit oder Frequenz verwendet. Dies wurde als ganz wichtig angesehen, da ein beträchtlicher Aufwand darauf gerichtet wurde, das ganze System immun gegen Geschwindigkeitsvariationen zu machen, die durch Rundfunksender induziert werden. Es wurde entdeckt, daß einige Lieder signifikant verschiedene Werte von Asymmetrie und Wölbung bei verschiedenen Zeitverschiebungen bzw.-versetzungen erzeugten. Dies trat auf, wenn die Zeitverschiebungen das Fenster der Analyse in Bereiche eines Lieds bewegten, bei denen der ganze Charakter des Lieds anders war. Es wird angenommen, daß dies ein generelles Problem ist, welches jeden Satz gewählter Merkmale beeinflußt und deshalb beim Erkennungsalgorithmus anstelle der Auswahl zu verwendender Merkmale behandelt werden muß.
Schließlich entdeckte der Erfinder der vorliegenden Erfindung, daß die Eigenschaften von Asymmetrie und Wölbung gut zum effektiven und zuverlässigen Kategorisieren von Rundfunksignalen geeignet sind. Bandbreitenabschätzungen arbeiteten ebenfalls gut, waren jedoch weniger immun gegen die Effekte von Zeitverschiebungen. Da der Erkennungsalgorithmus direkt damit umgeht, kann sich die Hüllkurvenbandbreite noch als ein geeignetes Unterscheidungsmerkmal erweisen. Es sei darauf hingewiesen, daß jedes der diskutierten Merkmale für alle vier Frequenzbänder berechnet wurde. Deshalb wurde eine Gesamtheit von zwölf Merkmalen darauf angesehen, ob sie hinsichtlich ihrer Unterscheidungsfähigkeiten, vier sowohl für Asymmetrie als auch Wölbung und Hüllkurvenbandbreite, qualifiziert sind. Wenn alle zwölf Merkmale verwendet werden, wird ein zwölfdimensionaler Merkmalshyperraum erzeugt. Dies ist vom Standpunkt des erforderlichen Speichers und der Zahl an Merkmalen, die berechnet werden müssen, wahrscheinlich inakzeptabel. Deshalb wurde hinsichtlich der vorliegenden Ausführungsform entschieden, nur die Asymmetrie- und Wölbungswerte zu verwenden, so daß insgesamt acht Merkmale erzeugt werden. Dies kann im Hinblick auf den erforderlichen Speicher immer noch inakzeptabel sein. Deshalb wurden die vier Frequenzbänder zu drei Wellenformen linear kombiniert und auf diese Weise Asymmetrie- und Wölbungswerte für jede der drei Wellenformen bereitgestellt, wodurch ein sechsdimensionaler Merkmalshyperraum erzeugt wird. Eine Bestätigung dieser Wahl wird in Bezug auf die unten beschriebenen Vektorquantisierungsverfahren detaillierter beschrieben.
Vektorquantisierung ist im Prinzip ein einfaches Konzept. Es umfaßt die Reduzierung der Auflösung jeder Vektorkomponente von ihrem kontinuierlichen Wertebereich in einen mit einer kleinen Zahl Werte, beispielsweise die Reduzierung einer Anzahl mehrstelliger Werte in eine Anzahl einstelliger Werte (siehe Figur 8). Beispielsweise könnte der Merkmalswertebereich einfach in mehrere Bänder gleicher Breite unterteilt werden. Das Merkmal wird dann durch Ersetzen seines mehrstelligen Wertes durch seine Bandnummer kodiert oder quantisiert. Es gibt zwei primäre Probleme bei diesem Verfahren. Als erstes können Werte, die in die Nähe der Grenze zwischen zwei Bändern fallen, aufgrund von Beschränkungen durch Rauschen, Verzerrung oder Berechnungsgenauigkeit falsch quantisiert werden. Zweitens ist es nicht wahrscheinlich, daß die Merkmaiswerte gleichförmig über den ganzen Bereich verteilt sind. Dies würde zu einer starken Konzentration in gewissen Bändern führen, welche den Informationsgehalt des quantisierten Merkmais reduziert. In dem einschränkenden Fall, daß alle Werte in das gleiche Band fallen, würde das Merkmal keinerlei Information enthalten. Dies wird durch Verwendung einer nicht gleichförmigen Breite der Bänder (beispielsweise Figur 10) und eines überlappenden Quantisierungsprozesses zur Kodierung von Referenzmerkmalsvektoren für die Referenzbibliothek (beispielsweise Figur 12) behandelt.
Als erstes ist es notwendig, die Zahl an Quantisierungspegeln und die Zahl der beim Merkmalsvektor verwendeten Merkmale zu betrachten. Diese spezifizierende Dimensionalität und die Dichte des Merkmalhyperraums. In der Figur 7 sind die Zahl diskreter Stellen im Hyperraum als eine Funktion der Zahl an benutzten Merkmalen und der Zahl Pegel, auf die sie quantisiert sind, aufgelistet. Es sei darauf hingewiesen, daß bei allen Fällen, bei denen die Zahl Pegel größer als drei ist, mehr durch die Erhöhung der Zahl an Merkmalen als durch Erhöhung der Zahl an Quantisierungspegeln erreicht wird. Es ist günstig, innerhalb der Grenzen eines Speichers den größtmöglichen Merkmalhyperraum zu verwenden. Dadurch können die durch die Merkmalsvektoren dargestellten Signale über ein großes Volumen mit dem Ergebnis verstreut werden, daß beim zweitstufigen Korrelator weniger Signaturen entwickelt werden müssen. Bei der bevorzugten Ausführungsform hat der Erfinder fünf Quantisierungspegel und sechs Merkmale als vernünftigen Kompromiß gewählt. Dies stellt einen Hyperraum mit 15.625 diskreten Stellen bereit.
Es wurden zwei Vektorquantisierungsalgorithmen entwickelt. Der erste unterteilt jeden Vektor gemäß seiner statistischen Verteilung derart, daß jeder Bereich die gleiche Zahl Eingänge aufweist (siehe beispielsweise Figuren 10 und 11). Der zweite führt einen ähnlichen Prozeß aus, gibt jedoch zwei quantisierte Merkmalsvektoren zurück (siehe beispielsweise Figuren 12, 13 und 14). Die zwei Vektoren stellen den wahrscheinlichsten Bereich und den nächsten Nachbarn dar. Unter Verwendung einer Abtastsignalbibliothek werden von den Asymmetrie-, Wölbungs- und Bandbreitenwerten Histogramme erzeugt. Die Histogramme für die Wölbung werden unten in Bezug auf den Überlappungs- und Nichtüberlappungs-Vektorquantisierungsalgorithmus beschrieben.
Die Figur 12 stellt die überlappungskodierte Vektorquantisierung eines Wölbungsmerkmals dar. Es sei darauf hingewiesen, daß die Wölbungswertpopulation zuerst derart unterteilt wird, daß jeder Bereich ein Drittel der Gesamtzahl an Samples enthält. Zum Trennen von Bereichen 1, 3 und 5 werden Schwellen B und D verwendet. Zwei zusätzliche Bereiche sind so aufgebaut, daß sie ebenfalls jeweils ein Drittel der Punkte enthalten. Diese sind auf die Schwellen B und D zentriert, wobei ein Sechstel der Gesamtheit der Punkte darüber und darunter liegt. Bereiche 2 und 4 sind durch Schwellen A, C und E begrenzt. Wie in Figur 13 angedeutet, befinden sich Merkmalswerte, die kleiner als die Schwelle A sind, klar im Bereich 1 und werden mit (0,0) kodiert. Merkmalswerte, die zwischen die Schwellen A und B fallen, können zum Bereich 1 oder 2 gehören und werden mit (0,1) kodiert. Diejenigen, die zwischen die Schwellen B und C fallen, können zum Bereich 2 oder 3 gehören und werden mit (1,2) kodiert. Werte zwischen C und D fallen in die Bereiche 3 oder 4 und werden mit (2,3) kodiert. Werte zwischen D und E können zum Bereich 4 oder 5 gehören und werden mit (3,4) kodiert. Wenn schließlich ein Wert größer als die Schwelle E ist, befindet sie sich klar im Bereich 5 und wird mit (4,4) kodiert. Da jeder Vektor sechs Merkmale ver wendet, erzeugt die Ausgabe des Überlappungsvektorquantisierungsprozesses ein Paar aus sechs Elementvektoren, wie es in Figur 14 dargestellt ist. Durch Permutierung der Elemente dieser zwei Vektoren können bis zu 64 neue Vektoren gebildet werden, welche Stellen im Hyperraum spezifizieren, bei denen das Signal gespeichert werden kann. Jedoch werden jedesmal, wenn ein Kode (0,0) oder (4,4) erzeugt wird, doppelte Vektoren erzeugt. Bei der in vorläufigen Untersuchungen verwendeten Abtastbibliothek wurde beobachtet, daß ein Mittel von 21,4 unterschiedlicher Vektoren durch Permutierung von Elementen überlappter quantisierter Vektoren A und B erzeugt wird. Diese unterschiedlichen Vektoren werden als der Speicher "Nachbarschaft" eines Lieds im Hyperraum bezeichnet.
Eine Alternative zum überlappten Quantisierungsalgorithmus ist der nichtüberlappte Quantisierungsalgorithmus, der in den Figuren 10 und 11 gezeigt ist. Die Figuren 10 und 11 zeigen ein Histogramm von aus der Abtastbibliothek erzeugten Wölbungswerten. Gemäß dem Nichtüberlappungs-Vektorquantisierungsalgorithmus werden Quantisierungsschwellen durch Sortieren aller Merkmalswerte in absteigender Ordnung und dann durch Unterteilung dieser Liste in fünf Bereiche gleicher Größe abgeleitet. Die an den Grenzen befindlichen Datenwerte werden als Schwellen ausgewählt. Dies stellt sicher, daß jeder Bereich die gleiche Zahl an Samples enthält und der resultierende Hyperraum gleichmäßig gefüllt ist. Merkmalsvektorwerte, die in einen der Bereiche 1, 2, 3, 4 oder 5 fallen, werden, wie in Figur 11 gezeigt, einfach mit dem Wert kodiert. Dieser Prozeß kann bei der Erzeugung des Hyperraums im Speicher ausgeführt werden, obgleich der überlappungsquantisierte Vektoralgorithmus bevorzugt wird. Jedoch wird der Nichtüberlappungs-Quantisierungsalgorithmus während des Prozesses der Erkennung des unten beschriebenen empfangenen Signals verwendet.
Der in Bezug auf den technischen Lösungsweg zu beschreibende Endprozeß ist, wie die quantisierten Vektoren dann benutzt werden, um entweder Information in eine Signalidentifikationen enthaltende Datenbank einzuschreiben oder zu entnehmen. Der Erfinder der vorliegenden Erfindung hat zwei Verfahren zum Speichern und Wiedergewinnen von Information untersucht, die bei der Erkennung von Signalmustern anwendbar sind. Das erste umfaßt die Speicherung aller Variationen des erwarteten Musters im Hyperraum. Dies ist einfach eine Sache der Zuordnung des Liedidentifikationskodes zu jeder durch die Permutation der zwei vom überlappten Vektorquantisierungsprozeß zurückgekehrten Vektoren beschriebenen Stelle. Der Zugriff um faßt die Berechnung einer einzelnen Stelle, die eine Liste von Mustern enthält, welche die Suchkritierien erfüllen. Dies ist vom Standpunkt der Realzeiterkennung das effektivste, erfordert jedoch die Speicherung des Identifikationskodes an vielen Stellen im Merkmalshyperraum. Ein alternatives Verfahren ist das Speichern jedes Musters nur einmal im Raum.
Wenn auf den Raum zugegriffen wird, um eine Liste von Liedkandidaten zu finden, müssen alle im überlappten Quantisierungsprozeß beobachteten Variationen gesucht werden. Die bei jeder Stelle gefundenen Listen müssen dann vereinigt werden. Obgleich dieses zweite Verfahren Speicher spart, verlangsamt es den Erkennungsprozeß. Es ist auch ein "Band- und Aufhänger"-Prozeß möglich, der alle erwarteten Variationen der Merkmale speichert und dann den Bereich nach Verzerrungen absucht. Obgleich dieses Verfahren das wahrscheinlich robusteste ist, büßt es sowohl Zeit als auch Speicher ein. Das erste Verfahren wurde zur Weiterverfolgung ausgewählt, da eine Realzeitdurchführung wichtig ist und nicht angenommen wird, daß die Grenzen des Speichers überschritten oder erweitert werden.
Es gibt viele Verfahren zur Abbildung der Signalidentifikationen in den Speicher und nachfolgenden Wiederauffindung der Identifikationen entsprechend einem empfangenen Signal. Die derzeit bevorzugte Ausführungsform verwendet einen möglichen Lösungsweg, obgleich die Erfindung so ausgebildet ist, daß sie alle naheliegenden Äquivalente abdeckt. Gemäß den oben beschriebenen Parametern gibt es 15.625 diskrete Stellen im Vektorhyperraum. Deshalb wurde eine Tabelle aus Zeigern konstruiert, die auf Listen zeigen, welche Identifikationskodes von möglicherweise vergleichbaren Mustern enthalten. Jede Liste hat eine variable Länge, die erneuert wird, wenn Signale hinzugefügt oder entfernt werden. Die Figur 15 stellt dieses Zugriffsverfahren dar. Wenn ein Signal zur Datenbank zu addieren ist, werden alle Permutationen der vom überlappten Quantisierungsprozeß abgeleiteten beiden Vektoren berechnet. Eine Position auf der Liste wird dann als gewichtete Summe der Vektorkomponenten unter Verwendung einer nichtdezimalen Basis, beispielsweise 5, berechnet. Jede Position dieser Tabelle kann auf eine leere Liste oder auf die Stelle einer Liste zeigen, welche die Identifikationskodes eines Signals enthalten, das auf diese Stelle im Hyperraum abbildet. Diese Listen werden dynamisch erzeugt und modifiziert. Der erste Zugang in die Signalliste zeigt die Zahl der folgenden Identifikationskodes an. Der Rest der Liste enthält die Identifikationskodes. Eine Hinzufügung einer Signalidentifikation zur Liste umfaßt eine Prüfung, um zu sehen, ob die Liste existiert. Wenn nicht, muß sie erzeugt werden. Die Signalidentifikation wird dann addiert und die Listengröße auf 1 gesetzt. Wenn die Liste bereits existiert, wird geprüft, um zu sehen, ob die Signalidentifikation schon in der Liste ist. Wenn sie schon in der Liste ist, wird die Tabelle einfach verlassen, wenn nicht, wird die Liste um 1 erweitert und ein neuer Identifikationskode angefügt. Der erste Zugang in die Signalliste wird ebenfalls erneuert um anzuzeigen, daß ein zusätzlicher Signalidentifikationskode addiert worden ist. Die Entfernung eines Signalidentifikationskodes ist ein ähnlicher Prozeß.
Die Durchführung dieses Lösungswegs bzw. Verfahrens hängt von der Stabilität der gewählten statistischen Merkmale ab. Es wurden Momente gewählt, da sie von Geschwindigkeitsvariationen unbeeinflußt sind. Wenn jedoch Zeitverschiebungen involviert werden, ist es gut möglich, daß Segmente des Liedes andere Eigenschaften zeigen, die in einem anderen Bereich des Hyperraums Platz nehmen. Das hat Fehldetektionen zur Folge. Dies wurde durch Abschätzung der Merkmalsstabilität bei mehreren Zeitverzögerungen untersucht und die meisten wurden als stabil befunden. Einige änderten sich jedoch mit der Zeitverzögerung signifikant. Um dem zu begegnen, wurden Statistiken über einem Satz von vierzehn Sekundenintervallen innerhalb der vom Korrelator benutzten 28 Sekunden berechnet. Bei jeder Verschiebung wird ein Satz überlappter Stellen im Hyperraum berechnet und der Lied-ID-Kode wird zur korrespondierenden Liste addiert. Wenn das Lied stabil ist, werden keine Einbzw. Zugänge erzeugt. Wenn sich jedoch die Statistiken mit der Zeitverzögerung ändern, wird das Lied allen Bereichen hinzugefugt, in denen es möglicherweise als existent gefunden wird.
Dies beendet eine Diskussion des technischen Lösungswegs und den Überblick über die vorliegende Erfindung. Die Figur r1 zeigt ein Blockschaltbild einer Vorrichtung gemäß der vorliegenden Erfindung und Figur 16 zeigt ein Spitzenpegel Flußdiagramm für das Verfahren gemäß der vorliegenden Erfindung. Bei der vorliegenden Erfindung ermöglicht die Verarbeitungsstruktur nach Figur 1 eine gleichzeitige Verarbeitung von bis zu fünf Audiokanälen. Deshalb können bis zu fünf Rundfunkstationen überwacht und deren Rundfunkprogramme klassifiziert werden. Es können zusätzliche Hardware- und Software-Modifikationen zur Erhöhung oder Erniedrigung der Zahl an gleichzeitig überwachten Kanälen ausgeführt werden.
Eine Antenne 2 empfängt Audiosignale tragende Radiowellen. Die Antennenvorrichtung kann bis zu fünf Radiokanäle gleichzeitig empfangen. Das Audiosignal wird vom Audiokanalempfänger 4 empfangen und zum Audiovorprozessor 6 gegeben. Der Audiovorprozessor 6 umfaßt Filterbänke 8, Hüllkurvengleichrichter 10 und Tiefpaßfilter 12, wie sie in Figur 2 gezeigt sind. Alternativ dazu kann der Audiovorprozessor 6 digital in den Prozessor 24 aufgenommen sein.
Die Figur 1 zeigt auch einen Analog-Digital-Wandler 14, der zum Digitalisieren des Audiosignals benutzt werden kann. Ein Multiplexer 16 wird zum Ausführen der Multiplexoperationen verwendet, wenn mehrere Audiokanäle gleichzeitig überwacht werden. Sowohl der A/D-Wandler 14 als auch der Multiplexer 16 sind an einen Bus 100 gekoppelt. An den Bus 100 ist auch ein Arrray-Prozessor 18 gekoppelt. Im Array-Prozessor 18 werden Merkmalsvektoroperationen ausgeführt, welche die Zeitverzerrung der zweitstufigen Merkmalsfolge und die zweitstufigen Korrelationsberechnungen enthalten.
An den Bus 100 ist auch ein Prozessor 24 gekoppelt, welcher die Funktionen der Steuerung, der Datenbankverwaltung und der Verwaltung aller Eingänge/Ausgänge (I/A) der erststufigen Klassifikationsberechnungen ausführt. Der Prozessor 24 kann einen Mikroprozessor 26, einen Speicher 28, I/A- Schnittstellen 30 oder einen Realzeittaktgeber 33, einen Referenzmusterspeicher 34 und einen Offline-Speicher 36 aufweisen. Vorzugsweise ist der Mikroprozessor 26 ein Mikroprozessor der Serie Motorola 68020. Vorzugsweise umfaßt der Arbeitsspeicher 28 wenigstens 8 MBytes an Speicher. Ähnlich speichert der Musterspeicher 34 sowohl die erststufige als auch zweitstufige Referenzbibliothek und ist vorzugsweise als Festplatte mit wenigstens 140 MByte realisiert. Der Offline- Speicher 36 kann zum Ändern und/oder Addieren und/oder Entfernen von Referenzmustern der Referenzmusterbibliotheken im Speicher 34 verwendet werden. Vorzugsweise weist der Offline- Speicher 36 eine Bandkassette auf.
Das Verarbeitungssystem kann schließlich mit Periphergeräten, wie beispielsweise eine Kathodenstrahlröhrer (CRT) 38, einem Drucker oder Modem 40 und einem Endgerät 42 gekoppelt sein. Solche Periphergeräte werden durch die I/A-Schnittstellen 30 an das System gekoppelt.
Anhand der Figur 2 wird eine grobe Spektralanalyse beschrieben. Das empfangene Audiosignal wird an den Audiovorprozessor 6 gegeben, in welchem es in mehrere Kanäle unterteilt wird. Bei der derzeit bevorzugten Ausführungsform sind vier Kanäle gewählt worden. Es können jedoch in Abhängigkeit von dem exakten Typ des zu klassifizierenden Signals mehr oder weniger Kanäle verwendet werden. Jeder Kanal weist ein Bandpaßfilter 8 auf, wobei jedes Filter einen anderen Wert hat. Jeder Kanal weist auch einen Gleichrichter 10 und ein Tiefpaßfilter 12 auf. Zweck des Audiovorprozessors ist es, die Menge an in der ersten Stufe verarbeiteten Information zu reduzieren. Dies liefert eine Langterm-Mittelwertbildung der erststufigen Merkmale. Da es Zweck der ersten Stufe ist, die zur Erkennung erforderlichen Berechnungen zu reduzieren, ist es günstig, die Menge an pro Zeiteinheit verarbeiteter Information zu reduzieren. Die Signalunterscheidungsgenauigkeit ist proportional zum Zeit-Bandbreite-Produkt des Merkmalsvektors. Deshalb wird durch Reduzierung der Bandbreite des Merkmalsvektors unter gleichzeitiger Ausdehnung der Dauer die Genauigkeit aufrechterhalten, während die erforderliche Verarbeitung pro Zeiteinheit erniedrigt ist. Dies gilt für jeden Prozeß, der eine kontinuierliche Suche nach Zeitreihenereignissen benötigt.
Um dies auszuführen, wird das in Figur 3 gezeigte Audioeingangssignal an jedes der Bandpaßfilter 8 gegeben. Jedes Bandpaßfilter gibt ein gefiltertes Signal aus, beispielsweise das in Figur 3 gezeigte. Die gefilterten Signale werden an die Gleichrichter 10 gegeben, deren jeder eine in Figur 3 gezeigte Wellenform ausgibt. Schließlich werden die gleichgerichteten Signale an Tiefpaßfilter 12 gegeben, deren jedes ein tiefpaßgefiltertes Signal ausgibt, wie es in Figur 3 gezeigt ist. Durch Abtasten des Signals reduzierter Bandbreite bleibt die Verarbeitungszeit erhalten, während gleichzeitig die Empfindlichkeit des Systems auf Geschwindigkeitsvariationen im Audiosignal reduziert wird. Deshalb werden von den Tiefpaßfiltern 12 mehrere Wellenformen bereitgestellt, wie sie in Figur 4 gezeigt sind. Diese Wellenformen sind mit X&sub1;(t), X&sub2;(t), X&sub3;(t) bzw. X&sub4;(t) bezeichnet. Jede dieser Wellenformen wird an den Prozessor 24 gegeben, der die Merkmalsfolgen den Wellenformen entsprechend erzeugt.
Der Prozessor 24 stellt infolgedessen eine Anzahl Merkmalsfolgen bereit, die mit Xs&sub1;(t), Xs&sub2;(t), Xs&sub3;(t) bzw. Xc(t) bezeichnet sind (siehe Figur 2). Jede dieser Merkmalsfolgen ist als eine Linearkombination der Wellenformen X&sub1;(t) bis X&sub4;(t) gebildet. Bei der vorliegenden Erfindung ist die Linearkombination nichts anderes als eine Differenz zwischen zwei Bändem. Beispielsweise ist das Signal XS1(t) die Linearkombination X&sub4;(t)-X&sub3;(t) (im folgenden als "Band (4-3)" bezeichnet. Ähnlich werden Signale für Band (3-2) und Band (2-1) im Prozessor 24 erzeugt. Dieser Schritt ist in der Figur 16 beim Schritt S110 gezeigt.
Bei manchen Implementierungen ist es jedoch günstig, Folgen zu bilden, die Linearkombinationen der vier Eingangswellenformen sind und gewisse spezielle Charakteristiken wie beispielsweise Orthogonalität aufweisen. Eine zusätzliche Verarbeitung kann an dieser Stelle zum Kompensieren von durch die Rundfunksender induzierter Verzerrung vorgenommen werden. Ein Beispiel einer solchen Verzerrung ist die Kompression des Dynamikbereiches oder seine Erweiterung unter Verwendung einer logarithmischen Kompressionsfunktion. Solche Verzerrungen können durch Simulation der Dynamikbereichverzerrung beim Erzeugen der Datenbank und/oder Kompensieren des empfangenen Signals für die Dynamikbereichverzerrung kompensiert werden.
Der nächste Schritt ist die Berechnung des statistischen Moments jedes der Banddifferenzsignale, der in der Figur 16 mit Schritt S120 bezeichnet ist. Jedes Bandpaßdifferenzsignal muß an mehreren Punkten abgetastet werden, um Signalwerte zu erzeugen, die zum Berechnen dieser statistischen Momente verwendet werden. Die Figur 5 zeigt die Abtastung von Band (4- 3). Der Abtastprozeß ist zum Erzeugen der Referenzbibliothek und zum Erkennen des empfangenen Signals ist etwas anders. Wenn die Referenzbibliothek erzeugt wird, wird das Signal in die Vorrichtung nach Figur 1 am Audiokanalempfänger 4 eingespielt. Der bei den Schritten S210 und S270 in Figur 16 gezeigte zweitstufige Korrelationsprozeß wird zum Wählen des spektral ausgeprägtesten Abschnitts des Signals zur Verwendung in den Referenzbibliotheken benutzt. Insbesondere identifiziert der Prozessor die spektral ausgeprägtesten 28 Sekunden des Signals zur Verwendung bei der Erzeugung der erstund zweitstufigen Referenzbibliothek. Wird andererseits ein Rundfunksignal von der Struktur nach Figur 1 überwacht, wird das Signal in eine Folge von vierzehn Sekundensegmenten herunter zerlegt und jedes Segment wird analysiert und mit den Referenzsignalbibliotheken verglichen.
Nach Figur 5 wird der Referenzbibliothekeingang für das Zielbzw. Sollsignal durch wiederholte Abtastung jedes Banddifferenzsignals mit einem Fenster mit 128 Abttastpunkten in neun Intervallen bestimmt, wobei das Fenster um 16 Punkte für jedes Intervall verschoben wird. Die an den Abtastpunkten bestimmten Signalwerte werden dann zum Berechnen der statistischen Momente, Asymmetrie und Wölbung beim Schritt S120 in Figur 16 verwendet. Die Figur 17 zeigt den Prozeß, durch welchen die statistischen Momente berechnet werden. Als erstes wird das Mittel der abgetasteten Signalwerte gemäß
gewonnen, wobei N die Zahl Abtastpunkte bedeutet, 1 < n < N gilt, und X der Wert des Signals (beispielsweise die Spannung) am Abtastpunkt ist. Dann wird die Varianz des abgetasteten Signals gemäß
Varianz =
gewonnen. Aus der Varianz wird die Standardabweichung wie folgt berechnet:
= Varianz ... (3)
Als nächstes können das oder die statistischen Momente gemäß der Formel
berechnet werden.
Obgleich die vorliegende Erfindung zwei statistische Momente, Asymmetrie und Wölbung, verwendet, kann ein einzelnes statistisches Moment gemäß Formel (4) berechnet werden oder alternativ dazu ein oder mehr Momente höherer Ordnung verwendet werden. Entsprechend der bevorzugten Ausführungsform wird die Asymmetrie berechnet durch
Die Wölbung wird wie folgt berechnet:
Die oben beschriebenen Berechnungen werden bei den Schritten S121 bis S125 in Figur 17 ausgeführt.
Wenn einmal die statistischen Momente berechnet worden sind, können die Merkmalsvektoren abgeleitet werden (Schritt S130 in Figur 16). Wie in Figur 6 gezeigt, wird ein Merkmalsvektor während der Erzeugung der Referenzbibliothek für jedes der neun Intervalle abgeleitet. Jeder Vektor enthält Asymmetrieund Wölbungswerte für die Banddifferenzsignale bei jedem Intervall. Infolgedessen enthält der Vektor 1 Werte für S(4- 3)&sub1;, S(3-2)&sub1;, S(2-1)&sub1;, K(4-3)&sub1;, K(3-2)&sub1; K(2-1)&sub1;. Diese Werte sind aktuelle Signalwerte und werden durch Gleitkommazahlen dargestellt.
Jetzt sind neun Merkmalsvektoren für jedes Signal erzeugt worden und jeder Merkmalsvektor beschreibt eine Stelle im Hyperraum. Dann wird in jeder Nachbarschaft im Hyperraum ein Liedidentifikationskode plaziert, wobei die Nachbarschaft doppelte Werte eliminiert.
Der nächste Schritte ist die Quantisierung der Merkmalsvektoren, wie sie früher beschrieben wurde (Schritt S140 in Figur 16). Während des Prozesses der Erzeugung der Referenzbibliotheken wird vorzugsweise der überlappte Vektorqantisierungsalgorithmus gemäß den Figuren 12 bis 14 verwendet. Beispielsweise werden, wie in Figur 14 gezeigt, die Werte des Vektors 1 auf den Graphen nach Figur 12 gezeichnet und zwei überlappte quantisierte Vektoren A und B erzeugt. Diese quantisierten Vektorkomponenten werden durch eine Stelle dargestellt, welche die Werte von 0 bis 4 annimmt. Bei einer alternativen Ausführungsform können jedoch die quantisierten Vektoren mehrstellig sein und mehr oder weniger als fünf unterschiedliche Werte aufweisen.
Nachdem die zwei quantisierten Vektoren A und B erhalten sind, wird eine Permutation dieser Vektoren ausgeführt, um alle möglichen Variationen dieser Vektoren zu erzeugen. Infolgedessen gibt es 64 mögliche Stellen im Hyperraum, bei denen die Siganlwerte des Vektors 1 gespeichert werden können. Da diese Permutation für jeden der neun Merkmalsvektoren erzeugt wird, sind für jedes Signal möglicherweise insgesamt 576 Vektoren im Hyperraum abzubilden. Nach vom Erfinder durchgeführten Experimenten werden für jeden Vektor jedoch 21 tatsächliche Stellen im Hyperraum erzeugt.
Eine Abbildung jedes permutierten quantisierten Vektors ist einfach eine Sache des Eingebens einer Liedidentifikation in eine besondere Stelle im Speicher (Schritt S150 in Figur 16). Dies wird entsprechend einem Prozeß ausgeführt, der in Figur 15 gezeigt ist, obgleich eine breite Anzahl von Abbildungsalgorithmen benutzt werden kann. Nach Figur 15 wird eine gewichtete Summe des permutierten quantisierten Vektors 2A unter Verwendung der nichtdezimalen Grundzahl 5 erzeugt. Dies heißt, daß die Vektorwerte mit verschiedenen Potenzen der Basis 5 multipliziert werden. Natürlich kann eine andere Grundzahl verwendet werden oder es kann eine gänzlich andere Methode zur Erzeugung einer Adresse angewendet werden. Bei dem in Figur 15 gezeigten Beispiel ist die gewichtete Summe der Vektorkomponenten gleich 11.117. Dann wird mit dieser Adresse auf eine mit Q-TABELLE bezeichnete Tabelle zugegriffen (Schritt S160 in Figur 16) und ein Zeiger erzeugt, der auf eine besondere Liedliste #1 zeigt. Während des Prozesses der Erzeugung der Datenbank wird nun der Liedidentifikationskode in die Liedliste eingegeben und die Zahl an Liedern auf der Liste wird um eins erhöht. Diese Prozedur wird für jeden der vom Abtastsignal erzeugten permutierten quantisierten Vektoren wiederholt, und der Identifikationskode für das Sample wird infolgedessen in mehrere Liedlisten in den Speicher geschrieben. Dies vollendet die Erzeugung der Datenbank, mit welcher die Signale erkannt werden.
Während der Signalerkennung sind die oben beschriebenen Schritte generell ähnlich. Das Rundfunksignal wird empfangen, bandpaßgefiltert, gleichgerichtet, tiefpaßgefiltert und Linearkombinationen der vier Bänder werden erzeugt. Der Abtastschritt während der Erkennung ist darin etwas anders, als das Lied bei 14 Sekundenintervallen abgetastet wird. Es wird für jedes Intervall nur ein einzelner Merkmalsvektor unter Verwendung der nach den Gleichungen (5) und (6) berechneten Asymmetrie- und Wölbungswerte erzeugt.
Der einzelne Merkmalsvektor für jedes abgetastete Intervall wird dann unter Verwendung des oben erwähnten Nichtüberlappungs-Quantisierungsalgorithmus quantisiert. Infolgedessen erzeugt jedes Liedintervall einen einzelnen quantisierten Vektor. Es wird dann eine gewichtete Summe der einzeln quantisierten Vektorkomponenten gewonnen und unter Verwendung der gewichteten Summe auf die Q-TABELLE zugegriffen. Der Zeiger aus der Q-TABELLE greift auf eine einzelne Liedliste zu. Die Lieder auf der einzelnen Liedliste sind die bei der zweitstufigen Klassifikationsprozedur untersuchten Liederkandidaten. Bei Verwendung eines einstufigen Klassifikationsprozesses werden natürlich das oder die von der einzelnen Liedliste herausgenommenen Lieder als das Rundfunksignal identifiziert.
Der zweitstufige Klassifikationsprozeß ist detailliert im '562-Patent in Spalte 13, Zeile 58 bis Spalte 15, Zeile 57 und in den Figurern 2, 7, 8, 9 und 14 beschrieben. Grundsätzlich werden die eine oder merheren beim erststufigen Klassifikationssprozeß erzeugten Liedlisten im zweitstufigen Korrelator zusammen mit dem Ausgangsssignal Xc(t) nach Figur 2 übermittelt. Das Signal Xc(t) kann linear zeitverzerrt sein, so, wie es in dem '562-Patent beschrieben ist. Die Fouriertransformation aller fünf zeitverzerrten und unverzerrten Wellenformen wird berechnet und als komplexe Spektren, die mit den zweitstufigen Referenzmustern verglichen werden, in der zweitstufigen Bibliothek gespeichert. Samples aus den digitalisierten Rundfunksignalen und den Referenzwellenformen werden kreuzmultipliziert und invers fouriertransformiert, um ein Korrelationssignal zu erzeugen (Schritt S211 in Figur 18). Als nächstes werden die Korrelationsfunktionen zwischen jedem zweitstufigen Referenzmuster und den mehreren zeitverzerrten (und unverzerrten) Eingangssignalen verglichen, um den maximalen Korrelationswert für das laufende Eingangssignal auszuwählen (Schritt S213 in Figur 18). Die geeignete Wellenform mit dem höchsten Korrelationswert wird ausgewählt und mit einem Schwellenwert verglichen, der die Erkennung bestimmt. Sobald festgestellt wird, daß ein Korrelationsspitzenwert über der vorbestimmten Schwelle ist, wird das Signal "erkannt" (Schritt S215 in Figur 18) und die Liedidentifikation wird mitgeschrieben und kann auf der Kathodenstrahlröhre 38 gezeigt werden.
Infolgedessen stellen das vorstehend beschriebene System und Verfahren ein genaues, zuverlässiges, kompaktes, immer noch billiges System zur Klassifizierung von Sginalen bereit.
Wie früher erwähnt, kann die Vorrichtung gemäß der vorliegenden Erfindung zum Erzeugen der erst- und zweitstufigen Rreferenzbibliotheken benutzt werden. Die Prozedur zur Erzeugung der erststufigen Bibliothek ist oben beeschrieben worden und die Prozedur zur Erzeugun der zweitstufigen Bibliothek geht vollständig aus dem '562-Patent, Spalte 15, Zeile 64 bis Spalte 16, Zeile 53 hervor.
Was deshalb oben beschrieben wurde, ist eine Vorrichtung und ein Verfahren zur automatischen Klassifizieirung von Signalen, vorzugsweise Rundfunksignalen. Da das System mikroprozessorbasiert ist, kann es in extrem kleiner und wirtschaftlichehr Packung realsiert werden. Beispielsweise umfaßt der existierende Prototyp einen kommerziellen FM-Radioempfänger und einen kleinen Computer mit einem Sun-3/150-Prozessor, einem einen Motorola-68020-Mikroprozessor verwendendes Sun-CPU- Board, mehrere Speicherboards, einen Mercury-Array-Prozessor, einen Vorprozessor, eine Steuereinrichtung für die Platte und Periphergeräte sowie eine Kathodenstrahlröhre Der Fachmann durchschnittlichen Könnens auf diesem Gebiet erkennt leicht die signifikanten Fortschritte bei der in diesem Patent offenbarten Signalerkennung.
Wenn die vorligende Erfindung in Verbindung mit dem, was derzeit als die praktikabelsten und bevorzugtesten Ausführungsformen betrachtet werden, beschrieben wurde, ist dies so zu verstehen, daß die Erfindung nicht auf die offenbarten Ausführugnsformen beschränkt ist. Vielmehr deckt die vorliegende Erfindung verschiedene Modifikationen und äquivalente Ausführungsformen ab, die in den Rahmen der beigefügten Ansprüche fallen.

Claims

1. Verfahren zur Klassifizierung eines Signals, bestehend aus den Schritten:

Empfangen des Signals,

Abtasten des Signals an mehreren Punkten zur Erzeugung mehrerer Signalwerte,

Ableiten eines Multiwert-Merkmalsvektors aus den Signalwerten,

Quantisieren des Merkmalsvektors durch Ersetzen jedes Merkmalsvektorwertes durch einen aus einem vorbestimmten, ungleichartige Merkmalsvektorwerte kategorisierenden Quantisierungsmuster bestimmten Kategoriewert und

Zugreifen auf eine Signalbibliothek mit dem quantisierten Vektor zur Erzeugung eines mit dem empfangenen Signal korrespondierenden Signalidentifikationskodes.

2. Verfahren nach Anspruch 1, wobei das vorbestimmte Quantisierungsmuster ein Überlappungsquantisierungsmuster ist.

3. Verfahren nach Anspruch 1, wobei der Quantisierungsschritt mehrere verschiedene vorbestimmte Quantisierungsmuster zum Quantisieren des Merkmalsvektors verwendet.

4. Verfahren nach Anspruch 1, wobei der Ableitungsschritt die Schritte

Berechnen zweier unterschiedlicher statistischer Momente der mehreren Signalwerte und

Bilden des Merkmalsvektors unter Verwendung der zwei berechneten statistischen Momente

aufweist.

5. Verfahren nach Anspruch 4, wobei für jedes der zwei statistischen Momente ein vorbestimmtes Quantisierungsmuster vorgesehen ist.

6. Verfahren nach Anspruch 4, wobei die zwei verschiedenen statistischen Momente Asymmetrie und Wölbung aufweisen.

7. Verfahren nach Anspruch 1, wobei der Empfangsschritt den Schritt einer Hüllkurvengleichrichtung des empfangenen Signals aufweist.

8. Verfahren nach Anspruch 11 wobei der Quantisierungsschritt die Schritte

Ersetzen des Merkmalsvektors durch mehreren quantisierte Vektoren entsprechend wenigstens einem vorbestimmten Quantisierungsmuster mit Überlappungskategorien und

Permutieren der mehreren quantisierten Vektoren zur Erzeugung mehrerer weiterer permutierter quantisierter Vektoren

aufweist.

9. Verfahren nach Anspruch 8, wobei der Zugreifschritt die Schritte

Zugreifen auf die Signalbibliothek mit den mehreren permutierten quantisierten Vektoren zum Erreichen mehrerer Speicherstellen und

Schreiben in jede Speicherzelle einen mit dem empfangenen Signal korrespondierenden Signalidentifikationskode aufweist.

10. Verfahren nach Anspruch 1, wobei der Empfangsschritt die Schritte

Spektralanalysieren des Signals zur Erzeugung mehrerer, verschiedene Frequenzbänder aufweisender analysierter Signale und

Bilden von Linearkombinationen der analysierten Wellenformen

aufweist,

wobei der Abtastschritt den Schritt einer Abtastung jeder Linearkombination zur Erzeugung mehrerer Abtastpunkte für jede Linearkombination

aufweist,

und wobei der Ableitungsschritt die Schritte

Berechnen von Asymmetrie- und Wölbungswerten für alle Linearkombinationen aus den korrespondierenden Abtastpunkten und

Bilden des Merkmalsvektors so, daß er Asymmetrie- und Wölbungswerte aller Linearkombinationen enthält,

aufweist.

11. Verfahren zum Erzeugen eines bei der Identifikation von Rundfunksignalen verwendbaren Signalidentifikationsbibliothek, bestehend aus den Schritten:

Abtasten eines durch Rundfunk zu sendenden Signals zur Erzeugung mehrerer analysierter Wellenformen für jedes durch Rundfunk zu sendende Signal,

Ableiten mehrerer Merkmalsvektoren und wenigstens einen Merkmalsvektor pro abgetastetes Signal aus den analysierten Wellenformen,

Quantisieren jedes Merkmalsvektors mit den Unterschritten:

Herstellen mehrerer Quantisierungspegel,

Verteilen der Quantisierungspegel ungleichartig über einer vorbestimmten statistischen Verteilung,

Ableiten mehrerer Quantisierungsschwellenwerte entsprechend den verteilten Quantisierungspegeln,

Ersetzen jedes Wertes jedes Merkmalsvektors durch einen durch die Quantisierungsschwellenwerte bestimmten korrespondierenden Quantisierungswert, und

Speichern jedes einen quantisierten Vektor darstellenden Wertes in einem Speicher als die Signalidentifikation für das korrespondierende abgetastete Signal.

12. Verfahren nach Anspruch 11, wobei der Schritt der Verteilung der Quantisierungspegel den Schritt einer Verteilung der Quantisierungspegel in überlappender Art und Weise aufweist, und wobei der Schritt des Ersetzens jedes Wertes jedes Merkmalsvektors die weiteren Schritte

Ersetzen jedes Wertes jedes Merkmalsvektors durch mehrere durch die überlappten Quantisierungspegel bestimmten Quantisierungswerte, wobei so jeder Merkmalsvektor durch mehrere quantisierte Vektoren ersetzt wird, und

Permutieren der mehreren quantisierten Vektoren jedes Merkmalsvektors zur Erzeugung mehrerer permutierter Vektoren

aufweist,

wobei der Schritt des Speicherns den Schritt eines Speicherns von mit den mehreren quantisierten Vektoren korrespondierenden Werten für jedes abgetastete Signal aufweist.

13. Verfahren nach Anspruch 11, wobei der Ableitungsschritt den Schritt eines Berechnens zweier statistischer Momente für jede analysierte Wellenform und Bilden jedes Merkmalsvektors so, daß er die zwei statistischen Momente enthält, aufweist.

14. Verfahren nach einem der Ansprüche 1 bis 10, mit den Schritten:

Berechnen eines statistischen Moments des Signals entsprechend der Formel

wobei N die Zahl der Abtastpunkte,

1 < n < N,

X den Signalwert des Signals an einem Abtastpunkt,

µ ein Mittel der Signalwerte,

eine Standardabweichung des Signalwertes und

k eine ganze Zahl größer als 1 bedeuten,

Vergleichen des Berechneten statistischen Moments mit einer mehrere gespeicherte Signalidentifikationen enthaltenden Bibliothek und

Erkennen des empfangenen Signals als ähnlich wenigstens einer der gespeicherten Signalidentifikationen.

15. Verfahren nach Anspruch 14, wobei der Berechnungsschritt die Schritte einer Berechnung der Asymmetrie und Wölbung des Signals aufweist, und wobei der Vergleichsschritt den Schritt einer Bildung eines Merkmalsvektors aus der Asymmetrie und Wölbung aufweist.

16. Verfahren nach Anspruch 14, wobei der Empfangsschritt die Schritte

Bandpaßfiltern des empfangenen Signals zum Erzeugen mehrerer gefilterter Signale,

Gleichrichten der gefilterten Signale,

Tiefpaßfiltern der gleichgerichteten Signale und

Berechnen mehrerer Linearkombinationen der tiefpaßgefilterten Signale

aufweist.

17. Verfahren nach Anspruch 16, wobei der Abtastschritt die Schritte

Abtasten einer ersten der Linearkombinationen an mehreren Abtastpunkten zur Erzeugung einer ersten Anzahl Signalwerte und

Abtasten einer zweiten der Linearkombinationen an mehreren Abtastpunkten zur Erzeugung einer zweiten Anzahl Signalwerte

aufweist.

18. Verfahren nach Anspruch 17, wobei der Berechnungsschritt die Schritte

Berechnen eines ersten Asymmetriewertes und eines ersten Wölbungswertes aus der ersten Anzahl Signalwerte,

Berechnen eines zweiten Asymmetriewertes und eines zweiten Wölbungswertes für die zweite Anzahl Signalwerte und

Ableiten eines den ersten und zweiten Asymmetriewert und ersten und zweiten Wölbungswert aufweisenden Merkmalsvektors

aufweist

19. Verfahren nach Anspruch 18, wobei der Vergleichsschritt die Schritte

Quantisieren des Merkmalsvektors entsprechend einer Zahl vorbestimmter Quantisierungsmuster zur Erzeugung eines quantisierten Vektors und

Zugreifen auf die Bibliothek mit dem quantisierten Vektor zur Lokalisierung einer mit dem quantisierten Vektor korrespondierenden Signalidentifikation

aufweist

20. Verfahren nach Anspruch 19, wobei der Zugreifschritt die Schritte

Bilden einer gewichteten Summe der Werte des quantisierten Vektors unter Verwendung einer nichtdezimalen Grundzahl,

Verwenden der gewichteten Summe als eine Adresse zum Zugreifen auf eine Zeigertabelle zum Lokalisieren eines mit der gewichteten Summe korrespondierenden Zeigers und

Verwenden des Zeigers zum Lokalisieren einer die mit dem quantisierten Vektor korrespondierende Signalidentifikation enthaltenden Identifikationsliste

aufweist.

21. Verfahren nach Anspruch 20, wobei der Erkennungsschritt die Schritte

Korrelieren einer dritten der mehreren Linearkombinationen mit mehreren mit den in der Signalidentifikationsliste enthaltenen Signalidentifikationen korrespondierenden gespeicherten Signalen und

Auswählen eines gespeicherten Signals, dessen Korrelation mit der dritten Linearkombination einen vorbestimmten Schwellenwert überschreitet,

aufweist.

22. Verfahren nach Anspruch 19, wobei der Quantisierungsschritt die Schritte

Kategorisieren jedes Asymmetriewertes des Merkmalsvektors entsprechend einem vorbestimmten Asymmetriequantisierungsmuster, in welchem Kategorien ungleichartig verteilt sind, und

Kategorisieren jedes Wölbungswertes des Merkmalsvektors entsprechend einem vorbestimmten Wölbungsquantisierungsmuster, in welchem Kategorien ungleichartig verteilt sind,

aufweist.

23. Verfahren nach einem der Ansprüche 11 bis 13, mit den Schritten:

Empfangen eines Referenzsignals,

Abtasten des Referenzsignals an mehreren Abtastpunkten zur Erzeugung mehrerer Signalwerte,

Berechnen eines statistischen Moments des empfangenen Referenzsignals entsprechend der Formel

wobei N die Zahl der Abtastpunkte,

1 < n < N,

X den abgetasteten Signalwert an einem Abtastpunkt,

µ ein Mittel der abgetasteten Signalwerte,

eine Standardabweichung der abgetasteten Signalwerte und

k eine ganze Zahl größer als 1 bedeuten,

Ableiten eines Merkmalsvektors aus dem berechneten statistischen Moment, und

Speichern des Merkmalsvektors oder einer Darstellung desselben in einem Speicher

aufweist.

24. Verfahren nach Anspruch 23, wobei der Berechnungsschritt den Schritt einer Berechnung zweier statistischer Momente des empfangenen Referenzsignals aufweist, und wobei der Ableitungsschritt den Schritt einer Ableitung des Merkmalsvektors aus den beiden berechneten statistischen Momente aufweist.

25. Verfahren nach Anspruch 23, wobei der Empfangsschritt die Schritte

Bandpaßfiltern des empfangenen Signals zur Erzeugung mehrerer gefilterter Signale,

Gleichrichten der gefilterten Signale,

Tiefpaßfiltern der gleichgerichteten Signale und

Berechnen mehrerer Linearkombinationen der tiefpaßgefilterten Signale

aufweist.

26. Verfahren nach Anspruch 25, wobei der Abtastschritt die Schritte

Abtasten eines ersten Teils einer der Linearkombinationen an mehreren Punkten zur Erzeugung einer ersten Anzahl Signalwerte und

Abtasten eines zweiten Teils der einen Linearkombination an mehreren Punkten zur Erzeugung einer zweiten Anzahl Signalwerte

aufweist.

27. Verfahren nach Anspruch 26, wobei der Berechnungsschritt die Schritte

Berechnen der Asymmetrie und Wölbung der ersten Anzahl Signalwerte zur Erzeugung eines ersten Asymmetriewertes und ersten Wölbungswertes und

Berechnen der Asymmetrie und Wölbung der zweiten Anzahl Signalwerte zur Erzeugung eines zweiten Asymmetriewertes und zweites Wölbungswertes

aufweist.

28. Verfahren nach Anspruch 27, wobei der Ableitungsschritt die Schritte

Bilden eines ersten Merkmalsvektors mit dem ersten Asymmetriewert und ersten Wölbungswert und

Bilden eines zweiten Merkmalsvektors mit dem zweiten Asymmetriewert und zweiten Wölbungswert

aufweist.

29. Verfahren nach Anspruch 28, wobei der Ableitungsschritt den Schritt einer Quantisierung beider Merkmalsvektoren durch Ersetzen der Asymmetrie- und Wölbungswerte durch ganze Zahlen entsprechend vorbestimmter ungleichartiger Quantisierungsmuster zur Erzeugung eines ersten und zweiten quantisierten Vektors aufweist.

30. Verfahren nach Anspruch 29, wobei der Speicherschritt die Schritte

Berechnen einer gewichteten Summe des eine nichtdezimale Grundzahl verwendenden ersten Vektors,

Berechnen einer gewichteten Summe des eine nichtdezimale Grundzahl verwendenden zweiten Vektors,

Verwenden der gewichteten Summen zum Adressieren des Speichers, und

Speichern eines mit dem Referenzsignal korrespondierenden Signalidentifikationskode im Speicher bei den mit den gewichteten Summen korrespondieren Adressen

aufweist.

31. Verfahren nach Anspruch 28, wobei der Ableitungsschritt weiter die Schritte

Erzeugen eines ersten und zweiten überlappungsquantisierten Vektors aus dem ersten Merkmalsvektor entsprechend vorbestimmten ungleichartigen Überlappungsquantisierungsmustern,

Erzeugen eines dritten und vierten überlappungsquantisierten Vektors aus dem zweiten Merkmalsvektor entsprechend den vorbestimmten ungleichartigen Überlappungsquantisierungsmustern,

Bilden einer ersten Anzahl Permutationen des ersten und zweiten überlappungsquantisierten Vektors, und

Bilden einer zweiten Anzahl Permutationen des dritten und vierten überlappungsquantisierten Vektors

aufweist.

32. Verfahren nach Anspruch 31, wobei der Speicherschritt die Schritte

Berechnen einer gewichteten Summe der Werte sowohl der ersten als auch zweiten Anzahl Permutationen,

Zugreifen auf den Speicher bei mit den gewichteten Summen korrespondierenden Adressen, und

Speichern eines das Referenzsignal identifizierenden Signalidentifikationskodes in dem Speicher bei mit den Adressen korrespondierenden Bereichen

aufweist.

33. Vorrichtung zum Klassifizieren eines Signals, bestehend aus:

einem Empfänger zum Empfangen des Signals,

einem Speicher,

einem Prozessor zum a) Abtasten des Signals an mehreren Punkten zur Erzeugung mehrerer Signalwerte, b) Ableiten eines Multiwert-Merkmalsvektors aus den Signalwerten, c) Quantisieren des Merkmalsvektors durch Ersetzen jedes Merkmalsvektorwertes durch einen von einem vorbestimmten, Merkmalsvektorwerte ungleichartig kategorisierenden und im Speicher gespeicherten Quantisierungsmuster bestimmten Kategoriewert und d) Zugreifen auf eine im Speicher gespeicherte Signalbibliothek mit dem quantisierten Vektor zur Erzeugung eines mit dem empfangenen Signal korrespondierenden Signalidentifikationskodes.

34. Vorrichtung nach Anspruch 33, wobei das vorbestimmte Quantisierungsmuster ein Überlappungsquantisierungsmuster ist.

35. Vorrichtung nach Anspruch 33, wobei der Prozessor mehrere verschiedene vorbestimmte Quantisierungsmuster zur Quantisierung des Merkmalsvektors benutzt.

36. Vorrichtung nach Anspruch 33, wobei der Prozessor b1) zwei verschiedene statistische Momente der mehreren Signalwerte berechnet und b2) den Merkmalsvektor unter Verwendung der zwei berechneten statistischen Momente bildet.

37. Vorrichtung nach Anspruch 36, wobei für jedes der zwei statistischen Momente ein vorbestimmtes Quantisierungsmuster vorgesehen ist.

38. Vorrichtung nach Anspruch 36, wobei die zwei verschiedenen statistischen Momente Asymmetrie und Wölbung aufweisen.

39. Vorrichtung nach Anspruch 33, wobei der Prozessor das empfangene Signal hüllkurvengleichrichtet.

40. Vorrichtung nach Anspruch 33, wobei der Prozessor c1) den Merkmalsvektor durch mehrere quantisierte Vektoren entsprechend wenigstens einem vorbestimmten Quantisierungsmuster mit überlappenden Kategorien ersetzt und c2) die mehreren quantisierten Vektoren quantisiert, um eine weitere Anzahl permutierter quantisierter Vektoren zu erzeugen.

41. Vorrichtung nach Anspruch 40, wobei der Prozessor d1) mit den mehreren permutierten quantisierten Vektoren auf die Signalbibliothek zugreift, um mehrere Speicherstellen zu erreichen, und d2) in jede der Speicherstellen einen mit dem empfangenen Signal korrespondierenden Signalidentifikationskode schreibt.

42. Vorrichtung nach Anspruch 33, wobei der Empfänger a) das Signal spektralanalysiert, um mehrere analysierte Signale mit verschiedenen Frequenzbändern zu gewinnen, und b) Linearkombinationen der analysierten Wellenformen bildet,

und wobei der Prozessor jede Signalkombination zur Erzeugung mehrerer Abtastpunkte für jede Linearkombination abtastet, Asymmetrie- und Wölbungswerte für jede Linearkombination aus den korrespondierenden Abtastpunkten berechnet und den Merkmalsvektor derart bildet, daß er Asymmetrie- und Wölbungswerte aus allen Linearkombinationen enthält.

43. Vorrichtung zum Erzeugen einer zur Identifikation von Rundfunksignalen verwendbaren Signalidentifikationsbibliothek, bestehend aus:

einem Empfänger zum Empfangen mehrerer durch Rundfunk zu sendender Signale,

einem Speicher,

einem Prozessor zum a) Abtasten der durch Rundfunk zu sendenden Signale zur Erzeugung mehrerer analysierter Wellenformen für jedes durch Rundfunk zu sendende Signal, b) Ableiten mehrerer Merkmalsvektoren aus den analysierten Wellenformen und wenigstens eines Merkmalsvektors für jedes abgetastete Signal und c) Quantisieren jedes Merkmalsvektors, mit den Unterschritten:

c1) Herstellen mehrerer Quantisierungspegel,

c2) Verteilen der Quantisierungspegel ungleichartig über einer vorbestimmten statistischen Verteilung,

c3) Ableiten mehrerer Quantisierungsschwellenwerte ent sprechend den verteilen Quantisierungspegeln, und

c4) Ersetzen jedes Wertes jedes Merkmalsvektors durch einen durch die Quantisierungsschwellenwerte bestimmten korrespondierenden Quantisierungswert, wobei

der Prozessor d) einen jeden quantisierten Vektor im Speicher als die Signalidentifikation für das korrespondierende abgetastete Signal darstellenden Wert speichert.

44. Vorrichtung nach Anspruch 43, wobei die Quantisierungspegel überlapptartig verteilt sind, wobei der Prozessor c4a) jeden Wert jedes Merkmalsvektors durch mehrere durch die überlappten Quantisierungspegel bestimmte Quantisierungswerte ersetzt, wobei jeder Merkmalsvektor auf diese Weise durch mehrere quantisierte Vektoren ersetzt wird, und c4b) die mehreren quantisierten Vektoren jedes Merkmalsvektors permutiert, um mehrere permutierte Vektoren zu erzeugen, und wobei der Prozessor d1) im Speicher für jedes abgetastete Signal Werte speichert, die mit den mehreren quantisierten Vektoren korrespondieren.

45. Vorrichtung nach Anspruch 43, wobei der Prozessor b1) für jede analysierte Wellenform zwei statistische Momente berechnet und b2) jeden Merkmalsvektor derart bildet, daß er die zwei berechneten statistischen Momente enthält.

46. Vorrichtung nach einem der Ansprüche 33 bis 42, wobei der Prozessor e) zur Berechnung eines statistischen Moments des Signals gemäß der Formel

wobei N die Zahl der Abtastpunkte,

1 < n < N,

X den Signalwert des Signals an einem Abtastpunkt,

µ ein Mittel des Signalwertes,

eine Standardabweichung des Signalwertes und

k eine ganze Zahl größer als 1 bedeuten,

f) zum Speichern einer mehrere gespeicherte Signalidentifikationen enthaltenden Bibliothek, g) Vergleichen des berechneten statistischen Momentes mit den mehreren gespeicherten Signalidentifikationen in der Bibliothek und h) Erkennen des empfangenen Signals als einem der gespeicherten Signalidentifikationen ähnlich vorgesehen ist.

47. Vorrichtung nach Anspruch 46, wobei die Verarbeitungseinrichtung die Asymmetrie und Wölbung des Signals berechnet und aus der Asymmetrie und Wölbung einen Merkmalsvektor bildet.

48. Vorrichtung nach Anspruch 46, wobei die Verarbeitungseinrichtung

eine Einrichtung zur Bandpaßfilterung des empfangenen Signals zur Erzeugung mehrerer gefilterter Signale,

eine Einrichtung zum Gleichrichten der gefilterten Signale,

eine Einrichtung zum Tiefpaßfiltern der gleichgerichteten Signale und

eine Einrichtung zum Berechnen mehrerer Linearkombinationen der tiefpaßgefilterten Signale

aufweist.

49. Vorrichtung nach Anspruch 48, wobei die Verarbeitungseinrichtung a1) eine erste der Linearkombinationen an mehreren Abtastpunkten abtastet, um eine erste Anzahl Signalwerte zu erzeugen, und a2) eine zweite der Linearkombinationen an mehreren Abtastpunkten abtastet, um eine zweite Anzahl Signalwerte zu erzeugen.

50. Vorrichtung nach Anspruch 49, wobei die Verarbeitungseinrichtung e1) einen ersten Asymmetriewert und einen ersten Wölbungswert aus der ersten Anzahl Signalwerte sowie einen zweiten Asymmetriewert und zweiten Wölbungswert für die zweite Anzahl Signalwerte berechnet und e2) einen den ersten und zweiten Asymmetriewert und ersten und zweiten Wölbungswert aufweisenden Merkmalsvektor ableitet.

51. Vorrichtung nach Anspruch 50, wobei die Verarbeitungseinrichtung g1) den Merkmalsvektor entsprechend einer Anzahl gespeicherter vorbestimmter Quantisierungsmuster quantisiert, um einen quantisierten Vektor zu erzeugen, und 92) mit dem quantisierten Vektor auf die Bibliothek zugreift, um eine mit dem quantisierten Vektor korrespondierende Signalidentifikation zu lokalisieren.

52. Vorrichtung nach Anspruch 51, wobei die Verarbeitungseinrichtung 92) eine gewichtete Summe der Werte des eine nichtdezimale Grundzahl verwendenden quantisierten Vektors bildet, g2b) die gewichtete Summe als eine Adresse zum Zugreifen auf eine in der Bibliothek gespeicherte Zeigertabelle zum Lokalisieren eines mit der gewichteten Summe korrespondierenden Zeigers verwendet und den Zeiger zum Zugreifen auf die Bibliothek zum Lokalisieren einer die mit dem quantisierten Vektor korrespondierende Signalidentifikation enthaltenden Signalidentifikationsliste verwendet.

53. Vorrichtung nach Anspruch 52, wobei die Verarbeitungseinrichtung h1) eine dritte der mehreren Linearkombinationen mit mehreren gespeicherten Signalen korreliert, die mit den in der Signalidentifikationsliste enthaltenen Signalidentifikationen korrespondieren, und h2) ein gespeichertes Signal auswählt, dessen Korrelation mit der dritten Linearkombination einen vorbestimmten Schwellenwert überschreitet.

54. Vorrichtung nach Anspruch 51, wobei die Verarbeitungseinrichtung g1a) jeden Asymmetriewert des Merkmalsvektors entsprechend einem gespeicherten vorbestimmten Asymmetriequantisierungsmuster, in welchem Kategorien ungleichartig verteilt sind, kategorisiert, und d1b) jeden Wölbungswert des Merkmalsvektors entsprechend einem gespeicherten vorbestimmten Wölbungsquantisierungsmuster, in welchem Kategorien ungleichartig verteilt sind, kategorisiert.

55. Vorrichtung nach einem der Ansprüche 43 bis 45, wobei der Prozessor e) zum Berechnen eines statistischen Moments des empfangenen Referenzsignals gemäß der Formel

wobei N die Zahl der Abtastpunkte,

1 < n < N,

X den abgetasteten Signalwert an einem Abtastpunkt,

µ ein Mittel der abgetasteten Signalwerte,

eine Standardabweichung der abgetasteten Signal werte und

k eine ganze Zahl größer als 1 bedeuten,

f) Ableiten eines Merkmalsvektors aus dem berechneten statistischen Moment und g) Speichern des Merkmalsvektors oder einer Darstellung dieses Vektors in dem Speicher vorgesehen ist.

56. Vorrichtung nach Anspruch 55, wobei die Verarbeitungseinrichtung zwei statistische Momente des empfangenen Referenzsignais berechnet und den Merkmalsvektor aus beiden berechneten statistischen Momenten ableitet.

57. Vorrichtung nach Anspruch 55, wobei die Verarbeitungseinrichtung das empfangene Signal bandpaßfiltert, um mehrere gefilterte Signale zu erzeugen, die gefilterten Signale gleichrichtet, die gleichgerichteten Signale tiefpaßfiltert und mehrere Linearkombinationen der tiefpaßgefilterten Signale berechnet.

58. Vorrichtung nach Anspruch 57, wobei die Verarbeitungseinrichtung a1) einen ersten Teil einer der Linearkombinationen an mehreren Abtastpunkten abtastet, um eine erste Anzahl Signalwerte zu erzeugen, und a2) einen zweiten Teil der einen Linearkombination an mehreren Abtastpunkten abtastet, um eine zweite Anzahl Signalwerte zu erzeugen.

59. Vorrichtung nach Anspruch 58, wobei die Verarbeitungseinrichtung e1) die Asymmetrie und Wölbung der ersten Anzahl Signalwerte berechnet, um einen ersten Asymmetriewert und einen ersten Wölbungswert zu erzeugen, und e2) die Asymmetrie und Wölbung der zweiten Anzahl Signalwerte berechnet, um einen zweiten Asymmetriewert und zweiten Wölbungswert zu erzeugen.

60. Vorrichtung nach Anspruch 59, wobei die Verarbeitungseinrichtung f1) einen den ersten Asymmetriewert und ersten Wölbungswert enthaltenden ersten Merkmalsvektor bildet und f2) einen den zweiten Asymmetriewert und zweiten Wölbungswert enthaltenden zweiten Merkmalsvektor bildet.

61. Vorrichtung nach Anspruch 60, wobei die Verarbeitungseinrichtung f3) beide Merkmalsvektoren durch Ersetzen der Asymmetrie- und Wölbungswerte durch ganze Zahlen entsprechend vorbestimmter, in dem Speicher gespeicherter ungleichartiger Quantisierungsmuster quantisiert, um den ersten und zweiten quantisierten Vektor zu erzeugen.

62. Vorrichtung nach Anspruch 61, wobei die Verarbeitungseinrichtung g1) eine gewichtete Summe aus dem eine nichtdezimale Grundzahl verwendenden ersten Vektor berechnet, g2) eine gewichtete Summe aus dem eine nichtdezimale Grundzahl verwendenden zweiten Vektor berechnet, g4) die gewichteten Summen zum Adressieren des Speichers verwendet, und g5) in dem Speicher einen mit dem Referenzsignal korrespondierenden Signalidentifikationskode an einer mit den gewichteten Summen korrespondierenden Adresse speichert.

63. Vorrichtung nach Anspruch 60, wobei die Verabeitungseinrichtung f3) einen ersten und zweiten überlappungsquantisierten Vektor aus dem ersten Merkmalsvektor entsprechend den in dem Speicher gespeicherten vorbestimmten ungleichartigen Überlappungsquantisierungsmustern erzeugt, f4) einen dritten und vierten überlappungsquantisierten Vektor aus dem zweiten Merkmalsvektor entsprechend den in dem Speicher gespeicherten vorbestimmten ungleichartigen Überlappungsquantisierungsmuster erzeugt, f5) eine erste Anzahl Permutationen des ersten und zweiten überlappungsquantisierten Vektors bildet und f6) eine zweite Anzahl Permutationen des dritten und vierten überlappungsquantisierten Vektors bildet.

64. Vorrichtung nach Anspruch 63, wobei die Verarbeitungseinrichtung g1) eine gewichtete Summe der Werte sowohl der ersten als auch zweiten Anzahl Permutationen berechnet, g2) auf den Speicher bei mit den gewichteten Summen korrespondierenden Adressen zugreift und g3) in den Speicher einen das Referenzsignal identifizierenden Signalidentifikationskode bei mit den Adressen korrespondierenden Bereichen speichert.