DE69122017T2 - Verfahren und vorrichtung zur signalerkennung - Google Patents

Verfahren und vorrichtung zur signalerkennung

Info

Publication number
DE69122017T2
DE69122017T2 DE69122017T DE69122017T DE69122017T2 DE 69122017 T2 DE69122017 T2 DE 69122017T2 DE 69122017 T DE69122017 T DE 69122017T DE 69122017 T DE69122017 T DE 69122017T DE 69122017 T2 DE69122017 T2 DE 69122017T2
Authority
DE
Germany
Prior art keywords
signal
feature vector
values
value
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69122017T
Other languages
English (en)
Other versions
DE69122017D1 (de
Inventor
Stephen Kenyon
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BROADCAST DATA SYSTEMS Ltd PAR
Original Assignee
BROADCAST DATA SYSTEMS Ltd PAR
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BROADCAST DATA SYSTEMS Ltd PAR filed Critical BROADCAST DATA SYSTEMS Ltd PAR
Publication of DE69122017D1 publication Critical patent/DE69122017D1/de
Application granted granted Critical
Publication of DE69122017T2 publication Critical patent/DE69122017T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0033Recording/reproducing or transmission of music for electrophonic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/131Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
    • G10H2240/141Library retrieval matching, i.e. any of the steps of matching an inputted segment or phrase with musical database contents, e.g. query by humming, singing or playing; the steps may include, e.g. musical analysis of the input, musical feature extraction, query formulation, or details of the retrieval process

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Analysis (AREA)
  • Complex Calculations (AREA)
  • Geophysics And Detection Of Objects (AREA)
  • Radar Systems Or Details Thereof (AREA)

Description

    HINTERGRUND DER ERFINDUNG
  • Diese Erfindung betrifft eine Vorrichtung und ein Verfahren zur Erkennung von Signalen, insbesondere eine Vorrichtung und ein Verfahren zur Erkennung von Signalen durch Verwendung statistischer Momente abgetasteter Signalwerte zur Erzeugung von Merkmalsvektoren und zur Quantisierung der Merkmalsvektoren zum Vergleichen des Signals mit einer vorbestimmten Signaldatenbank und zum Ableiten der Signaldatenbank.
  • Obgleich die vorliegende Erfindung in Bezug auf ein System zur Erkennung von Rundfunksignalen wie beispielsweise Musik beschrieben wird, ist dies so zu verstehen, daß die Lehren dieser Anmeldung auf ein breites Spektrum von Signalerkennungsgebieten anwendbar sind.
  • Die genaue Erkennung von Rundfunksignalen ist für Marketingleiter, Lizenzsammlungsagenturen, Musikpromotor usw. wichtig. Es ist wohlbekannt, daß eine breite Mannigfaltigkeit an Rechts-, Wirtschafts- und Sozialunternehmer die reguläre Überwachung von Rundfunkinformation benötigen. Alle diese Erfordernisse teilen ein gemeinsames Bedürfnis nach einer gewissen Information, beispielsweise welche Information rundfunkgesendet wird und wann. Bekanntermaßen wurden Rundfunkstationen manuell durch mehrere Hörer überwacht, welche das Rundfunkprogramm wahmehmend überwachten und manuell tabellarisierten, welche Information zu welcher Zeit rundfunkgesendet wurde. Zuverlässigkeits und Kostenprobleme haben die Anstrengungen in Richtung einer Realisierung von automatisierten Rundfunksignalerkennungssystemen angeregt. Ein anfängliches automatisiertes Verfahren umfaßte die Kodierung eines einzigen Stichwortsignals in jedem Lied und dann die Überwachung jeder Rundfunkstation, um das Stichwortsignal zu detektieren. Die zugeordnete Kodierungs- und Dekodierungsschaltung ist jedoch teuer und kompliziert und staatliche Durchführungsämter sind gegen eine Bereitstellung zusätzlicher Bandbreite, die zum Vorsehen einer großen Anzahl einziger Stichwortsignale notwendig ist.
  • Ein weiterer Fortschritt auf dem Gebiet der automatisierten Rundfunksignalerkennung geht aus dem Moon et al. erteilten US-Patent Nr. 3 919 479 hervor. Bei Moon et al. wird ein Audiosignal digital abgetastet, um ein Referenzsignalsegment zu erzeugen, welches in einer Referenzbibliothek gespeichert wird. Wenn dann das Audiosignal rundfunkgesendet wird, werden sukzessive Abschnitte des Signals digitalisiert und mit dem Referenzsegment in der Bibliothek verglichen. Der Vergleich wird in einem Korrelationsprozeß ausgeführt, der ein Korrelationsfunktionssignal erzeugt. Wenn das Referenz- und Rundfunksignalsegment nicht gleich sind, resultiert eine Korrelationsfunktion relativ kleiner Amplitude. Wenn andererseits das Referenz- und Rundfunksignalsegment relativ gleich sind, wird ein großes Korrelationsfunktionssignal erzeugt. Die Amplitude des Korrelationsfunktionssignals wird abgetastet, um ein Erkennungssignal zu erzeugen, wenn die Amplitude einen vorbestimmten Schwellenpegel überschreitet.
  • Das Einzelsegment-Korrelationssystem nach Moon et al. erleidet jedoch einem Signalausfall, der das System gänzlich un brauchbar macht. Auch ist das System nach Moon et al. relativ empfindlich für Zeitachsenvariationen in der Rundfunkinformation selbst. Beispielsweise ist bekannt, daß viele Diskjokkeys Rundfunklieder durch Beschleunigen des Antriebsmechanismus "komprimieren". Es ist auch bekannt, daß andere Diskjokkeys Rundfunkinformation "komprimieren" und/oder "strecken", um gewisse gewünschte Effekte bei der Hörerschaft zu erzeugen. Moon et al. versuchen, solcher Zeitachsenvariationen dadurch Herr zu werden, daß die Bandbreite des Rundfunksignals durch Hüllkurvengleichrichtung des Rundfunksignals reduziert und Hüllkurvensignale mit im wesentlichen niedrigen Signalfrequenzkomponenten, vorzugsweise im Subaudiobereich, bereitgestellt werden. Es wurde entdeckt, daß bei Verwendung des Hüllkurvensignais bei Subaudiofrequenzen während des Korrelationsprozesses die digital abgetasteten Wellenformen weniger empfindlicher für Zeitachsenvariationen sind. Jedoch sind die Verbesserungen, die durch eine solche Lösung erreicht werden können, sehr begrenzt und arbeiten nur bei Rundfunksignalen, die um einen kleinen Betrag "komprimiert" oder "gestreckt" worden sind. Außerdem ist eine solche Lösung hohen Fehlalarmraten unterworfen. Diese Nachteile machen das System nach Moon et al. für ein schnelles, genaues und billiges automatisches Rundfunksignalerkennungssystem weniger als erwünscht.
  • Ein weiterer Fortschritt auf dem Gebiet der automatischen Signalerkennung geht aus dem Kenyon et al. erteilten US-Patent Nr. 4 450 531 hervor. Der gleiche Herr Kenyon ist der einzige Erfinder der vorliegenden Erfindung. Das System des '531- Patents widmet sich erfolgreich den Zuverlässigkeitsproblemen eines Einzelsegmentkorrelationssystems und den Zeitachsenvariationsproblemen, die bei bekannten Systemen in Erfahrung gebracht worden sind. Im '531-Patent wird eine Anzahl Referenzsignalsegmente aus einer Programmeinheit (Lied) extrahiert, digitalisiert, fouriertransformiert und in einer Referenzbibliothek in einem komplexen Frequenzdomänenspektrum gespeichert. Das empfangene Rundfunksignal wird dann vorgefiltert, um einen Frequenzabschnitt des Audiospektrums auszuwählen, der stabile Charakteristiken für eine Unterscheidung aufweist. Nach einer weiteren Filterung und Umwandlung in ein digitales Signal wird das Rundfunksignal fouriertransformiert und einem komplexen Multiplikationsprozeß mit Referenzsignalsegmenten unterworfen, um ein Vektorprodukt zu erhalten. Die Ergebnisse des komplexen Multiplikationsprozesses werden dann einem inversen Fouriertransformationsschritt unterworfen, um eine Korrelationsfunktion zu erhalten, die von der Frequenzin die Zeitdomäne transformiert worden ist. Diese Korrelationsfunktion wird dann normiert und die Korrelationsspitze für jedes Segment ausgewählt und der Spitzenabstand mit der Segmentlänge verglichen. Gleichzeitig wird die RMS-Leistung des mit dem Korrelationsspitzensegment komzidierenden Segments abgetastet, um das Segmentpunktleistungsmuster zu bestimmen. Infolgedessen beseitigt das '531-Patent die Nachteile eines Einzelsegment-Korrelationssystems durch das Vorsehen einer Anzahl Korrelationssegmente und Messen der Abstände zwischen den Korrelationsspitzen. Wo die Abstände passen, wird das Rundfunksignal als ähnlich dem in der Referenzbibliothek gespeicherten Signalsegment erklärt. Außerdem arbeitet der RMS- Wertvergleich so, daß er die unter Verwendung der Signalsegmente ausgeführte Klassifikation bestätigt.
  • Zur Beseitigung des Zeitachsenvariationsproblems verwendet das '531-Patent einen Hüllkurvengleichrichter und ein Bandpaßfilter für die Rundfunkinformation. Das System nach dem '531-Patent ist jedoch rechenerisch sehr anspruchsvoll. Beispielsweise erfordert die Ausführung der verschiedenen Multisegmentkorrelationen einen großen Teil an Computerleistung. Da eine große Zahl an Segmenten abgetastet wird, benötigt das System nach dem '531-Patent einen guten Teil an Zeit und benötigt die Verwendung teuerer leistungsfähiger Computer.
  • Ein automatisiertes Verfahren für Sprachmustererkennung geht aus dem Sakoe erteilten US-Patent Nr. 4 282 403 hervor. Sakoe offenbart ein Spracherkennungssystem, bei welchem eine Zeitfolgeeingabe aus Mustermerkmalsvektoren in eine Referenzbibliothek eingegeben wird. Das empfangene Sprachsignal wird dann einer Spektralanalyse, einer Abtastung und einer Digitalisierung unterworfen, um in eine Zeitfolge von Vektoren transformiert zu werden, welche Merkmale des Sprachtons bei jeweiligen Abtastmomenten darstellen. Für jedes Referenzmuster kann eine Zeitverzerrungsfunktion durch die Verwendung von Merkmalsvektorkomponenten weniger Kanäle verwendet werden. Die Zeitverzerrungsfunktion für jeden Referenzmuster- Merkmalsvektor wird zum Korrelieren des Eingangsmuster- Merkmalsvektors und des Referenzmuster-Merkmalsvektors verwendet. Die Eingangsmuster-Merkmalsvektorfolge wird dann mit der Referenzmuster-Merkmalsvektorfolge in Bezug auf die Zeitverzerrungsfunktion verglichen, um das gesprochene Wort zu identifizieren. Das System nach Sakoe zeitzerrt jedoch die Referenzmuster und nicht das Eingangssignal und folglich muß eine Anzahl Muster für jedes Referenzmuster berechnet werden, wodurch die Speicher- und Rechenanforderungen des Systems erhöht werden.
  • Ein weiteres Signalerkennungssystem geht aus dem an Bunge erteilten US-Patent Nr. 4 432 096 hervor. Bei Bunge werden Tonund/oder Sprachsignale in ein elektrisches Signal umgewandelt und in einer Filterbank in mehrere Spektralkomponenten unterteilt. Diese Komponenten werden dann über eine kurze Zeitperiode integriert, um das Kurzzeitspektrum des Signals zu erzeugen. Die Spektralkomponenten des Signals werden an eine Zahl Musterdetektoren gegeben, welche ein Ausgangssignal nur abgeben, wenn das Kurzzeitspektrum mit dem im relevanten Musterdetektor eingestellten Muster korrespondiert. Jeder Musterdetektor hat zwei Schwellenwertdetektoren, welche ein Signal erzeugen, wenn die angelegte Eingabe zwischen den einstellbaren Schwellenwerten liegt. Infolgedessen liefern die Musterdetektoren ein Ausgangssignal nur, wenn alle Schwellenwertdetektoren aktiviert sind. Für jeden Sprachton ist ein Musterdetektor vorgesehen. Beim Erkennen einer Reihe von Tönen wird die Reihe von Adressen der Musterdetektoren, die erfolgreich ein Ausgangssignal erzeugt haben, gespeichert und danach an den Computer zum Vergleich gegeben. Es ist leicht einzusehen, daß ein derartiges System eine Zahl Musterdetektoren und eine korrespondierende leistungsfähige Berechnungseinrichtung erfordert. Überdies leidet das System nach Bunge, obgleich es eine Filterbank zum Bereitstellen eines niedrigfrequenten Ausgangssignals, das relativ unempfindlich für Zeitachsenvariationen ist, verwendet, noch an Zeitverzerrungsproblemen und einer hohen Fehlalarmrate.
  • Ein neuerdings kommerzialisiertes automatisches Rundfunksignalerkennungssystem geht aus dem an Kenyon et al. erteilten US-Patent Nr. 4 843 562 hervor. Wiederum ist der gleiche Mr. Kenyon der einzige Erfinder der vorliegenden Erfindung. Tatsächlich sind spezielle Lehren aus dem '562-Patent in weiteren Abschnitten des vorliegenden Patents inkorporiert. Das '562-Patent beschreibt ein zweistufiges (grobes und feines) Klassifikationssystem unter Verwendung weniger Prozessorquellen. Gemäß dem '562-Patent wird das Rundfunksignal bandpaßgefiltert, gleichgerichtet und tiefpaßgefiltert, um mehrere Wellenformen niedriger Bandbreite zu erzeugen. Die Wellenformen werden abgetastet und die Samples werden zum Erzeugen eines Spektrogramms verwendet, welches dann mit mehreren Referenzspektrogrammen verglichen wird, die in einer Referenzbibliothek erster Stufe gespeichert sind. Die erststufigen Referenzspektrogramme werden dann in der Ordnung ihrer Ähnlichkeit mit dem erzeugten Spektrogramm aufgereiht. Als nächstes werden mehrere Referenzmuster zweiter Stufe, die mit den aufgereihten erststufigen Referenzspektrogrammen korrespondieren mit einer der analysierten Wellenformen in der vorher hergestellten Reihenfolge korreliert. Für jedes in der Referenzbibliothek zweiter Stufe gespeicherte zweitstufige Referenzmuster wird ein Korrelationswert vorgesehen. Wenn festgestellt wird, daß ein Korrelationswert einen Schwellenwert überschreitet, wird eine Erkennung erklärt und das Rundfunksignal als ähnlich mit dem zweitstufigen Referenzmuster klassifiziert, dessen Korrelationswert den Schwellenwert überschreitet. Die bei der zweitstufigen Klassifikation verwendete analysierte Wellenform ist zeitverzerrt, um Geschwindigkeitsfluktuationen im Rundfunksignal Rechnung zu tragen.
  • Obgleich das System gemäß dem '562-Patent erfolgreich ist, ist es in seiner Fähigkeit der Erkennung einer großen Zahl Lieder etwas beschränkt. Beispielswiese kann das System gemäß dem '562-Patent jedes beliebiges von 600 Liedern auf einem einzelnen Kanal mit hoher Zuverlässigkeit erkennen. Das System kann gleichzeitig 5 verschiedene Kanäle überwachen. Jedoch würde ein System, welches jedes von dreitausend Liedern auf jeder von fünf gleichzeitigen Rundfunkstationen mit hoher Zuverlässigkeit identifizieren kann, ein sehr attraktives und kommerziell erfolgreiches Signalerkennungssystem darstellen. Ferner benötigt das System gemäß dem '562-Patent annähernd 64 Sekunden zum Detektieren und Klassifizieren eines Rundfunkliedes. Es wird gewünscht, diese Zeit auf 28 Sekunden zu reduzieren, um die Identifikation von Aufzeichnungen kürzerer Dauer, beispielsweise Werbung, zu ermöglichen. Bei Erhöhung der Leistungsfähigkeit ist es wichtig, die günstige kompakte Architektur des '562-Patents beizubehalten.
  • Was infolgedessen benötigt wird, ist ein verbessertes System zur genauen Erkennung und Klassifizierung einer großen Zahl einmaliger Rundfunksignale auf mehreren Rundfunkkanälen gleichzeitig und mit hoher Zuverlässigkeit. Das System muß klein, billig und leicht zu betreiben sein.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Erfindung ist zum Beseitigen der Nachteile bekannter automatischer Rundfunksignalerkennungssysteme ausgebildet, während sie gleichzeitig die oben diskutierten Aufgaben löst. Außerdem ist die Erfindung auf einer breiten Mannigfaltigkeit von Signalerkennungsgebieten und nicht gerade zur Erkennung von Runfunksignalen anwendbar.
  • Der Erfinder der vorliegenden Erfindung hat ein verbessertes Verfahren zur Signalerkennung entdeckt, bei welchem ein Signal empfangen und an mehreren Abtastpunkten abgetastet wird, um mehrere Signalwerte zu erzeugen. Ein statistisches Moment der Signalwerte wird dann gemäß der Formel
  • berechnet, wobei N die Zahl der Abtastpunkte
  • 1 < n < N
  • X den Signalwert des Signals an einem Ab tastpunkt,
  • µ ein Mittel der Signalwerte,
  • eine Standardabweichung des Signalwer tes und
  • k eine ganze Zahl < 1 bedeuten.
  • Das berechnete statistische Element wird mit mehreren gespeicherten Signalidentifikationen verglichen und das empfangene Signal wird dann als ähnlich wenigstens einer der gespeicherten Signalidentifikationen erkannt.
  • Vorzugsweise wird das empfangene Signal bandpaßgefiltert, gleichgerichtet und tiefpaßgefiltert, um mehrere Wellenformen niedriger Frequenz zu erzeugen. Dann werden die Wellenformen niedriger Frequenz zu mehreren Linearkombinationen von ihnen kombiniert. Jede Linearkombination wird dann abgetastet, um die mehreren Signalwerte zu erzeugen, die zum Berechnen des statistischen Moments verwendet werden.
  • Vorzugsweise werden zwei statistische Momente (Asymmetrie und Wölbung) für die abgetasteten Werte jeder Linearkombination berechnet. Dann können mehrere Merkmalsvektoren abgeleitet werden, wobei jeder Merkmalsvektor den Asymmetrie- und Wölbungswert für alle Linearkombinationen innerhalb einer vorbestimmten Abtastzeitperiode enthält.
  • Jeder Merkmalsvektor kann dann durch Ersetzen der Gleitkommawerte von Asymmetrie und Wölbung mit einzelnen ganzen Zahlen entsprechend einem vorbestimmten Quantisierungsmuster quantisiert werden. Nach der Quantisierung kann eine gewichtete Summe des quantisierten Vektors unter Verwendung einer nichtdezimalen Grundzahl berechnet werden. Der gewichtete Summenwert kann dann zum Adressieren einer Datenbank verwendet werden, der Signalidentifikationen entsprechend der Adresse speichert.
  • Die vorliegende Erfindung schlägt auch ein System zur Erzeugung der Signaldatenbank vor, auf die zum Erkennen des empfangenen Signals zugegriffen wird. Der Prozeß der Erzeugung der Datenbank ist sehr ähnlich dem Prozeß der Erkennung des obengenannten Signals. Jedoch wird das Ziel- bzw. Sollsignal zuerst zum Bestimmen eines spektral unterschiedenen Abschnitts dieses Signals analysiert. Der spektral unterschiedene Abschnitt des Signals wird dann bandpaßgefiltert, gleichgerichtet und tiefpaßgefiltert, um die Wellenformen niedriger Frequenz zu erzeugen, von denen mehrere Linearkombinationen abgeleitet werden. Die Linearkombinationen des Spektral unterschiedenen Abschnitts werden dann einer modifizierten Abtastprozedur unterworfen, wodurch jede Linearkombination eine Anzahl mal mit einem Bewegungsfenster abgetastet wird. Die abgetasteten Werte werden dann zum Berechnen von Asymmetrie und Wölbung verwendet, so daß mehrere Referenzmerkmalsvektoren für den spektral unterschiedenen Abschnitt des Signals erzeugt werden.
  • Die mehreren Merkmalsvektoren werden quantisiert, um ihre Werte durch Verbreiterung der Abstände zwischen den Vektoren in dem Merkmalshyperraum unterscheidbarer zu machen. Es sind zwei Prozeduren zur Quantisierung möglich. Als erstes kann ein Nichtüberlappungs-Quantisierungsschema angenommen werden, bei welchem die Merkmalsvektor-Signalwertpopulation gerade in mehrere Segmente, beispielsweise 5, unterteilt wird. Dann wird jeder Wert der Asymmetrie oder Wölbung in jedem Merkmalsvektor aufgenommen und einer der fünf Werte ausgezeich net. Infolgedessen wird eine Anzahl quantisierter Vektoren für jedes abgetastete Signal erzeugt. Ebenfalls möglich ist eine Überlappungsmethode der Quantisierung, bei welcher die Signalwertpopoulation der Asymmetrie und Wölbung in eine Anzahl überlappter Bereiche unterteilt wird, wobei ein Asymmetrie- oder Wölbungswert zwei Bereichen zugeordnet sein kann. Jeder Merkmalsvektor wird dann aufgenommen und es werden zwei quantisierte Vektoren erzeugt, da jeder Asymmetrie- oder Wölbungswert zwei Werte annehmen kann. Die zwei quantisierten Merkmalsvektoren werden dann permutiert, um eine weitere Anzahl quantisierter Merkmalsvektoren für die Referenzdatenbank zu erzeugen.
  • Welches Quantisierungsschema auch immer angenommen wird, es wird vorzugsweise eine gewichtete Summe jedes quantisierten Vektors unter Verwendung einer nicht dezimalen Grundzahl erzeugt. Die gewichtete Summe wird dann als eine Adresse zum Zugriff auf eine Datenbank verwendet, in welcher ein Zeiger gespeichert ist, wobei der Zeiger auf eine weitere Datenbankstelle zeigt, bei welcher der Identifikationskode des Sollsignals gespeichert ist.
  • KURZE BESCHREIBUNG DER ZEICHNUNGEN
  • Die vorteilhaften Merkmale und Eigenschaften der vorliegenden Erfindung können leicht aus der folgenden Beschreibung der gegenwärtig bevorzugten exemplarischen Ausführungsform verstanden werden, wenn diese zusammen mit den beigefügten Zeichnungen gelesen wird, in denen:
  • Figur 1 ein das System gemäß der gegenwärtig bevorzugten Ausführungsform zeigendes Blockschaltbild ist,
  • Figur 2 ein das Prinzip der Filterung des empfangenen Signals in vier verschiedene Frequenzbänder zeigendes Blockschaltbild ist,
  • Figur 3 eine Reihe von Wellenformen darstellt, welche die in dem Prozessor nach Figur 1 ausgeführte Wellenformung zeigt,
  • Figur 4 eine Reihe aus Wellenformen ist, welche vier durch den Prozessor erzeugte Merkmalsfolgen zeigt,
  • Figur 5 ein Diagramm ist, welche die Überlappungsabtastung eines spektral unterschiedenen Abschnitts des Signals zur Erzeugung der Referenzbibliotheken zeigt,
  • Figur 6 die durch die in Figur 5 ausgeführte Abtastung erzeugten Merkmalsvektoren darstellt,
  • Figur 7 eine die Zahl unterschiedlicher Identitäten für eine gegebene Zahl von Quantisierungspegeln und einer gegebenen Zahl von Merkmalen zeigenden Vektorquantisierungstabelle ist,
  • Figur 8 die Quantisierung eines Merkmalsvektors zeigt,
  • Figur 9 eine Darstellung des in einem dreidimensionalen Raum aufgezeichneten quantisierten Merkmalsvektors ist,
  • Figur 10 die Populationsdichte von bei einer nicht gleichförmigen Vektorquantisierung ohne Überlappung verwendeten Wölbungswerten darstellt,
  • Figur 11 zeigt, wie die Merkmalsvektorquantitäten quantisierten Werten in der Population nach Figur 10 zugeordnet sind,
  • Figur 12 die Populationsdichte von bei einer nicht gleichförmigen überlappungskodierten Vektorquantisierung verwendeten Wölbungswerten zeigt,
  • Figur 13 zeigt, wie Merkmalsvektorquantitäten quantisierten Werten in der Population nach Figur 12 zugeordnet sind,
  • Figur 14 zeigt, wie der Merkmalsvektor im überlappungskodierten Vektorquantisierungsschema quantisiert ist,
  • Figur 15 zeigt, wie der quantisierte Vektor in eine gewichtete Summe umgewandelt wird, die zum Adressieren einer Datenbank zum Identifizieren eines Signals verwendet wird,
  • Figur 16 ein Spitzenpegel-Flußdiagramm ist, welches ein Verfahren gemäß der bevorzugten Ausführungsform zeigt,
  • Figur 17 ein Flußdiagramm ist, welches zeigt, wie die statistischen Momente berechnet werden, und
  • Figur 18 ein Flußdiagramm ist, welches den Bestätigungsschritt nach Figur 16 zeigt.
  • DETAILLIERTE BESCHREIBUNG DER GEGENWÄRTIG BEVORZUGTEN EXEMPLARISCHEN AUSFÜHRUNGSFORM
  • Obgleich die vorliegende Erfindung bezüglich einer Verbesserung des im '562-Patent beschriebenen Systems ist, erkennt der Fachmann durchschnittlichen Könnens auf diesem Gebiet, daß die Lehren dieser Erfindung bei einer breiten Mannigfaltigkeit von Signalerkennungsgegebenheiten angewendet werden kann. Beispielsweise findet die vorliegende Erfindung Anwendung bei Stimmenverarbeitungssystemen, Spracherkennungssystemen, akustischen Kommunikationssystemen usw..
  • Zunächst wird zum Zweck von Klarstellungen ein Überblick über die Erfindung gegeben. Das '562-Patent beschreibt eine Vorrichtung und ein Verfahren, bei denen Rundfunkinformation un ter Verwendung eines zweistufigen Klassifikationsprozesses erkannt wird. Bei dem ersten Schritt wird das Eingangssignal mit einer Bibliothek erster Stufe verglichen und eine grobe Spektralanalyse ausgeführt. Der erststufige Vergleich erzeugt eine Reihe von Signalidentifikationen aus der erststufigen Referenzbibliothek entsprechend der groben Spektralanalyse. Dann wird in der zweiten Stufe eine feinere Korrelation in der bei der ersten Stufe hergestellten Reihenfolge ausgeführt. Die vorliegende Erfindung schlägt eine Verbesserung beim erststufigen Klassifikationsprozeß derart vor, daß die Erkennungszeit und die Zahl von Eintritten in die erststufige Reihe reduziert wird. Tatsächlich hat die vorliegende Erfindung eine derart hohe Effizienz gezeigt, daß sie ohne die zweite Stufe bei gewissen Sigualerkennungssystemen anwendbar ist.
  • Die erststufige Analyse schirmt das Eingangssignal ab und eliminiert bei der in der zweiten Stufe ausgeführten rechnerisch anspruchsvollen, zeitverzerrten Korrelation eine große Zahl von Kandidatensignalen aus der Betrachtung. Wenn die erststufige Effizienz von 80 % auf 90 % erhöht werden kann, wird die Systemkapazität verdoppelt. Ein Prototyp der vorhe genden Erfindung hat eine Effizienz von über 98 % bei der Ausscheidung von Fehlalarm gezeigt. Infolgedessen kann in dem System gemäß dem '562-Patent eine Verbesserung um einen Faktor 10 erreicht werden.
  • Im '531-Patent ist ein effizientes Signalerkennungssystem offenbart, das ein ausreichendes Zeit-Bandbreite-Produkt aufrecht erhält, um eine genaue Unterscheidung von Signalsignaturen zu ermöglichen, wobei ein Mittel bereitgestellt ist, welches das System unempfindlich für Rundfunkgeschwindig keitsvariationen und Übertragungsabweichungen macht. Diese als segmentierte Korrelation bekannte Technik und die anderen Implementierungsdetails, die im '531-Patent beschrieben sind, stellen ein sehr empfindliches System bereit, welches jedes beliebige von 25 Liedern auf einem einzelnen Kanal mit hoher Zuverlässigkeit erkennen kann. Die vorliegende Erfindung hat als ein Ziel die Fähigkeit, jedes beliebige von sechstausend aufgezeichneten Signalen auf jeden von fünf gleichzeitigen Rundfunkkanälen mit vergleichbarer Zuverlässigkeit zu identifizieren. Eine zusätzliche Systemabstimmung und eine Prototypausbildung sollten die Kapazität auf annähernd zehntausend Lieder pro Kanal erhöhen.
  • Zentral in den durch die Erfindung nach dem '562-Patent verkörperten Konzepten ist eine Technik zur Kompensation von Rundfunkgeschwindigkeitsvariationen, die als lineare Zeitverzerrungskorrelation bekannt ist. Diese Technik ist robuster als das vorhergehende segmentierte Korrelationsverfahren, indem sie eine stärkere Beziehung zwischen Abschnitten des Merkmalsvektors beibehält, die von verschiedenen Abschnitten der Aufzeichnung abgeleitet wurden. Außerdem dient eine hierarchische Erkennungsprozedur zum Multiplizieren der verfügbaren Verarbeitungskapazität durch Abschirmung der Kandidatenerkennungen unter Verwendung eines groben Sortierungsalgorithmus. Diese Technik verbraucht weniger Berechnungsmittel zum Abtasten der ganzen Signaldatenbank unter Ausschluß von Kandidaten, die klar nicht zu den zweitstufigen Erkennungskriterien passen. Diejenigen, die beim erststufigen Prozeß akzeptabel sind (typischerweise 10 bis 20 %) werden durch die rechnerisch intensive lineare Zeitverzerrungskorrelationsprozedur der zweiten Stufe in der in der ersten Stufe hergestellten Ordnung der Wahrscheinlichkeit der Erkennung (Reihe) analysiert. Neben der großen Erhöhung der Systemkapazität reduziert die Erfindung nach dem '562-Patent die Referenzmusterdauer von den bisherigen 64 Sekunden auf 28 Sekunden, um die Identifikation von Signalen kürzerer Dauer, beispielsweise von Werbung, zu ermöglichen.
  • Nun wird der zum gegenwärtig vorgeschlagenen System führende technische Lösungsweg beschrieben. Bei Gegebenheit der oben erwähnten Systemaufgaben zeigen sich zwei Probleme von selbst. Als erstes müssen mehr verschiedene Merkmalsvektoren für die erststufige Analyse bereitgestellt werden und als zweites muß die neue Architektur kompatibel mit der in dem '562-Patent beschriebenen Architektur sein. D.h. der erststufige Klassifikationsprozeß muß den gleichen Satz aus den beim '562-Patent verwendeten vier Hüllkurven gleichgerichteten Frequenzbändern akzeptieren. Das Ausgangssignal des erststufigen Klassifizierers muß eine Liste aus im zweitstufigen Korrelator entwickelten Musternummern sein.
  • Um effektiv zu sein, müssen die erststufigen Algorithmen Geschwindigkeitsvariationen und andere Abweichungen tolerieren, während sie eine hohe Unterscheidung zwischen Mustern bereitstellen. Die Fehlalarmrate muß ohne Verursachung fehlender Detektionen minimiert werden. Tatsächlich muß der erststufige Klassifizierer so voreingestellt sein, daß nur Signaturen, die klar inkorrekt sind, verworfen werden. Dies resultiert üblicherweise in einer Zunahme der Fehlalarmrate. Es ist schwierig, diese beiden Funktionsparameter gleichzeitig zu optimieren.
  • Ein Merkmalsvektor kann zum Definieren eines Merkmalsraums mit einer der Zahl an Merkmalen im Vektor gleichen Zahl Dimensionen zu definieren. Ein solcher Merkmalsraum kann als "Hyperraum" bezeichnet werden. Die Merkmalsvektoren jedes Solisignais werden im Hyperraum entsprechend ihrer berechneten Werte gespeichert. Bei der Erkennung wird der vom empfangenen Signal abgeleitete Merkmalsvektor zum Suchen des Hyperraums zur Entdeckung des Signals oder der Signale verwendet, deren Signaturen in einem besonderen Bereich des Hyperraums gespeichert sind. Der Hyperraum kann mehrere "Cluster" enthaltenf in denen die Merkmalsvektoren einer Anzahl Signale gespeichert werden können. Beispielsweise können ähnliche Signale ähnliche Merkmalsvektoren erzeugen, die in enger Nachbarschaft zueinandner im Hyperraum gespeichert werden. Wenn der Zwischenraum zwischen solchen Signalclustern im Hyperraum relativ zur Größe der Cluster groß ist, ist es möglich, einen Unsicherheitsbereich um jeden Merkmalsvektor im Hyperraum vorzusehen, der eine minimale Überlappung anderer Bereiche im Hyperraum aufweist. Ein Verfahren zur Ausführung dieser verstärkten Trennung liegt darin, die Dimensionalität des Merkmalshyperraums zu erhöhen. Der Wert jedes Merkmals wird als Koordinate im Hyperraum behandelt. Wenn beispielsweise und wie in Figur 9 gezeigt drei Merkmale verwendet werden, bilden sie einen Merkmalsvektor, der eine Position im dreidimensionalen Raum spezifiziert. Wenn der Merkmalsvektor dann quantisiert wird (einer auf dem detektierten Merkmalswert basierenden besonderen Kategorie zugeordnet), kann jede Komponente einen von einer Anzahl diskreter Werte, beispielsweise 5, annehmen. Dann enthält der Raum 125 diskrete Stellen. Wenn jeder Stelle ein Signalidentifikationskode zugeordnet wird, ist es möglich, die gleichen Merkmale aus einem empfangenen Signal zu extrahieren und quantisieren, der Merkmalsvektor kann auf die gleiche Stelle im dreidimensionalen Raum abgebildet werden, und der betreffende bzw. geeignete Signalidentifizierer kann wiedergewonnen werden. Dies ermöglicht einen eindeutigen Zugriff auf 125 Signale, wenn ihre Merkmalsvektorwerte nach der Quantisierung eindeutig sind. Leider sind die gemessenen Merkmale nicht eindeutig. Mehrere verschiedene Signale können den gleichen Merkmalsvektor erzeugen. Dies kann durch Zuordnung einer Liste von Wahrscheinlichkeiten zu jeder Stelle im Hyperraum behandelt werden. Die Figur 9 zeigt ein Beispiel eines dreidimensionalen Hyperraums, bei welchem jedes der drei Merkmale fünf Werte annehmen kann. Ein "Cluster" 40 ist darin bei der Stelle S(4-3) = 3, S(2-1) = 2, S(3-2) = 0 zentriert dargestellt.
  • Ein zweites Problem liegt darin, daß ein zu erkennendes Signal oder Muster aufgrund einer Zeitkompression oder anderen Übertragungsabweichungen nicht den geeigneten Vektor erzeugen kann. Infolgedessen muß die Variabilität der Merkmale studiert und bestimmt werden, wie die resultierenden Merkmalsvektoren verschiedene Bereiche im Hyperraum spezifizieren. Die Suche nach unterschiedlichen Merkmalen basiert auf dem Kriterium, daß sie unter dem Einfluß erwarteter Abweichungen stabil sind und daß sie unterscheidbar sind. Wenn anzunehmen ist, daß die individuellen Merkmale, aus denen der Merkmalsvektor besteht, unabhängig sind, kann durch Erhöhung der Zahl an Merkmalen die Trennung zwischen Clustern im Hyperraum ohne Erhöhung der Clustergröße dramatisch erhöht werden. Um in den quantisierten-Merkmalen Variationen zu ermöglichen und um das Erfordernis einer Zeitausrichtung zu reduzieren, können bei verschiedenen Zeitverschiebungen mehrfache Merkmalsvektoren erzeugt werden, durch welche jedes Signal einen Bereich des Hyperraums, den es einnimmt, überstreichen kann. Die Suche nach solchen unterscheidbaren zeitinvarianten Merkmalsvektoren wird unten beschrieben.
  • Einer der wichtigsten Aspekte jedes Mustererkennungssystems ist die Identifikation, Erzeugung und Auswahl von Merkmalen, die stabil sind, wenn eine besondere Signatur vorhanden ist, jedoch verschiedene Anzeigen bereitstellen, wenn die Signatur nicht vorhanden ist. Bei der Entwicklung dieser Erfindung wurden Audiosignale von Aufzeichnungen, Bändern und Airplay mit einer Rate von 2500 Samples pro Sekunde digitalisiert, nachdem sie mit einer Grenzfrequenz von 1,0 kHz tiefpaßgefiltert wurden. Es hat sich gezeigt, daß die Frequenzen unter 1 kHz durch die von Rundfunksendern verwendeten spektralen Modifikationen relativ unbeeinflußt bleiben. Annähernd 65 Sekunden Audio aus diesen Signalen wurden von 75 Liedern digitalisiert und als eine experimentelle Datenbank gespeichert. Jede dieser Dateien wurde dann durch eine Softwaresimulation des Prozessors am vorderen Ende verarbeitet, der die Hüllkurven von vier Frequenzbändern bildet. Die Ausgabe aus dem Simulator war ein Satz gemultiplexter Gleitkommadateien, die auf einem Graphikendgerät aufgezeichnet oder von einem Programm verarbeitet werden können, um Charakteristiken der Daten zu bestimmen, die zur Bildung guter Merkmale für die Merkmalsvektoren ausgewertet werden können. Ein Spektralanalyseprogramm berechnete das Leistungssprektrum, das logarithmische Leistungsspektrum, das Cepstrum bzw. die Silbenvertauschung des Spektrums und die Autokorrelationsfunktionen jedes Frequenzbandes. Das Leistungsspektrum und logarithmische Leistungsspektrum sind Funktionen der Frequenzdomäne, während das Cepstrum und die Autokorrelationsfunktionen Funktionen der Zeitdomäne sind. Als nächstes wurde ein statistisches Programm zum Berechnen statistischer Momente der Signalwerte der vier Bänder des empfangenen Signals verwendet. Solche statistischen Momente umfassen das Mittel bzw. den Mittelwert, Varianz, Asymmetrie und Wölbung. Außerdem wurde die kovariante Matrix der vier Bänder berechnet.
  • Beim Prüfen der Leistungsspektren und der logarithmischen Leistungsspektren wurde entdeckt, daß, oblgeich verschiedene Lieder spektrale Spitzen bei verschiedenen Frequenzen hatten, es nicht klar war, wie eine kleine Zahl spektraler Komponenten, die zwischen den verschiedenen Liedern zuverlässig unterscheiden können, auszuwählen sind. Dies gilt sowohl für die linearen als auch logarithmischen Leistungsspektren. Jedoch liefert die Berechnung der Signalbandbreite jedes Bandes einen Satz aus vier Zahlen, die bezüglich Geschwindigkeitsvariatonen stabil sein sollten. Diese Merkmale wurden unter Verwendung von acht verschiedenen Zeitverzögerungen entwikkelt.
  • Beim Prüfen der Autokorrelationsfunktionen wurde entdeckt, daß die einzigen stabilen Merkmale, die abgeleitet werden konnten, eng auf die früher diskutierten Bandbreitenmessungen bezogen waren. Dies ist zu erwarten, da das Leistungsspektrum und die Autokorrelationsfunktion ein Fouriertransformationspaar sind. Aus der Autokorrelationsfunktion abgeleitete Merkmale wurden deshalb so betrachtet, daß sie redundant sind, und wurden zugunsten der vom Leistungsspektrum abgeleiteten beiseite gelegt. Das Cepstrum wurde geprüft und gefunden, daß es keine brauchbaren stabilen Merkmale aufweist. Dies deshalb, weil das Cepstrum das Vorhandensein harmonisch bezogener Signalstrukturen zur Bestimmung der Periode der zusammengesetzten Wellenform ausnutzt. Es wurde gefunden, daß diese harmonischen Strukturen nicht in den Hüllkurven des bandpaßgefilterten Audios vorhanden sind.
  • Bei der Untersuchung des Verhaltens der durch das Statistikprogramm erzeugten Merkmale wurde entdeckt, daß Asymmetrie- und Wölbungswerte zwischen Liedern unterscheidbar und relativ stabil waren, wenn sie in Zeitverschiebungen in den Liedern berechnet wurden. Es gibt zwei andere Charakteristiken dieser Merkmale, die als attraktiv befunden wurden. Als erstes sind sowohl Asymmetrie als auch Wölbung selbstnormierend, d.h., ihr Wert ist unabhängig von der Lautstärke. Zweitens sind ihre Werte virtuell unbeeinflußt von Geschwindigkeitsvariationen bei der Aufzeichnung. Dies deshalb, weil ihre Berechnung nicht explizit die Zeit oder Frequenz verwendet. Dies wurde als ganz wichtig angesehen, da ein beträchtlicher Aufwand darauf gerichtet wurde, das ganze System immun gegen Geschwindigkeitsvariationen zu machen, die durch Rundfunksender induziert werden. Es wurde entdeckt, daß einige Lieder signifikant verschiedene Werte von Asymmetrie und Wölbung bei verschiedenen Zeitverschiebungen bzw.-versetzungen erzeugten. Dies trat auf, wenn die Zeitverschiebungen das Fenster der Analyse in Bereiche eines Lieds bewegten, bei denen der ganze Charakter des Lieds anders war. Es wird angenommen, daß dies ein generelles Problem ist, welches jeden Satz gewählter Merkmale beeinflußt und deshalb beim Erkennungsalgorithmus anstelle der Auswahl zu verwendender Merkmale behandelt werden muß.
  • Schließlich entdeckte der Erfinder der vorliegenden Erfindung, daß die Eigenschaften von Asymmetrie und Wölbung gut zum effektiven und zuverlässigen Kategorisieren von Rundfunksignalen geeignet sind. Bandbreitenabschätzungen arbeiteten ebenfalls gut, waren jedoch weniger immun gegen die Effekte von Zeitverschiebungen. Da der Erkennungsalgorithmus direkt damit umgeht, kann sich die Hüllkurvenbandbreite noch als ein geeignetes Unterscheidungsmerkmal erweisen. Es sei darauf hingewiesen, daß jedes der diskutierten Merkmale für alle vier Frequenzbänder berechnet wurde. Deshalb wurde eine Gesamtheit von zwölf Merkmalen darauf angesehen, ob sie hinsichtlich ihrer Unterscheidungsfähigkeiten, vier sowohl für Asymmetrie als auch Wölbung und Hüllkurvenbandbreite, qualifiziert sind. Wenn alle zwölf Merkmale verwendet werden, wird ein zwölfdimensionaler Merkmalshyperraum erzeugt. Dies ist vom Standpunkt des erforderlichen Speichers und der Zahl an Merkmalen, die berechnet werden müssen, wahrscheinlich inakzeptabel. Deshalb wurde hinsichtlich der vorliegenden Ausführungsform entschieden, nur die Asymmetrie- und Wölbungswerte zu verwenden, so daß insgesamt acht Merkmale erzeugt werden. Dies kann im Hinblick auf den erforderlichen Speicher immer noch inakzeptabel sein. Deshalb wurden die vier Frequenzbänder zu drei Wellenformen linear kombiniert und auf diese Weise Asymmetrie- und Wölbungswerte für jede der drei Wellenformen bereitgestellt, wodurch ein sechsdimensionaler Merkmalshyperraum erzeugt wird. Eine Bestätigung dieser Wahl wird in Bezug auf die unten beschriebenen Vektorquantisierungsverfahren detaillierter beschrieben.
  • Vektorquantisierung ist im Prinzip ein einfaches Konzept. Es umfaßt die Reduzierung der Auflösung jeder Vektorkomponente von ihrem kontinuierlichen Wertebereich in einen mit einer kleinen Zahl Werte, beispielsweise die Reduzierung einer Anzahl mehrstelliger Werte in eine Anzahl einstelliger Werte (siehe Figur 8). Beispielsweise könnte der Merkmalswertebereich einfach in mehrere Bänder gleicher Breite unterteilt werden. Das Merkmal wird dann durch Ersetzen seines mehrstelligen Wertes durch seine Bandnummer kodiert oder quantisiert. Es gibt zwei primäre Probleme bei diesem Verfahren. Als erstes können Werte, die in die Nähe der Grenze zwischen zwei Bändern fallen, aufgrund von Beschränkungen durch Rauschen, Verzerrung oder Berechnungsgenauigkeit falsch quantisiert werden. Zweitens ist es nicht wahrscheinlich, daß die Merkmaiswerte gleichförmig über den ganzen Bereich verteilt sind. Dies würde zu einer starken Konzentration in gewissen Bändern führen, welche den Informationsgehalt des quantisierten Merkmais reduziert. In dem einschränkenden Fall, daß alle Werte in das gleiche Band fallen, würde das Merkmal keinerlei Information enthalten. Dies wird durch Verwendung einer nicht gleichförmigen Breite der Bänder (beispielsweise Figur 10) und eines überlappenden Quantisierungsprozesses zur Kodierung von Referenzmerkmalsvektoren für die Referenzbibliothek (beispielsweise Figur 12) behandelt.
  • Als erstes ist es notwendig, die Zahl an Quantisierungspegeln und die Zahl der beim Merkmalsvektor verwendeten Merkmale zu betrachten. Diese spezifizierende Dimensionalität und die Dichte des Merkmalhyperraums. In der Figur 7 sind die Zahl diskreter Stellen im Hyperraum als eine Funktion der Zahl an benutzten Merkmalen und der Zahl Pegel, auf die sie quantisiert sind, aufgelistet. Es sei darauf hingewiesen, daß bei allen Fällen, bei denen die Zahl Pegel größer als drei ist, mehr durch die Erhöhung der Zahl an Merkmalen als durch Erhöhung der Zahl an Quantisierungspegeln erreicht wird. Es ist günstig, innerhalb der Grenzen eines Speichers den größtmöglichen Merkmalhyperraum zu verwenden. Dadurch können die durch die Merkmalsvektoren dargestellten Signale über ein großes Volumen mit dem Ergebnis verstreut werden, daß beim zweitstufigen Korrelator weniger Signaturen entwickelt werden müssen. Bei der bevorzugten Ausführungsform hat der Erfinder fünf Quantisierungspegel und sechs Merkmale als vernünftigen Kompromiß gewählt. Dies stellt einen Hyperraum mit 15.625 diskreten Stellen bereit.
  • Es wurden zwei Vektorquantisierungsalgorithmen entwickelt. Der erste unterteilt jeden Vektor gemäß seiner statistischen Verteilung derart, daß jeder Bereich die gleiche Zahl Eingänge aufweist (siehe beispielsweise Figuren 10 und 11). Der zweite führt einen ähnlichen Prozeß aus, gibt jedoch zwei quantisierte Merkmalsvektoren zurück (siehe beispielsweise Figuren 12, 13 und 14). Die zwei Vektoren stellen den wahrscheinlichsten Bereich und den nächsten Nachbarn dar. Unter Verwendung einer Abtastsignalbibliothek werden von den Asymmetrie-, Wölbungs- und Bandbreitenwerten Histogramme erzeugt. Die Histogramme für die Wölbung werden unten in Bezug auf den Überlappungs- und Nichtüberlappungs-Vektorquantisierungsalgorithmus beschrieben.
  • Die Figur 12 stellt die überlappungskodierte Vektorquantisierung eines Wölbungsmerkmals dar. Es sei darauf hingewiesen, daß die Wölbungswertpopulation zuerst derart unterteilt wird, daß jeder Bereich ein Drittel der Gesamtzahl an Samples enthält. Zum Trennen von Bereichen 1, 3 und 5 werden Schwellen B und D verwendet. Zwei zusätzliche Bereiche sind so aufgebaut, daß sie ebenfalls jeweils ein Drittel der Punkte enthalten. Diese sind auf die Schwellen B und D zentriert, wobei ein Sechstel der Gesamtheit der Punkte darüber und darunter liegt. Bereiche 2 und 4 sind durch Schwellen A, C und E begrenzt. Wie in Figur 13 angedeutet, befinden sich Merkmalswerte, die kleiner als die Schwelle A sind, klar im Bereich 1 und werden mit (0,0) kodiert. Merkmalswerte, die zwischen die Schwellen A und B fallen, können zum Bereich 1 oder 2 gehören und werden mit (0,1) kodiert. Diejenigen, die zwischen die Schwellen B und C fallen, können zum Bereich 2 oder 3 gehören und werden mit (1,2) kodiert. Werte zwischen C und D fallen in die Bereiche 3 oder 4 und werden mit (2,3) kodiert. Werte zwischen D und E können zum Bereich 4 oder 5 gehören und werden mit (3,4) kodiert. Wenn schließlich ein Wert größer als die Schwelle E ist, befindet sie sich klar im Bereich 5 und wird mit (4,4) kodiert. Da jeder Vektor sechs Merkmale ver wendet, erzeugt die Ausgabe des Überlappungsvektorquantisierungsprozesses ein Paar aus sechs Elementvektoren, wie es in Figur 14 dargestellt ist. Durch Permutierung der Elemente dieser zwei Vektoren können bis zu 64 neue Vektoren gebildet werden, welche Stellen im Hyperraum spezifizieren, bei denen das Signal gespeichert werden kann. Jedoch werden jedesmal, wenn ein Kode (0,0) oder (4,4) erzeugt wird, doppelte Vektoren erzeugt. Bei der in vorläufigen Untersuchungen verwendeten Abtastbibliothek wurde beobachtet, daß ein Mittel von 21,4 unterschiedlicher Vektoren durch Permutierung von Elementen überlappter quantisierter Vektoren A und B erzeugt wird. Diese unterschiedlichen Vektoren werden als der Speicher "Nachbarschaft" eines Lieds im Hyperraum bezeichnet.
  • Eine Alternative zum überlappten Quantisierungsalgorithmus ist der nichtüberlappte Quantisierungsalgorithmus, der in den Figuren 10 und 11 gezeigt ist. Die Figuren 10 und 11 zeigen ein Histogramm von aus der Abtastbibliothek erzeugten Wölbungswerten. Gemäß dem Nichtüberlappungs-Vektorquantisierungsalgorithmus werden Quantisierungsschwellen durch Sortieren aller Merkmalswerte in absteigender Ordnung und dann durch Unterteilung dieser Liste in fünf Bereiche gleicher Größe abgeleitet. Die an den Grenzen befindlichen Datenwerte werden als Schwellen ausgewählt. Dies stellt sicher, daß jeder Bereich die gleiche Zahl an Samples enthält und der resultierende Hyperraum gleichmäßig gefüllt ist. Merkmalsvektorwerte, die in einen der Bereiche 1, 2, 3, 4 oder 5 fallen, werden, wie in Figur 11 gezeigt, einfach mit dem Wert kodiert. Dieser Prozeß kann bei der Erzeugung des Hyperraums im Speicher ausgeführt werden, obgleich der überlappungsquantisierte Vektoralgorithmus bevorzugt wird. Jedoch wird der Nichtüberlappungs-Quantisierungsalgorithmus während des Prozesses der Erkennung des unten beschriebenen empfangenen Signals verwendet.
  • Der in Bezug auf den technischen Lösungsweg zu beschreibende Endprozeß ist, wie die quantisierten Vektoren dann benutzt werden, um entweder Information in eine Signalidentifikationen enthaltende Datenbank einzuschreiben oder zu entnehmen. Der Erfinder der vorliegenden Erfindung hat zwei Verfahren zum Speichern und Wiedergewinnen von Information untersucht, die bei der Erkennung von Signalmustern anwendbar sind. Das erste umfaßt die Speicherung aller Variationen des erwarteten Musters im Hyperraum. Dies ist einfach eine Sache der Zuordnung des Liedidentifikationskodes zu jeder durch die Permutation der zwei vom überlappten Vektorquantisierungsprozeß zurückgekehrten Vektoren beschriebenen Stelle. Der Zugriff um faßt die Berechnung einer einzelnen Stelle, die eine Liste von Mustern enthält, welche die Suchkritierien erfüllen. Dies ist vom Standpunkt der Realzeiterkennung das effektivste, erfordert jedoch die Speicherung des Identifikationskodes an vielen Stellen im Merkmalshyperraum. Ein alternatives Verfahren ist das Speichern jedes Musters nur einmal im Raum.
  • Wenn auf den Raum zugegriffen wird, um eine Liste von Liedkandidaten zu finden, müssen alle im überlappten Quantisierungsprozeß beobachteten Variationen gesucht werden. Die bei jeder Stelle gefundenen Listen müssen dann vereinigt werden. Obgleich dieses zweite Verfahren Speicher spart, verlangsamt es den Erkennungsprozeß. Es ist auch ein "Band- und Aufhänger"-Prozeß möglich, der alle erwarteten Variationen der Merkmale speichert und dann den Bereich nach Verzerrungen absucht. Obgleich dieses Verfahren das wahrscheinlich robusteste ist, büßt es sowohl Zeit als auch Speicher ein. Das erste Verfahren wurde zur Weiterverfolgung ausgewählt, da eine Realzeitdurchführung wichtig ist und nicht angenommen wird, daß die Grenzen des Speichers überschritten oder erweitert werden.
  • Es gibt viele Verfahren zur Abbildung der Signalidentifikationen in den Speicher und nachfolgenden Wiederauffindung der Identifikationen entsprechend einem empfangenen Signal. Die derzeit bevorzugte Ausführungsform verwendet einen möglichen Lösungsweg, obgleich die Erfindung so ausgebildet ist, daß sie alle naheliegenden Äquivalente abdeckt. Gemäß den oben beschriebenen Parametern gibt es 15.625 diskrete Stellen im Vektorhyperraum. Deshalb wurde eine Tabelle aus Zeigern konstruiert, die auf Listen zeigen, welche Identifikationskodes von möglicherweise vergleichbaren Mustern enthalten. Jede Liste hat eine variable Länge, die erneuert wird, wenn Signale hinzugefügt oder entfernt werden. Die Figur 15 stellt dieses Zugriffsverfahren dar. Wenn ein Signal zur Datenbank zu addieren ist, werden alle Permutationen der vom überlappten Quantisierungsprozeß abgeleiteten beiden Vektoren berechnet. Eine Position auf der Liste wird dann als gewichtete Summe der Vektorkomponenten unter Verwendung einer nichtdezimalen Basis, beispielsweise 5, berechnet. Jede Position dieser Tabelle kann auf eine leere Liste oder auf die Stelle einer Liste zeigen, welche die Identifikationskodes eines Signals enthalten, das auf diese Stelle im Hyperraum abbildet. Diese Listen werden dynamisch erzeugt und modifiziert. Der erste Zugang in die Signalliste zeigt die Zahl der folgenden Identifikationskodes an. Der Rest der Liste enthält die Identifikationskodes. Eine Hinzufügung einer Signalidentifikation zur Liste umfaßt eine Prüfung, um zu sehen, ob die Liste existiert. Wenn nicht, muß sie erzeugt werden. Die Signalidentifikation wird dann addiert und die Listengröße auf 1 gesetzt. Wenn die Liste bereits existiert, wird geprüft, um zu sehen, ob die Signalidentifikation schon in der Liste ist. Wenn sie schon in der Liste ist, wird die Tabelle einfach verlassen, wenn nicht, wird die Liste um 1 erweitert und ein neuer Identifikationskode angefügt. Der erste Zugang in die Signalliste wird ebenfalls erneuert um anzuzeigen, daß ein zusätzlicher Signalidentifikationskode addiert worden ist. Die Entfernung eines Signalidentifikationskodes ist ein ähnlicher Prozeß.
  • Die Durchführung dieses Lösungswegs bzw. Verfahrens hängt von der Stabilität der gewählten statistischen Merkmale ab. Es wurden Momente gewählt, da sie von Geschwindigkeitsvariationen unbeeinflußt sind. Wenn jedoch Zeitverschiebungen involviert werden, ist es gut möglich, daß Segmente des Liedes andere Eigenschaften zeigen, die in einem anderen Bereich des Hyperraums Platz nehmen. Das hat Fehldetektionen zur Folge. Dies wurde durch Abschätzung der Merkmalsstabilität bei mehreren Zeitverzögerungen untersucht und die meisten wurden als stabil befunden. Einige änderten sich jedoch mit der Zeitverzögerung signifikant. Um dem zu begegnen, wurden Statistiken über einem Satz von vierzehn Sekundenintervallen innerhalb der vom Korrelator benutzten 28 Sekunden berechnet. Bei jeder Verschiebung wird ein Satz überlappter Stellen im Hyperraum berechnet und der Lied-ID-Kode wird zur korrespondierenden Liste addiert. Wenn das Lied stabil ist, werden keine Einbzw. Zugänge erzeugt. Wenn sich jedoch die Statistiken mit der Zeitverzögerung ändern, wird das Lied allen Bereichen hinzugefugt, in denen es möglicherweise als existent gefunden wird.
  • Dies beendet eine Diskussion des technischen Lösungswegs und den Überblick über die vorliegende Erfindung. Die Figur r1 zeigt ein Blockschaltbild einer Vorrichtung gemäß der vorliegenden Erfindung und Figur 16 zeigt ein Spitzenpegel Flußdiagramm für das Verfahren gemäß der vorliegenden Erfindung. Bei der vorliegenden Erfindung ermöglicht die Verarbeitungsstruktur nach Figur 1 eine gleichzeitige Verarbeitung von bis zu fünf Audiokanälen. Deshalb können bis zu fünf Rundfunkstationen überwacht und deren Rundfunkprogramme klassifiziert werden. Es können zusätzliche Hardware- und Software-Modifikationen zur Erhöhung oder Erniedrigung der Zahl an gleichzeitig überwachten Kanälen ausgeführt werden.
  • Eine Antenne 2 empfängt Audiosignale tragende Radiowellen. Die Antennenvorrichtung kann bis zu fünf Radiokanäle gleichzeitig empfangen. Das Audiosignal wird vom Audiokanalempfänger 4 empfangen und zum Audiovorprozessor 6 gegeben. Der Audiovorprozessor 6 umfaßt Filterbänke 8, Hüllkurvengleichrichter 10 und Tiefpaßfilter 12, wie sie in Figur 2 gezeigt sind. Alternativ dazu kann der Audiovorprozessor 6 digital in den Prozessor 24 aufgenommen sein.
  • Die Figur 1 zeigt auch einen Analog-Digital-Wandler 14, der zum Digitalisieren des Audiosignals benutzt werden kann. Ein Multiplexer 16 wird zum Ausführen der Multiplexoperationen verwendet, wenn mehrere Audiokanäle gleichzeitig überwacht werden. Sowohl der A/D-Wandler 14 als auch der Multiplexer 16 sind an einen Bus 100 gekoppelt. An den Bus 100 ist auch ein Arrray-Prozessor 18 gekoppelt. Im Array-Prozessor 18 werden Merkmalsvektoroperationen ausgeführt, welche die Zeitverzerrung der zweitstufigen Merkmalsfolge und die zweitstufigen Korrelationsberechnungen enthalten.
  • An den Bus 100 ist auch ein Prozessor 24 gekoppelt, welcher die Funktionen der Steuerung, der Datenbankverwaltung und der Verwaltung aller Eingänge/Ausgänge (I/A) der erststufigen Klassifikationsberechnungen ausführt. Der Prozessor 24 kann einen Mikroprozessor 26, einen Speicher 28, I/A- Schnittstellen 30 oder einen Realzeittaktgeber 33, einen Referenzmusterspeicher 34 und einen Offline-Speicher 36 aufweisen. Vorzugsweise ist der Mikroprozessor 26 ein Mikroprozessor der Serie Motorola 68020. Vorzugsweise umfaßt der Arbeitsspeicher 28 wenigstens 8 MBytes an Speicher. Ähnlich speichert der Musterspeicher 34 sowohl die erststufige als auch zweitstufige Referenzbibliothek und ist vorzugsweise als Festplatte mit wenigstens 140 MByte realisiert. Der Offline- Speicher 36 kann zum Ändern und/oder Addieren und/oder Entfernen von Referenzmustern der Referenzmusterbibliotheken im Speicher 34 verwendet werden. Vorzugsweise weist der Offline- Speicher 36 eine Bandkassette auf.
  • Das Verarbeitungssystem kann schließlich mit Periphergeräten, wie beispielsweise eine Kathodenstrahlröhrer (CRT) 38, einem Drucker oder Modem 40 und einem Endgerät 42 gekoppelt sein. Solche Periphergeräte werden durch die I/A-Schnittstellen 30 an das System gekoppelt.
  • Anhand der Figur 2 wird eine grobe Spektralanalyse beschrieben. Das empfangene Audiosignal wird an den Audiovorprozessor 6 gegeben, in welchem es in mehrere Kanäle unterteilt wird. Bei der derzeit bevorzugten Ausführungsform sind vier Kanäle gewählt worden. Es können jedoch in Abhängigkeit von dem exakten Typ des zu klassifizierenden Signals mehr oder weniger Kanäle verwendet werden. Jeder Kanal weist ein Bandpaßfilter 8 auf, wobei jedes Filter einen anderen Wert hat. Jeder Kanal weist auch einen Gleichrichter 10 und ein Tiefpaßfilter 12 auf. Zweck des Audiovorprozessors ist es, die Menge an in der ersten Stufe verarbeiteten Information zu reduzieren. Dies liefert eine Langterm-Mittelwertbildung der erststufigen Merkmale. Da es Zweck der ersten Stufe ist, die zur Erkennung erforderlichen Berechnungen zu reduzieren, ist es günstig, die Menge an pro Zeiteinheit verarbeiteter Information zu reduzieren. Die Signalunterscheidungsgenauigkeit ist proportional zum Zeit-Bandbreite-Produkt des Merkmalsvektors. Deshalb wird durch Reduzierung der Bandbreite des Merkmalsvektors unter gleichzeitiger Ausdehnung der Dauer die Genauigkeit aufrechterhalten, während die erforderliche Verarbeitung pro Zeiteinheit erniedrigt ist. Dies gilt für jeden Prozeß, der eine kontinuierliche Suche nach Zeitreihenereignissen benötigt.
  • Um dies auszuführen, wird das in Figur 3 gezeigte Audioeingangssignal an jedes der Bandpaßfilter 8 gegeben. Jedes Bandpaßfilter gibt ein gefiltertes Signal aus, beispielsweise das in Figur 3 gezeigte. Die gefilterten Signale werden an die Gleichrichter 10 gegeben, deren jeder eine in Figur 3 gezeigte Wellenform ausgibt. Schließlich werden die gleichgerichteten Signale an Tiefpaßfilter 12 gegeben, deren jedes ein tiefpaßgefiltertes Signal ausgibt, wie es in Figur 3 gezeigt ist. Durch Abtasten des Signals reduzierter Bandbreite bleibt die Verarbeitungszeit erhalten, während gleichzeitig die Empfindlichkeit des Systems auf Geschwindigkeitsvariationen im Audiosignal reduziert wird. Deshalb werden von den Tiefpaßfiltern 12 mehrere Wellenformen bereitgestellt, wie sie in Figur 4 gezeigt sind. Diese Wellenformen sind mit X&sub1;(t), X&sub2;(t), X&sub3;(t) bzw. X&sub4;(t) bezeichnet. Jede dieser Wellenformen wird an den Prozessor 24 gegeben, der die Merkmalsfolgen den Wellenformen entsprechend erzeugt.
  • Der Prozessor 24 stellt infolgedessen eine Anzahl Merkmalsfolgen bereit, die mit Xs&sub1;(t), Xs&sub2;(t), Xs&sub3;(t) bzw. Xc(t) bezeichnet sind (siehe Figur 2). Jede dieser Merkmalsfolgen ist als eine Linearkombination der Wellenformen X&sub1;(t) bis X&sub4;(t) gebildet. Bei der vorliegenden Erfindung ist die Linearkombination nichts anderes als eine Differenz zwischen zwei Bändem. Beispielsweise ist das Signal XS1(t) die Linearkombination X&sub4;(t)-X&sub3;(t) (im folgenden als "Band (4-3)" bezeichnet. Ähnlich werden Signale für Band (3-2) und Band (2-1) im Prozessor 24 erzeugt. Dieser Schritt ist in der Figur 16 beim Schritt S110 gezeigt.
  • Bei manchen Implementierungen ist es jedoch günstig, Folgen zu bilden, die Linearkombinationen der vier Eingangswellenformen sind und gewisse spezielle Charakteristiken wie beispielsweise Orthogonalität aufweisen. Eine zusätzliche Verarbeitung kann an dieser Stelle zum Kompensieren von durch die Rundfunksender induzierter Verzerrung vorgenommen werden. Ein Beispiel einer solchen Verzerrung ist die Kompression des Dynamikbereiches oder seine Erweiterung unter Verwendung einer logarithmischen Kompressionsfunktion. Solche Verzerrungen können durch Simulation der Dynamikbereichverzerrung beim Erzeugen der Datenbank und/oder Kompensieren des empfangenen Signals für die Dynamikbereichverzerrung kompensiert werden.
  • Der nächste Schritt ist die Berechnung des statistischen Moments jedes der Banddifferenzsignale, der in der Figur 16 mit Schritt S120 bezeichnet ist. Jedes Bandpaßdifferenzsignal muß an mehreren Punkten abgetastet werden, um Signalwerte zu erzeugen, die zum Berechnen dieser statistischen Momente verwendet werden. Die Figur 5 zeigt die Abtastung von Band (4- 3). Der Abtastprozeß ist zum Erzeugen der Referenzbibliothek und zum Erkennen des empfangenen Signals ist etwas anders. Wenn die Referenzbibliothek erzeugt wird, wird das Signal in die Vorrichtung nach Figur 1 am Audiokanalempfänger 4 eingespielt. Der bei den Schritten S210 und S270 in Figur 16 gezeigte zweitstufige Korrelationsprozeß wird zum Wählen des spektral ausgeprägtesten Abschnitts des Signals zur Verwendung in den Referenzbibliotheken benutzt. Insbesondere identifiziert der Prozessor die spektral ausgeprägtesten 28 Sekunden des Signals zur Verwendung bei der Erzeugung der erstund zweitstufigen Referenzbibliothek. Wird andererseits ein Rundfunksignal von der Struktur nach Figur 1 überwacht, wird das Signal in eine Folge von vierzehn Sekundensegmenten herunter zerlegt und jedes Segment wird analysiert und mit den Referenzsignalbibliotheken verglichen.
  • Nach Figur 5 wird der Referenzbibliothekeingang für das Zielbzw. Sollsignal durch wiederholte Abtastung jedes Banddifferenzsignals mit einem Fenster mit 128 Abttastpunkten in neun Intervallen bestimmt, wobei das Fenster um 16 Punkte für jedes Intervall verschoben wird. Die an den Abtastpunkten bestimmten Signalwerte werden dann zum Berechnen der statistischen Momente, Asymmetrie und Wölbung beim Schritt S120 in Figur 16 verwendet. Die Figur 17 zeigt den Prozeß, durch welchen die statistischen Momente berechnet werden. Als erstes wird das Mittel der abgetasteten Signalwerte gemäß
  • gewonnen, wobei N die Zahl Abtastpunkte bedeutet, 1 < n < N gilt, und X der Wert des Signals (beispielsweise die Spannung) am Abtastpunkt ist. Dann wird die Varianz des abgetasteten Signals gemäß
  • Varianz =
  • gewonnen. Aus der Varianz wird die Standardabweichung wie folgt berechnet:
  • = Varianz ... (3)
  • Als nächstes können das oder die statistischen Momente gemäß der Formel
  • berechnet werden.
  • Obgleich die vorliegende Erfindung zwei statistische Momente, Asymmetrie und Wölbung, verwendet, kann ein einzelnes statistisches Moment gemäß Formel (4) berechnet werden oder alternativ dazu ein oder mehr Momente höherer Ordnung verwendet werden. Entsprechend der bevorzugten Ausführungsform wird die Asymmetrie berechnet durch
  • Die Wölbung wird wie folgt berechnet:
  • Die oben beschriebenen Berechnungen werden bei den Schritten S121 bis S125 in Figur 17 ausgeführt.
  • Wenn einmal die statistischen Momente berechnet worden sind, können die Merkmalsvektoren abgeleitet werden (Schritt S130 in Figur 16). Wie in Figur 6 gezeigt, wird ein Merkmalsvektor während der Erzeugung der Referenzbibliothek für jedes der neun Intervalle abgeleitet. Jeder Vektor enthält Asymmetrieund Wölbungswerte für die Banddifferenzsignale bei jedem Intervall. Infolgedessen enthält der Vektor 1 Werte für S(4- 3)&sub1;, S(3-2)&sub1;, S(2-1)&sub1;, K(4-3)&sub1;, K(3-2)&sub1; K(2-1)&sub1;. Diese Werte sind aktuelle Signalwerte und werden durch Gleitkommazahlen dargestellt.
  • Jetzt sind neun Merkmalsvektoren für jedes Signal erzeugt worden und jeder Merkmalsvektor beschreibt eine Stelle im Hyperraum. Dann wird in jeder Nachbarschaft im Hyperraum ein Liedidentifikationskode plaziert, wobei die Nachbarschaft doppelte Werte eliminiert.
  • Der nächste Schritte ist die Quantisierung der Merkmalsvektoren, wie sie früher beschrieben wurde (Schritt S140 in Figur 16). Während des Prozesses der Erzeugung der Referenzbibliotheken wird vorzugsweise der überlappte Vektorqantisierungsalgorithmus gemäß den Figuren 12 bis 14 verwendet. Beispielsweise werden, wie in Figur 14 gezeigt, die Werte des Vektors 1 auf den Graphen nach Figur 12 gezeichnet und zwei überlappte quantisierte Vektoren A und B erzeugt. Diese quantisierten Vektorkomponenten werden durch eine Stelle dargestellt, welche die Werte von 0 bis 4 annimmt. Bei einer alternativen Ausführungsform können jedoch die quantisierten Vektoren mehrstellig sein und mehr oder weniger als fünf unterschiedliche Werte aufweisen.
  • Nachdem die zwei quantisierten Vektoren A und B erhalten sind, wird eine Permutation dieser Vektoren ausgeführt, um alle möglichen Variationen dieser Vektoren zu erzeugen. Infolgedessen gibt es 64 mögliche Stellen im Hyperraum, bei denen die Siganlwerte des Vektors 1 gespeichert werden können. Da diese Permutation für jeden der neun Merkmalsvektoren erzeugt wird, sind für jedes Signal möglicherweise insgesamt 576 Vektoren im Hyperraum abzubilden. Nach vom Erfinder durchgeführten Experimenten werden für jeden Vektor jedoch 21 tatsächliche Stellen im Hyperraum erzeugt.
  • Eine Abbildung jedes permutierten quantisierten Vektors ist einfach eine Sache des Eingebens einer Liedidentifikation in eine besondere Stelle im Speicher (Schritt S150 in Figur 16). Dies wird entsprechend einem Prozeß ausgeführt, der in Figur 15 gezeigt ist, obgleich eine breite Anzahl von Abbildungsalgorithmen benutzt werden kann. Nach Figur 15 wird eine gewichtete Summe des permutierten quantisierten Vektors 2A unter Verwendung der nichtdezimalen Grundzahl 5 erzeugt. Dies heißt, daß die Vektorwerte mit verschiedenen Potenzen der Basis 5 multipliziert werden. Natürlich kann eine andere Grundzahl verwendet werden oder es kann eine gänzlich andere Methode zur Erzeugung einer Adresse angewendet werden. Bei dem in Figur 15 gezeigten Beispiel ist die gewichtete Summe der Vektorkomponenten gleich 11.117. Dann wird mit dieser Adresse auf eine mit Q-TABELLE bezeichnete Tabelle zugegriffen (Schritt S160 in Figur 16) und ein Zeiger erzeugt, der auf eine besondere Liedliste #1 zeigt. Während des Prozesses der Erzeugung der Datenbank wird nun der Liedidentifikationskode in die Liedliste eingegeben und die Zahl an Liedern auf der Liste wird um eins erhöht. Diese Prozedur wird für jeden der vom Abtastsignal erzeugten permutierten quantisierten Vektoren wiederholt, und der Identifikationskode für das Sample wird infolgedessen in mehrere Liedlisten in den Speicher geschrieben. Dies vollendet die Erzeugung der Datenbank, mit welcher die Signale erkannt werden.
  • Während der Signalerkennung sind die oben beschriebenen Schritte generell ähnlich. Das Rundfunksignal wird empfangen, bandpaßgefiltert, gleichgerichtet, tiefpaßgefiltert und Linearkombinationen der vier Bänder werden erzeugt. Der Abtastschritt während der Erkennung ist darin etwas anders, als das Lied bei 14 Sekundenintervallen abgetastet wird. Es wird für jedes Intervall nur ein einzelner Merkmalsvektor unter Verwendung der nach den Gleichungen (5) und (6) berechneten Asymmetrie- und Wölbungswerte erzeugt.
  • Der einzelne Merkmalsvektor für jedes abgetastete Intervall wird dann unter Verwendung des oben erwähnten Nichtüberlappungs-Quantisierungsalgorithmus quantisiert. Infolgedessen erzeugt jedes Liedintervall einen einzelnen quantisierten Vektor. Es wird dann eine gewichtete Summe der einzeln quantisierten Vektorkomponenten gewonnen und unter Verwendung der gewichteten Summe auf die Q-TABELLE zugegriffen. Der Zeiger aus der Q-TABELLE greift auf eine einzelne Liedliste zu. Die Lieder auf der einzelnen Liedliste sind die bei der zweitstufigen Klassifikationsprozedur untersuchten Liederkandidaten. Bei Verwendung eines einstufigen Klassifikationsprozesses werden natürlich das oder die von der einzelnen Liedliste herausgenommenen Lieder als das Rundfunksignal identifiziert.
  • Der zweitstufige Klassifikationsprozeß ist detailliert im '562-Patent in Spalte 13, Zeile 58 bis Spalte 15, Zeile 57 und in den Figurern 2, 7, 8, 9 und 14 beschrieben. Grundsätzlich werden die eine oder merheren beim erststufigen Klassifikationssprozeß erzeugten Liedlisten im zweitstufigen Korrelator zusammen mit dem Ausgangsssignal Xc(t) nach Figur 2 übermittelt. Das Signal Xc(t) kann linear zeitverzerrt sein, so, wie es in dem '562-Patent beschrieben ist. Die Fouriertransformation aller fünf zeitverzerrten und unverzerrten Wellenformen wird berechnet und als komplexe Spektren, die mit den zweitstufigen Referenzmustern verglichen werden, in der zweitstufigen Bibliothek gespeichert. Samples aus den digitalisierten Rundfunksignalen und den Referenzwellenformen werden kreuzmultipliziert und invers fouriertransformiert, um ein Korrelationssignal zu erzeugen (Schritt S211 in Figur 18). Als nächstes werden die Korrelationsfunktionen zwischen jedem zweitstufigen Referenzmuster und den mehreren zeitverzerrten (und unverzerrten) Eingangssignalen verglichen, um den maximalen Korrelationswert für das laufende Eingangssignal auszuwählen (Schritt S213 in Figur 18). Die geeignete Wellenform mit dem höchsten Korrelationswert wird ausgewählt und mit einem Schwellenwert verglichen, der die Erkennung bestimmt. Sobald festgestellt wird, daß ein Korrelationsspitzenwert über der vorbestimmten Schwelle ist, wird das Signal "erkannt" (Schritt S215 in Figur 18) und die Liedidentifikation wird mitgeschrieben und kann auf der Kathodenstrahlröhre 38 gezeigt werden.
  • Infolgedessen stellen das vorstehend beschriebene System und Verfahren ein genaues, zuverlässiges, kompaktes, immer noch billiges System zur Klassifizierung von Sginalen bereit.
  • Wie früher erwähnt, kann die Vorrichtung gemäß der vorliegenden Erfindung zum Erzeugen der erst- und zweitstufigen Rreferenzbibliotheken benutzt werden. Die Prozedur zur Erzeugung der erststufigen Bibliothek ist oben beeschrieben worden und die Prozedur zur Erzeugun der zweitstufigen Bibliothek geht vollständig aus dem '562-Patent, Spalte 15, Zeile 64 bis Spalte 16, Zeile 53 hervor.
  • Was deshalb oben beschrieben wurde, ist eine Vorrichtung und ein Verfahren zur automatischen Klassifizieirung von Signalen, vorzugsweise Rundfunksignalen. Da das System mikroprozessorbasiert ist, kann es in extrem kleiner und wirtschaftlichehr Packung realsiert werden. Beispielsweise umfaßt der existierende Prototyp einen kommerziellen FM-Radioempfänger und einen kleinen Computer mit einem Sun-3/150-Prozessor, einem einen Motorola-68020-Mikroprozessor verwendendes Sun-CPU- Board, mehrere Speicherboards, einen Mercury-Array-Prozessor, einen Vorprozessor, eine Steuereinrichtung für die Platte und Periphergeräte sowie eine Kathodenstrahlröhre Der Fachmann durchschnittlichen Könnens auf diesem Gebiet erkennt leicht die signifikanten Fortschritte bei der in diesem Patent offenbarten Signalerkennung.
  • Wenn die vorligende Erfindung in Verbindung mit dem, was derzeit als die praktikabelsten und bevorzugtesten Ausführungsformen betrachtet werden, beschrieben wurde, ist dies so zu verstehen, daß die Erfindung nicht auf die offenbarten Ausführugnsformen beschränkt ist. Vielmehr deckt die vorliegende Erfindung verschiedene Modifikationen und äquivalente Ausführungsformen ab, die in den Rahmen der beigefügten Ansprüche fallen.

Claims (64)

1. Verfahren zur Klassifizierung eines Signals, bestehend aus den Schritten:
Empfangen des Signals,
Abtasten des Signals an mehreren Punkten zur Erzeugung mehrerer Signalwerte,
Ableiten eines Multiwert-Merkmalsvektors aus den Signalwerten,
Quantisieren des Merkmalsvektors durch Ersetzen jedes Merkmalsvektorwertes durch einen aus einem vorbestimmten, ungleichartige Merkmalsvektorwerte kategorisierenden Quantisierungsmuster bestimmten Kategoriewert und
Zugreifen auf eine Signalbibliothek mit dem quantisierten Vektor zur Erzeugung eines mit dem empfangenen Signal korrespondierenden Signalidentifikationskodes.
2. Verfahren nach Anspruch 1, wobei das vorbestimmte Quantisierungsmuster ein Überlappungsquantisierungsmuster ist.
3. Verfahren nach Anspruch 1, wobei der Quantisierungsschritt mehrere verschiedene vorbestimmte Quantisierungsmuster zum Quantisieren des Merkmalsvektors verwendet.
4. Verfahren nach Anspruch 1, wobei der Ableitungsschritt die Schritte
Berechnen zweier unterschiedlicher statistischer Momente der mehreren Signalwerte und
Bilden des Merkmalsvektors unter Verwendung der zwei berechneten statistischen Momente
aufweist.
5. Verfahren nach Anspruch 4, wobei für jedes der zwei statistischen Momente ein vorbestimmtes Quantisierungsmuster vorgesehen ist.
6. Verfahren nach Anspruch 4, wobei die zwei verschiedenen statistischen Momente Asymmetrie und Wölbung aufweisen.
7. Verfahren nach Anspruch 1, wobei der Empfangsschritt den Schritt einer Hüllkurvengleichrichtung des empfangenen Signals aufweist.
8. Verfahren nach Anspruch 11 wobei der Quantisierungsschritt die Schritte
Ersetzen des Merkmalsvektors durch mehreren quantisierte Vektoren entsprechend wenigstens einem vorbestimmten Quantisierungsmuster mit Überlappungskategorien und
Permutieren der mehreren quantisierten Vektoren zur Erzeugung mehrerer weiterer permutierter quantisierter Vektoren
aufweist.
9. Verfahren nach Anspruch 8, wobei der Zugreifschritt die Schritte
Zugreifen auf die Signalbibliothek mit den mehreren permutierten quantisierten Vektoren zum Erreichen mehrerer Speicherstellen und
Schreiben in jede Speicherzelle einen mit dem empfangenen Signal korrespondierenden Signalidentifikationskode aufweist.
10. Verfahren nach Anspruch 1, wobei der Empfangsschritt die Schritte
Spektralanalysieren des Signals zur Erzeugung mehrerer, verschiedene Frequenzbänder aufweisender analysierter Signale und
Bilden von Linearkombinationen der analysierten Wellenformen
aufweist,
wobei der Abtastschritt den Schritt einer Abtastung jeder Linearkombination zur Erzeugung mehrerer Abtastpunkte für jede Linearkombination
aufweist,
und wobei der Ableitungsschritt die Schritte
Berechnen von Asymmetrie- und Wölbungswerten für alle Linearkombinationen aus den korrespondierenden Abtastpunkten und
Bilden des Merkmalsvektors so, daß er Asymmetrie- und Wölbungswerte aller Linearkombinationen enthält,
aufweist.
11. Verfahren zum Erzeugen eines bei der Identifikation von Rundfunksignalen verwendbaren Signalidentifikationsbibliothek, bestehend aus den Schritten:
Abtasten eines durch Rundfunk zu sendenden Signals zur Erzeugung mehrerer analysierter Wellenformen für jedes durch Rundfunk zu sendende Signal,
Ableiten mehrerer Merkmalsvektoren und wenigstens einen Merkmalsvektor pro abgetastetes Signal aus den analysierten Wellenformen,
Quantisieren jedes Merkmalsvektors mit den Unterschritten:
Herstellen mehrerer Quantisierungspegel,
Verteilen der Quantisierungspegel ungleichartig über einer vorbestimmten statistischen Verteilung,
Ableiten mehrerer Quantisierungsschwellenwerte entsprechend den verteilten Quantisierungspegeln,
Ersetzen jedes Wertes jedes Merkmalsvektors durch einen durch die Quantisierungsschwellenwerte bestimmten korrespondierenden Quantisierungswert, und
Speichern jedes einen quantisierten Vektor darstellenden Wertes in einem Speicher als die Signalidentifikation für das korrespondierende abgetastete Signal.
12. Verfahren nach Anspruch 11, wobei der Schritt der Verteilung der Quantisierungspegel den Schritt einer Verteilung der Quantisierungspegel in überlappender Art und Weise aufweist, und wobei der Schritt des Ersetzens jedes Wertes jedes Merkmalsvektors die weiteren Schritte
Ersetzen jedes Wertes jedes Merkmalsvektors durch mehrere durch die überlappten Quantisierungspegel bestimmten Quantisierungswerte, wobei so jeder Merkmalsvektor durch mehrere quantisierte Vektoren ersetzt wird, und
Permutieren der mehreren quantisierten Vektoren jedes Merkmalsvektors zur Erzeugung mehrerer permutierter Vektoren
aufweist,
wobei der Schritt des Speicherns den Schritt eines Speicherns von mit den mehreren quantisierten Vektoren korrespondierenden Werten für jedes abgetastete Signal aufweist.
13. Verfahren nach Anspruch 11, wobei der Ableitungsschritt den Schritt eines Berechnens zweier statistischer Momente für jede analysierte Wellenform und Bilden jedes Merkmalsvektors so, daß er die zwei statistischen Momente enthält, aufweist.
14. Verfahren nach einem der Ansprüche 1 bis 10, mit den Schritten:
Berechnen eines statistischen Moments des Signals entsprechend der Formel
wobei N die Zahl der Abtastpunkte,
1 < n < N,
X den Signalwert des Signals an einem Abtastpunkt,
µ ein Mittel der Signalwerte,
eine Standardabweichung des Signalwertes und
k eine ganze Zahl größer als 1 bedeuten,
Vergleichen des Berechneten statistischen Moments mit einer mehrere gespeicherte Signalidentifikationen enthaltenden Bibliothek und
Erkennen des empfangenen Signals als ähnlich wenigstens einer der gespeicherten Signalidentifikationen.
15. Verfahren nach Anspruch 14, wobei der Berechnungsschritt die Schritte einer Berechnung der Asymmetrie und Wölbung des Signals aufweist, und wobei der Vergleichsschritt den Schritt einer Bildung eines Merkmalsvektors aus der Asymmetrie und Wölbung aufweist.
16. Verfahren nach Anspruch 14, wobei der Empfangsschritt die Schritte
Bandpaßfiltern des empfangenen Signals zum Erzeugen mehrerer gefilterter Signale,
Gleichrichten der gefilterten Signale,
Tiefpaßfiltern der gleichgerichteten Signale und
Berechnen mehrerer Linearkombinationen der tiefpaßgefilterten Signale
aufweist.
17. Verfahren nach Anspruch 16, wobei der Abtastschritt die Schritte
Abtasten einer ersten der Linearkombinationen an mehreren Abtastpunkten zur Erzeugung einer ersten Anzahl Signalwerte und
Abtasten einer zweiten der Linearkombinationen an mehreren Abtastpunkten zur Erzeugung einer zweiten Anzahl Signalwerte
aufweist.
18. Verfahren nach Anspruch 17, wobei der Berechnungsschritt die Schritte
Berechnen eines ersten Asymmetriewertes und eines ersten Wölbungswertes aus der ersten Anzahl Signalwerte,
Berechnen eines zweiten Asymmetriewertes und eines zweiten Wölbungswertes für die zweite Anzahl Signalwerte und
Ableiten eines den ersten und zweiten Asymmetriewert und ersten und zweiten Wölbungswert aufweisenden Merkmalsvektors
aufweist
19. Verfahren nach Anspruch 18, wobei der Vergleichsschritt die Schritte
Quantisieren des Merkmalsvektors entsprechend einer Zahl vorbestimmter Quantisierungsmuster zur Erzeugung eines quantisierten Vektors und
Zugreifen auf die Bibliothek mit dem quantisierten Vektor zur Lokalisierung einer mit dem quantisierten Vektor korrespondierenden Signalidentifikation
aufweist
20. Verfahren nach Anspruch 19, wobei der Zugreifschritt die Schritte
Bilden einer gewichteten Summe der Werte des quantisierten Vektors unter Verwendung einer nichtdezimalen Grundzahl,
Verwenden der gewichteten Summe als eine Adresse zum Zugreifen auf eine Zeigertabelle zum Lokalisieren eines mit der gewichteten Summe korrespondierenden Zeigers und
Verwenden des Zeigers zum Lokalisieren einer die mit dem quantisierten Vektor korrespondierende Signalidentifikation enthaltenden Identifikationsliste
aufweist.
21. Verfahren nach Anspruch 20, wobei der Erkennungsschritt die Schritte
Korrelieren einer dritten der mehreren Linearkombinationen mit mehreren mit den in der Signalidentifikationsliste enthaltenen Signalidentifikationen korrespondierenden gespeicherten Signalen und
Auswählen eines gespeicherten Signals, dessen Korrelation mit der dritten Linearkombination einen vorbestimmten Schwellenwert überschreitet,
aufweist.
22. Verfahren nach Anspruch 19, wobei der Quantisierungsschritt die Schritte
Kategorisieren jedes Asymmetriewertes des Merkmalsvektors entsprechend einem vorbestimmten Asymmetriequantisierungsmuster, in welchem Kategorien ungleichartig verteilt sind, und
Kategorisieren jedes Wölbungswertes des Merkmalsvektors entsprechend einem vorbestimmten Wölbungsquantisierungsmuster, in welchem Kategorien ungleichartig verteilt sind,
aufweist.
23. Verfahren nach einem der Ansprüche 11 bis 13, mit den Schritten:
Empfangen eines Referenzsignals,
Abtasten des Referenzsignals an mehreren Abtastpunkten zur Erzeugung mehrerer Signalwerte,
Berechnen eines statistischen Moments des empfangenen Referenzsignals entsprechend der Formel
wobei N die Zahl der Abtastpunkte,
1 < n < N,
X den abgetasteten Signalwert an einem Abtastpunkt,
µ ein Mittel der abgetasteten Signalwerte,
eine Standardabweichung der abgetasteten Signalwerte und
k eine ganze Zahl größer als 1 bedeuten,
Ableiten eines Merkmalsvektors aus dem berechneten statistischen Moment, und
Speichern des Merkmalsvektors oder einer Darstellung desselben in einem Speicher
aufweist.
24. Verfahren nach Anspruch 23, wobei der Berechnungsschritt den Schritt einer Berechnung zweier statistischer Momente des empfangenen Referenzsignals aufweist, und wobei der Ableitungsschritt den Schritt einer Ableitung des Merkmalsvektors aus den beiden berechneten statistischen Momente aufweist.
25. Verfahren nach Anspruch 23, wobei der Empfangsschritt die Schritte
Bandpaßfiltern des empfangenen Signals zur Erzeugung mehrerer gefilterter Signale,
Gleichrichten der gefilterten Signale,
Tiefpaßfiltern der gleichgerichteten Signale und
Berechnen mehrerer Linearkombinationen der tiefpaßgefilterten Signale
aufweist.
26. Verfahren nach Anspruch 25, wobei der Abtastschritt die Schritte
Abtasten eines ersten Teils einer der Linearkombinationen an mehreren Punkten zur Erzeugung einer ersten Anzahl Signalwerte und
Abtasten eines zweiten Teils der einen Linearkombination an mehreren Punkten zur Erzeugung einer zweiten Anzahl Signalwerte
aufweist.
27. Verfahren nach Anspruch 26, wobei der Berechnungsschritt die Schritte
Berechnen der Asymmetrie und Wölbung der ersten Anzahl Signalwerte zur Erzeugung eines ersten Asymmetriewertes und ersten Wölbungswertes und
Berechnen der Asymmetrie und Wölbung der zweiten Anzahl Signalwerte zur Erzeugung eines zweiten Asymmetriewertes und zweites Wölbungswertes
aufweist.
28. Verfahren nach Anspruch 27, wobei der Ableitungsschritt die Schritte
Bilden eines ersten Merkmalsvektors mit dem ersten Asymmetriewert und ersten Wölbungswert und
Bilden eines zweiten Merkmalsvektors mit dem zweiten Asymmetriewert und zweiten Wölbungswert
aufweist.
29. Verfahren nach Anspruch 28, wobei der Ableitungsschritt den Schritt einer Quantisierung beider Merkmalsvektoren durch Ersetzen der Asymmetrie- und Wölbungswerte durch ganze Zahlen entsprechend vorbestimmter ungleichartiger Quantisierungsmuster zur Erzeugung eines ersten und zweiten quantisierten Vektors aufweist.
30. Verfahren nach Anspruch 29, wobei der Speicherschritt die Schritte
Berechnen einer gewichteten Summe des eine nichtdezimale Grundzahl verwendenden ersten Vektors,
Berechnen einer gewichteten Summe des eine nichtdezimale Grundzahl verwendenden zweiten Vektors,
Verwenden der gewichteten Summen zum Adressieren des Speichers, und
Speichern eines mit dem Referenzsignal korrespondierenden Signalidentifikationskode im Speicher bei den mit den gewichteten Summen korrespondieren Adressen
aufweist.
31. Verfahren nach Anspruch 28, wobei der Ableitungsschritt weiter die Schritte
Erzeugen eines ersten und zweiten überlappungsquantisierten Vektors aus dem ersten Merkmalsvektor entsprechend vorbestimmten ungleichartigen Überlappungsquantisierungsmustern,
Erzeugen eines dritten und vierten überlappungsquantisierten Vektors aus dem zweiten Merkmalsvektor entsprechend den vorbestimmten ungleichartigen Überlappungsquantisierungsmustern,
Bilden einer ersten Anzahl Permutationen des ersten und zweiten überlappungsquantisierten Vektors, und
Bilden einer zweiten Anzahl Permutationen des dritten und vierten überlappungsquantisierten Vektors
aufweist.
32. Verfahren nach Anspruch 31, wobei der Speicherschritt die Schritte
Berechnen einer gewichteten Summe der Werte sowohl der ersten als auch zweiten Anzahl Permutationen,
Zugreifen auf den Speicher bei mit den gewichteten Summen korrespondierenden Adressen, und
Speichern eines das Referenzsignal identifizierenden Signalidentifikationskodes in dem Speicher bei mit den Adressen korrespondierenden Bereichen
aufweist.
33. Vorrichtung zum Klassifizieren eines Signals, bestehend aus:
einem Empfänger zum Empfangen des Signals,
einem Speicher,
einem Prozessor zum a) Abtasten des Signals an mehreren Punkten zur Erzeugung mehrerer Signalwerte, b) Ableiten eines Multiwert-Merkmalsvektors aus den Signalwerten, c) Quantisieren des Merkmalsvektors durch Ersetzen jedes Merkmalsvektorwertes durch einen von einem vorbestimmten, Merkmalsvektorwerte ungleichartig kategorisierenden und im Speicher gespeicherten Quantisierungsmuster bestimmten Kategoriewert und d) Zugreifen auf eine im Speicher gespeicherte Signalbibliothek mit dem quantisierten Vektor zur Erzeugung eines mit dem empfangenen Signal korrespondierenden Signalidentifikationskodes.
34. Vorrichtung nach Anspruch 33, wobei das vorbestimmte Quantisierungsmuster ein Überlappungsquantisierungsmuster ist.
35. Vorrichtung nach Anspruch 33, wobei der Prozessor mehrere verschiedene vorbestimmte Quantisierungsmuster zur Quantisierung des Merkmalsvektors benutzt.
36. Vorrichtung nach Anspruch 33, wobei der Prozessor b1) zwei verschiedene statistische Momente der mehreren Signalwerte berechnet und b2) den Merkmalsvektor unter Verwendung der zwei berechneten statistischen Momente bildet.
37. Vorrichtung nach Anspruch 36, wobei für jedes der zwei statistischen Momente ein vorbestimmtes Quantisierungsmuster vorgesehen ist.
38. Vorrichtung nach Anspruch 36, wobei die zwei verschiedenen statistischen Momente Asymmetrie und Wölbung aufweisen.
39. Vorrichtung nach Anspruch 33, wobei der Prozessor das empfangene Signal hüllkurvengleichrichtet.
40. Vorrichtung nach Anspruch 33, wobei der Prozessor c1) den Merkmalsvektor durch mehrere quantisierte Vektoren entsprechend wenigstens einem vorbestimmten Quantisierungsmuster mit überlappenden Kategorien ersetzt und c2) die mehreren quantisierten Vektoren quantisiert, um eine weitere Anzahl permutierter quantisierter Vektoren zu erzeugen.
41. Vorrichtung nach Anspruch 40, wobei der Prozessor d1) mit den mehreren permutierten quantisierten Vektoren auf die Signalbibliothek zugreift, um mehrere Speicherstellen zu erreichen, und d2) in jede der Speicherstellen einen mit dem empfangenen Signal korrespondierenden Signalidentifikationskode schreibt.
42. Vorrichtung nach Anspruch 33, wobei der Empfänger a) das Signal spektralanalysiert, um mehrere analysierte Signale mit verschiedenen Frequenzbändern zu gewinnen, und b) Linearkombinationen der analysierten Wellenformen bildet,
und wobei der Prozessor jede Signalkombination zur Erzeugung mehrerer Abtastpunkte für jede Linearkombination abtastet, Asymmetrie- und Wölbungswerte für jede Linearkombination aus den korrespondierenden Abtastpunkten berechnet und den Merkmalsvektor derart bildet, daß er Asymmetrie- und Wölbungswerte aus allen Linearkombinationen enthält.
43. Vorrichtung zum Erzeugen einer zur Identifikation von Rundfunksignalen verwendbaren Signalidentifikationsbibliothek, bestehend aus:
einem Empfänger zum Empfangen mehrerer durch Rundfunk zu sendender Signale,
einem Speicher,
einem Prozessor zum a) Abtasten der durch Rundfunk zu sendenden Signale zur Erzeugung mehrerer analysierter Wellenformen für jedes durch Rundfunk zu sendende Signal, b) Ableiten mehrerer Merkmalsvektoren aus den analysierten Wellenformen und wenigstens eines Merkmalsvektors für jedes abgetastete Signal und c) Quantisieren jedes Merkmalsvektors, mit den Unterschritten:
c1) Herstellen mehrerer Quantisierungspegel,
c2) Verteilen der Quantisierungspegel ungleichartig über einer vorbestimmten statistischen Verteilung,
c3) Ableiten mehrerer Quantisierungsschwellenwerte ent sprechend den verteilen Quantisierungspegeln, und
c4) Ersetzen jedes Wertes jedes Merkmalsvektors durch einen durch die Quantisierungsschwellenwerte bestimmten korrespondierenden Quantisierungswert, wobei
der Prozessor d) einen jeden quantisierten Vektor im Speicher als die Signalidentifikation für das korrespondierende abgetastete Signal darstellenden Wert speichert.
44. Vorrichtung nach Anspruch 43, wobei die Quantisierungspegel überlapptartig verteilt sind, wobei der Prozessor c4a) jeden Wert jedes Merkmalsvektors durch mehrere durch die überlappten Quantisierungspegel bestimmte Quantisierungswerte ersetzt, wobei jeder Merkmalsvektor auf diese Weise durch mehrere quantisierte Vektoren ersetzt wird, und c4b) die mehreren quantisierten Vektoren jedes Merkmalsvektors permutiert, um mehrere permutierte Vektoren zu erzeugen, und wobei der Prozessor d1) im Speicher für jedes abgetastete Signal Werte speichert, die mit den mehreren quantisierten Vektoren korrespondieren.
45. Vorrichtung nach Anspruch 43, wobei der Prozessor b1) für jede analysierte Wellenform zwei statistische Momente berechnet und b2) jeden Merkmalsvektor derart bildet, daß er die zwei berechneten statistischen Momente enthält.
46. Vorrichtung nach einem der Ansprüche 33 bis 42, wobei der Prozessor e) zur Berechnung eines statistischen Moments des Signals gemäß der Formel
wobei N die Zahl der Abtastpunkte,
1 < n < N,
X den Signalwert des Signals an einem Abtastpunkt,
µ ein Mittel des Signalwertes,
eine Standardabweichung des Signalwertes und
k eine ganze Zahl größer als 1 bedeuten,
f) zum Speichern einer mehrere gespeicherte Signalidentifikationen enthaltenden Bibliothek, g) Vergleichen des berechneten statistischen Momentes mit den mehreren gespeicherten Signalidentifikationen in der Bibliothek und h) Erkennen des empfangenen Signals als einem der gespeicherten Signalidentifikationen ähnlich vorgesehen ist.
47. Vorrichtung nach Anspruch 46, wobei die Verarbeitungseinrichtung die Asymmetrie und Wölbung des Signals berechnet und aus der Asymmetrie und Wölbung einen Merkmalsvektor bildet.
48. Vorrichtung nach Anspruch 46, wobei die Verarbeitungseinrichtung
eine Einrichtung zur Bandpaßfilterung des empfangenen Signals zur Erzeugung mehrerer gefilterter Signale,
eine Einrichtung zum Gleichrichten der gefilterten Signale,
eine Einrichtung zum Tiefpaßfiltern der gleichgerichteten Signale und
eine Einrichtung zum Berechnen mehrerer Linearkombinationen der tiefpaßgefilterten Signale
aufweist.
49. Vorrichtung nach Anspruch 48, wobei die Verarbeitungseinrichtung a1) eine erste der Linearkombinationen an mehreren Abtastpunkten abtastet, um eine erste Anzahl Signalwerte zu erzeugen, und a2) eine zweite der Linearkombinationen an mehreren Abtastpunkten abtastet, um eine zweite Anzahl Signalwerte zu erzeugen.
50. Vorrichtung nach Anspruch 49, wobei die Verarbeitungseinrichtung e1) einen ersten Asymmetriewert und einen ersten Wölbungswert aus der ersten Anzahl Signalwerte sowie einen zweiten Asymmetriewert und zweiten Wölbungswert für die zweite Anzahl Signalwerte berechnet und e2) einen den ersten und zweiten Asymmetriewert und ersten und zweiten Wölbungswert aufweisenden Merkmalsvektor ableitet.
51. Vorrichtung nach Anspruch 50, wobei die Verarbeitungseinrichtung g1) den Merkmalsvektor entsprechend einer Anzahl gespeicherter vorbestimmter Quantisierungsmuster quantisiert, um einen quantisierten Vektor zu erzeugen, und 92) mit dem quantisierten Vektor auf die Bibliothek zugreift, um eine mit dem quantisierten Vektor korrespondierende Signalidentifikation zu lokalisieren.
52. Vorrichtung nach Anspruch 51, wobei die Verarbeitungseinrichtung 92) eine gewichtete Summe der Werte des eine nichtdezimale Grundzahl verwendenden quantisierten Vektors bildet, g2b) die gewichtete Summe als eine Adresse zum Zugreifen auf eine in der Bibliothek gespeicherte Zeigertabelle zum Lokalisieren eines mit der gewichteten Summe korrespondierenden Zeigers verwendet und den Zeiger zum Zugreifen auf die Bibliothek zum Lokalisieren einer die mit dem quantisierten Vektor korrespondierende Signalidentifikation enthaltenden Signalidentifikationsliste verwendet.
53. Vorrichtung nach Anspruch 52, wobei die Verarbeitungseinrichtung h1) eine dritte der mehreren Linearkombinationen mit mehreren gespeicherten Signalen korreliert, die mit den in der Signalidentifikationsliste enthaltenen Signalidentifikationen korrespondieren, und h2) ein gespeichertes Signal auswählt, dessen Korrelation mit der dritten Linearkombination einen vorbestimmten Schwellenwert überschreitet.
54. Vorrichtung nach Anspruch 51, wobei die Verarbeitungseinrichtung g1a) jeden Asymmetriewert des Merkmalsvektors entsprechend einem gespeicherten vorbestimmten Asymmetriequantisierungsmuster, in welchem Kategorien ungleichartig verteilt sind, kategorisiert, und d1b) jeden Wölbungswert des Merkmalsvektors entsprechend einem gespeicherten vorbestimmten Wölbungsquantisierungsmuster, in welchem Kategorien ungleichartig verteilt sind, kategorisiert.
55. Vorrichtung nach einem der Ansprüche 43 bis 45, wobei der Prozessor e) zum Berechnen eines statistischen Moments des empfangenen Referenzsignals gemäß der Formel
wobei N die Zahl der Abtastpunkte,
1 < n < N,
X den abgetasteten Signalwert an einem Abtastpunkt,
µ ein Mittel der abgetasteten Signalwerte,
eine Standardabweichung der abgetasteten Signal werte und
k eine ganze Zahl größer als 1 bedeuten,
f) Ableiten eines Merkmalsvektors aus dem berechneten statistischen Moment und g) Speichern des Merkmalsvektors oder einer Darstellung dieses Vektors in dem Speicher vorgesehen ist.
56. Vorrichtung nach Anspruch 55, wobei die Verarbeitungseinrichtung zwei statistische Momente des empfangenen Referenzsignais berechnet und den Merkmalsvektor aus beiden berechneten statistischen Momenten ableitet.
57. Vorrichtung nach Anspruch 55, wobei die Verarbeitungseinrichtung das empfangene Signal bandpaßfiltert, um mehrere gefilterte Signale zu erzeugen, die gefilterten Signale gleichrichtet, die gleichgerichteten Signale tiefpaßfiltert und mehrere Linearkombinationen der tiefpaßgefilterten Signale berechnet.
58. Vorrichtung nach Anspruch 57, wobei die Verarbeitungseinrichtung a1) einen ersten Teil einer der Linearkombinationen an mehreren Abtastpunkten abtastet, um eine erste Anzahl Signalwerte zu erzeugen, und a2) einen zweiten Teil der einen Linearkombination an mehreren Abtastpunkten abtastet, um eine zweite Anzahl Signalwerte zu erzeugen.
59. Vorrichtung nach Anspruch 58, wobei die Verarbeitungseinrichtung e1) die Asymmetrie und Wölbung der ersten Anzahl Signalwerte berechnet, um einen ersten Asymmetriewert und einen ersten Wölbungswert zu erzeugen, und e2) die Asymmetrie und Wölbung der zweiten Anzahl Signalwerte berechnet, um einen zweiten Asymmetriewert und zweiten Wölbungswert zu erzeugen.
60. Vorrichtung nach Anspruch 59, wobei die Verarbeitungseinrichtung f1) einen den ersten Asymmetriewert und ersten Wölbungswert enthaltenden ersten Merkmalsvektor bildet und f2) einen den zweiten Asymmetriewert und zweiten Wölbungswert enthaltenden zweiten Merkmalsvektor bildet.
61. Vorrichtung nach Anspruch 60, wobei die Verarbeitungseinrichtung f3) beide Merkmalsvektoren durch Ersetzen der Asymmetrie- und Wölbungswerte durch ganze Zahlen entsprechend vorbestimmter, in dem Speicher gespeicherter ungleichartiger Quantisierungsmuster quantisiert, um den ersten und zweiten quantisierten Vektor zu erzeugen.
62. Vorrichtung nach Anspruch 61, wobei die Verarbeitungseinrichtung g1) eine gewichtete Summe aus dem eine nichtdezimale Grundzahl verwendenden ersten Vektor berechnet, g2) eine gewichtete Summe aus dem eine nichtdezimale Grundzahl verwendenden zweiten Vektor berechnet, g4) die gewichteten Summen zum Adressieren des Speichers verwendet, und g5) in dem Speicher einen mit dem Referenzsignal korrespondierenden Signalidentifikationskode an einer mit den gewichteten Summen korrespondierenden Adresse speichert.
63. Vorrichtung nach Anspruch 60, wobei die Verabeitungseinrichtung f3) einen ersten und zweiten überlappungsquantisierten Vektor aus dem ersten Merkmalsvektor entsprechend den in dem Speicher gespeicherten vorbestimmten ungleichartigen Überlappungsquantisierungsmustern erzeugt, f4) einen dritten und vierten überlappungsquantisierten Vektor aus dem zweiten Merkmalsvektor entsprechend den in dem Speicher gespeicherten vorbestimmten ungleichartigen Überlappungsquantisierungsmuster erzeugt, f5) eine erste Anzahl Permutationen des ersten und zweiten überlappungsquantisierten Vektors bildet und f6) eine zweite Anzahl Permutationen des dritten und vierten überlappungsquantisierten Vektors bildet.
64. Vorrichtung nach Anspruch 63, wobei die Verarbeitungseinrichtung g1) eine gewichtete Summe der Werte sowohl der ersten als auch zweiten Anzahl Permutationen berechnet, g2) auf den Speicher bei mit den gewichteten Summen korrespondierenden Adressen zugreift und g3) in den Speicher einen das Referenzsignal identifizierenden Signalidentifikationskode bei mit den Adressen korrespondierenden Bereichen speichert.
DE69122017T 1990-05-02 1991-05-02 Verfahren und vorrichtung zur signalerkennung Expired - Fee Related DE69122017T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/517,835 US5210820A (en) 1990-05-02 1990-05-02 Signal recognition system and method
PCT/US1991/002907 WO1991017540A1 (en) 1990-05-02 1991-05-02 Signal recognition system and method

Publications (2)

Publication Number Publication Date
DE69122017D1 DE69122017D1 (de) 1996-10-17
DE69122017T2 true DE69122017T2 (de) 1997-04-10

Family

ID=24061421

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69122017T Expired - Fee Related DE69122017T2 (de) 1990-05-02 1991-05-02 Verfahren und vorrichtung zur signalerkennung

Country Status (9)

Country Link
US (1) US5210820A (de)
EP (1) EP0480010B1 (de)
JP (1) JP3130926B2 (de)
AT (1) ATE142815T1 (de)
CA (1) CA2041754C (de)
DE (1) DE69122017T2 (de)
ES (1) ES2091328T3 (de)
HK (1) HK133697A (de)
WO (1) WO1991017540A1 (de)

Families Citing this family (245)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2539274A1 (fr) * 1983-01-19 1984-07-20 Boussac Saint Freres Bsf Procede de fabrication de couches-culottes a jeter et couches-culottes obtenues
JP3277398B2 (ja) * 1992-04-15 2002-04-22 ソニー株式会社 有声音判別方法
US5745873A (en) * 1992-05-01 1998-04-28 Massachusetts Institute Of Technology Speech recognition using final decision based on tentative decisions
US5323337A (en) * 1992-08-04 1994-06-21 Loral Aerospace Corp. Signal detector employing mean energy and variance of energy content comparison for noise detection
JPH06110945A (ja) * 1992-09-29 1994-04-22 Fujitsu Ltd 音楽データベース作成装置及びその検索装置
GB9221678D0 (en) * 1992-10-15 1992-11-25 Taylor Nelson Group Limited Identifying a received programme stream
US5748763A (en) 1993-11-18 1998-05-05 Digimarc Corporation Image steganography system featuring perceptually adaptive and globally scalable signal embedding
US7313251B2 (en) 1993-11-18 2007-12-25 Digimarc Corporation Method and system for managing and controlling electronic media
US5841978A (en) 1993-11-18 1998-11-24 Digimarc Corporation Network linking method using steganographically embedded data objects
US5822436A (en) * 1996-04-25 1998-10-13 Digimarc Corporation Photographic products and methods employing embedded information
US7515733B2 (en) * 1993-11-18 2009-04-07 Digimarc Corporation Methods and arrangements employing digital content items
US5768426A (en) * 1993-11-18 1998-06-16 Digimarc Corporation Graphics processing system employing embedded code signals
JP2956473B2 (ja) * 1994-04-21 1999-10-04 日本電気株式会社 ベクトル量子化装置
US8094949B1 (en) 1994-10-21 2012-01-10 Digimarc Corporation Music methods and systems
US6560349B1 (en) 1994-10-21 2003-05-06 Digimarc Corporation Audio monitoring using steganographic information
US7362775B1 (en) * 1996-07-02 2008-04-22 Wistaria Trading, Inc. Exchange mechanisms for digital information packages with bandwidth securitization, multichannel digital watermarks, and key management
DE69521597T2 (de) * 1995-03-08 2002-07-11 Generalmusic S.P.A., San Giovanni In Marignano Vorrichtung mit Mikroprocessor zur Auswahl und Erkennung von Musikstücken
US7805500B2 (en) * 1995-05-08 2010-09-28 Digimarc Corporation Network linking methods and apparatus
US7224819B2 (en) 1995-05-08 2007-05-29 Digimarc Corporation Integrating digital watermarks in multimedia content
US7486799B2 (en) * 1995-05-08 2009-02-03 Digimarc Corporation Methods for monitoring audio and images on the internet
US6760463B2 (en) * 1995-05-08 2004-07-06 Digimarc Corporation Watermarking methods and media
US5613004A (en) 1995-06-07 1997-03-18 The Dice Company Steganographic method and device
US8429205B2 (en) * 1995-07-27 2013-04-23 Digimarc Corporation Associating data with media signals in media signal systems through auxiliary data steganographically embedded in the media signals
US6408331B1 (en) 1995-07-27 2002-06-18 Digimarc Corporation Computer linking methods using encoded graphics
US6965682B1 (en) 1999-05-19 2005-11-15 Digimarc Corp Data transmission by watermark proxy
US6411725B1 (en) * 1995-07-27 2002-06-25 Digimarc Corporation Watermark enabled video objects
US7562392B1 (en) * 1999-05-19 2009-07-14 Digimarc Corporation Methods of interacting with audio and ambient music
US7171018B2 (en) * 1995-07-27 2007-01-30 Digimarc Corporation Portable devices and methods employing digital watermarking
US6505160B1 (en) 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
US6577746B1 (en) 1999-12-28 2003-06-10 Digimarc Corporation Watermark-based object linking and embedding
US5712979A (en) * 1995-09-20 1998-01-27 Infonautics Corporation Method and apparatus for attaching navigational history information to universal resource locator links on a world wide web page
US5819285A (en) * 1995-09-20 1998-10-06 Infonautics Corporation Apparatus for capturing, storing and processing co-marketing information associated with a user of an on-line computer service using the world-wide-web.
US5812769A (en) * 1995-09-20 1998-09-22 Infonautics Corporation Method and apparatus for redirecting a user to a new location on the world wide web using relative universal resource locators
US5717860A (en) * 1995-09-20 1998-02-10 Infonautics Corporation Method and apparatus for tracking the navigation path of a user on the world wide web
JPH0990974A (ja) * 1995-09-25 1997-04-04 Nippon Telegr & Teleph Corp <Ntt> 信号処理方法
US7664263B2 (en) 1998-03-24 2010-02-16 Moskowitz Scott A Method for combining transfer functions with predetermined key creation
US6205249B1 (en) 1998-04-02 2001-03-20 Scott A. Moskowitz Multiple transform utilization and applications for secure digital watermarking
US7159116B2 (en) 1999-12-07 2007-01-02 Blue Spike, Inc. Systems, methods and devices for trusted transactions
US7457962B2 (en) 1996-07-02 2008-11-25 Wistaria Trading, Inc Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US5889868A (en) * 1996-07-02 1999-03-30 The Dice Company Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US7095874B2 (en) 1996-07-02 2006-08-22 Wistaria Trading, Inc. Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US7346472B1 (en) * 2000-09-07 2008-03-18 Blue Spike, Inc. Method and device for monitoring and analyzing signals
US7177429B2 (en) 2000-12-07 2007-02-13 Blue Spike, Inc. System and methods for permitting open access to data objects and for securing data within the data objects
US6088455A (en) * 1997-01-07 2000-07-11 Logan; James D. Methods and apparatus for selectively reproducing segments of broadcast programming
US5892536A (en) * 1996-10-03 1999-04-06 Personal Audio Systems and methods for computer enhanced broadcast monitoring
US7055166B1 (en) 1996-10-03 2006-05-30 Gotuit Media Corp. Apparatus and methods for broadcast monitoring
US5986692A (en) * 1996-10-03 1999-11-16 Logan; James D. Systems and methods for computer enhanced broadcast monitoring
US7751596B2 (en) * 1996-11-12 2010-07-06 Digimarc Corporation Methods and arrangements employing digital content items
US7730317B2 (en) 1996-12-20 2010-06-01 Wistaria Trading, Inc. Linear predictive coding implementation of digital watermarks
US6708146B1 (en) 1997-01-03 2004-03-16 Telecommunications Research Laboratories Voiceband signal classifier
JP3584458B2 (ja) * 1997-10-31 2004-11-04 ソニー株式会社 パターン認識装置およびパターン認識方法
US7689532B1 (en) 2000-07-20 2010-03-30 Digimarc Corporation Using embedded data with file sharing
US6263031B1 (en) * 1998-04-29 2001-07-17 Hughes Electronics Corp. Method and apparatus for signal burst classification
DE19821273B4 (de) * 1998-05-13 2006-10-05 Deutsche Telekom Ag Meßverfahren zur gehörrichtigen Qualitätsbewertung von codierten Audiosignalen
US7644282B2 (en) 1998-05-28 2010-01-05 Verance Corporation Pre-processed information embedding system
US7664264B2 (en) 1999-03-24 2010-02-16 Blue Spike, Inc. Utilizing data reduction in steganographic and cryptographic systems
US8055588B2 (en) * 1999-05-19 2011-11-08 Digimarc Corporation Digital media methods
US8752118B1 (en) 1999-05-19 2014-06-10 Digimarc Corporation Audio and video content-based methods
US7565294B2 (en) * 1999-05-19 2009-07-21 Digimarc Corporation Methods and systems employing digital content
US6895514B1 (en) * 1999-06-25 2005-05-17 Lucent Technologies Inc. Method and apparatus for achieving secure password access
GR1003625B (el) * 1999-07-08 2001-08-31 Μεθοδος χημικης αποθεσης συνθετων επικαλυψεων αγωγιμων πολυμερων σε επιφανειες κραματων αλουμινιου
US7475246B1 (en) 1999-08-04 2009-01-06 Blue Spike, Inc. Secure personal content server
JP3601371B2 (ja) 1999-09-27 2004-12-15 ヤマハ株式会社 波形生成方法及び装置
US6671407B1 (en) 1999-10-19 2003-12-30 Microsoft Corporation System and method for hashing digital images
CA2310769C (en) * 1999-10-27 2013-05-28 Nielsen Media Research, Inc. Audio signature extraction and correlation
KR100364753B1 (ko) * 1999-11-19 2002-12-16 엘지전자 주식회사 칼라 히스토그램의 빈값 양자화 방법
JP2003520506A (ja) * 2000-01-13 2003-07-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ノイズリダクション
US6577346B1 (en) * 2000-01-24 2003-06-10 Webtv Networks, Inc. Recognizing a pattern in a video segment to identify the video segment
US6737957B1 (en) 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
US6834308B1 (en) 2000-02-17 2004-12-21 Audible Magic Corporation Method and apparatus for identifying media content presented on a media playing device
US6453252B1 (en) * 2000-05-15 2002-09-17 Creative Technology Ltd. Process for identifying audio content
US6970886B1 (en) * 2000-05-25 2005-11-29 Digimarc Corporation Consumer driven methods for associating content indentifiers with related web addresses
US6990453B2 (en) 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
US7853664B1 (en) * 2000-07-31 2010-12-14 Landmark Digital Services Llc Method and system for purchasing pre-recorded music
US8205237B2 (en) 2000-09-14 2012-06-19 Cox Ingemar J Identifying works, using a sub-linear time search, such as an approximate nearest neighbor search, for initiating a work-based action, such as an action on the internet
US8010988B2 (en) * 2000-09-14 2011-08-30 Cox Ingemar J Using features extracted from an audio and/or video work to obtain information about the work
US7127615B2 (en) 2000-09-20 2006-10-24 Blue Spike, Inc. Security based on subliminal and supraliminal channels for data objects
US7277766B1 (en) * 2000-10-24 2007-10-02 Moodlogic, Inc. Method and system for analyzing digital audio files
FR2815760B1 (fr) * 2000-10-24 2003-01-24 Philippe Ecrement Procede de constitution d'un signal numerique representatif d'un signal sonore et procede de reconnaissance d'un signal sonore
US7562012B1 (en) * 2000-11-03 2009-07-14 Audible Magic Corporation Method and apparatus for creating a unique audio signature
DE10058811A1 (de) * 2000-11-27 2002-06-13 Philips Corp Intellectual Pty Verfahren zur Identifizierung von Musikstücken
US20020072982A1 (en) 2000-12-12 2002-06-13 Shazam Entertainment Ltd. Method and system for interacting with a user in an experiential environment
DE10109648C2 (de) * 2001-02-28 2003-01-30 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
DE10134471C2 (de) * 2001-02-28 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
US7359889B2 (en) 2001-03-02 2008-04-15 Landmark Digital Services Llc Method and apparatus for automatically creating database for use in automated media recognition system
TW582022B (en) * 2001-03-14 2004-04-01 Ibm A method and system for the automatic detection of similar or identical segments in audio recordings
US7363278B2 (en) * 2001-04-05 2008-04-22 Audible Magic Corporation Copyright detection and protection system and method
DE10117870B4 (de) * 2001-04-10 2005-06-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Überführen eines Musiksignals in eine Noten-basierte Beschreibung und Verfahren und Vorrichtung zum Referenzieren eines Musiksignals in einer Datenbank
US6996273B2 (en) * 2001-04-24 2006-02-07 Microsoft Corporation Robust recognizer of perceptually similar content
US7020775B2 (en) * 2001-04-24 2006-03-28 Microsoft Corporation Derivation and quantization of robust non-local characteristics for blind watermarking
US6975743B2 (en) * 2001-04-24 2005-12-13 Microsoft Corporation Robust and stealthy video watermarking into regions of successive frames
US7356188B2 (en) * 2001-04-24 2008-04-08 Microsoft Corporation Recognizer of text-based work
US6973574B2 (en) * 2001-04-24 2005-12-06 Microsoft Corp. Recognizer of audio-content in digital signals
US7046819B2 (en) 2001-04-25 2006-05-16 Digimarc Corporation Encoded reference signal for digital watermarks
US20060206478A1 (en) * 2001-05-16 2006-09-14 Pandora Media, Inc. Playlist generating methods
US7003515B1 (en) * 2001-05-16 2006-02-21 Pandora Media, Inc. Consumer item matching method and system
US7962482B2 (en) * 2001-05-16 2011-06-14 Pandora Media, Inc. Methods and systems for utilizing contextual feedback to generate and modify playlists
US20060212442A1 (en) * 2001-05-16 2006-09-21 Pandora Media, Inc. Methods of Presenting and Providing Content to a User
US6993532B1 (en) 2001-05-30 2006-01-31 Microsoft Corporation Auto playlist generator
DE10133333C1 (de) * 2001-07-10 2002-12-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines Fingerabdrucks und Verfahren und Vorrichtung zum Identifizieren eines Audiosignals
US7529659B2 (en) * 2005-09-28 2009-05-05 Audible Magic Corporation Method and apparatus for identifying an unknown work
US6968337B2 (en) * 2001-07-10 2005-11-22 Audible Magic Corporation Method and apparatus for identifying an unknown work
US7328153B2 (en) * 2001-07-20 2008-02-05 Gracenote, Inc. Automatic identification of sound recordings
US7877438B2 (en) * 2001-07-20 2011-01-25 Audible Magic Corporation Method and apparatus for identifying new media content
US8972481B2 (en) * 2001-07-20 2015-03-03 Audible Magic, Inc. Playlist generation method and apparatus
US6724914B2 (en) * 2001-10-16 2004-04-20 Digimarc Corporation Progressive watermark decoding on a distributed computing platform
US20030135623A1 (en) * 2001-10-23 2003-07-17 Audible Magic, Inc. Method and apparatus for cache promotion
US7065544B2 (en) * 2001-11-29 2006-06-20 Hewlett-Packard Development Company, L.P. System and method for detecting repetitions in a multimedia stream
US6995309B2 (en) * 2001-12-06 2006-02-07 Hewlett-Packard Development Company, L.P. System and method for music identification
US6714605B2 (en) 2002-04-22 2004-03-30 Cognio, Inc. System and method for real-time spectrum analysis in a communication device
US6850735B2 (en) * 2002-04-22 2005-02-01 Cognio, Inc. System and method for signal classiciation of signals in a frequency band
US7287275B2 (en) 2002-04-17 2007-10-23 Moskowitz Scott A Methods, systems and devices for packet watermarking and efficient provisioning of bandwidth
US7254191B2 (en) * 2002-04-22 2007-08-07 Cognio, Inc. System and method for real-time spectrum analysis in a radio device
WO2003090376A1 (en) * 2002-04-22 2003-10-30 Cognio, Inc. System and method for classifying signals occuring in a frequency band
US7292656B2 (en) * 2002-04-22 2007-11-06 Cognio, Inc. Signal pulse detection scheme for use in real-time spectrum analysis
CA2483104C (en) * 2002-04-25 2011-06-21 Shazam Entertainment, Ltd. Robust and invariant audio pattern matching
US7082394B2 (en) * 2002-06-25 2006-07-25 Microsoft Corporation Noise-robust feature extraction using multi-layer principal component analysis
US7006703B2 (en) * 2002-06-28 2006-02-28 Microsoft Corporation Content recognizer via probabilistic mirror distribution
US7095873B2 (en) 2002-06-28 2006-08-22 Microsoft Corporation Watermarking via quantization of statistics of overlapping regions
DE50214167D1 (de) * 2002-07-10 2010-03-04 Palm Inc Verfahren zum Auffinden einer Tonfolge
US20040091111A1 (en) * 2002-07-16 2004-05-13 Levy Kenneth L. Digital watermarking and fingerprinting applications
JP2005534051A (ja) 2002-07-22 2005-11-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号エンコーダのタイプ決定
US7171161B2 (en) * 2002-07-30 2007-01-30 Cognio, Inc. System and method for classifying signals using timing templates, power templates and other techniques
US8171567B1 (en) * 2002-09-04 2012-05-01 Tracer Detection Technology Corp. Authentication method and system
CA2499967A1 (en) 2002-10-15 2004-04-29 Verance Corporation Media monitoring, management and information system
EP1437711A1 (de) * 2002-12-17 2004-07-14 Sony France S.A. Verfahren und Vorrichtung zur Erzeugung einer Funktion um den globalen charakteristischen Wert eines Signalinhaltes zu erzeugen
EP1431956A1 (de) * 2002-12-17 2004-06-23 Sony France S.A. Verfahren und Vorrichtung zur Erzeugung einer Funktion um den globalen charakteristischen Wert eines Signalinhalts zu gewinnen
US6958103B2 (en) * 2002-12-23 2005-10-25 Kimberly-Clark Worldwide, Inc. Entangled fabrics containing staple fibers
US8332326B2 (en) * 2003-02-01 2012-12-11 Audible Magic Corporation Method and apparatus to identify a work received by a processing system
AU2003216230A1 (en) 2003-02-10 2004-09-06 Nielsen Media Research, Inc. Methods and apparatus to adaptively gather audience information data
US7606790B2 (en) 2003-03-03 2009-10-20 Digimarc Corporation Integrating and enhancing searching of media content and biometric databases
US20040208169A1 (en) * 2003-04-18 2004-10-21 Reznik Yuriy A. Digital audio signal compression method and apparatus
US7742926B2 (en) 2003-04-18 2010-06-22 Realnetworks, Inc. Digital audio signal compression method and apparatus
US7349663B1 (en) * 2003-04-24 2008-03-25 Leave A Little Room Foundation Internet radio station and disc jockey system
DE60334413D1 (de) * 2003-05-21 2010-11-11 Ericsson Telefon Ab L M Verfahren und system zur unzweideutigen winkelauflösung einer spärlichen breitbandantennengruppe
US7035593B2 (en) * 2003-07-28 2006-04-25 Cognio, Inc. Signal classification methods for scanning receiver and other applications
US20070039018A1 (en) * 2005-08-09 2007-02-15 Verance Corporation Apparatus, systems and methods for broadcast advertising stewardship
US20060239501A1 (en) 2005-04-26 2006-10-26 Verance Corporation Security enhancements of digital watermarks for multi-media content
US7369677B2 (en) 2005-04-26 2008-05-06 Verance Corporation System reactions to the detection of embedded watermarks in a digital host content
US9055239B2 (en) * 2003-10-08 2015-06-09 Verance Corporation Signal continuity assessment using embedded watermarks
US7831832B2 (en) * 2004-01-06 2010-11-09 Microsoft Corporation Digital goods representation based upon matrix invariances
US20050165690A1 (en) * 2004-01-23 2005-07-28 Microsoft Corporation Watermarking via quantization of rational statistics of regions
US7852259B2 (en) 2004-01-23 2010-12-14 Telefonaktiebolaget Lm Ericsson (Publ) Clutter filtering
EP2408126A1 (de) 2004-02-19 2012-01-18 Landmark Digital Services LLC Verfahren und Vorrichtung zur Identifikation einer Rundfunkquelle
US8688248B2 (en) * 2004-04-19 2014-04-01 Shazam Investments Limited Method and system for content sampling and identification
WO2005101998A2 (en) 2004-04-19 2005-11-03 Landmark Digital Services Llc Content sampling and identification
US7770014B2 (en) * 2004-04-30 2010-08-03 Microsoft Corporation Randomized signal transforms and their applications
WO2006012241A2 (en) 2004-06-24 2006-02-02 Landmark Digital Services Llc Method of characterizing the overlap of two media segments
US7873521B2 (en) * 2004-07-09 2011-01-18 Nippon Telegraph And Telephone Corporation Sound signal detection system, sound signal detection server, image signal search apparatus, image signal search method, image signal search program and medium, signal search apparatus, signal search method and signal search program and medium
US8130746B2 (en) 2004-07-28 2012-03-06 Audible Magic Corporation System for distributing decoy content in a peer to peer network
US7567899B2 (en) * 2004-12-30 2009-07-28 All Media Guide, Llc Methods and apparatus for audio recognition
US7451078B2 (en) * 2004-12-30 2008-11-11 All Media Guide, Llc Methods and apparatus for identifying media objects
DE602005021047D1 (de) * 2005-01-21 2010-06-17 Unltd Media Gmbh Vervahren zum Erzeugen eines Abdrucks eines Audiosignals
WO2006086556A2 (en) 2005-02-08 2006-08-17 Landmark Digital Services Llc Automatic identfication of repeated material in audio signals
JP4332129B2 (ja) * 2005-04-20 2009-09-16 富士通株式会社 文書分類プログラム、文書分類方法および文書分類装置
US20060242198A1 (en) * 2005-04-22 2006-10-26 Microsoft Corporation Methods, computer-readable media, and data structures for building an authoritative database of digital audio identifier elements and identifying media items
US7647128B2 (en) * 2005-04-22 2010-01-12 Microsoft Corporation Methods, computer-readable media, and data structures for building an authoritative database of digital audio identifier elements and identifying media items
US20060270371A1 (en) * 2005-05-31 2006-11-30 Sugar Gary L Tracking short-term maximum power spectrum density for improved visibility of low duty cycle signals
WO2006135986A1 (en) * 2005-06-24 2006-12-28 Monash University Speech analysis system
US8020004B2 (en) 2005-07-01 2011-09-13 Verance Corporation Forensic marking using a common customization function
US8781967B2 (en) * 2005-07-07 2014-07-15 Verance Corporation Watermarking in an encrypted domain
US20070076869A1 (en) * 2005-10-03 2007-04-05 Microsoft Corporation Digital goods representation based upon matrix invariants using non-negative matrix factorizations
US20070162761A1 (en) 2005-12-23 2007-07-12 Davis Bruce L Methods and Systems to Help Detect Identity Fraud
DE102006004202B4 (de) * 2006-01-27 2008-02-14 Nec Europe Ltd. Verfahren zum Schutz von SIP basierten Anwendungen
FR2898415B1 (fr) * 2006-03-09 2009-01-16 Thales Sa Procede d'identification par profilometrie laser
US7735101B2 (en) 2006-03-28 2010-06-08 Cisco Technology, Inc. System allowing users to embed comments at specific points in time into media presentation
US20070239675A1 (en) * 2006-03-29 2007-10-11 Microsoft Corporation Web search media service
MX2007015979A (es) * 2006-03-31 2009-04-07 Nielsen Media Res Inc Metodos, sistemas y aparato para medicion de multiples fines.
EP2016694B1 (de) * 2006-05-09 2019-03-20 Cognio, Inc. System und verfahren zur identifikation drahtloser geräte über impuls-fingerabdrücke und sequenzanalyse
US7873514B2 (en) * 2006-08-11 2011-01-18 Ntt Docomo, Inc. Method for quantizing speech and audio through an efficient perceptually relevant search of multiple quantization patterns
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US8738749B2 (en) 2006-08-29 2014-05-27 Digimarc Corporation Content monitoring and host compliance evaluation
US8707459B2 (en) 2007-01-19 2014-04-22 Digimarc Corporation Determination of originality of content
ES2433966T3 (es) 2006-10-03 2013-12-13 Shazam Entertainment, Ltd. Método para caudal alto de identificación de contenido de radiodifusión distribuido
US9179200B2 (en) 2007-03-14 2015-11-03 Digimarc Corporation Method and system for determining content treatment
US10242415B2 (en) 2006-12-20 2019-03-26 Digimarc Corporation Method and system for determining content treatment
US8060372B2 (en) * 2007-02-20 2011-11-15 The Nielsen Company (Us), Llc Methods and appratus for characterizing media
US8453170B2 (en) * 2007-02-27 2013-05-28 Landmark Digital Services Llc System and method for monitoring and recognizing broadcast data
US8458737B2 (en) * 2007-05-02 2013-06-04 The Nielsen Company (Us), Llc Methods and apparatus for generating signatures
US7840177B2 (en) * 2007-05-23 2010-11-23 Landmark Digital Services, Llc Device for monitoring multiple broadcast signals
JP2008009442A (ja) * 2007-07-23 2008-01-17 Video Research:Kk 音声データ処理方法
US8006314B2 (en) 2007-07-27 2011-08-23 Audible Magic Corporation System for identifying content of digital data
US7917347B2 (en) * 2007-10-30 2011-03-29 International Business Machines Corporation Generating a worst case current waveform for testing of integrated circuit devices
JP5414684B2 (ja) 2007-11-12 2014-02-12 ザ ニールセン カンパニー (ユー エス) エルエルシー 音声透かし、透かし検出、および透かし抽出を実行する方法および装置
US8457951B2 (en) 2008-01-29 2013-06-04 The Nielsen Company (Us), Llc Methods and apparatus for performing variable black length watermarking of media
CN102007714B (zh) 2008-03-05 2013-01-02 尼尔森(美国)有限公司 生成签名的方法和装置
WO2009151578A2 (en) * 2008-06-09 2009-12-17 The Board Of Trustees Of The University Of Illinois Method and apparatus for blind signal recovery in noisy, reverberant environments
US8259938B2 (en) 2008-06-24 2012-09-04 Verance Corporation Efficient and secure forensic marking in compressed
US8199651B1 (en) 2009-03-16 2012-06-12 Audible Magic Corporation Method and system for modifying communication flows at a port level
US8712109B2 (en) * 2009-05-08 2014-04-29 Microsoft Corporation Pose-variant face recognition using multiscale local descriptors
EP2433391A4 (de) * 2009-05-21 2013-01-23 Digimarc Corp Kombination aus wasserzeichen und fingerabdruck
US10949458B2 (en) * 2009-05-29 2021-03-16 Inscape Data, Inc. System and method for improving work load management in ACR television monitoring system
US8769584B2 (en) 2009-05-29 2014-07-01 TVI Interactive Systems, Inc. Methods for displaying contextually targeted content on a connected television
US9449090B2 (en) 2009-05-29 2016-09-20 Vizio Inscape Technologies, Llc Systems and methods for addressing a media database using distance associative hashing
US9094715B2 (en) 2009-05-29 2015-07-28 Cognitive Networks, Inc. Systems and methods for multi-broadcast differentiation
US8620967B2 (en) * 2009-06-11 2013-12-31 Rovi Technologies Corporation Managing metadata for occurrences of a recording
US8738354B2 (en) * 2009-06-19 2014-05-27 Microsoft Corporation Trans-lingual representation of text documents
US20110041154A1 (en) * 2009-08-14 2011-02-17 All Media Guide, Llc Content Recognition and Synchronization on a Television or Consumer Electronics Device
US8161071B2 (en) 2009-09-30 2012-04-17 United Video Properties, Inc. Systems and methods for audio asset storage and management
US8677400B2 (en) * 2009-09-30 2014-03-18 United Video Properties, Inc. Systems and methods for identifying audio content using an interactive media guidance application
US20110078020A1 (en) * 2009-09-30 2011-03-31 Lajoie Dan Systems and methods for identifying popular audio assets
US8521779B2 (en) 2009-10-09 2013-08-27 Adelphoi Limited Metadata record generation
US20110173185A1 (en) * 2010-01-13 2011-07-14 Rovi Technologies Corporation Multi-stage lookup for rolling audio recognition
US8886531B2 (en) * 2010-01-13 2014-11-11 Rovi Technologies Corporation Apparatus and method for generating an audio fingerprint and using a two-stage query
US9026034B2 (en) 2010-05-04 2015-05-05 Project Oda, Inc. Automatic detection of broadcast programming
WO2011140221A1 (en) * 2010-05-04 2011-11-10 Shazam Entertainment Ltd. Methods and systems for synchronizing media
EP2580750B1 (de) 2010-06-09 2014-05-14 Adelphoi Limited System und verfahren zur erkennung von audiomedien
US9607131B2 (en) 2010-09-16 2017-03-28 Verance Corporation Secure and efficient content screening in a networked environment
EP2735141A4 (de) 2011-07-18 2015-03-04 Viggle Inc System und verfahren zur verfolgung und belohnung einer medien- und unterhaltungsmittelverwendung mit praktisch in echtzeit erfolgenden belohnungen
EP2734997A4 (de) 2011-07-20 2015-05-20 Tata Consultancy Services Ltd Verfahren und system zur erkennung der grenzen von koartikulationseinheiten aus isolierter sprache
US8682026B2 (en) 2011-11-03 2014-03-25 Verance Corporation Efficient extraction of embedded watermarks in the presence of host content distortions
US8533481B2 (en) 2011-11-03 2013-09-10 Verance Corporation Extraction of embedded watermarks from a host content based on extrapolation techniques
US8923548B2 (en) 2011-11-03 2014-12-30 Verance Corporation Extraction of embedded watermarks from a host content using a plurality of tentative watermarks
US8615104B2 (en) 2011-11-03 2013-12-24 Verance Corporation Watermark extraction based on tentative watermarks
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US9323902B2 (en) 2011-12-13 2016-04-26 Verance Corporation Conditional access using embedded watermarks
US9547753B2 (en) 2011-12-13 2017-01-17 Verance Corporation Coordinated watermarking
US9292894B2 (en) 2012-03-14 2016-03-22 Digimarc Corporation Content recognition and synchronization using local caching
US8825188B2 (en) 2012-06-04 2014-09-02 Troy Christopher Stone Methods and systems for identifying content types
US9282366B2 (en) 2012-08-13 2016-03-08 The Nielsen Company (Us), Llc Methods and apparatus to communicate audience measurement information
US9571606B2 (en) 2012-08-31 2017-02-14 Verance Corporation Social media viewing system
US8977374B1 (en) * 2012-09-12 2015-03-10 Google Inc. Geometric and acoustic joint learning
US8869222B2 (en) 2012-09-13 2014-10-21 Verance Corporation Second screen content
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
US9106964B2 (en) 2012-09-13 2015-08-11 Verance Corporation Enhanced content distribution using advertisements
US9081778B2 (en) 2012-09-25 2015-07-14 Audible Magic Corporation Using digital fingerprints to associate data with a work
US9262794B2 (en) 2013-03-14 2016-02-16 Verance Corporation Transactional video marking system
US9251549B2 (en) 2013-07-23 2016-02-02 Verance Corporation Watermark extractor enhancements based on payload ranking
US9208334B2 (en) 2013-10-25 2015-12-08 Verance Corporation Content management using multiple abstraction layers
US9955192B2 (en) 2013-12-23 2018-04-24 Inscape Data, Inc. Monitoring individual viewing of television events using tracking pixels and cookies
WO2015138798A1 (en) 2014-03-13 2015-09-17 Verance Corporation Interactive content acquisition using embedded codes
US9699499B2 (en) 2014-04-30 2017-07-04 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US9905233B1 (en) 2014-08-07 2018-02-27 Digimarc Corporation Methods and apparatus for facilitating ambient content recognition using digital watermarks, and related arrangements
WO2016123495A1 (en) 2015-01-30 2016-08-04 Vizio Inscape Technologies, Llc Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device
JP5956624B1 (ja) * 2015-02-02 2016-07-27 西日本高速道路エンジニアリング四国株式会社 異常音の検出方法及びその検出値を用いた構造物の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法
WO2016168556A1 (en) 2015-04-17 2016-10-20 Vizio Inscape Technologies, Llc Systems and methods for reducing data density in large datasets
EP3286757B1 (de) 2015-04-24 2019-10-23 Cyber Resonance Corporation Verfahren und systeme zur durchführung einer signalanalyse zur identifizierung von inhaltstypen
JP6763019B2 (ja) 2015-07-16 2020-09-30 インスケイプ データ インコーポレイテッド メディアセグメント識別効率向上のために探索索引を区分するためのシステムおよび方法
MX384108B (es) 2015-07-16 2025-03-14 Inscape Data Inc Sistema y método para mejorar la gestión de la carga de trabajo en el sistema de monitoreo de televisión acr.
BR112018000716B1 (pt) 2015-07-16 2023-03-28 Inscape Data, Inc Método e dispositivo de computação para detecção de segmentos de mídia comuns
US10080062B2 (en) 2015-07-16 2018-09-18 Inscape Data, Inc. Optimizing media fingerprint retention to improve system resource utilization
US10397749B1 (en) * 2017-11-09 2019-08-27 Sprint Communications Company L.P. Systems and methods for detection, identification, and use of environmental audio signatures
US11107297B2 (en) * 2018-12-12 2021-08-31 Simmonds Precision Products, Inc. Merging discrete time signals
US11269635B1 (en) * 2019-10-21 2022-03-08 Accenture Global Solutions Limited Hardware efficient statistical moment computation
US12198711B2 (en) 2020-11-23 2025-01-14 Cyber Resonance Corporation Methods and systems for processing recorded audio content to enhance speech

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3919479A (en) * 1972-09-21 1975-11-11 First National Bank Of Boston Broadcast signal identification system
DE2536640C3 (de) * 1975-08-16 1979-10-11 Philips Patentverwaltung Gmbh, 2000 Hamburg Anordnung zur Erkennung von Geräuschen
US4053710A (en) * 1976-03-01 1977-10-11 Ncr Corporation Automatic speaker verification systems employing moment invariants
JPS542050A (en) 1977-06-07 1979-01-09 Nec Corp Block coding and decoding system
JPS5525150A (en) * 1978-08-10 1980-02-22 Nec Corp Pattern recognition unit
US4450531A (en) * 1982-09-10 1984-05-22 Ensco, Inc. Broadcast signal recognition system and method
US4697209A (en) 1984-04-26 1987-09-29 A. C. Nielsen Company Methods and apparatus for automatically identifying programs viewed or recorded
US4677466A (en) 1985-07-29 1987-06-30 A. C. Nielsen Company Broadcast program identification method and apparatus
JPH067343B2 (ja) * 1987-02-23 1994-01-26 株式会社東芝 パタ−ン識別装置
US4843562A (en) * 1987-06-24 1989-06-27 Broadcast Data Systems Limited Partnership Broadcast information classification system and method

Also Published As

Publication number Publication date
CA2041754C (en) 2004-12-28
EP0480010A1 (de) 1992-04-15
JPH05501166A (ja) 1993-03-04
CA2041754A1 (en) 1991-11-03
US5210820A (en) 1993-05-11
HK133697A (en) 1997-10-24
EP0480010B1 (de) 1996-09-11
DE69122017D1 (de) 1996-10-17
ES2091328T3 (es) 1996-11-01
ATE142815T1 (de) 1996-09-15
JP3130926B2 (ja) 2001-01-31
WO1991017540A1 (en) 1991-11-14

Similar Documents

Publication Publication Date Title
DE69122017T2 (de) Verfahren und vorrichtung zur signalerkennung
DE3878423T2 (de) System und verfahren zur klassifizierung von rundfunkinformationen.
DE3306730C2 (de)
DE69814104T2 (de) Aufteilung von texten und identifizierung von themen
EP1405222B9 (de) Verfahren und vorrichtung zum erzeugen eines fingerabdrucks und verfahren und vorrichtung zum identifizieren eines audiosignals
EP1407446B1 (de) Verfahren und vorrichtung zum charakterisieren eines signals und zum erzeugen eines indexierten signals
DE3878001T2 (de) Spracherkennungseinrichtung unter anwendung von phonemermittlung.
DE10232916B4 (de) Vorrichtung und Verfahren zum Charakterisieren eines Informationssignals
EP1368805B1 (de) Verfahren und vorrichtung zum charakterisieren eines signals und verfahren und vorrichtung zum erzeugen eines indexierten signals
EP1606798B1 (de) Vorrichtung und verfahren zum analysieren eines audio-informationssignals
DE60018886T2 (de) Adaptive Wavelet-Extraktion für die Spracherkennung
DE102004036154B3 (de) Vorrichtung und Verfahren zur robusten Klassifizierung von Audiosignalen sowie Verfahren zu Einrichtung und Betrieb einer Audiosignal-Datenbank sowie Computer-Programm
DE60120417T2 (de) Verfahren zur suche in einer audiodatenbank
DE69326044T2 (de) Verfahren zur Erkennung von Sprachsignalen
DE2825110A1 (de) Verfahren zur erkennung kontinuierlicher sprachsignale
DE2825186A1 (de) Verfahren zur verringerung der falschanzeige in spracherkennungsverfahren fuer kontinuierliche sprachsignale
EP1371055A2 (de) Vorrichtung zum analysieren eines audiosignals hinsichtlich von rhythmusinformationen des audiosignals unter verwendung einer autokorrelationsfunktion
EP0182989B1 (de) Normalisierung von Sprachsignalen
DE3733391A1 (de) Verfahren zur spracherkennung
Li et al. Correlation characteristics and dimensionality of speech spectra
DE102004028693B4 (de) Vorrichtung und Verfahren zum Bestimmen eines Akkordtyps, der einem Testsignal zugrunde liegt
DE102004049517B4 (de) Extraktion einer einem Audiosignal zu Grunde liegenden Melodie
EP1377924B1 (de) VERFAHREN UND VORRICHTUNG ZUM EXTRAHIEREN EINER SIGNALKENNUNG, VERFAHREN UND VORRICHTUNG ZUM ERZEUGEN EINER DAZUGEHÖRIGEN DATABANK und Verfahren und Vorrichtung zum Referenzieren eines Such-Zeitsignals
EP1743324B1 (de) Vorrichtung und verfahren zum analysieren eines informationssignals

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee