DE69122017T2 - Verfahren und vorrichtung zur signalerkennung - Google Patents
Verfahren und vorrichtung zur signalerkennungInfo
- Publication number
- DE69122017T2 DE69122017T2 DE69122017T DE69122017T DE69122017T2 DE 69122017 T2 DE69122017 T2 DE 69122017T2 DE 69122017 T DE69122017 T DE 69122017T DE 69122017 T DE69122017 T DE 69122017T DE 69122017 T2 DE69122017 T2 DE 69122017T2
- Authority
- DE
- Germany
- Prior art keywords
- signal
- feature vector
- values
- value
- quantization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0033—Recording/reproducing or transmission of music for electrophonic musical instruments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2240/00—Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
- G10H2240/121—Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
- G10H2240/131—Library retrieval, i.e. searching a database or selecting a specific musical piece, segment, pattern, rule or parameter set
- G10H2240/141—Library retrieval matching, i.e. any of the steps of matching an inputted segment or phrase with musical database contents, e.g. query by humming, singing or playing; the steps may include, e.g. musical analysis of the input, musical feature extraction, query formulation, or details of the retrieval process
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Image Analysis (AREA)
- Complex Calculations (AREA)
- Geophysics And Detection Of Objects (AREA)
- Radar Systems Or Details Thereof (AREA)
Description
- Diese Erfindung betrifft eine Vorrichtung und ein Verfahren zur Erkennung von Signalen, insbesondere eine Vorrichtung und ein Verfahren zur Erkennung von Signalen durch Verwendung statistischer Momente abgetasteter Signalwerte zur Erzeugung von Merkmalsvektoren und zur Quantisierung der Merkmalsvektoren zum Vergleichen des Signals mit einer vorbestimmten Signaldatenbank und zum Ableiten der Signaldatenbank.
- Obgleich die vorliegende Erfindung in Bezug auf ein System zur Erkennung von Rundfunksignalen wie beispielsweise Musik beschrieben wird, ist dies so zu verstehen, daß die Lehren dieser Anmeldung auf ein breites Spektrum von Signalerkennungsgebieten anwendbar sind.
- Die genaue Erkennung von Rundfunksignalen ist für Marketingleiter, Lizenzsammlungsagenturen, Musikpromotor usw. wichtig. Es ist wohlbekannt, daß eine breite Mannigfaltigkeit an Rechts-, Wirtschafts- und Sozialunternehmer die reguläre Überwachung von Rundfunkinformation benötigen. Alle diese Erfordernisse teilen ein gemeinsames Bedürfnis nach einer gewissen Information, beispielsweise welche Information rundfunkgesendet wird und wann. Bekanntermaßen wurden Rundfunkstationen manuell durch mehrere Hörer überwacht, welche das Rundfunkprogramm wahmehmend überwachten und manuell tabellarisierten, welche Information zu welcher Zeit rundfunkgesendet wurde. Zuverlässigkeits und Kostenprobleme haben die Anstrengungen in Richtung einer Realisierung von automatisierten Rundfunksignalerkennungssystemen angeregt. Ein anfängliches automatisiertes Verfahren umfaßte die Kodierung eines einzigen Stichwortsignals in jedem Lied und dann die Überwachung jeder Rundfunkstation, um das Stichwortsignal zu detektieren. Die zugeordnete Kodierungs- und Dekodierungsschaltung ist jedoch teuer und kompliziert und staatliche Durchführungsämter sind gegen eine Bereitstellung zusätzlicher Bandbreite, die zum Vorsehen einer großen Anzahl einziger Stichwortsignale notwendig ist.
- Ein weiterer Fortschritt auf dem Gebiet der automatisierten Rundfunksignalerkennung geht aus dem Moon et al. erteilten US-Patent Nr. 3 919 479 hervor. Bei Moon et al. wird ein Audiosignal digital abgetastet, um ein Referenzsignalsegment zu erzeugen, welches in einer Referenzbibliothek gespeichert wird. Wenn dann das Audiosignal rundfunkgesendet wird, werden sukzessive Abschnitte des Signals digitalisiert und mit dem Referenzsegment in der Bibliothek verglichen. Der Vergleich wird in einem Korrelationsprozeß ausgeführt, der ein Korrelationsfunktionssignal erzeugt. Wenn das Referenz- und Rundfunksignalsegment nicht gleich sind, resultiert eine Korrelationsfunktion relativ kleiner Amplitude. Wenn andererseits das Referenz- und Rundfunksignalsegment relativ gleich sind, wird ein großes Korrelationsfunktionssignal erzeugt. Die Amplitude des Korrelationsfunktionssignals wird abgetastet, um ein Erkennungssignal zu erzeugen, wenn die Amplitude einen vorbestimmten Schwellenpegel überschreitet.
- Das Einzelsegment-Korrelationssystem nach Moon et al. erleidet jedoch einem Signalausfall, der das System gänzlich un brauchbar macht. Auch ist das System nach Moon et al. relativ empfindlich für Zeitachsenvariationen in der Rundfunkinformation selbst. Beispielsweise ist bekannt, daß viele Diskjokkeys Rundfunklieder durch Beschleunigen des Antriebsmechanismus "komprimieren". Es ist auch bekannt, daß andere Diskjokkeys Rundfunkinformation "komprimieren" und/oder "strecken", um gewisse gewünschte Effekte bei der Hörerschaft zu erzeugen. Moon et al. versuchen, solcher Zeitachsenvariationen dadurch Herr zu werden, daß die Bandbreite des Rundfunksignals durch Hüllkurvengleichrichtung des Rundfunksignals reduziert und Hüllkurvensignale mit im wesentlichen niedrigen Signalfrequenzkomponenten, vorzugsweise im Subaudiobereich, bereitgestellt werden. Es wurde entdeckt, daß bei Verwendung des Hüllkurvensignais bei Subaudiofrequenzen während des Korrelationsprozesses die digital abgetasteten Wellenformen weniger empfindlicher für Zeitachsenvariationen sind. Jedoch sind die Verbesserungen, die durch eine solche Lösung erreicht werden können, sehr begrenzt und arbeiten nur bei Rundfunksignalen, die um einen kleinen Betrag "komprimiert" oder "gestreckt" worden sind. Außerdem ist eine solche Lösung hohen Fehlalarmraten unterworfen. Diese Nachteile machen das System nach Moon et al. für ein schnelles, genaues und billiges automatisches Rundfunksignalerkennungssystem weniger als erwünscht.
- Ein weiterer Fortschritt auf dem Gebiet der automatischen Signalerkennung geht aus dem Kenyon et al. erteilten US-Patent Nr. 4 450 531 hervor. Der gleiche Herr Kenyon ist der einzige Erfinder der vorliegenden Erfindung. Das System des '531- Patents widmet sich erfolgreich den Zuverlässigkeitsproblemen eines Einzelsegmentkorrelationssystems und den Zeitachsenvariationsproblemen, die bei bekannten Systemen in Erfahrung gebracht worden sind. Im '531-Patent wird eine Anzahl Referenzsignalsegmente aus einer Programmeinheit (Lied) extrahiert, digitalisiert, fouriertransformiert und in einer Referenzbibliothek in einem komplexen Frequenzdomänenspektrum gespeichert. Das empfangene Rundfunksignal wird dann vorgefiltert, um einen Frequenzabschnitt des Audiospektrums auszuwählen, der stabile Charakteristiken für eine Unterscheidung aufweist. Nach einer weiteren Filterung und Umwandlung in ein digitales Signal wird das Rundfunksignal fouriertransformiert und einem komplexen Multiplikationsprozeß mit Referenzsignalsegmenten unterworfen, um ein Vektorprodukt zu erhalten. Die Ergebnisse des komplexen Multiplikationsprozesses werden dann einem inversen Fouriertransformationsschritt unterworfen, um eine Korrelationsfunktion zu erhalten, die von der Frequenzin die Zeitdomäne transformiert worden ist. Diese Korrelationsfunktion wird dann normiert und die Korrelationsspitze für jedes Segment ausgewählt und der Spitzenabstand mit der Segmentlänge verglichen. Gleichzeitig wird die RMS-Leistung des mit dem Korrelationsspitzensegment komzidierenden Segments abgetastet, um das Segmentpunktleistungsmuster zu bestimmen. Infolgedessen beseitigt das '531-Patent die Nachteile eines Einzelsegment-Korrelationssystems durch das Vorsehen einer Anzahl Korrelationssegmente und Messen der Abstände zwischen den Korrelationsspitzen. Wo die Abstände passen, wird das Rundfunksignal als ähnlich dem in der Referenzbibliothek gespeicherten Signalsegment erklärt. Außerdem arbeitet der RMS- Wertvergleich so, daß er die unter Verwendung der Signalsegmente ausgeführte Klassifikation bestätigt.
- Zur Beseitigung des Zeitachsenvariationsproblems verwendet das '531-Patent einen Hüllkurvengleichrichter und ein Bandpaßfilter für die Rundfunkinformation. Das System nach dem '531-Patent ist jedoch rechenerisch sehr anspruchsvoll. Beispielsweise erfordert die Ausführung der verschiedenen Multisegmentkorrelationen einen großen Teil an Computerleistung. Da eine große Zahl an Segmenten abgetastet wird, benötigt das System nach dem '531-Patent einen guten Teil an Zeit und benötigt die Verwendung teuerer leistungsfähiger Computer.
- Ein automatisiertes Verfahren für Sprachmustererkennung geht aus dem Sakoe erteilten US-Patent Nr. 4 282 403 hervor. Sakoe offenbart ein Spracherkennungssystem, bei welchem eine Zeitfolgeeingabe aus Mustermerkmalsvektoren in eine Referenzbibliothek eingegeben wird. Das empfangene Sprachsignal wird dann einer Spektralanalyse, einer Abtastung und einer Digitalisierung unterworfen, um in eine Zeitfolge von Vektoren transformiert zu werden, welche Merkmale des Sprachtons bei jeweiligen Abtastmomenten darstellen. Für jedes Referenzmuster kann eine Zeitverzerrungsfunktion durch die Verwendung von Merkmalsvektorkomponenten weniger Kanäle verwendet werden. Die Zeitverzerrungsfunktion für jeden Referenzmuster- Merkmalsvektor wird zum Korrelieren des Eingangsmuster- Merkmalsvektors und des Referenzmuster-Merkmalsvektors verwendet. Die Eingangsmuster-Merkmalsvektorfolge wird dann mit der Referenzmuster-Merkmalsvektorfolge in Bezug auf die Zeitverzerrungsfunktion verglichen, um das gesprochene Wort zu identifizieren. Das System nach Sakoe zeitzerrt jedoch die Referenzmuster und nicht das Eingangssignal und folglich muß eine Anzahl Muster für jedes Referenzmuster berechnet werden, wodurch die Speicher- und Rechenanforderungen des Systems erhöht werden.
- Ein weiteres Signalerkennungssystem geht aus dem an Bunge erteilten US-Patent Nr. 4 432 096 hervor. Bei Bunge werden Tonund/oder Sprachsignale in ein elektrisches Signal umgewandelt und in einer Filterbank in mehrere Spektralkomponenten unterteilt. Diese Komponenten werden dann über eine kurze Zeitperiode integriert, um das Kurzzeitspektrum des Signals zu erzeugen. Die Spektralkomponenten des Signals werden an eine Zahl Musterdetektoren gegeben, welche ein Ausgangssignal nur abgeben, wenn das Kurzzeitspektrum mit dem im relevanten Musterdetektor eingestellten Muster korrespondiert. Jeder Musterdetektor hat zwei Schwellenwertdetektoren, welche ein Signal erzeugen, wenn die angelegte Eingabe zwischen den einstellbaren Schwellenwerten liegt. Infolgedessen liefern die Musterdetektoren ein Ausgangssignal nur, wenn alle Schwellenwertdetektoren aktiviert sind. Für jeden Sprachton ist ein Musterdetektor vorgesehen. Beim Erkennen einer Reihe von Tönen wird die Reihe von Adressen der Musterdetektoren, die erfolgreich ein Ausgangssignal erzeugt haben, gespeichert und danach an den Computer zum Vergleich gegeben. Es ist leicht einzusehen, daß ein derartiges System eine Zahl Musterdetektoren und eine korrespondierende leistungsfähige Berechnungseinrichtung erfordert. Überdies leidet das System nach Bunge, obgleich es eine Filterbank zum Bereitstellen eines niedrigfrequenten Ausgangssignals, das relativ unempfindlich für Zeitachsenvariationen ist, verwendet, noch an Zeitverzerrungsproblemen und einer hohen Fehlalarmrate.
- Ein neuerdings kommerzialisiertes automatisches Rundfunksignalerkennungssystem geht aus dem an Kenyon et al. erteilten US-Patent Nr. 4 843 562 hervor. Wiederum ist der gleiche Mr. Kenyon der einzige Erfinder der vorliegenden Erfindung. Tatsächlich sind spezielle Lehren aus dem '562-Patent in weiteren Abschnitten des vorliegenden Patents inkorporiert. Das '562-Patent beschreibt ein zweistufiges (grobes und feines) Klassifikationssystem unter Verwendung weniger Prozessorquellen. Gemäß dem '562-Patent wird das Rundfunksignal bandpaßgefiltert, gleichgerichtet und tiefpaßgefiltert, um mehrere Wellenformen niedriger Bandbreite zu erzeugen. Die Wellenformen werden abgetastet und die Samples werden zum Erzeugen eines Spektrogramms verwendet, welches dann mit mehreren Referenzspektrogrammen verglichen wird, die in einer Referenzbibliothek erster Stufe gespeichert sind. Die erststufigen Referenzspektrogramme werden dann in der Ordnung ihrer Ähnlichkeit mit dem erzeugten Spektrogramm aufgereiht. Als nächstes werden mehrere Referenzmuster zweiter Stufe, die mit den aufgereihten erststufigen Referenzspektrogrammen korrespondieren mit einer der analysierten Wellenformen in der vorher hergestellten Reihenfolge korreliert. Für jedes in der Referenzbibliothek zweiter Stufe gespeicherte zweitstufige Referenzmuster wird ein Korrelationswert vorgesehen. Wenn festgestellt wird, daß ein Korrelationswert einen Schwellenwert überschreitet, wird eine Erkennung erklärt und das Rundfunksignal als ähnlich mit dem zweitstufigen Referenzmuster klassifiziert, dessen Korrelationswert den Schwellenwert überschreitet. Die bei der zweitstufigen Klassifikation verwendete analysierte Wellenform ist zeitverzerrt, um Geschwindigkeitsfluktuationen im Rundfunksignal Rechnung zu tragen.
- Obgleich das System gemäß dem '562-Patent erfolgreich ist, ist es in seiner Fähigkeit der Erkennung einer großen Zahl Lieder etwas beschränkt. Beispielswiese kann das System gemäß dem '562-Patent jedes beliebiges von 600 Liedern auf einem einzelnen Kanal mit hoher Zuverlässigkeit erkennen. Das System kann gleichzeitig 5 verschiedene Kanäle überwachen. Jedoch würde ein System, welches jedes von dreitausend Liedern auf jeder von fünf gleichzeitigen Rundfunkstationen mit hoher Zuverlässigkeit identifizieren kann, ein sehr attraktives und kommerziell erfolgreiches Signalerkennungssystem darstellen. Ferner benötigt das System gemäß dem '562-Patent annähernd 64 Sekunden zum Detektieren und Klassifizieren eines Rundfunkliedes. Es wird gewünscht, diese Zeit auf 28 Sekunden zu reduzieren, um die Identifikation von Aufzeichnungen kürzerer Dauer, beispielsweise Werbung, zu ermöglichen. Bei Erhöhung der Leistungsfähigkeit ist es wichtig, die günstige kompakte Architektur des '562-Patents beizubehalten.
- Was infolgedessen benötigt wird, ist ein verbessertes System zur genauen Erkennung und Klassifizierung einer großen Zahl einmaliger Rundfunksignale auf mehreren Rundfunkkanälen gleichzeitig und mit hoher Zuverlässigkeit. Das System muß klein, billig und leicht zu betreiben sein.
- Die vorliegende Erfindung ist zum Beseitigen der Nachteile bekannter automatischer Rundfunksignalerkennungssysteme ausgebildet, während sie gleichzeitig die oben diskutierten Aufgaben löst. Außerdem ist die Erfindung auf einer breiten Mannigfaltigkeit von Signalerkennungsgebieten und nicht gerade zur Erkennung von Runfunksignalen anwendbar.
- Der Erfinder der vorliegenden Erfindung hat ein verbessertes Verfahren zur Signalerkennung entdeckt, bei welchem ein Signal empfangen und an mehreren Abtastpunkten abgetastet wird, um mehrere Signalwerte zu erzeugen. Ein statistisches Moment der Signalwerte wird dann gemäß der Formel
- berechnet, wobei N die Zahl der Abtastpunkte
- 1 < n < N
- X den Signalwert des Signals an einem Ab tastpunkt,
- µ ein Mittel der Signalwerte,
- eine Standardabweichung des Signalwer tes und
- k eine ganze Zahl < 1 bedeuten.
- Das berechnete statistische Element wird mit mehreren gespeicherten Signalidentifikationen verglichen und das empfangene Signal wird dann als ähnlich wenigstens einer der gespeicherten Signalidentifikationen erkannt.
- Vorzugsweise wird das empfangene Signal bandpaßgefiltert, gleichgerichtet und tiefpaßgefiltert, um mehrere Wellenformen niedriger Frequenz zu erzeugen. Dann werden die Wellenformen niedriger Frequenz zu mehreren Linearkombinationen von ihnen kombiniert. Jede Linearkombination wird dann abgetastet, um die mehreren Signalwerte zu erzeugen, die zum Berechnen des statistischen Moments verwendet werden.
- Vorzugsweise werden zwei statistische Momente (Asymmetrie und Wölbung) für die abgetasteten Werte jeder Linearkombination berechnet. Dann können mehrere Merkmalsvektoren abgeleitet werden, wobei jeder Merkmalsvektor den Asymmetrie- und Wölbungswert für alle Linearkombinationen innerhalb einer vorbestimmten Abtastzeitperiode enthält.
- Jeder Merkmalsvektor kann dann durch Ersetzen der Gleitkommawerte von Asymmetrie und Wölbung mit einzelnen ganzen Zahlen entsprechend einem vorbestimmten Quantisierungsmuster quantisiert werden. Nach der Quantisierung kann eine gewichtete Summe des quantisierten Vektors unter Verwendung einer nichtdezimalen Grundzahl berechnet werden. Der gewichtete Summenwert kann dann zum Adressieren einer Datenbank verwendet werden, der Signalidentifikationen entsprechend der Adresse speichert.
- Die vorliegende Erfindung schlägt auch ein System zur Erzeugung der Signaldatenbank vor, auf die zum Erkennen des empfangenen Signals zugegriffen wird. Der Prozeß der Erzeugung der Datenbank ist sehr ähnlich dem Prozeß der Erkennung des obengenannten Signals. Jedoch wird das Ziel- bzw. Sollsignal zuerst zum Bestimmen eines spektral unterschiedenen Abschnitts dieses Signals analysiert. Der spektral unterschiedene Abschnitt des Signals wird dann bandpaßgefiltert, gleichgerichtet und tiefpaßgefiltert, um die Wellenformen niedriger Frequenz zu erzeugen, von denen mehrere Linearkombinationen abgeleitet werden. Die Linearkombinationen des Spektral unterschiedenen Abschnitts werden dann einer modifizierten Abtastprozedur unterworfen, wodurch jede Linearkombination eine Anzahl mal mit einem Bewegungsfenster abgetastet wird. Die abgetasteten Werte werden dann zum Berechnen von Asymmetrie und Wölbung verwendet, so daß mehrere Referenzmerkmalsvektoren für den spektral unterschiedenen Abschnitt des Signals erzeugt werden.
- Die mehreren Merkmalsvektoren werden quantisiert, um ihre Werte durch Verbreiterung der Abstände zwischen den Vektoren in dem Merkmalshyperraum unterscheidbarer zu machen. Es sind zwei Prozeduren zur Quantisierung möglich. Als erstes kann ein Nichtüberlappungs-Quantisierungsschema angenommen werden, bei welchem die Merkmalsvektor-Signalwertpopulation gerade in mehrere Segmente, beispielsweise 5, unterteilt wird. Dann wird jeder Wert der Asymmetrie oder Wölbung in jedem Merkmalsvektor aufgenommen und einer der fünf Werte ausgezeich net. Infolgedessen wird eine Anzahl quantisierter Vektoren für jedes abgetastete Signal erzeugt. Ebenfalls möglich ist eine Überlappungsmethode der Quantisierung, bei welcher die Signalwertpopoulation der Asymmetrie und Wölbung in eine Anzahl überlappter Bereiche unterteilt wird, wobei ein Asymmetrie- oder Wölbungswert zwei Bereichen zugeordnet sein kann. Jeder Merkmalsvektor wird dann aufgenommen und es werden zwei quantisierte Vektoren erzeugt, da jeder Asymmetrie- oder Wölbungswert zwei Werte annehmen kann. Die zwei quantisierten Merkmalsvektoren werden dann permutiert, um eine weitere Anzahl quantisierter Merkmalsvektoren für die Referenzdatenbank zu erzeugen.
- Welches Quantisierungsschema auch immer angenommen wird, es wird vorzugsweise eine gewichtete Summe jedes quantisierten Vektors unter Verwendung einer nicht dezimalen Grundzahl erzeugt. Die gewichtete Summe wird dann als eine Adresse zum Zugriff auf eine Datenbank verwendet, in welcher ein Zeiger gespeichert ist, wobei der Zeiger auf eine weitere Datenbankstelle zeigt, bei welcher der Identifikationskode des Sollsignals gespeichert ist.
- Die vorteilhaften Merkmale und Eigenschaften der vorliegenden Erfindung können leicht aus der folgenden Beschreibung der gegenwärtig bevorzugten exemplarischen Ausführungsform verstanden werden, wenn diese zusammen mit den beigefügten Zeichnungen gelesen wird, in denen:
- Figur 1 ein das System gemäß der gegenwärtig bevorzugten Ausführungsform zeigendes Blockschaltbild ist,
- Figur 2 ein das Prinzip der Filterung des empfangenen Signals in vier verschiedene Frequenzbänder zeigendes Blockschaltbild ist,
- Figur 3 eine Reihe von Wellenformen darstellt, welche die in dem Prozessor nach Figur 1 ausgeführte Wellenformung zeigt,
- Figur 4 eine Reihe aus Wellenformen ist, welche vier durch den Prozessor erzeugte Merkmalsfolgen zeigt,
- Figur 5 ein Diagramm ist, welche die Überlappungsabtastung eines spektral unterschiedenen Abschnitts des Signals zur Erzeugung der Referenzbibliotheken zeigt,
- Figur 6 die durch die in Figur 5 ausgeführte Abtastung erzeugten Merkmalsvektoren darstellt,
- Figur 7 eine die Zahl unterschiedlicher Identitäten für eine gegebene Zahl von Quantisierungspegeln und einer gegebenen Zahl von Merkmalen zeigenden Vektorquantisierungstabelle ist,
- Figur 8 die Quantisierung eines Merkmalsvektors zeigt,
- Figur 9 eine Darstellung des in einem dreidimensionalen Raum aufgezeichneten quantisierten Merkmalsvektors ist,
- Figur 10 die Populationsdichte von bei einer nicht gleichförmigen Vektorquantisierung ohne Überlappung verwendeten Wölbungswerten darstellt,
- Figur 11 zeigt, wie die Merkmalsvektorquantitäten quantisierten Werten in der Population nach Figur 10 zugeordnet sind,
- Figur 12 die Populationsdichte von bei einer nicht gleichförmigen überlappungskodierten Vektorquantisierung verwendeten Wölbungswerten zeigt,
- Figur 13 zeigt, wie Merkmalsvektorquantitäten quantisierten Werten in der Population nach Figur 12 zugeordnet sind,
- Figur 14 zeigt, wie der Merkmalsvektor im überlappungskodierten Vektorquantisierungsschema quantisiert ist,
- Figur 15 zeigt, wie der quantisierte Vektor in eine gewichtete Summe umgewandelt wird, die zum Adressieren einer Datenbank zum Identifizieren eines Signals verwendet wird,
- Figur 16 ein Spitzenpegel-Flußdiagramm ist, welches ein Verfahren gemäß der bevorzugten Ausführungsform zeigt,
- Figur 17 ein Flußdiagramm ist, welches zeigt, wie die statistischen Momente berechnet werden, und
- Figur 18 ein Flußdiagramm ist, welches den Bestätigungsschritt nach Figur 16 zeigt.
- Obgleich die vorliegende Erfindung bezüglich einer Verbesserung des im '562-Patent beschriebenen Systems ist, erkennt der Fachmann durchschnittlichen Könnens auf diesem Gebiet, daß die Lehren dieser Erfindung bei einer breiten Mannigfaltigkeit von Signalerkennungsgegebenheiten angewendet werden kann. Beispielsweise findet die vorliegende Erfindung Anwendung bei Stimmenverarbeitungssystemen, Spracherkennungssystemen, akustischen Kommunikationssystemen usw..
- Zunächst wird zum Zweck von Klarstellungen ein Überblick über die Erfindung gegeben. Das '562-Patent beschreibt eine Vorrichtung und ein Verfahren, bei denen Rundfunkinformation un ter Verwendung eines zweistufigen Klassifikationsprozesses erkannt wird. Bei dem ersten Schritt wird das Eingangssignal mit einer Bibliothek erster Stufe verglichen und eine grobe Spektralanalyse ausgeführt. Der erststufige Vergleich erzeugt eine Reihe von Signalidentifikationen aus der erststufigen Referenzbibliothek entsprechend der groben Spektralanalyse. Dann wird in der zweiten Stufe eine feinere Korrelation in der bei der ersten Stufe hergestellten Reihenfolge ausgeführt. Die vorliegende Erfindung schlägt eine Verbesserung beim erststufigen Klassifikationsprozeß derart vor, daß die Erkennungszeit und die Zahl von Eintritten in die erststufige Reihe reduziert wird. Tatsächlich hat die vorliegende Erfindung eine derart hohe Effizienz gezeigt, daß sie ohne die zweite Stufe bei gewissen Sigualerkennungssystemen anwendbar ist.
- Die erststufige Analyse schirmt das Eingangssignal ab und eliminiert bei der in der zweiten Stufe ausgeführten rechnerisch anspruchsvollen, zeitverzerrten Korrelation eine große Zahl von Kandidatensignalen aus der Betrachtung. Wenn die erststufige Effizienz von 80 % auf 90 % erhöht werden kann, wird die Systemkapazität verdoppelt. Ein Prototyp der vorhe genden Erfindung hat eine Effizienz von über 98 % bei der Ausscheidung von Fehlalarm gezeigt. Infolgedessen kann in dem System gemäß dem '562-Patent eine Verbesserung um einen Faktor 10 erreicht werden.
- Im '531-Patent ist ein effizientes Signalerkennungssystem offenbart, das ein ausreichendes Zeit-Bandbreite-Produkt aufrecht erhält, um eine genaue Unterscheidung von Signalsignaturen zu ermöglichen, wobei ein Mittel bereitgestellt ist, welches das System unempfindlich für Rundfunkgeschwindig keitsvariationen und Übertragungsabweichungen macht. Diese als segmentierte Korrelation bekannte Technik und die anderen Implementierungsdetails, die im '531-Patent beschrieben sind, stellen ein sehr empfindliches System bereit, welches jedes beliebige von 25 Liedern auf einem einzelnen Kanal mit hoher Zuverlässigkeit erkennen kann. Die vorliegende Erfindung hat als ein Ziel die Fähigkeit, jedes beliebige von sechstausend aufgezeichneten Signalen auf jeden von fünf gleichzeitigen Rundfunkkanälen mit vergleichbarer Zuverlässigkeit zu identifizieren. Eine zusätzliche Systemabstimmung und eine Prototypausbildung sollten die Kapazität auf annähernd zehntausend Lieder pro Kanal erhöhen.
- Zentral in den durch die Erfindung nach dem '562-Patent verkörperten Konzepten ist eine Technik zur Kompensation von Rundfunkgeschwindigkeitsvariationen, die als lineare Zeitverzerrungskorrelation bekannt ist. Diese Technik ist robuster als das vorhergehende segmentierte Korrelationsverfahren, indem sie eine stärkere Beziehung zwischen Abschnitten des Merkmalsvektors beibehält, die von verschiedenen Abschnitten der Aufzeichnung abgeleitet wurden. Außerdem dient eine hierarchische Erkennungsprozedur zum Multiplizieren der verfügbaren Verarbeitungskapazität durch Abschirmung der Kandidatenerkennungen unter Verwendung eines groben Sortierungsalgorithmus. Diese Technik verbraucht weniger Berechnungsmittel zum Abtasten der ganzen Signaldatenbank unter Ausschluß von Kandidaten, die klar nicht zu den zweitstufigen Erkennungskriterien passen. Diejenigen, die beim erststufigen Prozeß akzeptabel sind (typischerweise 10 bis 20 %) werden durch die rechnerisch intensive lineare Zeitverzerrungskorrelationsprozedur der zweiten Stufe in der in der ersten Stufe hergestellten Ordnung der Wahrscheinlichkeit der Erkennung (Reihe) analysiert. Neben der großen Erhöhung der Systemkapazität reduziert die Erfindung nach dem '562-Patent die Referenzmusterdauer von den bisherigen 64 Sekunden auf 28 Sekunden, um die Identifikation von Signalen kürzerer Dauer, beispielsweise von Werbung, zu ermöglichen.
- Nun wird der zum gegenwärtig vorgeschlagenen System führende technische Lösungsweg beschrieben. Bei Gegebenheit der oben erwähnten Systemaufgaben zeigen sich zwei Probleme von selbst. Als erstes müssen mehr verschiedene Merkmalsvektoren für die erststufige Analyse bereitgestellt werden und als zweites muß die neue Architektur kompatibel mit der in dem '562-Patent beschriebenen Architektur sein. D.h. der erststufige Klassifikationsprozeß muß den gleichen Satz aus den beim '562-Patent verwendeten vier Hüllkurven gleichgerichteten Frequenzbändern akzeptieren. Das Ausgangssignal des erststufigen Klassifizierers muß eine Liste aus im zweitstufigen Korrelator entwickelten Musternummern sein.
- Um effektiv zu sein, müssen die erststufigen Algorithmen Geschwindigkeitsvariationen und andere Abweichungen tolerieren, während sie eine hohe Unterscheidung zwischen Mustern bereitstellen. Die Fehlalarmrate muß ohne Verursachung fehlender Detektionen minimiert werden. Tatsächlich muß der erststufige Klassifizierer so voreingestellt sein, daß nur Signaturen, die klar inkorrekt sind, verworfen werden. Dies resultiert üblicherweise in einer Zunahme der Fehlalarmrate. Es ist schwierig, diese beiden Funktionsparameter gleichzeitig zu optimieren.
- Ein Merkmalsvektor kann zum Definieren eines Merkmalsraums mit einer der Zahl an Merkmalen im Vektor gleichen Zahl Dimensionen zu definieren. Ein solcher Merkmalsraum kann als "Hyperraum" bezeichnet werden. Die Merkmalsvektoren jedes Solisignais werden im Hyperraum entsprechend ihrer berechneten Werte gespeichert. Bei der Erkennung wird der vom empfangenen Signal abgeleitete Merkmalsvektor zum Suchen des Hyperraums zur Entdeckung des Signals oder der Signale verwendet, deren Signaturen in einem besonderen Bereich des Hyperraums gespeichert sind. Der Hyperraum kann mehrere "Cluster" enthaltenf in denen die Merkmalsvektoren einer Anzahl Signale gespeichert werden können. Beispielsweise können ähnliche Signale ähnliche Merkmalsvektoren erzeugen, die in enger Nachbarschaft zueinandner im Hyperraum gespeichert werden. Wenn der Zwischenraum zwischen solchen Signalclustern im Hyperraum relativ zur Größe der Cluster groß ist, ist es möglich, einen Unsicherheitsbereich um jeden Merkmalsvektor im Hyperraum vorzusehen, der eine minimale Überlappung anderer Bereiche im Hyperraum aufweist. Ein Verfahren zur Ausführung dieser verstärkten Trennung liegt darin, die Dimensionalität des Merkmalshyperraums zu erhöhen. Der Wert jedes Merkmals wird als Koordinate im Hyperraum behandelt. Wenn beispielsweise und wie in Figur 9 gezeigt drei Merkmale verwendet werden, bilden sie einen Merkmalsvektor, der eine Position im dreidimensionalen Raum spezifiziert. Wenn der Merkmalsvektor dann quantisiert wird (einer auf dem detektierten Merkmalswert basierenden besonderen Kategorie zugeordnet), kann jede Komponente einen von einer Anzahl diskreter Werte, beispielsweise 5, annehmen. Dann enthält der Raum 125 diskrete Stellen. Wenn jeder Stelle ein Signalidentifikationskode zugeordnet wird, ist es möglich, die gleichen Merkmale aus einem empfangenen Signal zu extrahieren und quantisieren, der Merkmalsvektor kann auf die gleiche Stelle im dreidimensionalen Raum abgebildet werden, und der betreffende bzw. geeignete Signalidentifizierer kann wiedergewonnen werden. Dies ermöglicht einen eindeutigen Zugriff auf 125 Signale, wenn ihre Merkmalsvektorwerte nach der Quantisierung eindeutig sind. Leider sind die gemessenen Merkmale nicht eindeutig. Mehrere verschiedene Signale können den gleichen Merkmalsvektor erzeugen. Dies kann durch Zuordnung einer Liste von Wahrscheinlichkeiten zu jeder Stelle im Hyperraum behandelt werden. Die Figur 9 zeigt ein Beispiel eines dreidimensionalen Hyperraums, bei welchem jedes der drei Merkmale fünf Werte annehmen kann. Ein "Cluster" 40 ist darin bei der Stelle S(4-3) = 3, S(2-1) = 2, S(3-2) = 0 zentriert dargestellt.
- Ein zweites Problem liegt darin, daß ein zu erkennendes Signal oder Muster aufgrund einer Zeitkompression oder anderen Übertragungsabweichungen nicht den geeigneten Vektor erzeugen kann. Infolgedessen muß die Variabilität der Merkmale studiert und bestimmt werden, wie die resultierenden Merkmalsvektoren verschiedene Bereiche im Hyperraum spezifizieren. Die Suche nach unterschiedlichen Merkmalen basiert auf dem Kriterium, daß sie unter dem Einfluß erwarteter Abweichungen stabil sind und daß sie unterscheidbar sind. Wenn anzunehmen ist, daß die individuellen Merkmale, aus denen der Merkmalsvektor besteht, unabhängig sind, kann durch Erhöhung der Zahl an Merkmalen die Trennung zwischen Clustern im Hyperraum ohne Erhöhung der Clustergröße dramatisch erhöht werden. Um in den quantisierten-Merkmalen Variationen zu ermöglichen und um das Erfordernis einer Zeitausrichtung zu reduzieren, können bei verschiedenen Zeitverschiebungen mehrfache Merkmalsvektoren erzeugt werden, durch welche jedes Signal einen Bereich des Hyperraums, den es einnimmt, überstreichen kann. Die Suche nach solchen unterscheidbaren zeitinvarianten Merkmalsvektoren wird unten beschrieben.
- Einer der wichtigsten Aspekte jedes Mustererkennungssystems ist die Identifikation, Erzeugung und Auswahl von Merkmalen, die stabil sind, wenn eine besondere Signatur vorhanden ist, jedoch verschiedene Anzeigen bereitstellen, wenn die Signatur nicht vorhanden ist. Bei der Entwicklung dieser Erfindung wurden Audiosignale von Aufzeichnungen, Bändern und Airplay mit einer Rate von 2500 Samples pro Sekunde digitalisiert, nachdem sie mit einer Grenzfrequenz von 1,0 kHz tiefpaßgefiltert wurden. Es hat sich gezeigt, daß die Frequenzen unter 1 kHz durch die von Rundfunksendern verwendeten spektralen Modifikationen relativ unbeeinflußt bleiben. Annähernd 65 Sekunden Audio aus diesen Signalen wurden von 75 Liedern digitalisiert und als eine experimentelle Datenbank gespeichert. Jede dieser Dateien wurde dann durch eine Softwaresimulation des Prozessors am vorderen Ende verarbeitet, der die Hüllkurven von vier Frequenzbändern bildet. Die Ausgabe aus dem Simulator war ein Satz gemultiplexter Gleitkommadateien, die auf einem Graphikendgerät aufgezeichnet oder von einem Programm verarbeitet werden können, um Charakteristiken der Daten zu bestimmen, die zur Bildung guter Merkmale für die Merkmalsvektoren ausgewertet werden können. Ein Spektralanalyseprogramm berechnete das Leistungssprektrum, das logarithmische Leistungsspektrum, das Cepstrum bzw. die Silbenvertauschung des Spektrums und die Autokorrelationsfunktionen jedes Frequenzbandes. Das Leistungsspektrum und logarithmische Leistungsspektrum sind Funktionen der Frequenzdomäne, während das Cepstrum und die Autokorrelationsfunktionen Funktionen der Zeitdomäne sind. Als nächstes wurde ein statistisches Programm zum Berechnen statistischer Momente der Signalwerte der vier Bänder des empfangenen Signals verwendet. Solche statistischen Momente umfassen das Mittel bzw. den Mittelwert, Varianz, Asymmetrie und Wölbung. Außerdem wurde die kovariante Matrix der vier Bänder berechnet.
- Beim Prüfen der Leistungsspektren und der logarithmischen Leistungsspektren wurde entdeckt, daß, oblgeich verschiedene Lieder spektrale Spitzen bei verschiedenen Frequenzen hatten, es nicht klar war, wie eine kleine Zahl spektraler Komponenten, die zwischen den verschiedenen Liedern zuverlässig unterscheiden können, auszuwählen sind. Dies gilt sowohl für die linearen als auch logarithmischen Leistungsspektren. Jedoch liefert die Berechnung der Signalbandbreite jedes Bandes einen Satz aus vier Zahlen, die bezüglich Geschwindigkeitsvariatonen stabil sein sollten. Diese Merkmale wurden unter Verwendung von acht verschiedenen Zeitverzögerungen entwikkelt.
- Beim Prüfen der Autokorrelationsfunktionen wurde entdeckt, daß die einzigen stabilen Merkmale, die abgeleitet werden konnten, eng auf die früher diskutierten Bandbreitenmessungen bezogen waren. Dies ist zu erwarten, da das Leistungsspektrum und die Autokorrelationsfunktion ein Fouriertransformationspaar sind. Aus der Autokorrelationsfunktion abgeleitete Merkmale wurden deshalb so betrachtet, daß sie redundant sind, und wurden zugunsten der vom Leistungsspektrum abgeleiteten beiseite gelegt. Das Cepstrum wurde geprüft und gefunden, daß es keine brauchbaren stabilen Merkmale aufweist. Dies deshalb, weil das Cepstrum das Vorhandensein harmonisch bezogener Signalstrukturen zur Bestimmung der Periode der zusammengesetzten Wellenform ausnutzt. Es wurde gefunden, daß diese harmonischen Strukturen nicht in den Hüllkurven des bandpaßgefilterten Audios vorhanden sind.
- Bei der Untersuchung des Verhaltens der durch das Statistikprogramm erzeugten Merkmale wurde entdeckt, daß Asymmetrie- und Wölbungswerte zwischen Liedern unterscheidbar und relativ stabil waren, wenn sie in Zeitverschiebungen in den Liedern berechnet wurden. Es gibt zwei andere Charakteristiken dieser Merkmale, die als attraktiv befunden wurden. Als erstes sind sowohl Asymmetrie als auch Wölbung selbstnormierend, d.h., ihr Wert ist unabhängig von der Lautstärke. Zweitens sind ihre Werte virtuell unbeeinflußt von Geschwindigkeitsvariationen bei der Aufzeichnung. Dies deshalb, weil ihre Berechnung nicht explizit die Zeit oder Frequenz verwendet. Dies wurde als ganz wichtig angesehen, da ein beträchtlicher Aufwand darauf gerichtet wurde, das ganze System immun gegen Geschwindigkeitsvariationen zu machen, die durch Rundfunksender induziert werden. Es wurde entdeckt, daß einige Lieder signifikant verschiedene Werte von Asymmetrie und Wölbung bei verschiedenen Zeitverschiebungen bzw.-versetzungen erzeugten. Dies trat auf, wenn die Zeitverschiebungen das Fenster der Analyse in Bereiche eines Lieds bewegten, bei denen der ganze Charakter des Lieds anders war. Es wird angenommen, daß dies ein generelles Problem ist, welches jeden Satz gewählter Merkmale beeinflußt und deshalb beim Erkennungsalgorithmus anstelle der Auswahl zu verwendender Merkmale behandelt werden muß.
- Schließlich entdeckte der Erfinder der vorliegenden Erfindung, daß die Eigenschaften von Asymmetrie und Wölbung gut zum effektiven und zuverlässigen Kategorisieren von Rundfunksignalen geeignet sind. Bandbreitenabschätzungen arbeiteten ebenfalls gut, waren jedoch weniger immun gegen die Effekte von Zeitverschiebungen. Da der Erkennungsalgorithmus direkt damit umgeht, kann sich die Hüllkurvenbandbreite noch als ein geeignetes Unterscheidungsmerkmal erweisen. Es sei darauf hingewiesen, daß jedes der diskutierten Merkmale für alle vier Frequenzbänder berechnet wurde. Deshalb wurde eine Gesamtheit von zwölf Merkmalen darauf angesehen, ob sie hinsichtlich ihrer Unterscheidungsfähigkeiten, vier sowohl für Asymmetrie als auch Wölbung und Hüllkurvenbandbreite, qualifiziert sind. Wenn alle zwölf Merkmale verwendet werden, wird ein zwölfdimensionaler Merkmalshyperraum erzeugt. Dies ist vom Standpunkt des erforderlichen Speichers und der Zahl an Merkmalen, die berechnet werden müssen, wahrscheinlich inakzeptabel. Deshalb wurde hinsichtlich der vorliegenden Ausführungsform entschieden, nur die Asymmetrie- und Wölbungswerte zu verwenden, so daß insgesamt acht Merkmale erzeugt werden. Dies kann im Hinblick auf den erforderlichen Speicher immer noch inakzeptabel sein. Deshalb wurden die vier Frequenzbänder zu drei Wellenformen linear kombiniert und auf diese Weise Asymmetrie- und Wölbungswerte für jede der drei Wellenformen bereitgestellt, wodurch ein sechsdimensionaler Merkmalshyperraum erzeugt wird. Eine Bestätigung dieser Wahl wird in Bezug auf die unten beschriebenen Vektorquantisierungsverfahren detaillierter beschrieben.
- Vektorquantisierung ist im Prinzip ein einfaches Konzept. Es umfaßt die Reduzierung der Auflösung jeder Vektorkomponente von ihrem kontinuierlichen Wertebereich in einen mit einer kleinen Zahl Werte, beispielsweise die Reduzierung einer Anzahl mehrstelliger Werte in eine Anzahl einstelliger Werte (siehe Figur 8). Beispielsweise könnte der Merkmalswertebereich einfach in mehrere Bänder gleicher Breite unterteilt werden. Das Merkmal wird dann durch Ersetzen seines mehrstelligen Wertes durch seine Bandnummer kodiert oder quantisiert. Es gibt zwei primäre Probleme bei diesem Verfahren. Als erstes können Werte, die in die Nähe der Grenze zwischen zwei Bändern fallen, aufgrund von Beschränkungen durch Rauschen, Verzerrung oder Berechnungsgenauigkeit falsch quantisiert werden. Zweitens ist es nicht wahrscheinlich, daß die Merkmaiswerte gleichförmig über den ganzen Bereich verteilt sind. Dies würde zu einer starken Konzentration in gewissen Bändern führen, welche den Informationsgehalt des quantisierten Merkmais reduziert. In dem einschränkenden Fall, daß alle Werte in das gleiche Band fallen, würde das Merkmal keinerlei Information enthalten. Dies wird durch Verwendung einer nicht gleichförmigen Breite der Bänder (beispielsweise Figur 10) und eines überlappenden Quantisierungsprozesses zur Kodierung von Referenzmerkmalsvektoren für die Referenzbibliothek (beispielsweise Figur 12) behandelt.
- Als erstes ist es notwendig, die Zahl an Quantisierungspegeln und die Zahl der beim Merkmalsvektor verwendeten Merkmale zu betrachten. Diese spezifizierende Dimensionalität und die Dichte des Merkmalhyperraums. In der Figur 7 sind die Zahl diskreter Stellen im Hyperraum als eine Funktion der Zahl an benutzten Merkmalen und der Zahl Pegel, auf die sie quantisiert sind, aufgelistet. Es sei darauf hingewiesen, daß bei allen Fällen, bei denen die Zahl Pegel größer als drei ist, mehr durch die Erhöhung der Zahl an Merkmalen als durch Erhöhung der Zahl an Quantisierungspegeln erreicht wird. Es ist günstig, innerhalb der Grenzen eines Speichers den größtmöglichen Merkmalhyperraum zu verwenden. Dadurch können die durch die Merkmalsvektoren dargestellten Signale über ein großes Volumen mit dem Ergebnis verstreut werden, daß beim zweitstufigen Korrelator weniger Signaturen entwickelt werden müssen. Bei der bevorzugten Ausführungsform hat der Erfinder fünf Quantisierungspegel und sechs Merkmale als vernünftigen Kompromiß gewählt. Dies stellt einen Hyperraum mit 15.625 diskreten Stellen bereit.
- Es wurden zwei Vektorquantisierungsalgorithmen entwickelt. Der erste unterteilt jeden Vektor gemäß seiner statistischen Verteilung derart, daß jeder Bereich die gleiche Zahl Eingänge aufweist (siehe beispielsweise Figuren 10 und 11). Der zweite führt einen ähnlichen Prozeß aus, gibt jedoch zwei quantisierte Merkmalsvektoren zurück (siehe beispielsweise Figuren 12, 13 und 14). Die zwei Vektoren stellen den wahrscheinlichsten Bereich und den nächsten Nachbarn dar. Unter Verwendung einer Abtastsignalbibliothek werden von den Asymmetrie-, Wölbungs- und Bandbreitenwerten Histogramme erzeugt. Die Histogramme für die Wölbung werden unten in Bezug auf den Überlappungs- und Nichtüberlappungs-Vektorquantisierungsalgorithmus beschrieben.
- Die Figur 12 stellt die überlappungskodierte Vektorquantisierung eines Wölbungsmerkmals dar. Es sei darauf hingewiesen, daß die Wölbungswertpopulation zuerst derart unterteilt wird, daß jeder Bereich ein Drittel der Gesamtzahl an Samples enthält. Zum Trennen von Bereichen 1, 3 und 5 werden Schwellen B und D verwendet. Zwei zusätzliche Bereiche sind so aufgebaut, daß sie ebenfalls jeweils ein Drittel der Punkte enthalten. Diese sind auf die Schwellen B und D zentriert, wobei ein Sechstel der Gesamtheit der Punkte darüber und darunter liegt. Bereiche 2 und 4 sind durch Schwellen A, C und E begrenzt. Wie in Figur 13 angedeutet, befinden sich Merkmalswerte, die kleiner als die Schwelle A sind, klar im Bereich 1 und werden mit (0,0) kodiert. Merkmalswerte, die zwischen die Schwellen A und B fallen, können zum Bereich 1 oder 2 gehören und werden mit (0,1) kodiert. Diejenigen, die zwischen die Schwellen B und C fallen, können zum Bereich 2 oder 3 gehören und werden mit (1,2) kodiert. Werte zwischen C und D fallen in die Bereiche 3 oder 4 und werden mit (2,3) kodiert. Werte zwischen D und E können zum Bereich 4 oder 5 gehören und werden mit (3,4) kodiert. Wenn schließlich ein Wert größer als die Schwelle E ist, befindet sie sich klar im Bereich 5 und wird mit (4,4) kodiert. Da jeder Vektor sechs Merkmale ver wendet, erzeugt die Ausgabe des Überlappungsvektorquantisierungsprozesses ein Paar aus sechs Elementvektoren, wie es in Figur 14 dargestellt ist. Durch Permutierung der Elemente dieser zwei Vektoren können bis zu 64 neue Vektoren gebildet werden, welche Stellen im Hyperraum spezifizieren, bei denen das Signal gespeichert werden kann. Jedoch werden jedesmal, wenn ein Kode (0,0) oder (4,4) erzeugt wird, doppelte Vektoren erzeugt. Bei der in vorläufigen Untersuchungen verwendeten Abtastbibliothek wurde beobachtet, daß ein Mittel von 21,4 unterschiedlicher Vektoren durch Permutierung von Elementen überlappter quantisierter Vektoren A und B erzeugt wird. Diese unterschiedlichen Vektoren werden als der Speicher "Nachbarschaft" eines Lieds im Hyperraum bezeichnet.
- Eine Alternative zum überlappten Quantisierungsalgorithmus ist der nichtüberlappte Quantisierungsalgorithmus, der in den Figuren 10 und 11 gezeigt ist. Die Figuren 10 und 11 zeigen ein Histogramm von aus der Abtastbibliothek erzeugten Wölbungswerten. Gemäß dem Nichtüberlappungs-Vektorquantisierungsalgorithmus werden Quantisierungsschwellen durch Sortieren aller Merkmalswerte in absteigender Ordnung und dann durch Unterteilung dieser Liste in fünf Bereiche gleicher Größe abgeleitet. Die an den Grenzen befindlichen Datenwerte werden als Schwellen ausgewählt. Dies stellt sicher, daß jeder Bereich die gleiche Zahl an Samples enthält und der resultierende Hyperraum gleichmäßig gefüllt ist. Merkmalsvektorwerte, die in einen der Bereiche 1, 2, 3, 4 oder 5 fallen, werden, wie in Figur 11 gezeigt, einfach mit dem Wert kodiert. Dieser Prozeß kann bei der Erzeugung des Hyperraums im Speicher ausgeführt werden, obgleich der überlappungsquantisierte Vektoralgorithmus bevorzugt wird. Jedoch wird der Nichtüberlappungs-Quantisierungsalgorithmus während des Prozesses der Erkennung des unten beschriebenen empfangenen Signals verwendet.
- Der in Bezug auf den technischen Lösungsweg zu beschreibende Endprozeß ist, wie die quantisierten Vektoren dann benutzt werden, um entweder Information in eine Signalidentifikationen enthaltende Datenbank einzuschreiben oder zu entnehmen. Der Erfinder der vorliegenden Erfindung hat zwei Verfahren zum Speichern und Wiedergewinnen von Information untersucht, die bei der Erkennung von Signalmustern anwendbar sind. Das erste umfaßt die Speicherung aller Variationen des erwarteten Musters im Hyperraum. Dies ist einfach eine Sache der Zuordnung des Liedidentifikationskodes zu jeder durch die Permutation der zwei vom überlappten Vektorquantisierungsprozeß zurückgekehrten Vektoren beschriebenen Stelle. Der Zugriff um faßt die Berechnung einer einzelnen Stelle, die eine Liste von Mustern enthält, welche die Suchkritierien erfüllen. Dies ist vom Standpunkt der Realzeiterkennung das effektivste, erfordert jedoch die Speicherung des Identifikationskodes an vielen Stellen im Merkmalshyperraum. Ein alternatives Verfahren ist das Speichern jedes Musters nur einmal im Raum.
- Wenn auf den Raum zugegriffen wird, um eine Liste von Liedkandidaten zu finden, müssen alle im überlappten Quantisierungsprozeß beobachteten Variationen gesucht werden. Die bei jeder Stelle gefundenen Listen müssen dann vereinigt werden. Obgleich dieses zweite Verfahren Speicher spart, verlangsamt es den Erkennungsprozeß. Es ist auch ein "Band- und Aufhänger"-Prozeß möglich, der alle erwarteten Variationen der Merkmale speichert und dann den Bereich nach Verzerrungen absucht. Obgleich dieses Verfahren das wahrscheinlich robusteste ist, büßt es sowohl Zeit als auch Speicher ein. Das erste Verfahren wurde zur Weiterverfolgung ausgewählt, da eine Realzeitdurchführung wichtig ist und nicht angenommen wird, daß die Grenzen des Speichers überschritten oder erweitert werden.
- Es gibt viele Verfahren zur Abbildung der Signalidentifikationen in den Speicher und nachfolgenden Wiederauffindung der Identifikationen entsprechend einem empfangenen Signal. Die derzeit bevorzugte Ausführungsform verwendet einen möglichen Lösungsweg, obgleich die Erfindung so ausgebildet ist, daß sie alle naheliegenden Äquivalente abdeckt. Gemäß den oben beschriebenen Parametern gibt es 15.625 diskrete Stellen im Vektorhyperraum. Deshalb wurde eine Tabelle aus Zeigern konstruiert, die auf Listen zeigen, welche Identifikationskodes von möglicherweise vergleichbaren Mustern enthalten. Jede Liste hat eine variable Länge, die erneuert wird, wenn Signale hinzugefügt oder entfernt werden. Die Figur 15 stellt dieses Zugriffsverfahren dar. Wenn ein Signal zur Datenbank zu addieren ist, werden alle Permutationen der vom überlappten Quantisierungsprozeß abgeleiteten beiden Vektoren berechnet. Eine Position auf der Liste wird dann als gewichtete Summe der Vektorkomponenten unter Verwendung einer nichtdezimalen Basis, beispielsweise 5, berechnet. Jede Position dieser Tabelle kann auf eine leere Liste oder auf die Stelle einer Liste zeigen, welche die Identifikationskodes eines Signals enthalten, das auf diese Stelle im Hyperraum abbildet. Diese Listen werden dynamisch erzeugt und modifiziert. Der erste Zugang in die Signalliste zeigt die Zahl der folgenden Identifikationskodes an. Der Rest der Liste enthält die Identifikationskodes. Eine Hinzufügung einer Signalidentifikation zur Liste umfaßt eine Prüfung, um zu sehen, ob die Liste existiert. Wenn nicht, muß sie erzeugt werden. Die Signalidentifikation wird dann addiert und die Listengröße auf 1 gesetzt. Wenn die Liste bereits existiert, wird geprüft, um zu sehen, ob die Signalidentifikation schon in der Liste ist. Wenn sie schon in der Liste ist, wird die Tabelle einfach verlassen, wenn nicht, wird die Liste um 1 erweitert und ein neuer Identifikationskode angefügt. Der erste Zugang in die Signalliste wird ebenfalls erneuert um anzuzeigen, daß ein zusätzlicher Signalidentifikationskode addiert worden ist. Die Entfernung eines Signalidentifikationskodes ist ein ähnlicher Prozeß.
- Die Durchführung dieses Lösungswegs bzw. Verfahrens hängt von der Stabilität der gewählten statistischen Merkmale ab. Es wurden Momente gewählt, da sie von Geschwindigkeitsvariationen unbeeinflußt sind. Wenn jedoch Zeitverschiebungen involviert werden, ist es gut möglich, daß Segmente des Liedes andere Eigenschaften zeigen, die in einem anderen Bereich des Hyperraums Platz nehmen. Das hat Fehldetektionen zur Folge. Dies wurde durch Abschätzung der Merkmalsstabilität bei mehreren Zeitverzögerungen untersucht und die meisten wurden als stabil befunden. Einige änderten sich jedoch mit der Zeitverzögerung signifikant. Um dem zu begegnen, wurden Statistiken über einem Satz von vierzehn Sekundenintervallen innerhalb der vom Korrelator benutzten 28 Sekunden berechnet. Bei jeder Verschiebung wird ein Satz überlappter Stellen im Hyperraum berechnet und der Lied-ID-Kode wird zur korrespondierenden Liste addiert. Wenn das Lied stabil ist, werden keine Einbzw. Zugänge erzeugt. Wenn sich jedoch die Statistiken mit der Zeitverzögerung ändern, wird das Lied allen Bereichen hinzugefugt, in denen es möglicherweise als existent gefunden wird.
- Dies beendet eine Diskussion des technischen Lösungswegs und den Überblick über die vorliegende Erfindung. Die Figur r1 zeigt ein Blockschaltbild einer Vorrichtung gemäß der vorliegenden Erfindung und Figur 16 zeigt ein Spitzenpegel Flußdiagramm für das Verfahren gemäß der vorliegenden Erfindung. Bei der vorliegenden Erfindung ermöglicht die Verarbeitungsstruktur nach Figur 1 eine gleichzeitige Verarbeitung von bis zu fünf Audiokanälen. Deshalb können bis zu fünf Rundfunkstationen überwacht und deren Rundfunkprogramme klassifiziert werden. Es können zusätzliche Hardware- und Software-Modifikationen zur Erhöhung oder Erniedrigung der Zahl an gleichzeitig überwachten Kanälen ausgeführt werden.
- Eine Antenne 2 empfängt Audiosignale tragende Radiowellen. Die Antennenvorrichtung kann bis zu fünf Radiokanäle gleichzeitig empfangen. Das Audiosignal wird vom Audiokanalempfänger 4 empfangen und zum Audiovorprozessor 6 gegeben. Der Audiovorprozessor 6 umfaßt Filterbänke 8, Hüllkurvengleichrichter 10 und Tiefpaßfilter 12, wie sie in Figur 2 gezeigt sind. Alternativ dazu kann der Audiovorprozessor 6 digital in den Prozessor 24 aufgenommen sein.
- Die Figur 1 zeigt auch einen Analog-Digital-Wandler 14, der zum Digitalisieren des Audiosignals benutzt werden kann. Ein Multiplexer 16 wird zum Ausführen der Multiplexoperationen verwendet, wenn mehrere Audiokanäle gleichzeitig überwacht werden. Sowohl der A/D-Wandler 14 als auch der Multiplexer 16 sind an einen Bus 100 gekoppelt. An den Bus 100 ist auch ein Arrray-Prozessor 18 gekoppelt. Im Array-Prozessor 18 werden Merkmalsvektoroperationen ausgeführt, welche die Zeitverzerrung der zweitstufigen Merkmalsfolge und die zweitstufigen Korrelationsberechnungen enthalten.
- An den Bus 100 ist auch ein Prozessor 24 gekoppelt, welcher die Funktionen der Steuerung, der Datenbankverwaltung und der Verwaltung aller Eingänge/Ausgänge (I/A) der erststufigen Klassifikationsberechnungen ausführt. Der Prozessor 24 kann einen Mikroprozessor 26, einen Speicher 28, I/A- Schnittstellen 30 oder einen Realzeittaktgeber 33, einen Referenzmusterspeicher 34 und einen Offline-Speicher 36 aufweisen. Vorzugsweise ist der Mikroprozessor 26 ein Mikroprozessor der Serie Motorola 68020. Vorzugsweise umfaßt der Arbeitsspeicher 28 wenigstens 8 MBytes an Speicher. Ähnlich speichert der Musterspeicher 34 sowohl die erststufige als auch zweitstufige Referenzbibliothek und ist vorzugsweise als Festplatte mit wenigstens 140 MByte realisiert. Der Offline- Speicher 36 kann zum Ändern und/oder Addieren und/oder Entfernen von Referenzmustern der Referenzmusterbibliotheken im Speicher 34 verwendet werden. Vorzugsweise weist der Offline- Speicher 36 eine Bandkassette auf.
- Das Verarbeitungssystem kann schließlich mit Periphergeräten, wie beispielsweise eine Kathodenstrahlröhrer (CRT) 38, einem Drucker oder Modem 40 und einem Endgerät 42 gekoppelt sein. Solche Periphergeräte werden durch die I/A-Schnittstellen 30 an das System gekoppelt.
- Anhand der Figur 2 wird eine grobe Spektralanalyse beschrieben. Das empfangene Audiosignal wird an den Audiovorprozessor 6 gegeben, in welchem es in mehrere Kanäle unterteilt wird. Bei der derzeit bevorzugten Ausführungsform sind vier Kanäle gewählt worden. Es können jedoch in Abhängigkeit von dem exakten Typ des zu klassifizierenden Signals mehr oder weniger Kanäle verwendet werden. Jeder Kanal weist ein Bandpaßfilter 8 auf, wobei jedes Filter einen anderen Wert hat. Jeder Kanal weist auch einen Gleichrichter 10 und ein Tiefpaßfilter 12 auf. Zweck des Audiovorprozessors ist es, die Menge an in der ersten Stufe verarbeiteten Information zu reduzieren. Dies liefert eine Langterm-Mittelwertbildung der erststufigen Merkmale. Da es Zweck der ersten Stufe ist, die zur Erkennung erforderlichen Berechnungen zu reduzieren, ist es günstig, die Menge an pro Zeiteinheit verarbeiteter Information zu reduzieren. Die Signalunterscheidungsgenauigkeit ist proportional zum Zeit-Bandbreite-Produkt des Merkmalsvektors. Deshalb wird durch Reduzierung der Bandbreite des Merkmalsvektors unter gleichzeitiger Ausdehnung der Dauer die Genauigkeit aufrechterhalten, während die erforderliche Verarbeitung pro Zeiteinheit erniedrigt ist. Dies gilt für jeden Prozeß, der eine kontinuierliche Suche nach Zeitreihenereignissen benötigt.
- Um dies auszuführen, wird das in Figur 3 gezeigte Audioeingangssignal an jedes der Bandpaßfilter 8 gegeben. Jedes Bandpaßfilter gibt ein gefiltertes Signal aus, beispielsweise das in Figur 3 gezeigte. Die gefilterten Signale werden an die Gleichrichter 10 gegeben, deren jeder eine in Figur 3 gezeigte Wellenform ausgibt. Schließlich werden die gleichgerichteten Signale an Tiefpaßfilter 12 gegeben, deren jedes ein tiefpaßgefiltertes Signal ausgibt, wie es in Figur 3 gezeigt ist. Durch Abtasten des Signals reduzierter Bandbreite bleibt die Verarbeitungszeit erhalten, während gleichzeitig die Empfindlichkeit des Systems auf Geschwindigkeitsvariationen im Audiosignal reduziert wird. Deshalb werden von den Tiefpaßfiltern 12 mehrere Wellenformen bereitgestellt, wie sie in Figur 4 gezeigt sind. Diese Wellenformen sind mit X&sub1;(t), X&sub2;(t), X&sub3;(t) bzw. X&sub4;(t) bezeichnet. Jede dieser Wellenformen wird an den Prozessor 24 gegeben, der die Merkmalsfolgen den Wellenformen entsprechend erzeugt.
- Der Prozessor 24 stellt infolgedessen eine Anzahl Merkmalsfolgen bereit, die mit Xs&sub1;(t), Xs&sub2;(t), Xs&sub3;(t) bzw. Xc(t) bezeichnet sind (siehe Figur 2). Jede dieser Merkmalsfolgen ist als eine Linearkombination der Wellenformen X&sub1;(t) bis X&sub4;(t) gebildet. Bei der vorliegenden Erfindung ist die Linearkombination nichts anderes als eine Differenz zwischen zwei Bändem. Beispielsweise ist das Signal XS1(t) die Linearkombination X&sub4;(t)-X&sub3;(t) (im folgenden als "Band (4-3)" bezeichnet. Ähnlich werden Signale für Band (3-2) und Band (2-1) im Prozessor 24 erzeugt. Dieser Schritt ist in der Figur 16 beim Schritt S110 gezeigt.
- Bei manchen Implementierungen ist es jedoch günstig, Folgen zu bilden, die Linearkombinationen der vier Eingangswellenformen sind und gewisse spezielle Charakteristiken wie beispielsweise Orthogonalität aufweisen. Eine zusätzliche Verarbeitung kann an dieser Stelle zum Kompensieren von durch die Rundfunksender induzierter Verzerrung vorgenommen werden. Ein Beispiel einer solchen Verzerrung ist die Kompression des Dynamikbereiches oder seine Erweiterung unter Verwendung einer logarithmischen Kompressionsfunktion. Solche Verzerrungen können durch Simulation der Dynamikbereichverzerrung beim Erzeugen der Datenbank und/oder Kompensieren des empfangenen Signals für die Dynamikbereichverzerrung kompensiert werden.
- Der nächste Schritt ist die Berechnung des statistischen Moments jedes der Banddifferenzsignale, der in der Figur 16 mit Schritt S120 bezeichnet ist. Jedes Bandpaßdifferenzsignal muß an mehreren Punkten abgetastet werden, um Signalwerte zu erzeugen, die zum Berechnen dieser statistischen Momente verwendet werden. Die Figur 5 zeigt die Abtastung von Band (4- 3). Der Abtastprozeß ist zum Erzeugen der Referenzbibliothek und zum Erkennen des empfangenen Signals ist etwas anders. Wenn die Referenzbibliothek erzeugt wird, wird das Signal in die Vorrichtung nach Figur 1 am Audiokanalempfänger 4 eingespielt. Der bei den Schritten S210 und S270 in Figur 16 gezeigte zweitstufige Korrelationsprozeß wird zum Wählen des spektral ausgeprägtesten Abschnitts des Signals zur Verwendung in den Referenzbibliotheken benutzt. Insbesondere identifiziert der Prozessor die spektral ausgeprägtesten 28 Sekunden des Signals zur Verwendung bei der Erzeugung der erstund zweitstufigen Referenzbibliothek. Wird andererseits ein Rundfunksignal von der Struktur nach Figur 1 überwacht, wird das Signal in eine Folge von vierzehn Sekundensegmenten herunter zerlegt und jedes Segment wird analysiert und mit den Referenzsignalbibliotheken verglichen.
- Nach Figur 5 wird der Referenzbibliothekeingang für das Zielbzw. Sollsignal durch wiederholte Abtastung jedes Banddifferenzsignals mit einem Fenster mit 128 Abttastpunkten in neun Intervallen bestimmt, wobei das Fenster um 16 Punkte für jedes Intervall verschoben wird. Die an den Abtastpunkten bestimmten Signalwerte werden dann zum Berechnen der statistischen Momente, Asymmetrie und Wölbung beim Schritt S120 in Figur 16 verwendet. Die Figur 17 zeigt den Prozeß, durch welchen die statistischen Momente berechnet werden. Als erstes wird das Mittel der abgetasteten Signalwerte gemäß
- gewonnen, wobei N die Zahl Abtastpunkte bedeutet, 1 < n < N gilt, und X der Wert des Signals (beispielsweise die Spannung) am Abtastpunkt ist. Dann wird die Varianz des abgetasteten Signals gemäß
- Varianz =
- gewonnen. Aus der Varianz wird die Standardabweichung wie folgt berechnet:
- = Varianz ... (3)
- Als nächstes können das oder die statistischen Momente gemäß der Formel
- berechnet werden.
- Obgleich die vorliegende Erfindung zwei statistische Momente, Asymmetrie und Wölbung, verwendet, kann ein einzelnes statistisches Moment gemäß Formel (4) berechnet werden oder alternativ dazu ein oder mehr Momente höherer Ordnung verwendet werden. Entsprechend der bevorzugten Ausführungsform wird die Asymmetrie berechnet durch
- Die Wölbung wird wie folgt berechnet:
- Die oben beschriebenen Berechnungen werden bei den Schritten S121 bis S125 in Figur 17 ausgeführt.
- Wenn einmal die statistischen Momente berechnet worden sind, können die Merkmalsvektoren abgeleitet werden (Schritt S130 in Figur 16). Wie in Figur 6 gezeigt, wird ein Merkmalsvektor während der Erzeugung der Referenzbibliothek für jedes der neun Intervalle abgeleitet. Jeder Vektor enthält Asymmetrieund Wölbungswerte für die Banddifferenzsignale bei jedem Intervall. Infolgedessen enthält der Vektor 1 Werte für S(4- 3)&sub1;, S(3-2)&sub1;, S(2-1)&sub1;, K(4-3)&sub1;, K(3-2)&sub1; K(2-1)&sub1;. Diese Werte sind aktuelle Signalwerte und werden durch Gleitkommazahlen dargestellt.
- Jetzt sind neun Merkmalsvektoren für jedes Signal erzeugt worden und jeder Merkmalsvektor beschreibt eine Stelle im Hyperraum. Dann wird in jeder Nachbarschaft im Hyperraum ein Liedidentifikationskode plaziert, wobei die Nachbarschaft doppelte Werte eliminiert.
- Der nächste Schritte ist die Quantisierung der Merkmalsvektoren, wie sie früher beschrieben wurde (Schritt S140 in Figur 16). Während des Prozesses der Erzeugung der Referenzbibliotheken wird vorzugsweise der überlappte Vektorqantisierungsalgorithmus gemäß den Figuren 12 bis 14 verwendet. Beispielsweise werden, wie in Figur 14 gezeigt, die Werte des Vektors 1 auf den Graphen nach Figur 12 gezeichnet und zwei überlappte quantisierte Vektoren A und B erzeugt. Diese quantisierten Vektorkomponenten werden durch eine Stelle dargestellt, welche die Werte von 0 bis 4 annimmt. Bei einer alternativen Ausführungsform können jedoch die quantisierten Vektoren mehrstellig sein und mehr oder weniger als fünf unterschiedliche Werte aufweisen.
- Nachdem die zwei quantisierten Vektoren A und B erhalten sind, wird eine Permutation dieser Vektoren ausgeführt, um alle möglichen Variationen dieser Vektoren zu erzeugen. Infolgedessen gibt es 64 mögliche Stellen im Hyperraum, bei denen die Siganlwerte des Vektors 1 gespeichert werden können. Da diese Permutation für jeden der neun Merkmalsvektoren erzeugt wird, sind für jedes Signal möglicherweise insgesamt 576 Vektoren im Hyperraum abzubilden. Nach vom Erfinder durchgeführten Experimenten werden für jeden Vektor jedoch 21 tatsächliche Stellen im Hyperraum erzeugt.
- Eine Abbildung jedes permutierten quantisierten Vektors ist einfach eine Sache des Eingebens einer Liedidentifikation in eine besondere Stelle im Speicher (Schritt S150 in Figur 16). Dies wird entsprechend einem Prozeß ausgeführt, der in Figur 15 gezeigt ist, obgleich eine breite Anzahl von Abbildungsalgorithmen benutzt werden kann. Nach Figur 15 wird eine gewichtete Summe des permutierten quantisierten Vektors 2A unter Verwendung der nichtdezimalen Grundzahl 5 erzeugt. Dies heißt, daß die Vektorwerte mit verschiedenen Potenzen der Basis 5 multipliziert werden. Natürlich kann eine andere Grundzahl verwendet werden oder es kann eine gänzlich andere Methode zur Erzeugung einer Adresse angewendet werden. Bei dem in Figur 15 gezeigten Beispiel ist die gewichtete Summe der Vektorkomponenten gleich 11.117. Dann wird mit dieser Adresse auf eine mit Q-TABELLE bezeichnete Tabelle zugegriffen (Schritt S160 in Figur 16) und ein Zeiger erzeugt, der auf eine besondere Liedliste #1 zeigt. Während des Prozesses der Erzeugung der Datenbank wird nun der Liedidentifikationskode in die Liedliste eingegeben und die Zahl an Liedern auf der Liste wird um eins erhöht. Diese Prozedur wird für jeden der vom Abtastsignal erzeugten permutierten quantisierten Vektoren wiederholt, und der Identifikationskode für das Sample wird infolgedessen in mehrere Liedlisten in den Speicher geschrieben. Dies vollendet die Erzeugung der Datenbank, mit welcher die Signale erkannt werden.
- Während der Signalerkennung sind die oben beschriebenen Schritte generell ähnlich. Das Rundfunksignal wird empfangen, bandpaßgefiltert, gleichgerichtet, tiefpaßgefiltert und Linearkombinationen der vier Bänder werden erzeugt. Der Abtastschritt während der Erkennung ist darin etwas anders, als das Lied bei 14 Sekundenintervallen abgetastet wird. Es wird für jedes Intervall nur ein einzelner Merkmalsvektor unter Verwendung der nach den Gleichungen (5) und (6) berechneten Asymmetrie- und Wölbungswerte erzeugt.
- Der einzelne Merkmalsvektor für jedes abgetastete Intervall wird dann unter Verwendung des oben erwähnten Nichtüberlappungs-Quantisierungsalgorithmus quantisiert. Infolgedessen erzeugt jedes Liedintervall einen einzelnen quantisierten Vektor. Es wird dann eine gewichtete Summe der einzeln quantisierten Vektorkomponenten gewonnen und unter Verwendung der gewichteten Summe auf die Q-TABELLE zugegriffen. Der Zeiger aus der Q-TABELLE greift auf eine einzelne Liedliste zu. Die Lieder auf der einzelnen Liedliste sind die bei der zweitstufigen Klassifikationsprozedur untersuchten Liederkandidaten. Bei Verwendung eines einstufigen Klassifikationsprozesses werden natürlich das oder die von der einzelnen Liedliste herausgenommenen Lieder als das Rundfunksignal identifiziert.
- Der zweitstufige Klassifikationsprozeß ist detailliert im '562-Patent in Spalte 13, Zeile 58 bis Spalte 15, Zeile 57 und in den Figurern 2, 7, 8, 9 und 14 beschrieben. Grundsätzlich werden die eine oder merheren beim erststufigen Klassifikationssprozeß erzeugten Liedlisten im zweitstufigen Korrelator zusammen mit dem Ausgangsssignal Xc(t) nach Figur 2 übermittelt. Das Signal Xc(t) kann linear zeitverzerrt sein, so, wie es in dem '562-Patent beschrieben ist. Die Fouriertransformation aller fünf zeitverzerrten und unverzerrten Wellenformen wird berechnet und als komplexe Spektren, die mit den zweitstufigen Referenzmustern verglichen werden, in der zweitstufigen Bibliothek gespeichert. Samples aus den digitalisierten Rundfunksignalen und den Referenzwellenformen werden kreuzmultipliziert und invers fouriertransformiert, um ein Korrelationssignal zu erzeugen (Schritt S211 in Figur 18). Als nächstes werden die Korrelationsfunktionen zwischen jedem zweitstufigen Referenzmuster und den mehreren zeitverzerrten (und unverzerrten) Eingangssignalen verglichen, um den maximalen Korrelationswert für das laufende Eingangssignal auszuwählen (Schritt S213 in Figur 18). Die geeignete Wellenform mit dem höchsten Korrelationswert wird ausgewählt und mit einem Schwellenwert verglichen, der die Erkennung bestimmt. Sobald festgestellt wird, daß ein Korrelationsspitzenwert über der vorbestimmten Schwelle ist, wird das Signal "erkannt" (Schritt S215 in Figur 18) und die Liedidentifikation wird mitgeschrieben und kann auf der Kathodenstrahlröhre 38 gezeigt werden.
- Infolgedessen stellen das vorstehend beschriebene System und Verfahren ein genaues, zuverlässiges, kompaktes, immer noch billiges System zur Klassifizierung von Sginalen bereit.
- Wie früher erwähnt, kann die Vorrichtung gemäß der vorliegenden Erfindung zum Erzeugen der erst- und zweitstufigen Rreferenzbibliotheken benutzt werden. Die Prozedur zur Erzeugung der erststufigen Bibliothek ist oben beeschrieben worden und die Prozedur zur Erzeugun der zweitstufigen Bibliothek geht vollständig aus dem '562-Patent, Spalte 15, Zeile 64 bis Spalte 16, Zeile 53 hervor.
- Was deshalb oben beschrieben wurde, ist eine Vorrichtung und ein Verfahren zur automatischen Klassifizieirung von Signalen, vorzugsweise Rundfunksignalen. Da das System mikroprozessorbasiert ist, kann es in extrem kleiner und wirtschaftlichehr Packung realsiert werden. Beispielsweise umfaßt der existierende Prototyp einen kommerziellen FM-Radioempfänger und einen kleinen Computer mit einem Sun-3/150-Prozessor, einem einen Motorola-68020-Mikroprozessor verwendendes Sun-CPU- Board, mehrere Speicherboards, einen Mercury-Array-Prozessor, einen Vorprozessor, eine Steuereinrichtung für die Platte und Periphergeräte sowie eine Kathodenstrahlröhre Der Fachmann durchschnittlichen Könnens auf diesem Gebiet erkennt leicht die signifikanten Fortschritte bei der in diesem Patent offenbarten Signalerkennung.
- Wenn die vorligende Erfindung in Verbindung mit dem, was derzeit als die praktikabelsten und bevorzugtesten Ausführungsformen betrachtet werden, beschrieben wurde, ist dies so zu verstehen, daß die Erfindung nicht auf die offenbarten Ausführugnsformen beschränkt ist. Vielmehr deckt die vorliegende Erfindung verschiedene Modifikationen und äquivalente Ausführungsformen ab, die in den Rahmen der beigefügten Ansprüche fallen.
Claims (64)
1. Verfahren zur Klassifizierung eines Signals, bestehend aus
den Schritten:
Empfangen des Signals,
Abtasten des Signals an mehreren Punkten zur Erzeugung
mehrerer Signalwerte,
Ableiten eines Multiwert-Merkmalsvektors aus den
Signalwerten,
Quantisieren des Merkmalsvektors durch Ersetzen jedes
Merkmalsvektorwertes durch einen aus einem vorbestimmten,
ungleichartige Merkmalsvektorwerte kategorisierenden
Quantisierungsmuster bestimmten Kategoriewert und
Zugreifen auf eine Signalbibliothek mit dem
quantisierten Vektor zur Erzeugung eines mit dem empfangenen Signal
korrespondierenden Signalidentifikationskodes.
2. Verfahren nach Anspruch 1, wobei das vorbestimmte
Quantisierungsmuster ein Überlappungsquantisierungsmuster ist.
3. Verfahren nach Anspruch 1, wobei der Quantisierungsschritt
mehrere verschiedene vorbestimmte Quantisierungsmuster zum
Quantisieren des Merkmalsvektors verwendet.
4. Verfahren nach Anspruch 1, wobei der Ableitungsschritt die
Schritte
Berechnen zweier unterschiedlicher statistischer Momente
der mehreren Signalwerte und
Bilden des Merkmalsvektors unter Verwendung der zwei
berechneten statistischen Momente
aufweist.
5. Verfahren nach Anspruch 4, wobei für jedes der zwei
statistischen Momente ein vorbestimmtes Quantisierungsmuster
vorgesehen ist.
6. Verfahren nach Anspruch 4, wobei die zwei verschiedenen
statistischen Momente Asymmetrie und Wölbung aufweisen.
7. Verfahren nach Anspruch 1, wobei der Empfangsschritt den
Schritt einer Hüllkurvengleichrichtung des empfangenen
Signals aufweist.
8. Verfahren nach Anspruch 11 wobei der Quantisierungsschritt
die Schritte
Ersetzen des Merkmalsvektors durch mehreren quantisierte
Vektoren entsprechend wenigstens einem vorbestimmten
Quantisierungsmuster mit Überlappungskategorien und
Permutieren der mehreren quantisierten Vektoren zur
Erzeugung mehrerer weiterer permutierter quantisierter Vektoren
aufweist.
9. Verfahren nach Anspruch 8, wobei der Zugreifschritt die
Schritte
Zugreifen auf die Signalbibliothek mit den mehreren
permutierten quantisierten Vektoren zum Erreichen mehrerer
Speicherstellen und
Schreiben in jede Speicherzelle einen mit dem
empfangenen Signal korrespondierenden Signalidentifikationskode
aufweist.
10. Verfahren nach Anspruch 1, wobei der Empfangsschritt die
Schritte
Spektralanalysieren des Signals zur Erzeugung mehrerer,
verschiedene Frequenzbänder aufweisender analysierter Signale
und
Bilden von Linearkombinationen der analysierten
Wellenformen
aufweist,
wobei der Abtastschritt den Schritt einer Abtastung
jeder Linearkombination zur Erzeugung mehrerer Abtastpunkte für
jede Linearkombination
aufweist,
und wobei der Ableitungsschritt die Schritte
Berechnen von Asymmetrie- und Wölbungswerten für alle
Linearkombinationen aus den korrespondierenden Abtastpunkten
und
Bilden des Merkmalsvektors so, daß er Asymmetrie- und
Wölbungswerte aller Linearkombinationen enthält,
aufweist.
11. Verfahren zum Erzeugen eines bei der Identifikation von
Rundfunksignalen verwendbaren
Signalidentifikationsbibliothek, bestehend aus den Schritten:
Abtasten eines durch Rundfunk zu sendenden Signals zur
Erzeugung mehrerer analysierter Wellenformen für jedes durch
Rundfunk zu sendende Signal,
Ableiten mehrerer Merkmalsvektoren und wenigstens einen
Merkmalsvektor pro abgetastetes Signal aus den analysierten
Wellenformen,
Quantisieren jedes Merkmalsvektors mit den
Unterschritten:
Herstellen mehrerer Quantisierungspegel,
Verteilen der Quantisierungspegel ungleichartig über
einer vorbestimmten statistischen Verteilung,
Ableiten mehrerer Quantisierungsschwellenwerte
entsprechend den verteilten Quantisierungspegeln,
Ersetzen jedes Wertes jedes Merkmalsvektors durch einen
durch die Quantisierungsschwellenwerte bestimmten
korrespondierenden Quantisierungswert, und
Speichern jedes einen quantisierten Vektor darstellenden
Wertes in einem Speicher als die Signalidentifikation für das
korrespondierende abgetastete Signal.
12. Verfahren nach Anspruch 11, wobei der Schritt der
Verteilung der Quantisierungspegel den Schritt einer Verteilung der
Quantisierungspegel in überlappender Art und Weise aufweist,
und wobei der Schritt des Ersetzens jedes Wertes jedes
Merkmalsvektors die weiteren Schritte
Ersetzen jedes Wertes jedes Merkmalsvektors durch
mehrere durch die überlappten Quantisierungspegel bestimmten
Quantisierungswerte, wobei so jeder Merkmalsvektor durch mehrere
quantisierte Vektoren ersetzt wird, und
Permutieren der mehreren quantisierten Vektoren jedes
Merkmalsvektors zur Erzeugung mehrerer permutierter Vektoren
aufweist,
wobei der Schritt des Speicherns den Schritt eines
Speicherns von mit den mehreren quantisierten Vektoren
korrespondierenden Werten für jedes abgetastete Signal aufweist.
13. Verfahren nach Anspruch 11, wobei der Ableitungsschritt
den Schritt eines Berechnens zweier statistischer Momente für
jede analysierte Wellenform und Bilden jedes Merkmalsvektors
so, daß er die zwei statistischen Momente enthält, aufweist.
14. Verfahren nach einem der Ansprüche 1 bis 10, mit den
Schritten:
Berechnen eines statistischen Moments des Signals
entsprechend der Formel
wobei N die Zahl der Abtastpunkte,
1 < n < N,
X den Signalwert des Signals an einem Abtastpunkt,
µ ein Mittel der Signalwerte,
eine Standardabweichung des Signalwertes und
k eine ganze Zahl größer als 1
bedeuten,
Vergleichen des Berechneten statistischen Moments mit
einer mehrere gespeicherte Signalidentifikationen
enthaltenden Bibliothek und
Erkennen des empfangenen Signals als ähnlich wenigstens
einer der gespeicherten Signalidentifikationen.
15. Verfahren nach Anspruch 14, wobei der Berechnungsschritt
die Schritte einer Berechnung der Asymmetrie und Wölbung des
Signals aufweist, und wobei der Vergleichsschritt den Schritt
einer Bildung eines Merkmalsvektors aus der Asymmetrie und
Wölbung aufweist.
16. Verfahren nach Anspruch 14, wobei der Empfangsschritt die
Schritte
Bandpaßfiltern des empfangenen Signals zum Erzeugen
mehrerer gefilterter Signale,
Gleichrichten der gefilterten Signale,
Tiefpaßfiltern der gleichgerichteten Signale und
Berechnen mehrerer Linearkombinationen der
tiefpaßgefilterten Signale
aufweist.
17. Verfahren nach Anspruch 16, wobei der Abtastschritt die
Schritte
Abtasten einer ersten der Linearkombinationen an
mehreren Abtastpunkten zur Erzeugung einer ersten Anzahl
Signalwerte und
Abtasten einer zweiten der Linearkombinationen an
mehreren Abtastpunkten zur Erzeugung einer zweiten Anzahl
Signalwerte
aufweist.
18. Verfahren nach Anspruch 17, wobei der Berechnungsschritt
die Schritte
Berechnen eines ersten Asymmetriewertes und eines ersten
Wölbungswertes aus der ersten Anzahl Signalwerte,
Berechnen eines zweiten Asymmetriewertes und eines
zweiten Wölbungswertes für die zweite Anzahl Signalwerte und
Ableiten eines den ersten und zweiten Asymmetriewert und
ersten und zweiten Wölbungswert aufweisenden Merkmalsvektors
aufweist
19. Verfahren nach Anspruch 18, wobei der Vergleichsschritt
die Schritte
Quantisieren des Merkmalsvektors entsprechend einer Zahl
vorbestimmter Quantisierungsmuster zur Erzeugung eines
quantisierten Vektors und
Zugreifen auf die Bibliothek mit dem quantisierten
Vektor zur Lokalisierung einer mit dem quantisierten Vektor
korrespondierenden Signalidentifikation
aufweist
20. Verfahren nach Anspruch 19, wobei der Zugreifschritt die
Schritte
Bilden einer gewichteten Summe der Werte des
quantisierten Vektors unter Verwendung einer nichtdezimalen Grundzahl,
Verwenden der gewichteten Summe als eine Adresse zum
Zugreifen auf eine Zeigertabelle zum Lokalisieren eines mit der
gewichteten Summe korrespondierenden Zeigers und
Verwenden des Zeigers zum Lokalisieren einer die mit dem
quantisierten Vektor korrespondierende Signalidentifikation
enthaltenden Identifikationsliste
aufweist.
21. Verfahren nach Anspruch 20, wobei der Erkennungsschritt
die Schritte
Korrelieren einer dritten der mehreren
Linearkombinationen mit mehreren mit den in der Signalidentifikationsliste
enthaltenen Signalidentifikationen korrespondierenden
gespeicherten Signalen und
Auswählen eines gespeicherten Signals, dessen
Korrelation mit der dritten Linearkombination einen vorbestimmten
Schwellenwert überschreitet,
aufweist.
22. Verfahren nach Anspruch 19, wobei der
Quantisierungsschritt die Schritte
Kategorisieren jedes Asymmetriewertes des
Merkmalsvektors entsprechend einem vorbestimmten
Asymmetriequantisierungsmuster, in welchem Kategorien ungleichartig verteilt
sind, und
Kategorisieren jedes Wölbungswertes des Merkmalsvektors
entsprechend einem vorbestimmten
Wölbungsquantisierungsmuster, in welchem Kategorien ungleichartig verteilt sind,
aufweist.
23. Verfahren nach einem der Ansprüche 11 bis 13, mit den
Schritten:
Empfangen eines Referenzsignals,
Abtasten des Referenzsignals an mehreren Abtastpunkten
zur Erzeugung mehrerer Signalwerte,
Berechnen eines statistischen Moments des empfangenen
Referenzsignals entsprechend der Formel
wobei N die Zahl der Abtastpunkte,
1 < n < N,
X den abgetasteten Signalwert an einem Abtastpunkt,
µ ein Mittel der abgetasteten Signalwerte,
eine Standardabweichung der abgetasteten
Signalwerte und
k eine ganze Zahl größer als 1
bedeuten,
Ableiten eines Merkmalsvektors aus dem berechneten
statistischen Moment, und
Speichern des Merkmalsvektors oder einer Darstellung
desselben in einem Speicher
aufweist.
24. Verfahren nach Anspruch 23, wobei der Berechnungsschritt
den Schritt einer Berechnung zweier statistischer Momente des
empfangenen Referenzsignals aufweist, und wobei der
Ableitungsschritt
den Schritt einer Ableitung des Merkmalsvektors
aus den beiden berechneten statistischen Momente aufweist.
25. Verfahren nach Anspruch 23, wobei der Empfangsschritt die
Schritte
Bandpaßfiltern des empfangenen Signals zur Erzeugung
mehrerer gefilterter Signale,
Gleichrichten der gefilterten Signale,
Tiefpaßfiltern der gleichgerichteten Signale und
Berechnen mehrerer Linearkombinationen der
tiefpaßgefilterten Signale
aufweist.
26. Verfahren nach Anspruch 25, wobei der Abtastschritt die
Schritte
Abtasten eines ersten Teils einer der
Linearkombinationen an mehreren Punkten zur Erzeugung einer ersten Anzahl
Signalwerte und
Abtasten eines zweiten Teils der einen Linearkombination
an mehreren Punkten zur Erzeugung einer zweiten Anzahl
Signalwerte
aufweist.
27. Verfahren nach Anspruch 26, wobei der Berechnungsschritt
die Schritte
Berechnen der Asymmetrie und Wölbung der ersten Anzahl
Signalwerte zur Erzeugung eines ersten Asymmetriewertes und
ersten Wölbungswertes und
Berechnen der Asymmetrie und Wölbung der zweiten Anzahl
Signalwerte zur Erzeugung eines zweiten Asymmetriewertes und
zweites Wölbungswertes
aufweist.
28. Verfahren nach Anspruch 27, wobei der Ableitungsschritt
die Schritte
Bilden eines ersten Merkmalsvektors mit dem ersten
Asymmetriewert und ersten Wölbungswert und
Bilden eines zweiten Merkmalsvektors mit dem zweiten
Asymmetriewert und zweiten Wölbungswert
aufweist.
29. Verfahren nach Anspruch 28, wobei der Ableitungsschritt
den Schritt einer Quantisierung beider Merkmalsvektoren durch
Ersetzen der Asymmetrie- und Wölbungswerte durch ganze Zahlen
entsprechend vorbestimmter ungleichartiger
Quantisierungsmuster zur Erzeugung eines ersten und zweiten quantisierten
Vektors aufweist.
30. Verfahren nach Anspruch 29, wobei der Speicherschritt die
Schritte
Berechnen einer gewichteten Summe des eine nichtdezimale
Grundzahl verwendenden ersten Vektors,
Berechnen einer gewichteten Summe des eine nichtdezimale
Grundzahl verwendenden zweiten Vektors,
Verwenden der gewichteten Summen zum Adressieren des
Speichers, und
Speichern eines mit dem Referenzsignal
korrespondierenden Signalidentifikationskode im Speicher bei den mit den
gewichteten Summen korrespondieren Adressen
aufweist.
31. Verfahren nach Anspruch 28, wobei der Ableitungsschritt
weiter die Schritte
Erzeugen eines ersten und zweiten
überlappungsquantisierten Vektors aus dem ersten Merkmalsvektor entsprechend
vorbestimmten ungleichartigen
Überlappungsquantisierungsmustern,
Erzeugen eines dritten und vierten
überlappungsquantisierten Vektors aus dem zweiten Merkmalsvektor entsprechend
den vorbestimmten ungleichartigen
Überlappungsquantisierungsmustern,
Bilden einer ersten Anzahl Permutationen des ersten und
zweiten überlappungsquantisierten Vektors, und
Bilden einer zweiten Anzahl Permutationen des dritten
und vierten überlappungsquantisierten Vektors
aufweist.
32. Verfahren nach Anspruch 31, wobei der Speicherschritt die
Schritte
Berechnen einer gewichteten Summe der Werte sowohl der
ersten als auch zweiten Anzahl Permutationen,
Zugreifen auf den Speicher bei mit den gewichteten
Summen korrespondierenden Adressen, und
Speichern eines das Referenzsignal identifizierenden
Signalidentifikationskodes in dem Speicher bei mit den Adressen
korrespondierenden Bereichen
aufweist.
33. Vorrichtung zum Klassifizieren eines Signals, bestehend
aus:
einem Empfänger zum Empfangen des Signals,
einem Speicher,
einem Prozessor zum a) Abtasten des Signals an mehreren
Punkten zur Erzeugung mehrerer Signalwerte, b) Ableiten eines
Multiwert-Merkmalsvektors aus den Signalwerten, c)
Quantisieren des Merkmalsvektors durch Ersetzen jedes
Merkmalsvektorwertes durch einen von einem vorbestimmten,
Merkmalsvektorwerte ungleichartig kategorisierenden und im Speicher
gespeicherten Quantisierungsmuster bestimmten Kategoriewert und
d) Zugreifen auf eine im Speicher gespeicherte
Signalbibliothek mit dem quantisierten Vektor zur Erzeugung eines mit dem
empfangenen Signal korrespondierenden
Signalidentifikationskodes.
34. Vorrichtung nach Anspruch 33, wobei das vorbestimmte
Quantisierungsmuster ein Überlappungsquantisierungsmuster
ist.
35. Vorrichtung nach Anspruch 33, wobei der Prozessor mehrere
verschiedene vorbestimmte Quantisierungsmuster zur
Quantisierung des Merkmalsvektors benutzt.
36. Vorrichtung nach Anspruch 33, wobei der Prozessor b1)
zwei verschiedene statistische Momente der mehreren
Signalwerte berechnet und b2) den Merkmalsvektor unter Verwendung
der zwei berechneten statistischen Momente bildet.
37. Vorrichtung nach Anspruch 36, wobei für jedes der zwei
statistischen Momente ein vorbestimmtes Quantisierungsmuster
vorgesehen ist.
38. Vorrichtung nach Anspruch 36, wobei die zwei
verschiedenen statistischen Momente Asymmetrie und Wölbung aufweisen.
39. Vorrichtung nach Anspruch 33, wobei der Prozessor das
empfangene Signal hüllkurvengleichrichtet.
40. Vorrichtung nach Anspruch 33, wobei der Prozessor c1) den
Merkmalsvektor durch mehrere quantisierte Vektoren
entsprechend wenigstens einem vorbestimmten Quantisierungsmuster mit
überlappenden Kategorien ersetzt und c2) die mehreren
quantisierten Vektoren quantisiert, um eine weitere Anzahl
permutierter quantisierter Vektoren zu erzeugen.
41. Vorrichtung nach Anspruch 40, wobei der Prozessor d1) mit
den mehreren permutierten quantisierten Vektoren auf die
Signalbibliothek zugreift, um mehrere Speicherstellen zu
erreichen, und d2) in jede der Speicherstellen einen mit dem
empfangenen Signal korrespondierenden Signalidentifikationskode
schreibt.
42. Vorrichtung nach Anspruch 33, wobei der Empfänger a) das
Signal spektralanalysiert, um mehrere analysierte Signale mit
verschiedenen Frequenzbändern zu gewinnen, und b)
Linearkombinationen der analysierten Wellenformen bildet,
und wobei der Prozessor jede Signalkombination zur Erzeugung
mehrerer Abtastpunkte für jede Linearkombination abtastet,
Asymmetrie- und Wölbungswerte für jede Linearkombination aus
den korrespondierenden Abtastpunkten berechnet und den
Merkmalsvektor derart bildet, daß er Asymmetrie- und
Wölbungswerte aus allen Linearkombinationen enthält.
43. Vorrichtung zum Erzeugen einer zur Identifikation von
Rundfunksignalen verwendbaren
Signalidentifikationsbibliothek, bestehend aus:
einem Empfänger zum Empfangen mehrerer durch Rundfunk zu
sendender Signale,
einem Speicher,
einem Prozessor zum a) Abtasten der durch Rundfunk zu
sendenden Signale zur Erzeugung mehrerer analysierter
Wellenformen für jedes durch Rundfunk zu sendende Signal, b)
Ableiten mehrerer Merkmalsvektoren aus den analysierten
Wellenformen und wenigstens eines Merkmalsvektors für jedes
abgetastete Signal und c) Quantisieren jedes Merkmalsvektors, mit den
Unterschritten:
c1) Herstellen mehrerer Quantisierungspegel,
c2) Verteilen der Quantisierungspegel ungleichartig über
einer vorbestimmten statistischen Verteilung,
c3) Ableiten mehrerer Quantisierungsschwellenwerte ent
sprechend den verteilen Quantisierungspegeln, und
c4) Ersetzen jedes Wertes jedes Merkmalsvektors durch
einen durch die Quantisierungsschwellenwerte bestimmten
korrespondierenden Quantisierungswert, wobei
der Prozessor d) einen jeden quantisierten Vektor im
Speicher als die Signalidentifikation für das
korrespondierende abgetastete Signal darstellenden Wert speichert.
44. Vorrichtung nach Anspruch 43, wobei die
Quantisierungspegel überlapptartig verteilt sind, wobei der Prozessor c4a)
jeden Wert jedes Merkmalsvektors durch mehrere durch die
überlappten Quantisierungspegel bestimmte Quantisierungswerte
ersetzt, wobei jeder Merkmalsvektor auf diese Weise durch
mehrere quantisierte Vektoren ersetzt wird, und c4b) die
mehreren quantisierten Vektoren jedes Merkmalsvektors
permutiert, um mehrere permutierte Vektoren zu erzeugen,
und wobei der Prozessor d1) im Speicher für jedes
abgetastete Signal Werte speichert, die mit den mehreren quantisierten
Vektoren korrespondieren.
45. Vorrichtung nach Anspruch 43, wobei der Prozessor b1) für
jede analysierte Wellenform zwei statistische Momente
berechnet und b2) jeden Merkmalsvektor derart bildet, daß er die
zwei berechneten statistischen Momente enthält.
46. Vorrichtung nach einem der Ansprüche 33 bis 42, wobei der
Prozessor e) zur Berechnung eines statistischen Moments des
Signals gemäß der Formel
wobei N die Zahl der Abtastpunkte,
1 < n < N,
X den Signalwert des Signals an einem Abtastpunkt,
µ ein Mittel des Signalwertes,
eine Standardabweichung des Signalwertes und
k eine ganze Zahl größer als 1
bedeuten,
f) zum Speichern einer mehrere gespeicherte
Signalidentifikationen enthaltenden Bibliothek, g) Vergleichen des
berechneten statistischen Momentes mit den mehreren gespeicherten
Signalidentifikationen in der Bibliothek und h) Erkennen des
empfangenen Signals als einem der gespeicherten
Signalidentifikationen ähnlich vorgesehen ist.
47. Vorrichtung nach Anspruch 46, wobei die
Verarbeitungseinrichtung die Asymmetrie und Wölbung des Signals berechnet und
aus der Asymmetrie und Wölbung einen Merkmalsvektor bildet.
48. Vorrichtung nach Anspruch 46, wobei die
Verarbeitungseinrichtung
eine Einrichtung zur Bandpaßfilterung des empfangenen
Signals zur Erzeugung mehrerer gefilterter Signale,
eine Einrichtung zum Gleichrichten der gefilterten
Signale,
eine Einrichtung zum Tiefpaßfiltern der
gleichgerichteten Signale und
eine Einrichtung zum Berechnen mehrerer
Linearkombinationen der tiefpaßgefilterten Signale
aufweist.
49. Vorrichtung nach Anspruch 48, wobei die
Verarbeitungseinrichtung a1) eine erste der Linearkombinationen an mehreren
Abtastpunkten abtastet, um eine erste Anzahl Signalwerte zu
erzeugen, und a2) eine zweite der Linearkombinationen an
mehreren Abtastpunkten abtastet, um eine zweite Anzahl
Signalwerte zu erzeugen.
50. Vorrichtung nach Anspruch 49, wobei die
Verarbeitungseinrichtung e1) einen ersten Asymmetriewert und einen ersten
Wölbungswert aus der ersten Anzahl Signalwerte sowie einen
zweiten Asymmetriewert und zweiten Wölbungswert für die
zweite Anzahl Signalwerte berechnet und e2) einen den ersten und
zweiten Asymmetriewert und ersten und zweiten Wölbungswert
aufweisenden Merkmalsvektor ableitet.
51. Vorrichtung nach Anspruch 50, wobei die
Verarbeitungseinrichtung g1) den Merkmalsvektor entsprechend einer Anzahl
gespeicherter vorbestimmter Quantisierungsmuster quantisiert,
um einen quantisierten Vektor zu erzeugen, und 92) mit dem
quantisierten Vektor auf die Bibliothek zugreift, um eine mit
dem quantisierten Vektor korrespondierende
Signalidentifikation zu lokalisieren.
52. Vorrichtung nach Anspruch 51, wobei die
Verarbeitungseinrichtung 92) eine gewichtete Summe der Werte des eine
nichtdezimale
Grundzahl verwendenden quantisierten Vektors bildet,
g2b) die gewichtete Summe als eine Adresse zum Zugreifen auf
eine in der Bibliothek gespeicherte Zeigertabelle zum
Lokalisieren eines mit der gewichteten Summe korrespondierenden
Zeigers verwendet und den Zeiger zum Zugreifen auf die
Bibliothek zum Lokalisieren einer die mit dem quantisierten
Vektor korrespondierende Signalidentifikation enthaltenden
Signalidentifikationsliste verwendet.
53. Vorrichtung nach Anspruch 52, wobei die
Verarbeitungseinrichtung h1) eine dritte der mehreren Linearkombinationen mit
mehreren gespeicherten Signalen korreliert, die mit den in
der Signalidentifikationsliste enthaltenen
Signalidentifikationen korrespondieren, und h2) ein gespeichertes Signal
auswählt, dessen Korrelation mit der dritten Linearkombination
einen vorbestimmten Schwellenwert überschreitet.
54. Vorrichtung nach Anspruch 51, wobei die
Verarbeitungseinrichtung g1a) jeden Asymmetriewert des Merkmalsvektors
entsprechend einem gespeicherten vorbestimmten
Asymmetriequantisierungsmuster, in welchem Kategorien ungleichartig verteilt
sind, kategorisiert, und d1b) jeden Wölbungswert des
Merkmalsvektors entsprechend einem gespeicherten vorbestimmten
Wölbungsquantisierungsmuster, in welchem Kategorien
ungleichartig verteilt sind, kategorisiert.
55. Vorrichtung nach einem der Ansprüche 43 bis 45, wobei der
Prozessor e) zum Berechnen eines statistischen Moments des
empfangenen Referenzsignals gemäß der Formel
wobei N die Zahl der Abtastpunkte,
1 < n < N,
X den abgetasteten Signalwert an einem Abtastpunkt,
µ ein Mittel der abgetasteten Signalwerte,
eine Standardabweichung der abgetasteten Signal
werte und
k eine ganze Zahl größer als 1
bedeuten,
f) Ableiten eines Merkmalsvektors aus dem berechneten
statistischen Moment und g) Speichern des Merkmalsvektors oder
einer Darstellung dieses Vektors in dem Speicher vorgesehen
ist.
56. Vorrichtung nach Anspruch 55, wobei die
Verarbeitungseinrichtung zwei statistische Momente des empfangenen
Referenzsignais berechnet und den Merkmalsvektor aus beiden
berechneten statistischen Momenten ableitet.
57. Vorrichtung nach Anspruch 55, wobei die
Verarbeitungseinrichtung das empfangene Signal bandpaßfiltert, um mehrere
gefilterte Signale zu erzeugen, die gefilterten Signale
gleichrichtet, die gleichgerichteten Signale tiefpaßfiltert und
mehrere Linearkombinationen der tiefpaßgefilterten Signale
berechnet.
58. Vorrichtung nach Anspruch 57, wobei die
Verarbeitungseinrichtung a1) einen ersten Teil einer der Linearkombinationen
an mehreren Abtastpunkten abtastet, um eine erste Anzahl
Signalwerte zu erzeugen, und a2) einen zweiten Teil der einen
Linearkombination an mehreren Abtastpunkten abtastet, um eine
zweite Anzahl Signalwerte zu erzeugen.
59. Vorrichtung nach Anspruch 58, wobei die
Verarbeitungseinrichtung e1) die Asymmetrie und Wölbung der ersten Anzahl
Signalwerte berechnet, um einen ersten Asymmetriewert und
einen ersten Wölbungswert zu erzeugen, und e2) die Asymmetrie
und Wölbung der zweiten Anzahl Signalwerte berechnet, um
einen zweiten Asymmetriewert und zweiten Wölbungswert zu
erzeugen.
60. Vorrichtung nach Anspruch 59, wobei die
Verarbeitungseinrichtung f1) einen den ersten Asymmetriewert und ersten
Wölbungswert enthaltenden ersten Merkmalsvektor bildet und f2)
einen den zweiten Asymmetriewert und zweiten Wölbungswert
enthaltenden zweiten Merkmalsvektor bildet.
61. Vorrichtung nach Anspruch 60, wobei die
Verarbeitungseinrichtung f3) beide Merkmalsvektoren durch Ersetzen der
Asymmetrie- und Wölbungswerte durch ganze Zahlen entsprechend
vorbestimmter, in dem Speicher gespeicherter ungleichartiger
Quantisierungsmuster quantisiert, um den ersten und zweiten
quantisierten Vektor zu erzeugen.
62. Vorrichtung nach Anspruch 61, wobei die
Verarbeitungseinrichtung g1) eine gewichtete Summe aus dem eine nichtdezimale
Grundzahl verwendenden ersten Vektor berechnet, g2) eine
gewichtete Summe aus dem eine nichtdezimale Grundzahl
verwendenden zweiten Vektor berechnet, g4) die gewichteten Summen
zum Adressieren des Speichers verwendet, und g5) in dem
Speicher einen mit dem Referenzsignal korrespondierenden
Signalidentifikationskode an einer mit den gewichteten Summen
korrespondierenden Adresse speichert.
63. Vorrichtung nach Anspruch 60, wobei die
Verabeitungseinrichtung f3) einen ersten und zweiten
überlappungsquantisierten Vektor aus dem ersten Merkmalsvektor entsprechend den in
dem Speicher gespeicherten vorbestimmten ungleichartigen
Überlappungsquantisierungsmustern erzeugt, f4) einen dritten
und vierten überlappungsquantisierten Vektor aus dem zweiten
Merkmalsvektor entsprechend den in dem Speicher gespeicherten
vorbestimmten ungleichartigen
Überlappungsquantisierungsmuster erzeugt, f5) eine erste Anzahl Permutationen des ersten
und zweiten überlappungsquantisierten Vektors bildet und f6)
eine zweite Anzahl Permutationen des dritten und vierten
überlappungsquantisierten Vektors bildet.
64. Vorrichtung nach Anspruch 63, wobei die
Verarbeitungseinrichtung g1) eine gewichtete Summe der Werte sowohl der
ersten als auch zweiten Anzahl Permutationen berechnet, g2) auf
den Speicher bei mit den gewichteten Summen
korrespondierenden Adressen zugreift und g3) in den Speicher einen das
Referenzsignal identifizierenden Signalidentifikationskode bei
mit den Adressen korrespondierenden Bereichen speichert.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US07/517,835 US5210820A (en) | 1990-05-02 | 1990-05-02 | Signal recognition system and method |
| PCT/US1991/002907 WO1991017540A1 (en) | 1990-05-02 | 1991-05-02 | Signal recognition system and method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE69122017D1 DE69122017D1 (de) | 1996-10-17 |
| DE69122017T2 true DE69122017T2 (de) | 1997-04-10 |
Family
ID=24061421
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE69122017T Expired - Fee Related DE69122017T2 (de) | 1990-05-02 | 1991-05-02 | Verfahren und vorrichtung zur signalerkennung |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US5210820A (de) |
| EP (1) | EP0480010B1 (de) |
| JP (1) | JP3130926B2 (de) |
| AT (1) | ATE142815T1 (de) |
| CA (1) | CA2041754C (de) |
| DE (1) | DE69122017T2 (de) |
| ES (1) | ES2091328T3 (de) |
| HK (1) | HK133697A (de) |
| WO (1) | WO1991017540A1 (de) |
Families Citing this family (245)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2539274A1 (fr) * | 1983-01-19 | 1984-07-20 | Boussac Saint Freres Bsf | Procede de fabrication de couches-culottes a jeter et couches-culottes obtenues |
| JP3277398B2 (ja) * | 1992-04-15 | 2002-04-22 | ソニー株式会社 | 有声音判別方法 |
| US5745873A (en) * | 1992-05-01 | 1998-04-28 | Massachusetts Institute Of Technology | Speech recognition using final decision based on tentative decisions |
| US5323337A (en) * | 1992-08-04 | 1994-06-21 | Loral Aerospace Corp. | Signal detector employing mean energy and variance of energy content comparison for noise detection |
| JPH06110945A (ja) * | 1992-09-29 | 1994-04-22 | Fujitsu Ltd | 音楽データベース作成装置及びその検索装置 |
| GB9221678D0 (en) * | 1992-10-15 | 1992-11-25 | Taylor Nelson Group Limited | Identifying a received programme stream |
| US5748763A (en) | 1993-11-18 | 1998-05-05 | Digimarc Corporation | Image steganography system featuring perceptually adaptive and globally scalable signal embedding |
| US7313251B2 (en) | 1993-11-18 | 2007-12-25 | Digimarc Corporation | Method and system for managing and controlling electronic media |
| US5841978A (en) | 1993-11-18 | 1998-11-24 | Digimarc Corporation | Network linking method using steganographically embedded data objects |
| US5822436A (en) * | 1996-04-25 | 1998-10-13 | Digimarc Corporation | Photographic products and methods employing embedded information |
| US7515733B2 (en) * | 1993-11-18 | 2009-04-07 | Digimarc Corporation | Methods and arrangements employing digital content items |
| US5768426A (en) * | 1993-11-18 | 1998-06-16 | Digimarc Corporation | Graphics processing system employing embedded code signals |
| JP2956473B2 (ja) * | 1994-04-21 | 1999-10-04 | 日本電気株式会社 | ベクトル量子化装置 |
| US8094949B1 (en) | 1994-10-21 | 2012-01-10 | Digimarc Corporation | Music methods and systems |
| US6560349B1 (en) | 1994-10-21 | 2003-05-06 | Digimarc Corporation | Audio monitoring using steganographic information |
| US7362775B1 (en) * | 1996-07-02 | 2008-04-22 | Wistaria Trading, Inc. | Exchange mechanisms for digital information packages with bandwidth securitization, multichannel digital watermarks, and key management |
| DE69521597T2 (de) * | 1995-03-08 | 2002-07-11 | Generalmusic S.P.A., San Giovanni In Marignano | Vorrichtung mit Mikroprocessor zur Auswahl und Erkennung von Musikstücken |
| US7805500B2 (en) * | 1995-05-08 | 2010-09-28 | Digimarc Corporation | Network linking methods and apparatus |
| US7224819B2 (en) | 1995-05-08 | 2007-05-29 | Digimarc Corporation | Integrating digital watermarks in multimedia content |
| US7486799B2 (en) * | 1995-05-08 | 2009-02-03 | Digimarc Corporation | Methods for monitoring audio and images on the internet |
| US6760463B2 (en) * | 1995-05-08 | 2004-07-06 | Digimarc Corporation | Watermarking methods and media |
| US5613004A (en) | 1995-06-07 | 1997-03-18 | The Dice Company | Steganographic method and device |
| US8429205B2 (en) * | 1995-07-27 | 2013-04-23 | Digimarc Corporation | Associating data with media signals in media signal systems through auxiliary data steganographically embedded in the media signals |
| US6408331B1 (en) | 1995-07-27 | 2002-06-18 | Digimarc Corporation | Computer linking methods using encoded graphics |
| US6965682B1 (en) | 1999-05-19 | 2005-11-15 | Digimarc Corp | Data transmission by watermark proxy |
| US6411725B1 (en) * | 1995-07-27 | 2002-06-25 | Digimarc Corporation | Watermark enabled video objects |
| US7562392B1 (en) * | 1999-05-19 | 2009-07-14 | Digimarc Corporation | Methods of interacting with audio and ambient music |
| US7171018B2 (en) * | 1995-07-27 | 2007-01-30 | Digimarc Corporation | Portable devices and methods employing digital watermarking |
| US6505160B1 (en) | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
| US6577746B1 (en) | 1999-12-28 | 2003-06-10 | Digimarc Corporation | Watermark-based object linking and embedding |
| US5712979A (en) * | 1995-09-20 | 1998-01-27 | Infonautics Corporation | Method and apparatus for attaching navigational history information to universal resource locator links on a world wide web page |
| US5819285A (en) * | 1995-09-20 | 1998-10-06 | Infonautics Corporation | Apparatus for capturing, storing and processing co-marketing information associated with a user of an on-line computer service using the world-wide-web. |
| US5812769A (en) * | 1995-09-20 | 1998-09-22 | Infonautics Corporation | Method and apparatus for redirecting a user to a new location on the world wide web using relative universal resource locators |
| US5717860A (en) * | 1995-09-20 | 1998-02-10 | Infonautics Corporation | Method and apparatus for tracking the navigation path of a user on the world wide web |
| JPH0990974A (ja) * | 1995-09-25 | 1997-04-04 | Nippon Telegr & Teleph Corp <Ntt> | 信号処理方法 |
| US7664263B2 (en) | 1998-03-24 | 2010-02-16 | Moskowitz Scott A | Method for combining transfer functions with predetermined key creation |
| US6205249B1 (en) | 1998-04-02 | 2001-03-20 | Scott A. Moskowitz | Multiple transform utilization and applications for secure digital watermarking |
| US7159116B2 (en) | 1999-12-07 | 2007-01-02 | Blue Spike, Inc. | Systems, methods and devices for trusted transactions |
| US7457962B2 (en) | 1996-07-02 | 2008-11-25 | Wistaria Trading, Inc | Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data |
| US5889868A (en) * | 1996-07-02 | 1999-03-30 | The Dice Company | Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data |
| US7095874B2 (en) | 1996-07-02 | 2006-08-22 | Wistaria Trading, Inc. | Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data |
| US7346472B1 (en) * | 2000-09-07 | 2008-03-18 | Blue Spike, Inc. | Method and device for monitoring and analyzing signals |
| US7177429B2 (en) | 2000-12-07 | 2007-02-13 | Blue Spike, Inc. | System and methods for permitting open access to data objects and for securing data within the data objects |
| US6088455A (en) * | 1997-01-07 | 2000-07-11 | Logan; James D. | Methods and apparatus for selectively reproducing segments of broadcast programming |
| US5892536A (en) * | 1996-10-03 | 1999-04-06 | Personal Audio | Systems and methods for computer enhanced broadcast monitoring |
| US7055166B1 (en) | 1996-10-03 | 2006-05-30 | Gotuit Media Corp. | Apparatus and methods for broadcast monitoring |
| US5986692A (en) * | 1996-10-03 | 1999-11-16 | Logan; James D. | Systems and methods for computer enhanced broadcast monitoring |
| US7751596B2 (en) * | 1996-11-12 | 2010-07-06 | Digimarc Corporation | Methods and arrangements employing digital content items |
| US7730317B2 (en) | 1996-12-20 | 2010-06-01 | Wistaria Trading, Inc. | Linear predictive coding implementation of digital watermarks |
| US6708146B1 (en) | 1997-01-03 | 2004-03-16 | Telecommunications Research Laboratories | Voiceband signal classifier |
| JP3584458B2 (ja) * | 1997-10-31 | 2004-11-04 | ソニー株式会社 | パターン認識装置およびパターン認識方法 |
| US7689532B1 (en) | 2000-07-20 | 2010-03-30 | Digimarc Corporation | Using embedded data with file sharing |
| US6263031B1 (en) * | 1998-04-29 | 2001-07-17 | Hughes Electronics Corp. | Method and apparatus for signal burst classification |
| DE19821273B4 (de) * | 1998-05-13 | 2006-10-05 | Deutsche Telekom Ag | Meßverfahren zur gehörrichtigen Qualitätsbewertung von codierten Audiosignalen |
| US7644282B2 (en) | 1998-05-28 | 2010-01-05 | Verance Corporation | Pre-processed information embedding system |
| US7664264B2 (en) | 1999-03-24 | 2010-02-16 | Blue Spike, Inc. | Utilizing data reduction in steganographic and cryptographic systems |
| US8055588B2 (en) * | 1999-05-19 | 2011-11-08 | Digimarc Corporation | Digital media methods |
| US8752118B1 (en) | 1999-05-19 | 2014-06-10 | Digimarc Corporation | Audio and video content-based methods |
| US7565294B2 (en) * | 1999-05-19 | 2009-07-21 | Digimarc Corporation | Methods and systems employing digital content |
| US6895514B1 (en) * | 1999-06-25 | 2005-05-17 | Lucent Technologies Inc. | Method and apparatus for achieving secure password access |
| GR1003625B (el) * | 1999-07-08 | 2001-08-31 | Μεθοδος χημικης αποθεσης συνθετων επικαλυψεων αγωγιμων πολυμερων σε επιφανειες κραματων αλουμινιου | |
| US7475246B1 (en) | 1999-08-04 | 2009-01-06 | Blue Spike, Inc. | Secure personal content server |
| JP3601371B2 (ja) | 1999-09-27 | 2004-12-15 | ヤマハ株式会社 | 波形生成方法及び装置 |
| US6671407B1 (en) | 1999-10-19 | 2003-12-30 | Microsoft Corporation | System and method for hashing digital images |
| CA2310769C (en) * | 1999-10-27 | 2013-05-28 | Nielsen Media Research, Inc. | Audio signature extraction and correlation |
| KR100364753B1 (ko) * | 1999-11-19 | 2002-12-16 | 엘지전자 주식회사 | 칼라 히스토그램의 빈값 양자화 방법 |
| JP2003520506A (ja) * | 2000-01-13 | 2003-07-02 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ノイズリダクション |
| US6577346B1 (en) * | 2000-01-24 | 2003-06-10 | Webtv Networks, Inc. | Recognizing a pattern in a video segment to identify the video segment |
| US6737957B1 (en) | 2000-02-16 | 2004-05-18 | Verance Corporation | Remote control signaling using audio watermarks |
| US6834308B1 (en) | 2000-02-17 | 2004-12-21 | Audible Magic Corporation | Method and apparatus for identifying media content presented on a media playing device |
| US6453252B1 (en) * | 2000-05-15 | 2002-09-17 | Creative Technology Ltd. | Process for identifying audio content |
| US6970886B1 (en) * | 2000-05-25 | 2005-11-29 | Digimarc Corporation | Consumer driven methods for associating content indentifiers with related web addresses |
| US6990453B2 (en) | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
| US7853664B1 (en) * | 2000-07-31 | 2010-12-14 | Landmark Digital Services Llc | Method and system for purchasing pre-recorded music |
| US8205237B2 (en) | 2000-09-14 | 2012-06-19 | Cox Ingemar J | Identifying works, using a sub-linear time search, such as an approximate nearest neighbor search, for initiating a work-based action, such as an action on the internet |
| US8010988B2 (en) * | 2000-09-14 | 2011-08-30 | Cox Ingemar J | Using features extracted from an audio and/or video work to obtain information about the work |
| US7127615B2 (en) | 2000-09-20 | 2006-10-24 | Blue Spike, Inc. | Security based on subliminal and supraliminal channels for data objects |
| US7277766B1 (en) * | 2000-10-24 | 2007-10-02 | Moodlogic, Inc. | Method and system for analyzing digital audio files |
| FR2815760B1 (fr) * | 2000-10-24 | 2003-01-24 | Philippe Ecrement | Procede de constitution d'un signal numerique representatif d'un signal sonore et procede de reconnaissance d'un signal sonore |
| US7562012B1 (en) * | 2000-11-03 | 2009-07-14 | Audible Magic Corporation | Method and apparatus for creating a unique audio signature |
| DE10058811A1 (de) * | 2000-11-27 | 2002-06-13 | Philips Corp Intellectual Pty | Verfahren zur Identifizierung von Musikstücken |
| US20020072982A1 (en) | 2000-12-12 | 2002-06-13 | Shazam Entertainment Ltd. | Method and system for interacting with a user in an experiential environment |
| DE10109648C2 (de) * | 2001-02-28 | 2003-01-30 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals |
| DE10134471C2 (de) * | 2001-02-28 | 2003-05-22 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals |
| US7359889B2 (en) | 2001-03-02 | 2008-04-15 | Landmark Digital Services Llc | Method and apparatus for automatically creating database for use in automated media recognition system |
| TW582022B (en) * | 2001-03-14 | 2004-04-01 | Ibm | A method and system for the automatic detection of similar or identical segments in audio recordings |
| US7363278B2 (en) * | 2001-04-05 | 2008-04-22 | Audible Magic Corporation | Copyright detection and protection system and method |
| DE10117870B4 (de) * | 2001-04-10 | 2005-06-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren und Vorrichtung zum Überführen eines Musiksignals in eine Noten-basierte Beschreibung und Verfahren und Vorrichtung zum Referenzieren eines Musiksignals in einer Datenbank |
| US6996273B2 (en) * | 2001-04-24 | 2006-02-07 | Microsoft Corporation | Robust recognizer of perceptually similar content |
| US7020775B2 (en) * | 2001-04-24 | 2006-03-28 | Microsoft Corporation | Derivation and quantization of robust non-local characteristics for blind watermarking |
| US6975743B2 (en) * | 2001-04-24 | 2005-12-13 | Microsoft Corporation | Robust and stealthy video watermarking into regions of successive frames |
| US7356188B2 (en) * | 2001-04-24 | 2008-04-08 | Microsoft Corporation | Recognizer of text-based work |
| US6973574B2 (en) * | 2001-04-24 | 2005-12-06 | Microsoft Corp. | Recognizer of audio-content in digital signals |
| US7046819B2 (en) | 2001-04-25 | 2006-05-16 | Digimarc Corporation | Encoded reference signal for digital watermarks |
| US20060206478A1 (en) * | 2001-05-16 | 2006-09-14 | Pandora Media, Inc. | Playlist generating methods |
| US7003515B1 (en) * | 2001-05-16 | 2006-02-21 | Pandora Media, Inc. | Consumer item matching method and system |
| US7962482B2 (en) * | 2001-05-16 | 2011-06-14 | Pandora Media, Inc. | Methods and systems for utilizing contextual feedback to generate and modify playlists |
| US20060212442A1 (en) * | 2001-05-16 | 2006-09-21 | Pandora Media, Inc. | Methods of Presenting and Providing Content to a User |
| US6993532B1 (en) | 2001-05-30 | 2006-01-31 | Microsoft Corporation | Auto playlist generator |
| DE10133333C1 (de) * | 2001-07-10 | 2002-12-05 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen eines Fingerabdrucks und Verfahren und Vorrichtung zum Identifizieren eines Audiosignals |
| US7529659B2 (en) * | 2005-09-28 | 2009-05-05 | Audible Magic Corporation | Method and apparatus for identifying an unknown work |
| US6968337B2 (en) * | 2001-07-10 | 2005-11-22 | Audible Magic Corporation | Method and apparatus for identifying an unknown work |
| US7328153B2 (en) * | 2001-07-20 | 2008-02-05 | Gracenote, Inc. | Automatic identification of sound recordings |
| US7877438B2 (en) * | 2001-07-20 | 2011-01-25 | Audible Magic Corporation | Method and apparatus for identifying new media content |
| US8972481B2 (en) * | 2001-07-20 | 2015-03-03 | Audible Magic, Inc. | Playlist generation method and apparatus |
| US6724914B2 (en) * | 2001-10-16 | 2004-04-20 | Digimarc Corporation | Progressive watermark decoding on a distributed computing platform |
| US20030135623A1 (en) * | 2001-10-23 | 2003-07-17 | Audible Magic, Inc. | Method and apparatus for cache promotion |
| US7065544B2 (en) * | 2001-11-29 | 2006-06-20 | Hewlett-Packard Development Company, L.P. | System and method for detecting repetitions in a multimedia stream |
| US6995309B2 (en) * | 2001-12-06 | 2006-02-07 | Hewlett-Packard Development Company, L.P. | System and method for music identification |
| US6714605B2 (en) | 2002-04-22 | 2004-03-30 | Cognio, Inc. | System and method for real-time spectrum analysis in a communication device |
| US6850735B2 (en) * | 2002-04-22 | 2005-02-01 | Cognio, Inc. | System and method for signal classiciation of signals in a frequency band |
| US7287275B2 (en) | 2002-04-17 | 2007-10-23 | Moskowitz Scott A | Methods, systems and devices for packet watermarking and efficient provisioning of bandwidth |
| US7254191B2 (en) * | 2002-04-22 | 2007-08-07 | Cognio, Inc. | System and method for real-time spectrum analysis in a radio device |
| WO2003090376A1 (en) * | 2002-04-22 | 2003-10-30 | Cognio, Inc. | System and method for classifying signals occuring in a frequency band |
| US7292656B2 (en) * | 2002-04-22 | 2007-11-06 | Cognio, Inc. | Signal pulse detection scheme for use in real-time spectrum analysis |
| CA2483104C (en) * | 2002-04-25 | 2011-06-21 | Shazam Entertainment, Ltd. | Robust and invariant audio pattern matching |
| US7082394B2 (en) * | 2002-06-25 | 2006-07-25 | Microsoft Corporation | Noise-robust feature extraction using multi-layer principal component analysis |
| US7006703B2 (en) * | 2002-06-28 | 2006-02-28 | Microsoft Corporation | Content recognizer via probabilistic mirror distribution |
| US7095873B2 (en) | 2002-06-28 | 2006-08-22 | Microsoft Corporation | Watermarking via quantization of statistics of overlapping regions |
| DE50214167D1 (de) * | 2002-07-10 | 2010-03-04 | Palm Inc | Verfahren zum Auffinden einer Tonfolge |
| US20040091111A1 (en) * | 2002-07-16 | 2004-05-13 | Levy Kenneth L. | Digital watermarking and fingerprinting applications |
| JP2005534051A (ja) | 2002-07-22 | 2005-11-10 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信号エンコーダのタイプ決定 |
| US7171161B2 (en) * | 2002-07-30 | 2007-01-30 | Cognio, Inc. | System and method for classifying signals using timing templates, power templates and other techniques |
| US8171567B1 (en) * | 2002-09-04 | 2012-05-01 | Tracer Detection Technology Corp. | Authentication method and system |
| CA2499967A1 (en) | 2002-10-15 | 2004-04-29 | Verance Corporation | Media monitoring, management and information system |
| EP1437711A1 (de) * | 2002-12-17 | 2004-07-14 | Sony France S.A. | Verfahren und Vorrichtung zur Erzeugung einer Funktion um den globalen charakteristischen Wert eines Signalinhaltes zu erzeugen |
| EP1431956A1 (de) * | 2002-12-17 | 2004-06-23 | Sony France S.A. | Verfahren und Vorrichtung zur Erzeugung einer Funktion um den globalen charakteristischen Wert eines Signalinhalts zu gewinnen |
| US6958103B2 (en) * | 2002-12-23 | 2005-10-25 | Kimberly-Clark Worldwide, Inc. | Entangled fabrics containing staple fibers |
| US8332326B2 (en) * | 2003-02-01 | 2012-12-11 | Audible Magic Corporation | Method and apparatus to identify a work received by a processing system |
| AU2003216230A1 (en) | 2003-02-10 | 2004-09-06 | Nielsen Media Research, Inc. | Methods and apparatus to adaptively gather audience information data |
| US7606790B2 (en) | 2003-03-03 | 2009-10-20 | Digimarc Corporation | Integrating and enhancing searching of media content and biometric databases |
| US20040208169A1 (en) * | 2003-04-18 | 2004-10-21 | Reznik Yuriy A. | Digital audio signal compression method and apparatus |
| US7742926B2 (en) | 2003-04-18 | 2010-06-22 | Realnetworks, Inc. | Digital audio signal compression method and apparatus |
| US7349663B1 (en) * | 2003-04-24 | 2008-03-25 | Leave A Little Room Foundation | Internet radio station and disc jockey system |
| DE60334413D1 (de) * | 2003-05-21 | 2010-11-11 | Ericsson Telefon Ab L M | Verfahren und system zur unzweideutigen winkelauflösung einer spärlichen breitbandantennengruppe |
| US7035593B2 (en) * | 2003-07-28 | 2006-04-25 | Cognio, Inc. | Signal classification methods for scanning receiver and other applications |
| US20070039018A1 (en) * | 2005-08-09 | 2007-02-15 | Verance Corporation | Apparatus, systems and methods for broadcast advertising stewardship |
| US20060239501A1 (en) | 2005-04-26 | 2006-10-26 | Verance Corporation | Security enhancements of digital watermarks for multi-media content |
| US7369677B2 (en) | 2005-04-26 | 2008-05-06 | Verance Corporation | System reactions to the detection of embedded watermarks in a digital host content |
| US9055239B2 (en) * | 2003-10-08 | 2015-06-09 | Verance Corporation | Signal continuity assessment using embedded watermarks |
| US7831832B2 (en) * | 2004-01-06 | 2010-11-09 | Microsoft Corporation | Digital goods representation based upon matrix invariances |
| US20050165690A1 (en) * | 2004-01-23 | 2005-07-28 | Microsoft Corporation | Watermarking via quantization of rational statistics of regions |
| US7852259B2 (en) | 2004-01-23 | 2010-12-14 | Telefonaktiebolaget Lm Ericsson (Publ) | Clutter filtering |
| EP2408126A1 (de) | 2004-02-19 | 2012-01-18 | Landmark Digital Services LLC | Verfahren und Vorrichtung zur Identifikation einer Rundfunkquelle |
| US8688248B2 (en) * | 2004-04-19 | 2014-04-01 | Shazam Investments Limited | Method and system for content sampling and identification |
| WO2005101998A2 (en) | 2004-04-19 | 2005-11-03 | Landmark Digital Services Llc | Content sampling and identification |
| US7770014B2 (en) * | 2004-04-30 | 2010-08-03 | Microsoft Corporation | Randomized signal transforms and their applications |
| WO2006012241A2 (en) | 2004-06-24 | 2006-02-02 | Landmark Digital Services Llc | Method of characterizing the overlap of two media segments |
| US7873521B2 (en) * | 2004-07-09 | 2011-01-18 | Nippon Telegraph And Telephone Corporation | Sound signal detection system, sound signal detection server, image signal search apparatus, image signal search method, image signal search program and medium, signal search apparatus, signal search method and signal search program and medium |
| US8130746B2 (en) | 2004-07-28 | 2012-03-06 | Audible Magic Corporation | System for distributing decoy content in a peer to peer network |
| US7567899B2 (en) * | 2004-12-30 | 2009-07-28 | All Media Guide, Llc | Methods and apparatus for audio recognition |
| US7451078B2 (en) * | 2004-12-30 | 2008-11-11 | All Media Guide, Llc | Methods and apparatus for identifying media objects |
| DE602005021047D1 (de) * | 2005-01-21 | 2010-06-17 | Unltd Media Gmbh | Vervahren zum Erzeugen eines Abdrucks eines Audiosignals |
| WO2006086556A2 (en) | 2005-02-08 | 2006-08-17 | Landmark Digital Services Llc | Automatic identfication of repeated material in audio signals |
| JP4332129B2 (ja) * | 2005-04-20 | 2009-09-16 | 富士通株式会社 | 文書分類プログラム、文書分類方法および文書分類装置 |
| US20060242198A1 (en) * | 2005-04-22 | 2006-10-26 | Microsoft Corporation | Methods, computer-readable media, and data structures for building an authoritative database of digital audio identifier elements and identifying media items |
| US7647128B2 (en) * | 2005-04-22 | 2010-01-12 | Microsoft Corporation | Methods, computer-readable media, and data structures for building an authoritative database of digital audio identifier elements and identifying media items |
| US20060270371A1 (en) * | 2005-05-31 | 2006-11-30 | Sugar Gary L | Tracking short-term maximum power spectrum density for improved visibility of low duty cycle signals |
| WO2006135986A1 (en) * | 2005-06-24 | 2006-12-28 | Monash University | Speech analysis system |
| US8020004B2 (en) | 2005-07-01 | 2011-09-13 | Verance Corporation | Forensic marking using a common customization function |
| US8781967B2 (en) * | 2005-07-07 | 2014-07-15 | Verance Corporation | Watermarking in an encrypted domain |
| US20070076869A1 (en) * | 2005-10-03 | 2007-04-05 | Microsoft Corporation | Digital goods representation based upon matrix invariants using non-negative matrix factorizations |
| US20070162761A1 (en) | 2005-12-23 | 2007-07-12 | Davis Bruce L | Methods and Systems to Help Detect Identity Fraud |
| DE102006004202B4 (de) * | 2006-01-27 | 2008-02-14 | Nec Europe Ltd. | Verfahren zum Schutz von SIP basierten Anwendungen |
| FR2898415B1 (fr) * | 2006-03-09 | 2009-01-16 | Thales Sa | Procede d'identification par profilometrie laser |
| US7735101B2 (en) | 2006-03-28 | 2010-06-08 | Cisco Technology, Inc. | System allowing users to embed comments at specific points in time into media presentation |
| US20070239675A1 (en) * | 2006-03-29 | 2007-10-11 | Microsoft Corporation | Web search media service |
| MX2007015979A (es) * | 2006-03-31 | 2009-04-07 | Nielsen Media Res Inc | Metodos, sistemas y aparato para medicion de multiples fines. |
| EP2016694B1 (de) * | 2006-05-09 | 2019-03-20 | Cognio, Inc. | System und verfahren zur identifikation drahtloser geräte über impuls-fingerabdrücke und sequenzanalyse |
| US7873514B2 (en) * | 2006-08-11 | 2011-01-18 | Ntt Docomo, Inc. | Method for quantizing speech and audio through an efficient perceptually relevant search of multiple quantization patterns |
| US8239190B2 (en) * | 2006-08-22 | 2012-08-07 | Qualcomm Incorporated | Time-warping frames of wideband vocoder |
| US8738749B2 (en) | 2006-08-29 | 2014-05-27 | Digimarc Corporation | Content monitoring and host compliance evaluation |
| US8707459B2 (en) | 2007-01-19 | 2014-04-22 | Digimarc Corporation | Determination of originality of content |
| ES2433966T3 (es) | 2006-10-03 | 2013-12-13 | Shazam Entertainment, Ltd. | Método para caudal alto de identificación de contenido de radiodifusión distribuido |
| US9179200B2 (en) | 2007-03-14 | 2015-11-03 | Digimarc Corporation | Method and system for determining content treatment |
| US10242415B2 (en) | 2006-12-20 | 2019-03-26 | Digimarc Corporation | Method and system for determining content treatment |
| US8060372B2 (en) * | 2007-02-20 | 2011-11-15 | The Nielsen Company (Us), Llc | Methods and appratus for characterizing media |
| US8453170B2 (en) * | 2007-02-27 | 2013-05-28 | Landmark Digital Services Llc | System and method for monitoring and recognizing broadcast data |
| US8458737B2 (en) * | 2007-05-02 | 2013-06-04 | The Nielsen Company (Us), Llc | Methods and apparatus for generating signatures |
| US7840177B2 (en) * | 2007-05-23 | 2010-11-23 | Landmark Digital Services, Llc | Device for monitoring multiple broadcast signals |
| JP2008009442A (ja) * | 2007-07-23 | 2008-01-17 | Video Research:Kk | 音声データ処理方法 |
| US8006314B2 (en) | 2007-07-27 | 2011-08-23 | Audible Magic Corporation | System for identifying content of digital data |
| US7917347B2 (en) * | 2007-10-30 | 2011-03-29 | International Business Machines Corporation | Generating a worst case current waveform for testing of integrated circuit devices |
| JP5414684B2 (ja) | 2007-11-12 | 2014-02-12 | ザ ニールセン カンパニー (ユー エス) エルエルシー | 音声透かし、透かし検出、および透かし抽出を実行する方法および装置 |
| US8457951B2 (en) | 2008-01-29 | 2013-06-04 | The Nielsen Company (Us), Llc | Methods and apparatus for performing variable black length watermarking of media |
| CN102007714B (zh) | 2008-03-05 | 2013-01-02 | 尼尔森(美国)有限公司 | 生成签名的方法和装置 |
| WO2009151578A2 (en) * | 2008-06-09 | 2009-12-17 | The Board Of Trustees Of The University Of Illinois | Method and apparatus for blind signal recovery in noisy, reverberant environments |
| US8259938B2 (en) | 2008-06-24 | 2012-09-04 | Verance Corporation | Efficient and secure forensic marking in compressed |
| US8199651B1 (en) | 2009-03-16 | 2012-06-12 | Audible Magic Corporation | Method and system for modifying communication flows at a port level |
| US8712109B2 (en) * | 2009-05-08 | 2014-04-29 | Microsoft Corporation | Pose-variant face recognition using multiscale local descriptors |
| EP2433391A4 (de) * | 2009-05-21 | 2013-01-23 | Digimarc Corp | Kombination aus wasserzeichen und fingerabdruck |
| US10949458B2 (en) * | 2009-05-29 | 2021-03-16 | Inscape Data, Inc. | System and method for improving work load management in ACR television monitoring system |
| US8769584B2 (en) | 2009-05-29 | 2014-07-01 | TVI Interactive Systems, Inc. | Methods for displaying contextually targeted content on a connected television |
| US9449090B2 (en) | 2009-05-29 | 2016-09-20 | Vizio Inscape Technologies, Llc | Systems and methods for addressing a media database using distance associative hashing |
| US9094715B2 (en) | 2009-05-29 | 2015-07-28 | Cognitive Networks, Inc. | Systems and methods for multi-broadcast differentiation |
| US8620967B2 (en) * | 2009-06-11 | 2013-12-31 | Rovi Technologies Corporation | Managing metadata for occurrences of a recording |
| US8738354B2 (en) * | 2009-06-19 | 2014-05-27 | Microsoft Corporation | Trans-lingual representation of text documents |
| US20110041154A1 (en) * | 2009-08-14 | 2011-02-17 | All Media Guide, Llc | Content Recognition and Synchronization on a Television or Consumer Electronics Device |
| US8161071B2 (en) | 2009-09-30 | 2012-04-17 | United Video Properties, Inc. | Systems and methods for audio asset storage and management |
| US8677400B2 (en) * | 2009-09-30 | 2014-03-18 | United Video Properties, Inc. | Systems and methods for identifying audio content using an interactive media guidance application |
| US20110078020A1 (en) * | 2009-09-30 | 2011-03-31 | Lajoie Dan | Systems and methods for identifying popular audio assets |
| US8521779B2 (en) | 2009-10-09 | 2013-08-27 | Adelphoi Limited | Metadata record generation |
| US20110173185A1 (en) * | 2010-01-13 | 2011-07-14 | Rovi Technologies Corporation | Multi-stage lookup for rolling audio recognition |
| US8886531B2 (en) * | 2010-01-13 | 2014-11-11 | Rovi Technologies Corporation | Apparatus and method for generating an audio fingerprint and using a two-stage query |
| US9026034B2 (en) | 2010-05-04 | 2015-05-05 | Project Oda, Inc. | Automatic detection of broadcast programming |
| WO2011140221A1 (en) * | 2010-05-04 | 2011-11-10 | Shazam Entertainment Ltd. | Methods and systems for synchronizing media |
| EP2580750B1 (de) | 2010-06-09 | 2014-05-14 | Adelphoi Limited | System und verfahren zur erkennung von audiomedien |
| US9607131B2 (en) | 2010-09-16 | 2017-03-28 | Verance Corporation | Secure and efficient content screening in a networked environment |
| EP2735141A4 (de) | 2011-07-18 | 2015-03-04 | Viggle Inc | System und verfahren zur verfolgung und belohnung einer medien- und unterhaltungsmittelverwendung mit praktisch in echtzeit erfolgenden belohnungen |
| EP2734997A4 (de) | 2011-07-20 | 2015-05-20 | Tata Consultancy Services Ltd | Verfahren und system zur erkennung der grenzen von koartikulationseinheiten aus isolierter sprache |
| US8682026B2 (en) | 2011-11-03 | 2014-03-25 | Verance Corporation | Efficient extraction of embedded watermarks in the presence of host content distortions |
| US8533481B2 (en) | 2011-11-03 | 2013-09-10 | Verance Corporation | Extraction of embedded watermarks from a host content based on extrapolation techniques |
| US8923548B2 (en) | 2011-11-03 | 2014-12-30 | Verance Corporation | Extraction of embedded watermarks from a host content using a plurality of tentative watermarks |
| US8615104B2 (en) | 2011-11-03 | 2013-12-24 | Verance Corporation | Watermark extraction based on tentative watermarks |
| US8745403B2 (en) | 2011-11-23 | 2014-06-03 | Verance Corporation | Enhanced content management based on watermark extraction records |
| US9323902B2 (en) | 2011-12-13 | 2016-04-26 | Verance Corporation | Conditional access using embedded watermarks |
| US9547753B2 (en) | 2011-12-13 | 2017-01-17 | Verance Corporation | Coordinated watermarking |
| US9292894B2 (en) | 2012-03-14 | 2016-03-22 | Digimarc Corporation | Content recognition and synchronization using local caching |
| US8825188B2 (en) | 2012-06-04 | 2014-09-02 | Troy Christopher Stone | Methods and systems for identifying content types |
| US9282366B2 (en) | 2012-08-13 | 2016-03-08 | The Nielsen Company (Us), Llc | Methods and apparatus to communicate audience measurement information |
| US9571606B2 (en) | 2012-08-31 | 2017-02-14 | Verance Corporation | Social media viewing system |
| US8977374B1 (en) * | 2012-09-12 | 2015-03-10 | Google Inc. | Geometric and acoustic joint learning |
| US8869222B2 (en) | 2012-09-13 | 2014-10-21 | Verance Corporation | Second screen content |
| US8726304B2 (en) | 2012-09-13 | 2014-05-13 | Verance Corporation | Time varying evaluation of multimedia content |
| US9106964B2 (en) | 2012-09-13 | 2015-08-11 | Verance Corporation | Enhanced content distribution using advertisements |
| US9081778B2 (en) | 2012-09-25 | 2015-07-14 | Audible Magic Corporation | Using digital fingerprints to associate data with a work |
| US9262794B2 (en) | 2013-03-14 | 2016-02-16 | Verance Corporation | Transactional video marking system |
| US9251549B2 (en) | 2013-07-23 | 2016-02-02 | Verance Corporation | Watermark extractor enhancements based on payload ranking |
| US9208334B2 (en) | 2013-10-25 | 2015-12-08 | Verance Corporation | Content management using multiple abstraction layers |
| US9955192B2 (en) | 2013-12-23 | 2018-04-24 | Inscape Data, Inc. | Monitoring individual viewing of television events using tracking pixels and cookies |
| WO2015138798A1 (en) | 2014-03-13 | 2015-09-17 | Verance Corporation | Interactive content acquisition using embedded codes |
| US9699499B2 (en) | 2014-04-30 | 2017-07-04 | The Nielsen Company (Us), Llc | Methods and apparatus to measure exposure to streaming media |
| US9905233B1 (en) | 2014-08-07 | 2018-02-27 | Digimarc Corporation | Methods and apparatus for facilitating ambient content recognition using digital watermarks, and related arrangements |
| WO2016123495A1 (en) | 2015-01-30 | 2016-08-04 | Vizio Inscape Technologies, Llc | Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device |
| JP5956624B1 (ja) * | 2015-02-02 | 2016-07-27 | 西日本高速道路エンジニアリング四国株式会社 | 異常音の検出方法及びその検出値を用いた構造物の異常判定方法、並びに、振動波の類似度検出方法及びその検出値を用いた音声認識方法 |
| WO2016168556A1 (en) | 2015-04-17 | 2016-10-20 | Vizio Inscape Technologies, Llc | Systems and methods for reducing data density in large datasets |
| EP3286757B1 (de) | 2015-04-24 | 2019-10-23 | Cyber Resonance Corporation | Verfahren und systeme zur durchführung einer signalanalyse zur identifizierung von inhaltstypen |
| JP6763019B2 (ja) | 2015-07-16 | 2020-09-30 | インスケイプ データ インコーポレイテッド | メディアセグメント識別効率向上のために探索索引を区分するためのシステムおよび方法 |
| MX384108B (es) | 2015-07-16 | 2025-03-14 | Inscape Data Inc | Sistema y método para mejorar la gestión de la carga de trabajo en el sistema de monitoreo de televisión acr. |
| BR112018000716B1 (pt) | 2015-07-16 | 2023-03-28 | Inscape Data, Inc | Método e dispositivo de computação para detecção de segmentos de mídia comuns |
| US10080062B2 (en) | 2015-07-16 | 2018-09-18 | Inscape Data, Inc. | Optimizing media fingerprint retention to improve system resource utilization |
| US10397749B1 (en) * | 2017-11-09 | 2019-08-27 | Sprint Communications Company L.P. | Systems and methods for detection, identification, and use of environmental audio signatures |
| US11107297B2 (en) * | 2018-12-12 | 2021-08-31 | Simmonds Precision Products, Inc. | Merging discrete time signals |
| US11269635B1 (en) * | 2019-10-21 | 2022-03-08 | Accenture Global Solutions Limited | Hardware efficient statistical moment computation |
| US12198711B2 (en) | 2020-11-23 | 2025-01-14 | Cyber Resonance Corporation | Methods and systems for processing recorded audio content to enhance speech |
Family Cites Families (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3919479A (en) * | 1972-09-21 | 1975-11-11 | First National Bank Of Boston | Broadcast signal identification system |
| DE2536640C3 (de) * | 1975-08-16 | 1979-10-11 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Anordnung zur Erkennung von Geräuschen |
| US4053710A (en) * | 1976-03-01 | 1977-10-11 | Ncr Corporation | Automatic speaker verification systems employing moment invariants |
| JPS542050A (en) | 1977-06-07 | 1979-01-09 | Nec Corp | Block coding and decoding system |
| JPS5525150A (en) * | 1978-08-10 | 1980-02-22 | Nec Corp | Pattern recognition unit |
| US4450531A (en) * | 1982-09-10 | 1984-05-22 | Ensco, Inc. | Broadcast signal recognition system and method |
| US4697209A (en) | 1984-04-26 | 1987-09-29 | A. C. Nielsen Company | Methods and apparatus for automatically identifying programs viewed or recorded |
| US4677466A (en) | 1985-07-29 | 1987-06-30 | A. C. Nielsen Company | Broadcast program identification method and apparatus |
| JPH067343B2 (ja) * | 1987-02-23 | 1994-01-26 | 株式会社東芝 | パタ−ン識別装置 |
| US4843562A (en) * | 1987-06-24 | 1989-06-27 | Broadcast Data Systems Limited Partnership | Broadcast information classification system and method |
-
1990
- 1990-05-02 US US07/517,835 patent/US5210820A/en not_active Expired - Lifetime
-
1991
- 1991-05-02 EP EP91908882A patent/EP0480010B1/de not_active Expired - Lifetime
- 1991-05-02 WO PCT/US1991/002907 patent/WO1991017540A1/en not_active Ceased
- 1991-05-02 JP JP03508688A patent/JP3130926B2/ja not_active Expired - Fee Related
- 1991-05-02 CA CA002041754A patent/CA2041754C/en not_active Expired - Lifetime
- 1991-05-02 AT AT91908882T patent/ATE142815T1/de not_active IP Right Cessation
- 1991-05-02 ES ES91908882T patent/ES2091328T3/es not_active Expired - Lifetime
- 1991-05-02 DE DE69122017T patent/DE69122017T2/de not_active Expired - Fee Related
-
1997
- 1997-06-26 HK HK133697A patent/HK133697A/en not_active IP Right Cessation
Also Published As
| Publication number | Publication date |
|---|---|
| CA2041754C (en) | 2004-12-28 |
| EP0480010A1 (de) | 1992-04-15 |
| JPH05501166A (ja) | 1993-03-04 |
| CA2041754A1 (en) | 1991-11-03 |
| US5210820A (en) | 1993-05-11 |
| HK133697A (en) | 1997-10-24 |
| EP0480010B1 (de) | 1996-09-11 |
| DE69122017D1 (de) | 1996-10-17 |
| ES2091328T3 (es) | 1996-11-01 |
| ATE142815T1 (de) | 1996-09-15 |
| JP3130926B2 (ja) | 2001-01-31 |
| WO1991017540A1 (en) | 1991-11-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE69122017T2 (de) | Verfahren und vorrichtung zur signalerkennung | |
| DE3878423T2 (de) | System und verfahren zur klassifizierung von rundfunkinformationen. | |
| DE3306730C2 (de) | ||
| DE69814104T2 (de) | Aufteilung von texten und identifizierung von themen | |
| EP1405222B9 (de) | Verfahren und vorrichtung zum erzeugen eines fingerabdrucks und verfahren und vorrichtung zum identifizieren eines audiosignals | |
| EP1407446B1 (de) | Verfahren und vorrichtung zum charakterisieren eines signals und zum erzeugen eines indexierten signals | |
| DE3878001T2 (de) | Spracherkennungseinrichtung unter anwendung von phonemermittlung. | |
| DE10232916B4 (de) | Vorrichtung und Verfahren zum Charakterisieren eines Informationssignals | |
| EP1368805B1 (de) | Verfahren und vorrichtung zum charakterisieren eines signals und verfahren und vorrichtung zum erzeugen eines indexierten signals | |
| EP1606798B1 (de) | Vorrichtung und verfahren zum analysieren eines audio-informationssignals | |
| DE60018886T2 (de) | Adaptive Wavelet-Extraktion für die Spracherkennung | |
| DE102004036154B3 (de) | Vorrichtung und Verfahren zur robusten Klassifizierung von Audiosignalen sowie Verfahren zu Einrichtung und Betrieb einer Audiosignal-Datenbank sowie Computer-Programm | |
| DE60120417T2 (de) | Verfahren zur suche in einer audiodatenbank | |
| DE69326044T2 (de) | Verfahren zur Erkennung von Sprachsignalen | |
| DE2825110A1 (de) | Verfahren zur erkennung kontinuierlicher sprachsignale | |
| DE2825186A1 (de) | Verfahren zur verringerung der falschanzeige in spracherkennungsverfahren fuer kontinuierliche sprachsignale | |
| EP1371055A2 (de) | Vorrichtung zum analysieren eines audiosignals hinsichtlich von rhythmusinformationen des audiosignals unter verwendung einer autokorrelationsfunktion | |
| EP0182989B1 (de) | Normalisierung von Sprachsignalen | |
| DE3733391A1 (de) | Verfahren zur spracherkennung | |
| Li et al. | Correlation characteristics and dimensionality of speech spectra | |
| DE102004028693B4 (de) | Vorrichtung und Verfahren zum Bestimmen eines Akkordtyps, der einem Testsignal zugrunde liegt | |
| DE102004049517B4 (de) | Extraktion einer einem Audiosignal zu Grunde liegenden Melodie | |
| EP1377924B1 (de) | VERFAHREN UND VORRICHTUNG ZUM EXTRAHIEREN EINER SIGNALKENNUNG, VERFAHREN UND VORRICHTUNG ZUM ERZEUGEN EINER DAZUGEHÖRIGEN DATABANK und Verfahren und Vorrichtung zum Referenzieren eines Such-Zeitsignals | |
| EP1743324B1 (de) | Vorrichtung und verfahren zum analysieren eines informationssignals |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 8364 | No opposition during term of opposition | ||
| 8339 | Ceased/non-payment of the annual fee |