DE69721404T2 - Diktiersystem - Google Patents

Diktiersystem Download PDF

Info

Publication number
DE69721404T2
DE69721404T2 DE69721404T DE69721404T DE69721404T2 DE 69721404 T2 DE69721404 T2 DE 69721404T2 DE 69721404 T DE69721404 T DE 69721404T DE 69721404 T DE69721404 T DE 69721404T DE 69721404 T2 DE69721404 T2 DE 69721404T2
Authority
DE
Germany
Prior art keywords
data compression
data
speech signal
signal
compressed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69721404T
Other languages
English (en)
Other versions
DE69721404D1 (de
Inventor
Herbert BÖLDL
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of DE69721404D1 publication Critical patent/DE69721404D1/de
Publication of DE69721404T2 publication Critical patent/DE69721404T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/64Automatic arrangements for answering calls; Automatic arrangements for recording messages for absent subscribers; Arrangements for recording conversations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Magnetic Heads (AREA)
  • Graft Or Block Polymers (AREA)
  • Artificial Filaments (AREA)
  • Processes Of Treating Macromolecular Substances (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Non-Volatile Memory (AREA)
  • Polymerisation Methods In General (AREA)

Description

  • Die Erfindung betrifft ein Diktiersystem mit einer in der Hand gehaltenen Diktiereinrichtung zum Speichern eines Sprachsignals in Speichermitteln, wobei die Einrichtung Datenkompressionsmittel zum Datenkomprimieren des Sprachsignals in ein datenkomprimiertes Sprachsignal umfasst, Speicherungsmittel zum Speichern des datenkomprimierten Sprachsignals in den Speichermitteln. Die Datenkompressionsmittel sind ausgebildet, um am Sprachsignal einen Datenkompressionsschritt in einem von zumindest zwei unterschiedlichen Datenkompressionsmodi auszuführen, wobei die zumindest zwei unterschiedlichen Datenkompressionsmodi zu unterschiedlichen Datenkompressionsverhältnissen führen, wenn sie auf das gleiche Sprachsignal angewendet werden, wobei die genannten zumindest zwei unterschiedlichen Datenkompressionsmodi von einem Benutzer selektiert werden können, wobei die Datenkompressionsmittel weiterhin zum Verschaffen von Datendateien ausgebildet sind, die Abschnitte des datenkomprimierten Sprachsignals umfassen, und zum Generieren eines Kennungssignals ausgebildet sind, das den selektierten Datenkompressionsmodus identifiziert.
  • Die Erfindung betrifft weiterhin eine in der Hand gehaltene Diktiereinrichtung, eine Transkriptionseinrichtung und eine abnehmbare Festkörperspeichereinheit zur Verwendung in dem Diktiersystem. Ein Diktiersystem wie eingangs definiert ist nach dem Stand der Technik wohl bekannt.
  • Datenkompression kann in Diktiersystemen nach dem Stand der Technik durch Wegwerfen der Stilleperioden realisiert werden, die normalerweise im Sprachsignal vorhanden sind. Weiterhin kann man ein Anzeigesignal speichern, das die Länge der Stilleperiode und ihren Ort im Sprachsignal andeutet. Bei der Transkription kann eine Kopie des Sprachsignals durch das Einfügen von Stilleperioden der gleichen Länge an den. angegebenen Positionen in dem komprimierten Sprachsignal regeneriert werden.
  • US 5.481.645 offenbart einen tragbaren Computer, der Signale, die aus einem Mikrofon stammen, in digitale Sprachsignale umwandeln kann, die in einem Speicher gespeichert werden sollen. Um die Sprachsignale an Stellen des Speichers als individuell identifizierbare sprachliche Einfügungen zu speichern und um jeder Einfügung einen ständigen Identifikationscode zuzuweisen, der Information zu dem für die genannte sprachliche Einfügung verwendeten Kompressionsverfahren umfasst, sind Identifikationsmittel vorgesehen sowie Mittel zur visuellen Darstellung von Daten, die zu den Identifikationscodes der sprachlichen Einfügungen gehören, auf einem Bildschirm. Die Identifikationscodes der digitalen Sprachsignale werden gesondert von den digitalen Sprachsignalen zusammen mit der Startadresse der digitalen Sprachsignale gespeichert.
  • Der Erfindung liegt als Aufgabe zugrunde, ein verbessertes Diktiergerät zu verschaffen. Das erfindungsgemäße Diktiersystem ist dadurch gekennzeichnet, dass die Datendateien einen Headerabschnitt umfassen, wobei die Datenkompressionsmittel zum Speichern des genannten Kennungssignals in dem genannten Headerabschnitt ausgebildet sind. Die Erfindung beruht auf der folgenden Erkenntnis. Die Speicherkapazität von Speichern, die in Diktiergeräten enthalten sind, ist begrenzt. Vorzugsweise sollte eine höhere Anzahl von Diktaten in einem Speicher gespeichert werden. Dies ist nach dem Stand der Technik dadurch realisiert worden, dass die Stilleperioden, die in einem Sprachsignal vorhanden sind, weggelassen werden. Durch Anwendung leistungsstärkerer Kompressionstechniken kann ein größeres Kompressionsverhältnis erhalten werden. Insbesondere führen verlustbehaftete Kompressionstechniken zu großen Datenkompressionsverhältnissen. Größere Datenreduktionsverhältnisse können bei der Datenexpansion jedoch zu einer Abnahme der Qualität des zurückgewonnenen Signals führen. Erfindungsgemäß ist ein Diktiersystem vorgeschlagen worden, bei dem der Benutzer die Möglichkeit hat, einen Datenkompressionsmodus aus zwei oder mehr Datenkompressionsmodi zu wählen, mit denen die in der Hand gehaltene Diktiereinrichtung das Sprachsignal komprimieren kann. Der Benutzer kann zwischen der Anzahl Sprachnachrichten, die er diktieren möchte und in einer Speichereinheit speichern möchte, und der Qualität des Sprachsignals bei der Wiedergabe einen Kompromiss machen. Wenn der Benutzer in dem Speicher mehr Diktate gespeichert haben möchte, wird er den Datenkompressionsmodus wählen, der ein höheres Datenkompressionsverhältnis ergibt. Wenn der Benutzer eine höhere Wiedergabequalität bevorzugt, wird er den Datenkompressionsmodus wählen, der ein niedrigeres Datenkompressionsverhältnis ergibt.
  • Die Unteransprüche definieren bevorzugte Ausführungsformen des Diktiersystems, der in der Hand gehaltenen Diktiereinrichtung, einer Transkriptionseinrichtung und der abnehmbaren Festkörperspeichereinheit.
  • Ausführungsbeispiele der Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben. Es zeigen:
  • 1 eine Ausführungsform der in der Hand gehaltenen Diktiereinrichtung,
  • 2 eine Ausführungsform der Speicherkarte zur Verwendung in der in der Hand gehaltenen Diktiereinrichtung,
  • 3 das Schaltbild der in der Hand gehaltenen Diktiereinrichtung,
  • 4 die Folge von Signalblöcken, die von dem Prozessor in der in der Hand gehaltenen Diktiereinrichtung generiert werden, und
  • 5 eine Ausführungsform eines Transkriptionsgerätes, entweder als Tischgerät oder in Form eines PCs.
  • 1 zeigt eine Vorderansicht einer in der Hand gehaltenen Diktiereinrichtung 1, die mit einem Ein-/Ausschalter 2 versehen ist, der an der Seite des Gehäuses der Einrichtung liegt. Am Boden des Gehäuses ist ein Batteriefach 3 (nicht abgebildet) vorgesehen, das an der Rückseite des Gehäuses erreicht werden kann. An der Vorderseite des Gehäuses ist ein Schiebeschalter 4 vorgesehen, um die Einrichtung in die verschiedenen Diktiermodi zu schalten. Die Einrichtung ist mit einer Anzahl von Tasten versehen: Taste 5 ist die Aufzeichnungstaste, Taste 6 ist die BRIEF-Taste, Taste 7 ist die MODUS-Taste, Taste 8 ist die EINFÜGE-Taste und Taste 9 ist die LÖSCH-Taste. Der Schalter 10 ist der Aufzeichnungsmodusschalter. Der Schalter 11 ist der Empfindlichkeitsschalter. Die Einrichtung 1 ist weiterhin mit einer LCD-Anzeige versehen, um verschiedene Informationen hinsichtlich eines Diktates wiederzugeben, wie die Aufzeichnungsdauer des Diktates, die verbleibende Aufzeichnungsdauer, den Aufzeichnungsmodus, die Anzahl Diktate usw.
  • Ein Mikrofon 13 und ein Lautsprecher 18 sind in dem Gehäuse vorgesehen und ein Lautstärkereglerknopf 14 ist an der Seite des Gehäuses vorgesehen. Weiterhin ist in der Oberseite der Einrichtung ein Schlitz 16 vorgesehen, um eine Speicherkarte 15 aufzunehmen.
  • Die Speicherkarte 15 wird auch in 2 dargestellt. Die Speicherkarte 15 ist mit einem Festkörperspeicher 20 und mit elektrischen Anschlüssen 22 versehen, die mit dem Festkörperspeicher 20 verbunden sind. Der Festkörperspeicher 20 kann z. B. ein EE-PROM oder ein löschbarer FLASH-Speicher sein. Die elektrischen Anschlüsse 22 können so ausgeführt sein, dass sie ein elektrisches Zusammenarbeiten mit der international standardisierten PCMCIA-Schnittstelle eines PCs ermöglichen.
  • 3 zeigt die elektrische Konstruktion der Einrichtung 1 und ihre Zusammenwirkung mit der Speicherkate 15. Die Einrichtung 1 umfasst einen digitalen Signalprozessor 30, der einen digitalen Eingang/Ausgang 32 hat, der mit Anschlüssen 34 gekoppelt ist, die elektrisch mit den Anschlüssen 22 der Speicherkarte 15 gekoppelt sind, wenn diese in den Schlitz 16 eingebracht ist. Das Mikrofon 13 ist mit einem Analogeingang 36 des Prozessors 30 gekoppelt, falls notwendig über einen Verstärker 38. Der Prozessor 30 umfasst weiterhin einen Analogausgang 40, der mit dem Lautsprecher 18 über einen Verstärker 42 gekoppelt ist. Die verschiedenen Knöpfe und Tasten, die in 3 durch das Bezugszeichen 44 angedeutet sind, sind mit Steuereingängen 46 des Prozessors 30 gekoppelt. Weiterhin ist ein Steuerausgang 48 des Prozessors 30 mit einer Display-Steuereinheit 50 zum Steuern der Anzeige von Informationen auf dem Display 12 gekoppelt.
  • Der Benutzer steckt die Speicherkarte 15 in den Schlitz 16 der Einrichtung 1, bis die Anschlüsse 22 der Speicherkarte 15 mit elektrischen Anschlüssen 34, die im Schlitz der Einrichtung vorhanden sind, in Kontakt kommen. Die Speicherkarte steht nun elektrisch und mechanisch mit der Einrichtung 1 in Kontakt.
  • Der Prozessor 30 ist imstande, die analogen Sprachsignale über den Eingang 36 zu empfangen und eine Analog/Digital-Umzusetzung des Sprachsignals in ein digitales Sprachsignal auszuführen. Weiterhin kann der Prozessor 30 nach Selektion durch den Benutzer einen von zumindest zwei unterschiedlichen Datenkompressionsschritten an dem digitalen Sprachsignal ausführen. Angenommen werde, dass der Prozessor 30 imstande ist, zwei Datenkompressionsschritte an dem Sprachsignal auszuführen. Jeder an dem gleichen Sprachsignal ausgeführte Kompressionsschritt führt zu unterschiedlichen Kompressionsverhältnissen. Die Datenkompressionsschritte können die Form von verlustlosen Kompressionsschritten haben. Das bedeutet, dass tatsächlich keine Daten verloren gehen und das ursprüngliche Sprachsignal bei der Datenexpansion vollständig zurückgewonnen werden kann. Ein Beispiel für ein verlustloses Datenkompressionsverfahren ist lineares prädiktives Codieren, dem eine Huffman-Codierung folgt, die an dem Ausgangssignal des linearen prädiktiven Codierers ausgeführt wird. Datenkompression kann auch verlustbehaftet sein. Ein solcher verlustbehafteter Datenkompressionsschritt ist Subbandcodierung, in der Tech nik wohl bekannt und angewendet in digitalen DCC-Magnetaufzeichnungssystemen. Bei verlustbehafteten Kompressionsverfahren wird der Teil der Information, der nicht hörbar ist, tatsächlich weggeworfen. Bei der Datenexpansion wird eine Kopie des ursprünglichen Sprachsignals zurückgewonnen. Da die Information, die bei der Datenkompression weggelassen worden ist, unhörbar war, wird die Kopie des Sprachsignals von dem Benutzer gehört werden, als ob sie gleich dem ursprünglichen Sprachsignal sei.
  • Der Prozessor 30 kann am Sprachsignal einen verlustlosen Datenompressionsschritt sowie einen verlustbehafteten Datenkompressionsschritt ausführen, als die zwei unterschiedlichen Datenkompressionsschritte, die von dem Prozessor 30 realisiert werden können. Als Alternative kann der Prozessor 30 zwei unterschiedliche verlustlose Datenkompressionsschritte ausführen, die zu unterschiedlichen Datenkompressionsverhältnissen führen. Als wiederum andere Alternative kann der Prozessor 30 imstande sein, zwei unterschiedliche verlustlose Datenkompressionsschritte an dem Sprachsignal auszuführen, die zu zwei unterschiedlichen Datenkompressionsverhältnissen führen. Als Beispiel für die letzte Möglichkeit könnte der Prozessor 30 mit einem einfachen Subbandcodierer versehen sein, wie er bei DCC verwendet wird. Der Subbandcodierer kann einfach sein, da weniger Subbänder zum Codieren des Sprachsignals benötigt werden. Weniger Subbänder werden benötigt, z. B. 5 anstelle der 32 im DCC-Subbandcodierer, da die Bandbreite des Sprachsignals viel kleiner ist als ein Breitbandaudiosignal. Mit dem vereinfachten Subbandcodierer können unterschiedliche Kompressionsverhältnisse erhalten werden, indem der Bitpool für den Bitzuweisungsschritt in dem vereinfachten Subbandcodierer geändert wird. In diesem Zusammenhang wird auf die Dokumente (1), (2), (3a) und (3b) in der Liste der Dokumente verwiesen, die am Ende dieser Beschreibung zu finden sind.
  • Wenn der Benutzer eine Sprachnachricht in der Einrichtung aufzeichnen möchte, drückt er die BRIEF-Taste 6, die angibt, dass der Benutzer eine Sprachnachricht speichern möchte. Weiterhin kann der Benutzer die MODUS-Taste 7 betätigen, um verschiedene Modi zu selektieren, wie z. B. ob die Sprachnachricht eine (hohe) Priorität haben soll oder ob die Sprachnachricht gegen Überschreiben geschützt werden soll. Anschließend selektiert der Benutzer durch Betätigung der Taste 10 einen Aufzeichnungsmodus. Selektieren des Aufzeichnungsmodus bedeutet, dass der Benutzer einen Datenkompressionsmodus selektiert. Wenn der Benutzer/die Benutzerin eine Aufzeichnung mit relativ guter Qualität wünscht, wählt er/sie den Datenkompressionsmodus so, dass er zu dem niedrigsten Datenkompressionsverhältnis führt. Daher wird für das genannte Diktat eine größere Menge In formation in dem Speicher 20 gespeichert werden, sodass weniger Diktate in dem genannten Speicher gespeichert werden können. Wenn der Benutzer/die Benutzerin möglichst viele Diktate in dem Speicher gespeichert haben möchte, wird er/sie den Datenkompressionsmodus wählen, der zu dem höheren Datenkompressionsverhältnis führt. Eine Speicherung mit niedriger Qualität der Diktate kann die Folge sein.
  • Die komprimierte Information ist in Informationsblöcken (oder "Dateien") ..., Bi, Bi+1, Bi+2, ... enthalten. Dies wird in 4 gezeigt. Jeder Informationsblock B; hat einen Headerabschnitt, der als HDR bezeichnet wird, und einen Informationsabschnitt, der mit IP bezeichnet wird. Weiterhin wird ein Kennungssignal in dem Headerabschnitt gespeichert. Das Kennungssignal in einem Headerabschnitt HDR eines Signalblockes identifiziert den Kompressionsmodus, der auf das Sprachsignal angewendet wird, um die in dem Informationsabschnitt IP des gleichen Signalblocks gespeicherte datenkomprimierte Information zu erzeugen. Die Folge von Signalblöcken wird dem digitalen Ausgang 32 des Prozessors 30 zugeführt und anschließend in dem Speicher 20 auf der Speicherkarte 15 gespeichert.
  • Es soll hier bemerkt werden, dass der Prozessor 30 Signalblöcke erzeugen könnte, die so lang sind, wie notwendig ist, um die Information von genau einer Sprachnachricht zu speichern. Der Prozessor 30 kann auch ausgebildet sein, um Signalblöcke mit fester Länge zu erzeugen, und so, dass die datenkomprimierte Information einer Sprachnachricht in einer Vielzahl nachfolgender, von dem Prozessor 30 erzeugter Signalblöcke gespeichert wird.
  • Wenn der Benutzer möchte, dass die Sprachnachricht in dem Speicher 20 gespeichert wird, kann der Prozessor 30 die datenkomprimierte Information aus dem Speicher 20 zurückgewinnen und an der in dem Speicher gespeicherten datenkomprimierten Information einen Datenexpansionsschritt ausführen. Es wird deutlich sein, dass der Datenexpansionsschritt das Inverse des beim Diktieren ausgeführten Datenkompressionsschrittes ist. Der in dem Prozessor 30 auszuführende Datenexpansionsschritt wird weiterhin anhand einer Ausführungsform eines Transkriptionsgerätes, wie in 5 gezeigt, näher erläutert werden. Nachdem eine Kopie des Sprachsignals erhalten worden ist, wird dieses Sprachsignal in dem Prozessor einer Digital/Analog-Umsetzung unterzogen und zur Wiedergabe durch den Lautsprecher 18 dem Ausgang 40 zugeführt.
  • Zur Transkription der in dem Speicher 20 auf der Speicherkarte 15 gespeicherten Sprachnachrichten wird die Speicherkarte 15 aus der Einrichtung gezogen und in ein Transkriptionstischgerät 52 eingeführt, siehe 5. Das Transkriptionsgerät 52 umfasst einen digitalen Signalprozessor 53, der einen Digitaleingang 54 hat, der mit Anschlüssen 56 gekoppelt ist, die mit den Anschlüssen 22 der Speicherkarte 15 elektrisch gekoppelt sind, wenn diese in einen in dem Gerät 52 vorgesehenen Schlitz (nicht abgebildet) eingesteckt ist. Über einen Verstärker 62 ist ein Lautsprecher 58 mit einem Analogausgang 60 des Prozessors 53 gekoppelt. Der Prozessor 53 umfasst weiterhin einen Steuerausgang 64, der mit einer Display-Steuerungseinheit 66 zum Steuern der Anzeige von Information auf einem Display 68 gekoppelt ist. Eine Tastatur 70 ist mit Steuereingängen 72 des Prozessors 53 gekoppelt.
  • Der Benutzer führt die Speicherkarte 15 in einen Schlitz (nicht abgebildet) des Transkriptionsgerätes 52 ein, bis die Anschlüsse 22 der Speicherkarte 15 mit elektrischen Anschlüssen 56, die im Schlitz des Transkriptionsgerätes 52 vorgesehen sind, in Kontakt kommen. Die Speicherkarte steht jetzt elektrisch und mechanisch mit dem Gerät 52 in Kontakt.
  • Beim Betätigen einer "AUSSPEICHER"-Taste auf der Tastatur 70 wird die in dem Speicher 20 auf der Speicherkarte 15 gespeicherte Information ausgelesen und in einem internen Speicher des digitalen Signalprozessors 53 gespeichert. Der Prozessor 53 kann an der aus der Speicherkarte ausgespeicherten digitalen Information einen von zumindest zwei unterschiedlichen Datenexpansionsschritten ausführen. Es wird deutlich sein, dass der in dem Prozessor 53 ausgeführte Expansionsmodus das Inverse des während des Diktierschrittes in dem Prozessor 30 ausgeführten Kompressionsmodus ist. Der Prozessor 53 gewinnt das Kennungssignal aus den Headerabschnitten HDR der Signalblöcke zurück und führt in Reaktion auf das Kennungssignal einen Datenexpansionsschritt aus. Als Folge wird eine Kopie des digitalen Sprachsignals erhalten.
  • Der Prozessor 53 ist weiterhin imstande, die Kopie des digitalen Sprachsignals in ein analoges Sprachsignal umzusetzen und das analoge Sprachsignal über den Ausgang 30 dem Lautsprecher 58 zuzuführen, sodass eine Schreibkraft oder eine andere Person das Sprachsignal, das transkribiert werden muss, hören kann.
  • Die Schreibkraft kann die Sprachnachricht, die über den Lautsprecher wiedergegeben wird, unter Verwendung der Tastatur 70 eintippen, um eine getippte Version der Sprachnachricht zu erhalten.
  • Bei einer anderen Ausführungsform des Transkriptionsgerätes 52, wenn diese in Form eines Personalcomputers mit genügend großer Speicherkapazität realisiert ist, kann das Gerät mit einem Spracherkennungsalgorithmus versehen sein, der es ermöglicht, dass das Gerät als Folge eines solchen Spracherkennungsschrittes aus dem Sprachsignal eine Zeichendatei erzeugt. Die Zeichendatei könnte auf dem Display 68 sichtbar gemacht werden, sodass die Schreibkraft durch Lesen des Textes auf dem Wiedergabeschirm 68 und Abhören der Sprachnachricht über den Lautsprecher 58 eine Fehlerkontrolle ausführen kann und die Fehler durch Verwendung der Tastatur 70 korrigieren kann.
  • Zuvor ist ein Beispiel eines verlustlosen Datenkompressionsverfahrens beschrieben worden, nämlich lineares prädiktives Codieren, dem eine Huffman-Codierung folgt. Es spricht für sich, dass der Prozessor 53 imstande sein muss, eine entsprechende Huffman-Decodierung auszuführen, der eine entsprechende lineare prädiktive Decodierung folgt, um das ursprüngliche Sprachsignal zu regenerieren.
  • Es ist auch ein Beispiel eines verlustbehafteten Datenkompressionsschrittes beschrieben worden, nämlich Subbandcodierung. Es spricht für sich, dass der Prozessor 53 imstande sein muss, eine entsprechende Subbanddecodierung auszuführen, um eine Kopie des ursprünglichen Sprachsignals zu regenerieren.
  • Wenngleich die vorliegende Erfindung anhand von bevorzugten Ausführungsbeispielen beschrieben worden ist, sind diese natürlich keine einschränkenden Beispiele. So können verschiedene Abwandlungen sich für den Fachkundigen als offensichtlich erweisen, ohne dass der Rahmen der Erfindung, wie sie in den Ansprüchen definiert wird, verlassen wird. Weiterhin liegt die Erfindung in jedem einzelnen Neuheitsmerkmal oder einer Kombination von Merkmalen, wie hier offenbart.
  • Verwandte Dokumente
    • (1) Europäische Patentanmeldung Nr. 402.973 (PHN 13.241).
    • (2) Europäische Patentanmeldung Nr. 400.755 (PHQ 89.018A).
    • (3a) Europäische Patentanmeldung Nr. 457.390 (PHN 13.328).
    • (3b) Europäische Patentanmeldung Nr. 457.391 (PHN 13.329)
  • INSCHRIFT DER ZEICHNUNG
  • FIG. 3
    12
    Display
    15
    Speicherkarte
    32
    digital ein/aus
    36
    analog ein
    40
    analog aus
    44
    TASTEN Aufzeichnen, Abspielen, ...
    50
    Display-Steuerung
    FIG. 5
    15
    Speicherkarte
    53
    DSP (digitaler Signalprozessor)
    54
    digital ein
    60
    analog aus
    68
    Display
    70
    TASTEN

Claims (22)

  1. Diktiersystem mit einer in der Hand gehaltenen Diktiereinrichtung (1) zum Speichern eines Sprachsignals in Speichermitteln (15), wobei die Einrichtung Datenkompressionsmittel (30) zum Datenkomprimieren des Sprachsignals in ein datenkomprimiertes Sprachsignal umfasst, Speicherungsmittel zum Speichern des datenkomprimierten Sprachsignals in den Speichermitteln, wobei die Datenkompressionsmittel ausgebildet sind, um am Sprachsignal einen Datenkompressionsschritt in einem von zumindest zwei unterschiedlichen Datenkompressionsmodi auszuführen, wobei die zumindest zwei unterschiedlichen Datenkompressionsmodi zu unterschiedlichen Datenkompressionsverhältnissen führen, wenn sie auf das gleiche Sprachsignal angewendet werden, wobei die genannten zumindest zwei unterschiedlichen Datenkompressionsmodi von einem Benutzer selektiert werden können, wobei die Datenkompressionsmittel weiterhin zum Verschaffen von Datendateien (Bi, Bi+1, Bi+2) ausgebildet sind, die Abschnitte des datenkomprimierten Sprachsignals (IP) umfassen, und zum Generieren eines Kennungssignals ausgebildet sind, das den selektierten Datenkompressionsmodus identifiziert, dadurch gekennzeichnet, dass die Datendateien einen Headerabschnitt (HDR) umfassen, wobei die Datenkompressionsmittel zum Speichern des genannten Kennungssignals in dem genannten Headerabschnitt ausgebildet sind.
  2. Diktiersystem nach Anspruch 1, dadurch gekennzeichnet, dass die Speichermittel eine abnehmbare Festkörperspeichereinheit zum Speichern der Datendateien umfassen, wobei die Festkörperspeichereinheit mit Kopplungsmitteln versehen ist, um die Speichereinheit mechanisch und elektrisch mit der in der Hand gehaltenen Diktiereinrichtung zu koppeln.
  3. Diktiersystem nach Anspruch 2, dadurch gekennzeichnet, dass die Kopplungsmittel weiterhin ausgebildet sind, um die Speichereinheit mechanisch und elektrisch mit einem PC zu koppeln.
  4. Diktiersystem nach Anspruch 3, dadurch gekennzeichnet, dass die Kopplungsmittel ausgebildet sind, um die Speichereinheit mechanisch und elektrisch mit einer international standardisierten Schnittstelle des PC zu koppeln.
  5. Diktiersystem nach Anspruch 4, dadurch gekennzeichnet, dass die genannte Schnittstelle eine PCMCIA-Schnittstelle ist.
  6. Diktiersystem nach einem der Ansprüche 2 bis 5, dadurch gekennzeichnet, dass die Festkörperspeichereinheit einen EEPROM umfasst.
  7. Diktiersystem nach einem der Ansprüche 2 bis 5, dadurch gekennzeichnet, dass die Festkörperspeichereinheit eine löschbare Flash-Speichereinheit umfasst.
  8. Diktiersystem nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass die Festkörperspeichereinheit eine Back-up-Batterie umfasst.
  9. Diktiersystem nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass die Datenkompressionsmittel ausgebildet sind, um an dem Sprachsignal einen Datenkompressionsschritt in einem von zumindest zwei unterschiedlichen Datenkompressionsmodi auszuführen, wobei zumindest einer der genannten zumindest zwei unterschiedlichen Datenkompressionsmodi ein verlustbehafteter Datenkompressionsmodus ist.
  10. In der Hand gehaltene Diktiereinrichtung (1) zur Verwendung in dem System nach einem der vorhergehenden Ansprüche, wobei die Einrichtung Datenkompressionsmittel (30) zum Datenkomprimieren des Sprachsignals in ein datenkomprimiertes Sprachsignal umfasst, wobei die Datenkompressionsmittel ausgebildet sind, um am Sprachsignal einen Datenkompressionsschritt in einem von zumindest zwei unterschiedlichen Datenkompressionsmodi auszuführen, wobei die zumindest zwei unterschiedlichen Datenkompressionsmodi zu unterschiedlichen Datenkompressionsverhältnissen führen, wobei die genannten zumindest zwei unterschiedlichen Datenkompressionsmodi von einem Benutzer selektiert werden können, wobei die Datenkompressionsmittel weiterhin zum Verschaffen von Datendateien (Bi, Bi+1, Bi+2) ausgebildet sind, die Abschnitte des datenkomprimierten Sprachsignals (IP) umfassen, und zum Generieren eines Kennungssignals ausgebildet sind, das den selektierten Datenkompressionsmodus identifiziert, dadurch gekennzeichnet, dass die Datendateien einen Headerabschnitt (HDR) umfassen, wobei die Datenkompressionsmittel zum Speichern des genannten Kennungssignals in dem genannten Headerabschnitt ausgebildet sind.
  11. In der Hand gehaltene Diktiereinrichtung nach Anspruch 10, dadurch gekennzeichnet, dass sie mit Kopplungsmittel versehen ist, um mechanisch und elektrisch mit Kopplungsmitteln einer abnehmbaren Festkörperspeichereinheit zusammenzuwirken.
  12. In der Hand gehaltene Diktiereinrichtung nach Anspruch 11, dadurch gekennzeichnet, dass die Kopplungsmittel einer international standardisierten Schnittstelle gemäß sind.
  13. In der Hand gehaltene Diktiereinrichtung nach Anspruch 12, dadurch gekennzeichnet, dass die genannte Schnittstelle eine PCMCIA-Schnittstelle ist.
  14. In der Hand gehaltene Diktiereinrichtung nach einem der Ansprüche 10 bis 13, dadurch gekennzeichnet, dass die Datenkompressionsmittel ausgebildet sind, um an dem Sprachsignal einen Datenkompressionsschritt in einem von zumindest zwei unterschiedlichen Datenkompressionsmodi auszuführen, wobei zumindest einer der genannten zumindest zwei unterschiedlichen Datenkompressionsmodi ein verlustbehafteter Datenkompressionsmodus ist.
  15. Transkriptionseinrichtung zum Transkribieren von Sprachnachrichten, die Datenexpansionsmittel umfasst, die ausgebildet sind, um einen Datenexpansionsschritt an einem in Speichermitteln gespeicherten datenkomprimierten Sprachsignal auszuführen, wobei das genannte datenkomprimierte Sprachsignal in einem von zumindest zwei unterschiedlichen Datenkompressionsmodi datenkomprimiert ist, wobei die zumindest zwei unterschiedlichen Datenkompressionsmodi zu unterschiedlichen Datenkompressionsverhältnissen führen, wenn sie auf das gleiche Sprachsignal angewendet werden, wobei das datenkomprimierte Sprachsignal in den Speichermitteln in Datendateien (Bi, Bi+1, Bi+2) gespeichert ist, die Abschnitte des datenkomprimierten Sprachsignals (IP) umfassen, dadurch gekennzeichnet, dass die Datendateien einen Headerabschnitt (HDR) umfassen, in dem ein Kennungssignal gespeichert ist, wobei das Kennungssignal den beim Datenkomprimieren des Sprachsignals selektierten Datenkompressionsmodus identifiziert, wobei die Datenexpansionsmittel zum Rückgewinnen des Kennungssignals aus Headerabschnitten ausgebildet sind und ausgebildet sind, um in Reaktion auf das Kennungssignal einen von zumindest zwei unterschiedlichen Expansionsmodi an der in den Dateien gespeicherten datenkomprimierten Information auszuführen, um eine Kopie des Sprachsignals zu erhalten.
  16. Transkriptionseinrichtung nach Anspruch 15, dadurch gekennzeichnet, dass die Speichermittel die Form einer abnehmbaren Festkörperspeichereinheit haben und dass die Transkriptionseinrichtung mit Kopplungsmitteln versehen ist, um mechanisch und elektrisch mit Kopplungsmitteln der Festkörperspeichereinheit zusammenzuwirken.
  17. Transkriptionseinrichtung nach Anspruch 16, dadurch gekennzeichnet, dass die Kopplungsmittel einer international standardisierten Schnittstelle gemäß sind.
  18. Transkriptionseinrichtung nach Anspruch 17, dadurch gekennzeichnet, dass die genannte Schnittstelle eine PCMCIA-Schnittstelle ist.
  19. Abnehmbare Festkörperspeichereinheit, mit einem datenkomprimierten Sprachsignal, wobei das genannte datenkomprimierte Sprachsignal in einem von zumindest zwei unterschiedlichen Datenkompressionsmodi datenkomprimiert ist, wobei die zumindest zwei unterschiedlichen Datenkompressionsmodi zu unterschiedlichen Datenkompressionsverhältnissen führen, wenn sie auf das gleiche Sprachsignal angewendet werden, wobei das datenkomprimierte Sprachsignal in der Speichereinheit in Datendateien gespeichert ist, die Abschnitte (IP) des datenkomprimierten Sprachsignals umfassen, dadurch gekennzeichnet, dass die Datendateien einen Headerabschnitt (HDR) umfassen, in dem ein Kennungssignal gespeichert ist, wobei das Kennungssignal den beim Datenkomprimieren des Sprachsignals selektierten Datenkompressionsmodus identifiziert.
  20. Festkörperspeichereinheit nach Anspruch 19, dadurch gekennzeichnet, dass sie mit Kopplungsmitteln versehen ist, um die Speichereinheit mechanisch und elektrisch mit einem PC zu koppeln.
  21. Festkörperspeichereinheit nach Anspruch 20, dadurch gekennzeichnet, dass die Kopplungsmittel ausgebildet sind, um die Speichereinheit mechanisch und elektrisch mit einer international standardisierten Schnittstelle des PC zu koppeln.
  22. Festkörperspeichereinheit nach Anspruch 21, dadurch gekennzeichnet, dass die genannte Schnittstelle eine PCMCIA-Schnittstelle ist.
DE69721404T 1996-02-12 1997-01-24 Diktiersystem Expired - Fee Related DE69721404T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP96200328 1996-02-12
EP96200328 1996-02-12
PCT/IB1997/000048 WO1997029578A2 (en) 1996-02-12 1997-01-24 Dictation system

Publications (2)

Publication Number Publication Date
DE69721404D1 DE69721404D1 (de) 2003-06-05
DE69721404T2 true DE69721404T2 (de) 2004-03-11

Family

ID=8223656

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69721404T Expired - Fee Related DE69721404T2 (de) 1996-02-12 1997-01-24 Diktiersystem

Country Status (10)

Country Link
US (1) US6182043B1 (de)
EP (1) EP0820625B1 (de)
JP (1) JPH11508709A (de)
KR (1) KR100531558B1 (de)
CN (1) CN1119797C (de)
AT (1) ATE239290T1 (de)
BR (1) BR9702068A (de)
DE (1) DE69721404T2 (de)
ID (1) ID15832A (de)
WO (1) WO1997029578A2 (de)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3235654B2 (ja) * 1997-11-18 2001-12-04 日本電気株式会社 無線電話装置
DE19800127B4 (de) * 1997-11-20 2006-06-29 Joachim Alberth Audio-Recorder
KR100287366B1 (ko) * 1997-11-24 2001-04-16 윤순조 엠피이지 방식을 이용한 휴대용 음향 재생장치 및 방법
US6772126B1 (en) * 1999-09-30 2004-08-03 Motorola, Inc. Method and apparatus for transferring low bit rate digital voice messages using incremental messages
US6789060B1 (en) 1999-11-01 2004-09-07 Gene J. Wolfe Network based speech transcription that maintains dynamic templates
JP3468183B2 (ja) * 1999-12-22 2003-11-17 日本電気株式会社 音声再生記録装置および方法
US7339892B1 (en) 2000-08-18 2008-03-04 Nortel Networks Limited System and method for dynamic control of data packet fragmentation threshold in a wireless network
US7366103B2 (en) * 2000-08-18 2008-04-29 Nortel Networks Limited Seamless roaming options in an IEEE 802.11 compliant network
US7308279B1 (en) 2000-08-18 2007-12-11 Nortel Networks Limited Dynamic power level control on transmitted messages in a wireless LAN
US6947483B2 (en) * 2000-08-18 2005-09-20 Nortel Networks Limited Method, apparatus, and system for managing data compression in a wireless network
US7280495B1 (en) 2000-08-18 2007-10-09 Nortel Networks Limited Reliable broadcast protocol in a wireless local area network
US7474739B2 (en) 2003-12-15 2009-01-06 International Business Machines Corporation Providing speaker identifying information within embedded digital information
CN100456357C (zh) * 2004-01-06 2009-01-28 华为技术有限公司 一种语音数据的存储方法
WO2008041083A2 (en) * 2006-10-02 2008-04-10 Bighand Ltd. Digital dictation workflow system and method
US8024289B2 (en) 2007-07-31 2011-09-20 Bighand Ltd. System and method for efficiently providing content over a thin client network
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
EP3613039B1 (de) 2018-06-29 2020-10-07 Google LLC Audioverarbeitung in einem netzwerksystem mit niedriger bandbreite

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5086475A (en) * 1988-11-19 1992-02-04 Sony Corporation Apparatus for generating, recording or reproducing sound source data
US5347478A (en) * 1991-06-09 1994-09-13 Yamaha Corporation Method of and device for compressing and reproducing waveform data
IT1256823B (it) * 1992-05-14 1995-12-21 Olivetti & Co Spa Calcolatore portatile con annotazioni verbali.
US5491774A (en) * 1994-04-19 1996-02-13 Comp General Corporation Handheld record and playback device with flash memory
US5812882A (en) * 1994-10-18 1998-09-22 Lanier Worldwide, Inc. Digital dictation system having a central station that includes component cards for interfacing to dictation stations and transcription stations and for processing and storing digitized dictation segments
US5884269A (en) * 1995-04-17 1999-03-16 Merging Technologies Lossless compression/decompression of digital audio data
US5839100A (en) * 1996-04-22 1998-11-17 Wegener; Albert William Lossless and loss-limited compression of sampled data signals

Also Published As

Publication number Publication date
WO1997029578A3 (en) 1997-10-23
EP0820625B1 (de) 2003-05-02
KR100531558B1 (ko) 2006-01-27
BR9702068A (pt) 1998-05-26
JPH11508709A (ja) 1999-07-27
KR19980703806A (ko) 1998-12-05
CN1185854A (zh) 1998-06-24
WO1997029578A2 (en) 1997-08-14
ATE239290T1 (de) 2003-05-15
CN1119797C (zh) 2003-08-27
ID15832A (id) 1997-08-14
US6182043B1 (en) 2001-01-30
DE69721404D1 (de) 2003-06-05
EP0820625A2 (de) 1998-01-28

Similar Documents

Publication Publication Date Title
DE69721404T2 (de) Diktiersystem
EP0712131B1 (de) Vorrichtung zur Sprachaufzeichnung mit anschliessender Texterstellung
DE69829802T2 (de) Spracherkennungsapparat zum Übertragen von Sprachdaten auf einem Datenträger in Textdaten
DE102004036154B3 (de) Vorrichtung und Verfahren zur robusten Klassifizierung von Audiosignalen sowie Verfahren zu Einrichtung und Betrieb einer Audiosignal-Datenbank sowie Computer-Programm
EP0624291B1 (de) Fehlerschutz in einem subbandkodierer
DE19629184A1 (de) Sprachgesteuertes Aufzeichnungsgerät
DE3534064A1 (de) Empfangsgeraet
DE69534561T2 (de) Sender-empfänger
DE4313175A1 (de) Verfahren und Vorrichtung zur Aufzeichnung von Audiosignalen in einen Halbleiterspeicher
DE3590157T (de) System zur Speicherung und zum Abruf der Stimme eines Telefonisten
DE69734543T2 (de) Mit 2-kanal- und 1-kanal-übertragung kompatible n-kanalübertragung
DE3149462A1 (de) Wortprozessor
DE69728330T2 (de) Mit einer 5-kanalübertragung und einer 2-kanalübertragung kompatible 7-kanalübertragung
DE10004284A1 (de) Tragbares Datenaufnahme- und/oder Datenwiedergabegerät
JP4012976B2 (ja) 口述録音及び録音再生装置
DE69706927T2 (de) Diktiergerät zum speichern von sprachsignalen
DE3149862A1 (de) Wort-verarbeitungseinrichtung zum verarbeiten und editieren von texten
DE69632557T2 (de) Telefonanrufbeantworter
DE69327897T2 (de) Aus einer Kombination von tragbaren Rechner und Handapparat bestehendes Diktiergerät
DE19906512C2 (de) Verfahren zum unbemerkten Übertragen und/oder Speichern von Zusatzinformationen innerhalb eines Signals, insbesondere Audiosignals
DE19962338A1 (de) Verfahren zur Speicherung mindestens einer Rufsignalfolge und Telekommunikationsendgerät
DE19846544A1 (de) Telefon
DE3149859A1 (de) Anzeige-steuereinrichtung fuer einen wort-prozessor fuer text-editierungs-funktionen
EP1059637B1 (de) Verfahren zur Erweiterung der Bandbreite von analog gespeicherten Sprachsignalen für ein Diktiergerät
DE102008013762A1 (de) Datenwiedergabevorrichtung und Datenwiedergabeverfahren

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee