-
Die Erfindung betrifft ein Diktiersystem
mit einer in der Hand gehaltenen Diktiereinrichtung zum Speichern
eines Sprachsignals in Speichermitteln, wobei die Einrichtung Datenkompressionsmittel
zum Datenkomprimieren des Sprachsignals in ein datenkomprimiertes
Sprachsignal umfasst, Speicherungsmittel zum Speichern des datenkomprimierten Sprachsignals
in den Speichermitteln. Die Datenkompressionsmittel sind ausgebildet,
um am Sprachsignal einen Datenkompressionsschritt in einem von zumindest
zwei unterschiedlichen Datenkompressionsmodi auszuführen, wobei
die zumindest zwei unterschiedlichen Datenkompressionsmodi zu unterschiedlichen
Datenkompressionsverhältnissen
führen,
wenn sie auf das gleiche Sprachsignal angewendet werden, wobei die
genannten zumindest zwei unterschiedlichen Datenkompressionsmodi
von einem Benutzer selektiert werden können, wobei die Datenkompressionsmittel
weiterhin zum Verschaffen von Datendateien ausgebildet sind, die
Abschnitte des datenkomprimierten Sprachsignals umfassen, und zum
Generieren eines Kennungssignals ausgebildet sind, das den selektierten
Datenkompressionsmodus identifiziert.
-
Die Erfindung betrifft weiterhin
eine in der Hand gehaltene Diktiereinrichtung, eine Transkriptionseinrichtung
und eine abnehmbare Festkörperspeichereinheit
zur Verwendung in dem Diktiersystem. Ein Diktiersystem wie eingangs
definiert ist nach dem Stand der Technik wohl bekannt.
-
Datenkompression kann in Diktiersystemen nach
dem Stand der Technik durch Wegwerfen der Stilleperioden realisiert
werden, die normalerweise im Sprachsignal vorhanden sind. Weiterhin
kann man ein Anzeigesignal speichern, das die Länge der Stilleperiode und ihren
Ort im Sprachsignal andeutet. Bei der Transkription kann eine Kopie
des Sprachsignals durch das Einfügen
von Stilleperioden der gleichen Länge an den. angegebenen Positionen
in dem komprimierten Sprachsignal regeneriert werden.
-
US 5.481.645 offenbart einen tragbaren Computer,
der Signale, die aus einem Mikrofon stammen, in digitale Sprachsignale
umwandeln kann, die in einem Speicher gespeichert werden sollen.
Um die Sprachsignale an Stellen des Speichers als individuell identifizierbare
sprachliche Einfügungen
zu speichern und um jeder Einfügung
einen ständigen
Identifikationscode zuzuweisen, der Information zu dem für die genannte
sprachliche Einfügung
verwendeten Kompressionsverfahren umfasst, sind Identifikationsmittel
vorgesehen sowie Mittel zur visuellen Darstellung von Daten, die
zu den Identifikationscodes der sprachlichen Einfügungen gehören, auf
einem Bildschirm. Die Identifikationscodes der digitalen Sprachsignale
werden gesondert von den digitalen Sprachsignalen zusammen mit der
Startadresse der digitalen Sprachsignale gespeichert.
-
Der Erfindung liegt als Aufgabe zugrunde, ein
verbessertes Diktiergerät
zu verschaffen. Das erfindungsgemäße Diktiersystem ist dadurch
gekennzeichnet, dass die Datendateien einen Headerabschnitt umfassen,
wobei die Datenkompressionsmittel zum Speichern des genannten Kennungssignals in
dem genannten Headerabschnitt ausgebildet sind. Die Erfindung beruht
auf der folgenden Erkenntnis. Die Speicherkapazität von Speichern,
die in Diktiergeräten
enthalten sind, ist begrenzt. Vorzugsweise sollte eine höhere Anzahl
von Diktaten in einem Speicher gespeichert werden. Dies ist nach
dem Stand der Technik dadurch realisiert worden, dass die Stilleperioden,
die in einem Sprachsignal vorhanden sind, weggelassen werden. Durch
Anwendung leistungsstärkerer
Kompressionstechniken kann ein größeres Kompressionsverhältnis erhalten
werden. Insbesondere führen
verlustbehaftete Kompressionstechniken zu großen Datenkompressionsverhältnissen.
Größere Datenreduktionsverhältnisse
können
bei der Datenexpansion jedoch zu einer Abnahme der Qualität des zurückgewonnenen
Signals führen.
Erfindungsgemäß ist ein
Diktiersystem vorgeschlagen worden, bei dem der Benutzer die Möglichkeit
hat, einen Datenkompressionsmodus aus zwei oder mehr Datenkompressionsmodi
zu wählen,
mit denen die in der Hand gehaltene Diktiereinrichtung das Sprachsignal
komprimieren kann. Der Benutzer kann zwischen der Anzahl Sprachnachrichten,
die er diktieren möchte
und in einer Speichereinheit speichern möchte, und der Qualität des Sprachsignals bei
der Wiedergabe einen Kompromiss machen. Wenn der Benutzer in dem
Speicher mehr Diktate gespeichert haben möchte, wird er den Datenkompressionsmodus
wählen,
der ein höheres
Datenkompressionsverhältnis
ergibt. Wenn der Benutzer eine höhere
Wiedergabequalität
bevorzugt, wird er den Datenkompressionsmodus wählen, der ein niedrigeres Datenkompressionsverhältnis ergibt.
-
Die Unteransprüche definieren bevorzugte Ausführungsformen
des Diktiersystems, der in der Hand gehaltenen Diktiereinrichtung,
einer Transkriptionseinrichtung und der abnehmbaren Festkörperspeichereinheit.
-
Ausführungsbeispiele der Erfindung
sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben.
Es zeigen:
-
1 eine
Ausführungsform
der in der Hand gehaltenen Diktiereinrichtung,
-
2 eine
Ausführungsform
der Speicherkarte zur Verwendung in der in der Hand gehaltenen Diktiereinrichtung,
-
3 das
Schaltbild der in der Hand gehaltenen Diktiereinrichtung,
-
4 die
Folge von Signalblöcken,
die von dem Prozessor in der in der Hand gehaltenen Diktiereinrichtung
generiert werden, und
-
5 eine
Ausführungsform
eines Transkriptionsgerätes,
entweder als Tischgerät
oder in Form eines PCs.
-
1 zeigt
eine Vorderansicht einer in der Hand gehaltenen Diktiereinrichtung 1,
die mit einem Ein-/Ausschalter 2 versehen ist, der an der
Seite des Gehäuses
der Einrichtung liegt. Am Boden des Gehäuses ist ein Batteriefach 3 (nicht
abgebildet) vorgesehen, das an der Rückseite des Gehäuses erreicht werden
kann. An der Vorderseite des Gehäuses
ist ein Schiebeschalter 4 vorgesehen, um die Einrichtung
in die verschiedenen Diktiermodi zu schalten. Die Einrichtung ist
mit einer Anzahl von Tasten versehen: Taste 5 ist die Aufzeichnungstaste,
Taste 6 ist die BRIEF-Taste, Taste 7 ist die MODUS-Taste,
Taste 8 ist die EINFÜGE-Taste
und Taste 9 ist die LÖSCH-Taste.
Der Schalter 10 ist der Aufzeichnungsmodusschalter. Der
Schalter 11 ist der Empfindlichkeitsschalter. Die Einrichtung 1 ist
weiterhin mit einer LCD-Anzeige versehen, um verschiedene Informationen
hinsichtlich eines Diktates wiederzugeben, wie die Aufzeichnungsdauer
des Diktates, die verbleibende Aufzeichnungsdauer, den Aufzeichnungsmodus,
die Anzahl Diktate usw.
-
Ein Mikrofon 13 und ein
Lautsprecher 18 sind in dem Gehäuse vorgesehen und ein Lautstärkereglerknopf 14 ist
an der Seite des Gehäuses
vorgesehen. Weiterhin ist in der Oberseite der Einrichtung ein Schlitz 16 vorgesehen,
um eine Speicherkarte 15 aufzunehmen.
-
Die Speicherkarte 15 wird
auch in 2 dargestellt.
Die Speicherkarte 15 ist mit einem Festkörperspeicher 20 und
mit elektrischen Anschlüssen 22 versehen,
die mit dem Festkörperspeicher 20 verbunden
sind. Der Festkörperspeicher 20 kann
z. B. ein EE-PROM
oder ein löschbarer
FLASH-Speicher sein. Die elektrischen Anschlüsse 22 können so
ausgeführt
sein, dass sie ein elektrisches Zusammenarbeiten mit der international
standardisierten PCMCIA-Schnittstelle eines PCs ermöglichen.
-
3 zeigt
die elektrische Konstruktion der Einrichtung 1 und ihre
Zusammenwirkung mit der Speicherkate 15. Die Einrichtung 1 umfasst
einen digitalen Signalprozessor 30, der einen digitalen
Eingang/Ausgang 32 hat, der mit Anschlüssen 34 gekoppelt
ist, die elektrisch mit den Anschlüssen 22 der Speicherkarte 15 gekoppelt
sind, wenn diese in den Schlitz 16 eingebracht ist. Das
Mikrofon 13 ist mit einem Analogeingang 36 des
Prozessors 30 gekoppelt, falls notwendig über einen
Verstärker 38.
Der Prozessor 30 umfasst weiterhin einen Analogausgang 40,
der mit dem Lautsprecher 18 über einen Verstärker 42 gekoppelt
ist. Die verschiedenen Knöpfe
und Tasten, die in 3 durch
das Bezugszeichen 44 angedeutet sind, sind mit Steuereingängen 46 des Prozessors 30 gekoppelt.
Weiterhin ist ein Steuerausgang 48 des Prozessors 30 mit
einer Display-Steuereinheit 50 zum Steuern der Anzeige
von Informationen auf dem Display 12 gekoppelt.
-
Der Benutzer steckt die Speicherkarte 15 in den
Schlitz 16 der Einrichtung 1, bis die Anschlüsse 22 der
Speicherkarte 15 mit elektrischen Anschlüssen 34,
die im Schlitz der Einrichtung vorhanden sind, in Kontakt kommen.
Die Speicherkarte steht nun elektrisch und mechanisch mit der Einrichtung 1 in
Kontakt.
-
Der Prozessor 30 ist imstande,
die analogen Sprachsignale über
den Eingang 36 zu empfangen und eine Analog/Digital-Umzusetzung
des Sprachsignals in ein digitales Sprachsignal auszuführen. Weiterhin
kann der Prozessor 30 nach Selektion durch den Benutzer
einen von zumindest zwei unterschiedlichen Datenkompressionsschritten
an dem digitalen Sprachsignal ausführen. Angenommen werde, dass der
Prozessor 30 imstande ist, zwei Datenkompressionsschritte
an dem Sprachsignal auszuführen.
Jeder an dem gleichen Sprachsignal ausgeführte Kompressionsschritt führt zu unterschiedlichen
Kompressionsverhältnissen.
Die Datenkompressionsschritte können
die Form von verlustlosen Kompressionsschritten haben. Das bedeutet,
dass tatsächlich
keine Daten verloren gehen und das ursprüngliche Sprachsignal bei der
Datenexpansion vollständig
zurückgewonnen
werden kann. Ein Beispiel für
ein verlustloses Datenkompressionsverfahren ist lineares prädiktives
Codieren, dem eine Huffman-Codierung folgt, die an dem Ausgangssignal
des linearen prädiktiven
Codierers ausgeführt
wird. Datenkompression kann auch verlustbehaftet sein. Ein solcher
verlustbehafteter Datenkompressionsschritt ist Subbandcodierung,
in der Tech nik wohl bekannt und angewendet in digitalen DCC-Magnetaufzeichnungssystemen.
Bei verlustbehafteten Kompressionsverfahren wird der Teil der Information,
der nicht hörbar ist,
tatsächlich
weggeworfen. Bei der Datenexpansion wird eine Kopie des ursprünglichen
Sprachsignals zurückgewonnen.
Da die Information, die bei der Datenkompression weggelassen worden
ist, unhörbar war,
wird die Kopie des Sprachsignals von dem Benutzer gehört werden,
als ob sie gleich dem ursprünglichen
Sprachsignal sei.
-
Der Prozessor 30 kann am
Sprachsignal einen verlustlosen Datenompressionsschritt sowie einen
verlustbehafteten Datenkompressionsschritt ausführen, als die zwei unterschiedlichen
Datenkompressionsschritte, die von dem Prozessor 30 realisiert
werden können.
Als Alternative kann der Prozessor 30 zwei unterschiedliche
verlustlose Datenkompressionsschritte ausführen, die zu unterschiedlichen
Datenkompressionsverhältnissen
führen.
Als wiederum andere Alternative kann der Prozessor 30 imstande
sein, zwei unterschiedliche verlustlose Datenkompressionsschritte
an dem Sprachsignal auszuführen,
die zu zwei unterschiedlichen Datenkompressionsverhältnissen
führen.
Als Beispiel für
die letzte Möglichkeit
könnte
der Prozessor 30 mit einem einfachen Subbandcodierer versehen
sein, wie er bei DCC verwendet wird. Der Subbandcodierer kann einfach
sein, da weniger Subbänder
zum Codieren des Sprachsignals benötigt werden. Weniger Subbänder werden
benötigt,
z. B. 5 anstelle der 32 im DCC-Subbandcodierer, da die
Bandbreite des Sprachsignals viel kleiner ist als ein Breitbandaudiosignal.
Mit dem vereinfachten Subbandcodierer können unterschiedliche Kompressionsverhältnisse
erhalten werden, indem der Bitpool für den Bitzuweisungsschritt
in dem vereinfachten Subbandcodierer geändert wird. In diesem Zusammenhang
wird auf die Dokumente (1), (2), (3a) und (3b) in der Liste der
Dokumente verwiesen, die am Ende dieser Beschreibung zu finden sind.
-
Wenn der Benutzer eine Sprachnachricht
in der Einrichtung aufzeichnen möchte,
drückt
er die BRIEF-Taste 6, die angibt, dass der Benutzer eine Sprachnachricht
speichern möchte.
Weiterhin kann der Benutzer die MODUS-Taste 7 betätigen, um
verschiedene Modi zu selektieren, wie z. B. ob die Sprachnachricht
eine (hohe) Priorität
haben soll oder ob die Sprachnachricht gegen Überschreiben geschützt werden
soll. Anschließend
selektiert der Benutzer durch Betätigung der Taste 10 einen
Aufzeichnungsmodus. Selektieren des Aufzeichnungsmodus bedeutet,
dass der Benutzer einen Datenkompressionsmodus selektiert. Wenn
der Benutzer/die Benutzerin eine Aufzeichnung mit relativ guter
Qualität wünscht, wählt er/sie
den Datenkompressionsmodus so, dass er zu dem niedrigsten Datenkompressionsverhältnis führt. Daher
wird für
das genannte Diktat eine größere Menge
In formation in dem Speicher 20 gespeichert werden, sodass
weniger Diktate in dem genannten Speicher gespeichert werden können. Wenn
der Benutzer/die Benutzerin möglichst
viele Diktate in dem Speicher gespeichert haben möchte, wird
er/sie den Datenkompressionsmodus wählen, der zu dem höheren Datenkompressionsverhältnis führt. Eine
Speicherung mit niedriger Qualität
der Diktate kann die Folge sein.
-
Die komprimierte Information ist
in Informationsblöcken
(oder "Dateien") ..., Bi, Bi+1,
Bi+2, ... enthalten. Dies wird in 4 gezeigt. Jeder Informationsblock
B; hat einen Headerabschnitt, der als HDR bezeichnet wird, und einen
Informationsabschnitt, der mit IP bezeichnet wird. Weiterhin wird
ein Kennungssignal in dem Headerabschnitt gespeichert. Das Kennungssignal
in einem Headerabschnitt HDR eines Signalblockes identifiziert den
Kompressionsmodus, der auf das Sprachsignal angewendet wird, um
die in dem Informationsabschnitt IP des gleichen Signalblocks gespeicherte
datenkomprimierte Information zu erzeugen. Die Folge von Signalblöcken wird
dem digitalen Ausgang 32 des Prozessors 30 zugeführt und anschließend in
dem Speicher 20 auf der Speicherkarte 15 gespeichert.
-
Es soll hier bemerkt werden, dass
der Prozessor 30 Signalblöcke erzeugen könnte, die
so lang sind, wie notwendig ist, um die Information von genau einer
Sprachnachricht zu speichern. Der Prozessor 30 kann auch
ausgebildet sein, um Signalblöcke
mit fester Länge
zu erzeugen, und so, dass die datenkomprimierte Information einer
Sprachnachricht in einer Vielzahl nachfolgender, von dem Prozessor 30 erzeugter
Signalblöcke
gespeichert wird.
-
Wenn der Benutzer möchte, dass
die Sprachnachricht in dem Speicher 20 gespeichert wird,
kann der Prozessor 30 die datenkomprimierte Information
aus dem Speicher 20 zurückgewinnen und
an der in dem Speicher gespeicherten datenkomprimierten Information
einen Datenexpansionsschritt ausführen. Es wird deutlich sein,
dass der Datenexpansionsschritt das Inverse des beim Diktieren ausgeführten Datenkompressionsschrittes
ist. Der in dem Prozessor 30 auszuführende Datenexpansionsschritt
wird weiterhin anhand einer Ausführungsform eines
Transkriptionsgerätes,
wie in 5 gezeigt, näher erläutert werden.
Nachdem eine Kopie des Sprachsignals erhalten worden ist, wird dieses Sprachsignal
in dem Prozessor einer Digital/Analog-Umsetzung unterzogen und zur
Wiedergabe durch den Lautsprecher 18 dem Ausgang 40 zugeführt.
-
Zur Transkription der in dem Speicher 20 auf der
Speicherkarte 15 gespeicherten Sprachnachrichten wird die
Speicherkarte 15 aus der Einrichtung gezogen und in ein
Transkriptionstischgerät 52 eingeführt, siehe 5. Das Transkriptionsgerät 52 umfasst einen
digitalen Signalprozessor 53, der einen Digitaleingang 54 hat,
der mit Anschlüssen 56 gekoppelt
ist, die mit den Anschlüssen 22 der
Speicherkarte 15 elektrisch gekoppelt sind, wenn diese
in einen in dem Gerät 52 vorgesehenen
Schlitz (nicht abgebildet) eingesteckt ist. Über einen Verstärker 62 ist
ein Lautsprecher 58 mit einem Analogausgang 60 des Prozessors 53 gekoppelt.
Der Prozessor 53 umfasst weiterhin einen Steuerausgang 64,
der mit einer Display-Steuerungseinheit 66 zum Steuern
der Anzeige von Information auf einem Display 68 gekoppelt
ist. Eine Tastatur 70 ist mit Steuereingängen 72 des
Prozessors 53 gekoppelt.
-
Der Benutzer führt die Speicherkarte 15 in
einen Schlitz (nicht abgebildet) des Transkriptionsgerätes 52 ein,
bis die Anschlüsse 22 der
Speicherkarte 15 mit elektrischen Anschlüssen 56,
die im Schlitz des Transkriptionsgerätes 52 vorgesehen
sind, in Kontakt kommen. Die Speicherkarte steht jetzt elektrisch
und mechanisch mit dem Gerät 52 in
Kontakt.
-
Beim Betätigen einer "AUSSPEICHER"-Taste
auf der Tastatur 70 wird die in dem Speicher 20 auf der
Speicherkarte 15 gespeicherte Information ausgelesen und
in einem internen Speicher des digitalen Signalprozessors 53 gespeichert.
Der Prozessor 53 kann an der aus der Speicherkarte ausgespeicherten digitalen
Information einen von zumindest zwei unterschiedlichen Datenexpansionsschritten
ausführen. Es
wird deutlich sein, dass der in dem Prozessor 53 ausgeführte Expansionsmodus
das Inverse des während
des Diktierschrittes in dem Prozessor 30 ausgeführten Kompressionsmodus
ist. Der Prozessor 53 gewinnt das Kennungssignal aus den
Headerabschnitten HDR der Signalblöcke zurück und führt in Reaktion auf das Kennungssignal
einen Datenexpansionsschritt aus. Als Folge wird eine Kopie des
digitalen Sprachsignals erhalten.
-
Der Prozessor 53 ist weiterhin
imstande, die Kopie des digitalen Sprachsignals in ein analoges Sprachsignal
umzusetzen und das analoge Sprachsignal über den Ausgang 30 dem
Lautsprecher 58 zuzuführen,
sodass eine Schreibkraft oder eine andere Person das Sprachsignal,
das transkribiert werden muss, hören
kann.
-
Die Schreibkraft kann die Sprachnachricht, die über den
Lautsprecher wiedergegeben wird, unter Verwendung der Tastatur 70 eintippen,
um eine getippte Version der Sprachnachricht zu erhalten.
-
Bei einer anderen Ausführungsform
des Transkriptionsgerätes 52,
wenn diese in Form eines Personalcomputers mit genügend großer Speicherkapazität realisiert
ist, kann das Gerät
mit einem Spracherkennungsalgorithmus versehen sein, der es ermöglicht, dass
das Gerät
als Folge eines solchen Spracherkennungsschrittes aus dem Sprachsignal eine
Zeichendatei erzeugt. Die Zeichendatei könnte auf dem Display 68 sichtbar
gemacht werden, sodass die Schreibkraft durch Lesen des Textes auf
dem Wiedergabeschirm 68 und Abhören der Sprachnachricht über den
Lautsprecher 58 eine Fehlerkontrolle ausführen kann
und die Fehler durch Verwendung der Tastatur 70 korrigieren
kann.
-
Zuvor ist ein Beispiel eines verlustlosen
Datenkompressionsverfahrens beschrieben worden, nämlich lineares
prädiktives
Codieren, dem eine Huffman-Codierung folgt. Es spricht für sich,
dass der Prozessor 53 imstande sein muss, eine entsprechende
Huffman-Decodierung auszuführen,
der eine entsprechende lineare prädiktive Decodierung folgt,
um das ursprüngliche
Sprachsignal zu regenerieren.
-
Es ist auch ein Beispiel eines verlustbehafteten
Datenkompressionsschrittes beschrieben worden, nämlich Subbandcodierung. Es
spricht für
sich, dass der Prozessor 53 imstande sein muss, eine entsprechende
Subbanddecodierung auszuführen,
um eine Kopie des ursprünglichen
Sprachsignals zu regenerieren.
-
Wenngleich die vorliegende Erfindung
anhand von bevorzugten Ausführungsbeispielen
beschrieben worden ist, sind diese natürlich keine einschränkenden
Beispiele. So können
verschiedene Abwandlungen sich für
den Fachkundigen als offensichtlich erweisen, ohne dass der Rahmen
der Erfindung, wie sie in den Ansprüchen definiert wird, verlassen
wird. Weiterhin liegt die Erfindung in jedem einzelnen Neuheitsmerkmal
oder einer Kombination von Merkmalen, wie hier offenbart.
-
Verwandte Dokumente
-
- (1) Europäische
Patentanmeldung Nr. 402.973 (PHN 13.241).
- (2) Europäische
Patentanmeldung Nr. 400.755 (PHQ 89.018A).
- (3a) Europäische
Patentanmeldung Nr. 457.390 (PHN 13.328).
- (3b) Europäische
Patentanmeldung Nr. 457.391 (PHN 13.329)
-
INSCHRIFT DER ZEICHNUNG
-
- FIG.
3
- 12
- Display
- 15
- Speicherkarte
- 32
- digital
ein/aus
- 36
- analog
ein
- 40
- analog
aus
- 44
- TASTEN
Aufzeichnen, Abspielen, ...
- 50
- Display-Steuerung
-
- FIG.
5
- 15
- Speicherkarte
- 53
- DSP
(digitaler Signalprozessor)
- 54
- digital
ein
- 60
- analog
aus
- 68
- Display
- 70
- TASTEN