Tokenbasierte Kompression - LinkFang.de





Tokenbasierte Kompression


Die tokenbasierte Kompression (englisch token-based compression) ist eine Methode, um bei der Datenverarbeitung Speicherplatz zu sparen. Dabei werden die Seiten eines Dokuments als eine Ansammlung aus im Dokument vorkommenden Symbolen (Tokens) repräsentiert. Positionsinformationen geben an, wo die Symbole erscheinen sollen. Jedes Symbol ist hierbei eine Abbildung eines Teils des Dokuments, etwa ein Buchstabe, ein Wort oder eine Grafik.

Mehrfache Vorkommen desselben Zeichens im Dokument werden repräsentiert, indem die Abbildung des Zeichens nur einmal verwendet wird. Jede Seite des Dokuments spezifiziert, welches Symbol auf ihr vorkommt und legt dessen Position fest.

Häufig wiederkehrende Schlüsselwörter werden durch Abkürzungen, Tokens, ersetzt.

Die Kompressionsraten bei diesem Verfahren sind recht hoch, wenn der zu kodierende Text viele Wiederholungen enthält. Bei Eingaben mit wenigen oder gar keinen Wiederholungen ist die tokenbasierte Kompression ungeeignet.

Ausgangstext: Print "Hallo"; Print "Hier"
  Kodiertext: 3F "Hallo"; 3F "Hier"

Siehe auch: Tokenisierung


Kategorien: Datenkompression

Quelle: Wikipedia - http://de.wikipedia.org/wiki/Tokenbasierte Kompression (Vollständige Liste der Autoren des Textes [Versionsgeschichte])    Lizenz: CC-by-sa-3.0

Änderungen: Alle Bilder mit den meisten Bildunterschriften wurden entfernt. Ebenso alle zu nicht-existierenden Artikeln/Kategorien gehenden internen Wikipedia-Links (Bsp. Portal-Links, Redlinks, Bearbeiten-Links). Entfernung von Navigationsframes, Geo & Normdaten, Mediadateien, gesprochene Versionen, z.T. ID&Class-Namen, Style von Div-Containern, Metadaten, Vorlagen, wie lesenwerte Artikel. Ansonsten sind keine Inhaltsänderungen vorgenommen worden. Weiterhin kann es durch die maschinelle Bearbeitung des Inhalts zu Fehlern gerade in der Darstellung kommen. Darum würden wir jeden Besucher unserer Seite darum bitten uns diese Fehler über den Support mittels einer Nachricht mit Link zu melden. Vielen Dank!

Stand der Informationen: August 201& - Wichtiger Hinweis: Da die Inhalte maschinell von Wikipedia übernommen wurden, ist eine manuelle Überprüfung nicht möglich. Somit garantiert LinkFang.de nicht die Richtigkeit und Aktualität der übernommenen Inhalte. Sollten die Informationen mittlerweile fehlerhaft sein, bitten wir Sie darum uns per Support oder E-Mail zu kontaktieren. Wir werden uns dann innerhalb von spätestens 10 Tagen um Ihr Anliegen kümmern. Auch ohne Anliegen erfolgt mindestens alle drei Monate ein Update der gesamten Inhalte.