Lempel-Ziv-Welch-Algorithmus
Der LZW- oder auch Lempel-Ziv-Welch-Algorithmus ist ein häufig bei Grafikformaten zur Datenkompression, also zur Reduzierung der Datenmenge, eingesetzter Algorithmus. Ein Großteil der Funktionweise dieses Algorithmus wurde 1978 von Abraham Lempel und Jacob Ziv entwickelt und veröffentlicht (LZ78). Einige Detailverbesserungen wurden 1984 von Terry A. Welch gemacht.
LZW ist ein verlustfreies Komprimierungsverfahren. Es wird zum Beispiel im 1987 von CompuServe-Mitarbeitern entwickelten Bildformat GIF benutzt und kann optional auch in TIFF und JPEG eingesetzt werden.
| Inhaltsverzeichnis |
Funktionsweise
LZW komprimiert mittels Wörterbüchern, in denen die am häufigsten vorkommenden Zeichenketten, wie z.B. 'ist', 'die' und 'ein', gespeichert werden und nun nur noch unter einer Abkürzung angesprochen werden müssen. Der Knackpunkt bei diesem Algorithmus liegt darin, dass das Wörterbuch nicht zusätzlich abgelegt werden muss. Dieses wird implizit mit in die Datei geschrieben. Der Decoder, sofern richtig programmiert, ist in der Lage, es aus dem Datenstrom zu rekonstruieren.
Beispiel zur Kompression
Verweise sind hier mit $ ausgezeichnet. In dem Algorithmus von Lempel, Ziv und Welch werden die Verweise mittels einem Bit oder mehreren realisiert. Im einfachsten Fall liegen also keine 8-Bit-Zeichen, sondern 9-Bit-Zeichen vor, die, wenn das erste Bit gesetzt ist, als Verweis interpretiert werden.
Dazu existiert ein kleines, unfertiges Java-Applet: ausprobieren
Zu komprimierende Zeichenkette: HA,HA,HI,HA,HO
| Vorh. Zeichen | Eingabe | Ausgabe | Index von | Neuer Eintrag |
|---|---|---|---|---|
| H | ||||
| H | A | H | 0 | HA |
| A | , | A | 1 | A, |
| , | H | , | 2 | ,H |
| H | A | |||
| A | , | $0 | 3 | HA, |
| , | H | |||
| H | I | $2 | 4 | ,HI |
| I | , | I | 5 | I, |
| , | H | |||
| H | A | $2 | 6 | ,HA |
| A | , | |||
| , | H | $1 | 7 | A,H |
| H | O | H | ||
| O | O | |||
Patente
Für LZW und ähnliche Algorithmen wurden verschiedene Patente in den USA und anderen Ländern ausgestellt. LZ78 wurde durch das am 10. August 1981 eingereichte und am 7. August 1984 gewährte US-Patent 4.464.650 der Sperry Corporation (später zu Unisys fusioniert) abgedeckt, in dem Lempel, Ziv, Cohn und Eastman als Erfinder eingetragen sind.
Zwei US-Patente wurden für den LZW-Algorithmus ausgestellt: Nr. 4.814.746 von Victor S. Miller and Mark N. Wegman für IBM, eingereicht am 1. Juni 1983, sowie Nr. 4.558.302 von Welch für die Sperry Corporation, später Unisys Corporation, eingereicht am 20. Juni 1983.
Das US-Patent 4.558.302 verursachte die größte Kontroverse. Eine der am weitesten verbreiteten Anwendungen für LZW war das in den 1990er Jahren für Webseiten immer populärer werdende GIF-Format für Bilder. Unisys hatte zwar bereits seit 1987 Lizenzgebühren für die LZW-Verwendung in Hardware und hardwarenaher Software verlangt, die tantiemenfreie Nutzung des LZW-Algorithmus jedoch gestattet, während GIF sich neben JPEG zu einem Standard-Format entwickelte. Im Dezember 1994 begann Unisys jedoch mit CompuServe Lizenzgebühren von Entwicklern kommerzieller Software, die das GIF-Format lesen und schreiben konnte, zu verlangen und dehnte dies im August 1999 auch auf freie Software aus. Dieses Verhalten rief in Entwickler- und Anwenderkreisen weltweit Empörung hervor.
Viele Rechtsexperten kamen zum Schluss, dass das Patent solche Geräte nicht abdeckt, die LZW-Daten zwar dekomprimieren, aber nicht komprimieren können. Aus diesem Grund kann das weit verbreitete Programm Gzip Dateiarchive im Z-Format zwar lesen, aber nicht schreiben.
Das US-Patent 4.558.302 lief am 20. Juni 2003 nach 20 Jahren aus. Die entsprechenden europäischen, kanadischen und japanischen Patente folgten im Juni 2004.
Siehe auch
Weblinks
- Tutorial zur Funktionsweise des LZW-Verfahrens (Deutsch)
- http://www.rz.uni-bayreuth.de/lehre/dibito/vorlesung/node37.html
- WebArchiv: http//www.ufg.ac.at/zid/public_html/funk/medientechnik/material/LZW.html
- http://lzw.info (Englisch)
- Originaltext des US-Patents 4.558.302 (Englisch)
