Image compression library Jetpix
General
The image compression library Jetpix was developed in 1999. Even at today’s standards it achieves an exremely high data reduction of images with high image quality. At large resolutions the image files are around factor 5 smaller than jpeg. Among others it was used by Munich company vididia AG and in a TV project to transfer press photos at small bandwidth.
The library performed outstanding in a contest of the German c’t magazine. The participants were:
-
Uni Rostock
-
FHTW/ Telekom BERKOM
-
Luratech
-
Image&Video Compr.
-
Uni Potsdam
-
MeVis/CeVis, Uni Bremen
1. Wavelet compression contest (German)
In der c’t, Ausgabe 1/99, wurde zu einem Wettbewerb zur Beurteilung der Leistungsfähigkeit waveletbasierter Standbild-kompressionsverfahren aufgerufen. Bis zum 15.02.99 konnten entsprechende Verfahren bei den Veranstaltern - Prof. Heinz-Otto Peitgen (Universität Bremen) und Prof. Peter Maaß (Universität Potsdam) - eingereicht werden.
Anhand dieses Wettbewerbs sollte eine Übersicht über die Leistungsfähigkeit dieser Verfahren erarbeitet werden. Darauf aufbauend werden Vorschläge für die Standardisierung von waveletbasierten Kompressionsalgorithmen entwickelt. Da zwei der Einsender an der Vorbereitung des JPEG-2000-Standards beteiligt sind, werden die Erkenntnisse aus dem Wettbewerb auch in die zukünftigen Standardisierungsbemühungen eingearbeitet.
Erfreulicherweise war die Resonanz auf diesen Aufruf recht hoch. Dies verdeutlicht das Potential, das Forschung und Industrie dieser Problematik beimessen. Nicht weniger als 7 Verfahren wurden in diesem Wettbewerb verglichen.
Die Auswertung fand in der Zeit vom 16.02.99 bis 12.03.99 an den Universitäten Bremen und Potsdam unter der Leitung von Prof. H.-G. Stark (FH Würzburg-Schweinfurt-Aschaffenburg) statt.
Ein Kompressionsverfahren wird umso besser sein, je weniger die komprimierten Bilder von den Originalen abweichen. Um hierzu möglichst umfassende und praxisgerechte Aussagen zu erhalten, wurden folgende Beurteilungskriterien herangezogen:
-
Ermittlung des Peak-Signal-to-Noise-Abstands (PSNR) der komprimierten Bilder zu den Originalen. Zur Definition dieses Gütemaßes wird auf den Ausschreibungstext verwiesen, der unter http://www.math.uni-potsdam.de/numerik/wav/ zu finden ist.
-
Ermittlung von Kennzahlen zu Laufzeitverhalten und Speicherbedarf bei der (De)kompression.
-
Subjektiver Vergleich der erzielten Bildqualitäten durch eine repräsentative Auswahl von Betrachtern.
-
Für spezielles Bildmaterial (Röntgen- bzw. CT-Aufnahmen, Satellitenbilder) Beurteilung der Bildqualitäten durch Experten.
-
Die obige Mischung aus subjektiven und objektiven Kriterien berücksichtigt die Tatsache, daß bei der Bildbeurteilung durch Betrachter häufig Gesichtspunkte eine Rolle spielen, die durch meßbare Größen alleine nicht erfaßt werden. Die Frage, ob sich derartige Kriterien überhaupt quantitativ werden messen lassen können, ist nach wie vor offen und kann hier nicht entschieden werden.
2. Testszenario und Ablauf der Auswertung
Basis für die Auswertung war der folgende Satz an Testbildern:
Kategorie | Anzahl | Verlangte Kompressionsraten |
---|---|---|
Farbbilder |
6 |
1:10, 1:30, 1:100 |
Graustufenbilder |
2 |
1:10, 1:20, 1:40 |
Röntgenbilder |
2 |
1:8, 1:16, 1:32 |
CT-Bilder |
2 |
1:4, 1:8, 1:16 |
Satellitenbilder |
2 |
1:8, 1:16, 1:32 |
Insgesamt gingen damit 42 komprimierte Bilder in die Auswertung ein. Die Farbbilder stellen Alltagssituationen dar, erfordern also kein Expertenwissen. Dasselbe trifft auf die ausgewählten Graustufenbilder zu, die in die Auswertung mit einbezogen wurden, da sie sich in den letzten Jahren als "Quasistandard" zur Beurteilung der Güte von Kompressionsverfahren etabliert hatten. Bei beiden Bildklassen wurde die subjektive Bewertung durch eine Auswahl unvoreingenommener Betrachter vorgenommen. Da die Interpretation von Röntgen- CT- und Satellitenbildern entsprechendes Fachwissen erfordert, wurde diese Bewertung von Experten durchgeführt.
2.1. Subjektive Bewertung bei Farb- und Graustufenbildern
2.1.1. Testprozedur
Obige Tabelle führt zu 8*3=24 Testbildern, bei denen die einzelnen Verfahren miteinander verglichen werden können. Diese Prozedur wurde dreimal durchgeführt, so daß sich insgesamt 72 Experimente ergeben, die von 10 Testpersonen durchgeführt wurden. Dabei wurde folgendermaßen vorgegangen:
-
S1: Anonymisierung der Verfahren.
-
S2: Durchführung der Einzelexperimente mit folgenden Schritten:
-
S21: Präsentation von jeweils 2 aus verschiedenen Verfahren stammenden Bildern, bis eine Reihenfolge der 7 Verfahren feststand. Bei jedem Vergleich konnte sich die Testperson dabei für eines der beiden Bilder entscheiden, oder beide als gleich gut einstufen.
-
S22: Entsprechend der entstandenen Reihenfolge Zuweisung einer Punktzahl an die einzelnen Verfahren (7 Punkte für den Spitzenreiter, 1 Punkt für das Schlußlicht).
-
S3: Schließlich wurden aus den in den Einzelexperimenten erzielten Punktzahlen die zu den im nächsten Abschnitt besprochenen Kategorien gehörenden Gesamtpunktzahlen der einzelnen Verfahren bestimmt und graphisch dargestellt.
2.1.2. Auswertung
-
Kategorie 1: Gesamtwertung Graustufenbilder Aus den zu den Graustufenbildern gehörenden 6 Testbildern (2 Vorlagen in jeweils 3 Kompressionsstufen, s. obige Tabelle) wurden die zu den einzelnen Verfahren gehörenden Gesamtpunktzahlen ermittelt und als Balkendiagramm aufgetragen (s. Abb. 1).
-
Kategorie 2: Spezifikation von Kategorie 1 nach Kompressionsraten Die in Abb. 1 dargestellten Gesamtpunktzahlen setzen sich aus den zu den 3 verlangten Kompressionsraten gehörenden Teilpunktzahlen zusammen. Diese Teilpunktzahlen sind in 3 weiteren Balkendiagrammen dargestellt, die Interessenten unter Subjektive Beurteilung von Standardbilder / Farbbilder finden können.
-
Kategorie 3: Gesamtwertung Farbbilder. Hier wurde genauso vorgegangen, wie bei den Graustufenbildern beschrieben. Zugrunde lagen hier 18 Testbilder (6 Vorlagen in jeweils 3 Kompressionsstufen, s. obige Tabelle). Die Gesamtpunktzahlen sind in Abb. 2 dargestellt.
-
Kategorie 4: Spezifikation von Kategorie 3 nach Kompressionsraten Die zu den 3 verlangten Kompressionsraten gehörenden Teilpunktzahlen sind in 3 weiteren Balkendiagrammen dargestellt, die Interessenten unter Subjektive Beurteilung von Standardbilder / Farbbilder finden können.
2.2. Objektive Bewertung bei Farb- und Graustufenbildern
2.2.1. Testprozedur
Die Messungen wurden für jedes der in 2.1.1 erwähnten 24 Bilder durchgeführt
und umfaßten im einzelnen:
-
O1: Bestimmung der PSNR-Abstandes der komprimierten Bilder zu den Originalen.
-
O2: Ermittlung der zur (De-)kompression benötigten Programmlaufzeiten.
-
O3: Ermittlung des benötigten Speicherbedarfs.
2.2.2. Auswertung
-
Zu O1: Die bei den einzelnen Messungen erzielten Ergebnisse wurden entsprechend den in 2.1.2 aufgeführten Kategorien aufaddiert und führten zu den Diagrammen in Abb. 3 und 4.
Die zu den jeweiligen Spezifikationen nach Kompressionsraten gehörenden Diagramme können unter Beurteilung der Verfahren bezüglich PSNR eingesehen werden.
-
Zu O2 und O3: Die hier ermittelten Werte wurden mit den entsprechenden Werten bei CR-, CT- und Satellitenbildern zusammengefaßt (s. 2.5, Abb. 9 und 10).
2.3. Zusammenfassende Bewertung bei Farb- und Graustufenbildern
Es fällt auf, daß bei den Graustufenbildern im oberen Bereich eine sichtbare Korrelation zwischen subjektiver Bewertung und objektiver Bewertung anhand des PSNR-Abstands besteht: Bei Abb. 1 und Abb. 3 schält sich dasselbe Spitzentrio heraus. Andererseits gilt dies im unteren Bereich nicht: Das nach PSNR-Maßstäben "schlechteste" Verfahren wurde subjektiv keineswegs als solches empfunden. Die gute Korrelation im oberen Bereich ist bei den Farbbildern nicht mehr so deutlich: Abb. 2 und Abb. 4 isolieren nur noch dasselbe Spitzenduo, das zudem mit dem "Farb-Spitzenduo" nicht identisch ist. Grundsätzlich bleibt aber festzuhalten, daß - sowohl bei den PSNR-Messungen als auch der objektiven Bewertung - die Schwankung bei der Gesamtbewertung unter den besten 6 der untersuchten Verfahren relativ gering ist. Dabei sind die Unterschiede in der subjektiven Bewertung etwas signifikanter, als bei der Bewertung anhand der PSNR-Messung. Dies wird insbesondere bei der Ausdifferenzierung der Diagramme nach Bildarten und Kompressionsraten deutlich (s. obige Webadresse) - ein Hinweis darauf, daß subjektives Empfinden und PSNR-Messung nicht vollständig korreliert sind.
2.4. Subjektive Bewertung bei CR- CT-Bildern
2.4.1. Testprozedur
Die Begutachtung der medizinischen Testbilder erfolgt unter diagnostischen Gesichtspunkten, die Kriterien der Bildverarbeitung wurden nicht berücksichtigt. Bei der Bestimmung einer qualitativen Reihenfolgen der Wettbewerbsbeiträge fanden nur die Bilder mit der höchsten Kompressionsstufe Verwendung. Angesicht der guten Qualität der komprimierten Bilder war es den Testpersonen nicht möglich bei niedrigen Kompressionsraten ein eindeutiges Ranking vorzunehmen. Die komprimierten Bilder wurden drei Radiologen zur Beurteilung vorgelegt. Unter der Variation des Kompressionsverfahrens legte jeder Gutachter eine eindeutige Reihenfolge unter den Bilder fest. Das beste Kompressionsergebnis wurde mit (1), das schlechteste Resultat mit (7) bewertet. Aufgrund der eingeschränkten Testmenge waren für diese Testprozedur 3*4*7=84 Experimente durchzuführen. Für die Versuche fanden die folgenden Testbilder Verwendung:
Testbild | Verlangte Kompressionsrate |
---|---|
Röntgenbild Thorax |
1:32 |
Röntgenbild Bein |
1:32 |
CT-Aufnahme Thorax |
1:16 |
CT-Aufnahmen Kopf |
1:16 |
2.4.2. Auswertung
In Analogie zu den in 2.1.2 beschriebenen Verfahren wurde die subjektive Bewertung vorgenommen. Unter der Variation der Kompressionsverfahren vergab jeder Gutachter die Noten (1) Gut – 7 (Schlecht) an die jeweiligen Testbilder. Die Addition der drei Benotungen ordnete jedem Verfahren bezüglich der vier Testbilder einen Wert zu. Je geringer dieser Wert, desto besser die subjektive Qualität des Bildes.
Die zu den verlangten Kompressionsraten gehörenden Teilwertungen können unter Subjektive Beurteilung der medizinischen Bilder abgerufen werden.
2.5. Objektive Bewertung bei CR- CT- und Satellitenbildern
Testprozedur und Auswertung erfolgten genauso, wie in 2.2.1 bzw. 2.2.2 für Farb- und Grauwertbilder beschrieben. Die PSNR-Gesamtwertungen sind in den Abbildungen 6-8 dargestellt.
Die zu den 3 verlangten Kompressionsraten gehörenden Teilwertungen können wieder unter Beurteilung der Verfahren bezüglich PSNR abgerufen werden.
Zu Speicherbedarf und Laufzeitverhalten:
Die zugehörigen Daten wurden mit den entsprechenden Werten bei Farb- und Graustufenbildern zusammengefaßt und sind in den Abbildungen 9 und 10 dargestellt.
3. Zusammenfassung
Die Ergebnisse dieser Untersuchung zeigen, daß offensichtlich die mit der Waveletkompression verknüpften Erwartungen mittlerweile erfüllt werden können: Die bei einem definierten Qualitätsanspruch erzielbaren Kompressionsraten übertreffen die Werte des JPEG-Standards bei weitem und dies bei vertretbarem Verhalten hinsichtlich Programmlaufzeit und Speicherbedarf. Die Tatsache, daß die besten 6 der 7 untersuchten Verfahren keine drastischen Qualitätsunterschiede aufweisen, weist weiterhin darauf hin, daß das zugrundeliegende Know-How (Waveletauswahl, Parametersetting, Codierverfahren,…) in der "Entwicklergemeinde" mittlerweile einen Stand erreicht hat, der Waveletmethoden im Hinblick auf die eingangs angesprochene JPEG-2000-Standardisierung eine solide Ausgangsposition verschafft. Ist man an einer möglichst breiten Anwendbarkeit der Kompessionstechnologie interessiert, so haben sich die Verfahren 1 und 3 als Spitzenreiter erwiesen: Bei der Zusammenfassung der Messungen über alle Bildarten und Kompressionsraten hinweg lieferten sie die besten Ergebnisse. Ein Vergleich mit den Abbildungen 11 und 12 zeigt, daß erfreulicherweise diese Verfahrensgüte nicht mit einem erhöhten Ressourcenaufwand einhergehen muß. Es sollte aber abschließend nochmals betont werden, daß die Unterschiede in den Leistungsdaten der besten 6 Verfahren nicht so gravierend sind, daß sie eindeutige "Sieger" oder "Verlierer" liefern: Differenziert man die Leistungsdaten nach Bildmaterial und Kompressionsraten (s. obige Abbildungen und die angegebene Webadresse), so zeigt sich, daß die Verfahren ihre spezifischen Stärken und Schwächen haben, die wohl an die Entstehungsgeschichte und die ursprünglichen Anforderungsprofile der jeweiligen Algorithmen gekoppelt sind.