Komprese
Z MiS
(Rozdíly mezi verzemi)
(→Statické × dynamciké metody: Doplněny popisy metod.) |
(Přidán Model dat a příklad.) |
||
Řádka 1: | Řádka 1: | ||
[[Category:VSE]][[Category:Sítě]][[Category:Informatika]][[Category:Bezpečnost]][[Category:CRI]][[Category:Komprese]] | [[Category:VSE]][[Category:Sítě]][[Category:Informatika]][[Category:Bezpečnost]][[Category:CRI]][[Category:Komprese]] | ||
− | == Definice == | + | == Principy == |
+ | |||
+ | === Definice === | ||
* Kompresní metody: Postupy, vedoucí ke snížení objemu dat při zachování podstatné informace. | * Kompresní metody: Postupy, vedoucí ke snížení objemu dat při zachování podstatné informace. | ||
+ | |||
+ | === Model dat === | ||
+ | * Kompresi můžeme využít pouze tehdy, pokud umíme odlišit „podstatnou“ informaci od zbytku. | ||
+ | * Musíme tedy vědět nějaké další informace o datech, které komprimujeme. | ||
+ | * Pojem „model dat“ označuje souhrn pravidel, o kterých víme, že jsou v datech dodržena. | ||
+ | |||
+ | <div class="Priklad"> | ||
+ | ; Příklad — Chceme komprimovat posloupnost nul a jedniček | ||
+ | # Pokud o datech nic nevíme, pak: | ||
+ | #* nevíme, co z těchto dat můžeme „ztratit“, aniž bychom poškodili původní informaci. | ||
+ | #* Můžeme si ale všimnout, že se často opakují některé posloupnosti nul a jedniček a nahradit je jinými, kratšími posloupnostmi (za cenu toho, že jiné, málo se opakující, nahradíme delšími posloupnostmi). | ||
+ | #* Naším „modelem dat“ tedy bude pravděpodobnost výskytu jednotlivých posloupností. | ||
+ | #* ''(Pokud by však pravděpodobnosti výskytu jednotlivých posloupností byly stejné, komprese nám nic nepřinese.)'' | ||
+ | # Pokud bychom ale věděli, že naše posloupnost nul a jedniček nese informace o barvách pixelů na fotce... | ||
+ | #* pak víme, že tato data jsou již zatížena chybou při digitalizaci | ||
+ | #* a že na fotce nejspíš sousední pixely budou mít „podobné“ barvy. | ||
+ | #* Můžeme tak postavit mnohem přesnější model dat a vylepšit použitý kompresní algoritmus. | ||
+ | </div> | ||
Verze z 27. 3. 2017, 06:55
Obsah[skrýt] |
Principy
Definice
- Kompresní metody: Postupy, vedoucí ke snížení objemu dat při zachování podstatné informace.
Model dat
- Kompresi můžeme využít pouze tehdy, pokud umíme odlišit „podstatnou“ informaci od zbytku.
- Musíme tedy vědět nějaké další informace o datech, které komprimujeme.
- Pojem „model dat“ označuje souhrn pravidel, o kterých víme, že jsou v datech dodržena.
- Příklad — Chceme komprimovat posloupnost nul a jedniček
- Pokud o datech nic nevíme, pak:
- nevíme, co z těchto dat můžeme „ztratit“, aniž bychom poškodili původní informaci.
- Můžeme si ale všimnout, že se často opakují některé posloupnosti nul a jedniček a nahradit je jinými, kratšími posloupnostmi (za cenu toho, že jiné, málo se opakující, nahradíme delšími posloupnostmi).
- Naším „modelem dat“ tedy bude pravděpodobnost výskytu jednotlivých posloupností.
- (Pokud by však pravděpodobnosti výskytu jednotlivých posloupností byly stejné, komprese nám nic nepřinese.)
- Pokud bychom ale věděli, že naše posloupnost nul a jedniček nese informace o barvách pixelů na fotce...
- pak víme, že tato data jsou již zatížena chybou při digitalizaci
- a že na fotce nejspíš sousední pixely budou mít „podobné“ barvy.
- Můžeme tak postavit mnohem přesnější model dat a vylepšit použitý kompresní algoritmus.
Pojmy
- Kompresní poměr
- Poměr velikosti původních dat a velikosti zkomprimovaných dat.
- Závisí na konkrétních datech, která komprimujeme.
Kompresní poměr
- Pro bezeztrátovou kompresi a obecná data je typický kompresní poměr 2:1.
- Pro ztrátovou kompresi (obvykle obrázky, video atd.) je typický kompresní poměr cca 10:1.
- Entropie
- Množství podstatné informace obsažené v datech.
- Velikost dat při použití ideálního kompresního algoritmu bezeztrátové komprese.
Rozdělení kompresních metod
Ztrátové × bezeztrátové
- Ztrátové typicky u videa, audia, obrázků a dalších dat, která jsou již sama zatížena chybou.
- Ztrátové mohou docílit výrazně vyššího kompresního poměru za cenu dílčího poškození (zhoršení kvality) komprimovaných dat.
Statistické × slovníkové metody
- Statistické metody
- Nahrazují jednotlivé hodnoty symbolů posloupností bitů.
- Můžeme si představit třeba tabulku: E => 01, A => 100, T => 101,...
- Vychází z toho, že pravděpodobnost výskytu znaků se dá spočítat a není stejná.
- Pro běžná počítačová data malý kompresní poměr, jsou spíše součástí jiných metod.
- Slovníkové metody
- Nahrazují celé posloupnosti symbolů (slova) za posloupnosti bitů.
- Převodní tabulka je větší, ale můžeme docílit lepšího kompresního poměru.
- Do této skupiny patří většina běžně používaných metod.
Statické × dynamické metody
- Statické metody
- Po celou dobu komprese datového souboru se převodní tabulka nemění.
- Většinou se převodní tabulka musí přiložit k souboru.
- Často je třeba nejprve předzpracovat statistiku výskytu znaků.
- Dynamické metody
- Upravují převodní tabulku v průběhu komprese.
Příklady metod
- LZ 77
- Používá kompresní program ZIP a odvozené.
- Bezeztrátová slovníková metoda
- Autoři Lempel a Ziv, Izrael, 1977.
- LZ 78
- Tvoří základ algoritmů programů RAR a GZIP
- Autoři Lempel a Ziv, Izrael, 1978.