Różnica między GZIP i BZIP2

Różnica między GZIP i BZIP2

GZIP vs BZIP2

GNU Zip (znany również jako GZIP) to aplikacja z celem kompresji plików. Pierwotnie miał na celu zastąpienie programu kompresowego używanego we wczesnych systemach UNIX - do użycia w projekcie GNU (projekt wolnego oprogramowania).

BZIP2 jest algorytmem kompresji danych bezstratnych open source - w zasadzie klasa algorytmów kompresji danych, która umożliwia całkowicie zrekonstruowanie oryginalnych danych pliku skompresowanego.

GZIP opiera się na algorytmie znanym jako deflate. Jest to również bezstronny algorytm kompresji danych. Wykorzystuje zarówno algorytm LZ77, jak i kodowanie Huffmana. Zasadniczo GZIP odnosi się do formatu pliku o tej samej nazwie. Ten format jest 10-bajtowym nagłówkiem, który zawiera magiczną liczbę (co oznacza wartość numeryczną lub tekstową, która nigdy się nie zmienia i jest używana do oznaczenia formatu lub protokołu pliku, nienazwanej wartości numerycznej, która nigdy się nie zmienia, lub odrębne wartości, których nie można pomylić W przypadku wszystkiego innego), dodatkowe nagłówki, które mogą, ale nie muszą być konieczne (na przykład oryginalna nazwa pliku), ciało zawierające ładunek kompresowany z rozdzielczością (który jest danymi, które niosą nagłówki), oraz stopień 8 -bajtowy stopień która zawiera kontrolę kontrolną CRC-32, a także rzeczywistą długość oryginalnych nieskompresowanych danych.

Istnieje wiele technik kompresji, których stosuje format BZIP2, które są ułożone na siebie w kilku warstwach. Występują w bardzo charakterystycznej kolejności: kodowanie długości biegu (która jest dowolną sekwencją od czterech do 255 duplikatów, które są zastąpione przez pierwsze cztery symbole i długość kodowania, która powtarza się między 0 a 251), transformacja Burrows-Wheeler (( który jest odwracalnym sortem blokowym, który stanowi sam rdzeń BZIP2), przesuń się na przód (pozostawia rozmiar przetworzonego bloku niezmieniony), kodowanie długości biegów (które składa się z długich nici symboli - zwykle zerowych - które stale stale zerowe - które nieustannie Powtórz w wyjściu i są zastępowane zarówno symbolem, jak i sekwencją dwóch kodów), kodowanie Huffmana (który jest procesem zastępującym symbole o stałej długości 8-bitowych bajtów zmieniającymi się kodami długości), wielokrotnym kodowaniem Hoffmana (które składają się z kodowania Hoffmana (które składają się z kodowania Hoffmana (które składają się z Wiele tabel Hoffmana o identycznych rozmiarach), Unary Base 1 Kodowanie, kodowanie delta i rzadka tablica bitów.

Streszczenie:

1. GZIP to bezpłatna aplikacja używana do kompresji plików; BZIP2 jest algorytmem kompresji danych bezstratnych open source, który umożliwia pobranie oryginalnych danych pliku skompresowanego.

2. GZIP składa się z 10-bajtowego nagłówka, opcjonalnych nagłówków, ciała i stopki 8-bajtowej; BZIP2 składa się z nie mniej niż dziewięć warstw technik kompresji.