Differenza tra GZIP e BZIP2

GZIP vs BZIP2

GNU zip (noto anche come GZIP) è un'applicazione software con lo scopo di comprimere i file. Originariamente era destinato a sostituire il programma di compressione usato nei primi sistemi Unix - da utilizzare nel Progetto GNU (un progetto di software libero).

BZIP2 è un algoritmo di compressione dei dati senza perdita open source, in pratica una classe di algoritmi di compressione dei dati che consente di ricostruire completamente i dati originali di un file compresso dai dati compressi.

GZIP si basa su un algoritmo noto come DEFLATE. Questo è anche un algoritmo di compressione dei dati senza perdita di dati. Utilizza sia l'algoritmo LZ77 che la codifica di Huffman. In sostanza, GZIP si riferisce al formato file con lo stesso nome. Questo formato è un'intestazione di 10 byte che contiene un numero magico (che indica un valore numerico o di testo che non cambia mai e viene utilizzato per indicare un formato o protocollo di file, un valore numerico senza nome che non cambia mai o valori distinti che non possono essere scambiati per qualsiasi altra cosa), intestazioni extra che possono o non possono essere effettivamente necessarie (nome del file originale, ad esempio), un corpo che contiene un carico utile compresso DEFLATE (che è il dato che portano le intestazioni) e un piè di pagina da 8 byte che contiene un checksum CRC-32, nonché la lunghezza effettiva dei dati non compressi originali.

Esistono varie tecniche di compressione utilizzate dal formato BZIP2, che sono sovrapposte l'una sull'altra in diversi livelli. Si verificano in un ordine molto particolare: codifica Run-length (che è una qualsiasi sequenza di simboli da 4 a 255 duplicati che viene sostituita dai primi quattro simboli e una lunghezza di codifica che si ripete tra 0 e 251), trasformazione di Burrows-Wheeler ( che è il blocco-ordinamento reversibile che costituisce l'essenza stessa del BZIP2), Sposta in primo piano (lascia inalterata la dimensione del blocco elaborato), Codifica run-length (che consiste in lunghi filamenti di simboli - solitamente zeri - che costantemente ripetere nell'output e sono sostituiti sia dal simbolo che da una sequenza di due codici), codifica Huffman (che è un processo che sostituisce i simboli a lunghezza fissa di byte a 8 bit con codici di lunghezza variabili), codifica Hoffman multipla (che consiste di più tabelle Hoffman di dimensioni identiche), codifica Unario di base 1, codifica Delta e array di bit sparsi.

Sommario:

1. GZIP è un'applicazione gratuita utilizzata per comprimere i file; BZIP2 è un algoritmo di compressione dei dati senza perdita open source che consente di recuperare i dati originali di un file compresso.

2. GZIP è costituito da un'intestazione da 10 byte, intestazioni opzionali, un corpo e un piè di pagina da 8 byte; BZIP2 consiste in non meno di nove livelli di tecniche di compressione.