Mieux compresser les
données
Un jour ou l'autre, nous sommes tous confrontés au problème du stockage des données. En dépit de la taille sans cesse accrue des disques durs, les fichiers qui ne sont pas utilisés fréquemment et qui sont destinés à être archivés pour une période plus ou moins longue doivent nécessairement être compressés. C'est évidemment le cas de la quasi-totalité des fichiers que nous téléchargeons sur le Net.
Pour Windows, on peut recenser quatre algorithmes de compression assez répandus : les fichiers ZIP, les fichiers RAR, les fameux fichiers CAB ("MS Cabinet File") et plus récemment les fichiers ACE. Bien entendu, on peut en citer d'autres (ARJ, LZH, CAB, GZ, TAR, ARC, ...) mais j'ai préféré retenir ces trois formats qui sont certainement devenus des standards universels.
Associés à ces quatre types de fichiers compressés, vous trouverez trois applications majeures qui permettent de les créer : WinZip (www.winzip.com), WinRar (www.rarsoft.com) et WinAce (www.winace.com). Là aussi, ces archiveurs ne sont pas les seules applications disponibles mais leur notoriété ne fait guère de doute. En outre, l'utilisation de ces applications est relativement simple, un clic droit suffisant le plus souvent à compresser et archiver un fichier.
Ceci étant dit, l'objet principal de cette section est d'attirer votre attention sur les performances de ces trois algorithmes. En effet, selon le type de fichier à compresser, vous obtiendrez des performances très disparates d'une application à une autre. Bref, avant de faire l'acquisition de l'une de ces applications, autant savoir laquelle offre les meilleures performances. Notez toutefois que si ces applications sont en principe capables d'ouvrir tous types de fichiers compressés, elles ne sont pas en revanche toutes capables de compresser des fichiers dans tous les formats voulus : Winzip, par exemple, est incapable de compresser un fichier au format ACE. WinAce peut quant à lui compresser indifféremment aux formats ACE, LHA, CAB et ZIP.
Pour les besoins du test, j'ai utilisé cinq types de données : les fichiers "Log" de mon serveur qui ne sont en fait que des fichiers textes (148Mo), des fichiers MP3 déjà extrêmement compressés, des fichiers de plugins Photoshop (extension 8BF), des fichiers images Windows bitmaps (BMP) et les principaux fichiers exécutables (EXE) d'Office 2000 (Word, Excel, FrontPage, Access, PowerPoint). Pour les applications, j'ai utilisé WinZip 7.0 SR1, WinRar 2.5 et WinAce 1.0. Dans tous les cas, j'ai choisi les options de compression maximale en utilisant le cas échéant les paramètres supplémentaires d'optimisation qu'offraient lesdites applications (WinRar et WinAce permettent en effet de traiter un ensemble de fichiers comme un seul fichier - "Solid Archive" - et de choisir la taille de la mémoire dévolue à l'opération - "Dictionnary"). Le tableau ci-dessous récapitule les résultats obtenus.
| Type | Taille | Fichier(s) | WinZip | WinRar | MS Cabinet | WinAce | Meilleur Taux |
| Log | 155.285.843 | 14 | 11.617.694 | 8.135.571 | erreurs | 9.277.404 | 94% |
| 8BF | 14.024.704 | 188 | 6.630.398 | 2.315.099 | 2.051.320 | 1.216.032 | 91% |
| MP3 | 11.594.385 | 3 | 11.320.920 | 11.312.700 | 11.270.242 | 11.341.976 | 2% |
| BMP | 63.209.528 | 64 | 46.685.232 | 44.112.012 | 42.364.777 | 44.844.372 | 29% |
| EXE | 26.587.412 | 5 | 14.109.329 | 12.972.864 | 11.317.944 | 13.109.428 | 51% |
On notera en premier lieu que WinZip affiche les plus mauvais scores. Mais il faut savoir en revanche que le temps de calcul est relativement élevé pour les autres compresseurs. WinRar est le plus lent d'entre eux et les disparités peuvent aller de 1 à plus de 5 minutes. Les fichiers CAB s'avèrent également être fortement compressés. Cependant, il m'a été impossible de compresser des fichiers LOG de grande taille. Pour un fichier de 4.8 Mo, le fichier CAB généré affiche une taille de 52Ko contre 47Ko pour WinAce.
Bien entendu, les fichiers qui sont eux-mêmes fortement compressés (MP3, JPG, etc.) ne permettent quasiment pas de compression accrue.
Pour conclure, ceux qui stockent des données, qui en archivent pour permettre leur téléchargement ou qui en échangent par d'autres voies, devraient retenir que s'il existe bien un format peu performant c'est bien le format ZIP.
Mis en ligne le 1er septembre 1999 / Dernière modification : 1-09-1999