Maly test 7z a paq8px. Jednalo se o skriptypro bash, gnuplot, tedy textove soubory, ve kterych je hodne podobnosti (fraze, cykly), i jednotlive soubory maji mezi sebou docela dost podobnosti. Zkouska jak komprimace slozky, tak TAR archivu. 7z i paq8px umi najit podobnosti mezi soubory, takze TAR spis kompresi zhorsi, nez zlepsi. Navic neni mozne tak jednoduse rozbalit z archivu jen vybrane soubory-slozky v pripade TAR. Velikost slovniku staci vetsi, nez velikost slozky o neco, tedy 24 MB u 7z. U paq8px vybrana uroven 5 (vyzaduje okolo 233 MB RAM).
Zdrojova data:
Folders: 4
Files: 117
Size: 13515147
Velikost TAR souboru 13639680 B
7z komprese:
7z a -t7z -m0=lzma -mx=9 -mfb=273 -md=24m -ms=on
paq8px komprese -5
7z archiv zkoprimovana slozka se soubory: 574129 B
7z archiv zkomprimovany TAR: 569895 B
paq8px archiv zkomprimovana slozka se soubory: 315310 B
paq8px archiv zkomprimovany TAR: 316448 B
Doba v pripade 7z okolo 20-30 s, v pripade paq8px okolo 3-4 hod (procesor ATOM).
paq8px napsal dobu komprese necelych 1000 s, ale bylo to mnohem delsi (mozna pocita primo procesorovy cas komprese).
Nejak se mi tam pripletla nula, paq8px je cca 300-500 pomajejsi nez 7z, nikoliv 3000-5000 krat.
7z archiv jde snadno zkontrolovat (7z t Archiv.7z), u paq8px je spolehlivost otazkou.
Asi by docela byla sranda komprimovat dataset Openstreetmaps (cca 800 GB, s 1024 slovnikem na I7 CPU okolo 9 dni), nebo Anglickou Wikipedii (neco okolo 60-70 GB tusim, 2 dny komprese 7z). Dobu paq8px radsi nechci videt. Kdovi jestli paq8px umi i multithreating.