100M rozdiel
Ten rozdíl nemusí být 100 MB, klidně to může být rozdíl jediného bajtu. Padding na konci posledního bloku to tedy klidně může udělat.
Neviem o tej db nic, ale je kludne mozne ze je tam cez povedzme 5M riadkov ktore su exportovane samostatne ako insert into a kazdy je samostatne zasifrovany. Je to uplne v poriadku vysledok.
Šifrovaný je celý zkomprimovaný soubor.
Myslim ze problem tu je ta db3 kde skoro 8gb db vyprodukuje ledva 2gb export. Na to sa skor OP pyta. A tam jedine ze je to zasifrovane a potom gzipovane, lenze potom preco db2 tiez nie je mensia/gzipnuta? Myslim ze to je ta zahada.
Nesmysl. Za prvé, je to vidět, že je to zkomprimované a pak zašifrované. Za druhé, kdyby to bylo zašifrované a zkomprimované, bude to plus mínus stejně velké. Proto se nikdy nekomprimují šifrovaná data, ale šifrují se komprimovaná data. Podstata šifrování je to, aby výstup připomínal co nejvíce náhodná data – a ta se nedají komprimovat.
Neviem aky ma ten export format vobec, kedze s pg nerobim, ale je kludne mozne ze pri istej velkosti(napr 2GB+) ten export robi nejaku optimalizaciu(dodatocna kompresia, ktoru si pri improte sam poriesi) a ide pravdepodobne len o vec nejake cli vlajky s ktorou je to mozne de/aktivovat.
Výstup je sekvence SQL příkazů, které vytvoří současný stav databáze. Tj.
CREATE,
INSERT apod. Proto to jde tak dobře komprimovat.
Každopdáně problém je zjevně v tom, že jsou data useknutá – a jde o to, zda to dělá aplikace nebo souborový systém. Může to být souborový systém, 2 GiB je limit na velikost souboru FAT16. Ale 2 GiB je zároveň velikost znaménkového
intu, takže to může být i problém aplikace.
Proto je potřeba jako první zjistit přesnou velikost souborů v bajtech – zda jsou opravdu oba dva stejně velké a odpovídají tomu 2
31.