Tak tar asi taky nemusi nacitat .tar celý celý - to by odporovalo jeho použití na páskách, ne? Ale nevím, zda to funguje s kompresí.
Je to přesně tak. Tar+komprese je vlastně solid archiv, proto i tar+gzip komprimoval vždy lépe, než samotný zip.
Rar, pokud se pamatuji, přišel se solid archivem a taky s archivací podle přípony (na dosu), čímž docílil toho, že podobné soubory se komprimovaly blízko sebe a tím docílil lepší komprese - něco tak na čtvrtině cesty mezi kompresí a kompresí s deduplikací.
Archivátor s vnitřní deduplikací neznám, ale docela by to mohlo být zajímavé, jen by asi bylo těžké určit velikost bloku pro deduplikaci. Malý blok = hodně režie. Velký blok = menší šance zásahu.