Nic dalsiho me nenapada.
Jak často zálohujete? Uchovává se jen poslední verze souboru, nebo potřebujete archivovat různé verze v čase?
Asi bych nejprve řešil hardware, aby vše, čím data procházejí, mělo podporu / zapnutý ECC. Nevím do jaké kapacity, ale i flash storage se vyrábějí s interním ECC.
Nespoléhal bych na jediný komprimační program, v něm může být chyba, včetně test funkce.
Doplnil bych před a po kompresi kontrolní součty, minimálně SHA-2, snad i SHA-3 apod. - prostě co bude při ruce.
Pokud by se jednalo o práci přímo pomalém disku (NFS apod.), zvážil bych ještě rozdělení do menších kousků (a poté aplikace všeho výše uvedeného).
Nemohl byste pro zajímavost vysvětlit, o co se jedná? Zní to tak tajuplně.
Diky za napady. To ze jeden komprimacni program muze mit chybu, vc. testu, to je take fakt. Aby zkontrolovany 7z nesel rozbalit, kdyz kontrola dopadne dobre, to se mi nestalo, ale muze to nastat. Nebo jakoze se to rozbali i zkontroluje OK, ale rozbaleny soubor uz je o neco jiny, i kdyz jmeno, velikost , cas a dalsi metadata sedi.
Zalohovat staci posledni verzi, zalohuji cca jednou za 2-6 mesicu dukladne na vsechna mista a jednou za 2-3 tydny na 2-3 mista. Ale uchovat si jednou za 1-2 roky verzi k danemu datu, to neni od veci, neni to ale potreba. Naprostou nutnosti je (aspon relativne) posledni verze. Kdyz by se napr. obnovit dala jen predposledni verze, tak se ztrati jen prace po obnovene zaloze.
Samotny soubor, ktery potrebuji zalohovat, je TC kontejner neco malo prez 20 GiB velky. A prave ta m kdyby v urcitych mistech byla chyba, mozna ho nikdy neoevru, tezko pujde opravit. A nektere jednotlive soubory primo v nem musi take byt naprosto bezchybne. Jestli TC ma nejakou kontrolu integrity disku, to si nejsem jisty. Kompresi se velikost souboru v tomto pripade nezmensi, jde ale zkontrolovat integrita-checksum (7z t file.7z).
Pouziti jineho komprimacniho programu, co kontrolu checksumu ma je urcite doby napad. Jaky by se mohl hodit ?
Co je uvnitr, tolik nechci rozvadet. Jedna se ale o urcity projekt, vyzkum vedecky a je tam i neco z informatiky. A vsechno kolem toho. Muze to mit slusne vysledky. Kazdopadne jsou v tom desetitisice, mozna az nad 100 000 hodin prace a i financne to stalo docela dost. Zasifrovane je to proto, aby nejaky potentat data neukradl a neobohatil se z cizi prace.
Jaky hardware na to potreba - servery na ruznych mistech jsou k dispozici a flashdisky, externi disky taky.