Kontrola integrity dat na disku

Kontrola integrity dat na disku
« kdy: 23. 11. 2017, 22:51:06 »
Zdravím,

nastíním situaci: Řekněme, že mám na disku důležitá data. Samozřejmě pravidelně zálohuji na externí HDD. Pokud ale dojde ke poškození některých souboru, ke kterým nepřistupuji zrovna denně, nezjistím to. To znamená, že tyto soubory pak ještě mohu zazálohovat a nic nezjistím do té doby než je budu jednou potřebovat.

Šlo pouze o hypotézu. Nic takového se mi nestalo. Je vlastně možné, aby se data poškodila během uskladnění, když k nim zrovna nepřistupuji? O poškození souboru u ostatních uživatelů jsem něco četl - word soubor, který nelze otevřít nebo že v textovém souboru byl obsah nahrazen null znaky. Nemám důvod tomu nevěřit, jen nevím jak se to stalo - jestli při kopírování nebo tak. Něco jsem totiž četl o error correction coding.

Jedním řešením by bylo nasazení btrfs. Jestli jsem to dobře pochopil. Měl by v metadatech ukládat checksum souboru. Nicméně zatím ho nasazovat nechci... takže mě napadá vytvořit hash list a zkontrolovat ho před provedením zálohy. Trochu se to komplikuje tím, že musím zohledňovat soubory u kterých se změní mtime nebo změna jména.

Řešíte u sebe integritu dat - jestli ano, jak? Nebo si tu vymýšlím absolutní hovadiny? :D
« Poslední změna: 24. 11. 2017, 08:28:43 od Petr Krčmář »


rxgu

Re:kontrola integrity dat
« Odpověď #1 kdy: 23. 11. 2017, 23:15:40 »
Tak o hovadinu rozhodně nejde, za sebe to neřeším nijak. Ale sám jsem zvědavý, co tady ostatní napíšou.

Jenda

Re:kontrola integrity dat
« Odpověď #2 kdy: 23. 11. 2017, 23:25:56 »
Je vlastně možné, aby se data poškodila během uskladnění, když k nim zrovna nepřistupuji?

Ano, na disku se vytvoří vadný sektor a prostě jeden blok souboru nepůjde přečíst (disk vrátí chybu, takže o tom alespoň víš). Občas se to stává.

Další možnost poškození je silent data corruption, kdy disk vrátí jiná data a neřekne ti o tom. To se stává extrémně zřídka, ale u některých disků k tomu vlivem nějaké závady prostě dojde.

Další možnost pak je, že jsi zálohoval přes vadnou RAMku (vadná, rowhammer, …) a soubor se poškodil během přečtení z disku, přenosu po síti a zápisu na cílový disk.

Nejlepší je asi spočítat u všech souborů SHA256 a občas zkontrolovat. Další možností by bylo btrfs, ale tam byl minimálně na 4.7 bug, kdy scrub našel chyby v souborech, ale nenašel chyby v metadatech. Dále checksumy umí ZFS, s tím nemám žádné zkušenosti.

Kit

Re:kontrola integrity dat
« Odpověď #3 kdy: 23. 11. 2017, 23:47:39 »
Jednou z možností je zálohovat soubory verzováním. Pokud jsou data shodná, šetří se místo na zálohovacím disku. Pokud jsou jiná, zálohují se jako nová verze. Pokud dojde k poškození některého ze souborů, obnoví se z vhodné verze.

Git se na tento způsob zálohování moc nehodí, ale například rdiff-backup by mohl být vhodným kandidátem.

V neposlední řadě tu jsou služby typu Dropbox či Mega.nz. Zálohují automaticky a staré verze souborů si drží asi měsíc, než je smažou. Nehodí se však na často měněné soubory.

Z placených služeb se dá využít např. Amazon S3.

JardaP .

  • *****
  • 11 064
    • Zobrazit profil
    • E-mail
Re:kontrola integrity dat
« Odpověď #4 kdy: 23. 11. 2017, 23:54:13 »
Co takle pouzit stary dobry Tripwire s databazi na externim ulozisti ve dvou kopiich?


Re:kontrola integrity dat
« Odpověď #5 kdy: 23. 11. 2017, 23:56:02 »
Řekněme, že mám na disku důležitá data. Samozřejmě pravidelně zálohuji na externí HDD. Pokud ale dojde ke poškození některých souboru, ke kterým nepřistupuji zrovna denně, nezjistím to. To znamená, že tyto soubory pak ještě mohu zazálohovat a nic nezjistím do té doby než je budu jednou potřebovat.

Integritu živých dat může zajišťovat filesystem, např. ZFS má checksumy na každý blok a lze to považovat za plus minus bezpečné řešení.

Ale co si myslím, že Vám chybí je archivace dat. Tedy, ne jen záloha, ale posloupnost záloh v čase. Nejvhodnějším médiem pro archivaci jsou pak pásky (LTO), nebo RDX disky.

Kit

Re:kontrola integrity dat
« Odpověď #6 kdy: 24. 11. 2017, 00:47:05 »
Ale co si myslím, že Vám chybí je archivace dat. Tedy, ne jen záloha, ale posloupnost záloh v čase. Nejvhodnějším médiem pro archivaci jsou pak pásky (LTO), nebo RDX disky.

Myslím si, že pro domácí použití je to overkill a že DVD nebo BR poslouží také dobře.

Sada flešek se správným zálohovacím plánem takový úkol může zvládnout také.

Re:kontrola integrity dat
« Odpověď #7 kdy: 24. 11. 2017, 00:50:17 »
Myslím si, že pro domácí použití je to overkill a že DVD nebo BR poslouží také dobře.
Sada flešek se správným zálohovacím plánem takový úkol může zvládnout také.

Souhlas.

JardaP .

  • *****
  • 11 064
    • Zobrazit profil
    • E-mail
Re:kontrola integrity dat
« Odpověď #8 kdy: 24. 11. 2017, 01:13:26 »
Myslím si, že pro domácí použití je to overkill a že DVD nebo BR poslouží také dobře.

Pokud vam staci write only zalohy, tak ano.

Kit

Re:kontrola integrity dat
« Odpověď #9 kdy: 24. 11. 2017, 01:31:45 »
Myslím si, že pro domácí použití je to overkill a že DVD nebo BR poslouží také dobře.

Pokud vam staci write only zalohy, tak ano.

Tvůj návrh domácí archivace je ještě hloupější, takže se nevytahuj.

JardaP .

  • *****
  • 11 064
    • Zobrazit profil
    • E-mail
Re:kontrola integrity dat
« Odpověď #10 kdy: 24. 11. 2017, 01:54:34 »
Tvůj návrh domácí archivace je ještě hloupější, takže se nevytahuj.

Ktery navrh presne?

Kit

Re:kontrola integrity dat
« Odpověď #11 kdy: 24. 11. 2017, 02:21:05 »
Tvůj návrh domácí archivace je ještě hloupější, takže se nevytahuj.

Ktery navrh presne?

Ten, který jsi napsal v tomhle vlákně.

JardaP .

  • *****
  • 11 064
    • Zobrazit profil
    • E-mail
Re:kontrola integrity dat
« Odpověď #12 kdy: 24. 11. 2017, 11:02:53 »
Tvůj návrh domácí archivace je ještě hloupější, takže se nevytahuj.

Ktery navrh presne?

Ten, který jsi napsal v tomhle vlákně.

Aha. Ktery presne?

Kit

Re:kontrola integrity dat
« Odpověď #13 kdy: 24. 11. 2017, 11:16:17 »
Tvůj návrh domácí archivace je ještě hloupější, takže se nevytahuj.

Ktery navrh presne?

Ten, který jsi napsal v tomhle vlákně.

Aha. Ktery presne?

Přesně ten, kde nedoporučuješ žádnou archivaci a když už, tak write-only, což je evidentní hloupost.

JardaP .

  • *****
  • 11 064
    • Zobrazit profil
    • E-mail
Re:kontrola integrity dat
« Odpověď #14 kdy: 24. 11. 2017, 11:46:28 »
Přesně ten, kde nedoporučuješ žádnou archivaci a když už, tak write-only, což je evidentní hloupost.

Umis cist? Nikde nic takoveho nedoporucuji.