Rozdělení dat z hlediska zálohování a vysoké dostupnosti

Doposud zálohujeme ve firmě úplně všechno, ale s tím jak data narůstají je potřeba změnit přístup. Moje myšlenka je rozdělit si data na několik řekněme tříd, A, B a C pro začátek, přičemž A byla data velmi důležitá a denně se modifikující s potřebou denního zálohování, B by byla data důležitá ale ne moc často se modifikující s potřebou zálohování např. jednou za týden a C byla data nedůležitá a nebo data dopočitatelná z A a B a ty by stačilo zálohovat jednou za měsíc.  Jak to děláte u vás? Nějaké tipy? Návrhy? Je ten můj model špatně? Jistě na to již někdo vymyslel, jen nevím jak to správně hledat ... děkuji.


Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
« Odpověď #1 kdy: 03. 06. 2021, 09:55:40 »
Doposud zálohujeme ve firmě úplně všechno, ale s tím jak data narůstají je potřeba změnit přístup. Moje myšlenka je rozdělit si data na několik řekněme tříd, A, B a C pro začátek, přičemž A byla data velmi důležitá a denně se modifikující s potřebou denního zálohování, B by byla data důležitá ale ne moc často se modifikující s potřebou zálohování např. jednou za týden a C byla data nedůležitá a nebo data dopočitatelná z A a B a ty by stačilo zálohovat jednou za měsíc.  Jak to děláte u vás? Nějaké tipy? Návrhy? Je ten můj model špatně? Jistě na to již někdo vymyslel, jen nevím jak to správně hledat ... děkuji.

Není to úplně to na co se ptáš, ale zkus hledat slovo deduplikace.
« Poslední změna: 03. 06. 2021, 09:57:25 od FKoudelka »

Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
« Odpověď #2 kdy: 03. 06. 2021, 10:04:45 »
Jinak to ani nejde. Něco se zálohuje 2x denně a něco jednou za měsíc. Z toho vyplývá i počet držených záloh.
« Poslední změna: 03. 06. 2021, 10:08:38 od kotelgg »

Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
« Odpověď #3 kdy: 03. 06. 2021, 10:07:13 »
Jinak to ani nejde. Něco se zálohuje 2x denně a něco jednou za měsíc. Z toho vyplývá i počet držených záloh.
Mě jde hlavně o to, zda mám takhle ty kategorie nějak správně, resp. co se používá "obecně" a jak se to většinou dělá jinde, jestli se používají nějaká jiná rozdělení, nějaká názvosloví zavedená atd. prostě abych nevymýšlel znovu kolo :-)

robac

  • ***
  • 125
    • Zobrazit profil
    • E-mail
Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
« Odpověď #4 kdy: 03. 06. 2021, 11:32:37 »
Jinak to ani nejde. Něco se zálohuje 2x denně a něco jednou za měsíc. Z toho vyplývá i počet držených záloh.
Mě jde hlavně o to, zda mám takhle ty kategorie nějak správně, resp. co se používá "obecně" a jak se to většinou dělá jinde, jestli se používají nějaká jiná rozdělení, nějaká názvosloví zavedená atd. prostě abych nevymýšlel znovu kolo :-)
Takže Vám jde pouze o terminologii?
Nějak jsem nikde nezaznamenal tu vysokou dostupnost.

Můj názor:
  • "B by byla data důležitá ale ne moc často se modifikující s potřebou zálohování např. jednou za týden" To, že se data nemodifikují často, nutně neznamená, že ta modifikace není kritická. Tudíž měřítkem není četnost modifikací dat, ale potřeba/nepotřeba obnovit co nejnovější data (případně data platná v nějakém čase). Případně, pokud se data skoro nemění, neprovádět zálohu periodicky, ale právě po změně dat.
  • "C byla data nedůležitá a nebo data dopočitatelná z A a B a ty by stačilo zálohovat jednou za měsíc" Nějak nevidím pointu v tom obnovovat měsíc stará data, když si můžu dopočítat data aktuálnější.
  • Deduplikace


Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
« Odpověď #5 kdy: 03. 06. 2021, 12:09:26 »
řešte spíš "inteligenci" zálohování.. Vaše rozdělení dat je obvykle chybné od uživatelů, ti sami nikdy neřeknou co je méně důležité atd.. a i když řeknou, při ztrátě C, stejně budou křičet..

Spočtete si na co máte kapacitu kde, nastavte plány a se stárnutím záloh "probírejte" - každý slušný backup sw to umí.. např. 24 hodin dozadu máte zálohu každé 4 hodiny (na sql i třeba více).. po týdnu se to promaže na 2x/den, po měsíci třeba na 1x týden.. po půl roce na 1x měsíc

možností je spoustu, ale "dělení dat" není dobrá cesta

Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
« Odpověď #6 kdy: 03. 06. 2021, 16:09:15 »
Pokud existuje nenulové riziko chybného zařazení dat do kategorie (něco kritického v kategorii C), tak to celé schéma automaticky invaliduje a nemáte zálohu. Cesta je v deduplikaci, případně rovnou tenkých snapshotech (btrfs/zfs).

S nástroji jako btrbk není problém mít offsite zálohu (mirror) s historií mnoha měsíců nebo i roků zpátky, navíc s možností promazávání a okamžitému přístupu k libovolnému souboru z libovolného zálohovaného okamžiku. Všechno prakticky bez overheadu (velikost zálohy je jen zanedbatelně vyšší než součet velikostí zápisů mezi snapshoty). U svých laptopů mám takhle zálohy 1-2 roky zpětně, počínaje desetiminutovými v posledních dvou dnech až po dvoudenní rok zpět.

Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
« Odpověď #7 kdy: 03. 06. 2021, 20:58:00 »
Možná by pomohlo říct, čím zálohujete

Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
« Odpověď #8 kdy: 03. 06. 2021, 22:54:54 »
Zálohuji Veeamem, ale to není důležité, systém se dá vyměnit ...

Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
« Odpověď #9 kdy: 04. 06. 2021, 10:32:04 »
Četnost lze řešit nastavením cyklů backupů (Inc/Diff/Full nebo třeba Inc only apod.). Ale jestli je problém celkový objem záloh, tak na to se mi osvědčilo nastavení různých retenčních politik.