Fórum Root.cz

Hlavní témata => Server => Téma založeno: Michal Šiman 03. 06. 2021, 09:48:05

Název: Rozdělení dat z hlediska zálohování a vysoké dostupnosti
Přispěvatel: Michal Šiman 03. 06. 2021, 09:48:05
Doposud zálohujeme ve firmě úplně všechno, ale s tím jak data narůstají je potřeba změnit přístup. Moje myšlenka je rozdělit si data na několik řekněme tříd, A, B a C pro začátek, přičemž A byla data velmi důležitá a denně se modifikující s potřebou denního zálohování, B by byla data důležitá ale ne moc často se modifikující s potřebou zálohování např. jednou za týden a C byla data nedůležitá a nebo data dopočitatelná z A a B a ty by stačilo zálohovat jednou za měsíc.  Jak to děláte u vás? Nějaké tipy? Návrhy? Je ten můj model špatně? Jistě na to již někdo vymyslel, jen nevím jak to správně hledat ... děkuji.
Název: Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
Přispěvatel: FKoudelka 03. 06. 2021, 09:55:40
Doposud zálohujeme ve firmě úplně všechno, ale s tím jak data narůstají je potřeba změnit přístup. Moje myšlenka je rozdělit si data na několik řekněme tříd, A, B a C pro začátek, přičemž A byla data velmi důležitá a denně se modifikující s potřebou denního zálohování, B by byla data důležitá ale ne moc často se modifikující s potřebou zálohování např. jednou za týden a C byla data nedůležitá a nebo data dopočitatelná z A a B a ty by stačilo zálohovat jednou za měsíc.  Jak to děláte u vás? Nějaké tipy? Návrhy? Je ten můj model špatně? Jistě na to již někdo vymyslel, jen nevím jak to správně hledat ... děkuji.

Není to úplně to na co se ptáš, ale zkus hledat slovo deduplikace.
Název: Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
Přispěvatel: kotelgg 03. 06. 2021, 10:04:45
Jinak to ani nejde. Něco se zálohuje 2x denně a něco jednou za měsíc. Z toho vyplývá i počet držených záloh.
Název: Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
Přispěvatel: Michal Šiman 03. 06. 2021, 10:07:13
Jinak to ani nejde. Něco se zálohuje 2x denně a něco jednou za měsíc. Z toho vyplývá i počet držených záloh.
Mě jde hlavně o to, zda mám takhle ty kategorie nějak správně, resp. co se používá "obecně" a jak se to většinou dělá jinde, jestli se používají nějaká jiná rozdělení, nějaká názvosloví zavedená atd. prostě abych nevymýšlel znovu kolo :-)
Název: Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
Přispěvatel: robac 03. 06. 2021, 11:32:37
Jinak to ani nejde. Něco se zálohuje 2x denně a něco jednou za měsíc. Z toho vyplývá i počet držených záloh.
Mě jde hlavně o to, zda mám takhle ty kategorie nějak správně, resp. co se používá "obecně" a jak se to většinou dělá jinde, jestli se používají nějaká jiná rozdělení, nějaká názvosloví zavedená atd. prostě abych nevymýšlel znovu kolo :-)
Takže Vám jde pouze o terminologii?
Nějak jsem nikde nezaznamenal tu vysokou dostupnost.

Můj názor:
Název: Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
Přispěvatel: petrnovak134 03. 06. 2021, 12:09:26
řešte spíš "inteligenci" zálohování.. Vaše rozdělení dat je obvykle chybné od uživatelů, ti sami nikdy neřeknou co je méně důležité atd.. a i když řeknou, při ztrátě C, stejně budou křičet..

Spočtete si na co máte kapacitu kde, nastavte plány a se stárnutím záloh "probírejte" - každý slušný backup sw to umí.. např. 24 hodin dozadu máte zálohu každé 4 hodiny (na sql i třeba více).. po týdnu se to promaže na 2x/den, po měsíci třeba na 1x týden.. po půl roce na 1x měsíc

možností je spoustu, ale "dělení dat" není dobrá cesta
Název: Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
Přispěvatel: Jakub Štech 03. 06. 2021, 16:09:15
Pokud existuje nenulové riziko chybného zařazení dat do kategorie (něco kritického v kategorii C), tak to celé schéma automaticky invaliduje a nemáte zálohu. Cesta je v deduplikaci, případně rovnou tenkých snapshotech (btrfs/zfs).

S nástroji jako btrbk (https://digint.ch/btrbk/) není problém mít offsite zálohu (mirror) s historií mnoha měsíců nebo i roků zpátky, navíc s možností promazávání a okamžitému přístupu k libovolnému souboru z libovolného zálohovaného okamžiku. Všechno prakticky bez overheadu (velikost zálohy je jen zanedbatelně vyšší než součet velikostí zápisů mezi snapshoty). U svých laptopů mám takhle zálohy 1-2 roky zpětně, počínaje desetiminutovými v posledních dvou dnech až po dvoudenní rok zpět.
Název: Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
Přispěvatel: FKoudelka 03. 06. 2021, 20:58:00
Možná by pomohlo říct, čím zálohujete
Název: Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
Přispěvatel: Michal Šiman 03. 06. 2021, 22:54:54
Zálohuji Veeamem, ale to není důležité, systém se dá vyměnit ...
Název: Re:Rozdělení dat z hlediska zálohování a vysoké dostupnosti
Přispěvatel: lazywriter 04. 06. 2021, 10:32:04
Četnost lze řešit nastavením cyklů backupů (Inc/Diff/Full nebo třeba Inc only apod.). Ale jestli je problém celkový objem záloh, tak na to se mi osvědčilo nastavení různých retenčních politik.