Připojuju se k tomu, že s Bareos mám dobré zkušenosti, Bacula už dneska myslím nemá cenu. Každopádně je potřeba počítat s tím, že je to docela "velké řešení", není to úplně triviální správně nastavit, člověku docela trvá, než pochopí principy. Zvlášť když s "velkým zálohováním" nemá zkušenosti. I tak to ale imho za to stojí, je to hodně dobrý nástroj.
Za slabinu považuji to, že po rekonfiguraci neexistuje vždy možnost reloadu, aniž by spadly běžící joby. Opět, dá se s tím žít, ale pokud to uděláte uprostřed full zálohy, ta bude muset proběhnout znovu, ale data v datasetu už jsou, a budou čekat na exspiraci (také nedořešený stav).
Pokud člověk nemá systém takový, že mu tam střílí jedna full záloha za druhou, tak asi pravděpodobnost tohodle jevu bude docela malá (typicky třeba záloha běží třeba ve 4 v noci, já v tuhle dobu málo kdy upravuju konfiguraci

). A když už by se to mělo stát a měl by to být problém, dá se to ručně řešit - v závislosti na systému ukládání záloh různě. Já mám systém takový, že co job to volume, takže v téhle situaci by mi stačilo volume s tou nedokončenou zálohou ručně purge-ovat a když je nastavený "Action on purge = truncate", tak se i uvolní místo.
Se snapshoty to má více úskalí. Jak u VmWare tak u hyperV dochazí ke krátkému "pause" virtuálního stroje nebo disk IO operace se protahují na mnoho vteřin. Záleží co na těch virtuálech běží, normálně napsanému software by to nemělo vadit ale třeba průmyslové aplikaci využívající OPC komunikaci, nebo taková softwarová "perla" jako siemens simaticIT jsou na to docela citlivé a často v důsledku backupu VM padaly.
Pletou se tady dvě věci dohromady: snapshot virtuálního stroje (celého - i se stavem CPU a RAM) a snapshot úložiště. To první tenhle efekt bue mít asi vždycky (na různých hypervisorech různě vážný), to druhé nemusí.
Snapshot filesystemu zaridi jen konzistenci dat, aby jsi ten virtual nemusel vypinat. Samozrejme jen po dobu co pobezi kopirovani.
1. Snapshot nebo vypnuti virtualu
2. Rsync kompletniho virtualu
3. Smazani snapshotu, nebo spusteni virtualu
Snapshot nezařizuje konzistenci dat, ale to, že celý disk je jakoby uložen v jednom okamžiku. Je to jako bych běžící stroj vyrval ze zásuvky a poté zazálohoval disk. Takže "konzistentní" je to jenom ve fakt omezeném smyslu.
Bacha na to, že aplikací, které se po takové události nemusí nutně umět zotavit, je spousta. Nejrůznější aplikace si vytváří na disku nejrůznější zámky a při nalezení stale zámku se chovají různě. Zrovna nedávno se mi stalo, že jsem vůbec netušil, proč najednou spamassassin žere 100% CPU a nakonec se ukázalo, že to bylo právě přesně tímhle - nekorektní zastavení stroje a stale lock. Pochopitelně v logu žádná srozumitelná hláška, trvalo několik dní, než jsem objevil pravou příčinu. Takže bacha na to!
Blbý je, že se víceméně nedá nijak zjistit, jestli aplikace, které člověk provozuje, opravdu umí tuhle událost ustát - výrobce může tvrdit cokoli a nemusí to být ve všech případech pravda. Zkoušet to můžu tisíckrát a teprve po tisíceprvní se to projeví. Je to blbý prostě no
