Nevím jestli jsem vás pochopil správně, ale HA řešení na Debianu jsem před pár dny zkoušel a nasadil.
HW:
první stroj: AMD X6, 8GB ram, chipset s iommu (byl to můj desktop který bude po zkušební době nahrazen identickým jako druhý stroj), 2x 1TB.
druhý stroj: AMD X4, 8GB ram, chipset i intergrovanou grafikou, 2x 1TB.
Stroje jsem měl propojené integrovanými síťovými kartami 1gb, + další síťová karta do místní sítě, disky v SW raid1 (mdadm), na poli lvm. Debian s XEN4.0 jako dom0 na obou, drbd synchronizuje vybrané lvm oddíly, dva vytvořené hosty domU (1x Debian(samba, ldap, mail, pgsql, mysql, apache, vše s minimální zátěží), 1x Windows 7 pro(mssql-skoro nevytížené + nějaké účetnictví)).
heartbeat hlídal spuštění virtualizovaných systémů, hlídá si že je puštěn jen jeden, když se jeden stroj vypíná tak se virtuály odmigrují automaticky na ten který zůstane běžet. migraci je možné dělat i ručně, trvá asi minutu(je nastaveno 1GB ram pro hosty) a po celou dobu migrace vše funguje
Zkušenosti:
cca 2 sekundy výpadek na konci migrace (nevrátí se 2x ping), když se kopíruje soubor přes sambu/windows tak ten prostě spadne, ale když jich kopíruju víc tak spadne jen ten jeden a dá se přeskočit a ostatní soubory pokračují, to je jediný výpadek který nastane (soubory které jsou otevřené zůstanou zamčené pro ostatní uživatele), vnc, putty a podobné další služby to ani nepoznali.
nejdůležitější je že se nesmí rozpojit ten vyhrazenej ethernet, jinak se rozpadne drbd synchronizace dat a je problém to dát dohromady, musí se zasáhnout ručně než se ten kabel obnoví, jinak dojde k poškození dat, protože heartbeat v tu chvíli spustí virtuální stroje na tom druhém železe protože si myslí že ten první HW spadnul a naopak. tohle nepřežije ani ext3/4 ani ntfs, jsou jiné systémy které by to možná přežili lépe, s těmito filesystémy je to na format...
byl bych opatrný v nasazení na fileserver, budu testovat vytíženější snad ještě letos, zatím nevím jestli je možné přes drbd provozovat i vytížený fileserver na xenu, zatím to příliš výkonné není, tipnul bych si že maximální výkon tohodle je cca 1/3 než kdyby to byl samostatný HW.
celé to je kritické na odezvu mezi drbd, takže teoreticky pořádné síťovky raid řadič s baterkou a pak se můžou zapnout cache (to je snad jediná věc která mi nefunguje = nečekat na zápis drbd na druhém HW)
Pepa