Fórum Root.cz

Hlavní témata => Windows a jiné systémy => Téma založeno: Zash 01. 09. 2015, 12:27:42

Název: WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 01. 09. 2015, 12:27:42
Dobrý den,
začnu nastíněním situace: server Dell R520, RAID6 pole 15TB rozdělené do několika oddílů, win 2012 std. Nastavené dvě úlohy zálohování ve windows backup, jedna zálohuje systém a dva menší diskové oddíly, druhá zálohuje jeden diskový oddíl - ten největší. První úloha proběhne vždy bez problémů (3x týdně), druhá úloha proběhne vždy jen jednou a to při jejím prvním spuštění na zcela prázdný oddíl, pokud ji chci v týdnu spustit znovu, aby udělala přírůstky skončí náhodně po zazálohování kolem 300MB dat (jak kdy) a v logu se každých 30s opakuje chyba: Událost 129, vhdmp - Obnoveno do zařízení \Device\RaidPort3, vystaveno. Zálohování probíhá na NAS připojený pomocí iSCSI, gigová síť, dva oddíly, jeden pro každou úlohu.

Nevěděl by někdo kde by mohl být problém/jak ho vyřešit?

Děkuji za odpověď.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: JardaP . 01. 09. 2015, 12:53:15
Ze by http://blogs.msdn.com/b/ntdebugging/archive/2011/05/06/understanding-storage-timeouts-and-event-129-errors.aspx ? "The most common causes of the Event ID 129 errors are unresponsive LUNs or a dropped request."

Jinak priste zkuste Widle v anglictine, ty hlasky se lepe googluji a vymyslet presny preklad neni vzdy tak jednoduche, zejmena pak pri kvalite ceskych lokalizaci. Treba vam blbne jedna hlasitost.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 01. 09. 2015, 13:28:41
Díky, to jsem četl, nicméně tam nikde nevidím řešení nbeo si to nedokážu správně přeložit. Navíc, proč to u jedné úlohy proiběhne vždycky ok a druhá jen na čistej disk? Taky divný, ne?
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: JardaP . 01. 09. 2015, 13:35:46
Tak tady https://social.technet.microsoft.com/Forums/windows/en-US/975a312a-fd49-4db5-8a38-e3961ae0a1e9/event-129-vhdmp-during-backup-windows-2012-std?forum=windowsbackup se pise:

"
Question
Sign in to vote
0
Sign in to vote

Hi,

So if you separately backup each partition, only the third one will fail with the event 129 error?

From the article, there is a Time-out value (HKLM\System\CurrentControlSet\Services\Disk\TimeOutValue) which should longer than the time a backup is running. So please check if the issue occurs when the partition (or disk) is busy.

It is not recommended to edit the value so you may confirm with your storage vendor if it is OK to modify."

Tedy to vypada na editaci registry, kterou tentokrat nedoporucuje nejen Lael Ophir, ale i jini. Tak bych zagoogloval, jestli ten klic znamena opravdu to, co rikaji a jaka jsou doporuceni, jak s tim zachazet. Tedy je to zase MS pakarna.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: j 01. 09. 2015, 13:53:12
Díky, to jsem četl, nicméně tam nikde nevidím řešení nbeo si to nedokážu správně přeložit. Navíc, proč to u jedné úlohy proiběhne vždycky ok a druhá jen na čistej disk? Taky divný, ne?

To neni divny, zalohujes 100GB vs 15TB ... tzn cojavim 10 minut vs nekolik hodin. A tam ti proste nekde vznikne nejakej drop, kterej to ukonci. Nemluve o tom, ze pouzivat widlowsi zalohovani ... je samo o sobe jaksi nanic. Prave proto, ze to nic poradne neumi, a navic to jeste haze podobny hlasky.

=> resenim je poridit si zalohovaci SW treti strany. Je jich hromada, vybrat si muzes jak co do funcionality tak co do ceny (0-miliony).
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: JardaP . 01. 09. 2015, 14:50:10
No, mozna by stalo za to nahodit nejaky free soft, jako Bacula, ktera je snad zadara a zkusit, co to udela s tim. Ntbackup je dost strasny a je dobry tak na zalohu Widli samotnych, protoze umi system state, coz kazdy backup neumi.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 01. 09. 2015, 17:40:31

To neni divny, zalohujes 100GB vs 15TB ... tzn cojavim 10 minut vs nekolik hodin. A tam ti proste nekde vznikne nejakej drop, kterej to ukonci. Nemluve o tom, ze pouzivat widlowsi zalohovani ... je samo o sobe jaksi nanic. Prave proto, ze to nic poradne neumi, a navic to jeste haze podobny hlasky.

=> resenim je poridit si zalohovaci SW treti strany. Je jich hromada, vybrat si muzes jak co do funcionality tak co do ceny (0-miliony).

Zalohuju 1TB a 2TB a to 2TB zazalohuje vetšinou kolem 300MB a konec, to přece netrvá několik hodin + navíc na čistou partition to proběhne vždycky bez problémů, tak jakej je v tom rozdíl? :)
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: j 01. 09. 2015, 19:21:28
Zalohuju 1TB a 2TB a to 2TB zazalohuje vetšinou kolem 300MB a konec, to přece netrvá několik hodin + navíc na čistou partition to proběhne vždycky bez problémů, tak jakej je v tom rozdíl? :)

To se neptej me, to se ptej v M$.

Pro zalohovani potrebujes vedet kolik dat mas, jakej je jejich narust, a predevsim, kolik zmen generujes. To posledni je nejdulezitejsi udaj, podle toho se zalohovani defakto dimenzuje co do vykonu.

Proto se na zalohovani pouzivaj systemy, ktery backupujou jen zmeny, ovsem ne kazdej system to ve skutecnosti umi delat efektivne. Trebas zrovna ten widlobackup umi naprosto kulovy, a dost pravdepodobne ti driv nebo pozdejs neco nezalohuje, protoze jediny co pouziva je udaj nad souborem o case zmeny. Tzn, pokud mas trebas na tom disku databazi, bude se ti bud zalohovat pokazdy cela, nebo se nebude zalohovat vubec (a navic bude v obou pripadech nekonzistentni = stejny jako kdyz to vyrves z elektriky).

Navic potrebujes misto - potrebujes mit dost mista na to, aby bylo kam zapsat vsechny zmeny, ktery probehnou v ramci zalohovaciho okna - pro cely 2TB to je 6 hodin na gigovy siti. Obecne se da rict, ze 10% je kriticky minimum. Ale samo zalezi.

+ muzes mit nejakej dalsi HW/SW problem, widlobackup je sam o sobe extremne nepouzitelnej a nespolehlivej, nema zadny reportovani, zadny overeni zalohy ...

Rekne ti to aspon kolik toho chce do toho diffu naladovat? Nebo to proste nekde cestou uhnije? At si udelame predstavu o mnoztvi tech zmen. Je taky mozny, ze se ti to podela na nejakym locknutym souboru. Widle obecne neumej ani cist ... kdyz ma na sobe neco lock.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 02. 09. 2015, 08:32:19

To se neptej me, to se ptej v M$.

Pro zalohovani potrebujes vedet kolik dat mas, jakej je jejich narust, a predevsim, kolik zmen generujes. To posledni je nejdulezitejsi udaj, podle toho se zalohovani defakto dimenzuje co do vykonu.

Proto se na zalohovani pouzivaj systemy, ktery backupujou jen zmeny, ovsem ne kazdej system to ve skutecnosti umi delat efektivne. Trebas zrovna ten widlobackup umi naprosto kulovy, a dost pravdepodobne ti driv nebo pozdejs neco nezalohuje, protoze jediny co pouziva je udaj nad souborem o case zmeny. Tzn, pokud mas trebas na tom disku databazi, bude se ti bud zalohovat pokazdy cela, nebo se nebude zalohovat vubec (a navic bude v obou pripadech nekonzistentni = stejny jako kdyz to vyrves z elektriky).

Navic potrebujes misto - potrebujes mit dost mista na to, aby bylo kam zapsat vsechny zmeny, ktery probehnou v ramci zalohovaciho okna - pro cely 2TB to je 6 hodin na gigovy siti. Obecne se da rict, ze 10% je kriticky minimum. Ale samo zalezi.

+ muzes mit nejakej dalsi HW/SW problem, widlobackup je sam o sobe extremne nepouzitelnej a nespolehlivej, nema zadny reportovani, zadny overeni zalohy ...

Rekne ti to aspon kolik toho chce do toho diffu naladovat? Nebo to proste nekde cestou uhnije? At si udelame predstavu o mnoztvi tech zmen. Je taky mozny, ze se ti to podela na nejakym locknutym souboru. Widle obecne neumej ani cist ... kdyz ma na sobe neco lock.

A doporučil bys mi něco na widle, z vlastní zkušenosti myslím.

Jinak ten backup ukazuje kolik toho chce zálohovat.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Unknown 02. 09. 2015, 08:45:15

To se neptej me, to se ptej v M$.

Pro zalohovani potrebujes vedet kolik dat mas, jakej je jejich narust, a predevsim, kolik zmen generujes. To posledni je nejdulezitejsi udaj, podle toho se zalohovani defakto dimenzuje co do vykonu.

Proto se na zalohovani pouzivaj systemy, ktery backupujou jen zmeny, ovsem ne kazdej system to ve skutecnosti umi delat efektivne. Trebas zrovna ten widlobackup umi naprosto kulovy, a dost pravdepodobne ti driv nebo pozdejs neco nezalohuje, protoze jediny co pouziva je udaj nad souborem o case zmeny. Tzn, pokud mas trebas na tom disku databazi, bude se ti bud zalohovat pokazdy cela, nebo se nebude zalohovat vubec (a navic bude v obou pripadech nekonzistentni = stejny jako kdyz to vyrves z elektriky).

Navic potrebujes misto - potrebujes mit dost mista na to, aby bylo kam zapsat vsechny zmeny, ktery probehnou v ramci zalohovaciho okna - pro cely 2TB to je 6 hodin na gigovy siti. Obecne se da rict, ze 10% je kriticky minimum. Ale samo zalezi.

+ muzes mit nejakej dalsi HW/SW problem, widlobackup je sam o sobe extremne nepouzitelnej a nespolehlivej, nema zadny reportovani, zadny overeni zalohy ...

Rekne ti to aspon kolik toho chce do toho diffu naladovat? Nebo to proste nekde cestou uhnije? At si udelame predstavu o mnoztvi tech zmen. Je taky mozny, ze se ti to podela na nejakym locknutym souboru. Widle obecne neumej ani cist ... kdyz ma na sobe neco lock.

A doporučil bys mi něco na widle, z vlastní zkušenosti myslím.


Na zalohu te partition: xcopy
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 02. 09. 2015, 10:32:04

Na zalohu te partition: xcopy

Vypisuje to nejaky hlasky po uspesnym/neuspenym zalohovani, jak to zvlada prirustky, dokaze to samo prepisovat starsi soubory, kdyz uz bude disk, na kterej se zalohuje plnej? :)
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Screemy 02. 09. 2015, 11:45:29
A co tahle Acronis? :-)
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 02. 09. 2015, 12:01:25
A co tahle Acronis? :-)

Než začnu škemrat o peníze na soft, radši bych to zkusil vyřešit stávajícími prostředky :) Když to do háje dokáže udělat full backup na čistej disk,musí přece zvládnou i pitomý přírůstky, navíc když to na druhé partition funguje.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: blbecek 02. 09. 2015, 12:39:43
Ta bacula je na pomerny opensource prekvapive malo spatna. Dokonce na Windows umi shadow copy, cca 7-8 let zpatky jsem na ni zalohoval Exchange a MS SQL servery, slapalo to vyborne. Bacula si pres API rekne ze chce shadow copy, OS pres API rekne serverum at si udelaji flush na disky, ty to provedou, OS doda konzistentni verzi datovych souboru v shadowcopy zatimco aplikace muzou bez problemu bezet dal a vznikne pekna pouzitelna zaloha.

Je trochu hodinarska prace to konfigurovat a obsluhovat, ale kdyz to clovek pretrpi tak to funguje relativne dobre a samo.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Unknown 02. 09. 2015, 12:53:06

Na zalohu te partition: xcopy

Vypisuje to nejaky hlasky po uspesnym/neuspenym zalohovani, jak to zvlada prirustky, dokaze to samo prepisovat starsi soubory, kdyz uz bude disk, na kterej se zalohuje plnej?

Hlasky po neuspesnem kopirovani:      2>%logfile%

Prirustky: /D:m-d-r Kopíruje soubory změněné po zadaném datu. Není-li zadáno žádné datum, zkopíruje pouze
             soubory, u kterých je čas ve zdrojovém umístění novější než čas v cílovém umístění.

Zjisteni mista a prepis starsich zaloh je par radek scriptu...
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Lael.Ophir 03. 09. 2015, 00:30:16
Zkusil bych tohle:
http://blogs.technet.com/b/kevinholman/archive/2013/06/21/event-id-129-storachi-reset-to-device-device-raidport0-was-issued.aspx

Pokud to nepomůže, zkuste pohledat chyby v System Logu, případně v logu toho NASu. Samozřejmě můžete zkusit i nakopírovat data na ten NAS pomocí utility robocopy s paramerey /ndl /nfl. Pokud vyhodí nějaké hlášky, problém je zřejmě v lokálním disku, připojení k NASu, nebo v tom NASu.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 03. 09. 2015, 08:42:30
Zkusil bych tohle:
http://blogs.technet.com/b/kevinholman/archive/2013/06/21/event-id-129-storachi-reset-to-device-device-raidport0-was-issued.aspx

Pokud to nepomůže, zkuste pohledat chyby v System Logu, případně v logu toho NASu. Samozřejmě můžete zkusit i nakopírovat data na ten NAS pomocí utility robocopy s paramerey /ndl /nfl. Pokud vyhodí nějaké hlášky, problém je zřejmě v lokálním disku, připojení k NASu, nebo v tom NASu.

Diky, to jsem už zkoušel + rady z komentu, nepomohlo.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 08. 09. 2015, 08:09:32
Takze napad na vyreseni problemu nikdo nema, pouze nahradu za soucasne zalohovani?
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Ditys Cidae 08. 09. 2015, 09:30:50
Od verze serveru 2008 je možné používat program Windows Server Backup - dá se doinstalovat jako vlastnost (feature) serveru asi za 1 min. Ten provádí zálohování přes stínovou kopii, následující kopie je pak již rozdílová. Je to mnohem efektivnější, protože se zálohují pouze rozdíly v souborech, nikoli celé modifikované soubory. Navíc se celý diskový oddíl kopíruje jako jeden soubor, takže přenos po síti je asi 10x rychlejší.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Lol Phirae 08. 09. 2015, 10:23:58
A co tahle Acronis? :-)

Kristova noho! Jen to ne. To je na reinstalaci systému.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 09. 09. 2015, 12:22:41
Od verze serveru 2008 je možné používat program Windows Server Backup - dá se doinstalovat jako vlastnost (feature) serveru asi za 1 min. Ten provádí zálohování přes stínovou kopii, následující kopie je pak již rozdílová. Je to mnohem efektivnější, protože se zálohují pouze rozdíly v souborech, nikoli celé modifikované soubory. Navíc se celý diskový oddíl kopíruje jako jeden soubor, takže přenos po síti je asi 10x rychlejší.

Vzdyt o tom je tady celou dobu rec.. :D
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 09. 09. 2015, 12:23:16
A co tahle Acronis? :-)

Kristova noho! Jen to ne. To je na reinstalaci systému.

Co je spatnyho na Acronisu?
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Lol Phirae 09. 09. 2015, 14:44:21
Co je spatnyho na Acronisu?

Krom toho, že prakticky neopravitelným způsobem rozjebe systém (http://www.wilderssecurity.com/threads/beware-of-acronis-leftovers-issues.316447/), tak celkem nic. Každý rok vychází nová placená verze, staré se zásadně neopravují. Celkově opravdu vřele doporučuju.  ;D  ::)
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Petr 09. 09. 2015, 16:44:11
Ještě to může být síťový problém. Vzpomínám si, že jsem řešil náhodný pád aplikace posílající dlouhý souvislý stream dat, pomohlo nastavení velikosti tcp okna (muselo se zmenšit). Zkusil bych tcpdump nebo zálohu na lokální/usb disk.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 10. 09. 2015, 17:31:24
Ještě to může být síťový problém. Vzpomínám si, že jsem řešil náhodný pád aplikace posílající dlouhý souvislý stream dat, pomohlo nastavení velikosti tcp okna (muselo se zmenšit). Zkusil bych tcpdump nebo zálohu na lokální/usb disk.

Jo, to jsem si taky myslel i nekde cetl, tak sjem zkusil jinej port na switchi, jinej switch i druhou sitovku na qnapu, nic. Zkusim ten jeste ten usb disk.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 14. 09. 2015, 08:34:34
Hm, tak zalohovani na usb disk nepomohlo, chova se to uplne stejne, takze v siti problem nebude. Neco v systemu?
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Lael.Ophir 14. 09. 2015, 16:44:15
Hm, tak zalohovani na usb disk nepomohlo, chova se to uplne stejne, takze v siti problem nebude. Neco v systemu?
No vida, bude to lokální problém. Zkuste aktualizovat driver toho RAIDu, plus jeho firmware (a nejlépe i všechen ostatní firmware). Dell měl zjevně s firmwarem trochu problém, možná se to týkalo více modelů. Pokud to nepomůže, někdo doporučoval ještě další postup, vizte druhý link.
http://www.dell.com/support/home/us/en/19/Drivers/DriversDetails?driverId=CFP8C
http://en.community.dell.com/techcenter/extras/f/4475/t/19417113
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 15. 09. 2015, 08:07:23
Hm, tak zalohovani na usb disk nepomohlo, chova se to uplne stejne, takze v siti problem nebude. Neco v systemu?
No vida, bude to lokální problém. Zkuste aktualizovat driver toho RAIDu, plus jeho firmware (a nejlépe i všechen ostatní firmware). Dell měl zjevně s firmwarem trochu problém, možná se to týkalo více modelů. Pokud to nepomůže, někdo doporučoval ještě další postup, vizte druhý link.
http://www.dell.com/support/home/us/en/19/Drivers/DriversDetails?driverId=CFP8C
http://en.community.dell.com/techcenter/extras/f/4475/t/19417113


Diky, ale jakto, ze ta prvni zaloha probehne vzdycky? Zalohuje se na stejny NAS, ze stejneho raid pole. To nechapu. Prece kdyby to bylo ovladacema, tak nemuze fungovat ani to prvni, ne? Kdyz je to na stejnym HW i SW.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: JardaP . 15. 09. 2015, 09:24:50
Koukal jste se na to HKLM\System\CurrentControlSet\Services\Disk\TimeOutValue, jestli to existuje a co to doopravdy dela, pokud to neco vubec dela?
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 15. 09. 2015, 13:06:59
Koukal jste se na to HKLM\System\CurrentControlSet\Services\Disk\TimeOutValue, jestli to existuje a co to doopravdy dela, pokud to neco vubec dela?

V registru to je, ale nekoukal jsem, kdyz tam psal, ze se nedoporucuje to menit :)
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: JardaP . 15. 09. 2015, 14:09:02
Koukal jste se na to HKLM\System\CurrentControlSet\Services\Disk\TimeOutValue, jestli to existuje a co to doopravdy dela, pokud to neco vubec dela?

V registru to je, ale nekoukal jsem, kdyz tam psal, ze se nedoporucuje to menit :)

Jo, ale kdyz to stejne nefunguje, tak zkusim, co mam po ruce. Horsi to tezko muze byt a vzdycky to muzu nastavit zpatky. Doporuceni MS a dodavatelu backupu atd. je nekdy lepsi ignorovat.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 15. 09. 2015, 14:34:14
Koukal jste se na to HKLM\System\CurrentControlSet\Services\Disk\TimeOutValue, jestli to existuje a co to doopravdy dela, pokud to neco vubec dela?

V registru to je, ale nekoukal jsem, kdyz tam psal, ze se nedoporucuje to menit :)

Jo, ale kdyz to stejne nefunguje, tak zkusim, co mam po ruce. Horsi to tezko muze byt a vzdycky to muzu nastavit zpatky. Doporuceni MS a dodavatelu backupu atd. je nekdy lepsi ignorovat.

No jasne, ale to je nejaky globalni nastaveni jsem koukal, tak by to prece nefungovalo ani u toho prvniho zalohovani, kdyby to bylo v tomhle cisle
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: JardaP . 15. 09. 2015, 15:03:01
No jasne, ale to je nejaky globalni nastaveni jsem koukal, tak by to prece nefungovalo ani u toho prvniho zalohovani, kdyby to bylo v tomhle cisle

Ja to z popisu pochopil tak, ze se jedna o maximalni prijatelnou delku backupu. Pokud trva dele, vypadne to s chybou:

"From the article, there is a Time-out value (HKLM\System\CurrentControlSet\Services\Disk\TimeOutValue) which should longer than the time a backup is running."

Backup 1 je maly, hodnota tedy nepretece. Backup 2 je velky. Pri prvnim spusteni se sice zdari, ale to je kompletni backup, bere se to, jak to pada a jede to rychle, i kdyz je toho hodne. Pri dalsim spusteni se delaji prirustky, coz mozna znamena hafo hrabani po disku, coz se muze protahnout a hodnota pretece. Nevim, zjistil bych, c ten kic vlastne presne znamena a stopnul bych si, za jak dlouho mi to vypadne.

Jestli v tech datech mate nejakou obrovskou databazi, mozna byste ji mohl z te zalohy vyloucit a zalohovat ji extra ulohou, aby se videlo, jestli rozdeleni na dve extra ulohy neco zmeni.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Lael.Ophir 15. 09. 2015, 15:33:54
Diky, ale jakto, ze ta prvni zaloha probehne vzdycky? Zalohuje se na stejny NAS, ze stejneho raid pole. To nechapu. Prece kdyby to bylo ovladacema, tak nemuze fungovat ani to prvni, ne? Kdyz je to na stejnym HW i SW.

Na prvním místě z popisu v úvodu článku mi nebylo jasné, že jde o lokální problém. Ono je to vidět podle parametrů v tom eventu 129, což by mi došlo kdybych se na stroji podíval na Object Manager, ale takhle mi to uniklo :/

Event 129 nastává pokud driver detekuje, že zařízení neodpovědělo v timeout period. To může mít různé důvody:
- Bad block na zařízení. Pokud používáte RAID, tak by disky měly být RAIDové. Ty mají ve firmwaru nastaveno, že když se nepodaří data přečíst, tak to rychle vzdají (u některých disků to lze nastavit utilitou od výrobce). Naopak ne-RAIDové disky se zatraceně dlouho snaží data přečíst, a dojde na timeout. To nastavení timeoutu v Registry (psal o něm JardaP) musí být delší než doba po kterou se disk snaží přečíst data.
- Problém s připojením disku, kabely, v případě SAN (což není váš případ - problém se projevuje i bez SANu) spojení se SAN nebo závada na jeho straně.
- Problém s vlastním řadičem nebo driverem, který vede k tomu že zařízení z hlediska OS přestane odpovídat.

To že se problém projeví jen při té delší záloze může být způsobené například bad blockem na té části disku, kterou zálohujete. Chybu dost možná odchytí RAID controller, který nakonec dá data dohromady z paritních disků, takže ji v Event Logu nemusíte vidět. Nicméně by mohla být vidět v nějakém RAID manageru, který dodává výrobce HW.
Další možností je to že se RAID controller (nebo driver) čas od času sekne na něčem úplně jiném. Pokud to nastává jednou za X hodin, a nemáte většinu času I/O subsystém plně vytížený, tak se do toho vůbec nemusíte nestrefil. Při zálohování ale čtete co to jde po dlouhé hodiny, takže na to časem narazíte.

Ovšem prostý dotaz na site:dell.com event 129 ukazuje, že váš problém není úplně neobvyklý. Ten update firmware RAID controlleru má v popisu psáno, že když má systém víc než 8GB RAM, může se občas seknout a dojde na event 129. To nejspíš souvisí s implementací DMA, kde driver controlleru říká "načti z disku X bytů, ulož je do paměti na adresu Y", kde Y je buffer ze kterého se data dál zpracovávají (pokud je to obsah souboru bez komprese a šifrování, může to být rovnou buffer cílové aplikace). Vypadá to, že pokud je ten buffer výš než 8GB, tak to ten controller nerozdýchá (možná vždy, možná občas). To jestli se buffer dostane nad 8GB je víceméně náhodné, a určitě to souvisí s obsazenou paměti včetně cache, vytížením I/O subsystému atd. Klidně to může být až po pr hodinách silného vytížení I/O subsystému.

V druhém linku někdo popisuje, že u něj problém nastával díky tomu, že RAID controller občas testoval zbývající kapacitu baterky (prý dokonce non-stop). Ta se používá pro napájení paměti, do které se dočasně ukládají zápisy na zařízení. Controller zapíše data do baterií zálohované RAM, potvrdí že zápis na zařízení byl úspěšný, a aplikace může pokračovat v běhu. Controller pak na pozadí provede zápis na fyzický disk. Jednak to celou operaci urychlí (pokud není I/O subsystém plně vytížený), a pak to controlleru dává možnost si pořadí zápisů setřídit tak aby byly co nejrychlejší. Problém je v tom, že když vám vypadne proud mezi potvrzením zápisu (data máme jen v RAM controlleru) a jejich zápisem na disk, tak OS dostal potvrzeno že operace proběhla, ale data by byla ztracena. Proto je tam ta baterka, která tu RAM pár dní udrží napájenou. Když pak systém znovu zapnete, controller zapíše na disky co zbylo v jeho RAM z doby před výpadkem.
Kapacita té baterie je tedy celkem kritický údaj, a pochopitelně časem padá. Proto controller periodicky ověřuje, jakou kapacitu ta baterka ještě má. A tam můžou nastat hned dva problémy: 1. Může to být nesprávně implementované a controller může na nějakou dobu vytuhnout, a hlavně 2. to že se provádí test vybíjení baterie znamená nutnost přestat používat tu RAM controlleru a zapsat veškerý její obsah na disk (cca 128MB-2GB dat), což nějakou dobu trvá, a myslím že by to mohlo způsobit timeout. Samozřejmě to lze implementovat lépe, a obsah té RAM není nutné vysypat na disk najednou. Opět to může být jedna z věcí, kterou lze opravit ve firmware controlleru.
V linkovaném případu pomohlo vypnout a znovu zapnout cachování na RAID controlleru, a znovu nastavit čas kdy se baterka testuje.

Na vašem místě bych tedy aktualizoval driver RAIDu, jeho firmware, čistě pro jistotu i firmware zbývajících částí HW, a zkusil pomocí utility smcli to zakázání+povolení cache na controlleru plus nastavení doby kdy se testuje baterka (pokud možno na dobu kdy server nemá moc velkou zátěž).

Support information pro váš server, včetně downloadu firmwaru a driverů, je tady:
http://www.dell.com/support/home/us/en/19/product-support/product/poweredge-r520/research
Najdete tam i support articles, a jeden z nich zmiňuje možnost nastavit čas testování baterie v aplikaci OpenManage Server Administrator. Odkaz na utilitu smcli jsem nenašel, takže nevím jestli ji máte.
http://www.dell.com/Support/Article/us/en/19/SLN130018#Section_D
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Lael.Ophir 15. 09. 2015, 15:45:17
Ja to z popisu pochopil tak, ze se jedna o maximalni prijatelnou delku backupu. Pokud trva dele, vypadne to s chybou:
To nemá s vlastní délkou backupu nic společného. Jde o dobu, po kterou se čeká na dokončení SCSI Request Blocku. Pokud se operce nedokončí v této době, Storage Manager ji 8x opakuje, a pak teprve zahlásí timeout.
https://msdn.microsoft.com/en-us/library/windows/hardware/ff563970%28v=vs.85%29.aspx
https://technet.microsoft.com/en-us/library/aa997069(v=exchg.80).aspx
http://blogs.msdn.com/b/san/archive/2011/09/01/the-windows-disk-timeout-value-understanding-why-this-should-be-set-to-a-small-value.aspx
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 22. 09. 2015, 20:57:40
Lael.Ophir: Pro info, tak jsem vsechno aktualizoval a bum, porad to samy :D jeste zkusim zmenit ten cas v registrech, to jediny jsem nezkousel.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Lael.Ophir 22. 09. 2015, 21:23:47
Lael.Ophir: Pro info, tak jsem vsechno aktualizoval a bum, porad to samy :D jeste zkusim zmenit ten cas v registrech, to jediny jsem nezkousel.
To můžete zkusit, ale popsaný problém působí tak, že váš disk celých 80 sekund neodpovídá (8x ta hodnota v Registry). Pokud nepomohl update firmwaru (s důrazem na firmware RAIDu), doporučil bych nejprve diagnostiku RAID controlleru a disků. Diagnostické utility by měly být na servisní partition, případně jsou ke stažení ze stejných stránek jako firmware.

Mimochodem může být dobrý nápad kontaktovat support Dellu. Samozřejmě pokud nemáte otestovaný HW, tak to nemá smysl, protože to nejspíš bude jedno z prvních doporučení.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 23. 09. 2015, 07:27:27
Lael.Ophir: Pro info, tak jsem vsechno aktualizoval a bum, porad to samy :D jeste zkusim zmenit ten cas v registrech, to jediny jsem nezkousel.
To můžete zkusit, ale popsaný problém působí tak, že váš disk celých 80 sekund neodpovídá (8x ta hodnota v Registry). Pokud nepomohl update firmwaru (s důrazem na firmware RAIDu), doporučil bych nejprve diagnostiku RAID controlleru a disků. Diagnostické utility by měly být na servisní partition, případně jsou ke stažení ze stejných stránek jako firmware.

Mimochodem může být dobrý nápad kontaktovat support Dellu. Samozřejmě pokud nemáte otestovaný HW, tak to nemá smysl, protože to nejspíš bude jedno z prvních doporučení.


Nemyslim si, ze by to byl problem disku nebo controlleru, vsechno ostatni co se zazalohuje je na stejnych discich, na stejnem controlleru. Navic jak jsem rikal, zhavaruje pokus o prirustkove zalohovani, cili mnohem mene dat nez pri prvni zaloze a mnohem mene dat nez pri zalohovani sotatnich partition, ktere probehne vzdy, jsem z toho jelen.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: j 23. 09. 2015, 09:10:24
...

Co nechapes na tom, ze prohlem je naprosto v cemkoli, ale rozhodne ne ve widlich. V tech totiz nikdy zadnej problem neni.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 23. 09. 2015, 14:39:47
...

Co nechapes na tom, ze prohlem je naprosto v cemkoli, ale rozhodne ne ve widlich. V tech totiz nikdy zadnej problem neni.

Nikdo nerikal, ze to neni chyba windows..
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: ET 23. 09. 2015, 15:31:51
* jak dopadla zaloha na USB disk?
* konci (failuje) zalozha vzdy na stejnem miste/souboru?
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 23. 09. 2015, 15:37:23
* jak dopadla zaloha na USB disk?
* konci (failuje) zalozha vzdy na stejnem miste/souboru?

Zaloha na usb disk konci stejne jako na NAS, velikost prenesenych dat je ruzna, ale konci to na par stovkach MB.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Lael.Ophir 23. 09. 2015, 15:38:21
Nemyslim si, ze by to byl problem disku nebo controlleru, vsechno ostatni co se zazalohuje je na stejnych discich, na stejnem controlleru. Navic jak jsem rikal, zhavaruje pokus o prirustkove zalohovani, cili mnohem mene dat nez pri prvni zaloze a mnohem mene dat nez pri zalohovani sotatnich partition, ktere probehne vzdy, jsem z toho jelen.
Pokud by šlo o chybu disku, může se to projevovat jen při přístupu k určitým sektorům, a nemusí se to ani opakovat vždycky. Pokud disky nejsou určené pro RAID, nebo nejsou přepnuté v RAID módu, tak se disk bude snažit chybu opravit opakovaným čtením, a celý RAID vám může na nějakou dobu vytuhnout. Pokud by to trvalo víc než 80 sekund (což na desktopu při vadných sektorech na disku není výjimečné), vypadalo by to přesně jak jste popisoval. Takže bych ty disky zkontroloval. Controller sice asi bude OK, ale jeho test je krátký, proto bych s ním také neváhal.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 23. 09. 2015, 16:18:47
Nemyslim si, ze by to byl problem disku nebo controlleru, vsechno ostatni co se zazalohuje je na stejnych discich, na stejnem controlleru. Navic jak jsem rikal, zhavaruje pokus o prirustkove zalohovani, cili mnohem mene dat nez pri prvni zaloze a mnohem mene dat nez pri zalohovani sotatnich partition, ktere probehne vzdy, jsem z toho jelen.
Pokud by šlo o chybu disku, může se to projevovat jen při přístupu k určitým sektorům, a nemusí se to ani opakovat vždycky. Pokud disky nejsou určené pro RAID, nebo nejsou přepnuté v RAID módu, tak se disk bude snažit chybu opravit opakovaným čtením, a celý RAID vám může na nějakou dobu vytuhnout. Pokud by to trvalo víc než 80 sekund (což na desktopu při vadných sektorech na disku není výjimečné), vypadalo by to přesně jak jste popisoval. Takže bych ty disky zkontroloval. Controller sice asi bude OK, ale jeho test je krátký, proto bych s ním také neváhal.

Tak jsou tam Seagate Constellation ES.3. JInak koukam, ze test od Dellu chce restart, coz si ted par dni nemuzu dovolit. Bude stacit alespon nejakej surfecate test treba pres HDDscan?
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: j 23. 09. 2015, 18:06:21
Nemyslim si, ze by to byl problem disku nebo controlleru, vsechno ostatni co se zazalohuje je na stejnych discich, na stejnem controlleru. Navic jak jsem rikal, zhavaruje pokus o prirustkove zalohovani, cili mnohem mene dat nez pri prvni zaloze a mnohem mene dat nez pri zalohovani sotatnich partition, ktere probehne vzdy, jsem z toho jelen.
Pokud by šlo o chybu disku, může se to projevovat jen při přístupu k určitým sektorům, a nemusí se to ani opakovat vždycky. Pokud disky nejsou určené pro RAID, nebo nejsou přepnuté v RAID módu, tak se disk bude snažit chybu opravit opakovaným čtením, a celý RAID vám může na nějakou dobu vytuhnout. Pokud by to trvalo víc než 80 sekund (což na desktopu při vadných sektorech na disku není výjimečné), vypadalo by to přesně jak jste popisoval. Takže bych ty disky zkontroloval. Controller sice asi bude OK, ale jeho test je krátký, proto bych s ním také neváhal.

A tusis ty vubec jak funguje RAID? No jasne, jak bys moh, zejo ... pokud odpoved libovolnyho disku v poli presahne provozni meze, tak ho radic zcela automaticky z pole vyradi jako vadny. Aspon kazdy pricetny. V pripade realokace sektoru nebo dokonce badka je takovej disk dokonce na svepravnej radic nepripojitelnej, protoze ho do pole ani nejde pridat.

Pokud by to nedelal, tak by se totiz pole velmi brzo rozpadlo samovolne a naprosto nerizene.

Pricetny pole pak defakto nikdy nedojde do stavu kdy je degradovany, protoze problemovej disk vyrazuje driv, nez se znej stane vadnej disk, a data na nem jednoduse syncne na spare => pole se ani neprepocitava.
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Lael.Ophir 23. 09. 2015, 22:07:45
Tak jsou tam Seagate Constellation ES.3. JInak koukam, ze test od Dellu chce restart, coz si ted par dni nemuzu dovolit. Bude stacit alespon nejakej surfecate test treba pres HDDscan?
No to jsou RAIDové disky, takže by to mělo být bez problému. Jenže bohužel firmware mají i disky. Constellation ES.3 s firmwarem 0003 se údajně odpojí když jeho teplota dosáhne 40 stupňů. Normálně to bývá 60 stupňů, což je teplota kterou byste překročil jen pokud byste měl problém s chlazením (což samozřejmě také můžete prověřit). Zkuste pro začátek upgradovat firmware těch disků. Bohužel rebootu se u toho asi nevyhnete.
http://www.bigdatajunkie.com/index.php/10-hardware/19-seagate-constellation-es-3-firmware-0003
http://community.seagate.com/cso_community_zones?id=90630000000i1W3AAI
Název: Re:WindowsBackup - Event 129 během zálohování Windows 2012 Std
Přispěvatel: Zash 24. 09. 2015, 08:36:10
Tak jsou tam Seagate Constellation ES.3. JInak koukam, ze test od Dellu chce restart, coz si ted par dni nemuzu dovolit. Bude stacit alespon nejakej surfecate test treba pres HDDscan?
No to jsou RAIDové disky, takže by to mělo být bez problému. Jenže bohužel firmware mají i disky. Constellation ES.3 s firmwarem 0003 se údajně odpojí když jeho teplota dosáhne 40 stupňů. Normálně to bývá 60 stupňů, což je teplota kterou byste překročil jen pokud byste měl problém s chlazením (což samozřejmě také můžete prověřit). Zkuste pro začátek upgradovat firmware těch disků. Bohužel rebootu se u toho asi nevyhnete.
http://www.bigdatajunkie.com/index.php/10-hardware/19-seagate-constellation-es-3-firmware-0003
http://community.seagate.com/cso_community_zones?id=90630000000i1W3AAI

Wow, tak to je dobrej bug. Diky za tip, ale tohle to nebude, uz tam je ten opravenej firmware.