Vadné sektory na dvou HDD naráz

gwh

Vadné sektory na dvou HDD naráz
« kdy: 16. 05. 2013, 16:16:17 »
Zdravim.
Na serveri sa na 2 rovnakych diskoch (RAID1) vyskytli v jednom okamihu chyby - vadne sektory. Podozrivy je aj rovnaky pocet chyb. SMART long test zbehol na oboch v poriadku, dd-cko (iba citanie) tiez zbehlo bez chyb. Aj vzhladom na prvu chybu v logu typujem skor chybu inde ako v diskoch. Co mohlo byt pricinou (mam nejake podozrenia, ale... :) )?

syslog http://pastebin.com/4u7WkT2b
smart http://pastebin.com/LGiPasTG
smart http://pastebin.com/gvYEw9yM
« Poslední změna: 16. 05. 2013, 19:35:36 od Petr Krčmář »


kosta

Re:Vadne sektory na 2 HDD v jednom okamihu
« Odpověď #1 kdy: 16. 05. 2013, 16:58:35 »
jsou zarovnany oddily na sektory?
popr. by to moh delat sata kabel, ale to by asi nebylo na obou soucasne

gwh

Re:Vadne sektory na 2 HDD v jednom okamihu
« Odpověď #2 kdy: 16. 05. 2013, 17:11:32 »
tie disky su uplne rovnake, 1 particia a bezia uz 4 roky bez problemov. kable, to je jedna z moznosti, ale presne - na oboch naraz? a ak by to aj boli kable, co by naznacovala ta prva cast logu, nemalo by to predsa vplyv na vznik vadnych sektorov.

Jirka1

Re:Vadne sektory na 2 HDD v jednom okamihu
« Odpověď #3 kdy: 16. 05. 2013, 17:34:02 »
Ty disky ale moc stejně nevypadají. Podle smartreportu byl skutečný bad sector pouze na /dev/sde, kde Reallocated_Sector_Ct=1, na /dev/sdf je to 0. Stejně tak je zajímavé, když píšete, že jde o stejné disky, ale jeden má najeto 15432 hodin a druhý 35640. Takže asi je vadný jen jeden z disků a pole objevení se bad sectoru nevydýchalo.

Re:Vadne sektory na 2 HDD v jednom okamihu
« Odpověď #4 kdy: 16. 05. 2013, 17:43:03 »
Obecne je klidne mozne, ze disky maj problem oba. Zivotnost disku je jenom par let, jsou to mechanicke soucastky ktere se opotrebovavaji... Skoro se divim ze vydrzely 4 roky :)


gwh

Re:Vadne sektory na 2 HDD v jednom okamihu
« Odpověď #5 kdy: 16. 05. 2013, 18:02:49 »
je to tak. jeden disk bol ako nahradny a bol pouzity neskor. ano, iba jeden disk ma vadny 1 sektor, ale oba maju rovnaky pocet 12 Reported_Uncorrect sektorov (z mojich skusenosti to znamena skory odchod, alebo minimalne (dalsie) vadne sektory), co mi stale vrta hlavou. bojim sa, ci to nebude nahodou radic. ale podrobnejsi test diskov bude asi nevyhnutny.

Sten

Re:Vadne sektory na 2 HDD v jednom okamihu
« Odpověď #6 kdy: 16. 05. 2013, 18:06:51 »
Disky jsou v pohodě, nemají žádné vadné (uncorrectable ani pending) sektory. Jeden má jeden relocated sektor, ale to zřejmě nic neznamená, test žádnou vadu nenašel. Tipuju to na vadný či přehřátý řadič disků či northbridge, přesně takhle se to projevuje.

Jim

Re:Vadne sektory na 2 HDD v jednom okamihu
« Odpověď #7 kdy: 16. 05. 2013, 18:52:42 »
Sten + 1, řekl bych že je to jasný řadič.

gwh

Re:Vadné sektory na dvou HDD naráz
« Odpověď #8 kdy: 16. 05. 2013, 20:21:36 »
:( doska uz bola reklamovana (vypadok prudu a lacna UPS, ale nikomu nehovorte :) ) - nefungovali PS/2 porty. cuduj sa svete to opravili. server je skladacka a bezi bez problemov 4 roky. je v klimatizovanej miestnosti (cca 21-22 stupnov). sensory:
Kód: [Vybrat]
fan1:       3006 RPM  (min =    0 RPM)
fan2:       1212 RPM  (min =    0 RPM)
fan7:       1142 RPM  (min =    0 RPM)
temp1:       +27.0°C  (high = +100.0°C, hyst = +95.0°C)  sensor = Intel PECI
temp2:       +28.0°C  (high = +100.0°C, hyst = +95.0°C)  sensor = Intel PECI
temp5:       +40.0°C  (high = +100.0°C, hyst = +95.0°C)  sensor = thermistor
temp6:       +37.0°C  (high = +100.0°C, hyst = +95.0°C)  sensor = thermistor

teploty diskov 29-35 stupnov. nemohlo to by zdrojom? (asi sa obavam toho najhorsieho...)

Pavel Tisnovsky

Re:Vadné sektory na dvou HDD naráz
« Odpověď #9 kdy: 16. 05. 2013, 20:24:04 »
To vypada spis na soft chybu, muze to zpusobit napriklad vypadek napajeni, kdy disk nestaci vse zapsat ze sve cache. Popr. jak zminovali predrecnici taky radic muze blbnout, popr. se v dnesnich teplotach prehrivat.

Pavel Tisnovsky

Re:Vadné sektory na dvou HDD naráz
« Odpověď #10 kdy: 16. 05. 2013, 20:32:31 »
priklad soft chyby na mem disku (vypnuti ve spatnou chvili :-):

  5 Reallocated_Sector_Ct   0x0033   097   097   005    Pre-fail  Always       -       227
Error 44 occurred at disk power-on lifetime: 24327 hours (1013 days + 15 hours)
Error 43 occurred at disk power-on lifetime: 24327 hours (1013 days + 15 hours)
Error 42 occurred at disk power-on lifetime: 24327 hours (1013 days + 15 hours)
Error 41 occurred at disk power-on lifetime: 24327 hours (1013 days + 15 hours)
Error 40 occurred at disk power-on lifetime: 24327 hours (1013 days + 15 hours)

Ten disk od te doby bezi dalsi 3 roky :)

Sten

Re:Vadné sektory na dvou HDD naráz
« Odpověď #11 kdy: 16. 05. 2013, 20:36:42 »
:( doska uz bola reklamovana (vypadok prudu a lacna UPS, ale nikomu nehovorte :) ) - nefungovali PS/2 porty. cuduj sa svete to opravili. server je skladacka a bezi bez problemov 4 roky. je v klimatizovanej miestnosti (cca 21-22 stupnov). sensory:
Kód: [Vybrat]
fan1:       3006 RPM  (min =    0 RPM)
fan2:       1212 RPM  (min =    0 RPM)
fan7:       1142 RPM  (min =    0 RPM)
temp1:       +27.0°C  (high = +100.0°C, hyst = +95.0°C)  sensor = Intel PECI
temp2:       +28.0°C  (high = +100.0°C, hyst = +95.0°C)  sensor = Intel PECI
temp5:       +40.0°C  (high = +100.0°C, hyst = +95.0°C)  sensor = thermistor
temp6:       +37.0°C  (high = +100.0°C, hyst = +95.0°C)  sensor = thermistor

teploty diskov 29-35 stupnov. nemohlo to by zdrojom? (asi sa obavam toho najhorsieho...)

Je dost pravděpodobné, že to neodnesly jen ty PS/2 porty. Zdroj by to být taky mohl, obzvlášť jestli dostal zásah nebo nemá moc velkou rezervu výkonu.

gwh

Re:Vadné sektory na dvou HDD naráz
« Odpověď #12 kdy: 16. 05. 2013, 20:54:00 »
2Pavel: to by mohlo vysvetlit vznik chyb diskov

2Sten: tak som sa pozrel do evidencie. reklamacia bola pred rokom a pol a zdoj bol meneny pol roka pred tym - Seasonic M12II-520 Bronze - 2x XEON, 3x 8GB ram, 6x HDD - to by hadam mal utiahnut v pohode.

Jirka1

Re:Vadné sektory na dvou HDD naráz
« Odpověď #13 kdy: 16. 05. 2013, 21:03:27 »
Klidně to mohlo zblbnout tak, že se právě nově objevil bad sector na tom jednom disku, při jeho čtení / zápisu to hodilo I/O error a timeout, což řadič nepobral, dokud ho po čase driver nezresetoval.

Sten

Re:Vadné sektory na dvou HDD naráz
« Odpověď #14 kdy: 16. 05. 2013, 21:45:10 »
2Pavel: to by mohlo vysvetlit vznik chyb diskov

2Sten: tak som sa pozrel do evidencie. reklamacia bola pred rokom a pol a zdoj bol meneny pol roka pred tym - Seasonic M12II-520 Bronze - 2x XEON, 3x 8GB ram, 6x HDD - to by hadam mal utiahnut v pohode.

2 × Xeon může nárazově brát až 300 W (záleží na konkrétním typu)
6 × HDD může nárazově brát až 180 W
520 W je už potom dost na hraně. Výkon klesá jak s časem, tak i s teplotou. Není neobvyklé, aby 500 W zdroj při 40℃ dodával méně než 400 W.