S.M.A.R.T na MegaRaid poli

ZAJDAN

  • *****
  • 2 078
    • Zobrazit profil
    • E-mail
S.M.A.R.T na MegaRaid poli
« kdy: 13. 06. 2018, 16:58:47 »
Ahoj...
mam HW raid 1 (MegaRaid) a při záloze LV snapshotu jsem zachytil výstup:
Kód: [Vybrat]
DESTROY all the LVM snaphots
  /dev/databases/sql-server_snapshot: read failed after 0 of 4096 at 118111535104: Input/output error
  /dev/databases/sql-server_snapshot: read failed after 0 of 4096 at 118111592448: Input/output error
  /dev/databases/sql-server_snapshot: read failed after 0 of 4096 at 0: Input/output error
  /dev/databases/sql-server_snapshot: read failed after 0 of 4096 at 4096: Input/output error

pustil jsem tedy smartclt na oba disky:
smartctl -a -d megaraid,6  /dev/sdb
Kód: [Vybrat]
Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:   424188540        0         0  424188540          0       1404.456           0
write:         0        0         0         0          0        612.763           0
verify: 2700427945        0         0  2700427945          0       2070.401           0

Non-medium error count:        2

smartctl -a -d megaraid,7  /dev/sdb
Kód: [Vybrat]
Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:   420704234        0         0  420704234          0       1532.549           0
write:         0        0         0         0          0        612.736           0
verify: 2155469642        0         0  2155469642          0       1897.588           0

Non-medium error count:        8

Non-medium error count - to míní chyby jiné než na mediu/plotně? ...tedy elektronika, komunikace s řadičem(kabel) ?

díky



Vesele, vesele do továrny dělník běží...vesele, vesele do továrny jde. Vesele se usmívá když mu soustruh zazpívá...vesele, vesele do továrny jde. Vesele si poskočí když se soustruh roztočí ...vesele, vesele do továrny jde.


ZAJDAN

  • *****
  • 2 078
    • Zobrazit profil
    • E-mail
Re:S.M.A.R.T na MegaRaid poli
« Odpověď #1 kdy: 13. 06. 2018, 17:24:53 »
pustil jsem na to ještě PATROL READ:
megacli -AdpPR -Start -aALL

jak to dojede tak se podivam na vystup:
megacli -AdpEventLog -GetSinceReboot -warning -fatal -aALL

možná se bude někomu hodit:
http://fibrevillage.com/storage/176-megaraid-patrol-read-detail
« Poslední změna: 13. 06. 2018, 17:28:36 od ZAJDAN »
Vesele, vesele do továrny dělník běží...vesele, vesele do továrny jde. Vesele se usmívá když mu soustruh zazpívá...vesele, vesele do továrny jde. Vesele si poskočí když se soustruh roztočí ...vesele, vesele do továrny jde.

Jose D

  • *****
  • 850
    • Zobrazit profil
Re:S.M.A.R.T na MegaRaid poli
« Odpověď #2 kdy: 13. 06. 2018, 20:30:09 »
mhmm na relativne cerstvym serveru mam:

Kód: [Vybrat]
=== START OF READ SMART DATA SECTION ===
SMART Health Status: OK
..
Kód: [Vybrat]
Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:   3849552949        4         0  3849552953          4      11801,563           0
write:         0        0         0         0          0       6361,595           0
verify: 1579853104        0         0  1579853104          0      18033,382           0

Non-medium error count:       37

na dalsim disku
Kód: [Vybrat]
Non-medium error count:      116
a jeste dalsim
Kód: [Vybrat]
Non-medium error count:       41
takže nejsem si jistý, co to znamená, ale beru to tak, že dokud raid ten disk nevykopne, tak se s tím nějak popasuje.