SMART: Raw_Read_Error_Rate půl milionu za 15 hodin

Pavouk106

  • *****
  • 2 358
    • Zobrazit profil
    • Můj blog
    • E-mail
SMART: Raw_Read_Error_Rate půl milionu za 15 hodin
« kdy: 19. 04. 2014, 18:21:20 »
Zdravím,

včera jsem dostal do ruky (po reklamaci) nový disk Seagate Pipeline (ST3000VM002-1F316N) a hned ho dal do PC a nechal na něj zrebuildit (md)RAID1. Ráno (po 15 hodinách od spuštění PC) jsem se podíval na SMART informace a dost mi vyrazily dech dva řádky: 1 a 7 (viz níže ve  výpisu).
Kód: [Vybrat]
  1 Raw_Read_Error_Rate     0x000f   100   100   006    Pre-fail  Always       -       458408
  3 Spin_Up_Time            0x0003   092   092   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       8
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   100   253   030    Pre-fail  Always       -       146946
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       15
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       8
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   090   090   000    Old_age   Always       -       10
190 Airflow_Temperature_Cel 0x0022   073   060   045    Old_age   Always       -       27 (Min/Max 25/27)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       7
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       8
194 Temperature_Celsius     0x0022   027   040   000    Old_age   Always       -       27 (0 23 0 0 0)
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

Je to normální stav? Podle informací na wikipedii tyhle dva parametry má každý výrobce nastavené podle sebe a jsou tedy irelevantní. Disk jsem vyhodil z RAIDu, odpojil a teď přemýšlím co dál...

Nejspíš napíšu na nějakou Seagate podporu, abych si to ověřil a pak případně opět reklamace (poprvé to bylo taky  den, kdy jsem disk donesl domů - dřely hlavy o plotny...).

Co vy na to říkáte?

Pro porovnání - v tom PC už 4 týdny běží 24/7 WD Green a ten má následující SMART (samozřejmě jsem mu vysvětlil, že hlavičky nemá parkovat každých "nesmyslně-málo-sekund", ale co nejvíc šlo nastavit...
Kód: [Vybrat]
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   175   175   021    Pre-fail  Always       -       6233
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       15
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       690
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       15
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       2
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       2330
194 Temperature_Celsius     0x0022   121   111   000    Old_age   Always       -       29
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0


P_V

  • ***
  • 227
    • Zobrazit profil
    • E-mail
Re:SMART: Raw_Read_Error_Rate půl milionu za 15 hodin
« Odpověď #1 kdy: 19. 04. 2014, 19:37:16 »
To je disk na video. Na data bych se ho bál dát, protože jednak data vůbec neopravuje (prioritou je stálý datový tok) a druhak video nejsou důležitá data, drobné výpadky se připouštějí, takže kdoví z jakého odpadu v továrně vybírali plotny. Ani ten WD Green nebude nejlepší volba do RAIDu, protože při chybě z něj brzy vypadne na timeout.

Lol Phirae

Re:SMART: Raw_Read_Error_Rate půl milionu za 15 hodin
« Odpověď #2 kdy: 19. 04. 2014, 19:44:26 »
Oba disky naprosto nevhodné do RAIDu. Osobně bych to nedal nikam.

Pavouk106

  • *****
  • 2 358
    • Zobrazit profil
    • Můj blog
    • E-mail
Re:SMART: Raw_Read_Error_Rate půl milionu za 15 hodin
« Odpověď #3 kdy: 19. 04. 2014, 19:53:23 »
Díky za názory.

A co říkáte na položku 1 a 7 u toho Seagate? Je to normalní? Nebo byste to zkusili reklamovat?

P_V: Seagate sám asi neví, kam to zařadit - 5900ot/min, "zelenej" (úspornej), nejlevnější z nabídky, prodává se jako vidoe/pvr typ...

P_V + Lol Phirae: Dva Greeny mi běží už tři roky v RAID1, nikdy žádnej problém.Tož asi tak.

Někdo něco k tématu?

Re:SMART: Raw_Read_Error_Rate půl milionu za 15 hodin
« Odpověď #4 kdy: 19. 04. 2014, 22:50:34 »
U Seagatu se na 1 a 7 vyignoruj. Jako jediní tam flákají všechny úspěšné i neúspěšné pokusy a opravy a vypovídací hodnota je h.....o. Srovnej u WD a ostatních. 1 a 7 je správně na 0, protože tam se to u všech mění jen když je opravdu neopravitelná krpa.
Takže u Seagatu u těchto hodnot můžeš akorát sledovat nikoliv RAW hodnoty, ale změnu těch tří Normalizovaná, Nejhorší a Prahová (přelož do angličtiny).
Tedy vidím zde Seagate zatím v okeju. ALE!!!.......máš problém tady: 189 High_Fly_Writes  je tam 10 a MUSÍ být 0 jako u ostatních výrobců. Značí to, že se hlava pohybovala mimo operační rozmezí (po našem lítá do pr***le). Způsobené  elektro(nicko)mechanickou vadou vystavování hlavy.
A ještě tady sledovat: 192 Power-Off_Retract_Count 2 toto znamená počet vypnutí nebo nouzových odstavení. Jo, nic to není, ale roste to po jednotkách jednou za uherský rok. Po roce a půl tam mám 25, takže o nic nejde.
Co s tím? V tento okamžik to na reklamaci není, to je zbytečné někam psát. Doporučuji, jestli je možnost ho dát do karantény, dát mu záhul=třískat  s hlavičkou od kraje ke kraji (to vy softwéráři dovedete) a sledovat hodnotu 189 High Fly.... jestli roste. Disk má problém s vystavováním hlaviček na stopu, což bych zahrnul do mechanických problémů typu vylágrovaný ložiska na nosiči ramínek hlav. Plotny, povrch, zápisy, realokace jsou v pořádku, takže data jsou v bezpečí, akorát se tou hlavičkou na ně trefit, že.....Ale zase mít v RAID 1, to jako v zrcadle, které má chránit před mechanickým selháním disku mechanicky pochybný disk jako už nový...Abys na to Jaromíre nedoplatil.


Trident

Re:SMART: Raw_Read_Error_Rate půl milionu za 15 hodin
« Odpověď #5 kdy: 20. 04. 2014, 20:23:44 »
U Seagatu se na 1 a 7 vyignoruj. Jako jediní tam flákají všechny úspěšné i neúspěšné pokusy a opravy a vypovídací hodnota je h.....o. Srovnej u WD a ostatních. 1 a 7 je správně na 0, protože tam se to u všech mění jen když je opravdu neopravitelná krpa.
Takže u Seagatu u těchto hodnot můžeš akorát sledovat nikoliv RAW hodnoty, ale změnu těch tří Normalizovaná, Nejhorší a Prahová (přelož do angličtiny).
Tedy vidím zde Seagate zatím v okeju. ALE!!!.......máš problém tady: 189 High_Fly_Writes  je tam 10 a MUSÍ být 0 jako u ostatních výrobců. Značí to, že se hlava pohybovala mimo operační rozmezí (po našem lítá do pr***le). Způsobené  elektro(nicko)mechanickou vadou vystavování hlavy.
A ještě tady sledovat: 192 Power-Off_Retract_Count 2 toto znamená počet vypnutí nebo nouzových odstavení. Jo, nic to není, ale roste to po jednotkách jednou za uherský rok. Po roce a půl tam mám 25, takže o nic nejde.
Co s tím? V tento okamžik to na reklamaci není, to je zbytečné někam psát. Doporučuji, jestli je možnost ho dát do karantény, dát mu záhul=třískat  s hlavičkou od kraje ke kraji (to vy softwéráři dovedete) a sledovat hodnotu 189 High Fly.... jestli roste. Disk má problém s vystavováním hlaviček na stopu, což bych zahrnul do mechanických problémů typu vylágrovaný ložiska na nosiči ramínek hlav. Plotny, povrch, zápisy, realokace jsou v pořádku, takže data jsou v bezpečí, akorát se tou hlavičkou na ně trefit, že.....Ale zase mít v RAID 1, to jako v zrcadle, které má chránit před mechanickým selháním disku mechanicky pochybný disk jako už nový...Abys na to Jaromíre nedoplatil.

Raw Error Rate - Je treba si uvedomit ze pri cteni i toho nepecliveji vyrobeneho disku dochazi k prirozene chybovosti. A v mnozstvi tech informaci to dela fakt hodne takze toho cisla si nevsimej. Cokoliv Raw*Error_Rate je hodnota ani ne informativniho charakteru. To je tak maximalne debug pro vyrobce.
Ber to jako takove hausnumero co ma kazdy vyrobce disku jine. U meho stareho WD  muze mit maximalni hodnotu 65535. Ale jedinym duvodem bylo to ze vyrobce nemel vetsi promenou nez 65535;)

High Fly Writes? Jses zdravy? Jak vis ze uzivatel disk mechanicky neovlivnuje? Tys u neho byl celou dobu? A muze se stat tak nevedomky. Otevrenim zasuvky na nabytku kde dany disk je, strcenim pri uklizeni, bouraci prace v byte;)  Clovek si ani nemusi vsimnout nebo si to spojit/

Staci do disku kopnout pri zapisu a nebo s nim trochu zahybat a uz tato hodnota poroste. Jedna se o to ze moderni disky maji ochranu proti spatnemu zapisu za nevhodnych mechanickych podminek. Disk pozna kdy hlava lita o neco vyse nez obvykle kvuli mechanickemu vychyleni a disk zapise pozdeji nebo jinam. Koneckoncu lepsi odlozeny zapis nez spatny zapis. Nemusi se vubec jedna to zavadu na disku.

A pozor na vibrace! Basy od audia a podobne. Pokud disk neni do takovych podminek vhodne uchycen tak vibrace jsou nejvetsi zabijak disku a high fly muze narustat.
Triskat hlavickou softwerari? Jako jsi normalni clovece? Pokud chces skutecne triskat hlavickou tak spust ve smartu long test a ver ze vyrobce implementoval random readtest tak ze s hlavickou uvnitr skutecne triska.
Ruznym softwarovym testum bych neveril pokud nevis jak funguji. Vem si ze jdes pres logiku disku ktera muze vysledky znacne zkreslit. Musis cist opravdu hodne dat. Myslet si ze staci precist blok na zacatku disku, uprostred a na konci jak si nekteri vyrobci testu mysli je opravdu s dnesni implementaci diskove cache na spotrebnich discich pitomy napad.Ta hlava se tak pohne na zacatku ale potom uz nikoliv. A ty nevis kde presne dana data jsou. Nemuzes proste rici ze se hlavicka vychyluje podle toho ktery blok na disku ctes. Ty nemuzes vubec vedet kam se hlavicka hybe. Nejses vyrobce abys jeji skutecny pohyb mohl sledovat. Disky maji zablokovane oblasti, oblasti vyrobnich chyb, jsou zonovany(jako rozkrajeny dort) a nad tim mas prekladovou vrstvu vyrobce. Co vyrobce to original.

Power_Off_Retract_Count - muze znamenat jen suspend,sleep nebo vypnuti. Informativni ale celkem uzitecna polozka. Disk sam o sobe nepozna zda-li doslo k nouzovemu odstaveni. Muze pouze brat v potaz ze OS provedl rizene odstaveni disku ale bral bych to s rezervou.

Re:SMART: Raw_Read_Error_Rate půl milionu za 15 hodin
« Odpověď #6 kdy: 20. 04. 2014, 21:45:50 »
>High Fly Writes? Jses zdravy? Jak vis ze uzivatel disk mechanicky neovlivnuje? Tys u neho byl celou dobu? A muze se stat tak nevedomky. Otevrenim zasuvky na nabytku kde dany disk je, strcenim pri uklizeni, bouraci prace v byte;)  Clovek si ani nemusi vsimnout nebo si to spojit/
Moc šplícháš rozumem. Toto co popisuješ se mi projevuje v hodnotě G-sensor rate a to disk je pevně na stole v AiO. Ale HFW mám stále na 0. Že bych o discích něco věděl?
>Triskat hlavickou softwerari? Jako jsi normalni clovece? Pokud chces skutecne triskat hlavickou tak spust ve smartu long test a ver ze vyrobce implementoval random readtest tak ze s hlavickou uvnitr skutecne triska.
>Vem si ze jdes pres logiku disku.......prekladovou vrstvu vyrobce.<
Měl jsem na mysli vlastnoručně napsaný test, případně pokud ho nemáš upytlačený od výrobce. Tak něajak to trochu znám z výroby. Kromě toho ti prozradím malé tajemství, ale výrobce všechny tyto vrstvy překvapivě!!! umí obejít a čte z disku co chce a hlavičku dostane kam chce. :-X
Děkuji za poučení z oblasti disků. To co tu píšeš, tak to u nás ve fabrice, která vyráběla diskové paměti už před 40 lety by líp popsala i uklízečka. Kurňa, jak jsme se mohli propracovat až k diskům typu Winchester, když vůbec jsme neměli šajnu jak disky fungují? ::)
Děkuji za optání. Zdravý jsem. A jak jsi na tom ty? ;D
Co tam máš dál?