Vysvětlení SMART hodnot

Ramtech

Vysvětlení SMART hodnot
« kdy: 03. 07. 2013, 16:20:21 »
Pred nedávnom tu bola diskusia vyhodnocovaní SMART hodnôt keďže ja sa v tom moc nevyznám poprosil by som miestnych guru aby sa k môjmu disku vyjdadrili
pri zakúpení
Kód: [Vybrat]
< ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
<   1 Raw_Read_Error_Rate     0x000f   100   100   006    Pre-fail  Always       -       16216
<   3 Spin_Up_Time            0x0003   099   099   000    Pre-fail  Always       -       0
<   4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       4
<   5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
<   7 Seek_Error_Rate         0x000f   100   253   030    Pre-fail  Always       -       138
<   9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       0
<  10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
<  12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       4
< 184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
< 187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
< 188 Command_Timeout         0x0032   100   253   000    Old_age   Always       -       0
< 189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
< 190 Airflow_Temperature_Cel 0x0022   074   074   045    Old_age   Always       -       26 (Min/Max 21/26)
< 191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
< 192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       4
< 193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       4
< 194 Temperature_Celsius     0x0022   026   040   000    Old_age   Always       -       26 (0 21 0 0 0)
< 197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
< 198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
< 199 UDMA_CRC_Error_Count    0x003e   200   253   000    Old_age   Always       -       0
--- po badblocks -svw
Kód: [Vybrat]
> ID# ATTRIBUTE_NAME          FLAGS    VALUE WORST THRESH FAIL RAW_VALUE
>   1 Raw_Read_Error_Rate     POSR--   117   100   006    -    137402416
>   3 Spin_Up_Time            PO----   099   099   000    -    0
>   4 Start_Stop_Count        -O--CK   100   100   020    -    4
>   5 Reallocated_Sector_Ct   PO--CK   100   100   010    -    0
>   7 Seek_Error_Rate         POSR--   100   253   030    -    10926
>   9 Power_On_Hours          -O--CK   100   100   000    -    17
>  10 Spin_Retry_Count        PO--C-   100   100   097    -    0
>  12 Power_Cycle_Count       -O--CK   100   100   020    -    4
> 184 End-to-End_Error        -O--CK   100   100   099    -    0
> 187 Reported_Uncorrect      -O--CK   100   100   000    -    0
> 188 Command_Timeout         -O--CK   100   100   000    -    0
> 189 High_Fly_Writes         -O-RCK   001   001   000    -    167
> 190 Airflow_Temperature_Cel -O---K   073   071   045    -    27 (Min/Max 21/29)
> 191 G-Sense_Error_Rate      -O--CK   100   100   000    -    0
> 192 Power-Off_Retract_Count -O--CK   100   100   000    -    4
> 193 Load_Cycle_Count        -O--CK   100   100   000    -    4
> 194 Temperature_Celsius     -O---K   027   040   000    -    27 (0 21 0 0 0)
> 197 Current_Pending_Sector  -O--C-   100   100   000    -    0
> 198 Offline_Uncorrectable   ----C-   100   100   000    -    0
« Poslední změna: 04. 07. 2013, 23:03:21 od Petr Krčmář »


Re:ako si vysvetliť SMART hodnoty
« Odpověď #1 kdy: 03. 07. 2013, 17:13:45 »
Moc mi to nedava smysl.  Raw_Read_Error_Rate po badblocks je 117, zatimco pred badblocks byla 100, a 117 je podle definice "lepsi hodnota", pritom tam je mnohem vic read errors nez predtim. Takze si to protireci. Nechapu :)

Honza

Re:ako si vysvetliť SMART hodnoty
« Odpověď #2 kdy: 03. 07. 2013, 17:43:48 »
Moc mi to nedava smysl.  Raw_Read_Error_Rate po badblocks je 117, zatimco pred badblocks byla 100, a 117 je podle definice "lepsi hodnota", pritom tam je mnohem vic read errors nez predtim. Takze si to protireci. Nechapu :)
to bude tím, že to je výsledná hodnota, resp. průměr, viz "Power on hours" 0 vs. 17

Dworkin

Re:ako si vysvetliť SMART hodnoty
« Odpověď #3 kdy: 03. 07. 2013, 18:39:58 »
01 read error rate je vendor specific, veľa sa z nej vyčítať nedá viď: http://en.wikipedia.org/wiki/S.M.A.R.T.
z mojich skúseností môžem povedať, že disk odchádza, keď začnú rásť hodnoty 05, C5 a C6

Jirka1

Re:ako si vysvetliť SMART hodnoty
« Odpověď #4 kdy: 03. 07. 2013, 20:03:47 »
Předpokládám, že ten disk je Seagate, tam hodnota Raw_Read_Error_Rate stále roste a nemá žádný význam. Naopak u WD bývá při bezproblémovém chodu nulová. Vzhledem k tomu, že hodnoty Reallocated_Sector_Count, Current_Pending_Sector_Count a Uncorrectable_Sector_Count jsou nulové, disk by měl být OK.


šarik

Re:ako si vysvetliť SMART hodnoty
« Odpověď #5 kdy: 03. 07. 2013, 21:45:16 »
Ano disk je OK podle zásadních parametrů. Teď. Doporučil bych do pozornosti, že prudce vzrostla hodnota High Fly Writes z nuly. Výklad příčin je různý, ale obecně je to informační hodnota, kterou je potřeba sledovat ve vztahu k ostatním hodnotám SMART. Tedy bych formuloval odpověď na tvoji otázku, že disk zatím nelze reklamovat.

Ramtech

Re:ako si vysvetliť SMART hodnoty
« Odpověď #6 kdy: 04. 07. 2013, 00:47:58 »
Pre porovnanie súčasný Samsung F1 podľa mňa už mu moc nechýba preto som kupoval nový Seagate

Kód: [Vybrat]
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   100   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   078   078   011    Pre-fail  Always       -       7550
  4 Start_Stop_Count        0x0032   099   099   000    Old_age   Always       -       1241
  5 Reallocated_Sector_Ct   0x0033   097   097   010    Pre-fail  Always       -       130
  7 Seek_Error_Rate         0x000f   100   100   051    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   015    Pre-fail  Offline      -       9914
  9 Power_On_Hours          0x0032   096   096   000    Old_age   Always       -       17803
 10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail  Always       -       0
 11 Calibration_Retry_Count 0x0012   100   100   000    Old_age   Always       -       1
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1198
 13 Read_Soft_Error_Rate    0x000e   100   100   000    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   099    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   076   063   000    Old_age   Always       -       24 (Min/Max 13/25)
194 Temperature_Celsius     0x0022   076   061   000    Old_age   Always       -       24 (Min/Max 13/26)
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       1617097
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x000a   099   098   000    Old_age   Always       -       1075
201 Soft_Read_Error_Rate    0x000a   100   100   000    Old_age   Always       -       0

Disk na ktorý som sa pýtal bol Seagate SV35 resp. st1000vx000

šarik

Re:ako si vysvetliť SMART hodnoty
« Odpověď #7 kdy: 04. 07. 2013, 13:29:31 »
Předpokládám, že zdroj je v okeju. Kdybys měl smart, když byl disk nový, mohl bys porovnat hodnotu 3 Spin up time. Disk má najetých 18 000 hodin, tak z toho by se dalo vyčíst, jak moc jsou vylágrované ložiska. Jestli RAW je v ms tak rozběh trvá 1,2 s tak to je v normě. Ještě vidím muchu na 11 Calibration... a to značí mechanické problémy. Ale chuj s tím, pokud to nevzniklo teď a neroste to. Po mechanické stránce stav disku odpovídá počtu hodin.
A jsme u klasiky hodnota 5 Reallocated sector count. Je tam přemapovaných 130 sektorů. A k ní je 200 Multi zone...což je problém se zápisy. Pro tyto hodnoty je důležité kdy vznikly, jestli přibývaly pozvolna/rychle nebo už delší čas nepřibývají. Pokud to bylo jednorázově a je klid, disk lze považovat za plně funkční, což neznamená, že tvrdím, že je spolehlivý. Nicméně je už potřeba tyto hodnoty pravidelně sledovat jestli přibývají a jak rychle. Toť výklad co ve smartu vidím, ale nečiním z toho jednoznačný závěr. Může fungovat ještě celá léta a nebo po pár hodinách může být po plotnách.
U mě by vzhledem k odkrouceným hodinám a už chycenému povrchu by byl poslán na odpočinek nebo postoupen méně majetnému zájemci.
Závěr už je na flame podle vkusu každého soudruha, zda disk dále používat nebo vyhodit.

CRaSH

Re:ako si vysvetliť SMART hodnoty
« Odpověď #8 kdy: 04. 07. 2013, 14:39:57 »
Já mám, na 2.5 palcovém HDD s 5400 otáčkami a s 22 tisíci hodinami na krku, spin-up time "jen" asi 1700 ms.

Spíše mne zaujal ten Multizone Error Rate. Jednak to znamená že údaj používají i Samsungy, jednak je tam napočítaná hodnota.

200 (C8) Write Error Rate / Multi-Zone Error Rate (Western Digital): Indicates the total number of errors appearing while recording data to a hard disk.

Čeho přesně se týká a co znamená ten parametr 195 (C3) Hardware ECC Recovered?

Ramtech

Re:ako si vysvetliť SMART hodnoty
« Odpověď #9 kdy: 04. 07. 2013, 17:30:37 »
Ten F1 Samsung je také kurvítko tie sektory tam vznikali postupne napr. journald mi ukázal že nejaká služba nenášla svoj konfigurák pritom ja som kľudne jeden vytvoril pomocou touch-u domnievam sa že ten sektor na ktorom bol sa "pokazil" a disk ho potom označil za vadný a služba potom nešla

šarik

Re:ako si vysvetliť SMART hodnoty
« Odpověď #10 kdy: 04. 07. 2013, 17:47:27 »
200 Multi zone....přesně se to týká nemožnosti zápisu do sektoru. Je to pomocná hodnota a obsah raw je daný na výrobci, takže vypovídací hodnota pro uživatele je jenom taková, že se něco děje. Samsungy jsem neměl v ruce, ale dá se předpokládat, že by tam měla být nula, pokud nezapisuje všechny pokusy jak opakované, tak neúspěšné.  Řekl bych odhadem, že bude vázaná na hodnotu 5 Reallocation sector a pokud ta se nemění, nemá tato hodnota zásadní význam.
193 Hardware ECC říká, že byl použit opravný ECC kód pro poškození dat. Zpravidla jako pomocná hodnota ukazuje na degradaci povrchu ploten.
Pro obyčejného uživatele, jak psal kolega výše, má zásadní význam akorát hodnota 5 Realokované sektory, 197 Pending sektory a kromě Seagatů 1 Raw read error rate a 196 Reallocated event count pro zkušenější.

šarik

Re:ako si vysvetliť SMART hodnoty
« Odpověď #11 kdy: 04. 07. 2013, 17:51:42 »
Ten F1 Samsung je také kurvítko tie sektory tam vznikali postupne napr. journald mi ukázal že nejaká služba nenášla svoj konfigurák pritom ja som kľudne jeden vytvoril pomocou touch-u domnievam sa že ten sektor na ktorom bol sa "pokazil" a disk ho potom označil za vadný a služba potom nešla
No jestli se chová takto, že ti ztrácí data, tak není vůbec co řešit a hned ho hoď na kompost za potok. A pokud vznikají postupně, tak duplom ven s ním.

šarik

Re:ako si vysvetliť SMART hodnoty
« Odpověď #12 kdy: 04. 07. 2013, 18:35:34 »
Ještě jsem se mrknul na tvýho Seagata http://extrahardware.cnews.cz/recenze/pevne-disky-seagate-sv35-konkurence-rude-edice-western-digital-test/strana/0/1 a vypadá to, že High fly wites nenulový je u Seagatů v pořádku.

Mrkev

Řadič z WD Passport s diskem Toshiba
« Odpověď #13 kdy: 09. 08. 2013, 17:42:40 »
Zdravím,

Potřeboval jsem teď narychlo připojit jeden 2,5" HDD (SATA III) k notebooku. Rozebral jsem WD Passport (nebo jak se to jmenuje, nikdy jsem nechápal ty jemné nuance v označení) a HDD připojil.

Drivery pro "WD řadič" se našly okamžitě (součást systému Windows). V systému je ale aktivní S.M.A.R.T. monitoring a ten nový disk našel a spustil alarm. Disk označuje za Western Digital, ale zbytek označení převzal správně, tak jak ho uvádí Toshiba. Jenže kromě divného označení označil disk (prakticky nepoužívaný - doteď sloužil jen na zálohy, celkem výkoný se kterým nebyly nikdy problémy) za disk se zdravím pouhých 42% a ještě hlásí chyby.

0x05 - Reallocated Sectors Count: 25 (Fail)
0x09 - Power-On Hours (POH):15 (OK)
0xC4 - Reallocation Event Count: 12 (Degradation)
0xC5 - Current Pending Sector Count: 3 (Degradation)

Hodnotu POH uvádím kvůli celkové představě. Měl jsem za to že číslo mělo být vyšší, protože disk už odpracoval více hodin, ale asi tomu tak není. Nebo se nezapočítává idle režim?. No teď mne to netrápí.

Otázka zní zda jsou ty chyby skutečné nebo jde o falešný poplach vzniklý jen připojením přes řadič (redukce SATA ???/USB2.0), který byl možná navržen jen pro specifický HDD (WD Scorpio Blue). Disk funguje (čtení, zápis), je nějaká šance na poškození disku Toshiba tímto řadičem?
Disk teď nemohu připojit (kvůli testu) do žádného počítače, jako interní disk. Externí řadič/rámeček od jiného výrobce teď nemám k dispozici.
Až budu mít k dispozici nový řadič (i-Tec MySafe Backup), chtěl jsem do něj (pro začátek a na zkoušku) nacpat právě zmíněný WD Scorpio Blue. Nebudou nějaké problémy?

Díky za reakci, zkušenost, objasnění, nasměrování, nakopnutí,...

Lol Phirae

Re:Vysvětlení SMART hodnot
« Odpověď #14 kdy: 09. 08. 2013, 18:02:16 »
Hodnoty jsou ulozene v disku a o chybu radice se rozhodne nejedna. Nic na to proboha nezalohuj a vyhod to!!!