Fórum Root.cz
Hlavní témata => Hardware => Téma založeno: Ferda 20. 02. 2018, 06:43:57
-
Asi rok mám tento 4TB disk a od začátku nebyl dokonalý, ale nyní s ním jsou velké problémy. Jsou na něm data, které sice nejsou zásadní a když na něj něco nakonec zapíši a zkontroluji (MD5), tak je vše O.K. Zápis se spustí svižně, ale posléze rychlost začne padat až na kB/s a většinou to skončí v nekonečnu, kdy pomůže jen restart systému. Během zápisu se enormně zvedne iowait
(https://image.ibb.co/cmbdTH/iowait.png)
ale ve výpisu iotop to vidět není. V fstab mám standard
ext4 defaults 0 2
a write cache na to nemá vliv, ale nepoužívám ji. Ve smartu taky nic není patrno
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 178 174 021 Pre-fail Always - 8066
4 Start_Stop_Count 0x0032 099 099 000 Old_age Always - 1259
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 089 089 000 Old_age Always - 8637
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 93
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 29
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 1229
194 Temperature_Celsius 0x0022 114 104 000 Old_age Always - 38
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline - 0
SMART Error Log Version: 1
No Errors Logged
a v logu jsem nic nenašel, kromě dlouhého vypínání z toho nekonečna
INFO: task jbd2/sdd1-8:702 blocked for more than 120 seconds.
seq 3785 '/devices/pci0000:00/0000:00:17.0/ata4/host4/target4:0:0/4:0:0:0/block/sdd' is taking a long time
seq 3785 '/devices/pci0000:00/0000:00:17.0/ata4/host4/target4:0:0/4:0:0:0/block/sdd' killed
Kabel jsem vyměnil, port jsem zkusil jiný. Mám obavu, že ten HDD je fyzicky vadný, ale budu muset sehnat jiný disk, na který ty data přenesu, abych ho mohl odpojit a testovat. Nic jiného mě nenapadá a nechci se dočkat, že jinde to bude bez problému. Strojek to není špatný (CPU i3-6100, RAM 16GB) a z jinými připojenými disky problém nemám.
-
Co chcete řešit?
Tři hodnoty ve SMART jsou ve stavu Pre-Fail.
Zvyšující se doba značí, že buďto zahřátím, nebo prostě tím, že zrovna najedete na vadnou oblast, disk relokuje vadné bloky jinam.
Neváhal bych, z tohoto disku musí data rychle pryč!
-
Realokovaný není žádný sektor, ani žádný sektor není zaznamenaný kvůli chybnému čtení, předzvěst může být vydedukovaná těmi záseky.
-
Tak není, tohle smart z 10.2.2017, kdy byl zapnutý úplně porpvé:
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 253 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 100 253 021 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 1
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 1
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 1
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 0
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 1
194 Temperature_Celsius 0x0022 118 118 000 Old_age Always - 34
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline - 0
SMART Error Log Version: 1
No Errors Logged
-
Osobně si myslím, že se disk loučí. Vykopírovat data a vyreklamovat. A příště si rozmyslet, zda disk určený na specifický typ provozu používat na něco jiného a raději nekoupit "normální".
-
ten "pre-fail" ve výpisu je typ nikoliv stav
ve výpisu S.M.A.R.T.u problém nevidím, ale v chování disku za provozu ano - rychle s datama na jinej disk a s hlubší diagnostikou na tento (ať je pokud možno nalezen reálný důvod, proč disk reklamovat...)
-
Před asi pěti lety jsem reklamoval jeden WD green 2,5TB, byl úplně nový a byl tak pomalý, že instalace OS trvala celý den. Boot OS pak trval několik hodin. Vyreklamován za nový, který slouží dodnes.
K popisu závady stačilo uvést, že disk je pomalý. V servisním protokolu pak bylo "Vadný disk. Všechno trvá straaaaaašně dlouho." :-)
-
udělej taky smartctl -t long, z výpisu je vidět, že jsi to ještě nikdy nedělal
no a spin-up time 8066 je dost, jestli smart náhodou nekecá, tak se disk blbě roztáčí? nemáš třeba málo napětí? nebo není slyšet, že se roztáčí na několikrát?
-
Nevím, kolik je běžná hodnota spin-up time, ale ostatní ve SMART je v pohodě. Nicméně se kloním k ostatním - vykopírovat data, testovat, reklamovat.
Jinak co se týče výběru disku - fakt je podle vás rozdíl mezi disky pro kamerové záznamy (tento), NAS (Red; 24/7), Blue, Black atd.? Kromě různých otáček dost pochybuju o tom, že se ty disky od sebe nějak více liší. Plotny budou nasázené všude stejné, hlavičky taky. Pak už zbývají jen otáčky a případně upravená elektronika. Purple (tento) prý umí lépe využívat mezipaměť. Takže těch 64MB cache má stačit na ty tuny videa, které kamery v bezpečnostních systémech denně generují? Hahaha... Tenhle disk by zjevně měl být stavěný právě na zápis/přepis. A to tenhle konkrétní kus zjevně dělá špatně.
Mimochodem - přinesl jsem před pár lety funglnový disk domů, připojil ho a slyšel zvuk (dle mého řekl bych zkušeného odhadu) dření hlaviček o plotny. Byl to úplně nový disk. Jindy mě zase zlobil 2.5", který se ale dle všeho tvářil v pořádku (asi jako v tomto případě). Dnes to není s disky zrovna hitparáda...
-
Nemá technologii SMR? V podstatě má disk sektory 256MB velké, které se musí zapat najednou a disk jako pomoc používá menší "cache" buĎ 10GB SSD SLC nebo 10GB normální NE-SMR (pak by mě ale zajímalo, jak je udělaná, že část je SMR a část ne) nebo že by to byla plotny 2 typů, ale to by disk prodražovalo.
-
Jinak co se týče výběru disku - fakt je podle vás rozdíl mezi disky pro kamerové záznamy (tento), NAS (Red; 24/7), Blue, Black atd.?
Taky by mě nenapadlo, že to může být rozdíl, ale A/V disky ze zkušenosti "běžný" (= ne stream) provoz obvykle dlouho neustojí a často odcházejí ještě v záruce.
Tuned for write-intensive, low bit-rate, high stream-count applications typical to most surveillance applications
-
Mám obavu, že ten HDD je fyzicky vadný, ale budu muset sehnat jiný disk, na který ty data přenesu, abych ho mohl odpojit a testovat.
Pokud tech dat mate jen jednu kopii, tak se pravdepodobne brzy presvedcite o tom, ze jedna kopii dat je obcas uplne to same, jako zadna kopie dat.
-
...
Pokud tech dat mate jen jednu kopii, tak se pravdepodobne brzy presvedcite o tom, ze jedna kopii dat je obcas uplne to same, jako zadna kopie dat.
Ty to dovedeš vždycky tak krásně napsat ;D
ByCzech: Já bych právě očekával, že menší záhul jim bude vadit míň a to jejich zaměření na tvrdej zápisovej výkon je vlastně bonus (oproti klasickýmu desktop HDD). Mám doma jeden Seagate Video (prý pro sekvenční zápisy a video streaming) a jede mi v pohodě už čtyři roky normálně jako desktop (resp. NAS použitý přes NFS jako /home). Ale hádat se nebudu, je možné, že takové disky můžou chcípat ještě v záruce. Pořád bych ale do desktopu koupil libovolný disk (dle poměru cena/kapacita). "Speciální" bych cíleně kupoval jen pro speciální využití (NAS, video, server).
-
Chlapi dík za podnětné připomínky. Sehnal jsem si 2TB, na tom 4TB je využito 2,4TB, tím pádem zbytek dám jinam.
Určitě je podle trubicoid2 ten spin-up time vysoký, otevřel jsem bednu a na 12V jsem naměřil 11,85V, při zápisu to klesalo na 11,82V. Je to trochu nižší, ale nic mimo mez. Při tom smartctl -t long mi to psalo o kontrole trvající 524 minut, což momentálně nejde kvůli kopírování. To je přes USB 3.0 rychlé cca 120 MB/s, takže i tak to potrvá, ale čtení vypadá O.K.
-
ByCzech: Já bych právě očekával, že menší záhul jim bude vadit míň a to jejich zaměření na tvrdej zápisovej výkon je vlastně bonus (oproti klasickýmu desktop HDD). Mám doma jeden Seagate Video (prý pro sekvenční zápisy a video streaming) a jede mi v pohodě už čtyři roky normálně jako desktop (resp. NAS použitý přes NFS jako /home). Ale hádat se nebudu, je možné, že takové disky můžou chcípat ještě v záruce. Pořád bych ale do desktopu koupil libovolný disk (dle poměru cena/kapacita). "Speciální" bych cíleně kupoval jen pro speciální využití (NAS, video, server).
Zdálo by se to logické, že podpora ATA streaming příkazů je bonus navíc, z praxe mám u zákazníků, co si nedali říct a chtěli ušetřit (vždyť ten disk je přece na provoz 24/7) zkušenost jinou. Seagate A/V disky odcházejí při tomhle použití úplně stejně jako jiné značky. A taky vím o pár kusech co vydržely cca 5 let bez problémů než byly vyměněny za vyšší kapacitu. Ale když ten disk strčíte do video-recordéru pro kamery, vydrží tam obvykle celou životnost nebo než se mění za něco modernějšího.
-
Chlapi dík za podnětné připomínky. Sehnal jsem si 2TB, na tom 4TB je využito 2,4TB, tím pádem zbytek dám jinam.
Určitě je podle trubicoid2 ten spin-up time vysoký, otevřel jsem bednu a na 12V jsem naměřil 11,85V, při zápisu to klesalo na 11,82V. Je to trochu nižší, ale nic mimo mez. Při tom smartctl -t long mi to psalo o kontrole trvající 524 minut, což momentálně nejde kvůli kopírování. To je přes USB 3.0 rychlé cca 120 MB/s, takže i tak to potrvá, ale čtení vypadá O.K.
Tak dejte vědět jak jste dopadl...
-
Jinak co se týče výběru disku - fakt je podle vás rozdíl mezi disky pro kamerové záznamy (tento), NAS (Red; 24/7), Blue, Black atd.?
Nevím jak ostatní varianty, ale u Red je prý upravený fw, tak aby dříve(oproti desktop diskům) hlásil chyby čtení/zápisu a místo vyhození celého disu z RAID se tak řeší jen chyba zápisu/čtení (TLER).
-
Jinak co se týče výběru disku - fakt je podle vás rozdíl mezi disky pro kamerové záznamy (tento), NAS (Red; 24/7), Blue, Black atd.?
Nevím jak ostatní varianty, ale u Red je prý upravený fw, tak aby dříve(oproti desktop diskům) hlásil chyby čtení/zápisu a místo vyhození celého disu z RAID se tak řeší jen chyba zápisu/čtení (TLER).
TLER tomu říká WD, jiní tomu říkají třeba CCTL. Obecně se tomu říká ERC (Error Recovery Control). Více např. viz https://en.wikipedia.org/wiki/Error_recovery_control
-
Podotkneme, ze disky WD casto nevychazeji ze statistik Backblaze zrovna nejlepe. Konkretne tento disk v nich nenachazim, ale jine 4 TB WD modely vychazeji nekde kolem prumeru. Tedy ne nejhorsi, ale take ne zadny zazrak,coz ale neznamena, ze tento model neni smejd nebo ze se nejedna o smejdskou serii. Treba tady: https://community.spiceworks.com/topic/2083672-3-out-of-4-western-digital-purple-drives-failed-in-2-years?page=2 jeden clovek tvrdi, ze ze ctyr tri musel vymenit, coz moc dobre nevypada.
-
Jakej máš MB ?
-
Určitě je podle trubicoid2 ten spin-up time vysoký, otevřel jsem bednu a na 12V jsem naměřil 11,85V, při zápisu to klesalo na 11,82V. Je to trochu nižší, ale nic mimo mez.
nejvíc to klesne hned po startu, když se disky roztáčí
možná stačí disk vytáhnout z napájení a znova zastrčit a změřit o kolik to poklesne
Při tom smartctl -t long mi to psalo o kontrole trvající 524 minut, což momentálně nejde kvůli kopírování.
jasně, to udělej po záloze, když ten smart test bude blbej, tak je to jasná známka pro reklamaci-vyhození
-
Nevím, kolik je běžná hodnota spin-up time, ale ostatní ve SMART je v pohodě....
taky přesně nevím, je dost možný, že si to každej výrobce dělá jinak
teď na starým seagate tam mám kupříkladu 0 a jeho disk po koupi tam měl taky 0
mám podezření, že nenulová vysoká hodnota je znakem problémů s rozjezdem-roztáčením
-
U WD je ta hodnota vždy nenulová, je to prostě čas na roztočení, jen je otázka, v čem přesně. U 1TB WD blue mám hodnotu raw=1117 a je to zcela normální, převedená je jako value=170. Pravda, ta naměřená je 8x vyšší, ale po převodu taky nijak problematická, daleko od varovné.
-
asi to u WD bude OK, u čtyř WD40EFRX mám Spin_Up_Time mezi 7566 a 7708
-
Tři hodnoty ve SMART jsou ve stavu Pre-Fail.
Blbý, blbější, Šilhavý... ::)
-
Pro ilustraci ohledně spin up mám např. u WD RED:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
3 Spin_Up_Time 0x0027 169 167 021 Pre-fail Always - 4550
u Toshiby:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
3 Spin_Up_Time 0x0007 148 148 024 Pre-fail Always - 242 (Average 271)
u starší Barracudy od Seagate:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
3 Spin_Up_Time 0x0003 098 096 000 Pre-fail Always - 0
-
Pro ilustraci ohledně spin up mám např. u WD RED:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
3 Spin_Up_Time 0x0027 169 167 021 Pre-fail Always - 4550
Přihodím do sbírky
WD Blue: 3875
WD RE: 3750