Fórum Root.cz
Hlavní témata => Hardware => Téma založeno: Honza1Ubuntu 10. 10. 2019, 12:12:16
-
Systemovy disk s Ubuntu (2 partition na jednom disku - Ubuntu a mensi partition s Windows) mi najednou spadl v prubehu behu programu do read-only, neslo tedy udela zadne zme. Restartoval jsem notas, ale ubuntu mi nabehlo do busy-boxu, ve kterem nejde nic. Tak jsem nabehnul Ubuntu z USB flashky, kouknul se na internetu, co stim.
Dal jsem badblocks -sv
. Naslo mi to chybnych bloku (240/0/0). Dohledal jsem reseni editovat nano /etc/fstab
. U systemoveho oddilu UUID=XXXX / ext4 errors=remount-ro 0 1
jsem zmenil na UUID=XXXX / ext4 defaults 0 1
. Zkousel jsem nabehnout Ubuntu z disku a zase to spadlo do Busy-boxu. Tak jsem zase nabehnul Ubuntu z flashky a dal fsck /dev/sda5 -y -v
. Opravilo to nekolik chyb a Ubuntu z disku nabehlo normalne, i v nem slo pracovat, radsi jsem moc nepokousel.
Znovu jsem zkontroloval disk badblocks -sv
a naslo mi to chybnych bloku (52/0/0). Mensi partition s Windows je bez vadnych bloku, je ale malo pouzivana. fsck /dev/sda5 -y -v
(jde jen z USB disku po nabootovani) uz chyby nenasel. Programem Disc jsem spustil self-test a skoncilo to na SELF-TEST FAILED, kratka varianta. Dlouha varianta bezela, naslo to par desitek vadnych sektoru. napsalo to Disk OK porad.
-
Na to je děsně jednoduchá odpověď: pokud je disk vadný, okamžitě vyměnit.
Jediné, co musíte ověřit je, jestli není vadný řadič nebo kabel - to se nejjednodušeji udělá v jiném PC.
Pokud se najde jakákoliv chyba, patří do stoupy.
-
Dejte sem vypis ze smartctl -A /dev/sdX, tim jak badblocks meni svuj nazor tak bych mu neveril :-)
-
tim jak badblocks meni svuj nazor tak bych mu neveril :-)
a neni to tak ze kdyz badblock najde bad block, tak se FW disku pokusi sektor realokovat na zalozni, a zvysi pocet realocated_sector_counts v smartctl, pokud tedy uz zalozni bloky nedosly?
-
a neni to tak ze kdyz badblock najde bad block, tak se FW disku pokusi sektor realokovat na zalozni, a zvysi pocet realocated_sector_counts v smartctl, pokud tedy uz zalozni bloky nedosly?
Přesně tak. Toto jsou obvykle výsledky relokace, jestli se povede / nepovede. To může být odvislé mj. od kvality napájení, datového kabelu, nebo i provozní teploty.
Kdyby smartctl ukázal, že je disk v háji, je na vyhození určite.
Pokud smartctl neukáže chyby, pak stejně nezbyde, než disk vyzkoušet v jiném PC.
-
Vypis smartctl -A /dev/sda5:
smartctl -A /dev/sda5
smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.13.0-46-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 1481
2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0
3 Spin_Up_Time 0x0023 092 085 025 Pre-fail Always - 2501
4 Start_Stop_Count 0x0032 095 095 000 Old_age Always - 5271
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0
8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 10678
10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 624
12 Power_Cycle_Count 0x0032 095 095 000 Old_age Always - 5397
191 G-Sense_Error_Rate 0x0022 100 100 000 Old_age Always - 2704
192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0
194 Temperature_Celsius 0x0002 064 052 000 Old_age Always - 32 (Min/Max 2/48)
195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0
196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 17
198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0036 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 3005
223 Load_Retry_Count 0x0032 100 100 000 Old_age Always - 624
225 Load_Cycle_Count 0x0032 097 097 000 Old_age Always - 37082
Smart data and Self test - Utilita na Disc, Short test skoncil SELF-TEST FAILED. Extended test nasel v prubehu par desitek vadnych sektoru, a pak to skoncilo stejne: SELF-TEST FAILED.Verze testu Conveyance neni podporovana.
RDa
Ten pokles vadnych bloku byl prave po akci fsck /dev/sda5 -y -v, kdy to chyby opravilo. Podruhem spusteni z to chyby nenaslo zadne a pocet vadnych bloku se nemeni.
-
1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 1481
3 Spin_Up_Time 0x0023 092 085 025 Pre-fail Always - 2501
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
Vyhodit.
-
Vypis celeho 1 TB disku /dev/sda1:
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 1481
2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0
3 Spin_Up_Time 0x0023 092 085 025 Pre-fail Always - 2501
4 Start_Stop_Count 0x0032 095 095 000 Old_age Always - 5271
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0
8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 10678
10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 624
12 Power_Cycle_Count 0x0032 095 095 000 Old_age Always - 5397
191 G-Sense_Error_Rate 0x0022 100 100 000 Old_age Always - 2704
192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0
194 Temperature_Celsius 0x0002 064 052 000 Old_age Always - 32 (Min/Max 2/48)
195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0
196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 17
198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0036 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 3005
223 Load_Retry_Count 0x0032 100 100 000 Old_age Always - 624
225 Load_Cycle_Count 0x0032 097 097 000 Old_age Always - 37082
Vypis partisny s Widlema /dev/sda2
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 1481
2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0
3 Spin_Up_Time 0x0023 092 085 025 Pre-fail Always - 2501
4 Start_Stop_Count 0x0032 095 095 000 Old_age Always - 5271
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0
8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 10678
10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 624
12 Power_Cycle_Count 0x0032 095 095 000 Old_age Always - 5397
191 G-Sense_Error_Rate 0x0022 100 100 000 Old_age Always - 2704
192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0
194 Temperature_Celsius 0x0002 064 052 000 Old_age Always - 32 (Min/Max 2/48)
195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0
196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 17
198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0036 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 3005
223 Load_Retry_Count 0x0032 100 100 000 Old_age Always - 624
225 Load_Cycle_Count 0x0032 097 097 000 Old_age Always - 37082
Oboji vypis je stejny, ale asi, jak rika Miroslav, disk je nejpis v haji. Diky za pomoc.
-
Miroslav je okecavajici teoretik, to co citoval nejsou problemy, Raw_Read_Error_Rate je normalni ze jsou disk je opravuje za chodu, Spin_Up_Time je take normalni (jde o pocet normalniho roztoceni motoru, tedy pri zapnuti stroje a/nebo probuzeni disku). spletl si to se Spin_Retry_Count (to je ze se NEdari roztocit motor a disk to zkousi znovu) ktere mas 0, posledni Miroslav citoval Reallocated_Sector_Ct ktere mas 0...
co naopak preskocil je "Current_Pending_Sector" ktere mas 17, to jsou podezrele sektory cekajici na provereni (az k nim "dojdes") zda jsou opravdu vadne, pak by se bud oznacili jako v poradku, nebo zkusili realokovat na jine rezervni, dale Offline_Uncorrectable mas 0 to znamena ze nemas zatim zadne zjistene neopravitelne sektory...
-
Miroslav je okecavajici teoretik, to co citoval nejsou problemy, Raw_Read_Error_Rate je normalni ze jsou disk je opravuje za chodu, Spin_Up_Time je take normalni (jde o pocet normalniho roztoceni motoru, tedy pri zapnuti stroje a/nebo probuzeni disku). spletl si to se Spin_Retry_Count (to je ze se NEdari roztocit motor a disk to zkousi znovu) ktere mas 0, posledni Miroslav citoval Reallocated_Sector_Ct ktere mas 0...
Já myslím že stačí přečíst pre-fail status.
-
Já myslím že stačí přečíst pre-fail status.
pre-fail NEznamena "pred selhanim" ale ze jde o TYP udaje kterej uzivatel muze poznat z udaje v poslednim sloupci
dale mas typ old-age, coz opet NEznamena ze je disk "starej", ale pouze ze jde o TYP udaje kterej naznacuje stari disku coz ale neznamena ze musi kvuli tomu byt problem...
-
pre-fail NEznamena "pred selhanim" ale ze jde o TYP udaje kterej uzivatel muze poznat z udaje v poslednim sloupci
dale mas typ old-age, coz opet NEznamena ze je disk "starej", ale pouze ze jde o TYP udaje kterej naznacuje stari disku coz ale neznamena ze musi kvuli tomu byt problem...
Pravda. Mozek mimo hlavu.
Díky.
-
ok, stejne bych zvazil do jake miry budes mit problem, kdyz disk chcipne.
Disky menim preventivne pravidelne ve stroji, ktery pouzivam na praci. Plotnove jednou za 3-4 roky. SSDcko mam ted prvni dva kousky a nevim jak se k nim chovat. Zatim jede 4 roky a vse vypada ok. Snazim se co nejvic zalohovat. Ted jsem zacal disky klonovat. Takze mam vzdy dve sady pracovnich disku. Jednu v pocitaci a jednu ve skrini. Takto vyuzivam ty stare disky, ktere jsou v poradku, ale uz je v pracovnim stroji nechci.
Disky ve strojich, ktere mame doma a neslouzi na praci nemenim, ale snazim se zalohovat, pokud o to uzivatele stoji :).
-
Takze radsi mam poridit novy ?
Badblocks -sv ukazueporad stejnypocet vadnych bloku (52/0/0) a Smart-Data and SelfTest take porad stejne (z prvu to ukaze 17 vadnych, nez nakonec SELF-TEST FAILED) smartctl -A /dev/sdX ukazuje taky tech 17 podezrelych.
-
co naopak preskocil je "Current_Pending_Sector" ktere mas 17, to jsou podezrele sektory cekajici na provereni (az k nim "dojdes") zda jsou opravdu vadne, pak by se bud oznacili jako v poradku, nebo zkusili realokovat na jine rezervni, dale Offline_Uncorrectable mas 0 to znamena ze nemas zatim zadne zjistene neopravitelne sektory...
no Current_Pending_Sector nejsou podezřelé, ale jsou to ty, které se nezdařilo přečíst, na prověření nečekají, prostě disk je nemůže bez chyby i s pomocí samoopravného kódu přečíst a protože tam může být stále část uživatelových dat, tak s tím nic nedělá
Pending sector se realokuje až pokud se do něj bude zapisovat, tím dáte disku najevo, že o data nestojíte
Takze radsi mam poridit novy ?
Badblocks -sv ukazueporad stejnypocet vadnych bloku (52/0/0) a Smart-Data and SelfTest take porad stejne (z prvu to ukaze 17 vadnych, nez nakonec SELF-TEST FAILED) smartctl -A /dev/sdX ukazuje taky tech 17 podezrelych.
zálohu dat máte? jinak badblocks by to mohl "opravit" tím přepsáním, ale je potřeba ho pustit ve write-mode, t.j. badblocks -svw -c 4096 -b 4096 /dev/sdx
toto 4x po sobě přepíše disk různým vzorem a kontroluje, jestli na konci bude ukazovat 0 chyb, tak vše realokoval
ještě bych nakonec pustil smartctl -t long a koukl na výsledek
-
Vypis celeho 1 TB disku /dev/sda1:
Ono se to pousti na /dev/sda jenom - je to stav disku, ne partisny :)
Osobne se divam na tyto hodnoty pro stanoveni diagnozy:
5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 17
Coz znamena, ze disk jiz pomalu chcipa. Tech 17 sektoru je momentalne s vadou - a nevi se zda se jeste nekdy prectou. Zadne premapovane sektory tam nejsou, takze az tak strasny to s nim jeste neni.
A jako sekundarni zdroj informaci:
4 Start_Stop_Count 0x0032 095 095 000 Old_age Always - 5271
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 10678
12 Power_Cycle_Count 0x0032 095 095 000 Old_age Always - 5397
225 Load_Cycle_Count 0x0032 097 097 000 Old_age Always - 37082
Na jakykoliv disk jsou to dosti velke cisla - znamena to, ze disk jede cca 2 hodiny a pak se vypne (at uz deep sleep nebo vypnuti). To znamena 3 vypnuti denne za 5 let.. a pokud ho mate mladsi tak jeste vice. Ale prakticky vyznam informaci je - disk je hodne starej a jetej.
Porid si novy disk a pokud si nechces komplikovat zivot, tak stejne velikosti - a pak v live distribuci nebo jinem kompu to pretahni pres ddrescue. Hlavne si nesplet zdroj a cil u takove kriticke operace - kdyz oba argumenty jsou /dev/sdX :-)
-
Takze radsi mam poridit novy ?
Badblocks -sv ukazueporad stejnypocet vadnych bloku (52/0/0) a Smart-Data and SelfTest take porad stejne (z prvu to ukaze 17 vadnych, nez nakonec SELF-TEST FAILED) smartctl -A /dev/sdX ukazuje taky tech 17 podezrelych.
Nikdo jiny nez ty nedokaze zhodnotnit, jak velky bude problem, pokud ten disk chcipne. Pokud jen to, ze se vecer nebudes divat na film, tak to neres a zalohuj. To bys uz stejne mel delat. Pokud to bude znamenat, ze nemuzes dopsat diplomku a stravis o rok dele ve skole misto prace, nebo nedokazes odevzdat praci, kterou jsi slibil odevzdat, tak urcite kup novy a tento si nechej jako klon, protoze i novy disk muze chcipnout i kdyz pravdepodobnost je velmi mala.
-
Zalohuji samozrejme pravidelne prez rsync, mam tam ruzne projekty a vypocty. Veskera data jsou zazalohovana, takze jen budu muset preinstalovat Ubuntu a stahnout data ze zalohy zpet.
Zalohuji:
rsync -ahvc -e ssh --delete --progress ZDROJ CIL
Hlavne dobre nastavit zdroj a cil vzdy.
Disk uz je docela stary, notas je repasovanej. Takze uz je to docela znat. Spis poridim disk o neco vetsi.
-
"Disk uz je docela stary, notas je repasovanej."
Tak do notebooku zásadně SSD. Jednou s tím praštíš a.... Koneckonců právě to se Ti asi stalo.
Rotačáky patřej do datovejch skladů, NASů... a do DOOMa.
-
"Disk uz je docela stary, notas je repasovanej."
Tak do notebooku zásadně SSD. Jednou s tím praštíš a.... Koneckonců právě to se Ti asi stalo.
Rotačáky patřej do datovejch skladů, NASů... a do DOOMa.
Přesně tak ;-)
-
Disk jsem vymenil, ten puvodni byl skutecne dosti starej. Na starem jsem mel Ubuntu na velke partition a na mensi partition Win7. Na novy disk se mi nakonec podarilo Ubuntu dostat. Ubuntu 19.04 po nainstalovani na velkou partition se chovalo podivne - vzdy se zaseklo na textovem vystupu pri startovani systemu, reinstalace nepomohla. Ubuntu 18.04 zase nezvladlo vytvorit grub (pri bootu to spadlo do grub error a rescue modu), a tak jsem musel v grub rescue mode to nastavit rucne, napodruhe Ubuntu nabehlo, konecne.
Ted jeste nevim, jak to udelat s mensi partition pro Win7 (instalacni CD nemam a obcas musim i do Widli). Mam to pretahnout pomoci ddrescue ze stareho na novy disk (Win7 ma vzdy mensi partittion,na ktere i u stareho disku porad badblocks bez chyb) ? Nejak to pak budu muset hodit do grub.