Fórum Root.cz
Hlavní témata => Windows a jiné systémy => Téma založeno: m3l1sk0 20. 02. 2017, 23:50:51
-
Pekny den. Pouzivam Windows 10 a pri kopirovani vacsieho mnozstva dat na externy disk som si vsimol par problemov. Kopiroval som cez totalcmd a obcas kopirovanie zastalo na nejakom errore ohladom nemozneho citania/zapisu (presne znenie uz nepamatam) no ked som dal retry tak tento subor sa skopiroval (niekedy na 2-3 pokus ale skopiroval). Nakoniec som na retry nemal nervy a data som skopiroval pomocou
xcopy SRC DST /C /E /Q. Vsimol som si vsak ze niektore subory ktore sa skopirovali mali iny checksum ako povodne (vid obr.):
(https://i.stack.imgur.com/7t8B8.png)
Bolo to pravdepodobne sposobene optionom /C continue-on-error. Neskor som sa vrtal v Event Viewery a v case ked som kopiroval tieto data som si vsimol nasledujuce typy eventov:
########################################################
Log Name: System
Source: disk
Date: 2/12/2017 9:49:01 PM
Event ID: 51
Task Category: None
Level: Warning
Keywords: Classic
User: N/A
Computer: DESKTOP-1VIQ4LA
Description:
An error was detected on device \Device\Harddisk1\DR12 during a paging operation.
########################################################
Log Name: System
Source: Microsoft-Windows-Ntfs
Date: 2/12/2017 10:41:45 PM
Event ID: 140
Task Category: None
Level: Warning
Keywords: (8)
User: DESKTOP-1VIQ4LA\marek
Computer: DESKTOP-1VIQ4LA
Description:
The system failed to flush data to the transaction log. Corruption may occur in VolumeId: D:, DeviceName: \Device\HarddiskVolume20.
(A device which does not exist was specified.)
########################################################
Log Name: System
Source: disk
Date: 2/13/2017 12:07:28 AM
Event ID: 157
Task Category: None
Level: Warning
Keywords: Classic
User: N/A
Computer: DESKTOP-1VIQ4LA
Description:
Disk 1 has been surprise removed.
########################################################
Taktiez som si pocas kopirovania obcas vsimol aj tuto hlasku (vid obr.):
(https://s3.postimg.org/acjt5obkz/upload.png)
Rovnaku hlasku som nasiel aj v Event Viewery:
########################################################
Log Name: System
Source: Application Popup
Date: 2/12/2017 10:11:24 PM
Event ID: 26
Task Category: None
Level: Information
Keywords:
User: SYSTEM
Computer: DESKTOP-1VIQ4LA
Description:
Application popup: cmd.exe - Neúspěšný opožděný zápis : Nebylo možné uložit všechna data pro soubor \EDU_VIDEOS_DELL\Coursera - Introduction to Human Behavioral Genetics\3 - 3 - 2C_ Findings from Twin Studies (16_03).mp4; došlo ke ztrátě dat. Tato chyba může nastat, pokud bylo zařízení odebráno nebo je médium chráněné proti zápisu.
########################################################
Tu https://community.spiceworks.com/topic/28640-identify-disk-from-error-in-event-viewer (https://community.spiceworks.com/topic/28640-identify-disk-from-error-in-event-viewer) a tu http://www.computerperformance.co.uk/ezine/BestPractice/BestPractice77.htm (http://www.computerperformance.co.uk/ezine/BestPractice/BestPractice77.htm) som sa docital ze nebezpecne su hlasky ktore maju Event ID: 7,51,52
V logu som nasiel aj Event ID: 7. Je to vsak z ineho datumu ako ked som kopiroval tieto data a teda neviem na 100% povedat ci sa to tyka tohoto disku alebo nejakeho ineho externeho media:
########################################################
Log Name: System
Source: disk
Date: 11/13/2016 12:33:52 PM
Event ID: 7
Task Category: None
Level: Error
Keywords: Classic
User: N/A
Computer: DESKTOP-1VIQ4LA
Description:
The device, \Device\Harddisk2\DR2, has a bad block.
########################################################
Otazky:
odchadza mi disk do kremikoveho neba?
mohol by chdisk pomoct (nemoze mi pokazit nejake data na disku)?
pokial budem len citat a nezapisovat mohol by som z disku dostat existujuce data?
mal by som sledovat este nejake ine event ID?
-
odchadza mi disk do kremikoveho neba?
pravdepodobne ano, bez dalsich testu nelze s jistoutou rict, hlavne vystup ze SMART je prvni vec kam je potreba se podivat, windows event log je to posledni...
https://cs.wikipedia.org/wiki/S.M.A.R.T.
mohol by chdisk pomoct (nemoze mi pokazit nejake data na disku)?
zelezi v cem je chyba, pokud je naborenej filesystem tak chdisk muze pomoci, pokud je problem fyzicky s hw tak muze spis uskodit...
pokial budem len citat a nezapisovat mohol by som z disku dostat existujuce data?
zelezi jestli/jak/moc/kde/proc je ten problem, kazdopadne tva predstavaa ze jen ctes neznamena ze system (u Windows to plati 10nasobne) nebude mezitim zaroven i zapisovat...
takze bych na tom pustil z USB Live GNU/Linux, NTFS disk pripojil v rezimu readonly a pak teprve zkusil z toho kopirovat data, s tim ze bych mell jistotu ze pri readonly pripojeni nedochazi opravdu k zadnemu zapisu
mal by som sledovat este nejake ine event ID?
zadne, opakuji, mel bys zkouknout/sledovat SMART
https://cs.wikipedia.org/wiki/S.M.A.R.T.
jinak pokud tam mas opravdu dulezite/nezalohovane data, tak VZDY plati udelat bitovou kopii CELEHO disku, tedy zadne kopirovani souboru, zadne pouziti pochybnejch zalohovacich programu co delaji nejakej svuj uzavrenej/specialeni/nikde_jinde_necitelnej format, v GNU/Linuxu tedy pozuit DD resp. pokud muze byt na disku vadne bloky tak DDRESCUE, timto nastrojem tedy udelat 1:1 obraz disku, pri dukladnosti pak jeste kopii toho obrazzu, a s tim az pak pracovat/opravovat/zachranovat...
-
Vdaka, pozriem SMART a pastnem sem vystup. Ten disk je relativne novy. Ma cca 2-3 roky ale prakticky bol pouzivany len ako zaloha - raz za cas sa pripojil do PC a nakopiroval som nan vacsie mnozstvo dat. Preto sa mi celkom nechce verit ze ma najlepsie dni za sebou. S bitovou kopiou mam svoje skusenosti. No napr som zazil pripad kedy disk vykazoval podobne problemy ako tie ktore opisujem no bitova kopia prebehla bez problemov. Preto by ma zaujimalo ci existuje nejaky spolahlivy indikator (ci uz v SMARTE, Event Viewery alebo niekde inde) ktory hovori o tom v akom stave je disk? Resp ci nahosou netreba sledovat ako sa atributy menia v case? Viem ze SMART ma niekolko atributov no neviem ktory presne hovori o problemoch s diskom? Dakujem
-
Ve smartu doporučuji sledovat CurrentPendingSectorCount, což je počet nalezených, ale ještě nerealokovaných sektorů. Pak RealocatedEventCount a RealocatedSectorCount - počet pokusů o realokaci a již realokovaných bad sektorů. Pokud je jich hodně, začne se objevovat UncorrectableSectorCount - již neopravitelné sektory. Taky se koukněte na UltraATACRCErrorRate - to je chyba SATA rozhraní, způsobená buď elektronikou nebo mnohem častěji jen vadným kabelem.
-
Ten disk je relativne novy. Ma cca 2-3 roky
;D ;D ;D ::) ::) ::)
-
opravuji puvodni link https://cs.wikipedia.org/wiki/S.M.A.R.T. (https://cs.wikipedia.org/wiki/S.M.A.R.T.)
pridavam pak nejake dalsi cesky:
https://www.root.cz/clanky/budte-s-m-a-r-t-a-hlidejte-si-disky
https://www.linuxexpres.cz/praxe/sprava-linuxoveho-serveru-smart-testy-a-monitorovani
umyslne nepridavam zadne Windows nastroje protoze jak sem psal na ten HDD proste radeji/zatim NIC NEINSTALOVAT a rozhodne z toho Windows OKAMZITE PRESTAT PROVOZOVAT
rady klidne ignoruj, ale kdyz pak prijdes o moznost vytahnout data tak se nevracej s brekem ;)
-
opravuji puvodni link https://cs.wikipedia.org/wiki/S.M.A.R.T. (https://cs.wikipedia.org/wiki/S.M.A.R.T.)
pridavam pak nejake dalsi cesky:
https://www.root.cz/clanky/budte-s-m-a-r-t-a-hlidejte-si-disky
https://www.linuxexpres.cz/praxe/sprava-linuxoveho-serveru-smart-testy-a-monitorovani
umyslne nepridavam zadne Windows nastroje protoze jak sem psal na ten HDD proste radeji/zatim NIC NEINSTALOVAT a rozhodne z toho Windows OKAMZITE PRESTAT PROVOZOVAT
rady klidne ignoruj, ale kdyz pak prijdes o moznost vytahnout data tak se nevracej s brekem ;)
ten disk je externy windows z neho nebezi (neviem ci ma Windows dovod tam nieco zapisovat). Dnes pridam SMART log - vcera som sa k tomu nedostal. Diky
-
ten disk je externy windows z neho nebezi (neviem ci ma Windows dovod tam nieco zapisovat). Dnes pridam SMART log - vcera som sa k tomu nedostal. Diky
Jestli ma pod tri roky podle serioveho cisla na disku (ne USB krabici), mohl by mit zaruku od vyrobce disku - zalezi na to, jak dany vyrobce dnes ojebava zakazniky. Cili rozmontovat, zjistit pripadnou moznost reklamace a pokud jde, vratit disk a krabici si nechat.
-
ten disk je externy windows z neho nebezi (neviem ci ma Windows dovod tam nieco zapisovat). Dnes pridam SMART log - vcera som sa k tomu nedostal. Diky
Jestli ma pod tri roky podle serioveho cisla na disku (ne USB krabici), mohl by mit zaruku od vyrobce disku
Neznamena to ale ze ho musim dostat z krabice a tym padom teda porusim zaruku? BTW je to samsung D3 2TB ktory by mal ma 3 roky zaruku. Pripajam SMART log.
(https://s15.postimg.org/ol2arzzmj/HDDscan.png)
Je to z Windows aplikacie HDDscan (momenalne nemam nervy riesit boot Linuxu s UEFI). Skusal som aj smartctl pre windows ale smartctl.exe --scan mi nasiel len 1 disk (pravdepodobne interny v notebooku) no ani ten nevedel precitat (samozrejme vsetko pustam ako admin):
c:\gsmartcontrol-0.8.7-win32>smartctl.exe --scan
/dev/sda -d ata # /dev/sda, ATA device
c:\gsmartcontrol-0.8.7-win32>smartctl.exe -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [i686-w64-mingw32-win8(64)] (sf-5.43-1)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net
Smartctl: Device Read Identity Failed: Input/output error
A mandatory SMART command failed: exiting. To continue, add one or more '-T permissive' options.
c:\gsmartcontrol-0.8.7-win32>smartctl.exe -aT permissive /dev/sda
smartctl 5.43 2012-06-30 r3573 [i686-w64-mingw32-win8(64)] (sf-5.43-1)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net
Smartctl: Device Read Identity Failed: Input/output error
=== START OF INFORMATION SECTION ===
Device Model: [No Information Found]
Serial Number: [No Information Found]
Firmware Version: [No Information Found]
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: [No Information Found]
ATA Standard is: [No Information Found]
Local Time is: Wed Feb 22 23:16:56 2017 CEST
SMART support is: Ambiguous - ATA IDENTIFY DEVICE words 82-83 don't show if SMART supported.
SMART support is: Ambiguous - ATA IDENTIFY DEVICE words 85-87 don't show if SMART is enabled.
A mandatory SMART command failed: exiting. To continue, add one or more '-T permissive' options.
PS: skusal som aj rozne dalsie programy pre windows SpeedFan, HDtune, gsmartcontrol (pouziva smartctl.exe). Jedine SpeedFan bol este schopny vydolovat SMART. HDtune nie. A gsmartcontrol mi disk zobrazil ale nesiel pozriet, co je zaujimave kedze ako pisem predosle prikazy ho nenasli (vid obr.)
(https://s28.postimg.org/e9pwodz99/gsmartcontrol_01.png)
(https://s14.postimg.org/h05w8o5pt/gsmartcontrol_02.png)
(https://s24.postimg.org/ctvp55idh/gsmartcontrol_03.png)
-
[...] Je to z Windows aplikacie HDDscan (momenalne nemam nervy riesit boot Linuxu s UEFI). [...]
Boot "Linuxu s UEFI" z USBFlash je totozne jako Boot "Windows s UEFI", v obou pripade, jakmile mas nahrane na USB, staci znat hotkey desky pro bootmenu (F12?) nebo v "BIOSu" nastavit poradi pro UEFI Boot...
http://cdimage.ubuntu.com/xubuntu/releases/14.04.5/release/xubuntu-14.04.5-desktop-amd64.iso
http://cdimage.ubuntu.com/xubuntu/releases/14.04.5/release/xubuntu-14.04.5-desktop-amd64.iso.torrent
http://wiki.ubuntu.cz/instalace/z_flash_disku
myslim ze to od stazeni pro pusteni smartctl zabere mene casu nez stahovat ruzne programy do windows a delat screenshoty ;) vystup smartctl pak vlozit samozrejme jako text...
-
pro uplnost:
sudo apt update && sudo apt install gsmartcontrol
jinak z toho obrazu, aspon par postrehu... vadne bloky tam nejsou (ani uz prealokovane, ani k prealokovani, ani k prozkoumani), zobrazuje to ovsem jen takove na ktere by to uz narazilo pri zapisu, nebo pri pusteni "smart long testu"... nulovej je i error znamenajici "pokusy o znovuroztoceni" takze ani problem s motorkem/a_jeho_elektronikou ani s nedostatecnym USB napajeni neni... ani teplota nebyla moc, i kdyz ma max 45C, predpokladam podle max 35 ze to nebylo dlouhodobe... no a jinak ze by to melo nabehano realne 108hodin???
jo a podle modelu nejde o Samsung, ale o Seagate Barracuda
-
Neznamena to ale ze ho musim dostat z krabice a tym padom teda porusim zaruku? BTW je to samsung D3 2TB ktory by mal ma 3 roky zaruku.
Tak to zalezi na tom, jak je to stare. Jestli ma pres 2 roky, tak uz nemate zaruku na disk v krabici z kramu, ledaze by se vyrobce nekde dusoval, ze dava vic a tak byste si to mohl vyridit primo s nim. Pokud ale disk ma pod 3 roky, tak by mohl mit zaruku od vyrobce disku podle data vyroby/serioveho cisla. Pokud mate doklad o koupi, tak by se pocatk tech tri let zaruky posouval k datu prodeje.
V kazdem pripade by neskodilo na ten disk pustit nejaky test na spatne bloky. Pokud zaruka na krabici uz vyprsela, tak bych to rozebral a pustil test primo na disk bez krabice, aby se zjistilo, jestli trable nepusobi krabice.
Ostatne problemy by mohl zpusobovat i kabel nebo USB porty na masine.
-
pro uplnost:
sudo apt update && sudo apt install gsmartcontrol
jinak z toho obrazu, aspon par postrehu... vadne bloky tam nejsou (ani uz prealokovane, ani k prealokovani, ani k prozkoumani), zobrazuje to ovsem jen takove na ktere by to uz narazilo pri zapisu, nebo pri pusteni "smart long testu"... nulovej je i error znamenajici "pokusy o znovuroztoceni" takze ani problem s motorkem/a_jeho_elektronikou ani s nedostatecnym USB napajeni neni... ani teplota nebyla moc, i kdyz ma max 45C, predpokladam podle max 35 ze to nebylo dlouhodobe... no a jinak ze by to melo nabehano realne 108hodin???
jo a podle modelu nejde o Samsung, ale o Seagate Barracuda
Vdaka. pripajam vysupt zo smartctl na lubuntu. Este predtym jeden obr ktory ma prekvapil hned po tom ako som disk pripojil do USB
(https://s7.postimg.org/3ycmgl8ez/oie_q7_Nv_MVZt4_I6_Q.png)
root@lubuntu:~# smartctl -a /dev/sdb
smartctl 6.4 2014-10-07 r4002 [x86_64-linux-4.2.0-16-generic] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org
/dev/sdb: Unknown USB bridge [0x04e8:0x6123 (0x202)]
Please specify device type with the -d option.
Use smartctl -h to get a usage summary
root@lubuntu:~# #smartctl -a -d sat /dev/sdb
root@lubuntu:~# man smartctl
root@lubuntu:~# smartctl -a -d sat /dev/sdb
smartctl 6.4 2014-10-07 r4002 [x86_64-linux-4.2.0-16-generic] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.14 (AF)
Device Model: ST2000DM001-1E6164
Serial Number: W1E903F0
LU WWN Device Id: 5 000c50 07d3083c7
Firmware Version: SC48
User Capacity: 2,000,398,934,016 bytes [2.00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 7200 rpm
Form Factor: 3.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS T13/1699-D revision 4
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is: Thu Feb 23 23:09:12 2017 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART Status command failed: scsi error medium or hardware error (serious)
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
See vendor-specific Attribute list for marginal Attributes.
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 584) seconds.
Offline data collection
capabilities: (0x73) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
No Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 232) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x3081) SCT Status supported.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 115 100 006 Pre-fail Always - 84432688
3 Spin_Up_Time 0x0003 095 095 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 65
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 30065544638
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 106
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 52
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 001 000 Old_age Always - 7 7 65535
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 075 045 045 Old_age Always In_the_past 25 (Min/Max 23/25)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 5
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 759
194 Temperature_Celsius 0x0022 025 055 000 Old_age Always - 25 (0 20 0 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 25h+56m+04.421s
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 846975072
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 840186210
SMART Error Log Version: 1
ATA Error Count: 2
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 2 occurred at disk power-on lifetime: 63 hours (2 days + 15 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 00 ff ff ff 4f 00 00:00:12.218 READ DMA EXT
25 00 08 c0 05 60 40 00 00:00:12.217 READ DMA EXT
25 00 20 ff ff ff 4f 00 00:00:12.210 READ DMA EXT
25 00 28 ff ff ff 4f 00 00:00:12.149 READ DMA EXT
25 00 20 ff ff ff 4f 00 00:00:11.675 READ DMA EXT
Error 1 occurred at disk power-on lifetime: 63 hours (2 days + 15 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 00 ff ff ff 4f 00 00:00:12.218 READ DMA EXT
25 00 08 c0 05 60 40 00 00:00:12.217 READ DMA EXT
25 00 20 ff ff ff 4f 00 00:00:12.210 READ DMA EXT
25 00 28 ff ff ff 4f 00 00:00:12.149 READ DMA EXT
25 00 20 ff ff ff 4f 00 00:00:11.675 READ DMA EXT
SMART Self-test log structure revision number 1
No self-tests have been logged. [To run self-tests, use: smartctl -t]
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
root@lubuntu:~# smartctl -d sat -t short /dev/sdb
smartctl 6.4 2014-10-07 r4002 [x86_64-linux-4.2.0-16-generic] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION ===
Sending command: "Execute SMART Short self-test routine immediately in off-line mode".
Drive command "Execute SMART Short self-test routine immediately in off-line mode" successful.
Testing has begun.
Please wait 1 minutes for test to complete.
Test will complete after Thu Feb 23 23:22:27 2017
Use smartctl -X to abort test.
root@lubuntu:~# smartctl -a -d sat /dev/sdb
smartctl 6.4 2014-10-07 r4002 [x86_64-linux-4.2.0-16-generic] (local build)
Copyright (C) 2002-14, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Family: Seagate Barracuda 7200.14 (AF)
Device Model: ST2000DM001-1E6164
Serial Number: W1E903F0
LU WWN Device Id: 5 000c50 07d3083c7
Firmware Version: SC48
User Capacity: 2,000,398,934,016 bytes [2.00 TB]
Sector Sizes: 512 bytes logical, 4096 bytes physical
Rotation Rate: 7200 rpm
Form Factor: 3.5 inches
Device is: In smartctl database [for details use: -P show]
ATA Version is: ATA8-ACS T13/1699-D revision 4
SATA Version is: SATA 3.0, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is: Thu Feb 23 23:22:33 2017 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART Status command failed: scsi error medium or hardware error (serious)
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
See vendor-specific Attribute list for marginal Attributes.
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 584) seconds.
Offline data collection
capabilities: (0x73) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
No Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 232) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x3081) SCT Status supported.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 115 100 006 Pre-fail Always - 84432688
3 Spin_Up_Time 0x0003 095 095 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 65
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 30065544772
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 106
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 52
183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 001 000 Old_age Always - 7 7 65535
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 069 045 045 Old_age Always In_the_past 31 (Min/Max 23/31)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 5
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 761
194 Temperature_Celsius 0x0022 031 055 000 Old_age Always - 31 (0 20 0 0 0)
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 25h+58m+11.091s
241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 846975072
242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 840186210
SMART Error Log Version: 1
ATA Error Count: 2
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 2 occurred at disk power-on lifetime: 63 hours (2 days + 15 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 00 ff ff ff 4f 00 00:00:12.218 READ DMA EXT
25 00 08 c0 05 60 40 00 00:00:12.217 READ DMA EXT
25 00 20 ff ff ff 4f 00 00:00:12.210 READ DMA EXT
25 00 28 ff ff ff 4f 00 00:00:12.149 READ DMA EXT
25 00 20 ff ff ff 4f 00 00:00:11.675 READ DMA EXT
Error 1 occurred at disk power-on lifetime: 63 hours (2 days + 15 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
40 51 00 ff ff ff 0f Error: UNC at LBA = 0x0fffffff = 268435455
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
25 00 00 ff ff ff 4f 00 00:00:12.218 READ DMA EXT
25 00 08 c0 05 60 40 00 00:00:12.217 READ DMA EXT
25 00 20 ff ff ff 4f 00 00:00:12.210 READ DMA EXT
25 00 28 ff ff ff 4f 00 00:00:12.149 READ DMA EXT
25 00 20 ff ff ff 4f 00 00:00:11.675 READ DMA EXT
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 106 -
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
-
ten obrazek je v poradku znamena ze vidi "neciste NTFS", z toho duvodu neprovede mount a nabada k pripojeni rucnimu v rezimu pouze_cteni... dava obecnou radu, (pokud by neslo o externi) ze Windows mohli byt nekorektne vypnute nebo hibernovane (coz W8,W10 delaji bezne i kdyz das vypnout, rikaji tomu fastboot/faststart a je vhodne to tak jako tam v nastaveni napajeni (windows) vypnout), u externiho pak muze jit o proste vyrvani za chodu bez pouziti tlacitka "bezpecne odebrat hw"...
S.M.A.R.T. (takto pro me prehlednejsi) vypada dobre, na 99.9% to vidim jen na naborenej filesystem, takze by pouha oprava (ve Windows) mela celej problem vyresit, stale ale plati ze pokud je s diskem problem co by se projevil pri zapisu, muze se neco po, takze pokud tam mas dulezite data, zkus bud udelat ten syrovej obraz disku do souboru a/nebo zkopiruj date z disk pripojeneho v linuxu, po pripojeni v readonly
sudo mount -o ro /dev/sdb1 /mntale zase, pokud je naborenej filesystem (to ze neni clean nemusi znamenat nutne naborena data, muze jit "jen" o priznam nespravneho vypnuti), muze se pri kopirovani dat pred kontrolou/opravou disku (ve Windows) kopirovat nekonsistentni data... ale muze jit v pripade havarie pri kontrole alespon o nejake data, v pripade ze udelas obraz disku mas samozrejme idealni stav, kdy muzes pozdeji provadet jak kopirovani dat z obrazu(resp. z kopie toho obrazu), tak opravu dat v obrazu apod...
-
vadne bloky tam nejsou (ani uz prealokovane, ani k prealokovani, ani k prozkoumani), zobrazuje to ovsem jen takove na ktere by to uz narazilo pri zapisu, nebo pri pusteni "smart long testu"
Ked spravne chapem tak to funguje tak ze ked zlyha citanie/zapis zo sektora tak je v nejakom cakajucom stave. Ak sa dalsi r/w sektora podari potom je sektor povazovany za normalny. Ak sa r/w nepodari potom sa pokusi o realokovaie z volych sektorov. Ak sa ani toto nepodari potom sa dostane do stavu 198 Uncorrectable Error Count? Tym stavom k preskumaniu myslite prave ten pripad kedy prve r/w zlyhalo a caka sa ci sa prealokuje alebo sa vyhlasi za poskodeny - ktory to je atribut?
A teda:
005 Reallocation Sector Count - prealokovane?
197 Current Pending Error Count - k prealokovaniu?
Este taka otazka ze smart long test skusa citat (zapisovat asi nie aby neposkodil data) kazdy jeden sektor?
nulovej je i error znamenajici "pokusy o znovuroztoceni" takze ani problem s motorkem/a_jeho_elektronikou ani s nedostatecnym USB napajeni neni
Myslite atribut Spin Retry Count?
ani teplota nebyla moc, i kdyz ma max 45C, predpokladam podle max 35 ze to nebylo dlouhodobe
Nevsimol som si ze by sa nejako vyrazne hrial. Je pravda ze je v krabici a keby ta bola horuca tak to by uz asi bolo velmi zle.
no a jinak ze by to melo nabehano realne 108hodin???
Toto neviem isto povedat kazdopadne to bolo spustene naozaj len par X kym sa tam nenakopirovalo vacsie mnozstvo dat. Predpokladam ze myslite toto: 009 Power On Hours-Count (hex(68) == dec(104))?
jo a podle modelu nejde o Samsung, ale o Seagate Barracuda
Pokial viem tak:
Seagate = Maxtor = Samsung
WD = Hitachi
-
Koukněte se do Disk Managementu, který disk je \Device\Harddisk2. Tipnu si že Disk 2 bude ten externí. Pokud to tak je, tak jde nejspíš o problém s diskem nebo jeho napájením. Můžete zkusit odpojit ostatní USB zařízení, aby měl disk dost proudu. V dalším kroku zkuste Y kabel, tím opět dodáte víc proudu.
http://www.adata.com/us/support/faq/2
Ale daleko spíš to bude disk. Koupil jsem si například několik disků ADATA, a ať jsem zkoušel cokoliv, tak se všechny odpojovaly. Takže šly všechny na reklamaci.
-
[...] Ak sa ani toto nepodari potom sa dostane do stavu 198 Uncorrectable Error Count? [...]
A teda:
005 Reallocation Sector Count - prealokovane?
197 Current Pending Error Count - k prealokovaniu?
ano
Este taka otazka ze smart long test skusa citat (zapisovat asi nie aby neposkodil data) kazdy jeden sektor?
smart test jen cte a neposkodi data, tedy sam o sobe, pokud by pri tom testy se odhalil HW problem a doslo by k prealokoani hromady sektoru a nedopadlo to dobre tak se data prijit muze, pritom bez pusteni testu by teoreticky dojit nemuselo, tohle je neco jak slepice a vejce :)
dalsi vec je ze aby se projevila vadnost sektoru nekdy nemusi stacit cteni a je potreba provest write test, kterej (v pripade napr. nastroje badblock v rezimu write) nemusi znamenat poskozena data (krome situace vyse), protoze pri testu zapisu se nejdrive nactou aktualni data, ktere se pak vrati zpatky...
Myslite atribut Spin Retry Count?
ano
Predpokladam ze myslite toto: 009 Power On Hours-Count (hex(68) == dec(104))?
ano
Pokial viem tak:Seagate = Maxtor = Samsung, WD = Hitachi
To ze Seagate koupil pred par lety Samsunga, neznamena ze HDD od Seagate (navic v rade co Seagate pouzival davno predtim) budes rikat Samsung ;)
-
STx000DM001 je model zralej na ránu kladivem už hned po zakoupení. Přestaň mrhat časem a ten šmejd vyhoď.
-
STx000DM001 je model zralej na ránu kladivem už hned po zakoupení. Přestaň mrhat časem a ten šmejd vyhoď.
ale nekecej... problemova byla jen nejaka velikost(ted nevim jestli 1.5TB nebo 3TB?) a snad jen nejake serie...
mel sem 6kusu ST2000DM001 tedy 2TB 3.5" v RAID6 a v provozu 24h/7d to natocilo ~40000hodin, z tech 6ti odesel jen 1, ostatni jsou ok a server byl odstaven, jinak by bezelo dale... tazatel ma 1x single HDD co ma najeto jen 108hodin...
-
ale nekecej... problemova byla jen nejaka velikost(ted nevim jestli 1.5TB nebo 3TB?) a snad jen nejake serie...
Tak určitě. Proto Seagate zrušil diskusní fórum, kde byl cca 1000stránkovej thread vo těhle šmejdech.
-
Tak určitě. Proto Seagate zrušil diskusní fórum, kde byl cca 1000stránkovej thread vo těhle šmejdech.
tak ono cist jak J a Lol Phirae nadavaj do kola stejne neni nic zajimaveho ;) ted apson muzes tvrdit ze slo o 2TB HDD a take ze me tech 6 HDD urcite nemohlo chodit ;)
-
STx000DM001 je model zralej na ránu kladivem už hned po zakoupení. Přestaň mrhat časem a ten šmejd vyhoď.
ale nekecej... problemova byla jen nejaka velikost(ted nevim jestli 1.5TB nebo 3TB?) a snad jen nejake serie...
mel sem 6kusu ST2000DM001 tedy 2TB 3.5" v RAID6 a v provozu 24h/7d to natocilo ~40000hodin, z tech 6ti odesel jen 1, ostatni jsou ok a server byl odstaven, jinak by bezelo dale... tazatel ma 1x single HDD co ma najeto jen 108hodin...
Ne tohle skutecne neni pravda. Problemove byly vice serii za sebou a to hned v nekolika aspektech.
1. Reznuti kontaktu mezi PCB vnejsi elektroniky a zbytkem disku / uz zrezle kontakty po dodavce. Oprava jednoducha ale disk na vyhozeni.
2. Disky byly vyrobeny ze stare varky ploten ktere mely vadnou ochrannou vrstvu ktera se odlupovala v prubehu cinnosti. Kompletni cisteni, vymena hlav, velmi draha oprava s jistou ztratovosti dat.
3. Bugy ve firmware ktere nesly opravit upgradem, nebot zde firmware updater odmital disky updatovat z neznamych duvodu(mohly byt i dobre nebot i jeden typ disku muze mit x hw revizi). Posledni update mel opravovat zbytecne a slysitelne vraceni hlav ktere melo vliv na zivotnost.
4. Casto odchazi predzesilovac signalu u hlav. Nasledna oprava kvuli ziskani dat je draha a bohuzel neobejde bez rozebrani disku a rekalibracnich kroku. Je to ten pripad kdy disk proste odejde a z diagnostickeho interface vyplyva ze nedojde k inicializacnim krokum.
Problemova plotny byly pouzity i v predchozi nizkootackove generaci disku Seagate BarraCuda LP ST32000542AS a pribuzne vyssi otacky 7200.11 kde hlavni bugy byly:
1. Zde se ukazal fatalni problem s kryci vrstvou na plotnach - cca 1-2 roky pri silnem provozu
2. Fatalni seagate BSY bug ktery byl opravitelny bez low level opravy disku
3. Upgrade firmware ktery mel zpusobovat BSY bug zrakvil disky :))) http://www.tomshardware.com/news/seagate-firmware-7200.11-drives-bricking,6885.html
Pochybuji ze muzes provadet nejake statistiky ze svych 6ti disku pokud nemas vetsi storage reseni postavene na beznych discich. Tezko udelas statistiky jako Backblaze nebo Google ktere maji jejich dostatecny statisticky vzorek protoze jinak nemas nic. Nebot...
...firmy ktere nabizeji velka storage reseni z nich techto statistik necerpaji, protoze pro jejich skatule jsou jim dodavany brandovane disky(hlidane serie z normalnich varek enterprise disku a kolikrat vlastni firmware a jina velikost bloku) uz v suplicich a firmy jako EMC(zadekl),Hitachi nebo IBM si hlidaji statistiky poruchovosti. Tim spise ze Hitachi si treba samo dela disky.
-
Jeden znamy tvrdi ze tento disk ma nejaky problem s vychylovacim systemom hlav, vid:
7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 30065544772
resp.
7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 30065544638
co si o tom myslite? Totiz zaznelo tu ze pravdepodobne sa jedna "len" o poskodeny file system a teda mohol by stait aj scandisk bez ddrecue. V takomto pripade som rozmyslal nad tym ze si data jednoducho skopirujem. Potom nad kazdym suborom spravim md5sum. Potom pustim scandisk a opat spravim md5sum. Takto by som teoreticky mohol najst nekonzistentne data a tie si vykopirovat nanovo (po tom co si overim ze scandisk nic nepokazil a usetril by som si kopiu 1:1). Ak je ale naozaj problem s vychylovanim hlav tak neviem ze ci je to dobry napad - pretoze ked spravne chapem tak pri kopii 1:1 sa hlava az tak "nenabeha" kedze ide blok po bloku ako pri kopirovani fragmentovanychsuborov. Dakujem
-
Trident, slusne informacie 8)
Mam doma ST2000DM001 a ST4000DM000 v externych Seagate Expansion diskoch typu STBV2000200 a STBV4000200. Mal by som si vyhladat novy firmware? Da sa nahrat novy firmware aj cez USB aby som nemusel disky vyberat z krabice?