Reported uncorrectable errors na SATA SSD

Reported uncorrectable errors na SATA SSD
« kdy: 21. 09. 2024, 13:17:29 »
Zdravím,
v jiném příspěvku zabývajícím se výpisu ze smartctl jsem zaznamenal řadu lidí, kteří byli schopni se více či méně fundovaně vyjádřit n zaslanému výpisu.
Já to vezmu zkrátka a rovnou sugestivní otázkou:
Mohu se domnívat, že chyby disku, které (v tomto případě) v gsmartcontrol (který volá smartctl) vidím, mohu směle ignorovat? Dodám, že Error-log je prázdný (no errors logged). Jedná se o starší SSD, které jede v jednom serveru jako SSD pro operační systém trvale (stejně jako dalších 8 disků) a až na tuhle „červenou“ položku nevykazuje žádné potíže. Jsem si samozřejmě vědom, že SSD může umřít bez varování stylem „najednou zničehonic zdechne a pápá data“ (už jsem takové osobně zažil dva SanDisky a jeden Krucinál). Není to samozřejmě žádný mission-critical server, ostatně je to z obyčejného PCčka, staré Core i5-650, Intel deska, ale svému účelu stačí a energii neřeším (zatím, ale mám v plánu to zmigrovat do virtuálky, to je všechno vedlejší). Jsou tam v poli nějaké disky, které se tváří vadněji, ale pole je řešené tak, že výpadek jednoho libovolného disku (a dokonce dvou konkrétních najednou) se přežije. Ale asi by mě nebavilo znovu instalovat celý OS a všechno to nastavovat, znáte to ;) (rozumnou a na SW bezplatnou zálohovací strategii živého OS jsem ale ještě nevyšpekuloval, to bude další krok).
« Poslední změna: 21. 09. 2024, 13:19:43 od WIFT ​​​​​​​​​​ »


RDa

  • *****
  • 2 765
    • Zobrazit profil
    • E-mail
Re:Reported uncorrectable errors na SATA SSD
« Odpověď #1 kdy: 22. 09. 2024, 11:26:27 »
Ja uz tem SSD neverim ani bit. Vse musi jit v raidu (at uz mdadm, lvm ci btrfs) z ruznych modelu, pokud nechces vypadek z provozu (takhle mam na jednom serveru pripichlej usb disk kde je mirror, pac jeden z internich non hotswap boot disku odesel a nechce se me to vytahovat a resit).

Nebo pokud je to fakt nekriticky, tak to jet co nejvic v RO rezimu a mit zalohu obsahu (po kazdem updatu), aby s to mohl nahodit zpet na jinej disk.

Ve tvem pripade by asi stacil rsync ze systemoveho ssd na datovy pole kde ochranu na vypadek mas. A pak skrze live distro to z tama vytahnes v pripade obnovy nebo migrace.

jjrsk

  • *****
  • 571
    • Zobrazit profil
Re:Reported uncorrectable errors na SATA SSD
« Odpověď #2 kdy: 23. 09. 2024, 18:03:27 »
Predevsim, u vsech cisel ve smartu je podstatny, jestli se menej.

Kdyby to byl problem, tak pri tomhle cisle z toho disku davno neprectes ani bit ;D. Pokud si pamatuju, par patku nazad probehla aferka na tema ze nektery disky (nevim estli zrovna ten tvuj) presne tohle cislo neustale navysujou. A vyrobce pak mlel neco o tom, ze to cislo znamena neco jinyho nez znamena ...

Navic bys realne chyby mel pak videt i v dmesg. I kdybys tam totiz nevidel zadny error na disku, videl bys tam:

Kód: [Vybrat]
perf: interrupt took too long ...

Porad dokola a velice casto.  Ja to obcas vidim kdyz je disk na maximu zatizeni a nestiha. Ale videl sem to i kdyz chyboval = snazil se to cist porad dokola, ono se mu to vetsinou povedlo, ale vykon byl tragickej.

Kazdopadne prover pripojeni = domacknuti konektoru, pripadne vymen kabelaz.


Re:Reported uncorrectable errors na SATA SSD
« Odpověď #3 kdy: 23. 09. 2024, 19:53:29 »
perf: interrupt took too long neznamená problém s diskem, objevuje se často, když něco počítáte a CPU jede na plno.

viz https://bbs.archlinux.org/viewtopic.php?id=187636

problém s diskem bude v dmesg prostě error