SSD disk: integrita dat při výpadku proudu

k.

SSD disk: integrita dat při výpadku proudu
« kdy: 10. 10. 2016, 17:28:18 »
mam par let stary SSD disk crucial M4.
monitoring disku mi hlasi ze je disk ve vybornem stavu 87%
Kód: [Vybrat]
The status of the solid state disk is PERFECT. Problematic or weak sectors were not found.
The TRIM feature of the SSD is supported and enabled for optimal performance.
The health is determined by SSD specific S.M.A.R.T. attribute(s):  #202 Percentage Of The Rated Lifetime Used

No actions needed.

v posledni dobe jsem si zacal vsimat, ze se mi ztraci data z textovych souboru a jsou nahrazeny dlouhou sekvenci pouze NULL znaku.

dle SMART je vse v poradku a pritom se v tichosti deji takove veci

Setkal se nekdo s necim podobnym? Mohl by za to teoreticky vypadek elektrickeho proudu ackoliv v dobe vypadku se se souborem nepracovalo?
« Poslední změna: 10. 10. 2016, 18:24:57 od Petr Krčmář »


Daniel Kozak

Re:SSD disk, integrita dat, vypadek proudu
« Odpověď #1 kdy: 10. 10. 2016, 17:46:12 »
Tak jde o to zda se ti to stava casto, nebo jenom jednou prave po nejakem vypnuti. Vypadek proudu muze zpusobit ledacos. Jinak mam zkusenost ze SMART je na nic. U vetsiny disku co mi odesly nic nepoznal. Mam tu dva SSD disky co proste nahodne rozbiji sektory a SMART tvrdi ze jsou uplne v poradku.

Edit admin: Necitujte celé příspěvky nad sebou, zhoršuje to čitelnost fóra.
« Poslední změna: 10. 10. 2016, 18:26:05 od Petr Krčmář »

k.

Re:SSD disk, integrita dat, vypadek proudu
« Odpověď #2 kdy: 10. 10. 2016, 18:01:07 »
stalo se mi to vicekrat tento rok - asi za to muze opravdu vypadek proudu, ale mozna i nasilne vypnuti podrzenim vypinace (pri zaseknuti)

to jak se to deje v tichosti a muze se na to prijit za dlouhou dobu je opravdu neprijemne.

zalozni napajeni je tedy asi nezbytne.

j

Re:SSD disk: integrita dat při výpadku proudu
« Odpověď #3 kdy: 10. 10. 2016, 18:42:38 »
Vypnuti = totez jako vytrzeni ze site.

Tohle chovani je zavisly na modelu, a v nekterych pripadech to muze dojit tak daleko, ze SSDcko proste uplne chcipne (prave kvuli odpojeni napajeni). Kdyz zagooglis, tak najdes mozna par postupu, jak donutit ssdcko vyprazdnit vsemozny cache. Protoze to ssdcko zapisuje i v pripade, ze ty nic nezapisujes. Dela si tak udrzbu. A nektery modely mely problem prave treba v tom, ze pokud vytrhnes napajeni, tak se neulozi informace o pouzivanych blocich, a to SSDcko rozhodi tak, ze ho proste uz normalnima nastrojema nerozjedes. Tohle konkretne by vsechny novsi modely uz mely mit vyreseno.

Ve tvym pripade bych to videl na nasledujici. SSD si drzi v cache preklad sektory/bloky. A tenhle preklad samo musi aktualizovat i v situaci, kdy dela udrzbu(tzn presunuje starsi bloky jinam, aby je refreshnul, uvolnuje misto, optimalizuje ...) = musel by to opakovane nekam zapisovat. Tzn, zapisuje to jen cas od casu, coz je presne to, o co prijdes, kdyz to odpojis.

Z pohledu SMART je tudiz naprosto OK. Porid si UPS, nebo pohledej, jestli neexistuje nejaka aktualizace firmware. Novsi ssd to resej prevazne tak, ze je na nich kondik, kterej ten finalni zapis potom, co ssd ztrati napajeni, udrzi.

k.

Re:SSD disk: integrita dat při výpadku proudu
« Odpověď #4 kdy: 10. 10. 2016, 19:53:14 »
Dekuji za vysvetleni.

Objednavam zalozni zdroj a nejspis provedu i aktualizaci firmwaru SSD.


Ondro

Re:SSD disk: integrita dat při výpadku proudu
« Odpověď #5 kdy: 10. 10. 2016, 19:58:05 »
Starsie SSD mali praveze castejsie kondiky ako ochranu pri vypadku elektriny. Pri novych je to skor rarita, najdes ich len medzi drahsimi SSD.

UPS nieje zla, ja by som skor vymenil to SSD.

JardaP .

  • *****
  • 11 064
    • Zobrazit profil
    • E-mail
Re:SSD disk: integrita dat při výpadku proudu
« Odpověď #6 kdy: 10. 10. 2016, 20:11:16 »
...nejspis provedu i aktualizaci firmwaru SSD.

Jestlipak pri tom zarvou data?

Jenda

Re:SSD disk: integrita dat při výpadku proudu
« Odpověď #7 kdy: 10. 10. 2016, 21:03:48 »
v posledni dobe jsem si zacal vsimat, ze se mi ztraci data z textovych souboru a jsou nahrazeny dlouhou sekvenci pouze NULL znaku.
Podle mě to může být i filesystémem, který garantuje jen žurnálování metadat (např. default nastavení ext4) a ne dat.

RDa

  • *****
  • 3 081
    • Zobrazit profil
    • E-mail
Re:SSD disk: integrita dat při výpadku proudu
« Odpověď #8 kdy: 10. 10. 2016, 22:49:52 »
Od toho existuji profesionalnejsi SSD - s kondenzatorama, ktere osefuji stav pri ztrate napajeni - SSD samotne se pak korektne vypne (cache se rychle zapise) a po zapnuti se uvede do interne korektniho stavu. Pak uz budou chybet jen data ktere zavisi na filesystemu a chovani pri obnove ze zurnalu.

ByCzech

  • *****
  • 1 870
    • Zobrazit profil
    • E-mail
Re:SSD disk: integrita dat při výpadku proudu
« Odpověď #9 kdy: 10. 10. 2016, 23:07:56 »
...nejspis provedu i aktualizaci firmwaru SSD.

Jestlipak pri tom zarvou data?

Záleží na výrobci a na modelu.

Aktualizace např. Crucial MX100 - bez ztráty dat, Transcend SSD 370 při aktualizaci FW data zlikviduje. Nějaké OCZ likviduje podle verze FW. :-D
Prostě je třeba číst, co výrobce píše.

ByCzech

  • *****
  • 1 870
    • Zobrazit profil
    • E-mail
Re:SSD disk: integrita dat při výpadku proudu
« Odpověď #10 kdy: 10. 10. 2016, 23:17:05 »
Osobně si myslím, že to také může být efekt postupného ztrácení dat. Flash postupně prostě "zapomíná". Podobně jako klasická DRAM, akorát ta to zapomene hned po vypnutí :D

j

Re:SSD disk: integrita dat při výpadku proudu
« Odpověď #11 kdy: 11. 10. 2016, 02:07:41 »
SSDcko data zapomene, ale po hodne dlouhy dobe, co ho nechas vypnuty, proto za chodu dela udrzbu - cas od casu bloky presunuje. Ony data ostatne zmizej i na megnetickym disku ... za desitky let.

Kolemjdouci

Re:SSD disk: integrita dat při výpadku proudu
« Odpověď #12 kdy: 11. 10. 2016, 19:49:42 »
Kód: [Vybrat]
The TRIM feature of the SSD is supported and enabled for optimal performance.

v posledni dobe jsem si zacal vsimat, ze se mi ztraci data z textovych souboru a jsou nahrazeny dlouhou sekvenci pouze NULL znaku.

Tohle může být chybou ve firmware, zkuste vypnout TRIM, možná máte podobně chybný firmware jako má Crucial M500 nebo jako měl M550 bez upgrade na MU02: https://bugzilla.kernel.org/show_bug.cgi?id=71371

Ondro

Re:SSD disk: integrita dat při výpadku proudu
« Odpověď #13 kdy: 11. 10. 2016, 23:09:25 »
SSDcko data zapomene, ale po hodne dlouhy dobe, co ho nechas vypnuty, proto za chodu dela udrzbu - cas od casu bloky presunuje. Ony data ostatne zmizej i na megnetickym disku ... za desitky let.

SSD zabuda data umerne opotrebovanosti a okolnej teplote. Ak je SSD naozaj opotrebovane a okolita teplota je vysoka, tak SSD nemusi udrzat data ani jeden den odpojenia od napajania. S rastucou teplotou rapidne klesa doba udrzania dat.

U beznych NAND flash pred par rokmi(za ery 34 a 25nm) vyrobcovia udavali udrzanie dat (data retention) 10 rokov. Ako je to teraz a hlavne s TLC neviem, lepsie to rozhodne nebude.
Opotrebovane SSD(vlastne vsetko s NAND flash) nieje dobre odpajat od elektriny na dlhsiu dobu. Daju s ak tomu na internete najst zaujimave materialy.

U klasickych diskov vyrobcovia tiez udavali data retention na 10 rokov. Aka je realna a od coho zavisy netusim. Studoval som len zivotnost NAND flash diskov.

Sten

Re:SSD disk: integrita dat při výpadku proudu
« Odpověď #14 kdy: 12. 10. 2016, 02:29:17 »
To, že by nějaké SSD po výpadku proudu ztratilo FTL (mapu alokací, wear-levelingu, bloků k vymazání ap.) a umřelo, mi přijde jako blbost. Výpadek napájení je u PC běžný (co asi tak dělá tlačítko reset?) a vyřizovat reklamace disků, které to nepřežijí, by se dost prodražilo. A přitom je řešení velmi jednoduché a levné, už CompactFlash používaly log-structured FTL, takže výpadek znamenal pouze to, že se nezapsalo nejnovější rozložení alokací, ale paměť se nikdy nedostala do stavu, kdy by měla nefunkční FTL.

Může se stát, že tohle konkrétní SSD má firmware, kde se provede TRIM před zápisem změn do FTL, pak by při výpadku proudu byly v FTL vedeny vymazané bloky. Nicméně všechny flash paměti mají po vymazání bity nastavené na 1 a takové sektory by tak byly plné 0xFF, nikoliv NULL. Navíc snad většiny SSD při poslání příkazu TRIM pouze označí blok pro vymazání, ale vymažou ho až někdy později, a v té době už by měl být zapsaný změněný stav FTL.

Nepíšete, jaký souborový systém tam máte. Bloky plné NULL běžně dělalo při výpadku proudu XFS (v souladu s mottem „lepší žádná data než vadná data“). Jediné rozumné řešení na to byla UPS, ale XFS jsem už osm let nepoužíval, tak možná už dnes to motto opustili. U ext* mohou být data poškozena, pokud nejsou žurnálována a dojde k výpadku napájení při jejich zápisu, ale typicky tam je bordel, ne NULLy; nicméně SSD vrací NULLy při dotazu na bloky, pro které nemá v FTL mapování (typicky TRIMované), takže to může být i to. Žurnálování dat by to spravilo, ale dost výrazně zkrátí životnost i výkon toho SSD (žurnál zapisuje na jedno místo a běžné SSD umí rotovat bloky jen uvnitř skupin bloků). Btrfs a podobné COW filesystémy by se nikdy neměly dostat do stavu, kdy budou mít poškozená data, maximálně budou mít stará data (za předpokladu, že disk dodržuje write barriery, tzn. data za write barrier nezapíše dříve než data před ní, ale to dnes už snad všechny dělají).

U beznych NAND flash pred par rokmi(za ery 34 a 25nm) vyrobcovia udavali udrzanie dat (data retention) 10 rokov. Ako je to teraz a hlavne s TLC neviem, lepsie to rozhodne nebude.

U současných MLC to je okolo jednoho roku při 25°C a 32 hodin při 70°C [Carnegie Mellon], u TLC okolo měsíce při 25°C a méně než 24 hodin při 50°C, levnější (a pomalejší) TLC vydrží i déle [JEDEC].