Utilizace disku zahlcuje celý server

jjrsk

  • *****
  • 691
    • Zobrazit profil
Re:Utilizace disku zahlcuje celý server
« Odpověď #15 kdy: 12. 02. 2025, 09:10:14 »
... a neni tento jeden treba povesen na PCH a timpadem znevyhodnen co se tyce latenci nebo sirce pasma?
Nebo se o ten kanal s necim deli. Ale to by zase nemel nijak vyznamne ovlivnit trim, o cemz tazatel pise ze to na chvili pomuze.


Re:Utilizace disku zahlcuje celý server
« Odpověď #16 kdy: 12. 02. 2025, 13:18:39 »
Tak jsem to dále zkoumal. Když spustím fstrim, tak to zhruba 2 hodiny je ok a pak postupně to jde do toho maximálního loadu. Vidím i jak utilizace časem stoupá. Pro všechny FS, které jsou na ext4, jsem zapl discard, ale nepomohlo to. Takže nezbývá asi než zapnout trim každé dvě hodiny?

Re:Utilizace disku zahlcuje celý server
« Odpověď #17 kdy: 12. 02. 2025, 13:33:37 »
No, já bych ten disk osobně teda vyhodil a pořídil něco vhodného pro servery.

Re:Utilizace disku zahlcuje celý server
« Odpověď #18 kdy: 12. 02. 2025, 14:01:29 »
...
Takže nezbývá asi než zapnout trim každé dvě hodiny?

Nikoliv, tím byste se možná pokusil řešít následek. Navíc není žádná jistota, že to i do budoucna pomůže, protože nevíte, proč se to děje.
Je tam určitá šance, že pokud ty ostatní tenhle problém nevykazují a je tam na oba RAIDy víceméně podobná zátěž, tak je prostě jeden kousek ze čtyřech vadný.
Ale jak jsme tu psali, abyste si to potvrdil, vyhoďte nejdřív ten podezřelý z RAIDu, neznám úplně jiný způsob, jak to zjistit. Pojedete chvíli bez redundance, ale jestli je to SSD skutečně nějak nakopnuté, má dlouhé latence a celý RAID na něj čeká, tak by ty problémy měly ustat.

Jinak samozřejmě, je pravda i to, že nezávisle na případném vadném kousku jde o entry-level consumer SSD. Jestli je ten server vytěžovaný a jde vám o spolehlivost a dostupnost, tak ty serverová SSD mají své opodstatnění a samozřejmě i důvody, proč pak stojí třeba dvakrát tolik.

jjrsk

  • *****
  • 691
    • Zobrazit profil
Re:Utilizace disku zahlcuje celý server
« Odpověď #19 kdy: 12. 02. 2025, 14:39:21 »
Podle toho co si napsal generujes zhruba 1GB/hod zapisu.

V nehorsim pripade to znamena 2097152 zapisu (512B/zapis). Jenze ... velikost bloku toho ssdcka je podle vseho 64MB. Takze kvuli kazdymu jednomu zapisu bys pak musel nejdriv tech 64MB precist (coz odpovida tomu ze kdyz provedes trim, chvili se to nedeje), coz ti generuje 134TB/hod. Tzn cca 40MB/s cteni, a to je slusna porce i pro SSD. Pricemz to zdaleka neni vsechno. Protoze to samy pak musis upravit a zpet zapsat.

Tudiz krome toho ze jeden disk to nejspis nedava, mas dost pravdepodobne problem ve velikosti bloku toho raidu + bloku fs.


RDa

  • *****
  • 2 893
    • Zobrazit profil
    • E-mail
Re:Utilizace disku zahlcuje celý server
« Odpověď #20 kdy: 12. 02. 2025, 17:53:13 »
Jeste bych se podival na SMART rozdil, udelejte 2 vzorky vzdalene 24 hodin (nebo hodinu ve spicce) terba pres vsechny disky pomoci nvme smart-log a odectete objem cteni i zapisu, at vidite o jakou zatez se vlastne jedna.

(snad LVM mirror neni tak blbej, ze by kazdej zapis povazoval za update celeho LVM extentu, coz je 4MB)

Re:Utilizace disku zahlcuje celý server
« Odpověď #21 kdy: 13. 02. 2025, 12:49:38 »
Tenhle model disku mám, nemá rád teploty takže solidní chladič je nutnost, když kopíruju více dat jednorázově (cca 400GB+). Udělal bych kontrolu zda se přehřívá když je hodně vytížený. Určitě bych alespoň toto ověřil.

Osobně jej ale používám jako sekundární velké úložiště, na hlavní pak Samsung 990 Pro (heatsink) a to pro stolní PC.
O jeho vhodnosti nasazení jako hlavní disk nejsem přesvědčen (testováno cca 3 měsíce). Nasazení v serveru mě přijde riskantní až nevhodné. Beru to pouze jako velké úložiště.