Chyby na různých discích na Btrfs poli

RDa

  • *****
  • 2 729
    • Zobrazit profil
    • E-mail
Re:Chyby na různých discích na Btrfs poli
« Odpověď #15 kdy: 13. 10. 2024, 22:58:44 »
Mám tedy v poli 4x4TB a 2x3TB.

A ukladaci politika je jaka? mirror na 2 mista nebo neco lepsiho? Pri poctu 6 disku bych tam dal klidne R6 :) To by teoreticky melo dat (6-2)*3 + (4-2)*1 = 12+2 = 14 TB vyuzitelne kapacity.

A taky se pridavam k ostatnim.. ze pokud "neni jiste ze je to 6G" je neco co resite, tak bych tomu zadna data nesveroval. Pan je asi kaskader a opakovane varovani mu doposud nevyjasnili ze takhle ne..  achjo.


rmrf

Re:Chyby na různých discích na Btrfs poli
« Odpověď #16 kdy: 14. 10. 2024, 13:15:14 »

Asi by bylo vhodné zaměřit se na kontrolu hardwaru.

S.M.A.R.T. diagnostika disku: Klíčové položky, na které je potřeba se zaměřit:
    Reallocated_Sector_Ct: Počet přemapovaných sektorů. Zvýšený počet znamená problémy s povrchem disku.
    Pending_Sector: Počet sektorů čekajících na přemapování. Tento ukazatel je kritický.
    Uncorrectable_Sector: Počet neopravených sektorů.

Kontrola kabelů a připojení: Zkontrolovat fyzické připojení disku, zejména SATA/IDE kabely a napájecí kabely, které mohou být zdrojem problémů se čtením a zápisem dat.

Testování napájení: Nestabilní napájení může způsobovat problémy s diskem. V případě podezření na problémy s napájením je dobré zkontrolovat napájecí zdroje nebo zvážit použití UPS. Taky to, že všechny disky budou pověšené na jedné kšandě, stabilitě napájení moc nepřidá.

Kontrola RAM: Vadná paměť RAM se může v důsledku projevit chybami na disku.

Test povrchu disku: Např. badblocks.

Dál bych popřemýšlel nad tím, jestli je k filesystému s raid1 vhodné připojit dva potenciálně vadné disky a poté provést full rebalanc. Protože po tom rebalancu se alespoň některým datům může stát, že budou uložena právě a jen na těch dvou podezřelých discích. Pokud jsou ty disky podezřelé, otestoval bych je (smart, badblocks) někde jinde. Pokud tedy není k dispozici jiný systém, alespoň bych je v tom jediném možném systému otestoval samostatně předtím, než je připojím do raidu a nahraju na ně ostrá data.

Re:Chyby na různých discích na Btrfs poli
« Odpověď #17 kdy: 14. 10. 2024, 15:45:43 »
Citace
S.M.A.R.T. diagnostika disku: Klíčové položky, na které je potřeba se zaměřit:
    Reallocated_Sector_Ct: Počet přemapovaných sektorů. Zvýšený počet znamená problémy s povrchem disku.
    Pending_Sector: Počet sektorů čekajících na přemapování. Tento ukazatel je kritický.
    Uncorrectable_Sector: Počet neopravených sektorů.
kromě 1 realokovaného sektoru na jednom disku jsem tam neviděl problém, viz některý z předchozích příspěvků. (To že tam ten problém nevidím já neznamená že tam není)

Citace
Kontrola kabelů a připojení: Zkontrolovat fyzické připojení disku, zejména SATA/IDE kabely a napájecí kabely, které mohou být zdrojem problémů se čtením a zápisem dat.

Všechny sata kabely jsem před posledním scrubem vypojil a ty u kterých jsem měl pochybnosti vyměnil. Ale i tak tam byly chyby a to nejenom ty neopravitelné co tam jsou od minula.

Citace
Testování napájení: Nestabilní napájení může způsobovat problémy s diskem. V případě podezření na problémy s napájením je dobré zkontrolovat napájecí zdroje nebo zvážit použití UPS. Taky to, že všechny disky budou pověšené na jedné kšandě, stabilitě napájení moc nepřidá.
Mám to v této skříni: https://www.silverstonetek.com/en/product/info/server-nas/CS380/ . Má šuplíky na disky a k nim backplane. Zde mám máslo na hlavě, protože te%d jsem si to překontroloval, a našel jsem tam další napajecí konektory, které jsem neviděl.

Citace
Kontrola RAM: Vadná paměť RAM se může v důsledku projevit chybami na disku.

Memtest jedu od večera. Je tam 22 průchodů bez chyb. Asi to teď ale přeruším a přidám tam to chybějící napájení.

Citace
Test povrchu disku: Např. badblocks.

Ty dva nové 4TB seagate disky jsem první přejel badblocks - bez chyb. Pak jsem na ně nahrál data z těch 4TB WD, které jsem pak přejel badblocks - také bez chyb. Ty 3TB WD jsem netestoval, ale ty mě nebyly podezřelé.

Citace
Dál bych popřemýšlel nad tím, jestli je k filesystému s raid1 vhodné připojit dva potenciálně vadné disky a poté provést full rebalanc. Protože po tom rebalancu se alespoň některým datům může stát, že budou uložena právě a jen na těch dvou podezřelých discích. Pokud jsou ty disky podezřelé, otestoval bych je (smart, badblocks) někde jinde. Pokud tedy není k dispozici jiný systém, alespoň bych je v tom jediném možném systému otestoval samostatně předtím, než je připojím do raidu a nahraju na ně ostrá data.

Full rebalanc jsem udělal po tom, co mi vyšel scrub úplně bez chyb.


Půjdu teď přidat ty napájecí kabely, pak pustím scrub a uvidím co to udělá

RDa

  • *****
  • 2 729
    • Zobrazit profil
    • E-mail
Re:Chyby na různých discích na Btrfs poli
« Odpověď #18 kdy: 14. 10. 2024, 16:20:38 »
Jeste pohlidat teplotu, pokud ty disky jsou nad sebou namackane

Re:Chyby na různých discích na Btrfs poli
« Odpověď #19 kdy: 14. 10. 2024, 16:23:18 »
Tak napájení opraveno, pouštím scrub.

Citace
Jeste pohlidat teplotu, pokud ty disky jsou nad sebou namackane
Do disků foukají ventilátory, a podle logů teploty nepřesáhly 40˚C.