HW raid 10 vs 6

mfrd

Re:HW raid 10 vs 6
« Odpověď #30 kdy: 22. 01. 2021, 19:04:33 »
MTBF není jen marketingový údaj v rámci FTA a vícenásobných systémů společně s MTTR opravdu ovlivňuje design.

Jinak ačkoliv se technologie hodně posunula spoustě lidí tady chybí úplné základy. Doporučuji si projít tento odkaz
https://www.snia.org/sites/default/education/tutorials/2008/spring/storage/Whittington-W_Desktop_Nearline_Enterprise_HDDS.pdf
Zde je vysvětleno proč Enterprise má význam, co se děje v SAS , V SATA přenosu jaká je chybovost a celkový dopad.



PanVP

Re:HW raid 10 vs 6
« Odpověď #31 kdy: 22. 01. 2021, 20:02:26 »

Re:HW raid 10 vs 6
« Odpověď #32 kdy: 23. 01. 2021, 10:11:56 »
MTBF není jen marketingový údaj v rámci FTA a vícenásobných systémů společně s MTTR opravdu ovlivňuje design.

Jinak ačkoliv se technologie hodně posunula spoustě lidí tady chybí úplné základy. Doporučuji si projít tento odkaz
https://www.snia.org/sites/default/education/tutorials/2008/spring/storage/Whittington-W_Desktop_Nearline_Enterprise_HDDS.pdf
Zde je vysvětleno proč Enterprise má význam, co se děje v SAS , V SATA přenosu jaká je chybovost a celkový dopad.
Jedine co muzu potvrdit je zasadni rozdil v rozhrani. Ten tu byl, je a jeste nejakou dobu bude. Vcetne moznosti ktere SCSI nabizi a to je prima manipulace s tabulkami chyb. To v podstate SATA neumi, muzete si jen precist nejaky obecne country a logy pres smart, na primou manipulaci standardy na to nejsou a je to mozne jen pres diagnosticke rozhrani.
Zpusob zaznamu  a ani detail zavady vam vendor neprozradi jako kdysi. Kdyz je svolavani vice disku z poli maximalne to chce poslat zpatky do labu s popisem zavad. Zpatky prijde rozkaz na recall nebo novy firmware specialne pro vas jako firmu vyrabejici SAN/NAS reseni.

 Bohuzel spousta toho davno z clanku jiz neni pravda. Ano plotny se porad tridi na consumer a enterprise ale zbytek je stejny level jako consumer base. Loziska stejny, hlavy stejny, kastle stejny.Chyby stejny. Nektere SAS disky uz maji jen jiny konektor asvab navic a jiny a fw. Jiny fw a narocnejsi testovani je asi ten nejvetsi rozdil.

Bullshit o MTBF stale zustava. Na nizsi tiery se proste drahe enterprise disky nevyplaci pokud mate obcasnou jednostrannou zatez jako dlouhy read nebo write tak v pohode bych poridil hromadu rotacnich disku do desktopu. Jo je to uzasny prodat zakosovi 2x drazsi disk ve stovkach kusu a kdybych byl nagelovanej bezpaterni obchodak tak se budu svym obratem chlubit u piva ale na ty mene vyznamne tiery / castou zalohu je to proste vyhozeni penez z okna.

Zatim je dost velky rozdil v enterprise a consumer ssd/nvme discich a tady bych fakt slapnuti vedle neriskoval. Muzete prijit o velke kusy replik a ty levne ssd "placacky na mouchy" se chovaji velmi nepredvidatelne co se poruchovych stavu tyce. Coz je pro vetsi storage reseni kolikrat mnohem vic fatalni nez kdyby se z disku jen zakourilo.

BTW: Co se toho 12 let stareho clanku tyce, FC disky uz v novych instalacich nevidam nekolik let vubec. Vypada to ze je to co se tyce rozhrani disku je to vymrely druh.

mfrd

Re:HW raid 10 vs 6
« Odpověď #33 kdy: 23. 01. 2021, 16:44:26 »
Jde o to pochopit základy a z toho odvodit dále. Poznat rozdíl, že SATA a SAS není jen rozdíl v konektoru, ale v mnohém dalším.

A propo MTBF opravdu není bullshit. Jen pro ty co ho označují za Bullshit asi neznají vztah k MTTR a dostupnosti. A samozřejmě počítání spolehlivosti při sériovém zapojení nebo paralelním zapojení.

MTBF je statistická hodnota, která se musí správně využívat. Pro neznalého člověka souhlasím je to nepoužitelné číslo.

Pokud si uvědomíme, že zejména u SATA při obnově existuje v současných kapacitách vysoká pravděpodobnost, že Rebuild RAIDu bude obsahovat neopravitelnou chybu. Tak snížení počtu rebuildů je významným faktorem, zejména pokud si uvědomíme jak s rostoucí kapacitou narůstá MTTR (tedy doba obnovy).

Samozřejmě, pokud uchováváte nedůležitá data, tak případná UER  (neopravitelná chyba) Vás netrápí. Pokud však data jsou důležitá, a znáte dobu a výslednou cenu obnovy pro případ takové chyby ze zálohy. Tak velmi rád zaplatíte x násobek vůči desktop komponentám. Spolehlivostní matematika je velmi jednoduchá a exponenciální. Prostě ano s porovnáním s Alzou, vám může připadat renomované diskové pole o stejné kapacitě jako předražený krám. Jsou však pouze dvě řešení, buď si problematiku nastudujete a víte proč platíte a nebo půjdete cestou pokusu a omylu, což však může hodně bolet. V demokracii je to pouze Vaše volba. Z odborného hlediska musím vyvažovat hodnotu pro zákazníka. Tj. vyvažovat náklady a rizika společně se zákazníkem.

Re:HW raid 10 vs 6
« Odpověď #34 kdy: 26. 01. 2021, 17:38:18 »
Dakujem za dokument z roku 2008. Je pravda, ze zopar zakladov je platnych aj dnes, ale ... radsej by som ten dokument dal do archivu. Pretoze je tu stale velka skupina odvaznych, ktorym staci si rychlo niekde precitat a prehlasit to za svatu pravdu.

Perla c.1 z dokumentu - Anatomy of an Enterprise Drive: 4 platters & 8 heads design
a realita z roku 2009 z mojich servrov:
- Seagate Constellation.2 SAS obsahoval 2x250GB platne a 4 R/W heads
nasledovnik Seagate Enterprise Capacity 2.5 HDD v3, obsahoval uz 3x400GB platne a 6 R/W heads
a to plati aj na dnesne disky.
ten kto pisal ten slideware nemal toho mnoho rozmontovaneho.


Re:HW raid 10 vs 6
« Odpověď #35 kdy: 26. 01. 2021, 17:45:15 »
k MTBF na zaver:
Citace
MTBF je statistická hodnota, která se musí správně využívat. Pro neznalého člověka souhlasím je to nepoužitelné číslo.

suhlasim, je to statisticky udaj. a ak robite s datami, tak by vam malo zalezat, aby ste vedel, ako presne k nemu ten vendor prisiel a ci sa da ten udaj zreplikovat vo vasich podmienkach.
Inak hrozi, ze si kupite auto, ktore statisticky havaruje 2x za 5 rokov, akurat to vase bude mozno zajtra mrtve. To je statistika.

A ako to vlastne je s tym realnym pouzitim MTBF pise aj Seagate:
https://www.seagate.com/gb/en/support/kb/hard-disk-drive-reliability-and-mtbf-afr-174791en/

Seagate is no longer using the industry standard "Mean Time Between Failures" (MTBF) to quantify disk drive average failure rates. MTBF has proven useful in the past, but it is flawed.

PanVP

Re:HW raid 10 vs 6
« Odpověď #36 kdy: 26. 01. 2021, 22:28:58 »
Hoooši, měli byste jít dělat ředitele do firmy INTEL

Fakt jim jako chybíte!
Podívejte se, jaké píšou věci...teda...měli byste jim to vysvětlit.

https://www.intel.com/content/dam/support/us/en/documents/server-products/Enterprise_vs_Desktop_HDDs_2.0.pdf

mfrd

Re:HW raid 10 vs 6
« Odpověď #37 kdy: 27. 01. 2021, 08:33:08 »
k MTBF na zaver:
Citace
MTBF je statistická hodnota, která se musí správně využívat. Pro neznalého člověka souhlasím je to nepoužitelné číslo.

A ako to vlastne je s tym realnym pouzitim MTBF pise aj Seagate:
https://www.seagate.com/gb/en/support/kb/hard-disk-drive-reliability-and-mtbf-afr-174791en/


AFR hodnocené za periodu jednoho roku.

relationship between AFR and MTBF (in hours) is

AFR=1-exp(-8766/MTBF)

Seagate změnil ukazatel z důvodu, jiné prezentace a nepochopení lidí. Ve své podstatě to v tom článku vysvětlili.




Re:HW raid 10 vs 6
« Odpověď #38 kdy: 28. 01. 2021, 11:53:54 »
pani, ten zdroj vypoctu (asi wikipedia) by ste mali brat naozaj ako silne teoreticky a zjednoduseny vypocet.

Dovod:
Vratim sa k jednej debate z roku 2014, ktoru mam poznacenu v mojich zalozkach. Ma v sebe viac reality, ako teorie. Link je tu:
https://www.truenas.com/community/threads/the-math-on-hard-drive-failure.21110/

Matematika (priamo v linku):
- pre vypocet Failures rate musite brat do uvahy, aky mate Array, kolko je v nom diskov a kolko je z toho realne redundandnych diskov
- ak do toho zaratate aj geometriu blokov, tak sa posuvate dalej k presnejsim vypoctom

Skuste si to dat do excelu a zistite, ktory typ RAIDu a nastavenia jeho poctu diskov/redundancie bude vplyvat na moznosti vzniku failures.
Ak ste prave zistili, ze RAID5 je na tom horsie ako RAID10, tak mate dalsi dovod skumat viac informacii ako len pozerat na MTBF.

MTBF je udaj, ktory "odhaduje" spolahlivost pri dodrzanych laboratornych podmienkach na skupine diskov (to je k tej statistike).
Nie je garanciou niecoho, co by malo byt brane ako primarny evaluator zivotnosti samotneho a konkretneho disku, ktory pouzivate.
Druhy pohlad MTBF = Mean Time = priemerny cas. Priemer je jeden z najmenej presnych ukazovatelov. Preto ludia na presne vypocty pouzivaju percentily.
Priemerny pocet hodin, kedy padne dopravne lietadlo je tiez k nicomu = MTBF je to iste.

Cela ta prezentacia, na ktoru ste tu upozornili je o rozdeleni na Enterprise/Desktop, ktora neberie do uvahy, ze svet nie je len cierny/biely. Dtto ten Intel doc.


mfrd

Re:HW raid 10 vs 6
« Odpověď #39 kdy: 29. 01. 2021, 07:32:17 »
Jakékoliv vyjádření spolehlivosti má své problémy, zejména v tom kdy a jaké selhání se projevují. To jest větší míra problémů v počátcích a ke konci života daného zařízení.

MTBF je samozřejmě buď vypočtená hodnota nebo empiricky zjištěná. Samo číslo o sobě bez např. vazby na MTTR z praktického hlediska nepomůže.

Ano i wiki zobrazuje propočet na AFR, což samo o sobě není špatně . Stejně tak jako stejný přepočet používají např.
zde:

https://www.sciencedirect.com/topics/computer-science/mean-time-between-failure

AFR je pouze jiné vyjádření skutečnosti - procentuální- vyjádřené jako MTBF a naopak.

Pokud bude výrobce lhát a bude si připisovat vyšší spolehlivost (tedy vyšší MTBF, nižší AFR) než ve skutečnosti má. Pak jeho výrobky budou vnímané jako nekvalitní.

Jinak dále k původu dokumentu, který byl označen v průběhu diskuse, že autor je mimo mísu. Dokument je publikován pod hlavičkou SNIA. Tedy žádný studentík, který někde něco publikuje. Členové SNIA jsou společnosti vyrábějící disky a disková pole. Dále dokonce autor tjo slideware pocházel ze společnosti Seagate.

Dokonce i ten Intel refreshnutý dokument shrňuje to co je vyjádřeno ve SNIA dokumentu.




Re:HW raid 10 vs 6
« Odpověď #40 kdy: 29. 01. 2021, 12:00:24 »
Pánové řešíte nesmysly. Disky jsou nespolehlivá zařízení a každý den hrajete loterii. Proto jsou v roce 2021 úvahy o RAID 10 nebo 6 zamrznutím v čase, řešením pro dnešní dobu je distribuované úložiště/FS.

Re:HW raid 10 vs 6
« Odpověď #41 kdy: 29. 01. 2021, 15:16:18 »
Pánové řešíte nesmysly. Disky jsou nespolehlivá zařízení a každý den hrajete loterii. Proto jsou v roce 2021 úvahy o RAID 10 nebo 6 zamrznutím v čase, řešením pro dnešní dobu je distribuované úložiště/FS.

ano, i v konzervativním bankovním sektoru se přechází na distribuované uložiště, odhadem největší české banky už mají poměr 50:50 v porovnání s diskovými poli, ty už se skoro nerozšiřují.

Porovnávání čísel hypotetické spolehlivosti se řešilo snad vždy, pak člověk koupí disky najednou z jedné série a umřou mu všechny ve stejném čase.