3706
Odkladiště / Re:Jak správně zálohovat data okolo 20 GiB
« kdy: 16. 10. 2017, 13:31:53 »Pane Šilhavý, já si myslím, že to nikdo nezpochybňoval.V tom případě jste asi přehlédl všechny příspěvky Milfause.
Tato sekce Vám umožňuje zobrazit všechny příspěvky tohoto uživatele. Prosím uvědomte si, že můžete vidět příspěvky pouze z oblastí Vám přístupných.
Pane Šilhavý, já si myslím, že to nikdo nezpochybňoval.V tom případě jste asi přehlédl všechny příspěvky Milfause.
Omyl, pisi o portalech, ktere vznikly v poslednich dvou trech letech.To jste ovšem zapomněl napsat. Reagoval jste na komentář o daňovém portálu.
A ackoliv ukonceni podpory npapi se vedelo minimalne rok dopreduCož je ovšem problém Oraclu. Že se Oracle hodí Java applety přes palubu se dopředu nevědělo.
Pokud není vadný, tak ne!To je opravdu výborná informace. Vy to víte dopředu, že ten disk je vadný? Kupujete disky „dejte mi pět bezvadných a tři vadné“? Asi těžko. Ve skutečnosti máte disky, u kterých nevíte, zda jsou vadné nebo bezvadné. Dokonce i dříve bezvadný disk se může změnit ve vadný. A to, že je disk vadný, se dozvíte buď tak, že rovnou začne hlásit tvrdé chyby a data vůbec nepřečte, a nebo právě tak, že vám vrátí špatná data, což zjistíte právě z kontrolního součtu. Ano, většina vadných disků se projeví tak, že budou rovnou vracet tvrdé chyby, ale to neznamená, že k vrácení chybných dat nemůže dojít.
Nechci se Milhause zastávat, ale opravdu tu někteří tvrdí, že disk vrací data podle nálady, což není pravda.Já jsme nikoho takového nezaznamenal. Naopak jsem si všiml, že Milhaus pořád předpokládá, že vadné disky nemohou existovat.
A takhle funguje cela statni sprava, zavadi reseni, ktera jsou zbytecna pomoci technologii, ktere jsou zastarale :-D Ve statni sprave se pouziva hromada portalu, jejichz existence je primo umerna EU dotacim:-) A pro elektronicke podepisovani se bohuzel bezne pouziva java applet nebo silverlight, asi ty vyvojarske firmy ziji v jinem vesmiru nez bezni smrtelnici.Pláčete sice hezky, ale na základě špatných informací. Daňový portál je mnohem starší, než ukončení podpory NPAPI v prohlížečích. Takže psát o „zavádění řešení“ je úplně mimo – zavedení Javy pro elektronický podpis na daňovém portálu před mnoha lety znamenalo nahrazení ActiveX komponenty, byl to tedy jednoznačně krok vpřed. To, že se pro elektronické podepisování běžně používá Java Applet nebo Silverlight, je dané tím, že to byly jediné dvě reálné možnosti. Pak už zbývala jen možnost proprietárních aplikací svázaných s konkrétním prohlížečem a platformou, např. ActiveX. Dnes je akorát potřeba Java Applety (a případně Silverlight, pokud se někde ještě používá) upravit na Java WebStart aplikace. Vývojářské firmy nežijí v jiném vesmíru, právě naopak, vývojářské firmy mohou použít jenom technologie, které jsou k dispozici.
O čem tedy celou dobu píšete? Na začátku bylo tvrzení, že je vhodné mít u souboru kontrolní součet, aby bylo možné rozpoznat, že disk je nemocný a vrátil špatná data. Vy to celou dobu zpochybňujete a tvrdíte, že disk nikdy za žádných okolností špatná data vrátit nemůže.nemocný disk vrací nemocná data.
To bych řekl, že nikdo nezpochybňuje.
Já se přiznám, že už se ani nenamáhám to číst.To je váš problém, že chcete setrvávat v bludu. Tak ty bludy aspoň dál nešiřte.
Jirsák nerozumí psanému textu, že?Pěkně prosím, kde v tom vašem textu bylo napsané, že je to 12 bitů na blok? Aby mohl někdo rozumět psanému textu, musí nejprve existovat ten psaný text. A také bývá vhodné, když ten text je psaný v nějakém všeobecně uznávaném jazyce, což lze jen stěží říct o shluku slov „Chyba dvanáctibitů se rozumí na celý blok!“ „Rozpoznat chyba až osmnáctibitový“ je také zajímavá češtin. Jestli on spíš nebude problém v tom, že Milfaus neumí psát.
Chyba 12bitů se rozumí na CELÝ BLOK!
Pokud má SSD interně 640b bloky (spíš by se slušelo říct stránky), tak se bavíme o to, že se dá opravit chyba až 12 bitů KDEKOLIV v tom bloku a rozpoznat chyba až 18b!!!
Přiznej se, že ty to děláš schválněAno, ty vaše nesmysly opravuju schválně. Zajímavé spíš je, proč vy ty nesmysly píšete.
například u SSD se používá 12-ti bitová ochrana, jinými slovy, pokud dojde k selhání 12-ti bitů, pořád to jde opravitZkuste se zamyslet nad tím, co jste napsal. Když načtete jeden bajt, tedy 8 bitů, může tam být 12 bitů chybných? 12 z 8? Nebo je to 12 bitů na celý disk? Takže když máte 512 GB SSD disk, může na něm být chybných 12 bitů, a pořád je možné obsah celého disku obnovit? To by ale znamenalo, že byste při každém čtení musel přečíst úplně celý disk, abyste mohl spočítat kontrolní kód a detekovat chyby, případně je opravit. Už vám je jasné, jaký jste napsal nesmysl? Už víte, že chybovost je nutné vždy uvádět jako podíl, tedy například že řadič ECC dokáže detekovat a opravit jednobitovou chybu v 64bitovém slově, případně dvoubitovou chybu v 64bitovém slově dokáže detekovat?
Kdyby měl Milfaus pravdu, tak by přece kontrola disků a řadičů byla zbytečná. Pokud by nemohla nastat chyba disku nebo řadiče, která by znamenala přečtení špatných dat, co byste na tom chtěl kontrolovat? Takže sám potvrzujete, že není možné se spolehnout na to, že disk 100% vždy vrátí správná data. Ano, pokud disk vrátí špatná data, je to ve většině případů způsobené závadou na disku nebo na řadiči. Ale proto se ty kontrolní součty používají, aby se takové závady odhalily.Data na discich se meni, neco jako 100% spolehlivost neni.Jenze milfaus ma pravdu a ty si zkontroluj disky a ovladac radice!
Vyvedu tě z omylu, ne každá databáze ukládá data v plaintextuProč by měla databáze ukládat data v plaintextu? Já jsem uváděl konkrétní příklad s celým číslem uloženým normálně ve dvojkové soustavě – obě dvě ta čísla jsou platné hodnoty, takže jenom z těch samotných hodnota databáze samozřejmě nepozná, že je něco špatně.
databáze jsou na změnu jednoho bitu poměrně dost citlivé!To už jste jednou psal, a já jsem vám to vyvracel, že většina dat uložených databází jsou uživatelská data, a pokud by došlo k překlopení bitu v nich, databázi to nijak vadit nebude.
Ono se to zvládne vesměs opravitAha, takže ty chyby, ke kterým podle vás nedochází, se vlastně vyskytují, ale magicky se to samo opravuje.
ale jak databáze zjistí nekonzistenci, musí se provést oprava.Opět, jaká nekonzistence, když k tomu podle vás nedochází?
Nebo že by nevadilo, kdyby docházelo k chybám a měnil by se datový kontejner virtuálního počítače?To, že vy jste se s nějakou chybou nesetkal, neznamená, že vůbec neexistují. Zřejmě taky nezálohujete, protože vám nikdy žádný disk neodešel a budete tvrdit, že k selhání disků nedochází. Víte, jiní lidé se ale neřídí jen svou vlastní zkušeností, takže když mají informace o tom, že disk může selhat, zálohují data, i když jim disk zatím neselhal.
Takové kontejnery mají běžně 60 GB obsazeného místa!
Data na disku se nemění!Stopy na disku jsou dnes tak blízko u sebe, že zápis do jedné stopy ovlivňuje i vedlejší stopy. Dnešní disky fungují spíš tak, že čtecí hlava přečte nějaký spíš šum než data, a na základě samoopravných kódů se z toho zrekonstruuje, co tam asi mělo být uloženo. Ta data se nemění v tom smyslu, jak si to představujete vy, že by na tom disku někde byla vyražená jednička a sama se změnila na nulu. Ne, ta data se mohou změnit tak, že tam toho šumu může být už příliš mnoho, víc, než kolik zvládnou opravit dané samoopravné kódy.
Může to hlídat i souborový systém.Aha, takže souborový systém hlídá chyby, které nemohou nikdy nastat. Proč pak to asi dělá?
A dobrý archivační program ti zajistí jak integritu tak se dokáže sám opravit!A dokonce i dobrý archivační program hlídá chyby, které nemohou nikdy nastat. Zdá se, že v oblasti ukládání dat panuje obsese v ukládání zbytečných kontrolních součtů. Tak proč se k tomu nepřidat a neuložit si je taky?
Databáze jsou o řád citlivější na poškozené soubory a nikdy se jejich obsah nemění samovolně!!!Popisujete, co se děje, ale já jsem vám k tomu vysvětloval i to, proč se to děje. Ty databázové soubory máte uložené na nějakém RAIDu, RAID má uložené kontrolní součty bloků a při čtení je ověřuje. Pokud mu nějaký kontrolní součet nesedí, přečte data z jiného disku, kde jsou také uložená, a ten původní disk, který vrátil chybná data, označí za chybný a správce jej vymění.
Osobně bych použil více hashovacích algoritmů, pravděpodobnost, že všechny v kombinaci budou mít stejnou chybu (kolizi) je prakticky nulová.Prakticky nulová je pravděpodobnost kolize i u jediného hashovacího algoritmu, pokud se použije nějaký rozumný (třeba SHA-2 nebo SHA-3). Použití dvou hashovacích algoritmů by bylo dobré akorát tak pro dobrý pocit a pro to, že je pořád extrémně jednoduché to použít (zejména v porovnání se zjišťováním, jestli a jaké používá 7zip kontrolní součty).
Užít k hashování 7z je taky možnostPak tedy asi víte, jaký hashovací algoritmus 7zip používá, co hashuje a jakým způsobem hashe ověřuje. Mohl byste to nám ostatním prozradit, ať to nemusíme hledat?
Z těch obyčejných RAR umí BLAKE2, stačí mu to říct parametrem.Jenže aby to k něčemu bylo, je potřeba si ověřit, že konkrétní program, který se použije pro rozbalování, ten kontrolní součet opravdu ověřuje. Zejména když použijete nějaký opensource klon, který někdo napsal hlavně pro to, aby dokázal běžné archivy vůbec rozbalit, nemáte vůbec jistotu, že nějaké ověřování kontrolních součtů bude dělat. Vždyť to pro rozbalení není potřeba, a když se ten kontrolní součet neověří, nikdo to nepozná.
Řada archivátorů (snad skoro každý) přidává do souboru kontrolní i opravné součty.Problém je právě v tom „někde na úrovni“. Kdyby byla někde na úrovni MD5, je to fajn, protože by to změnu v jediném bitu opravdu zaznamenalo. Ale co když je ta kontrola někde na úrovni CRC32? To už by bylo velmi nedostatečné, vzhledem k tomu, o jak důležitá data má jít. Takže byste musel zjistit, jaký kontrolní součet se v kterém archivačním formátu používá (a vůbec bych se nedivil, kdyby jich pro některé formáty bylo víc a záleželo na tom, který program použijete pro kompresi). Dále byste musel zjistit, že program, který použijete na dekompresi, opravdu provádí tu validaci kontrolních součtů.
Proto Vám ZIP řekne, že je archiv porušený, protože detekoval chybu, to je sice hodně primitivní kontrola někde úrovni MD5, ale dostatečně odolná, aby se zjistilo poškození byť jen jediného bitu.
Mimo to, jak CD/DVD/BD, Pásky i HardDisky disky používají vlastní kontrolní součty!To všichni vědí. Jenže tohle všechno je určené pro běžný provoz, ne k nějakému super jištění. Vzhledem k tomu, že tazatel chce uložit data asi na pět nebo kolik míst, určitě chce mít svou vlastní možnost ověřit si, že data v jednotlivé kopii nejsou poškozená. Ono je to jednodušší, než stahovat všech pět kopií k sobě a pak porovnávat, které z nich jsou stejné a které se liší (což by se dělalo opět přes hashe…).
Každý formát má svoje opravné mechanismy, aby se bity neztrácely!
Takže další kontrolní součty na úrovni souborového systému!!!