Stažené soubory s nesedícím md5

Re:Stažené soubory s nesedícím md5
« Odpověď #75 kdy: 04. 08. 2025, 14:11:17 »
On md5 pouziva na detekci chyb a ne na detekci podvrhu. A vy dva s Crhonkem si zalozte vlastni vlakno a nepodsouvejte mu vlastni nemohoucnost pochopit use case.

Použít MD5 jako kontrolní součet na odhalení toho, jestli ti neshnila data na disku nebo v RAMce, to je asi v pohodě. Ale jaký je důvod nepoužít algoritmus, který poslouží i jako ochrana před MITM útoky (tzn. záměrná změna dat, kdy mi někdo na síti chce podstrčit škodlivý kód)?


Re:Stažené soubory s nesedícím md5
« Odpověď #76 kdy: 04. 08. 2025, 14:29:45 »
Zkoušeno mnohokrát, čímž se pravděpodobnost kolize dále snižuje.
Nesnižuje. U MD5 není problém v tom, že by kolize mohla vzniknout náhodou. Problém je v tom, že se velmi snadno dá vyrobit záměrně. Pokud by někdo nahrálna server falešný soubor, ke kterému by však seděl MD5 součet, nezáleží na tom, kolikrát to budete zkoušet – pořád tam bude ten stejný (podvržený) soubor, takže výpočet jeho MD5 vyjde pokaždé stejně.

Nejde o to, že by zrovna v tom vašem způsobu použití, kdy jste hledal chybu hardwaru, mohlo MD5 způsobit nějaké problémy. Jde o to, že především autoři Nextcloudu ten MD5 hash vůbec nemají vystavovat, a za druhé i vy byste měl automaticky sáhnout po něčem jiném, než MD5. Stejně jako pro konfiguraci sítě na Linuxu automaticky saháme (doufám, že už všichni) po ip a ne po ifconfig.

To vis, ze snizuje. On md5 pouziva na detekci chyb a ne na detekci podvrhu. A vy dva s Crhonkem si zalozte vlastni vlakno a nepodsouvejte mu vlastni nemohoucnost pochopit use case.
Máte to vysvětlené v tom textu, který jste citoval. První dvě věty máte vysvětlené v prvním odstavci, třetí větu ve druhém.

RDa

  • *****
  • 3 057
    • Zobrazit profil
    • E-mail
Re:Stažené soubory s nesedícím md5
« Odpověď #77 kdy: 04. 08. 2025, 14:57:35 »
Zkoušeno mnohokrát, čímž se pravděpodobnost kolize dále snižuje.
Nesnižuje. U MD5 není problém v tom, že by kolize mohla vzniknout náhodou. Problém je v tom, že se velmi snadno dá vyrobit záměrně. Pokud by někdo nahrálna server falešný soubor, ke kterému by však seděl MD5 součet, nezáleží na tom, kolikrát to budete zkoušet – pořád tam bude ten stejný (podvržený) soubor, takže výpočet jeho MD5 vyjde pokaždé stejně.

Pokud si prectes vlakno, tak zjistis ze OP nezapasi s tim, ze mu stazeny soubor zobrazuje cunarny a tezi bitkojny, byt mu MD5 sedi.. ale tim, ze mu MD5 praveze nesedi !

Nechapu tu potrebu resit porad nejake off topic veci. Drz se tematu nebo si zaloz vlastni.

Re:Stažené soubory s nesedícím md5
« Odpověď #78 kdy: 04. 08. 2025, 15:52:29 »
Pokud si prectes vlakno, tak zjistis ze OP nezapasi s tim, ze mu stazeny soubor zobrazuje cunarny a tezi bitkojny, byt mu MD5 sedi.. ale tim, ze mu MD5 praveze nesedi !

Nechapu tu potrebu resit porad nejake off topic veci. Drz se tematu nebo si zaloz vlastni.
Pokud si přečtete vlákno, zjistíte, že původní problém byl dávno vyřešen.

Vzhledem k tomu, že tazatel použil MD5, padlo tu od různých lidí upozornění na to, že v roce 2025 fakt není žádný důvod používat MD5, včetně vysvětlení, proč to tak je. Takové upozornění je na tomto webu zcela na místě – očekává se nějaká odborná úroveň odpovídajících a k tomu patří i to, že upozorní na zjevnou chybu, i když nesouvisí přímo s tématem.

Normálně by tady stačily asi tři komentáře tří různých osob upozorňujících na to, že MD5 do roku 2025 fakt nepatří, a to ani když to někdo neznalý vystaví na internetu. Autor by si to třikrát přečetl, zapamatoval by si to a bylo by to vyřešené.

Ale to ne, diskusi musí pořád zaplevelovat nesmysly někdo, kdo mermomocí musí obhajovat neobhajitelné a polemizovat s něčím, co nikdo nepsal. Všichni, kdo tu kritizovali použití MD5, vědí, že zrovna v tomto případě to nezpůsobilo problém. Také nikdo nekritizoval toto konkrétní použití, ale to, že v roce 2025 vůbec někoho napadne použít MD5, na cokoli.

Protože v roce 2025 je jediné správné nepoužívat MD5 nikdy na nic. Prostě neexistuje racionální důvod pro použití MD5 – buď je to nebezpečné, a tam, kde to není nebezpečné, je to zbytečně pomalé.

Pokud si chcete teoretizovat o tom, za jakých okolností je použití MD5 bezpečné a proč vám vůbec nevadí, že je to zbytečně pomalé, klidně si o tom teoretizujte, ale někde jinde. Protože takové komentáře s tímto vláknem vůbec nijak nesouvisí a jenom zaplevelují tuto diskusi. Ty 2,5 komentáře zmiňující MD5 jako nevhodné fakt problém nejsou (přičemž třetí byl jen reakcí na vzniklou diskusi, druhý byl samostatný komentář na jeden řádek a v prvním komentáři to byla jednovětá poznámka po dvou odstavcích týkajících se přímo problému, který tazatel řešil).

Takže úplně offtopic jste tu vy.


Kdyby na webu o tuningu moderních Octavií někdo mimochodem zmínil, že změnu směru ukazuje rukou z okénka, také ho ostatní oprávněně upozorní, že k tomu máme v moderních autech blinkry. Zajímalo by mne, kolik lidí by tam rozjelo offtopic debatu o tom, že zákon nezakazuje dávat znamení o směru jízdy rukama v případě, kdy je vozidlo vybaveno funkčními blinkry; a obhajovali by, že když je dotyčný zvyklý dávat znamení o změně směru jízdy rukama, tak přece není důvod, aby používal blinkry.

A už se těším, jak sem zase napochoduje někdo, kdo nezná pravidla silničního provozu, a začne mi vysvětlovat, že to je něco jiného, protože řidič v moderní Octavii s volantem vlevo nemůže dát rukou znamení o změně směru jízdy vpravo, aby bylo vidět. No tak vězte, že může. Akorát to nikdo nepochopí.

Re:Stažené soubory s nesedícím md5
« Odpověď #79 kdy: 04. 08. 2025, 16:24:34 »
Bedrich Kraus von Zillergut jak vysity.


Re:Stažené soubory s nesedícím md5
« Odpověď #80 kdy: 04. 08. 2025, 16:35:32 »
Pokud chci porovnávat jen okometricky, tak je dobré vzít v úvahu i délku výsledného hashe.
Přece jen je rozdíl koukat na řetězce typu (a hledat rozdíl):
CRC32 - B7781039
MD5 - 3d166650cb8991f23a1b9f77b1f4901c
BLAKE3 - 28b5122d0aea9630ba3421baf150fa08ff05d34bf7209575db3056da8fa7f62f

RDa

  • *****
  • 3 057
    • Zobrazit profil
    • E-mail
Re:Stažené soubory s nesedícím md5
« Odpověď #81 kdy: 04. 08. 2025, 16:41:51 »
Pokud chci porovnávat jen okometricky, tak je dobré vzít v úvahu i délku výsledného hashe.
Přece jen je rozdíl koukat na řetězce typu (a hledat rozdíl):
CRC32 - B7781039
MD5 - 3d166650cb8991f23a1b9f77b1f4901c
BLAKE3 - 28b5122d0aea9630ba3421baf150fa08ff05d34bf7209575db3056da8fa7f62f

Podstatnym kvalitativnim ukazatelem dobreho hashe je, ze i pri zmene byt jednoho bitu, bude cely hash vypada uplne jinak :) Takze nezalezi na delce.. zmena bude patrna uz z prvnich (ci poslednich) cislic. (ostatne to je princip i zkracovani u git commit hashe)

Re:Stažené soubory s nesedícím md5
« Odpověď #82 kdy: 04. 08. 2025, 16:55:14 »
Ano, to že jsou rozdílné, obvykle poznám stejně rychle u všech.
Ale zda jsou opravdu shodné, to už ne - jedině, že bych kouknul na prvních 5 znaků a když jsou shodné, zbytek nečtu a neporovnávám - ale pak mi stačí i ten CRC32, když zbytek ignoruju.

Re:Stažené soubory s nesedícím md5
« Odpověď #83 kdy: 04. 08. 2025, 17:00:10 »
Ano, to že jsou rozdílné, obvykle poznám stejně rychle u všech.
Ale zda jsou opravdu shodné, to už ne - jedině, že bych kouknul na prvních 5 znaků a když jsou shodné, zbytek nečtu a neporovnávám - ale pak mi stačí i ten CRC32, když zbytek ignoruju.
Pokud si potřebujete být opravdu jist, nebudete to porovnávat očima. Pokud vám ale stačí porovnání očima a zvládnete porovnat 32 hexadecimálních znaků MD5, pak zvládnete porovnat i prvních 32 hexadecimálních znaků BLAKE3 – a pořád budete mít u BLAKE3 nesrovnatelně větší jistotu, než u MD5.

Tom5

  • ***
  • 126
    • Zobrazit profil
Re:Stažené soubory s nesedícím md5
« Odpověď #84 kdy: 05. 08. 2025, 14:09:34 »
Pokud si potřebujete být opravdu jist, nebudete to porovnávat očima. Pokud vám ale stačí porovnání očima a zvládnete porovnat 32 hexadecimálních znaků MD5, pak zvládnete porovnat i prvních 32 hexadecimálních znaků BLAKE3 – a pořád budete mít u BLAKE3 nesrovnatelně větší jistotu, než u MD5.

To není pravda. Avalanche efekt je u obou velmi podobný (rozdíl je pouze nějakých 1-2pb).

BTW Podle @corkami není prakticky možné vytvořit soubor s konkrétním MD5 hashem. Tj. pokud máte bezpečnou cestou předaný MD5 k původnímu souboru, který nebyl(!) vyrobený za účelem MD5 kolize, tak se lze na MD5 spolehnout (s ohledem na konkrétní použití)

To ale pochopitelně neznamená, že nemá smysl „jít s dobou”. Jen se domnívám, že ta hysterie kolem MD5 kolizí je často přehnaná.
« Poslední změna: 05. 08. 2025, 14:11:36 od Tom5 »

Re:Stažené soubory s nesedícím md5
« Odpověď #85 kdy: 05. 08. 2025, 14:11:50 »
Podle @corkami není prakticky možné vytvořit soubor s konkrétním MD5 hashem.

Tohle není pravda. Už zde na rootu o tom psal přibližně před 20 lety pan Klíma, český kryptolog a dnes to jde do dvou minut na běžném CPU nebo GPU. Takže MD5 se vůbec nehodí na kontrolu obsahu souborů

Re:Stažené soubory s nesedícím md5
« Odpověď #86 kdy: 05. 08. 2025, 15:15:35 »
To není pravda. Avalanche efekt je u obou velmi podobný (rozdíl je pouze nějakých 1-2pb).
Co na tom není pravda? Pravděpodobnost, že budou mít dva soubory náhodou stejné MD5 je stejná, jako že budou mít stejnou první půlku BLAKE3 hashe (protože BLAKE3 je náhodou dvojnásobná oproti MD5). Podstatné je, že obojí je extrémně malá pravděpodobnost. Avalanche efekt se uplatňuje proto, že to nejsou dokonalé hashovací funkce – ale to je vzhledem k té pravděpodobnosti shody zanedbatelné.

BTW Podle @corkami není prakticky možné vytvořit soubor s konkrétním MD5 hashem. Tj. pokud máte bezpečnou cestou předaný MD5 k původnímu souboru, který nebyl(!) vyrobený za účelem MD5 kolize, tak se lze na MD5 spolehnout (s ohledem na konkrétní použití)
Nikoli, MD5 už je dávno prolomené vůči kolizím prvního i druhého řádu. Kolize druhého řádu byla na MD5 v praxi předvedena už v roce 2008. Ano, potřebovali k tomu tenkrát výkonný cluster, ale byl to rok 2008. V roce 2012 byl dle Microsoftu podepsán malware Flame certifikátem s kolizním hashem. Takže minimálně od roku 2012 musíte považovat kolize druhého řádu u MD5 za běžně dostupné.

Re:Stažené soubory s nesedícím md5
« Odpověď #87 kdy: 05. 08. 2025, 15:27:43 »
Citace
To vis, ze snizuje. On md5 pouziva na detekci chyb a ne na detekci podvrhu. A vy dva s Crhonkem si zalozte vlastni vlakno a nepodsouvejte mu vlastni nemohoucnost pochopit use case.


Škoda jen toho použitého hashe :)
Ten nahoře je slam-němý panák a a dole je MD5 a mlátí ji kolizí druhého řádu ale díky avalanche štítu se vyhýbá té slámě.

Ale z jednoho dne nelze dělat závěry o  vyhasnutí diskuze

Re:Stažené soubory s nesedícím md5
« Odpověď #88 kdy: 05. 08. 2025, 15:55:50 »
Ten nahoře je slam-němý panák a a dole je MD5 a mlátí ji kolizí druhého řádu ale díky avalanche štítu se vyhýbá té slámě.

Mám u tebe balení utěrek na monitor...  ;D ;D ;D ;D ;D ;D ;D

Tom5

  • ***
  • 126
    • Zobrazit profil
Re:Stažené soubory s nesedícím md5
« Odpověď #89 kdy: 05. 08. 2025, 19:01:14 »
To není pravda. Avalanche efekt je u obou velmi podobný (rozdíl je pouze nějakých 1-2pb).
Co na tom není pravda? Pravděpodobnost, že budou mít dva soubory náhodou stejné MD5 je stejná, jako že budou mít stejnou první půlku BLAKE3 hashe (protože BLAKE3 je náhodou dvojnásobná oproti MD5).

Reagoval jsem na vaše tvrzení, že „pořád budete mít u BLAKE3 nesrovnatelně větší jistotu, než u MD5.”

BTW Podle @corkami není prakticky možné vytvořit soubor s konkrétním MD5 hashem. Tj. pokud máte bezpečnou cestou předaný MD5 k původnímu souboru, který nebyl(!) vyrobený za účelem MD5 kolize, tak se lze na MD5 spolehnout (s ohledem na konkrétní použití)
Nikoli, MD5 už je dávno prolomené vůči kolizím prvního i druhého řádu. Kolize druhého řádu byla na MD5 v praxi předvedena už v roce 2008. Ano, potřebovali k tomu tenkrát výkonný cluster, ale byl to rok 2008. V roce 2012 byl dle Microsoftu podepsán malware Flame certifikátem s kolizním hashem. Takže minimálně od roku 2012 musíte považovat kolize druhého řádu u MD5 za běžně dostupné.

Máte pro své tvrzení nějaký důvěryhodný zdroj? Ne, že bych to problematiku podrobně sledoval, ale stále mi výsledky hledání hlásí i pro rok 2025 prakticky nedosažitelný second-preimage MD5 attack (dokonce se mi tu někde mihlo, že to nejde ani pro MD4). Pochopitelně se bavíme o běžných velikostech zpráv/souborů. Nikoli „laboratorní” jednotky bajtů.