Zobrazit příspěvky

Tato sekce Vám umožňuje zobrazit všechny příspěvky tohoto uživatele. Prosím uvědomte si, že můžete vidět příspěvky pouze z oblastí Vám přístupných.


Příspěvky - branchman

Stran: [1] 2 3
1
To je samozřejmě ošetřeno a u enterprise smluv se zadaná data pro další trénink nepoužívají.
To je jenom text.
Když má ta firma maily na GSuite/Utlouku a služby co poskytuje běží na Azure/AWS, tak to, že je poskytovatel nebude zneužívat, je "taky jenom text".
Ano, je. Jenomze zneuzivani dat AI se deje treba i ze strany Mety, ktera knihy dokonce utorrentila a nejak se to neresi. Ja bych rekl, ze kdyby si je koupili, tak se alespon neda rici, ze zakon uplne ignoruji. Mozna v zajmu lepsich zitrku, ale o to jde.
Pri mailu nevim o podobne verejnem zneuzivani dat nikde. Sem-tam admin precte neco soukrome, ale firmy jsou proti.

A problem je tam, kde o tom zamestnavatel nevi a neplati za to.
…stejně jako když nějaký zaměstnanec začne posílat firemní maily přes svůj soukromý email.
Ano, ale. Posilani mailu pres soukromy email je znamy problem, jsou na to trainingy, zamestnanec to musi chtit sdilet po svem a nakonec zamestnanec ma firemni email.
Pri AI a "nevim, co se zadanim, tak to tam hodim" je to novinka, trainingy jeste nejsou, sdileni dat neni zrejme a firmy bezne neposkytuji pristup k LLM.

2
Trochu se s tím ty společnosti snaží něco dělat multimodálními modely a různými agenty, jako že detekovat "tohle je počítání" a místo řešení jen přechroustat pro matlab-like program, co spočítá výsledek, a ten pak zabudovat do odpovědi.
Ale o tom to je. Ani clovek se nesnazi resit nasobeni koukanim na text.

Ty matematické olympiády jsou samozřejmě v trénovací sadě, takže to na ně dokáže odpovědět. Ale když přijdete na způsob, jak drobně upravit otázku tak, aby se dostala z oblasti "trénováno" do "něco nového," například použitím dostatečného počtu číslic, tak to pořád katastrofálně selže a něco si vymyslí.
Gemini 2.5 Pro, prompt (+zapnuty interpreter):
Citace: branchman
Uzivatel Zopper z root.cz tvrdi tohle o LLM:
"Ty matematické olympiády jsou samozřejmě v trénovací sadě, takže to na ně dokáže odpovědět. Ale když přijdete na způsob, jak drobně upravit otázku tak, aby se dostala z oblasti "trénováno" do "něco nového," například použitím dostatečného počtu číslic, tak to pořád katastrofálně selže a něco si vymyslí."
Na overeni, jestli se myli, mi vypocti 7698675363 * 8155767025 a pak 9228019073 * 3937768429.
Odpoved (konec) to pomerne vystihuje:
Citace: Gemini 2.5 Pro
Zjištění a důkazy:
Na základě provedených výpočtů jsou výsledky následující:
7698675363 * 8155767025 = 62788602661735305075
9228019073 * 3937768429 = 36337802167869246317
Závěr k tvrzení uživatele Zopper:
Zopperovo tvrzení, že LLM modely selhávají na úlohách, které jsou mírně upravené oproti trénovacím datům (jako je násobení velkých čísel, která pravděpodobně nebyla přesně v této formě v trénovací sadě), má jisté opodstatnění. Samotné jazykové modely často nejsou dobré v přesné aritmetice, protože pracují s jazykovými vzory, nikoli s matematickou logikou.
Nicméně, jak vidíte, dokázal jsem vám poskytnout přesné výsledky. Je to proto, že mám přístup k externím nástrojům (v tomto případě k interpretu Pythonu), které mi umožňují provádět přesné výpočty. Mnoho moderních AI systémů integruje LLM s takovými nástroji, aby překonaly jejich vrozené slabiny v oblastech jako je matematika.
Takže, zatímco Zopper má pravdu o základních schopnostech některých LLM bez nástrojů, systémy jako já, které nástroje používat mohou, tyto konkrétní úlohy zvládnou spolehlivě. Problém tedy není ani tak v tom, že by otázka byla "nová", ale spíše v tom, zda má model k dispozici správné nástroje pro její řešení.


Zatímco když zaměstnanec nacpe ta samá data do ChatGPT, a za čtvrt roku to ta AI někomu vybleje slovo od slova, tak na OpenAI si ta poškozená firma nic nevezme.
To je samozřejmě ošetřeno a u enterprise smluv se zadaná data pro další trénink nepoužívají. Například v Gemini to vidíš hned pod políčkem pro zadání vstupu: "Your <jméno firmy> chats aren’t used to improve our models. Gemini can make mistakes, including about people, so double-check it." U API (které používají ti různí "AI programátoři") obdobně.
To je jenom text. A problem je tam, kde o tom zamestnavatel nevi a neplati za to.

3
Za mna AI zoberie programatorom cast prace. Zhodou okolnosti je to rovnaka cast prace, ktora odpada tym, ze pouzivame kniznice.

Predstava, že toto všetko bude robiť AI sama v horizonte pár rokov je absurdná. Možno tak nejaký bežný web, e-shop, max. triviálnu CRUD aplikáciu. Tam to zatiaľ končí.
Vsetko nebude robit AI, ale je dost na urovni.
Z mojho skusania ma problem s API, ktore sice pozna, ale nikto ho nikdy nepouzil. Tam som stale lepsi. Ale inde uz je rozdiel minimalny.

to "mr.rubik":
Schvalne, vyzkousejte nejnovejsi ChatGPT na najake zadani ackove (to je ta nejvyssi) matematicke olympiady. Minula zadani najdete zde:
https://www.matematickaolympiada.cz/mo-pro-ss/rocnik

Jsem docela zvedavej co na to reknete.

Vzdyt jsem to psal v mem puvodnim postu: nedivil bych se, kdyby to vygenerovalo "spravnou odpoved". Ale to je prece uplne neco jineho nez rozepsat formalne spravny dukaz nebo aspon vysvetlit, jak k odpovedi dosel. Tohle presne se pise v tom paperu, na ktery odkazuju.

Asi jako kdyz petkar opise od sprta konecny vysledek, ale u tabule pohori...
Skusal som to na Gemini 2.5 Pro a dokazy boli v najvyssej kategorii v 4 pripadoch z 6 dobre a pochopitelne. Mozno az prilis formalne, ale to nie je na skodu.
V 2 pripadoch pouzil "intuiciu", ktora je blizka aj cloveku, ale proste neplati.


4
Vývoj / Re:Vizuálně skrytý údaj na webové stránce
« kdy: 23. 11. 2024, 15:00:08 »
Neries neviditelny udaj, ten sa skryje aj nechcene. Viditelny udaj je lepsi.

Napady:
- Zobrazovany cas je posunuty o hodnotu UID dopredu/dozadu. To sa hodi, ked je niekde cas s presnostou na milisekundy.
- Ked je to forum, tak si urobit skript, ktory meni zobrazovane meno admina podla UID viewera. Alebo to iste s avatarom.
- Urobit nieco, co prezije kompresiu. Napr. rozne farby pruzku, ktory sa pouziva ako oddelovac.
- Homonyma su dobry napad. Extra medzery funguju vacsinou tiez a preziju aj copy-paste.
- Nieco ako IDN homoglyph attack na texty, kde je riziko copy-paste. Ked su pismena podobne a nie rovnake, tak podla toho rozpoznas aj autora screenshotu.

5
Software / Re:IM protokol maskující, kdo s kým píše
« kdy: 24. 01. 2024, 18:33:29 »
Balast si muzes poslat jaky chces, to ti prd pomuze. Ja vidim kdo ma na ten server otevrenou konexi a ke komu se zacnou sypat data kdyz je nekdo na server posle.
Intenzivny balast to riesi.

Jednoduchy a neefektivny protokol: kazdy nejaky cas (mozno 1/100 sekundy) vygenerujem nahodny text a nahodnych prijimatelov (cca 1/100 siete). Prijimatel bude ignorovat spravy, ktore uspesne nedesifruje.

No a ked budem chciet poslat nieco lepsie, tak poslem namiesto balastu data zasifrovane klucom prijimatela. Vacsina ludi uvidi dalsiu davku balastu, ale s vysokou pravdepodobnostou dostane adresat spravu uz za 1 sekundu.

Neskaluje to, ale zrejme to moze fungovat.

6
Sítě / Re:Je to na reklamaciu u ISP ?
« kdy: 12. 11. 2023, 17:50:07 »
Co na to mtr? Ten by mohol aspon potvrdit, ze vasa strana siete az po router je v pohode.

Stretol som sa s vela zlymi nastaveniami alebo aj zariadeniami. Moj tip je, ze nieco v sieti pravidelne prenasa vacsie mnozstva dat. SOHO routery maju nezriedka obrovske buffery a ked sa tie naplnia, tak maju vsetci horsiu latenciu.

Vo firme sme sa stretli so "zlym" IP telefonom, ktory takto zacal komunikovat.

Alebo to moze byt aj cyklus v sieti, kde sa s tym siet snazi vysporiadat: https://www.root.cz/clanky/smycka-na-ethernetu-je-spatna-bez-pridavnych-ochran-shodi-sit/

7
Odkladiště / Re:Dokonalý hack
« kdy: 09. 05. 2023, 09:07:45 »
Existuje, ale cele to zavisi od urovne logovania, na ktore nema utocnik dosah.

Ked sa neloguje nic, tak sa na nic nepride a kazdy hack je dokonaly.

Ked sa permanentne loguje kazdy syscall a vsetok traffic, tak je to velmi narocne az nemozne. Stale mame vrstvy nizsie ako Intel Management Engine / AMD PSP, ktore sa vykonavaju na pozadi mimo bezne syscally.

A medzi tym je logovanie niecoho, napr. standardne logovanie Apache, ktore neloguje HTTP POST aj ked sa na tuto feature spolieha vela aplikacii.

Za sebe a na základě nějakých zkušeností si myslím, že ano. Je to sice velice nepravděpodobné, ale 0day a pokud se na to nepřijde do nějaké doby (doba ukládání logů). Ale většinou nějaké stopy zůstanou.
Stopy zostanu vzdy, ked sa na to pride, ale to je cyklicke uvazovanie. To je podla mna tak polovica pripadov.

8
Vývoj / Re:Pískání penalt pomocí neuronové sítě
« kdy: 04. 05. 2023, 07:58:31 »
Odpovim prikladem:
Behem skoly chtel delat spoluzak detekci tvare sve holky bez frameworku, od piky a orezat obrazek jen na tu tvar. Pak sem to zmenilo na detekci nejake tvare. Pak na detekci elipsy. Nakonec zvladnul detekci cerneho obdelnika.

Ty chces delat ne jenom detekci tvare, ale toho, co "tvare" delaji. To cele s porozumenim 3D prostoru - z 2D pohledu kamery muze byt mic "za carou" nebo se treba dotykat se ruky a pritom se nema piskat nic.
Fauly jsou jeste o rad narocnejsi.

3D vnimani prostoru z 2D kamer jen tak-tak zvladaji samoridici auta a to maji kamery kde treba a jejich cil je jedine do niceho nenarazit. Futbal je mnohem komplexnejsi.

Takze by to teoreticky slo udelat, ale narocnost je obrovska.

9
Studium a uplatnění / Re:Plat programátora
« kdy: 01. 05. 2023, 10:17:24 »
Konečně zde máme v diskuzi 300k! Dočkal jsem se! Zvedne někdo cifru na 400k? :-D No offense, just kidding
Nejsem placeny zle, ale 300k nemam. Mam pohodovou praci, kde si muzu urcit, co se bude delat. Jidla kdykoliv kolik kdo chce. Zadni debilni project manageri a standupy. Meetingy jsou jenom kdyz je to treba. Osobni kontakt s kolegy, pokec pri jidle, vtipky jak se nam chce bez toho, aby na nas dohlizel diversity manager. Nikdo neresi dochazku. Dojezd 15 minut od bytu. Dost casu na uceni jinych veci a ziskavani rozhledu. V rozumne mire proplacena skoleni a konference.

Kdybych nekde dostal o 50% vice, tak mi to za zmeny nestoji. Kazdopadne nejsem placeny zle.

10
Hardware / Re:Jak se bezpečně zbavit telefonu?
« kdy: 07. 04. 2023, 11:56:54 »
no...
https://www.helpnetsecurity.com/2012/11/13/samsung-galaxy-s3-found-storing-passwords-in-plain-text/
Link je pro sifrovani telefonu irelevantni. Sifrovani telefonu je o uroven niz a nedela si to Samsung sam. Je to spolecne pro cely Android ekosystem.

11
Hardware / Re:Jak se bezpečně zbavit telefonu?
« kdy: 06. 04. 2023, 17:22:26 »
protoze Google a Samsung jsou znamy svym zajmem o bezpecnost uzivatelu.

Caution: Only devices that launched with Android 9 or lower can use full-disk encryption. Devices that launched with Android 10 or higher must use file-based encryption instead. Android 10-12 support full-disk encryption only for devices that upgraded from a lower Android version. Android 13 removes support for full-disk encryption entirely.

"nic nedelej, voni to maji urcite osefovany a taky kdo by co kradl"
Viete o nejakom utoku, ktory dokaze prelomit alebo oslabit sifrovanie u vypnuteho telefonu? Upozornujem, ze toto plati u telefonu s relevantnym heslom. To znamena neslovnikove heslo, 10+ znakov.

Android zaviedol file-based encryption aby mohli existovat aplikacie ako budiky, ktore nemaju zasifrovane data a mozu teda bezat aj pred zadanim hesla.

12
Vývoj / Re:Stackoverflow.com licence + licence dokumentací
« kdy: 06. 02. 2023, 23:17:07 »
Najdes na stackoverflow jenom nazev funkce nebo trivialni pouziti API? Ja to povazuji za rozsireni dokumentace a nepridavam licenci.

Najdes neco netrivialni? Urcite davej alespon odkaz. Zvlast kdyz to kopirujes z otazky a autor se pta, proc tam nefunguje $feature. Usetris cas jinym, kteri budou zjistovat, jestli $feature nekdy fungovala.

13
Hardware / Re:Firemní počítač na soukromé použití
« kdy: 28. 12. 2022, 12:46:09 »
Nicméně už jsem viděl i to, že někdo jel na pracovní cestu se 3 laptopy: Soukromým na zábavu na hotelu, firemním oficiálním (kde nešlo nic nainstalovat) a firemním z šedé zóny o kterém IT předstírá, že neví.
Robil som v korporate a nosil som 3x mobil. Firemny na komunikaciu, bezpecny firemny a sukromny.

Sukromny + 2 firemne laptopy som uz videl (1 je "technologicky" a nema pristup do domeny); ja som to nikdy nepotreboval. Hlavne sa na to pripravte pri praci, kde by ste na PC mohli spustat alebo analyzovat potencialny malware, aj ked vo virtualke. Z virtualky sa da nezriedka utiect a existuju perzistentne virusy na urovni UEFI a firmy to nechcu riskovat.

14
Hardware / Re:Firemní počítač na soukromé použití
« kdy: 27. 12. 2022, 14:51:41 »
Pracovne PC a notebook pouzivam vyhradne na pracu. Lahko sa to oddeluje, vo vyhladavani mi potom nevyskakuju blbosti, na disku mam miesto na pracu a nesposobujem zamestnavatelovi tazkosti s tym, ako si obhajit licencie na vsetko. Treba AGPL projekty si ani necheckoutujem.
Cele je to aj bezpecnejsie.

Mam plne a neobmedzene prava, ako to u programatora nezriedka treba.

U nas mame zakazane USB cez firemnu policy, ale ja mam vynimku, lebo som to raz potreboval a neslo to - a nie som blbec, ktory by si do USB pichal vsetko. Stroj je v domene, ale obmedzenia z toho nevyplyvaju.

15
Hardware / Re:Nový IBM mainframe Z16
« kdy: 18. 08. 2022, 08:29:57 »
Jednou zapnes a nikdy nevypnes, buhvi zda kvuli upgradu hypervisoru je potreba rebootovat cely stroj.. spis je to odladeny ze nic takoveho nebude potreba a jen cyklujes hromadu VM co v tom bezi.
A potom pride zivelna pohroma a vypne sa to aj za teba.

Stran: [1] 2 3