Prerspektivy studia IT ve světle současného vývoje AI

Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #15 kdy: 18. 04. 2025, 09:53:10 »
V tomto oboru trošku dělám (takže si možná pod sebou podřezávám větev :-) ale to už nějak doklepu), ale osobně bych počkal, jak se vyřeší problém s tím, na čem jsou ty LLM natrénovány. Jsou to obecně zdrojáky s nějakou licencí a obecně už to vypadá tak, že velké firmy spíše chtějí provozovat vlastní LLM, ne ty veřejné (právě kvůli tomu, aby jejich data neleaknula a nevyužil je někdo jinej).

Tedy popravdě mě docela překvapuje, že se tady píše, jak se často používá copilot atd. To je taky věc, která se začíná hlídat, protože SW firmy prodávají "svoje" dílo a nechtějí, aby je někdo později zažaloval, že jsou v tom kusy, které vlastní někdo jinej a LLM je použil.

Ale jak píše Pavel - tvoří to už teď bariéru pro služebně mladší se dostat do oboru. Navíc je tady opět problém toho, jak ty mladší lidi natrénovat už na škole, když už teď si pomáhají AI (kolega říká, že se jejich výsledky nijak nezlepšily ani po nástupu SO, ani po nástupu AI - takže tady je to nefunkční berlička).


Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #16 kdy: 18. 04. 2025, 12:04:51 »
V tomto oboru trošku dělám (takže si možná pod sebou podřezávám větev :-) ale to už nějak doklepu), ale osobně bych počkal, jak se vyřeší problém s tím, na čem jsou ty LLM natrénovány. Jsou to obecně zdrojáky s nějakou licencí a obecně už to vypadá tak, že velké firmy spíše chtějí provozovat vlastní LLM, ne ty veřejné (právě kvůli tomu, aby jejich data neleaknula a nevyužil je někdo jinej).

Tedy popravdě mě docela překvapuje, že se tady píše, jak se často používá copilot atd. To je taky věc, která se začíná hlídat, protože SW firmy prodávají "svoje" dílo a nechtějí, aby je někdo později zažaloval, že jsou v tom kusy, které vlastní někdo jinej a LLM je použil.

Ale jak píše Pavel - tvoří to už teď bariéru pro služebně mladší se dostat do oboru. Navíc je tady opět problém toho, jak ty mladší lidi natrénovat už na škole, když už teď si pomáhají AI (kolega říká, že se jejich výsledky nijak nezlepšily ani po nástupu SO, ani po nástupu AI - takže tady je to nefunkční berlička).

Řekněme si to na rovinu, současné LLM porušují licenci vstupních dat, na kterých proběhl trénink. Otevřený kód a vzájemné kopírování to na ně všechny prásklo. Myslíš si, že se tohle změní uzavřením? Myslím, že nikoliv, jen to nebude tak snadno dohledatelné.

Netroufám si také udělat nějaké odhady do budoucna, současná LLM jsou neskutečně nerentabilní, trénink i provoz (zkušenosti z praxe). Asi všichni sází na to, že technologie pokročí k lepší efektivitě dříve než dojdou peníze.

Jsem optimista, s lidmi a juniory pracuji, chodím na škol občas něco říct, prostor a možnosti jak se něco učit jsou. Informace existují a pokud část lidí budou jen AI operátoři a budou místo programování psát prompty, co by ne, asi to trochu uvolní ruce té strašné přetlačované a nebude se už každý označovat za programátora.

Pokud jde o grafiky a tvorbu bannerů a náhledových obrázků, asi je dobře, že to převezme AI, protože to nikdy nebyla práce s velkou přidanou hodnotou, každý si točil několik vzorů jak na pásu (taky co chcít jiného za pár desítek kč za kus). V tomhle nebyl žádný um a inovace, učící křivka byla příliš protáhlá, dokola opakování jednoduchých postupů moc nikam nevede.

Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #17 kdy: 18. 04. 2025, 12:31:19 »
Ono zjistíte, že systém potřebuje odborníků jenom pár a naprostá většina lidí zůstává na základních pozicích nebo maximálně středních.
Ale to neni v rozporu. Ty odborniky stale budte potrebovat (do doby nez prijde obecna AI) a vetsina tech odborniku zacinala jako lopata.
Tedy znam par kteri to preskocili, ale s tema je obvykle obtizna domluva, protoze jim ta zkusenost chybi.
Kdyz seberete moznost zacinat, odbornici nemaji z ceho vyrust.

Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #18 kdy: 18. 04. 2025, 12:47:50 »
V tomto oboru trošku dělám (takže si možná pod sebou podřezávám větev :-) ale to už nějak doklepu), ale osobně bych počkal, jak se vyřeší problém s tím, na čem jsou ty LLM natrénovány. Jsou to obecně zdrojáky s nějakou licencí a obecně už to vypadá tak, že velké firmy spíše chtějí provozovat vlastní LLM, ne ty veřejné (právě kvůli tomu, aby jejich data neleaknula a nevyužil je někdo jinej).


Řekněme si to na rovinu, současné LLM porušují licenci vstupních dat, na kterých proběhl trénink. Otevřený kód a vzájemné kopírování to na ně všechny prásklo. Myslíš si, že se tohle změní uzavřením? Myslím, že nikoliv, jen to nebude tak snadno dohledatelné.

Velkým zákazníkům jde spíše o to, aby neleaknuly jejich data, tj., aby model nezahrnul jejich otázky do svých znalostí. Některým jde o kód. Vlastně jakákoli práce s copilotama vede k leaku dat, které navíc patří firmě/zaměstnavateli, ne tomu vývojáři, co to tam dobrovolně kopíruje. A dalším jde o to, aby v obecných dotazech nebyly senzitivní informace. Třeba akciovky mají poměrně přesně zákonem dané, jak oznamují některé změny, akvizice atd. A pokud si třeba firemní copywriter nechá "připravit" tiskové prohlášení veřejným LLM, tak to už si říká o velký problém.

Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #19 kdy: 18. 04. 2025, 14:00:48 »
Velkým zákazníkům jde spíše o to, aby neleaknuly jejich data, tj., aby model nezahrnul jejich otázky do svých znalostí. Některým jde o kód. Vlastně jakákoli práce s copilotama vede k leaku dat, které navíc patří firmě/zaměstnavateli, ne tomu vývojáři, co to tam dobrovolně kopíruje. A dalším jde o to, aby v obecných dotazech nebyly senzitivní informace. Třeba akciovky mají poměrně přesně zákonem dané, jak oznamují některé změny, akvizice atd. A pokud si třeba firemní copywriter nechá "připravit" tiskové prohlášení veřejným LLM, tak to už si říká o velký problém.

Jj, proto se tak rozšiřuje Copilot, který třeba nemá problém si vzít celý obsah teamsu a sharepointu a pak leakovat i osobní konverzace.

Chápu. Leakování dat není dnes snadno řešitelné, nelze totiž snadno ověřit, která data vlastně model dostal, neexistuje report, index a možnost nějaké kontroly. Ono i když pustíš model jen na konkrétní izolovaná data, tak stejně jsi závislý na tom, co tam vlastně jeden uživatel nahraje a leakování i uvnitř společnosti může být problém.



Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #20 kdy: 18. 04. 2025, 14:02:07 »
to "mr.rubik":
Schvalne, vyzkousejte nejnovejsi ChatGPT na najake zadani ackove (to je ta nejvyssi) matematicke olympiady. Minula zadani najdete zde:
https://www.matematickaolympiada.cz/mo-pro-ss/rocnik

Jsem docela zvedavej co na to reknete.

Vzdyt jsem to psal v mem puvodnim postu: nedivil bych se, kdyby to vygenerovalo "spravnou odpoved". Ale to je prece uplne neco jineho nez rozepsat formalne spravny dukaz nebo aspon vysvetlit, jak k odpovedi dosel. Tohle presne se pise v tom paperu, na ktery odkazuju.

Asi jako kdyz petkar opise od sprta konecny vysledek, ale u tabule pohori...

peete

Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #21 kdy: 18. 04. 2025, 16:21:59 »
Ze pry "AI neumí nic vytvořit - umí jen kombinovat" no to je nesmysl. Za prve AI je zajimava prave tim, ze na zaklade treningu si poradi se situacemi, ktere v zivote nevidela. Je to zakladni princip AI platny uz mnoho let. A za druhe, kdyz se na to podivame jinak, nakolik lidsky mozek je tak strasne originalni a na kolik kombinuje znalosti odjinud? Kdo z vas treba vytvoril novy matematicky postup, ktery pred tim neexistoval? Kdo z nas vymyslel novy styl hudby nebo vytvarneho umeni? Nebo jste vynasli novy algoritmus, ktery se dostal do ucebnic CS? Vetsina z nas kombinuje, tvorba je v mensich vecech, ne v obrovske prekvapujici originalite. Souhlasim s kolegou, ze velka pridana hodnota je umet dorozumet se s klienty a manazery, coz AI nezvladne. K pokroku v AI chybi mnoho veci, vyresit halucinace, AI alignment, vedomi, modularita, efektivnost atd. tedy to, co ma mozek. Kdo vi jestli se tyto problemy podari vyresit a kdy.

Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #22 kdy: 18. 04. 2025, 16:31:24 »
Ono zjistíte, že systém potřebuje odborníků jenom pár a naprostá většina lidí zůstává na základních pozicích nebo maximálně středních.
Ale to neni v rozporu. Ty odborniky stale budte potrebovat (do doby nez prijde obecna AI) a vetsina tech odborniku zacinala jako lopata.
Tedy znam par kteri to preskocili, ale s tema je obvykle obtizna domluva, protoze jim ta zkusenost chybi.
Kdyz seberete moznost zacinat, odbornici nemaji z ceho vyrust.
Osobně moje zkušenost je stejná jako v příspěvku, na který jsem reagoval. Tedy, že pár těch pár geniů to zvládne přirozeným talentem, ale je to můj osobní názor, který nemám potřebuju nějak extrémně obhajovat. On stejně život ukáže, jak to bude.

Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #23 kdy: 18. 04. 2025, 17:53:21 »
ad juniori: osobne to vnimam naopak, povzbudzujem dieta (aka nieco ako pre-junior programator), ze nech riesi problemy s AI. Umozni mu to rychlejsie preslapat cestu, aby z neho bol senior.

Ked si ja spomeniem, ako som doloval informacie z knih/casopisov, mi sucasny stav, ze poviem Copilotovi co potrebujem a po kratkej dobe mam jasno vo veci, pride uplne luxusny.
A je jedno, ci sa pytam na pocet mravcov v mravenisku alebo ako shrinknut Oracle databazu.

Zopper

  • *****
  • 881
    • Zobrazit profil
Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #24 kdy: 18. 04. 2025, 18:46:02 »
Dolovat věci tím těžším způsobem z knih a googlení v diskuzích z člověka lepšího programátora neudělá, udělá to z něj jen schopnějšího hledače. Důležité je, co pak s tou získanou informací člověk dělá dál. Můžu strávit dvě hodiny googlením a pak copy-pastnout první použitelně vypadající kus kódu ze StackOverflow. Nebo se můžu 10 minut bavit s AI a dalších 20 minut přemýšlet nad tím, co mi dala a jak to napsala. Která varianta mě naučí víc, to nechám na hodnocení ostatních.  8)

Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #25 kdy: 18. 04. 2025, 23:01:57 »
Za mna AI zoberie programatorom cast prace. Zhodou okolnosti je to rovnaka cast prace, ktora odpada tym, ze pouzivame kniznice.

Predstava, že toto všetko bude robiť AI sama v horizonte pár rokov je absurdná. Možno tak nejaký bežný web, e-shop, max. triviálnu CRUD aplikáciu. Tam to zatiaľ končí.
Vsetko nebude robit AI, ale je dost na urovni.
Z mojho skusania ma problem s API, ktore sice pozna, ale nikto ho nikdy nepouzil. Tam som stale lepsi. Ale inde uz je rozdiel minimalny.

to "mr.rubik":
Schvalne, vyzkousejte nejnovejsi ChatGPT na najake zadani ackove (to je ta nejvyssi) matematicke olympiady. Minula zadani najdete zde:
https://www.matematickaolympiada.cz/mo-pro-ss/rocnik

Jsem docela zvedavej co na to reknete.

Vzdyt jsem to psal v mem puvodnim postu: nedivil bych se, kdyby to vygenerovalo "spravnou odpoved". Ale to je prece uplne neco jineho nez rozepsat formalne spravny dukaz nebo aspon vysvetlit, jak k odpovedi dosel. Tohle presne se pise v tom paperu, na ktery odkazuju.

Asi jako kdyz petkar opise od sprta konecny vysledek, ale u tabule pohori...
Skusal som to na Gemini 2.5 Pro a dokazy boli v najvyssej kategorii v 4 pripadoch z 6 dobre a pochopitelne. Mozno az prilis formalne, ale to nie je na skodu.
V 2 pripadoch pouzil "intuiciu", ktora je blizka aj cloveku, ale proste neplati.


Zopper

  • *****
  • 881
    • Zobrazit profil
Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #26 kdy: 19. 04. 2025, 10:45:17 »
Ono se to tváří, jako že to přemýšlí, ale přitom to vůbec nemyslí. Asi jako většina lidí. :D Ty matematické olympiády jsou samozřejmě v trénovací sadě, takže to na ně dokáže odpovědět. Ale když přijdete na způsob, jak drobně upravit otázku tak, aby se dostala z oblasti "trénováno" do "něco nového," například použitím dostatečného počtu číslic, tak to pořád katastrofálně selže a něco si vymyslí. Viz třeba tenhle graf přesnosti.

A s lepšími modely se jen posouváme v tom grafu dál. Kdyby to skutečně umělo počítat, tak přesnost nespadne na nulu, jakmile se dostaneme z trénovací sady. Taky co jsem viděl analýzy vnitřních procesů, tak ono to sice umí napsat, jak se formálně něco dělá, ale vůbec ten proces nepoužije, dostává se k výsledku nějakými asociacemi. Trochu se s tím ty společnosti snaží něco dělat multimodálními modely a různými agenty, jako že detekovat "tohle je počítání" a místo řešení jen přechroustat pro matlab-like program, co spočítá výsledek, a ten pak zabudovat do odpovědi. Ale to má svoje problémy, dál to zvyšuje náklady, a neřeší to jádro problému. Takže dokud nepřijde nějaká změna paradigmatu v AI, současných problémů se nezbavíme.

_Jenda

  • *****
  • 1 622
    • Zobrazit profil
    • https://jenda.hrach.eu/
    • E-mail
Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #27 kdy: 19. 04. 2025, 12:50:49 »
Já to vidím podobně jako napsal speculatius.
podľa mňa nerozumie podstate ich práce [...] Keď vývojár dostane zadanie, musí si obehnúť stakeholderov, zozbierať požiadavky, odstrániť v nich rozpory, vytvoriť si v mysli doménový model problému, zvážiť jeho právne aspekty, nájsť vhodnú architektúru, nájsť kompromisy medzi funkcionalitou a cenou (scope), "stokrát" si overiť že sa všetci správne rozumejú atď. Potom niekde príde písanie kódu, ktoré tvorí možno 30% práce soft. inžiniera a ktoré údajne nahradí AI.
Současný vývojář s běžným IDE a interaktivním debuggerem je třeba 100x efektivnější, než když před 50 lety musel program vymyslet na papír, vyděrovat, potenciálně i ručně přeložit do assembleru/strojového kódu a zařadit do fronty sálového počítače. Přesto je v IT 100x víc pracovníků než tehdy, takže se zdánlivě dělá 10000x víc práce?

Přijde mi to podobné jako obávat se, že s nástupem kompilátorů přijdou programátoři o práci. Nebo dokonce uvažte nástup Pascalu, Basicu či dalších novějších "user-friendly" jazyků, různých programovacích nástrojů, kde si jenom taháte flowcharty, Excelu, MS Access atd: "programátoři nebudou potřeba! ovládat počítač / dělat si analýzu dat / dělat webové aplikace už je jako psát příkazy v angličtině / tahat si moduly po ploše!". No a jak to dopadlo.

Věřil bych na to, jak se také píše výše, že se nahradí programátoři s "365. blog ve Wordpressu" a "674. landing page v Angularu". Nevěřil bych, že se nahradí korporátní bull$hit generátory, byť technologie by to zvládla: viz též David Graeber: On the Phenomenon of Bullshit Jobs.

Velkým zákazníkům jde spíše o to, aby neleaknuly jejich data, tj., aby model nezahrnul jejich otázky do svých znalostí. Některým jde o kód. Vlastně jakákoli práce s copilotama vede k leaku dat, které navíc patří firmě/zaměstnavateli, ne tomu vývojáři, co to tam dobrovolně kopíruje. A dalším jde o to, aby v obecných dotazech nebyly senzitivní informace. Třeba akciovky mají poměrně přesně zákonem dané, jak oznamují některé změny, akvizice atd. A pokud si třeba firemní copywriter nechá "připravit" tiskové prohlášení veřejným LLM, tak to už si říká o velký problém.
Ehm. Naprostá většina firem má maily v Google/MS Cloudu, soubory sdílí přes google/one drive/sharepoint, komunikuje přes Slack, Teams, Meet a Zoom - to "tiskové prohlášení" se připravuje právě tam - zdrojáky a CI mají na GitHubu a hotové aplikace pak běží v Azure, AWS a podobně (=včetně kompletních zdrojáků, pokud je to interpretovaný jazyk, a ze snadno reverzovatelných binárek (určitě tam bude verze s debug symboly) pokud náhodou není). A ty teď tvrdíš, že se situace nějak změní, když budou používat LLM často i od té stejné firmy (Gemini = Google, ChatGPT = efektivně Microsoft, Claude = AWS) hostované na té stejné infrastruktuře?

A ty extrémně paranoidní, co teď mají on-premise Azure a on-premise GitHub/GitLab prostě budou mít vedle toho další rack s GPU - on-premise LLM. Zrovna třeba DeepSeek teď dělá přesně tohle.

Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #28 kdy: 19. 04. 2025, 13:09:52 »

Velkým zákazníkům jde spíše o to, aby neleaknuly jejich data, tj., aby model nezahrnul jejich otázky do svých znalostí. Některým jde o kód. Vlastně jakákoli práce s copilotama vede k leaku dat, které navíc patří firmě/zaměstnavateli, ne tomu vývojáři, co to tam dobrovolně kopíruje. A dalším jde o to, aby v obecných dotazech nebyly senzitivní informace. Třeba akciovky mají poměrně přesně zákonem dané, jak oznamují některé změny, akvizice atd. A pokud si třeba firemní copywriter nechá "připravit" tiskové prohlášení veřejným LLM, tak to už si říká o velký problém.
Ehm. Naprostá většina firem má maily v Google/MS Cloudu, soubory sdílí přes google/one drive/sharepoint, komunikuje přes Slack, Teams, Meet a Zoom - to "tiskové prohlášení" se připravuje právě tam - zdrojáky a CI mají na GitHubu a hotové aplikace pak běží v Azure, AWS a podobně (=včetně kompletních zdrojáků, pokud je to interpretovaný jazyk, a ze snadno reverzovatelných binárek (určitě tam bude verze s debug symboly) pokud náhodou není). A ty teď tvrdíš, že se situace nějak změní, když budou používat LLM často i od té stejné firmy (Gemini = Google, ChatGPT = efektivně Microsoft, Claude = AWS) hostované na té stejné infrastruktuře?

A ty extrémně paranoidní, co teď mají on-premise Azure a on-premise GitHub/GitLab prostě budou mít vedle toho další rack s GPU - on-premise LLM. Zrovna třeba DeepSeek teď dělá přesně tohle.

Já tvrdím jen to, co nám říkají zákazníci. Na začátku 2024 to bylo jedno, to jim stačila podpora Azure OpenAI, OpenAI (a tím to docela haslo, i když se podporoval i WatsonX), dnes jich hodně chce lokální modely, a ta snaha je tam je značná (i přes cenu). Ale víš jak, ona je to sociální bublina našich zákazníků, kteří potřebují hybrid cloud (jinak by asi šli k jinému dodavateli) a často běží disconnected clustery.

Jinak je vtipný, že taky máme Google mail, Google doc a Google meet. Ovšem (zjednoduším) zákaz copilotů (což ale chápu).

Zopper

  • *****
  • 881
    • Zobrazit profil
Re:Prerspektivy studia IT ve světle současného vývoje AI
« Odpověď #29 kdy: 19. 04. 2025, 13:19:28 »
Velkým zákazníkům jde spíše o to, aby neleaknuly jejich data, tj., aby model nezahrnul jejich otázky do svých znalostí. Některým jde o kód. Vlastně jakákoli práce s copilotama vede k leaku dat, které navíc patří firmě/zaměstnavateli, ne tomu vývojáři, co to tam dobrovolně kopíruje. A dalším jde o to, aby v obecných dotazech nebyly senzitivní informace. Třeba akciovky mají poměrně přesně zákonem dané, jak oznamují některé změny, akvizice atd. A pokud si třeba firemní copywriter nechá "připravit" tiskové prohlášení veřejným LLM, tak to už si říká o velký problém.
Ehm. Naprostá většina firem má maily v Google/MS Cloudu, soubory sdílí přes google/one drive/sharepoint, komunikuje přes Slack, Teams, Meet a Zoom - to "tiskové prohlášení" se připravuje právě tam - zdrojáky a CI mají na GitHubu a hotové aplikace pak běží v Azure, AWS a podobně (=včetně kompletních zdrojáků, pokud je to interpretovaný jazyk, a ze snadno reverzovatelných binárek (určitě tam bude verze s debug symboly) pokud náhodou není). A ty teď tvrdíš, že se situace nějak změní, když budou používat LLM často i od té stejné firmy (Gemini = Google, ChatGPT = efektivně Microsoft, Claude = AWS) hostované na té stejné infrastruktuře?

A ty extrémně paranoidní, co teď mají on-premise Azure a on-premise GitHub/GitLab prostě budou mít vedle toho další rack s GPU - on-premise LLM. Zrovna třeba DeepSeek teď dělá přesně tohle.
Tam jde, podle mě, o něco trochu jiného. S leaknutím dat se do nějaké míry počítá, úřady si je můžou i vyžádat, a proto se třeba nastavují nevypnutelná mazání soukromých zpráv na Slacku po dvou týdnech, a podobné věci. Ale když někdo z Microsoftu vynese data nějakého zákazníka, tak to bude pro MS ošklivá aféra a bude to drahé a žalovatelné, takže se ty korporáty snaží si tyhle věci navzájem nedělat. Zatímco když zaměstnanec nacpe ta samá data do ChatGPT, a za čtvrt roku to ta AI někomu vybleje slovo od slova, tak na OpenAI si ta poškozená firma nic nevezme. Může tak akorát vyhodit toho svého zaměstnance. A shareholdeři (a potenciálně úřady v případě třeba osobních dat) se začnou ptát "jak jste to mohli dovolit?" A šťourat se ve firemních procesech. Zatímco u toho emailu by se řeklo "my nic, my máme certifikaci, to oni" a problém se přehodí na ten Microsoft a tam to vyšumí do ztracena.