ChatGPT a AI pro vývojáře

Filip Jirsák · « **Odpověď #45 kdy:** 09. 05. 2023, 11:00:57 »

Citace: RDa 08. 05. 2023, 03:38:16

Ja vam tedy odpovim, protoze o matematice vite asi tak velky H jako o jinych tematech, ve kterych tlacite sva moudra.

Vy mi opravu odpovídat nemusíte.

Citace: RDa 08. 05. 2023, 03:38:16

Zadny program neni schopen pracovat s celou mnozinou realnych cisel a nikdy ani nebude moci - protoze je nekonecne velika.

To, že nějaký program pracuje s celou množinou, neznamená, že musí mít uložena všechna čísla z té množiny. Třeba když budete pracovat s bankovními účty v CZK, stačí vám přesnost na dvě desetinná místa a řád biliard. Když budete mít program, který bude pracovat s hmotností, stačí třeba kladné hodnoty od řádu hmotnosti elementárních částic po řádu hmotnosti celého vesmíru. Ale programy, které budou pracovat s čísly v rozsahu 1/10¹⁰⁰ do 10¹⁰⁰ asi nebudou moc časté. Programy, které potřebují pracovat s přesností 10¹⁰⁰ platných číslic také nebudou moc časté.

Citace: RDa 08. 05. 2023, 03:38:16

Tak nam tedy prozradte, co delaji ty vase pocitacove programy? Neco jineho nez minil programator nebo tvurce vypocetniho systemu?
Pochybuji. Pokud neco "nesedi", je to vzdy neporozumeni technickych omezeni, nebo obycejna neznalost.

Počítačové programy mohou ukládat třeba změřené hodnoty (hmotnost, délka, věk apod.). Nebo mohou ukládat nějaký stav – třeba částku na bankovním účtu. Ve všech případech je nějaký očekávaný rozsah hodnot, což jsou hodnoty, které se reálně vyskytují, plus nějaká rezerva.

Podstatné je to, že když si programátor vyzkouší, že pro některé vybrané hodnoty mu aplikace s čísly v plovoucí řádové čárce počítá matematicky správně, neznamená to, že mu bude matematicky správně počítat pro všechna čísla.

Citace: RDa 08. 05. 2023, 03:38:16

Cely svet si mysli opak - jak jsem psal, pocet desetinnych mist zavisi od typu, ne od hodnoty.

Teď nastala ta správná chvíle, kdy byste měl vzít na vědomí informaci, že množina reálných čísel je nekonečná, a zamyslet se nad tím (to bude ten problém), zda dokážete v konečné paměti počítače reprezentovat všechna reálná čísla s přesností na tři desetinná místa.

Ta čísla jsou nazývaná „čísla v pohyblivé/plovoucí řádové čárce“ („floating-point number“) proto, že desetinná čárka není v reprezentaci čísel umístěna napevno (např. že by za ní vždy byla tři platná desetinná místa), ale pohybuje se.

Citace: RDa 08. 05. 2023, 03:38:16

Ty bezne typy maji velice jasne definovany ekvivalent presnosti v desetinnych mistech:
FP16 ... 3
FP32 ... 7
FP64 ... 15
FP128 ... 34

Ne, tyhle hodnoty nejsou přesnost v desetinných místech (tj. místa za desetinnou čárkou), to je rozsah, kolik řádů (zaokrouhleně, v desítkové soustavě) dokáže daný datový typ reprezentovat. Tj. třeba FP32 má v desetinné soustavě 7 platných číslic, a k tomu číslu se 7 platnými číslicemi se pak někam umístí desetinná čárka – může být někde uvnitř těch 7 číslic, nebo někde před nimi, nebo za nimi. Takže FP32 dokáže odlišit čísla 1 000 001 a 1 000 002, nebo čísla 1,000001 a 1,000002 nebo čísla 0,1000001 0,1000002. Ale už nedokáže rozlišit 1 000 001,01 od 1 000 001,02, nebo nerozliší 1,00000101 od 1,00000102. A nedokáže rozlišit 100 000 001 od 100 000 002. Takže kdybyste použil FP32 pro stav bankovního účtu, u lidí, kteří mají na účtě přes milion, by se vám objevovaly nebo ztrácely halíře.

Račte si to vyzkoušet a pak někam zalezte a nepokoušejte se opravovat tvrzení v oblastech, kterým nerozumíte.

Citace: Death Walker 09. 05. 2023, 03:25:37

vzdy ide o podmnozinu racionalnych cisel

Technicky máte pravdu, ale vždy se uvádí, že čísla v plovoucí řádové čárce jsou reprezentací reálných čísel. Protože reprezentace v omezené paměti počítače samozřejmě nedokáže reprezentovat ani libovolné přirozené číslo, reprezentace nekonečných množin je vždy jen přibližná. Takže jako číslo v plovoucí řádové čárce můžete (přibližně) reprezentovat i třeba pí nebo odmocninu ze dvou, což jsou reálná čísla.

Reklama

RDa · « **Odpověď #46 kdy:** 09. 05. 2023, 12:04:42 »

Citace: Filip Jirsák 09. 05. 2023, 11:00:57

Citace: RDa 08. 05. 2023, 03:38:16
Cely svet si mysli opak - jak jsem psal, pocet desetinnych mist zavisi od typu, ne od hodnoty.
Teď nastala ta správná chvíle, kdy byste měl vzít na vědomí informaci, že množina reálných čísel je nekonečná, a zamyslet se nad tím (to bude ten problém), zda dokážete v konečné paměti počítače reprezentovat všechna reálná čísla s přesností na tři desetinná místa.

Ta čísla jsou nazývaná „čísla v pohyblivé/plovoucí řádové čárce“ („floating-point number“) proto, že desetinná čárka není v reprezentaci čísel umístěna napevno (např. že by za ní vždy byla tři platná desetinná místa), ale pohybuje se.

Citace: RDa 08. 05. 2023, 03:38:16
Ty bezne typy maji velice jasne definovany ekvivalent presnosti v desetinnych mistech:
FP16 ... 3
FP32 ... 7
FP64 ... 15
FP128 ... 34
Ne, tyhle hodnoty nejsou přesnost v desetinných místech (tj. místa za desetinnou čárkou), to je rozsah, kolik řádů (zaokrouhleně, v desítkové soustavě) dokáže daný datový typ reprezentovat. Tj. třeba FP32 má v desetinné soustavě 7 platných číslic, a k tomu číslu se 7 platnými číslicemi se pak někam umístí desetinná čárka – může být někde uvnitř těch 7 číslic, nebo někde před nimi, nebo za nimi. Takže FP32 dokáže odlišit čísla 1 000 001 a 1 000 002, nebo čísla 1,000001 a 1,000002 nebo čísla 0,1000001 0,1000002. Ale už nedokáže rozlišit 1 000 001,01 od 1 000 001,02, nebo nerozliší 1,00000101 od 1,00000102. A nedokáže rozlišit 100 000 001 od 100 000 002. Takže kdybyste použil FP32 pro stav bankovního účtu, u lidí, kteří mají na účtě přes milion, by se vám objevovaly nebo ztrácely halíře.

Račte si to vyzkoušet a pak někam zalezte a nepokoušejte se opravovat tvrzení v oblastech, kterým nerozumíte.

Spis nastala ta chvile, kdy zas michate jabka s hruskama - zde konkretne PRESNOST a ROZSAH.

Aby jste takove chyby nedelal, je vhodne cisla posuzovat v normalizovanem zapisu (0.neco * 10 na neco).

Pro vase priklady kolem milionu + haliru tedy porad plati pocet desetinnych mist 7 dle me definice a halire jsou nereprezovatelna:

0.100000101 * 10^7
0.100000102 * 10^7

Pouzivani normalnizovaneho zapisu pak ma dalsi vyhodu - k te problematice vejs ohledne posouvani desetinne tecky. Zde se vztahuje omezena velikost exponentu, ktera dokaze reprezentovat omezeny pocet hodnot pro exponent (jez je nativne dvojkovy, ale lze znova odvodit desitkovy zaruceny ekvivalent). Tohle cca urcuje nejmensi a nejvetsi cislo pro dany FP datovy typ, coz je ortogonalni vlastnost k presnosti (ne nadarmo jsou pole pro mantisu a exponent zcela nezavisla).

Je to dobre videt na existenci FP16 - kdy se urcita presnost a rozsah (z int16) zobchodovala na jinou kombinaci rozsahu (vyssi) a presnosti (nizsi), protoze pro specificke aplikace to bude porad dostacujici a prinosnejsi.

RDa · « **Odpověď #47 kdy:** 09. 05. 2023, 12:13:23 »

Citace: Death Walker 09. 05. 2023, 02:49:47

Citace: Tomas-T 15. 02. 2023, 14:58:55
Citace: Jiří Havel 15. 02. 2023, 12:05:52
Ty floaty nejsou moc dobrý příklad. Tam se nějaký nedeterminismus hledá dost těžko.
Já myslím, že jako PŘÍKLAD PŘÍSTUPU dobré jsou.
Pokud se máte rozhodnout, zda budete zaměstnancům počítat výplaty s float nebo decimal čísly.
S floaty to zvládnete za 5 minut, s tím, že občas někde vyskočí nějaká halířová nepřesnost.
S decimaly to bude vždy přesně dle očekávání, ale počítat se to bude hodinu.

A příště podobný problém, jen nepůjde o peníze, ale o zpracovávání nějakých statistik v reálném čase.
Vyberete si stejně nebo jinak?

Tak sa trocha zamyslime a pouzijeme normalny 64bit integer, s tym ze predstavuje hodnotu vynasobenu 100. Ze to zaokruhluje na 2 desatinne miesta? To decimal tiez, teda za predpokladu ze ma nastavene 2 desatinne miesta. Naviac je to pozadovana vlastnost, ciferspioni nepocitaju na vedeckych kalkulackach ked kontroluju ci vami vystaveny danovy doklad je v poriadku. Co myslite ze sa bude pocitat rychlejsie?

Pokud se jedna o databaze, tak zde je take jedna skryta zrada - zatimco DECIMAL(x,y) urcuje garantovany ukladani dle x/y parametru, je typ INT(z) fixne dany (32bit) a parametr z rika jen doporuceni na formatovani vystupu :-)

Treba financni reporty z Microsoft store nam chodi ve formatu s 18 desetinnymi misty, tak to holt zatim importuji na DECIMAL(30,18), nez bude jasny co tim chteli jako rict.

Death Walker · « **Odpověď #48 kdy:** 09. 05. 2023, 12:15:23 »

Citace: Filip Jirsák 09. 05. 2023, 11:00:57

Technicky máte pravdu, ale vždy se uvádí, že čísla v plovoucí řádové čárce jsou reprezentací reálných čísel. Protože reprezentace v omezené paměti počítače samozřejmě nedokáže reprezentovat ani libovolné přirozené číslo, reprezentace nekonečných množin je vždy jen přibližná. Takže jako číslo v plovoucí řádové čárce můžete (přibližně) reprezentovat i třeba pí nebo odmocninu ze dvou, což jsou reálná čísla.

V relevantnych zdrojoch sa uvadza ze float umoznuje reprezentovat cisla priblizne. To ze inde sa vacsinou uvadza ako reprezentacia realneho cisla, je velmi zjednodusena interpretacia. Takze floagt su pribliznou reprezentaciou realnych cisel. V danom kontexte je formulacia "priblizne" dolezita a nie je mozne ju vynechat.

Na druhu stranu existuje software ktory dokaze pracovat s pi, odmocninami z 2 alebo 3 a dalsimi iracionalnymi cislami, presne, akurat nepouziva ich ciselnu reprezentaciu ale pozna ich matenatiku a pracuje s nimi formalne

Death Walker · « **Odpověď #49 kdy:** 09. 05. 2023, 12:49:47 »

Citace: RDa 09. 05. 2023, 12:13:23

Pokud se jedna o databaze, tak zde je take jedna skryta zrada - zatimco DECIMAL(x,y) urcuje garantovany ukladani dle x/y parametru, je typ INT(z) fixne dany (32bit) a parametr z rika jen doporuceni na formatovani vystupu :-)

Tak nastastie existuju aj databaze kde si mozete popisat vlastne datovy typy. Napr. postgres. Teda ak by vam nestacil typ money, ktory je interne definovany prave ako 64bit integer. Len sa jeho hodnota deli 100 a tomu je prisposobena aj jeho interna aritmetika. Teda nemusi byt 100, moze to byt 10000 ak mate v locales nastavene indicke rupie, alebo 1000 pre pakistanske rupie...

Co sa tyka decimal, vdaka jeho pomalosti je vhodny akurat na prototypovanie, ak mate moznost definovat vlastne typy a ich internu logiku.

Citace: RDa 09. 05. 2023, 12:13:23

Treba financni reporty z Microsoft store nam chodi ve formatu s 18 desetinnymi misty, tak to holt zatim importuji na DECIMAL(30,18), nez bude jasny co tim chteli jako rict.

Mno, Malejmekej, od nich vela veci funguje divne... Neviem ako to chodi teraz, ale cca v 2010 som robil okolo pokladnicnych systemov. Vtedy nebolo mozne aby sa nejaky financny software neriadil legislativou, nedostali certifikat od danovakov. Siemens sa bol ochotny prisposobit, takze po dlhom vysvetlovani ako to ma fungovat a prikladoch ako to naprogramovat, nakoniec ten certifikat dostali (islo o velkeho zakaznika s prevadzkami po celej europe). Takze ten vas import s 18 desatinnymi miestami by som konzultoval s nejakym uctovnikom ktory dobre rozumie svojej praci. Ak ten financny report je pre vasu internu potrebu tak sa zrejme nic nestane, ale ak na zaklade neho odvadzate dane, tak moze byt problem.

Reklama

Filip Jirsák · « **Odpověď #50 kdy:** 09. 05. 2023, 13:29:47 »

Citace: RDa 09. 05. 2023, 12:04:42

Spis nastala ta chvile, kdy zas michate jabka s hruskama - zde konkretne PRESNOST a ROZSAH.

Celou dobu se tu bavíme o přesnosti. To, že vy píšete o rozsahu ale používáte termín přesnost, to je váš problém.

Citace: RDa 09. 05. 2023, 12:04:42

Pro vase priklady kolem milionu + haliru tedy porad plati pocet desetinnych mist 7 dle me definice

To, že jste si vymyslel vlastní definici pojmu, který všichni ostatní používají v jiném významu, je váš problém. „Desetinná místa“ v češtině vždy označují místa za desetinnou čárkou.

Citace: RDa 09. 05. 2023, 12:04:42

protoze pro specificke aplikace to bude porad dostacujici a prinosnejsi.

Což je přesně to, co jsem psal – že aplikace pracuje s určitým rozsahem hodnot, málokdy potřebuje umět reprezentovat všechny hodnoty, které umí reprezentovat daný typ. Třeba když je ve zdravotnické dokumentaci uložena hmotnost pacienta v kg, určitě nejsou potřeba záporná čísla, určitě nejsou potřeba čísla přes tisíc, a přesnost bude stačit nejspíš maximálně na dvě desetinná místa.

ChatGPT a AI pro vývojáře

Filip Jirsák

Re:ChatGPT a AI pro vývojáře

Reklama

RDa

Re:ChatGPT a AI pro vývojáře

RDa

Re:ChatGPT a AI pro vývojáře

Death Walker

Re:ChatGPT a AI pro vývojáře

Death Walker

Re:ChatGPT a AI pro vývojáře

Reklama

Filip Jirsák

Re:ChatGPT a AI pro vývojáře