Zobrazit příspěvky

Tato sekce Vám umožňuje zobrazit všechny příspěvky tohoto uživatele. Prosím uvědomte si, že můžete vidět příspěvky pouze z oblastí Vám přístupných.

Příspěvky - ShiroDN

Stran: [1]

Vývoj / Re:Nechápu limity a raty u OpenAI

« kdy: 18. 06. 2023, 19:19:39 »

Ano přesně tak limity počtu tokenů jsou na https://platform.openai.com/docs/models/overview. Vždy záleží na konkrétním použití. Pokud třeba chceš hledat pomocí openAI API v dokumentu, tak lze použít různé technicky dlouhodobé paměti. Na to slouží tzn. vektorové databáze.

Funguje to tak, že text dokumentu pošleš na embbeding model, ten ti vrátí velký matrix čísel - to je číselná reprezentace textu. Ten se uloží do vektorové databáze. Následně to funguje tak, že před dotazem na openAI API se nejprve provede hledání ve vektorové databázi a výsledek z tohoto hledání se pošle jako součast requestu. Tedy neposílá se celý dokument ale jen relevantní časti textu.

Tuto problematiku řeší třeba langchanin pro python a javascript což je framework, kde je většina těchto problémů již vyřešena: https://github.com/hwchase17/langchain

Pokud pak je třeba hledat v opravdu velkým množství dat, tak pak je asi potřeba použít fine tunning, tzn. doučení daného modelu. Ale to už je mnohem dražší.

Vývoj / Re:Nechápu limity a raty u OpenAI

« kdy: 18. 06. 2023, 18:42:32 »

Limit 3 RPM znamená 3 volání API za 1 minutu. V tvém případě ale řešíš počet tokenů, který na API můžeš poslat v jednom requestu a to je kolem 4097 včetně historie u chatgpt modelů, tomu se říká context lenght.

max_tokens parametr je limit počtu tokenů na completion reqest, tedy tímto limituješ počet tokenů, které ti model vrátí - tím se omezuje velikost odpovědi.

Ohledně zpracování celého dokumentu - prvně záleží jaký je to jazyk, u češtiny třeba je spotřeba tokenů mnohem větší, protože každý znak s diakritikou se počítá jako extra token. Pokud to má 106987 znaků jak píšeš, tak to se tam určitě nevleze. Chatgpt třeba začne postupně zapomínat starší zprávy z aktualní chat relace.

Počet tokenů si můžeš zkusit spočítat zde: https://platform.openai.com/tokenizer, stačí vložit text a přepočítá to na tokeny.

Tyto limity se ale nevztahují na rychlost generování.

Vývoj / Re:Nechápu limity a raty u OpenAI

« kdy: 18. 06. 2023, 17:01:32 »

OpenAI API má několik limitů, každý se váže na něco jiného.

Mají user API limit na daný model, to je pro davinci a ostatní text modely 60 RPM (requestů na API za minutu) a zároveň maximální počet tokenů input+output nesmí přesáhnout 250 000, tento limit ale po 48 hodinách padá a je automaticky navýšen viz https://platform.openai.com/docs/guides/rate-limits/what-are-the-rate-limits-for-our-api.

Dále je tu limit počtu tokenů na 1 request - davinci má limit 4097, tedy input+output nesmí dohromady přesáhnout 4097 tokenů, před pár dny byl oznámen model s podporou 16k tokenů, podrobnosti zde https://platform.openai.com/docs/models/overview.

Sítě / Re:Wireguard / VPN - spojenie dvoch klientov

« kdy: 19. 08. 2020, 15:25:40 »

Ahoj,

1. Vždy záleží na konkrétním použití, pokud potřebuješ směrovat pouze určitý provoz přes vpn je to naprosto v pořádku. Nevím kde jsi to "doporučení" našel, ale spíše je to jen pro ty co si to jinak nastavit neumí a nevyznají se v routingu/iptables atd.

2. Když chceš propojit 2 a více klientů a ani jeden z nich nemá veřejnou IP, tak musíš použít prostředníka - tedy něco co má veřejnou adresu. Minimálné jedna strana vždy musí mít vyplněn endpoind. U server-klient je to právě klient, který má adresu serveru předvyplněnou. Server mít endpoint klientů nemusí, protože endpoint u klientů je většinout dynamický, jak přecházíš mezi sítěmi. Pak už je to jen o nastavení na serveru. Na arch wiki je pěkný návod https://wiki.archlinux.org/index.php/WireGuard#Specific_use-case:_VPN_server, po následování návodu by ti měla komunikace client-to-client fungovat.

Jsou tu různé projekty, které se nutnost prostředníka snaží eliminovat, ale většinou je to zbytečně moc komlikované, třeba nedávno https://www.root.cz/zpravicky/dns-sd-objevovani-a-prime-propojeni-ucastniku-za-natem-wireguard-tunelem/.

Vývoj / Re:Rapsberry Pi: Embedded touchscreen GUI

« kdy: 13. 11. 2017, 10:47:17 »

Testoval jsem na rpi QT quick v EGLFS módu, jede bez Xka, podporuje oficiální touchscreen a nezatěžuje tolik rpi.

Stran: [1]