Dovolím si tohle vlákno ještě probudit. (Pár relevantních příspěvků proběhlo trochu nadivoko a off topic ještě
v nesouvisejícím sousedním vlákně.)
Měl jsem kolem Vánoc pár dnů volna, tak jsem zkusil trochu číst (a čučet na YT), co nového se k tématu v posledních letech urodilo. A k mému překvapení jsem našel pár věcí, které jsou pro mě v tuto chvíli nové, a o své nadšení bych se rád podělil. Můj komentář bude nutně laický a povrchní, pročež mi vyhovuje půdorys a neformální atmosféra tohoto fóra = není to zralé na článek a asi ani na samostatný webík, neproběhlo žádné hands-on hraní takže nemám ani nějaké svoje zdrojáky nebo konfigurace ke zveřejnění. Budu si opět jenom cintat pentli.
Seznam odkazů zřejmě zhustím na konec / do druhé části tohoto příspěvku, protože je toho poněkud víc.
Asi už jsem tady zmiňoval svůj dávný perpeťácký nápad, že "vědomí" či bdělý stav v biologickém mozku či ANN by mohlo fungovat na bázi "smyčky zobecněné kognitivní zpětné vazby", která by se skládala asi ze tří bloků:
1) nějaký uzel nadaný schopností udržovat "pracovní plochu", krátkodobý buffer, "kurzor do embeddings space" nebo tak něco...
2) auto-asociativní dlouhodobá paměť: jako dotaz přijme (referenci na) nějaký symbol či téma, a vrátí související symboly či témata
3) adaptivní filtr, který bude "potlačovat výsledky příliš mimo žádaný azimut úvahy". Výstup filtru zpátky do 1).
Schválně přiložím náčrtek, který jsem si k tomu před lety načmáral.
Je to jenom hrubý základní princip. Reálně by ta věc musela být hierarchická / skládat se z více vnořených smyček, musela by mít vstupy zvenčí od senzorů (smyslů), nějaké výstupy k "aktuátorům", nějaké stanovené cíle apod. Ten nápad že "mozek je veliký složitý kontrolér" ostatně nemám ze své hlavy. Popravdě mám v tomto kontextu pár dalších čmáranic, ale nechci tady svým vesnickým perpeťáctvím tapetovat, a kromě toho jsou mi spíš protivné "filozofické" a psychologické top-down přístupy k AI (jakožto mlácení prázdné slámy bez reálné náplně).
Pokud správně chápu fungování dnešních LLM, je tato moje představa na míle vzdálena fungování dnešních transformerů/LLM. Transformer/LLM se zvenčí přidaným lešením je jako somnambulik, kterého jsme upoutali do chodítka a nutíme ho, aby s námi konverzoval... není to bytost nadaná bdělým vědomím a nějakou vlastní vůlí.
Je jistě otázkou definitorickou, jak si vlastně představujeme AGI jakožto cíl vývoje. Má mít něco jako vlastní vědomí a vůli?
Nebo bychom radši koncepčně pokračovali v evoluci dnešních LLM? coby obří vegetativní znalostní báze, které se můžeme dotazovat prostřednictvím velkého počtu simultánních front-end relací...
Začínám mít pocit, že tenhle dnešní model LLM je vlastně žádaný:
- nemá vlastní vůli, což je v bezpečnostních ohledech plus, nevrazí nám kudlu do zad (kdo s tímhle straší, tak si jenom dělá PR bulvární cestou)
- obsahuje super-human objem znalostí (naučil se veškerý text a obrázky co našel na internetu), stačí přece trochu redigovat nejhorší zvěrstva v obsahu
- běží centralizovaně v datacentru, takže se to dobře správcuje, zapadá to do moderního trendu "všechno as a service", tj. má to šanci na smysluplný obchodní model
- možné bezpečnostní "postranní úmysly" nebudu blíže rozvádět
- častou výtkou je, že LLM se musí naučit předem, a back-endová "znalostní databáze" se následně už neučí z konverzace s uživatelem. Při bližším pohledu mám pocit, že toto je provozovatelem vnímáno spíše jako výhodná přirozená vlastnost, pokud ne vysloveně tichý záměr. Kdyby se znalostní báze dala ovlivňovat promptujícími uživateli, nejspíš by strašně rychle zdegenerovala i přirozeným způsobem, teoreticky by se dala taky záměrně zmanipulovat (masivně paralelně přesvědčovat pomocí botnetu) apod.
Tzn. skoro bych řekl, že ta architektura není projevem bezradnosti "prostě nám to takhle nějak vyšlo", ale dost možná je výsledkem cílevědomého designu. Třeba se o tom jenom nemluví nahlas na veřejnosti... divácky vděčnější je pábit o tajemných vnitřních pochodech, mystické emergenci nečekaných vlastností, netušených horizontech budoucího vývoje apod.
Lidský jedinec si celý internet do kedlubny nenacpe. Zato je nadán vlastní vůlí, bdělým vědomím, schopností autonomního pohybu v prostoru, ba dokonce jemnou motorikou, schopností učit se průběžně na jednotlivých příkladech a zkušenostech, a dnešní LLM dosud převyšuje mj. schopností "kriticky uvažovat", což je zčásti výsledkem odpovídající architektury CNS, zčásti bohatstvím zážitků z mnoha let reálného života (jak zde již zmínili druzí).
Mně osobně je sympatičtější pojetí AGI jakožto stroje, nadaného bdělým vědomím a jistou mírou autonomie, žijícího v reálném čase, schopného se průběžně učit, opravovat si a upřesňovat předchozí vědomosti. A pokud se náhodou ukáže, že super-human vševědoucnost je s touto architekturou neslučitelná, a že z toho pramení taky jistá míra "lidských" chyb, tak mě to nakonec ani neuráží :-) Popravdě k nahrazení lidí v mnoha profesích je tato varianta užitečnější, než vševědoucí vegetativní LLM.
Už se zase platonicky vykecávám. A co jsem teda našel:
V rovině přírodní neurobiologie jsem si trochu dostudoval vnitřní strukturu toho "květáku" co nosím v lebce, a narazil jsem na asi dva autory, kteří se věnují thalamu a jeho komunikaci s "cerebrálním kortexem" (= šedou kůrou). Komunikace je to obousměrná, zřejmě do jisté míry iterativní, netriviálně sekvenční / kaskádová. Zmíním dvě jména:
Murray Sherman - ročník 1944, odborník na thalamus, klade důraz na jeho "funkci reléové ústředny": zprostředkovává "signálové spojení" senzorických vstupů do kortexu a také spojení mezi různými částmi kortexu navzájem. Zmiňuje, že různé části kortexu mají často navzájem jak přímé spojení, tak nepřímé skrz thalamus. Nepouští se ale do spekulací, co tahle topologie axonů/dendritů/synapsí implementuje v rovině kognitivních funkcí.
Michael Halassa - mladší chlap, odborník na thalamo-kortikální interakce. Nad rámec toho co říká Sherman, Halassa se odvažuje dál v tvrzeních o roli thalamu jakožto "adaptivního filtru", který "přepíná kontexty" pro různé oblasti neokortexu.
(Zdá se, že v osobně-pracovní rovině má M.Halassa nějaký škraloup... otázka je, zda to nějak zpochybňuje jeho publikační činnost.)
Jako klíčový šém do googlu, odemykající slibnou bublinu / rabbit hole, se ukázalo cca sousloví "talamokortikální reverberace". Celé tohle talamokortikální téma zjevně není zdaleka tak populární, jako moderní LLM... bodejť, asi to není tak zralé ke zpeněžení. Produktizace zatím prakticky žádná, syntetické ANN s touhle topologií zatím podle všeho neexistují.
Bohužel celý obor neurobiologie, a tohle téma zejména, souvisí také s pokusy na zvířatech :-( Murray Sherman si v několika nahrávkách posteskl, že se mu v průběhu desítek let jeho kariéry zužuje paleta "zvířecích subjektů", na kterých smí pokusovat. Uff. Obtížné téma. Prakticky se většina výzkumu talamo-kortikálních interakcí a třeba taky funkce hippokampu dnes odehrává na myších. A občas někdo z přednášejících zmíní, že vědí, že konkrétní krásně pozorovatelná funkce myšího mozku je u primátů zjevně zadrátováná podstatně jinak. Záznam EEG / odposlechové sondy na jednotlivých neuronech dávají jiný obrázek, obvykle mnohem méně jasný.
Zprvu jsem se nevěřícně potutelně usmíval, že ty talamo-kortikální alfa vlny vypadají v podstatě jako projev (zvenčí snímaná obálka) iterativního cyklení zpětnovazební kognitivní smyčky. Nebo alespoň základního "živočišného bdělého stavu". Postupným čtením a sledováním materiálů mi úsměv trochu ztuhl a pozvedl jsem obočí... Prakticky v kterémkoli videu se dozvíte, že jednotlivý biologický neuron má rychlost reakce řádově 10 ms, a že reálný cyklus práce talamo-kortikálních spojů je řádově 100 ms. S tím, že různé nervové dráhy jsou různě rychlé - některá videa zaměřená na toto téma specifikují poměrně podrobně "zapojení" na úrovni jednotlivých neuronů a synapsí v talamu, kam se vážou do neokortexu, jakého jsou typu a jak jsou rychlé.
Charles Simon k tomu upozorňuje, že tyhle "průchozí latence" biologických neuronů jsou hrozně pomalé ve srovnání s křemíkovou elektronikou. A že pokud má mozek reagovat během nízkých jednotek sekund, tak to silně omezuje "sériovou komplexitu zpracování" = podle všeho nehrozí kdovíjak vysoký počet iterací nebo vrstev neuronové sítě. Spíš to vypadá na relativně krátký proces v několika málo krocích asociativního zpracování.
Obří je naopak míra paralelizace. Inu relevantní "embeddings space" má prakticky paralelní rozhraní :-( Matně si vybavuji jednu zmínku, že rozhraní thalamu vůči kortexu se skládá z nějakých milionů paralelních axonů (a nedokážu upřesnit, kterého savce se toto číslo týká.)
S tématem úzce souvisí pojem "kortikální sloupec" (cortical column) = cosi jako "základní skladebný makroblok šedé kůry", který se skládá asi ze 100 neuronů, má poměrně ustálenou vnitřní struktru (asi 6 vrstev) a opakuje se prakticky napříč celým neokortexem, v mírných obměnách funguje v různých "centrech" s různými funkcemi.
Několik autorů vyjadřuje názor, že tahle opakovaná/modulárně skladebná struktura je projevem vývoje mozku během vývoje jedince z vajíčka postupným dělením buněk pod volnou režií ze strany DNA. "Zdrojový kód" pro architekturu mozku nemůže být příliš detailní - spíše se načrtnou hrubé obrysy a základní bloky/centra, skladebnost kortexu z opakovaných kortikálních sloupců, a velká část funkční topologie axonů/dendritů/synapsí se naučí až po narození = už během života jedince. Údajně včetně třeba některých ne úplně vysokých funkcí/vrstev zrakových center.
Pokud se týče umělých neuronových sítí, inspirovaných přírodní předlohou, takových modelů zřejmě existuje přehršel, z toho většina privátně v laboratořích výzkumných týmů. Několik málo modelů z této kategorie (= mimo mainstream transformers/LLM) je volně k dispozici. Navzájem se liší mírou detailu, jak moc se drží biologické předlohy, a třeba také uspořádáním a úrovní abstrakce nějaké jednotící komunikační vrstvy. Níže zmíním cca dva příklady.
Zdá se, že v obou případech mají autoři za sebou předchozí pokusy o "produktizaci" NN modelů / simulátorů, a nedostatek prostředků k dalšímu vývoji na komerční bázi je nakonec vedly k uvolnění zdrojáků na githubu...
Tuším jsem tu už dříve krátce zmínil Charlese Simona a jeho "ANN Lego inspirované spiking neurony".
V odkazech tentokrát uvedu dvě reprezentativní videjka - z mnoha, která zatím natočil. Bohužel se často opakuje, na YT se vynořil nedávno a zatím se úplně nevymotal z popisu emulovaných pulzujících neuronů, se kterými si zřejmě dosud detailně "hraje".
Na filmečcích tohoto autora oceňuji podrobnou znalost biologického originálu a přiměřeně detailní výklady klíčových principů - a dále zajímavé nápady, co z toho si půjčit do ANN emulace.
Zdá se, že Ch.Simon vyvrací několik velmi tradičních mýtů o fungování neuronů a synapsí, učení z jednotlivých pokusů apod.
Připadá mi přitažlivý princip, že spiking wetware a stejně tak spiking ANN nespotřebovává energii na hrubě paralelní násobení matic, ale že funguje "sparse" způsobem: energie je spotřebována pouze na pulzy. Neaktivní neurony a synapse mají mizivou spotřebu a v ANN emulaci nemusí spotřebovávat výpočetní výkon. Učení probíhá jiným způsobem, než u dnešních LLM - a jak učení tak inference si vystačí s mnohem slabším hardwarem. Popravdě při skutečně průběžném učení obě fáze mohou splývat... v biologickém mozku učení prakticky nejde zastavit, v ANN modelech se detaily dají samozřejmě implementovat nějak po svém.
Charles Simon má na githubu dvě repa:
- starší Brain Simulator II, prakticky hotový software. Tuším se soustředí na jednotlivé neurony a malé sítě.
- novější Brain Simulator III, řekněme work in progress, bez kompletní dokumentace. Snahou tuším je, implementovat vyšší funkce a rozvoj topologie ANN během učení.
Oba modely jsou dostupné ve formě zdrojáků, převážně v C# .
Bohužel autor nevystavil zkompilované binárky. Ke kompilaci je potřeba MS Visual Studio - nezkoušel jsem, tolik času nebylo. Možná přesně to je cílem - oddělit skutečné zájemce od hračičků, kteří budou jenom loudit vedení za ručičku.
Autor tvrdí, že s tím zkusmo simuloval na stolním PCčku řádově miliardu neuronů. Docela by mě zajímalo, jakou úlohou ty neurony zaměstnal :-D
Dále stojí za zmínku Jeff Hawkins a jeho tým, dříve pod značkou Numenta, nyní v rámci Thousand Brains Project.
Jeff Hawkins kdysi spoluzaložil Palm Computing.
ANN model projektu TBP se jmenuje Monty a i zde jsou zdrojáky k dispozici na githubu.
Inspirace biologickou předlohou je u tohoto modelu poněkud volná. Údajně nepoužívá spiking neurony.
Nicméně se model učí průběžně (nebo téměř) resp. umí se doučovat nové objekty inkrementálně, a je v této situaci odolný proti "katastrofickému zapomínání". Je také mimořádně úsporný na výpočetní výkon (ve srovnání s klasickými "deep learning" modely).
Zvláštní je modulární vnitřní struktura modelu Monty. Členové týmu TBP občas přirovnávají "learning modules" ke kortikálním sloupcům, mě ale tato analogie moc nesedí. Spíše se zdá, že jednotlivý learning module odpovídá konkrétnímu funkčnímu centru neokortexu (nebo takovou roli může kolektivně plnit skupinka několika "learning modulů"). Také zvolená jednotící "komunikační sběrnice" se odehrává na první pohled na docela vysoké úrovni abstrakce, přitom ale metamodel protokolu by se zdál poměrně úzce doménově specifický... prostě mi to sedí velmi dobře na deklarovaný dosavadní hlavní účel modelu, a to senzo-motorické záležitosti, zejména rozpoznávání vizuálních objektů iterativním "ohledáváním rysů" -- ale ve chvíli, kdy Jeff Hawkins v jednom Q&A videjku odpovídá na jakýsi dotaz, že se chystají implementovat hippocampus, a že model je architekturou způsobilý i pro obecné "kognitivní" úlohy... mám své pochybnosti, zda vychází z hlubokých znalostí biologie a modelu Monty, nebo jestli náhodou jenom nepábí v obchodně konejšivé rovině :-)
Celé mi to připadá citelně "engineered", spíše než blízké biologii. A pravda je, že v jednotlivých videjkách různí členové týmu vysvětlují, že biologické věrnost nebyla primárním cílem, a že detaily implementace modelu stojí na pečlivě zvažovaných "designových rozhodnutích" - a vcelku při tom srší znalostmi neurobiologie a kongnitivních věd = působí dojmem, že vědí co dělají...
Ještě další takový "svůj" model má Chris Eliasmith, jmenuje se Spaun, verze 2 je na githubu... podrobněji jsem ho nezkoumal, opět má nějakou "engineered" jednotící vrstvu na poměrně vysoké úrovni abstrakce.
Suma sumárum, nenašel jsem v tomto zvláštním koutě AI oboru žádnou hotovou hračku, po které bych s gustem skočil.
Zdá se, že jak výzkum detailního fungování talamo-kortikálních mozků, tak vývoj "spiking" a jiných úsporných a "biologii blízkých" modelů ANN probíhají mimo hledáček médií a mimo zájem bohatých firem.
Pro mě osobně je tato oblast na mé povrchní úrovni chápání mimořádně zajímavá, ale asi jsem v této své libůstce prakticky osamocen. Třeba soudě podle počtů zhlédnutí níže odkazovaných YT materiálů.
Tolik asi moje zdůvodnění, proč se nadále nebojím, že by v nejbližší době vznikla nějaká nadlidská AGI, nadaná lstivou vůlí a schopnostmi, zhasnout svého stvořitele.
Následuje slíbený seznam odkazů.
**** To nejlepší co jsem potkal:
Charles Simon a jeho Brain Simulator modely
https://youtu.be/1Ip8xg8LPkA?t=118https://www.youtube.com/watch?v=wVeGYkPM2SwNa YT kanálu jsou v tuto chvíli dvě dlouhá videjka ohledně nápadů, jak by se na tomto "substrátu" dal postavit vstup videa.
https://github.com/FutureAIGuru/BrainSimIIhttps://github.com/FutureAIGuru/BrainSimIIIMurray Sherman
Thalamocortical System I and II
https://www.youtube.com/watch?v=aB2M1gg_1sUhttps://www.youtube.com/watch?v=KBILhSTpzFIPan profesor je zřejmě dobrá chodící encyklopedie...
https://www.youtube.com/watch?v=AJa7JRTnZFIMike Halassa
https://youtu.be/3gmGWte6h-k?t=1110...odkaz vede na konkrétní čas - kde je zmíněno, že součástí funkce thalamu je "dynamický filtr". Později muzika ještě o něco přitvrdí.
Pan profesor má zajímavý blogísek:
https://michaelhalassa.net/blog/Zmínil bych jeden konkrétní záznam:
https://michaelhalassa.net/a-thalamocortical-model-for-contextual-inference/...v závěru je tam odkaz na návazný výzkum v Číně, neměl jsem čas to zkoumat.
Školní homepage:
https://facultyprofiles.tufts.edu/michael-halassa/publicationsFaber+Novák 2012, "Thalamo-kortikální reverberace produkuje alfa rytmus jako iterativní kognitivní proces ve
stochastickém prostředí"
https://cognitive-remediation-journal.com/pdfs/crj/2012/01/01.pdf** Další projekty, které staví na (snad) spiking architektuře
a snaží se o nějakou modularitu / společného jmenovatele v podobě
standardizované "interní komunikační platformy" - moc mě to za srdce nechytlo:
Jeff Hawkins a jeho tým (ex Numenta)
Thousand brains theory/project
https://thousandbrains.orgPředstavení projektu - zpočátku neodsejpá, ale postupně houstne a začne dávat nějaký smysl
https://youtu.be/lqFZKlsb8Dc?t=250Další velké intro, čerstvější, je tam i nějaká "getting started" sekce:
https://youtu.be/a04Zvpzzbqg?t=3989Celé od začátku, prvních asi 9 minut je ticho:
https://youtu.be/a04Zvpzzbqg?t=545 Monty's capabilities
https://youtu.be/KJ74pKUTC-Y?t=1161Čerstvé Q&A videjko:
https://www.youtube.com/watch?v=50YPPzQ0BfI&t=711s...časová značka odkazuje doprostřed, na otázku "používáte vůbec spiking neurony?". Odpověď je zajímavá v několika rovinách.
Videjko stojí za shlédnutí celé, minimálně jako "food for thought", přestože mnoho konkrétních odpovědí nedostanete.
https://github.com/thousandbrainsproject/tbp.montyChris Eliasmith a jeho Spaun:
https://brainsandmachines.net/chris-eliasmith/Nevím nakolik je Spaun 2.0 ještě jeho dítě, nebo spíš jeho žáků:
https://github.com/xchoo/spaun2.0* Pár obecnějších intro materiálů k související problematice:
Anton: recurrent processing theory (pasuje na TCRS atd.?)
https://youtu.be/OlnioeAtloY?t=865Anton: hrubá anatomie mozku (svrchní mozkový kmen a thalamus)
https://youtu.be/OlnioeAtloY?t=171Kortikální sloupec
https://en.wikipedia.org/wiki/Cortical_columnDalší čtení o vnitřní struktuře kortikálního sloupce
https://www.google.com/search?q=inner+structure+of+a+cortical+column%2C+taxonomy+of+the+different+neuron+cell+types%2C+PDF+paper&udm=2Thalamus: most mezi senzorickými vstupy a neokortexem, možné "staré centrum vědomí"
https://en.wikipedia.org/wiki/Thalamus- Sherman a Halasa tvrdí, že to zřejmě zdaleka není jenom hloupá rozvodná skříň uprostřed mozku, spíš inteligentní filtrující multiplexer.
Hippocampus: přepis vzpomínek z krátkodobé paměti do dlouhodobé.
https://en.wikipedia.org/wiki/Hippocampus...novější zdroje dávají Hippocampus spíše do souvislosti s mapováním prostředí, vytvářením "modelu levelu", ve kterém se agent-savec pohybuje a "ví kde zrovna je"
Údajně je to dobře pozorovatelné v myším mozku, u chytřejších savců (primáti, ale třeba jenom chytřejší příbuzní myší) údajně "reverse engineering" až tak dobře nevychází.
Různí přednášející:
Hippocampal Place Cell fields and sequences
https://www.youtube.com/watch?v=PQNvfQJO-NMhttps://www.youtube.com/watch?v=q2x_4JmxMoMhttps://www.youtube.com/watch?v=yG54DEM05kQPrefrontal cortex: umožňuje soustředěné přemýšlení/uvažování, disponuje pracovní pamětí
https://en.wikipedia.org/wiki/Prefrontal_cortexWernicke:
https://www.wikiskripta.eu/w/Wernickeho_centrum_%C5%99e%C4%8DiBroca:
https://www.wikiskripta.eu/w/Brocovo_centrum_%C5%99e%C4%8DiNedala by se thalamo-kortikální smyčka implementovat v ANN? :
https://www.researchgate.net/publication/369055829_Remembrance_of_things_perceived_Adding_thalamocortical_function_to_artificial_neural_networks