diskutující na tomhle fóru mají vysoký IQ a to mě baví
díky za to!
volně navazuju na:
https://forum.root.cz/index.php?topic=15068.0poslední cca 4 roky jsem začal dělat data a povím vám příběh, proč už je asi
dělat nebudu.
na začátku mi to celý připadalo nepřehledný a nečitelný a začal jsem se o
datech vzdělávat ve škole a potom doma (naopak v programování to bylo
tak že jsem ve 13ti začal a kdybych se doma nevzdělával, tak jsem dneska nula).
naučil jsem rozhodovací stromy, regrese a nějaký alternativní přístupy jako
neuronky, genetický algoritmy a jiný srandy. šel jsem do praxe kde jsem dělal
business intelligence ale ve smyslu excel, dashboardy, potýkaní se s vizualizaci
a jak jednoduchý věci dát do grafu a umět složit pro manažera příběh co ten
graf říká, proč to tak řiká atd... problé je v tom, že to není žádná věda a
jednou bude takových lidí tolik jako je dneska lidí na
php / python / možná javu...
takže co dál? šel jsem se dívat právě na ty alternativní metody. a tam jsem se
samozřejmě nabil prtože nejsem matematik. jak tu vzpomínal kolega kde hledat
výzvy:
http://www.youtube.com/playlist?list=PLrAXtmErZgOfMuxkACrYnD2fTgbzk2THWjenže bohužel, tohle co tam říkají plus mínus znám ale je to všechno hello world
věci - gradientni metoda, feature normalization. jenže praxe si žádá aby jste tomu
rozuměli. uměli udělat cost function nebo hypotézu. rozuměli tomu a věděli proč
tohle tady atd. velmi doporučovanou prerekvizitou je, že máte dobrý background
VŠ matiky a to já nemám. když se podívám na lidi z matematických škol (technický,
přírodovědný obory...) tak nemám šanci věcem do rozumný hloubky rozumět. prostě
nemám.
takže? zbývá data engineering, který jsem dělal minimálně. paradoxně si nejsem
jistý jestli tohle je cesta. dělat ETL? no nevim co je to za výzvu. hustý už je
se vyznat ve světě not-only SQL databází.být kovaný jestli elasticsearch nebo
cassandra, hbase nebo snowflake. zase dělat v BI datový sklady taky nemusí
být špatný. jenže tohle je spíš o učení se. asi jako když se učíte puppet,
centos nebo nginx akorát se učíte databáze. a to já raději programuju
(mluvím o principu. jinak se učíte když se učíte javu a jinak se učíte, když
se učíte cisco... to dá rozum)
tady hezky dostávám k tématu který jsem už založil. dneska jsou "webový
appky" na takovým místě, že jen na fulltime můžete řešit Kafku a streaming
architekturu. a tady si nějak kladu otázky kolem paralelních a distribuovaných
sys.....
a je tu problém který to celé korunuje. nemám žádnou pořádnou business doménu,
ve které bych data dělal. (jako asi mám, ale je to pycho...) příklad.
jste doktor, znáte kontext a když umíte regresi, tak jste všechno vyhráli.
jste kovaný v nějaké problematice a data spolu s metodou vám dají do ruky
samurajský meč. není to o neuronce jak vám úžasně klasifikuje. "neuronka" totiž
nahrazuje váš mozek a zkušenosti. data a regrese vám dává jistotu rozhodnutí
udělat.
takže co radíte?