Jak moc uživalelsky pohodlná je paralelizace v R? Byly by to body, o který by R porazilo Pandas.
Vyzkoušení paralelizace mám na TODO listu, takže nepovím
Nástroje na to jsou, ale jak pohodlné to ještě nevím.
Jo počkat, myslíš paralelizaci přes víc strojů nebo v rámci jednoho? Jestli myslíš v rámci jednoho, tak to je v pohodě - Rko je docela funkcionálně orientovaný, takže klasika parallel map atd. Samozřejmě balíčků je na to X (jako ostatně v Rku na všechno
). Ale v tom žádnej rozdíl oproti Pythonu nebude, tam to jde určitě taky (vyzkoušený nemám).
Cokoli vetsiho v R je peklo. Je to prima nastroj na "otevru CSV, profiltruju na NA, namaluju obrazek, prozenu ANOVOU", ale na nejake programovani R nefunguje moc dobre. Zoufaly nedostatek pouzitelnych nastroju (uz jenom debugger je problem a nasi researcheri to obchazeji pomoci View v RStudiu), blbe navrhnuty jazyk (pro statistika dobre, ale na vetsi projekty nema dobre vlastnosti) a spousta ruznych necekanych pasti.
Jémine, tyhle jazyky přece nejsou určený k tomu, abys v tom psal informační systém (i když i http server v Rku existuje
). Jsou to jazyky primárně na
interaktivní práci s datama. Prostě vezmu dataset, dotlačím ho do správnýho formátu a vrazím do nějaké knihovny. Je to prostě lepidlo na knihovny, nic víc od toho nelze očekávat. Rozhodující pro tuhle práci je množství a kvalita knihoven a v tom je Rko dost slušný bych řekl.
Python je sice bezva, že to je univerzální jazyk, jenže jako lepidlo právě (imho) zas tak dobře nefunguje. Protože ho prostě ohýbáš na něco, na co nebyl určenej. A speciální nevýhoda je, že nemá rozumný makrojazyk. Takže předat parametr tak, aby se nevyhodnotil v době volání, je opruz. Viz krkolomná syntaxe selectu (narozdíl od Rka, kde samozřejmě selectem design jazyka začali - a téměř u něj skončili
).