Fórum Root.cz
Hlavní témata => Vývoj => Téma založeno: michal2 02. 04. 2017, 12:33:46
-
Ahoj, pracujem ako .net vyvojar informacnych systemov, takze s tym, na co sa chcem opytat som sa nikdy nestretol, tak sa ospravedlnujem ak by som sa zle vyjadril, respektive opytal sa na uplnu banalitu.
Chcel by som si doma skusit spravit jednoduchu aplikaciu, ktora by dokazala rozoznavat napr text v obraze, nejake gesta, alebo nieco podobne. Na ucenie mam celkom cas, pretoze mi to nesuri do skoly ani do prace, je to len cisto moja zvedavost, a skusit si nieco nove. Vedel by mi preto niekto dat nejake rady ako zacat, a co si nastudovat, alebo co by mi mohlo nejakym inym sposobom pomoct? Dakujem
-
Ahoj, pracujem ako .net vyvojar informacnych systemov, takze s tym, na co sa chcem opytat som sa nikdy nestretol, tak sa ospravedlnujem ak by som sa zle vyjadril, respektive opytal sa na uplnu banalitu.
Chcel by som si doma skusit spravit jednoduchu aplikaciu, ktora by dokazala rozoznavat napr text v obraze, nejake gesta, alebo nieco podobne. Na ucenie mam celkom cas, pretoze mi to nesuri do skoly ani do prace, je to len cisto moja zvedavost, a skusit si nieco nove. Vedel by mi preto niekto dat nejake rady ako zacat, a co si nastudovat, alebo co by mi mohlo nejakym inym sposobom pomoct? Dakujem
https://cloud.google.com/vision/
-
Ahoj, pracujem ako .net vyvojar informacnych systemov, takze s tym, na co sa chcem opytat som sa nikdy nestretol, tak sa ospravedlnujem ak by som sa zle vyjadril, respektive opytal sa na uplnu banalitu.
Chcel by som si doma skusit spravit jednoduchu aplikaciu, ktora by dokazala rozoznavat napr text v obraze, nejake gesta, alebo nieco podobne. Na ucenie mam celkom cas, pretoze mi to nesuri do skoly ani do prace, je to len cisto moja zvedavost, a skusit si nieco nove. Vedel by mi preto niekto dat nejake rady ako zacat, a co si nastudovat, alebo co by mi mohlo nejakym inym sposobom pomoct? Dakujem
https://cloud.google.com/vision/
To uz je priamo API ktore to obstarava zamna, ja by som si praveze taketo API implementoval rad sam. Ak by som robil na komercnom projekte asi by som skor vyuzil to API nech nevymyslam znova koleso, lenze mna zaujima ako to funguje a chcem si to skusit implementovat sam :)
-
Neuronove site.
-
Ak mas presne stanovenu velkost pisma a font tak sa to da urobit jednoducho:
Najprv treba najst zaciatok textu. Potom sa prechadza vyrez obrazku bod po bode a potom tie body porovnas s bitmapovymi maskami fontov, ktore mas ulozene v poli a na zaklade toho vratis pismeno ktore mas s tym vyrezom asociovane. Kedysi som takto "kradol" udaje z grafov (vyvoja ceny zlata).
Ak to chces pre rozne velkosti pisma alebo typy fontu tak princip bude +- rovnaky len to nebudes porovnavat 1:1 ako bitmapu, ale vektory.
-
Zkus začít hranovým detektorem. Např. kapitola 8 v těchto skriptech: http://mrl.cs.vsb.cz/people/sojka/dzo/digitalni_zpracovani_obrazu.pdf.
-
Nejdřív ta skripta, to je dobrá volba, pak praxe, C++, ale i Python na to má knihovnu OpenCV, příklad použití zde https://www.youtube.com/watch?v=2CZltXv-Gpk
Nebo tutoriály http://docs.opencv.org/master/d9/df8/tutorial_root.html
-
Ahoj, pracujem ako .net vyvojar informacnych systemov, takze s tym, na co sa chcem opytat som sa nikdy nestretol, tak sa ospravedlnujem ak by som sa zle vyjadril, respektive opytal sa na uplnu banalitu.
Chcel by som si doma skusit spravit jednoduchu aplikaciu, ktora by dokazala rozoznavat napr text v obraze, nejake gesta, alebo nieco podobne. Na ucenie mam celkom cas, pretoze mi to nesuri do skoly ani do prace, je to len cisto moja zvedavost, a skusit si nieco nove. Vedel by mi preto niekto dat nejake rady ako zacat, a co si nastudovat, alebo co by mi mohlo nejakym inym sposobom pomoct? Dakujem
https://cloud.google.com/vision/
To uz je priamo API ktore to obstarava zamna, ja by som si praveze taketo API implementoval rad sam. Ak by som robil na komercnom projekte asi by som skor vyuzil to API nech nevymyslam znova koleso, lenze mna zaujima ako to funguje a chcem si to skusit implementovat sam :)
nejsi ten, kdo se v jiném vlákně odmítal použít hotový herní engine a chtěl si ho napsat sám? Je dobré nejdřív se naučit používat hotové řešení a potom se případně pokusit implementovat něco podobného.
-
Zdrojáky k OpenCV jsou zde https://github.com/opencv/opencv
-
Začni matematikou
-
Prijemnou zabavu: http://mrl.cs.vsb.cz/people/sojka/pg/pocitacova_grafikaII.pdf
-
sorry, oprava, jsou to tyhle: http://mrl.cs.vsb.cz/people/sojka/dzo/digitalni_zpracovani_obrazu.pdf
-
Hezky si ty skripta precti, at konecne poznas, zac je toho loket.
-
Řekl bych, že state-of-art metody jsou založeny strojovém učení a neuronových sítích. Ta skripta se zabývají něčím trochu jiným.
-
Na zaciatok odporucim Martina Gorner a jeho Tensorflow and deep learning, without a PhD - napriklad ako natrenovat siet na rozpoznavanie cislic, ake su sposoby na zvysenie presnosti, ....
https://github.com/martin-gorner/tensorflow-mnist-tutorial
https://www.youtube.com/watch?v=u4alGiomYP4
https://www.youtube.com/watch?v=fTUwdXUFfI8
https://cloud.google.com/vision/ - to je predtrenovany model nad ktorym pracuje API. Aj AWS ponuka nieco podobne https://aws.amazon.com/rekognition/ - ich porovnanie http://cloudacademy.com/blog/google-vision-vs-amazon-rekognition/
-
http://ufal.mff.cuni.cz/courses/npfl114/winter-2016
http://www.deeplearningbook.org/
-
Řekl bych, že state-of-art metody jsou založeny strojovém učení a neuronových sítích. Ta skripta se zabývají něčím trochu jiným.
Pleteš se. Object detection a object recognition nejsou založeny jenom na deep learning. Je to jen jeden z mnoha přístupů.
Absolventi IT jsou na tohle v praxi většinou skor nepoužitelní, pokud se vše potřebné nedoučí ve svém volném čase. Takže plně podporuji přístup zakladatele diskuse.
Na AI a image processing je optimální background matematika se znalosti programování (takže v podstatě všichni absolventi). Nejvíce se na tyhle problémy používají C, C++, Matlab, Labview, C#, Python a funkcionální jazyky. Nepoužitelné jsou (a nebo použitelné pro masochistu) Java, Perl atd.
Doporučuju se ještě podívat na signal processing obecně, protoře obrázek je 2D signal, tzn. Fourierova transformace, Z-transformace, Hilbertova transoframce, různé druhy oken a filtrů. Důležitý je třeba KAlmanův filtr.
https://en.wikipedia.org/wiki/Kalman_filter
-
Nepoužitelné jsou (a nebo použitelné pro masochistu) Java, Perl atd.
na zpracování obrázků jsem používal http://pdl.perl.org/.
-
Řekl bych, že state-of-art metody jsou založeny strojovém učení a neuronových sítích. Ta skripta se zabývají něčím trochu jiným.
Pleteš se. Object detection a object recognition nejsou založeny jenom na deep learning. Je to jen jeden z mnoha přístupů.
Absolventi IT jsou na tohle v praxi většinou skor nepoužitelní, pokud se vše potřebné nedoučí ve svém volném čase. Takže plně podporuji přístup zakladatele diskuse.
Na AI a image processing je optimální background matematika se znalosti programování (takže v podstatě všichni absolventi). Nejvíce se na tyhle problémy používají C, C++, Matlab, Labview, C#, Python a funkcionální jazyky. Nepoužitelné jsou (a nebo použitelné pro masochistu) Java, Perl atd.
Doporučuju se ještě podívat na signal processing obecně, protoře obrázek je 2D signal, tzn. Fourierova transformace, Z-transformace, Hilbertova transoframce, různé druhy oken a filtrů. Důležitý je třeba KAlmanův filtr.
https://en.wikipedia.org/wiki/Kalman_filter
+ pokud je potřeba něco porovnat se vzorkem, tak Duhamelovy integrály apod. Tolik času na hraní bych chtěl mít...