Fórum Root.cz

Hlavní témata => Vývoj => Téma založeno: michal2 02. 04. 2017, 12:33:46

Název: Rozpoznávání objektů v obraze - kde začít?
Přispěvatel: michal2 02. 04. 2017, 12:33:46: Ahoj, pracujem ako .net vyvojar informacnych systemov, takze s tym, na co sa chcem opytat som sa nikdy nestretol, tak sa ospravedlnujem ak by som sa zle vyjadril, respektive opytal sa na uplnu banalitu.

Chcel by som si doma skusit spravit jednoduchu aplikaciu, ktora by dokazala rozoznavat napr text v obraze, nejake gesta, alebo nieco podobne. Na ucenie mam celkom cas, pretoze mi to nesuri do skoly ani do prace, je to len cisto moja zvedavost, a skusit si nieco nove. Vedel by mi preto niekto dat nejake rady ako zacat, a co si nastudovat, alebo co by mi mohlo nejakym inym sposobom pomoct? Dakujem
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: gll 02. 04. 2017, 12:49:13: Citace: michal2 02. 04. 2017, 12:33:46
Ahoj, pracujem ako .net vyvojar informacnych systemov, takze s tym, na co sa chcem opytat som sa nikdy nestretol, tak sa ospravedlnujem ak by som sa zle vyjadril, respektive opytal sa na uplnu banalitu.

Chcel by som si doma skusit spravit jednoduchu aplikaciu, ktora by dokazala rozoznavat napr text v obraze, nejake gesta, alebo nieco podobne. Na ucenie mam celkom cas, pretoze mi to nesuri do skoly ani do prace, je to len cisto moja zvedavost, a skusit si nieco nove. Vedel by mi preto niekto dat nejake rady ako zacat, a co si nastudovat, alebo co by mi mohlo nejakym inym sposobom pomoct? Dakujem

https://cloud.google.com/vision/
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: michal2 02. 04. 2017, 12:56:46: Citace: gll 02. 04. 2017, 12:49:13
Citace: michal2 02. 04. 2017, 12:33:46
Ahoj, pracujem ako .net vyvojar informacnych systemov, takze s tym, na co sa chcem opytat som sa nikdy nestretol, tak sa ospravedlnujem ak by som sa zle vyjadril, respektive opytal sa na uplnu banalitu.

Chcel by som si doma skusit spravit jednoduchu aplikaciu, ktora by dokazala rozoznavat napr text v obraze, nejake gesta, alebo nieco podobne. Na ucenie mam celkom cas, pretoze mi to nesuri do skoly ani do prace, je to len cisto moja zvedavost, a skusit si nieco nove. Vedel by mi preto niekto dat nejake rady ako zacat, a co si nastudovat, alebo co by mi mohlo nejakym inym sposobom pomoct? Dakujem

https://cloud.google.com/vision/

To uz je priamo API ktore to obstarava zamna, ja by som si praveze taketo API implementoval rad sam. Ak by som robil na komercnom projekte asi by som skor vyuzil to API nech nevymyslam znova koleso, lenze mna zaujima ako to funguje a chcem si to skusit implementovat sam :)
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: JardaP . 02. 04. 2017, 13:20:27: Neuronove site.
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: Verve 02. 04. 2017, 13:27:00: Ak mas presne stanovenu velkost pisma a font tak sa to da urobit jednoducho:

Najprv treba najst zaciatok textu. Potom sa prechadza vyrez obrazku bod po bode a potom tie body porovnas s bitmapovymi maskami fontov, ktore mas ulozene v poli a na zaklade toho vratis pismeno ktore mas s tym vyrezom asociovane. Kedysi som takto "kradol" udaje z grafov (vyvoja ceny zlata).

Ak to chces pre rozne velkosti pisma alebo typy fontu tak princip bude +- rovnaky len to nebudes porovnavat 1:1 ako bitmapu, ale vektory.
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: borekz 02. 04. 2017, 13:27:46: Zkus začít hranovým detektorem. Např. kapitola 8 v těchto skriptech: http://mrl.cs.vsb.cz/people/sojka/dzo/digitalni_zpracovani_obrazu.pdf.
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: Ivan Nový 02. 04. 2017, 13:52:51: Nejdřív ta skripta, to je dobrá volba, pak praxe, C++, ale i Python na to má knihovnu OpenCV, příklad použití zde https://www.youtube.com/watch?v=2CZltXv-Gpk

Nebo tutoriály http://docs.opencv.org/master/d9/df8/tutorial_root.html
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: gll 02. 04. 2017, 13:53:23: Citace: michal2 02. 04. 2017, 12:56:46
Citace: gll 02. 04. 2017, 12:49:13
Citace: michal2 02. 04. 2017, 12:33:46
Ahoj, pracujem ako .net vyvojar informacnych systemov, takze s tym, na co sa chcem opytat som sa nikdy nestretol, tak sa ospravedlnujem ak by som sa zle vyjadril, respektive opytal sa na uplnu banalitu.

Chcel by som si doma skusit spravit jednoduchu aplikaciu, ktora by dokazala rozoznavat napr text v obraze, nejake gesta, alebo nieco podobne. Na ucenie mam celkom cas, pretoze mi to nesuri do skoly ani do prace, je to len cisto moja zvedavost, a skusit si nieco nove. Vedel by mi preto niekto dat nejake rady ako zacat, a co si nastudovat, alebo co by mi mohlo nejakym inym sposobom pomoct? Dakujem

https://cloud.google.com/vision/

To uz je priamo API ktore to obstarava zamna, ja by som si praveze taketo API implementoval rad sam. Ak by som robil na komercnom projekte asi by som skor vyuzil to API nech nevymyslam znova koleso, lenze mna zaujima ako to funguje a chcem si to skusit implementovat sam :)

nejsi ten, kdo se v jiném vlákně odmítal použít hotový herní engine a chtěl si ho napsat sám? Je dobré nejdřív se naučit používat hotové řešení a potom se případně pokusit implementovat něco podobného.
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: Ivan Nový 02. 04. 2017, 13:55:44: Zdrojáky k OpenCV jsou zde https://github.com/opencv/opencv
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: trr 02. 04. 2017, 19:34:53: Začni matematikou
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: LaLa 02. 04. 2017, 21:19:00: Prijemnou zabavu: http://mrl.cs.vsb.cz/people/sojka/pg/pocitacova_grafikaII.pdf
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: LaLa 02. 04. 2017, 21:20:01: sorry, oprava, jsou to tyhle: http://mrl.cs.vsb.cz/people/sojka/dzo/digitalni_zpracovani_obrazu.pdf
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: LaLa 02. 04. 2017, 21:20:48: Hezky si ty skripta precti, at konecne poznas, zac je toho loket.
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: gll 02. 04. 2017, 21:31:05: Řekl bych, že state-of-art metody jsou založeny strojovém učení a neuronových sítích. Ta skripta se zabývají něčím trochu jiným.
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: john 02. 04. 2017, 21:57:31: Na zaciatok odporucim Martina Gorner a jeho Tensorflow and deep learning, without a PhD - napriklad ako natrenovat siet na rozpoznavanie cislic, ake su sposoby na zvysenie presnosti, ....
https://github.com/martin-gorner/tensorflow-mnist-tutorial
https://www.youtube.com/watch?v=u4alGiomYP4
https://www.youtube.com/watch?v=fTUwdXUFfI8

https://cloud.google.com/vision/ - to je predtrenovany model nad ktorym pracuje API. Aj AWS ponuka nieco podobne https://aws.amazon.com/rekognition/ - ich porovnanie http://cloudacademy.com/blog/google-vision-vs-amazon-rekognition/
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: Jenda 03. 04. 2017, 01:17:51: http://ufal.mff.cuni.cz/courses/npfl114/winter-2016

http://www.deeplearningbook.org/
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: trr 03. 04. 2017, 06:42:28: Citace: gll 02. 04. 2017, 21:31:05
Řekl bych, že state-of-art metody jsou založeny strojovém učení a neuronových sítích. Ta skripta se zabývají něčím trochu jiným.

Pleteš se. Object detection a object recognition nejsou založeny jenom na deep learning. Je to jen jeden z mnoha přístupů.
Absolventi IT jsou na tohle v praxi většinou skor nepoužitelní, pokud se vše potřebné nedoučí ve svém volném čase. Takže plně podporuji přístup zakladatele diskuse.
Na AI a image processing je optimální background matematika se znalosti programování (takže v podstatě všichni absolventi). Nejvíce se na tyhle problémy používají C, C++, Matlab, Labview, C#, Python a funkcionální jazyky. Nepoužitelné jsou (a nebo použitelné pro masochistu) Java, Perl atd.

Doporučuju se ještě podívat na signal processing obecně, protoře obrázek je 2D signal, tzn. Fourierova transformace, Z-transformace, Hilbertova transoframce, různé druhy oken a filtrů. Důležitý je třeba KAlmanův filtr.
https://en.wikipedia.org/wiki/Kalman_filter
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: gll 03. 04. 2017, 10:30:10: Citace: trr 03. 04. 2017, 06:42:28
Nepoužitelné jsou (a nebo použitelné pro masochistu) Java, Perl atd.

na zpracování obrázků jsem používal http://pdl.perl.org/.
Název: Re:Rozoznavanie objektov v obraze - kde zacat?
Přispěvatel: PetrM 03. 04. 2017, 13:13:03: Citace: trr 03. 04. 2017, 06:42:28
Citace: gll 02. 04. 2017, 21:31:05
Řekl bych, že state-of-art metody jsou založeny strojovém učení a neuronových sítích. Ta skripta se zabývají něčím trochu jiným.

Pleteš se. Object detection a object recognition nejsou založeny jenom na deep learning. Je to jen jeden z mnoha přístupů.
Absolventi IT jsou na tohle v praxi většinou skor nepoužitelní, pokud se vše potřebné nedoučí ve svém volném čase. Takže plně podporuji přístup zakladatele diskuse.
Na AI a image processing je optimální background matematika se znalosti programování (takže v podstatě všichni absolventi). Nejvíce se na tyhle problémy používají C, C++, Matlab, Labview, C#, Python a funkcionální jazyky. Nepoužitelné jsou (a nebo použitelné pro masochistu) Java, Perl atd.

Doporučuju se ještě podívat na signal processing obecně, protoře obrázek je 2D signal, tzn. Fourierova transformace, Z-transformace, Hilbertova transoframce, různé druhy oken a filtrů. Důležitý je třeba KAlmanův filtr.
https://en.wikipedia.org/wiki/Kalman_filter

+ pokud je potřeba něco porovnat se vzorkem, tak Duhamelovy integrály apod. Tolik času na hraní bych chtěl mít...