Balík pro testování fulltextových enginů

adam

Balík pro testování fulltextových enginů
« kdy: 09. 05. 2016, 13:18:53 »
Ahoj,
Hraji ai s fulltextovymi enginy Apache Lucene a Elastic Search a rad bych pouzil nejaky testovaci balik textu, nejlepe treba i se "zakernyma" zadanimi se kterymi by mohl mit fulltext problem, nevite nekdo jestli nekde existuje nejaky takovy testovaci balik textu, ktery by slo stahnout, zaindexovat a otestovat?? Diky moc za odpoved.

Adam
« Poslední změna: 09. 05. 2016, 13:33:03 od Petr Krčmář »


Re:Balík pro testování fulltextových enginů
« Odpověď #1 kdy: 09. 05. 2016, 13:47:00 »
Fulltext jako takový s žádnými daty problém mít nebude. Fulltext si jen vytvoří index požadovaného typu nad posloupností (třeba slov), kterou mu pošlete. Předpokládám, že „zákeřným zadáním“ myslíte třeba text s kombinací jazyků, synonyma, stopslova apod. Tím byste ale netestoval fulltext jako takový, ale vaši konfiguraci indexování i vyhledávání. A k tomu není dobré používat nějaká generická data, lepší je použít něco, co připomíná vaše cílová data.

Re:Balík pro testování fulltextových enginů
« Odpověď #2 kdy: 11. 05. 2016, 13:32:05 »
tak treba u Solru tvori vyznamnou cast "kvality" jen nastaveni tveho konkretniho core. Vytuneni synonyms, stopwords, spravny nastaveni akcentu/sklonovani. zvlaste v ceskem jazyce je to naprosto zasadni vec bez ktere bys na prvni pokus mel pocit, ze solr sam o sobe je uplne k nicemu
Děkuji za možnost editace příspěvku.