Postgresql full text české vyhledavaní (nastavení slovníků)

Wilima

Ahoj, máte někdo zkušenosti s nastavováním fulltest postgres vyhledávání (https://www.postgresql.org/docs/9.5/static/textsearch.html) v kontextu českého jazyka? Mám zmatek v tom co vlastně musím vše nastavit (jakou konfiguraci vytvořit). V dokumentaci je zmíněno několik slovníků a zatím jsem nepochopil zda se musí použít jen jeden (například ispell) nebo jejich kombinace (Synonym Dictionary, Thesaurus Dictionary, Ispell Dictionary, Snowball Dictionary).

Český internet má poměrně staré články a od té doby se pravděpodobně dost změnilo. V instalaci postgresu jsem dokonce našel nějaké defaultní české slovníky cs_cz.affix a cs_cz.dict

Díky za jakékoli rady.



Re:Postgresql full text české vyhledavaní (nastavení slovníků)
« Odpověď #1 kdy: 02. 03. 2017, 06:04:21 »
Konfigurace bude pořád stejná http://postgres.cz/wiki/Instalace_PostgreSQL#Instalace_Fulltextu . Pravděpodobně už budou k dispozici novější slovníky.

Wilima

Re:Postgresql full text české vyhledavaní (nastavení slovníků)
« Odpověď #2 kdy: 02. 03. 2017, 07:43:09 »
Diky, takze staci ispell?

Trupik

Re:Postgresql full text české vyhledavaní (nastavení slovníků)
« Odpověď #3 kdy: 02. 03. 2017, 10:25:28 »
Diky, takze staci ispell?
Podľa toho čo potrebuješ... Ale keď sa takto pýtaš, tak asi nevieš čo potrebuješ. V takom prípade to skús s tým ispell a uvidíš či to funguje ku Tvojej spokojnosti.

Fulltextové slovníky a konfigurácie vieš pridávať, meniť, mazať za behu, takže smelo do toho.

Wilima

Re:Postgresql full text české vyhledavaní (nastavení slovníků)
« Odpověď #4 kdy: 02. 03. 2017, 12:46:00 »
Diky, takze staci ispell?
Podľa toho čo potrebuješ... Ale keď sa takto pýtaš, tak asi nevieš čo potrebuješ. V takom prípade to skús s tým ispell a uvidíš či to funguje ku Tvojej spokojnosti.

Fulltextové slovníky a konfigurácie vieš pridávať, meniť, mazať za behu, takže smelo do toho.

No jde mi spis o to, jestli se daji/pouzivaji kombinace.


dw

Re:Postgresql full text české vyhledavaní (nastavení slovníků)
« Odpověď #5 kdy: 03. 03. 2017, 14:47:33 »
nemusis ich kombinovat, vsetky robia v podstate to iste, vyhadzu z textu nepodstatne prvky a podstatne slova prevedu na lemmy. to aky sposob pouzijes ma vplyv akurat na rychlost a pouzivanu pamat...

Idris

  • *****
  • 2 286
    • Zobrazit profil
    • E-mail
Re:Postgresql full text české vyhledavaní (nastavení slovníků)
« Odpověď #6 kdy: 29. 08. 2023, 13:35:07 »
ÚFAL nabízí ke stažení morfologický slovník. Plná verze zabere v paměti desítky GB.