Indexované vyhledávání s obsahem

Indexované vyhledávání s obsahem
« kdy: 03. 10. 2023, 22:01:56 »
Pouzivam ve Windows Everything, dela to indexy vcetne network shares (pokud jsou mapovany na pismeno).
vyhovuje plne, ale obcas potrebuju hledat i v obsahu. To umi, ale bez indexu je to nepouzitelne.
Ignorujte web, ktery tvrdi, ze to umi, to bylo v nejake alfe.

Windows search je pochopitelne nepouzitelny. (zejmena u network share).

existuje neco?
« Poslední změna: 04. 10. 2023, 06:59:48 od Petr Krčmář »


_Jenda

  • *****
  • 1 562
    • Zobrazit profil
    • https://jenda.hrach.eu/
    • E-mail
Re:indexovane vyhledavani (s obsahem)
« Odpověď #1 kdy: 04. 10. 2023, 02:05:57 »

Re:indexovane vyhledavani (s obsahem)
« Odpověď #2 kdy: 04. 10. 2023, 07:43:54 »

Re:Indexované vyhledávání s obsahem
« Odpověď #3 kdy: 04. 10. 2023, 08:35:20 »
Používám ze setrvačnosti docfetcher https://docfetcher.sourceforge.io/en/index.html ale vývoj zdá se už moc nepokračuje (poslední verze 2021). Hlavní problémy jsou asi java, neumí pořádně outlook ost soubory a neumí indexovat/hledat podle názvu souboru, čistě jen obsah.
Běží to jako lokální apka takže to může fungovat i jako portable z flashky.

Recoll mám v hledáčku a na linuxu jsem ho i nějak testoval, podařilo se mi ho i propojit se teseract ocr pro pdfka (což docfether nemá). Jakž takž to fungovalo., ale pak už jsem neměl čas(chuť) si s tím hrát a testovat to na větších datech.
Ani ten webový frontend mně moc neoslovil (prokliky na síťové lokace se chovaly divně pokud si pamatuju)
Ještě pozor na to že windows a linux verze se liší v tom co podporují(nebo tak to alespoň bylo) a za win verzi se platí asi deset dolarů za konkrétní staženou verzi(nejsou update zdarma).

Re:Indexované vyhledávání s obsahem
« Odpověď #4 kdy: 04. 10. 2023, 11:05:02 »
nejake rozumne penize by nemely byt problem, tohle je skutecne o produktivite.

treba se ted koukam na Copernic Desktop...



Re:Indexované vyhledávání s obsahem
« Odpověď #5 kdy: 04. 10. 2023, 11:20:49 »
on prokracuje, jen to neni open source. ted je to DocFetcher  PRo a DocFetcher  Server.



Používám ze setrvačnosti docfetcher https://docfetcher.sourceforge.io/en/index.html ale vývoj zdá se už moc nepokračuje (poslední verze 2021). Hlavní problémy jsou asi java, neumí pořádně outlook ost soubory a neumí indexovat/hledat podle názvu souboru, čistě jen obsah.
Běží to jako lokální apka takže to může fungovat i jako portable z flashky.

Recoll mám v hledáčku a na linuxu jsem ho i nějak testoval, podařilo se mi ho i propojit se teseract ocr pro pdfka (což docfether nemá). Jakž takž to fungovalo., ale pak už jsem neměl čas(chuť) si s tím hrát a testovat to na větších datech.
Ani ten webový frontend mně moc neoslovil (prokliky na síťové lokace se chovaly divně pokud si pamatuju)
Ještě pozor na to že windows a linux verze se liší v tom co podporují(nebo tak to alespoň bylo) a za win verzi se platí asi deset dolarů za konkrétní staženou verzi(nejsou update zdarma).

Re:Indexované vyhledávání s obsahem
« Odpověď #6 kdy: 04. 10. 2023, 11:57:21 »
AnyTXT Searcher nebo Lookeen, oboje jsem používal a jsou kvalitní.

Re:Indexované vyhledávání s obsahem
« Odpověď #7 kdy: 05. 10. 2023, 17:44:21 »
ted jsem vyzkousel AnyTXT ,
funguje skvele, ale jen na lokalnich discich, takze neni reseni.

Re:Indexované vyhledávání s obsahem
« Odpověď #8 kdy: 05. 10. 2023, 19:00:22 »
korekce, to AnyTXT  nastaveni je trochu divne (explicitne blacklistovat path pro kazdy druh souboru), ale ocividne to indexuje mapovane network shares.

Proc pri spusteni toho GUI to ale vyzaduje elevaci na admina? to zdaleka neni idealni.

ted jsem vyzkousel AnyTXT ,
funguje skvele, ale jen na lokalnich discich, takze neni reseni.

Re:Indexované vyhledávání s obsahem
« Odpověď #9 kdy: 05. 10. 2023, 19:46:41 »
ted jsem vyzkousel AnyTXT ,
funguje skvele, ale jen na lokalnich discich, takze neni reseni.

Omlouvám se, ten požadavek na shares mi unikl. V tom případě neporadím, žádné nemám.

Re:Indexované vyhledávání s obsahem
« Odpověď #10 kdy: 05. 10. 2023, 20:47:38 »
v pohode, uz jsem se opravil, ta soucasne verze to umi.

porovnavam nekolik reseni a trochu s tim zapasim, pokud je nejake nastaveni schovane nebo implicitni

ted jsem vyzkousel AnyTXT ,
funguje skvele, ale jen na lokalnich discich, takze neni reseni.

Omlouvám se, ten požadavek na shares mi unikl. V tom případě neporadím, žádné nemám.

Re:Indexované vyhledávání s obsahem
« Odpověď #11 kdy: 07. 10. 2023, 19:58:10 »
butu tohle tema aktualizaovat,az budu mit poradne vysledky.

ten anytxt Searcher funguje lip nez komercni veci, az na par veci. A je nekolikrat rychlejsi pri hledani i indexovani.
CO je v podstate blocker: nevrati to slozky se jmenem obsahujicim ten string. V rade pripadu ocekavam i slozky.
A soucasne to neumi aplikovat jemnejsi filtr (napriklad na 500 radkovy vysledek pridat kriterium data vytvoreni a pod).

Moje oblibene Everything ma od 1.5 ALFA indexovani obsahu, musim vyzkouset