Ahoj,
mam na disku spoustu souboru (filmy, obrazky, videa, ebooky, pdfka, mp3). Obcas zkratka divoce stahuju nebo narazim na nejaky repozitar/uloziste, ktery proste cely stahnu s tim, ze ho preberu potom... Nahromadila se mi takhle spousta duplikatu a potreboval bych to nejak automaticky prebrat.
Vim, ze existuji utilitky, ktere umi rozpoznat duplikaty a smazat je a uz jsem je i pouzival. Potiz je ale v tom, ze:
1. porovnava to soubory jen binarne, neumi to napriklad rozpoznat podobne nazvy jinych souboru (napriklad dve mp3, stejna pisnicka, nazev je klidne uplne stejny, ale soubory se o bajt lisi, ptz jednou je pisnicka o vterinu oriznuta).
2. je to one-off pouziti: tj. kdyz pridavam obsah, musel bych ho nakopirovat do slozek a pak zase pustit znovu scan celeho filesystemu.
Moje predstava, jak by neco takoveho mohlo fungovat je zhruba nasledujici:
1. bezelo by to jako daemon a v pravidelnych intervalech (pro moje pouziti by naprosto stacilo jednou denne) by oscannoval filesystem/dany adresar a zdetekoval zmeny
2. posledni stav by si drzel nekde v nejakem, napriklad, JSONu a oproti nemu vzdy kontroloval aktualni stav
3. jakmile by oscannoval FS a ziskal tenhle JSON (kde by byla napriklad cesta k souboru, hash, nazev a treba nejaka metadata jako kvalita apod.), mohl by veskerou chytristiku delat uz jen nad tim JSONem
4. kdyz by se soubor do adresare pridaval, stacilo by ho porovnat s JSONem (nebo rucne spustit scan)
5. pokud vim, linuxovy (a mozna i windows) kernel poskytuji nejake filesystem watche/notifikace
Existuje neco takoveho hotoveho, pouzitelneho nebo si to musim nakodit sam?
Programovat umim, myslim, vcelku obstojne...