do clipboardu
To na Windows v Cygwinu fakt netuším, na Linuxu xclip -in.
nebo lépe do *.txt
grep "^> " | cut -c 3- > soubor.txt
Porovnávalo by se z textu o 7tisíc řádku a podle nejvetsi podobnosti vyhodnotit shodu...
To mi není jasné co si pod tím přesně představuješ. Pokud ti jde o to zjistit „jak moc se soubory liší“, tak můžeš počítat řádky toho diffu. Další možnost je zkonkatenovat je, zagzipovat a podívat se na velikost výsledku -- pokud jsou téměř stejné, měla by komprese fungovat „dobře“, zatímco pokud se budou hodně lišit, nebude možné zkomprimovat ten druhý pomocí znalosti prvního. No a pak samozřejmě existuje spousta teoreticky podložených algoritmů jako třeba
Levenshteinova vzálenost,
Dynamic time warping atd., kde ale musíš vědět, co od toho chceš.