Fórum Root.cz
Hlavní témata => Vývoj => Téma založeno: Mr. Mrkev 09. 09. 2015, 23:47:52
-
Dobrý den,
mám dotaz ohledně vyhledání slov v různých textových dokumentech jedné složky. Lze sestavit příkaz nebo i více příkazů (.sh), které by dokázali vyhledat všechny textové soubory ve složce a ve všech nahradit určité slovo jiným slovem (jinými slovy), ale pozor to slovo/ta slova by bylo z jiného textového souboru?
O co mně přesně jde:
Kdybych měl více textových souborů s jedním stejným slovem (jinak pojemenovaný, ale stejný "mustr") a toto slovo bych chtěl v každém souboru zvlášť nahradit jiným slovem z druhého textového souboru, tak jak na to? Jelikož je to krkolomné, tak uvedu příklad:
***
Např.: V 5 souborech je stejné slovo "word". Toto slovo bych chtěl nahradit v každém souboru zvlášť různými slovy z šestého souboru, kde by byla uložena takto:
jedna
dva
tři
čtyři
pět
Výsledek:
// Původních 5 souborů tedy: ..... word .....
// Upravené:
1. soubor = .... jedna ....
2. soubor = .... dva ....
....
***
Prozatím jsem částečně nalezl a upravil tento příkaz, který funguje na nalezení a nahrazení jednoho slova přímo zadaným jedním slovem (textem), ale jak jsem psal, tak bych ho potřeboval "upravit"/nahradit/...
find /cesta/do/adresáře -type f -print0 | xargs -0 sed -i 's|hledaný text|nový text|g'
Varianty, které nefungují (prozatím jsem zkoušel jen nahradit 1 slovo 1 slovem z druhého souboru):
// "file" - měl být soubor ten soubor s náhradním slovem
// "22222" - jsem chtěl nahradit
find ./ -type f -print0 | xargs -0 sed -i 's|22222|$(sed -n 1p file)|g'
grep -rl '22222' ./ | xargs sed -i 's/22222/$(sed -n 1p file)/g'
sed -e "s/22222/$(sed -n 1p file)/" soubor.txt
Šlo by to nějak? Nebo si to už musím naprogramovat např. v C...? Sám bych byl raději, kdyby šel sestavit nějaký příkaz či script.
Předem Vám děkuji za Vaše rady!
S pozrdavem a přáním pěkného zbytku týdne
Jirka
-
Šlo by to i v bashi, ale líp uděláš, když si to napíšeš v pythonu. Už jen kvůli udržovatelnosti, až do toho jednou budeš chtít něco dodělat. C je v tomto případě kanón na vrabce.
-
Nebo gawk by mel byt schopny to dat celkem srozumitelne.
Ale ten python bude asi nejpristupnejsi ...
Z dokumentace :
>>> with open('workfile', 'r') as f:
... read_data = f.read()
>>> f.closed
True
readline, split, ...
https://docs.python.org/2/library/re.html
-
Šlo by to i v bashi, ale líp uděláš, když si to napíšeš v pythonu. Už jen kvůli udržovatelnosti, až do toho jednou budeš chtít něco dodělat. C je v tomto případě kanón na vrabce.
Děkuji za radu. Nakonec jsem využil tohoto řešení, pokud by se to někomu hodilo.
#!/bin/bash
i=1
word="word"
for f in soubory ; do
nahrada=`head -n $i šestý | tail -n 1`
sed -i "s/$word/$nahrada/g" "$f"
i=$(( $i + 1 ))
done
-
Nebo gawk by mel byt schopny to dat celkem srozumitelne.
Ale ten python bude asi nejpristupnejsi ...
Z dokumentace :
>>> with open('workfile', 'r') as f:
... read_data = f.read()
>>> f.closed
True
readline, split, ...
https://docs.python.org/2/library/re.html
Také ti děkuji za radu. Nakonec jsem využil řešení viz. výše.