Fórum Root.cz

Hlavní témata => Server => Téma založeno: Kubax 07. 12. 2018, 22:13:14

Název: Zamrznutí I/O při rozbalení konkrétního tarbalu
Přispěvatel: Kubax 07. 12. 2018, 22:13:14
Ahoj, pracuju s linuxem asi 15 let, 10let linux-only pracovní mašiny, ale tohle jsem ještě nezažil:
Na desktopu s ubuntu 18.04 s BTRFS na SSD, který normálně funguje už druhým rokem, jsem se rozhodl aktualizovat AMDGPU-PRO drivery. Stáhnu tarbal (amdgpu-pro-18.40-697810-ubuntu-18.04.tar.xz), je v něm hromada .deb balíčků, ale jinak nic zvláštního. Rozbaluju ho pomocí tar xfv <soubor>, všechno se vybalí OK, ale zachvíli (když na pozadí dojde k fsyncu) mi najednou začne umírat celý systém a podle ledky disku vidím, že se něco stalo s IO subsystémem, FS modulem, odešlo SSD, nebo tak něco - v pravidelném, asi 5sec intervalu na mě ledka asi 4x zabliká, a tak pořád dokola, ani po půl hodině čekání nic.

Restartuju, systém normálně nabíha, všechno funguje, vlezu do rozbaleného adresáře - data tam jsou (ale tuším, že budou nakřáplá), pouštím instalaci, a HRYZ! to samé, co předtím.

Restartuju, myslím si, že mám vadný SSD, tak projistotu rsyncuju celý disk bokem, ignoruju Downloads adresář (aby rsync nezavadil o ten nakoplý rozbalený), a HRYZ! Kua, instalačák stihnul nakopírovat část adresáře někam do /lib a jen o něj zavadil rsync, hryzlo se to.

Restartuju, mažu adresář z Downloads, a /lib, povedlo se. Rozbaluju tarbal znova, HRYZ! ....

Restarutju, mažu adresář, tarbal, stahuju znova, rozbaluju, HRYZ! ....

Restarutju, stahuju do jiného adresáře, několikrát tarbal kopíruju (s naivní představou, že třeba po rozbalení BTRFS vybere jiné diskové bloky, které nebudou nakřáplé, POKOD JE TO DISKEM), jednu z kopií rozbaluju..... ano, správně: HRYZ!

Tady jsem zatím skončil, ale WTF? Něco podobného jsem zažil s asi 10 let starou fedorou, kdy mi z ničeho nic začala mazat obsah souborů, které jsem otevřel pro čtení, to bylo ještě ext3, ale tohle je ještě víc WTF.

Stejně to tipuju na vadný disk (ale zkoušel jsem ho celý přečíst DDčkem a vše ok, smart test OK), ale zažili jste to někdo?
Název: Re:Největší linuxová záhada - zamrznutí IO při rozbalení konkrétního tarbalu
Přispěvatel: zkusto 07. 12. 2018, 23:02:24
Vytvor si diskovy oddil v ramce a zkus to rozbalit tam.
Název: Re:Největší linuxová záhada - zamrznutí IO při rozbalení konkrétního tarbalu
Přispěvatel: misaz 07. 12. 2018, 23:23:29
Můžeš si rovnou otestovat tu RAM. Pokud je ten archív nějaký větší a RAM nemáš nazbyt tak se při rozbalovaní ty data při průchodem ramkou poškodí a to pak může dělat všelico.
Název: Re:Největší linuxová záhada - zamrznutí IO při rozbalení konkrétního tarbalu
Přispěvatel: Kubax 08. 12. 2018, 00:01:08
Dik za tip, tak jsem promountoval /opt (kam si to instalacak rozbaluje) a /var/cache/apt/archives (kam si je lokalne kopiruje, uff) jako tmpfs, rozbaleni ok, ale instalace se opet opakovane hryzla, pri instalaci jednoho z balicku.

Dal jsem zkusil zaplnit 90% mista na disku, abych zvysil pravdepodobnost, ze se veskere dalsi veci budou zapisovat do nejakych jinych koncin SSD, nez kde jsou potencialne osoupane bloky, ale chova se to porad stejne, i obyc. rozbaleni toho archivu na disk zpusobi hryznuti, i imstalace z tech tmpfs konci presne ve stejnem bode.

Zacinam si myslet, ze ten soubor obsahuje nejaky specificky blok dat, ktery zmate bud logiku pro kontrolu integrity na SSD, nebo v btrfs, (hehe, ne, nic neberu...). Kernel mi nikde nic neublinkava, teda aspon na tty1, do dmesgu se pak uz nedostanu
Název: Re:Největší linuxová záhada - zamrznutí IO při rozbalení konkrétního tarbalu
Přispěvatel: Kubax 08. 12. 2018, 00:14:14
Dalsi pokus:
Kdyz uz jsem vyrobil ten 8GB soubor pro zaplneni disku, tak jsem ho naformatoval nejdriv na ext4, pak btrfs. V obou pripadech se v nem po namountovani povedlo tarball bez problemu rozbalit.
Název: Re:Největší linuxová záhada - zamrznutí IO při rozbalení konkrétního tarbalu
Přispěvatel: Kubax 08. 12. 2018, 01:26:59
Tak zahada vyresena :(

Mohl za to...
.
.
.
Nechteny proprietarni binarni sajrajt! (a svete div se, nejsou to AMD drivery)
.
.
.
Nedavno jsem se potreboval pripojit k Fortineti VPN, stahnul jsem si proprietarni Forticlient, ale VPN to neumelo, vyresil jsem to jinym balickem.
Forticlienta jsem zapomnel odinstalovat, a mimo to, ze neumi to co jsem chtel, UMI TO CO JSEM NECHTEL! Hraje si to na antivirus a saha to kam nema! Treba do bezicich procesu, kdyz rozbalujou "podezrely binarky". No a kdyz se mu neco nelibi, tak asi projistotu shodi kernel. Odinstalovano a vsechno zas funguje jak ma (teda az na ty AMDGPU-PRO (binarni sajrajt!), ktery mi segfaultujou uz v GDM, takze rollback tam, kde jsem byl pred 5ti hodinama v patek vecer...)
Název: Re:Největší linuxová záhada - zamrznutí IO při rozbalení konkrétního tarbalu
Přispěvatel: Lol Phirae 08. 12. 2018, 01:37:18
Nedavno jsem se potreboval pripojit k Fortineti VPN, stahnul jsem si proprietarni Forticlient

https://www.reddit.com/r/networking/comments/5fjity/tell_me_your_fortinetfortigate_horror_stories/

 ;D ;D ::) ::)