Fórum Root.cz
Hlavní témata => Hardware => Téma založeno: R. R. Šimek 14. 06. 2026, 14:14:26
-
Mám takový drobný problém: nové PC (AMD CPU) a v něm GPU ASUS PRIME Radeon RX 9070 XT.
Podle všeho to má perfektně fungovat, během instalace žádný problém nebyl, systém běží, aplikace fungují... - akorát pokud se spustí nějaká 3D graficky náročnější hra, která si žádá akceleraci, tak po nějaké době se grafika restartuje, spadne session a skončím na přihlašovací obrazovce.
Provedl jsem základní kontroly, instalaci nového firmware, nové drivery, nejnovější kernel, vyzkoušel několik distribucí (Ubuntu 26.04, Ubuntu 24.04, Fedora, Debian, .... - a nakonec zpět Ubuntu 26.04, které mi vyhovuje nejvíce), ale jediným úspěchem je prodloužení doby od spuštění hry k pádu z cca 10 na cca 30 minut (což poněkud komplikuje testování, protože na pád si člověk počká).
CPU ani GPU se (dle sledování systému) nepřehřívá - taky by to byl div, s tolika větráky ;D - zátěž má ke 100 % daleko.
Prošel jsem různá fóra, vyzkoušel různé rady (včetně je to v hardware, vyndej a zandej tu kartu), leč zatím marně.
Takže se obracím s dotazem sem, mezi znalce a ochotné odborníky. ;-)
Ještě přidám něco z logu, kde je přeci jen nějaká chyba ke čtení:
sudo journalctl --since "2026-06-13 11:29:30" -p err..emerg
čen 13 11:29:46 Odysseus kernel: amdgpu 0000:03:00.0: ring gfx_0.0.0 timeout, signaled seq=6628665, emitted seq=6628667
čen 13 11:29:46 Odysseus kernel: amdgpu 0000:03:00.0: Process GameMainThread pid 10639 thread dxvk-submit pid 10673
čen 13 11:29:46 Odysseus kernel: amdgpu 0000:03:00.0: Starting gfx_0.0.0 ring reset
čen 13 11:29:48 Odysseus kernel: amdgpu 0000:03:00.0: Ring gfx_0.0.0 reset failed
čen 13 11:29:50 Odysseus kernel: amdgpu 0000:03:00.0: MES(1) failed to respond to msg=REMOVE_QUEUE
čen 13 11:29:50 Odysseus kernel: amdgpu 0000:03:00.0: failed to unmap legacy queue
čen 13 11:29:50 Odysseus kernel: [drm:gfx_v12_0_cp_gfx_enable.isra.0 [amdgpu]] *ERROR* failed to halt cp gfx
čen 13 11:29:53 Odysseus kernel: amdgpu 0000:03:00.0: [drm] *ERROR* Failed to initialize parser -125!
čen 13 11:30:25 Odysseus (ubuntu-insights)[12377]: ubuntu-insights-collect.service: Failed to set up mount namespacing: /run/gdm3/home/gdm-greeter/.cache: No such file or directory
čen 13 11:30:25 Odysseus (ubuntu-insights)[12377]: ubuntu-insights-collect.service: Failed at step NAMESPACE spawning /usr/bin/ubuntu-insights: No such file or directory
čen 13 11:30:25 Odysseus (ubuntu-insights)[12378]: ubuntu-insights-upload.service: Failed to set up mount namespacing: /run/gdm3/home/gdm-greeter/.cache: No such file or directory
čen 13 11:30:25 Odysseus (ubuntu-insights)[12378]: ubuntu-insights-upload.service: Failed at step NAMESPACE spawning /usr/bin/ubuntu-insights: No such file or directory
čen 13 11:30:25 Odysseus systemd[12312]: Failed to start ubuntu-insights-collect.service - "Collect platform report using Ubuntu Insights while respecting consent".
čen 13 11:30:25 Odysseus systemd[12312]: Failed to start ubuntu-insights-upload.service - "Upload collected and matured platform reports using Ubuntu Insights while respecting consent".
-
Po padu jsi schopen pustit hru znova?
(tim by melo jit rozlisit, zda je to problem hw/driveru - ze to nepujde, nebo aplikace - ze to pujde)
Pak bych zkusil nejaky syntenticky load - bud Furmark, nebo game benchmarky (klidne ruzne a najit ten co ti padne nejdrive - abys mohl pak validovat navrhy na opravu)
-
Po padu jsi schopen pustit hru znova?
Ta hra pak jde normálně pustit a po obvyklou dobu funguje.
Z čehož jsem usoudil na softwareový problém nebo teplotní závislost - to druhé je asi méně pravděpodobné, protože to by po opakovaném spuštění padlo hned.
Pak bych zkusil nejaky syntenticky load - bud Furmark, nebo game benchmarky (klidne ruzne a najit ten co ti padne nejdrive - abys mohl pak validovat navrhy na opravu)
Benchmarky jsem nezkoušel, nicméně se zdá, že to padne vždycky zhruba po konstantním čase - i když si pro další test vyberu jinou hru - například steamovku a potom Minecraft. A nezáleží na tom, jak dlouho jsem předtím přihlášený.
-
ai mi rika otestovat pod windows, zkusit jiny zdroj do pc, grafarna pry zere i vice nez se udava a zdroj zo nemusi zvladnout.
dale vypnuti pcie aspm, v biosu nastavit pcie link speed na gen4 misto auto, vypnout mes. ai odhaduje problem v driveru amdgpu, chyba hw, bios pcie/mes problem.
-
Pravděpodobně je to bug v MESA ovladačích, ale může to být i bug v Ubuntu kernelu.
Můžeš zkusit nainstalovat poslední verzi MESA ovladačů z ppa.
https://launchpad.net/~kisak/+archive/ubuntu/kisak-mesa (https://launchpad.net/~kisak/+archive/ubuntu/kisak-mesa)
-
ai mi rika otestovat pod windows, zkusit jiny zdroj do pc, grafarna pry zere i vice nez se udava a zdroj zo nemusi zvladnout.
dale vypnuti pcie aspm, v biosu nastavit pcie link speed na gen4 misto auto, vypnout mes. ai odhaduje problem v driveru amdgpu, chyba hw, bios pcie/mes problem.
Koukám, že AI toho ví tolik, co my - co všechno se dá zkusit. ;-D
Zdroj to nebude, ten má dostatečnou reservu výkonu.
Zkoušet to pod Windows si necháváme až jako nouzové řešení - musel bych nějaké sehnat.
PCIE ASPM je vypnuté - to jsme zkoušeli - na PCIE Link Speed kouknu.
-
Pravděpodobně je to bug v MESA ovladačích, ale může to být i bug v Ubuntu kernelu.
Můžeš zkusit nainstalovat poslední verzi MESA ovladačů z ppa.
https://launchpad.net/~kisak/+archive/ubuntu/kisak-mesa (https://launchpad.net/~kisak/+archive/ubuntu/kisak-mesa)
Tohle jsme už zkusili - prodloužil se čas k pádu na cca půl hodiny.
-
ai mi rika otestovat pod windows, zkusit jiny zdroj do pc, grafarna pry zere i vice nez se udava a zdroj zo nemusi zvladnout.
dale vypnuti pcie aspm, v biosu nastavit pcie link speed na gen4 misto auto, vypnout mes. ai odhaduje problem v driveru amdgpu, chyba hw, bios pcie/mes problem.
Koukám, že AI toho ví tolik, co my - co všechno se dá zkusit. ;-D
Zdroj to nebude, ten má dostatečnou reservu výkonu.
Zkoušet to pod Windows si necháváme až jako nouzové řešení - musel bych nějaké sehnat.
PCIE ASPM je vypnuté - to jsme zkoušeli - na PCIE Link Speed kouknu.
ja bych ty windows zkusil hned, jdou pouzivat i bez licence a uvidis zda je to hw.
-
Pravděpodobně je to bug v MESA ovladačích, ale může to být i bug v Ubuntu kernelu.
Můžeš zkusit nainstalovat poslední verzi MESA ovladačů z ppa.
https://launchpad.net/~kisak/+archive/ubuntu/kisak-mesa (https://launchpad.net/~kisak/+archive/ubuntu/kisak-mesa)
Tohle jsme už zkusili - prodloužil se čas k pádu na cca půl hodiny.
Zkusil bych ještě nějakou herní distribuci jako CachyOS, Nobaru, Bazzite nebo PikaOS. Tyto distribuce mají opatchovaný kernel. Sám mám 9070 (non xt) a Nobaře tento problém nepozoruji a to hraju hry i několik hodin.
-
Zdroj to nebude, ten má dostatečnou reservu výkonu.
Jsem nedavno koukal po pouzitem/problemovem zdroji a popisek prodejce byl - po nejake dobe pada 12V vetev.
Takze hledat problem i ve zdroji je legitimni dotaz - ono staci kdyz tam bude nejaka odflaknuta tepelni podlozka a prehrivajici cast zpusobi chvilkovy propad (ale jasne, projevilo by se to ponekud vetsim problemem nez jen padem hry).
-
ja bych ty windows zkusil hned, jdou pouzivat i bez licence a uvidis zda je to hw.
To ano. Jenže já tu mám instalačky kdejakýho Linuxu, ale žádný Windows. ;D
Nejdřív si budu muset zařídit instalační médium - a ony se ty Window bez Windows blbě instalují...
-
Zkusil bych ještě nějakou herní distribuci jako CachyOS, Nobaru, Bazzite nebo PikaOS. Tyto distribuce mají opatchovaný kernel. Sám mám 9070 (non xt) a Nobaře tento problém nepozoruji a to hraju hry i několik hodin.
Díky, asi to - čistě z diagnostických důvodů zkusíme.
Jenže tohle není primárně herní stroj, takže preference je mít tam nějaký universální linux.
Čímž netvrdím, že se na tom hry hrát nebudou - když už nový stroj, tak aby na tom ty hry fungovaly.
-
Nejdřív si budu muset zařídit instalační médium - a ony se ty Window bez Windows blbě instalují...
tohle nefunguje?
https://www.microsoft.com/en-us/software-download/windows11
-
Takze hledat problem i ve zdroji je legitimni dotaz - ono staci kdyz tam bude nejaka odflaknuta tepelni podlozka a prehrivajici cast zpusobi chvilkovy propad (ale jasne, projevilo by se to ponekud vetsim problemem nez jen padem hry).
Zdroj je novej, tomu bych asi věřil. (Beztak nemám čím to přeměřit - do hardware nevrtám.)
Nicméně souhlasím, že by se to nejspíš projevilo jinde. Tohle je pravděpodobně prostě reset GPU (nebo něco podobného) - tedy nespadne jen hra, ale celá desktopová session. (Proto jsme jako první podezřívali chybu/nekompatibilitu ve Waylandu...)
-
Nejdřív si budu muset zařídit instalační médium - a ony se ty Window bez Windows blbě instalují...
tohle nefunguje?
https://www.microsoft.com/en-us/software-download/windows11
Ale jo. Jen se nedařilo to ISO udělat jako spustitelné na USB, protože na to používaná utilitka pro výrobu linuxových instalaček nefunguje. Bude potřeba to udělat jinak.
-
https://www.ventoy.net/en/index.html
"Nainstaluje" se na flashku a pak na ni naházíš jakékoliv ISO Windows / Linux a ono ho to nabootuje. Žádné vytváření flashky není pak už nikdy třeba.
-
Jestli trváte na Ubuntu, tak jde místo kisak-mesa zkusit přímo Ubuntu experimental, měla by tam být Mesa 25.1:
do sources.list
deb http://deb.debian.org/debian experimental main contrib non-free
sudo apt update
sudo apt install -t experimental mesa-vulkan-drivers libgl1-mesa-dri mesa-utils
Pak by se mělo zkontrolovat, že používáte radv ovladač, který je asi nejlepší:
vulkaninfo
A mělo by tam být:
driverName = radv
deviceName = AMD Radeon Graphics (RADV GFX....)
No a potom se dá otestovat stabilita pomocí vkmark (apt install vkmark) případně drsnějšího furmark (https://www.geeks3d.com/furmark). Přitom to chce sledovat teploty GPU a napětí napájení 12V. Jestli vám to ukazuje sensors, tak v terminálu:
watch -n 1 sensors
-
ring gfx_0.0.0 timeout, znamená, že grafický čip přestal reagovat na instrukce a systém se pokusil o restart GPU (Starting gfx_0.0.0 ring reset). To selhalo (Ring reset failed), což vedlo k úplnému zamrznutí grafického subsystému, pádu display serveru (Wayland/X11) a návratu na přihlašovací obrazovku (GDM). Že se problém opakuje napříč distribucemi a liší se pouze časem do pádu, je asi kvůli kombinaci hardwaru a chování správy napájení nebo verzi firmwaru.
Zkuste v souboru /etc/default/grub přidat do řádku GRUB_CMDLINE_LINUX_DEFAULT následující parametr:
amdgpu.runpm=0
Parametr amdgpu.runpm=0 zakazuje runtime power management, měl by stabilizovat kartu pod zátěží. Případně lze vyzkoušet i parametr amdgpu.ppfeaturemask=0xffffffff pro pozdější manuální úpravu napěťových křivek.
-
ring gfx_0.0.0 timeout, znamená, že grafický čip přestal reagovat na instrukce a systém se pokusil o restart GPU (Starting gfx_0.0.0 ring reset). To selhalo (Ring reset failed), což vedlo k úplnému zamrznutí grafického subsystému, pádu display serveru (Wayland/X11) a návratu na přihlašovací obrazovku (GDM).
Dospěli jsme v podstatě ke shodnému závěru.
Že se problém opakuje napříč distribucemi a liší se pouze časem do pádu, je asi kvůli kombinaci hardwaru a chování správy napájení nebo verzi firmwaru.
Firmware je tam poslední a skutečnost, že změnou parametrů lze ten čas měnit mi zase nepřipadne jako problém s napájením.
Zkuste v souboru /etc/default/grub přidat do řádku GRUB_CMDLINE_LINUX_DEFAULT následující parametr:
amdgpu.runpm=0
Parametr amdgpu.runpm=0 zakazuje runtime power management, měl by stabilizovat kartu pod zátěží. Případně lze vyzkoušet i parametr amdgpu.ppfeaturemask=0xffffffff pro pozdější manuální úpravu napěťových křivek.
Dobrý rada... - ...ale to už jsme zkusili. ;-(
ten parametr tam už máme. Možná to nastavení napěťových křivek, ale do toho bych se pouštěl jen nerad.
-
Parametr amdgpu.runpm=0 zakazuje runtime power management, měl by stabilizovat kartu pod zátěží. Případně lze vyzkoušet i parametr amdgpu.ppfeaturemask=0xffffffff pro pozdější manuální úpravu napěťových křivek.
Dobrý rada... - ...ale to už jsme zkusili. ;-(
ten parametr tam už máme. Možná to nastavení napěťových křivek, ale do toho bych se pouštěl jen nerad.
[/quote]
Na ty upravy je gui corectrl https://github.com/openfnord/corectrl (https://github.com/openfnord/corectrl). Nepotreboval jsem, takze nemuzu referovat.
-
Parametr amdgpu.runpm=0 zakazuje runtime power management, měl by stabilizovat kartu pod zátěží. Případně lze vyzkoušet i parametr amdgpu.ppfeaturemask=0xffffffff pro pozdější manuální úpravu napěťových křivek.
Dobrý rada... - ...ale to už jsme zkusili. ;-(
ten parametr tam už máme. Možná to nastavení napěťových křivek, ale do toho bych se pouštěl jen nerad.
Na ty upravy je gui corectrl https://github.com/openfnord/corectrl (https://github.com/openfnord/corectrl). Nepotreboval jsem, takze nemuzu referovat.
[/quote]
Corectrl už není nějaký čas ve vývoji. Za sebe doporučuji LACT.
https://github.com/ilya-zlobintsev/LACT (https://github.com/ilya-zlobintsev/LACT)