Náhodné padání Xserveru s GeForce RTX 2080

Náhodné padání Xserveru s GeForce RTX 2080
« kdy: 18. 09. 2024, 11:07:29 »
Ahoj, mám grafickou kartu NVIDIA 2080 a Debian 12. Používám uzavřené drivery z nvidia-driver a firmware-misc-nonfree balíčků instalované z apt. Xserver normálně běží, vše funguje, ale jednou za čas (třeba jednou týdně) mi najednou zamrzne obraz, nelze hýbat myší, klávesnice nereaguje a po chvíli spadnou Xka a objeví se login screen (nemám login manažer, takže rovnou terminál). Když se pokusím přihlásit, píše to chybu, že Xserver nelze spustit. V var/log/Xorg.1.log je toto:

Kód: [Vybrat]
[ 43463.848] (II) NVIDIA Unified Driver for all Supported NVIDIA GPUs
[ 43463.848] (II) systemd-logind: releasing fd for 226:0
[ 43463.848] (II) Loading sub module "fb"
[ 43463.848] (II) LoadModule: "fb"
[ 43463.848] (II) Module "fb" already built-in
[ 43463.848] (II) Loading sub module "wfb"
[ 43463.848] (II) LoadModule: "wfb"
[ 43463.848] (II) Loading /usr/lib/xorg/modules/libwfb.so
[ 43463.848] (II) Module wfb: vendor="X.Org Foundation"
[ 43463.848]    compiled for 1.21.1.7, module version = 1.0.0
[ 43463.848]    ABI class: X.Org ANSI C Emulation, version 0.4
[ 43463.849] (**) NVIDIA(0): Depth 24, (--) framebuffer bpp 32
[ 43463.849] (==) NVIDIA(0): RGB weight 888
[ 43463.849] (==) NVIDIA(0): Default visual is TrueColor
[ 43463.849] (==) NVIDIA(0): Using gamma correction (1.0, 1.0, 1.0)
[ 43463.849] (**) NVIDIA(0): Option "Stereo" "0"
[ 43463.849] (**) NVIDIA(0): Option "nvidiaXineramaInfoOrder" "DP-0"
[ 43463.849] (**) NVIDIA(0): Option "SLI" "Off"
[ 43463.849] (**) NVIDIA(0): Option "MultiGPU" "Off"
[ 43463.849] (**) NVIDIA(0): Option "BaseMosaic" "off"
[ 43463.849] (**) NVIDIA(0): Stereo disabled by request
[ 43463.849] (**) NVIDIA(0): NVIDIA SLI disabled.
[ 43463.849] (**) NVIDIA(0): NVIDIA Multi-GPU disabled.
[ 43463.849] (**) NVIDIA(0): Option "MetaModes" "DP-0: nvidia-auto-select +0+0 {ForceCompositionPipeline=On}, HDMI-0: nvidia-auto-select +0+1440 {ForceCompositionPipeline=On}"
[ 43463.849] (**) NVIDIA(0): Enabling 2D acceleration
[ 43463.849] (II) Loading sub module "glxserver_nvidia"
[ 43463.849] (II) LoadModule: "glxserver_nvidia"
[ 43463.849] (II) Loading /usr/lib/xorg/modules/extensions/libglxserver_nvidia.so
[ 43463.856] (II) Module glxserver_nvidia: vendor="NVIDIA Corporation"
[ 43463.856]    compiled for 1.6.99.901, module version = 1.0.0
[ 43463.856]    Module class: X.Org Server Extension
[ 43463.856] (II) NVIDIA GLX Module  550.107.02  Wed Jul 24 23:31:40 UTC 2024
[ 43463.856] (II) NVIDIA: The X server supports PRIME Render Offload.
[ 43464.366] (EE) NVIDIA(GPU-0): Failed to initialize the NVIDIA GPU at PCI:8:0:0.  Please
[ 43464.366] (EE) NVIDIA(GPU-0):     check your system's kernel log for additional error
[ 43464.366] (EE) NVIDIA(GPU-0):     messages and refer to Chapter 8: Common Problems in the
[ 43464.366] (EE) NVIDIA(GPU-0):     README for additional information.
[ 43464.366] (EE) NVIDIA(GPU-0): Failed to initialize the NVIDIA graphics device!
[ 43464.366] (EE) NVIDIA(0): Failing initialization of X screen
[ 43464.366] (II) UnloadModule: "nvidia"
[ 43464.366] (II) UnloadSubModule: "glxserver_nvidia"
[ 43464.366] (II) Unloading glxserver_nvidia
[ 43464.366] (II) UnloadSubModule: "wfb"
[ 43464.366] (EE) Screen(s) found, but none have a usable configuration.
[ 43464.366] (EE)
Fatal server error:
[ 43464.366] (EE) no screens found(EE)

I v tom zamrzlém stavu je možné se přihlásit k počítači přes SSH. Vidím tam, že Xorg vytěžuje jeden procesor na 100%. Většinou to zamrzne, když jsem pryč od počítače. Tj. třeba v 18:00 od něj odejdu a vrátím se ve 21:00 a už vidim jen tu přihlašovací obrazovku.

Dokázal by mi někdo poradit, jak to opravit? Zkoušel jsem i binární ovladače přímo z NVIDIA (jak stable, tak test verzi), ale chová se to stejně. Nejhorší je, že se to děje nepravidelně a po dost dlouhé době. Nemůže to souviset s nějakým uspáváním karty? Nemám žádné spořiče ani uspávání počítače. Možná slabý zdroj? Mám myslím Seasonic Focus Plus 650W. Ale při vytížení té karty na 100% to jede v pohodě.


Re:Náhodné padání Xserveru s GeForce RTX 2080
« Odpověď #1 kdy: 01. 11. 2024, 20:35:20 »
Jen pro info vsem, kteri by meli podobny problem. Jadro pudla bylo asi ve Firefoxu, ktery zpusoboval zamrznuti mysi, klavesnice a i vytizeni Xorg na jednom jadre na 100%. Kdyz necham pocitac s vypnutym Firefoxem, nebo misto nej pouziju Chrome, uadny problem nenastane.