Nedostupný server, zamrznutí, brute force ssh

Re:Nedostupný server, zamrznutí, brute force ssh
« Odpověď #30 kdy: 03. 07. 2025, 14:40:23 »
Memtest proběhl v pořádku, všelijaké stress testy nic neukázaly. Nevím jestli to mohl být hw problém, PC byl už starší kousek, ale zrovna ramky a disky byly úplně nové. Možná vás zklamu a možná je to škoda, ale už jsem ztratil trpělivost a přeinstaloval to na ubuntu server. Pokud to problém vyřeší, tak tato záhada asi zůstane neobjasněna. Každopádně díky za všechny tipy.


Re:Nedostupný server, zamrznutí, brute force ssh
« Odpověď #31 kdy: 08. 07. 2025, 13:53:01 »
Nechci to zakřiknout, ale na Ubuntu zatím bez problémů.

Re:Nedostupný server, zamrznutí, brute force ssh
« Odpověď #32 kdy: 21. 07. 2025, 13:28:02 »
Tak problém ikdyž o něco veselejší přetrvává, nyní pc nezamrzne ale restartuje se a opět nabootuje, logy opět neříkají nic moc.

Problém by mohl být nejspíš v nedostatečném výkonu zdroje. Jedná se o mini pc (HP EliteDesk 800 G4 DM), kde je 2x16GB ram a 2x2tb ssd disk.

Tuším, že mám 65W adaptér. Zkusím to zapojit přes chytrou zásuvku s měřením spotřeby, jestli to něco řekne.

Re:Nedostupný server, zamrznutí, brute force ssh
« Odpověď #33 kdy: 21. 07. 2025, 19:41:03 »
Tak adaptér je 90W

Re:Nedostupný server, zamrznutí, brute force ssh
« Odpověď #34 kdy: 22. 07. 2025, 12:12:48 »
To je mrzuté, že se problém vrací.
Ty komponenty, co jste psal, nezní nějak extrémně náročně, aby to nedal 90W zdroj.
Největší spotřebu bude mít CPU (byť nevím, co tam přesně je). Ale tam bych předpokládal, že k těm miniPC dává HP podle modelu CPU odpovídající zdroj (65, 90 nebo 150W). Taky by v případě problému mělo být náchylnější, když to vytížíte a vzroste jeho TDP, což je přesně důvod, jak jsem vám předtím psal o tom Prime nebo stress-ng. A podle toho, co jste psal, tak to nevytuhlo.
Nicméně samozřejmě nelze vyloučit, že odchází nějaká součástka nebo je třeba i nějaká tepelná závislost.
Stran té spotřeby CPU, asi by se dalo dočasně vyzkoušet nastavit tomu nějaký nižší TDP limit (Intel na to má RAPL rozhraní, co se dá v Linuxu ovládat přes sysfs a můžete třeba sundat celkový odběr package z 35 na 25W, dá se to typicky dohledat někde v datasheetu u Intelu od konkrétního CPU).
To by dočasně snížilo špičkový odběr a možná prodloužilo intervaly výskytu (jestli to s tím souvisí), ale zas mi to přijde, že se tím jenom obejde řešení problému, co bude někde jinde (např. deska, zdroj).

Takže za dané situace bych asi zkusil sehnat zdroj na výměnu. Bývá tam standardní 19,5V, jde jen o to, aby měl správný konektor a dával dostatečný proud. Bude jich určitě tuna i od OEM výrobců. Když jsem to řešil k notebookům, většinou jsem to sehnal okolo 6-800 Kč. To mi přijde jako nejlevnější a nejsnazší výměna pro vyzkoušení.
Pokud to nezabere, tak asi realisticky s tímhle miniPC smůla a nezbyde než vyndat SSD, RAM a poohlédnout se po náhradě.


Re:Nedostupný server, zamrznutí, brute force ssh
« Odpověď #35 kdy: 25. 08. 2025, 09:46:24 »
Tak záhada stále nevyřešena.

Podle logů, kde před restartem nebyly zapsané žádné chyby to vypadalo na problém s napájením. Zkoušel jsem tedy další 2 různé 90W adaptéry a nakonec jsem koupil i 135W adaptér. Problém to nevyřešilo.

Takže to vypadalo na nějaký jiný HW problém. Podařilo se mi sehnad druhý HP EliteDesk 800 G4 a jediné co jsem použil z původního byly disky, 2x2TB SSD disky (v RAID 1)

K restartům ale dochází stále.

Tak nevím zda nějaký problém přímo s těmi disky, s raidem, nebo nějaké linuxové ovladače.

Konkrétně se jedná o 2 identické disky DAHUA C970 PLUS 2TB (oba nové)

Ještě vyzkouším pouze jeden disk, přeformátovat a přeinstalovat OS a vyzkoušet bez RAIDu.


Re:Nedostupný server, zamrznutí, brute force ssh
« Odpověď #37 kdy: 25. 08. 2025, 10:49:48 »
Dává mi to smysl, že by mohl být problém vážně s iGPU a přechodem do nižšího idle stavu. Když jsem totiž zařízení instaloval a pak konfiguroval, cca týden jsem měl připojený monitor a k restartu nedošlo ani jednou. Jakmile bylo vše nakonfigurované, tak jsem monitor odpojil a server učinil veřejně viditelný z internetu, pak začaly brute force útoky, proto jsem si to dal do souvislosti s tím. Ale souvislost byla s tím odpojeným monitorem, který grafice nedovoloval přejít do nejnižšího idle stavu. Dnes vyzkouším, snad to problém konečně vyřeší.

Re:Nedostupný server, zamrznutí, brute force ssh
« Odpověď #38 kdy: 25. 08. 2025, 11:57:15 »
To je docela cesta, co jste vyzkoušel  :P uff.

Ale ty věci z vlákna na Proxmox fóru vypadají nadějně, zvlášť jestli ty rebooty taky dokážete izolovat na dobu, kdy není připojený monitor.
Vypadá to jako pěkná divočina.. minimálně na některých konfiguracích zmrzne ten i915 ovladač, pak začne postupně růst teplota a následně to natvrdo restartuje nějaká tepelná ochrana.
Taky zajímavá zmínka od někoho, komu pomohl jenom downgrade BIOSu.

Jinak pokud to pozitivně nemrzne s připojeným monitorem, tak by, pokud selžou ostatní zmíněné a jednodušší věci, mohlo teoreticky zabrat uložení EDIDu z toho konkrétního monitoru a pak natvrdo přiřazení ke konkrétnímu DP výstupu přes parametr jádra drm.edid_firmware=, což by mělo zajistit, že to pojede jako by byl pořád připojený.

A mimochodem ty powersave stavy jsou obecně docela častá příčina problémů, typicky třeba NVMe disků, které mají své vnitřní mechnismy pro low power stavy (APST). A ještě je tam pak podobná, ale separátní věc na PCIe (ASPM).
Občas je nutné s některými zařízeními to povypínat, nebo minimálně najít nějakou bezproblémovou úroveň šetření, funkční dobu přechodu a selektivně nastavit (občas se pak ještě musí řešit jestli to nastavuje jádro, nebo BIOS).

Každopádně díky, že jste tu to vlákno zmínil.. a držím palce s vyřešením ;)

Re:Nedostupný server, zamrznutí, brute force ssh
« Odpověď #39 kdy: 27. 08. 2025, 11:25:45 »
Díky všem za rady, a snahu pomoct problém vyřešit. Zatím to běží bez restartu.

Řešení:

Přidal jsem do /etc/default/grub:
Kód: [Vybrat]
GRUB_CMDLINE_LINUX_DEFAULT="i915.enable_dc=0 intel_idle.max_cstate=7"
Potom
Kód: [Vybrat]
sudo update-grub