Fórum Root.cz

Hlavní témata => Server => Téma založeno: jose1711 08. 08. 2024, 10:09:03

Název: Podman nerestartuje kontejner s failed healtcheckem (Raspbian)
Přispěvatel: jose1711 08. 08. 2024, 10:09:03
Ahoj,

v Arch Linuxe spustam testovaci rootless kontajner:

Kód: [Vybrat]
podman run  --name mycontainer --health-cmd="sleep 5 && exit 1" --health-interval=1s --health-retries=3 --health-timeout=10s --health-on-failure=restart --restart=no alpine sleep 300
Kazdych 15 sekund (sleep 5 * 3) sa kontajner restartuje, co je ocakavane a ziadane spravanie.

Ten isty prikaz spusteny v Raspbiane miesto restartovania skonci:

Exited (137) - unhealthy

Verzia podmanu v Raspbian je 4.3.1, v Archu mam 5.1.1. Okrem toho nejake zasadne zmeny medzi systemami nepozorujem (vsetko ostatne zda sa funguje).

Poradi niekto?

Diky, j
Název: Re:Podman nerestartuje kontejner s failed healtcheckem (Raspbian)
Přispěvatel: LolPhirae 08. 08. 2024, 10:52:41
Pokud vím tak 137 = došla paměť (oom-killer). Asi na to nebude malinová hračka vhodná.
Název: Re:Podman nerestartuje kontejner s failed healtcheckem (Raspbian)
Přispěvatel: jose1711 08. 08. 2024, 10:55:38
Hracka ma 8 GB pamate a alpine zabera par kB.
Název: Re:Podman nerestartuje kontejner s failed healtcheckem (Raspbian)
Přispěvatel: LolPhirae 08. 08. 2024, 11:03:10
Možná bych ještě prubnul dokumentaci, viz poznámky k
Kód: [Vybrat]
--health-on-failure=restart a tomu přepínači
Kód: [Vybrat]
--restart=no co tam vidím, plus poznámky k interakci se systemd.

https://docs.podman.io/en/latest/markdown/podman-run.1.html
Název: Re:Podman nerestartuje kontejner s failed healtcheckem (Raspbian)
Přispěvatel: jose1711 08. 08. 2024, 11:12:24
diky, ale bez rozdielu. verzia s vyhodenym --restart=no.

Kód: [Vybrat]
podman run  --name mycontainer --health-cmd="sleep 5 && exit 1" --health-interval=1s --health-retries=3 --health-timeout=10s --health-on-failure=restart alpine sleep 300
Název: Re:Podman nerestartuje kontejner s failed healtcheckem (Raspbian)
Přispěvatel: hmmmw 08. 08. 2024, 13:16:49
Pokud vím tak 137 = došla paměť (oom-killer). Asi na to nebude malinová hračka vhodná.

Pozor, 137 automaticky neznamená Out-Of-Memory. 137 znamená SIGKILL, tedy kontejner dostal zvenku pokyn na ukončení. Může to být OOM-Killer, ale to by pak někde ve výstupu byl příznak "OOMKilled": true.

Nám se například 137 objevuje v případě, že healthcheck nedostane odezvu, tak provede restart.
Název: Re:Podman nerestartuje kontejner s failed healtcheckem (Raspbian)
Přispěvatel: jose1711 15. 08. 2024, 21:50:28
Update na SID, podman 5.0.3 a uz sa to sprava tak, ako by som ocakaval. Takze zrejme problem starsej verzie.