SuperMicro X8SIE-F sem tam zapípá

RDa

  • *****
  • 2 683
    • Zobrazit profil
    • E-mail
SuperMicro X8SIE-F sem tam zapípá
« kdy: 26. 09. 2019, 16:31:43 »
Ahoj, nedokazu si vysvetlit co me chce deska rict - pipne to jako tuuuuu tu - delsi nizsi a kratsi vyssi ton.
Deje se to nekolikrat denne. System tam zdanlive neni pod zatezi.. proste idlujici fileserver ktery nevytezuji.

V dmesg nemam zadnou hlasku, MCE demon bezi a taky nic nereportuje. Jsou tam ECC pameti (4x8G=32G), takze ty bezi jen na 800MT/s - pri bootu to hlasi ECC mode, ale v dmidecode -t 17 | grep width to pise total width = data width = 64 ... coz by znamenalo ze to v ECC nejede, nebo tam je bug v biosu. Nikde jsem se nedocetl zda by ecc corrected error mel zpusobit pipnuti. Nejake napady, co zkontrolovat?
« Poslední změna: 26. 09. 2019, 17:09:49 od Petr Krčmář »


Re:SuperMicro X8SIE-F sem tam zapípá
« Odpověď #1 kdy: 27. 09. 2019, 10:57:10 »
Kdysi na nějakém cizím boardu jsem záhadné pípání dohledal k SuperIO švábovi. V manuálu X8SIE-F na straně "1-10"(22 of 113) je v panákovi vidět SuperIO šváb W83627DHG - což je z téže rodiny. V datasheetu W83627DHG na str.74-75 PDF souboru (64-65 v tisku) je popsáno, jak ten šváb kvíká, pokud je nespokojen: střídá pískání 600 a 1200 Hz po půl sekundě (střída 50%). Tzn. Vašemu popisu to myslím neodpovídá... Tušímže to v mém případě bylo sdruženo s výstupem pro PC speaker pomocí nějakého diskrétního OR hradla, takže jsem slyšel kvíkat "hoří" rozkonfigurované SuperIO a do toho se míchal POST beep ze south bridge (šlo to oboje z jediného repráčku/bzučáku).

Pokud se to projevuje náhodně za jízdy, nebude se jednat o spokojený POST beep. Ten se totiž objeví pouze jednou krátce po startu. Taky to nebude nějaký nespokojený BEEP code BIOSu, protože ty bývají jednak při startu, druhak jsou delší, a počítač při nich není schopen nabootovat.

Pokud to leze z PC speakeru, muselo by to dělat něco v operačním systému.

Ta deska má patrně IPMI BMC, ale nikdy jsem neslyšel, že by pípal zrovna BMC - ať už skrz hlavní PC speaker, nebo skrz nějaký svůj vlastní bzučák.

Říkáte SuperMicro motherboard... má to šasi šuplíky? SASové s funkčními failure LEDkami? Tzn. nějaká varianta TQ nebo dokonce něco s expandérem? Pokud ano, vězte že backplane kastlíku se šuplíkama obsahuje svůj vlastní bzučák, kterému vládne "enclosure manager" (šváb na tom backplanu). Tenhle šváb může mít nějaké autonomní hlídání teploty a třeba otáček ventilátorů (pokud má diskový kastlík svoje vlastní). S enclosure managerem se může bavit RAIDový řadič - buď pokud se jedná o slušný HW RAID s vlastním autonomním firmwarem (Areca/Adaptec), nebo v dnešní době umí SGPIO komunikaci i SAS HBA integrované v serverových čipsetech Intel (na to je ale 3420 PCH zřejmě trochu starý). Pokud správně chápu, Vaše varianta boardu nemá ani onboard LSI2008 HBA - a i kdyby měla, patrně by neuměl SGPIO.

Mimochodem RAIDové řadiče mívají svůj vlastní bzučák (Areca určitě).
Pokud říkáte dva různé tóny, mohlo by se velmi teoreticky jednat o následující sekvenci:
1) kvíkne RAIDový řadič. Zahlásí nějakou přechodnou událost - třeba přehřátí? nebo odchylku v napájení? Nedejbože něco s některým diskem? Ale to by spíš nebylo přechodné? Prostě kvíkne a hned zase dobrý.
2) stihnul ale zasignalizovat skrz SGPIO enclosure manageru, že se něco děje, ať taky ztropí poplach. A enclosure manager je "zpožděnej", takže si kvíkne svým tónem o fous později...

Pak mě napadá, že i některé napájecí zdroje (zejm. redundantní) mívají v backplanu alarmový bzučák. Sice jsem ho neslyšel nikdy dvoutónový, ale čert ví...
Pak taky kvíkat může UPSka. Viděl jsem krátké zákmity v napájení, které UPSka zaregistruje, kvíkne, ale vlastně ani nepřepne na zálohu a jede se dál, počítače přímo připojené na síť si ani nevšimnou...
Opět mě napadá sekvence dvou zdrojů. Situace: počítač s redundantním zdrojem 1+1 je připojený jedním fousem do zdi a druhým do UPS. Nastane kratičký výpadek napájení, kterého si všimne jak UPSka (a svůj výstup podrží), tak napájecí zdroj, kterému na chvíli vypadne jedna větev. UPS a zdroj reagují s různým zpožděním a kvíkají různým tónem...

Máte-li chuť experimentovat, onboard bzučáky s malou dírkou lze přelepit = umlčet. Spekulativně.

RDa

  • *****
  • 2 683
    • Zobrazit profil
    • E-mail
Re:SuperMicro X8SIE-F sem tam zapípá
« Odpověď #2 kdy: 27. 09. 2019, 11:05:04 »
Jedna se jenom o motherboard, s jumperem speakru v pozici pouzivej "interni bzucak". Varianta desky nema ani onboard SAS radic, natoz aby se v me sestave nachazel backplane, zdroj, nebo cokoliv jineho. Je to samostatna SM deska + 7 disku, 1 ssd, 10GE sitovka a pcie x1 sata radic.

Uz jsem pripojil BMC - pod Server Health / Event log. Vcera jsem ho smazal, od te doby to asi trikrat provedlo to pipnuti, ale neni tam zadnej zaznam. Je to poradna zahada :-)

Re:SuperMicro X8SIE-F sem tam zapípá
« Odpověď #3 kdy: 27. 09. 2019, 11:55:04 »
Jestli je to v Linuxu, tak zkusit Superiotoolem dumpnout registry SuperIO švába. Třeba bych z toho hexdumpu něco vykoukal. Jestli je zapnutý ten "beep alarm" a případně jaké má nastavené prahy. Pokud kolem něj kroužím správně, tak je to myslím zcela autonomní funkce SuperIO švába, která se ani nemusí promítnout do nějakého logu v IPMI BMC nebo tak něco. Ten SuperIO šváb rozhodně nemá interní log událostí nebo něco v tom smyslu - leda snad by dokázal při aktivaci alarmu generovat interrupt (můj odhad). Jestli by něco dokázal "out of band" zahoukat směrem k BMC... no nevím. Spíš kdyby se BMC pořád dokolečka přes I2C koukal, tak by si možná stihl toho alarmu všimnout, kdyby měl kliku...

RDa

  • *****
  • 2 683
    • Zobrazit profil
    • E-mail
Re:SuperMicro X8SIE-F sem tam zapípá
« Odpověď #4 kdy: 27. 09. 2019, 13:49:40 »
# superiotool -de
Kód: [Vybrat]
superiotool r
Found Nuvoton WPCM450 (id=0x1a11, rev=0x00) at 0x164e
No dump available for this Super I/O
Found Winbond W83627DHG (id=0xa0, rev=0x25) at 0x2e
Register dump:
idx 02 20 21 22 23 24 25 26  27 28 29 2a 2b 2c 2d 2e  2f
val ff a0 25 ff 00 4c 00 00  ff 10 00 02 00 03 01 00  ff
def 00 a0 NA ff 00 MM 00 MM  RR 50 00 00 RR e2 21 00  00
LDN 0x00 (Floppy)
idx 30 60 61 70 74 f0 f1 f2  f4 f5
val 00 00 00 00 02 8e 00 ff  00 00
def 01 03 f0 06 02 8e 00 ff  00 00
LDN 0x01 (Parallel port)
idx 30 60 61 70 74 f0
val 00 03 78 07 04 3f
def 01 03 78 07 04 3f
LDN 0x02 (COM1)
idx 30 60 61 70 f0
val 01 03 f8 04 00
def 01 03 f8 04 00
LDN 0x03 (COM2)
idx 30 60 61 70 f0 f1
val 01 02 f8 03 00 04
def 01 02 f8 03 00 00
LDN 0x05 (Keyboard)
idx 30 60 61 62 63 70 72 f0
val 01 00 60 00 64 01 0c 82
def 01 00 60 00 64 01 0c 83
LDN 0x06 (Serial peripheral interface)
idx 30 62 63
val 00 0a 00
def 00 00 00
LDN 0x07 (GPIO 6)
idx 30 f4 f5 f6 f7
val 06 ff ff ff ff
def 00 ff 00 00 00
LDN 0x08 (WDTO#, PLED)
idx 30 f5 f6 f7
val 00 ff 00 ff
def 00 00 00 00
LDN 0x09 (GPIO 2, GPIO 3, GPIO 4, GPIO 5)
idx 30 e0 e1 e2 e3 e4 e5 e6  e7 e8 e9 f0 f1 f2 f3 f4  f5 f6 f7 fe
val 03 ff ff ff ff 0c 00 00  00 ff ff ff 73 00 00 ff  ff ff ff 07
def 00 ff 00 00 ff 00 00 00  00 00 00 ff 00 00 00 ff  00 00 00 00
LDN 0x0a (ACPI)
idx 30 70 e0 e1 e2 e3 e4 e5  e6 e7 e8 e9 f2 f3 f4 f6  f7 fe
val 00 00 01 00 c5 00 20 00  0c 00 09 00 7c 00 00 00  00 00
def 00 00 01 00 ff 08 00 RR  1c 00 RR RR 7c 00 00 00  00 00
LDN 0x0b (Hardware monitor)
idx 30 60 61 70 f0 f1 f2
val 01 0a 10 00 81 10 80
def 00 00 00 00 81 00 00
LDN 0x0c (PECI, SST)
idx e0 e1 e2 e3 e4 e5 e8 f1  fe ff
val 30 64 64 64 64 00 21 4c  f2 25
def 00 48 48 48 48 00 00 48  00 00
Hardware monitor (0x0a15)



Re:SuperMicro X8SIE-F sem tam zapípá
« Odpověď #6 kdy: 27. 09. 2019, 16:47:18 »
X8SIE-F by melo mit BMC, tak bych zkusil obycejne ipmitool sel list

RDa

  • *****
  • 2 683
    • Zobrazit profil
    • E-mail
Re:SuperMicro X8SIE-F sem tam zapípá
« Odpověď #7 kdy: 27. 09. 2019, 17:23:25 »
X8SIE-F by melo mit BMC, tak bych zkusil obycejne ipmitool sel list

# ipmitool sel list
Kód: [Vybrat]
SEL has no entries

Re:SuperMicro X8SIE-F sem tam zapípá
« Odpověď #8 kdy: 27. 09. 2019, 22:56:39 »
@RDa: díky za ten dump... jednak jsem vyštrachal v archivu datasheet přesně pro Váš čip (ale on zrovna ten Beep asi funguje stejně u DGH i DHG-P) a druhak jsem bližším prolistováním zjistil, že ty konfigurační registry nežijou v tom hlavním SuperIO konfiguračním registru, ale v prostoru "health manageru" - který je dostupný přes dva IO porty (index/data) na bázové adrese 0xA10 . Než začnu vymejšlet, jak na to šáhnout holýma rukama (skriptem) tak mám jeden nápad na "low hanging fruit":

Nemám bohužel po ruce živý stroj s Linuxem a w83627, kam bych se na dálku dostal, ale našel jsem v jedné mašině jeho mladšího příbuzného NCT6776, a když pro něj loadnu HWMON ovladač, tak vidím v sysfs soubor /sys/class/hwmon/hwmon2/beep_enable . V mém případě má hodnotu "1".

...ale ne, to je pech... W83627DHG je podporován ovladačem w83627ehf.ko, který nemá opšnu beep_enable. Přitom jeho starší příbuzní w83781.ko a w83627hf.ko oba tuto opšnu obsahují :-(
Ach jo, je to tak doteď...

Zkuste prosím ještě mrknout na přiložený skript.
Je k tomu potřeba napřed nainstalovat tuto pomůcku.
V tom mém skriptu je opět jenom dump registrů. Všimněte si pár řádků, které patrně mají moc tu "beep funkci" vypnout - ale jsou uzavřené v bloku "if false", který se nikdy neprovede. Případně podle svého uvážení odšpuntujte.