Řadič P410 + RAID10 - selhání pole 6x6TB Seagate IronWolf

MaLaMuT

Re:Řadič P410 + RAID10 - selhání pole 6x6TB Seagate IronWolf
« Odpověď #30 kdy: 09. 05. 2017, 18:30:50 »
HP P400 nebo P410 jsou naprosto bezproblémové řadiče s vlastní cache, počítají si checksumy a pokud to člověD umí nastavit, funguje to desítky(u) let bez problém. P400 běhala od prvních desek s PCIexpress. Sám jsem na tom jel v domácím pecku raid ze dvou Seagate a v práci to bylo v několika serverech. Ten řadič šlape i s Windows 10 s Windows Serverem 2012/16 jako z praku, dneska sice už v testovacím počítáků, ale je to prostě PAN řadič.

K tomu tvému problému, dokud to nezčubčíš tak, že bys ty disky přepsal, data nejsou ztracená a dají se zachránit.
A co se vymrvilo u tebe? Kdo ví, podle mého odhadu jsi nějak popřeházel disky, což není problém, ale musíš vědět, jak to napravit. Skoro bych řekl, že jsi měl raid natažený přes něco jiného, než sis myslel.

Data nejsou fuč, rozhodně ne do doby, než disky přepíšeš. Klidně můžeš disky odpojit, vyresetovat řadič do defaultu, připojit disky zpět a není to problém. Mám to lépe vyzkoušené s PERCovskými řadiči od Dell, ale už jsem měnil zdechlý řadič i v serveru HP a o žádná data se nepřišlo. Stejně tak jsme měnil pořadí disků, atd.

Mám tu na stole dvě P400, což jsou jen starší P410 (P410 podporuje tuším navíc PCIexpress 2.0).
Takže bych to mohl vyřešit, ale asi bys musel sáhnout do prasátka, zadarmo si pustím raději film, nejlevnější budeš mít obnovit zálohu.


MaLaMuT

Re:Řadič P410 + RAID10 - selhání pole 6x6TB Seagate IronWolf
« Odpověď #31 kdy: 09. 05. 2017, 18:46:30 »
Pár poznámek k P400 i P410:

- HP vydalo i tooly pro Debian, ale nejsou veřejně přístupné, obecně linkem ze stránky řadiče je toho dostupného jen hodně málo

A když tak hodit Woko sem: http://cciss.sourceforge.net/

Případně pro P400: hpssacli-2.40-13.0_amd64.deb
(Nevím, jestli to je aktuální verze, ale mělo by to nasměrovat k ostatním DEB)

- dva dny jsem se vztekal, proč nemůžu enforcnout použití cache, pokud není k řadiči připojená baterka, cache se nepoužívá, leda by to bylo vynucené, řadič tvrdohlavě odmítal commandy a prostě to nešlo, myslel jsem si, že to je v tom ovládacím software, ale nebylo, celý problém byl v tom, že jsem měl nadefinované pole, ale neměl v něm disky :-D po připojení disků k poli ... hpacucli ctrl slot=4 modify nbwc=enable  najednou začalo fungovat :-P dva dny v čudu

- ARECA mi připravila DALEKO víc horkých chvilek, než tohle pole

- Řadič si toho nechá hrozně moc líbit, ale neprochází přes to SMART commandy (jen LoL_Pfufafel by se mohl divit proč), takže člověk nemá info o zdraví disků

- Podpora ve VMware je super, samozřejmě člověk NESMÍ stahovat čistý VMware, ale HP customized ISO stejně jako pro Dell se použivíají Dell Customized ISO. Asi nějak takhle, odkazy si pologramot vygooglí sám.
https://community.hpe.com/t5/ESXi/HPE-VMWare-ESXi-6-5-Image/td-p/6917990

ATD, právě mě přestalo bavit sem ty rozumy psát. Pokud někdo přidá nějaká dobrá moudra, třeba změním názor a něco připíšu.

Lol Phirae

Re:Řadič P410 + RAID10 - selhání pole 6x6TB Seagate IronWolf
« Odpověď #32 kdy: 09. 05. 2017, 18:51:31 »
HP P400 nebo P410 jsou naprosto bezproblémové řadiče

Jojo, to tady všichni vidíme.  ;D  ::)

MaLaMuT

Re:Řadič P410 + RAID10 - selhání pole 6x6TB Seagate IronWolf
« Odpověď #33 kdy: 09. 05. 2017, 19:48:57 »
Jojo, to tady všichni vidíme.  ;D  ::)

Ano, jsi velmi osvícený :-D
Přesně podle: Spustil jsem Linux a přišel o data, no a všichni vidíme, že Linux je krám a neměl by se vůbec používat.
Taky by bylo dobré zakázat všechna kladiva, protože pepíček se klepl do prstu při zatloukání obrázku, zlá kladívka, zlá!

czipis

  • ***
  • 225
    • Zobrazit profil
    • E-mail
Re:Řadič P410 + RAID10 - selhání pole 6x6TB Seagate IronWolf
« Odpověď #34 kdy: 09. 05. 2017, 20:32:00 »
Takže bych to mohl vyřešit, ale asi bys musel sáhnout do prasátka, zadarmo si pustím raději film, nejlevnější budeš mít obnovit zálohu.

presne nad tvym prispevkem pise ze uz to vyresil, takze ty jako expert uz bohuzel nevydelas :-D


MaLaMuT

Re:Řadič P410 + RAID10 - selhání pole 6x6TB Seagate IronWolf
« Odpověď #35 kdy: 09. 05. 2017, 20:38:48 »
presne nad tvym prispevkem pise ze uz to vyresil, takze ty jako expert uz bohuzel nevydelas :-D

Vidíš, toho jsem si nevšiml.
Tím líp, další zářez pro řadiče s čipem LSI  ;)

dustin

Re:Řadič P410 + RAID10 - selhání pole 6x6TB Seagate IronWolf
« Odpověď #36 kdy: 10. 05. 2017, 00:41:29 »
.
Zabrala ta verze bez kladiva.
Kód: [Vybrat]
ctrl slot=2 ld 2 modify reenable

IMO obdoba toho odkazovaného příkazu pro HP UX sautil accept_media_xchg . Řadiči se změnilo pořadí disků a odmítl z toho pole opět poskládat. Tak jsi jej k tomu přinutil ručně.

Jo, zlaté UUID v mdadm.

dustin

Re:Řadič P410 + RAID10 - selhání pole 6x6TB Seagate IronWolf
« Odpověď #37 kdy: 10. 05. 2017, 00:50:42 »
- Řadič si toho nechá hrozně moc líbit, ale neprochází přes to SMART commandy (jen LoL_Pfufafel by se mohl divit proč), takže člověk nemá info o zdraví disků
P410:
Kód: [Vybrat]
smartctl -a -d cciss,1 /dev/sda

smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.16.0-0.bpo.4-amd64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               HP     
Product:              DF0146B8052     
Revision:             HPD1
User Capacity:        146,815,737,856 bytes [146 GB]
Logical block size:   512 bytes
Logical Unit id:      0x5000c50004f548df
Serial number:        3QN0CV6H00009919D6QR
Device type:          disk
Transport protocol:   SAS
Local Time is:        Wed May 10 00:46:47 2017 CEST
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK

Current Drive Temperature:     39 C
Drive Trip Temperature:        68 C
Elements in grown defect list: 1
Vendor (Seagate) cache information
  Blocks sent to initiator = 2319274357
  Blocks received from initiator = 3466207494
  Blocks read from cache and sent to initiator = 4016003179
  Number of read and write commands whose size <= segment size = 3928309779
  Number of read and write commands whose size > segment size = 0
Vendor (Seagate/Hitachi) factory information
  number of hours powered up = 71681.40
  number of minutes until next internal SMART test = 57

Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:          0        0         0         0          0          0.000           0
write:         0        0         0         0          0          0.000           0
Non-medium error count:        0
No self-tests have been logged
Long (extended) Self Test duration: 1113 seconds [18.6 minutes]

Starší P800:

Kód: [Vybrat]
smartctl -a -d cciss,1 /dev/cciss/c0d0

smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.16.0-0.bpo.4-amd64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               HP     
Product:              DG146ABAB4     
Revision:             HPDE
User Capacity:        146,815,737,856 bytes [146 GB]
Logical block size:   512 bytes
Logical Unit id:      0x5000c50007a82903
Serial number:        3NM3TLP200009817WMS1
Device type:          disk
Transport protocol:   SAS
Local Time is:        Wed May 10 00:48:55 2017 CEST
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK

Current Drive Temperature:     30 C
Drive Trip Temperature:        68 C
Elements in grown defect list: 0
Vendor (Seagate) cache information
  Blocks sent to initiator = 2331526801
  Blocks received from initiator = 1491723202
  Blocks read from cache and sent to initiator = 3753111014
  Number of read and write commands whose size <= segment size = 1500071163
  Number of read and write commands whose size > segment size = 0
Vendor (Seagate/Hitachi) factory information
  number of hours powered up = 74344.68
  number of minutes until next internal SMART test = 52

Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:          0        0         0         0          0          0.000           0
write:         0        0         0         0          0          0.000           0

Non-medium error count:        0

SMART Self-test log
Num  Test              Status                 segment  LifeTime  LBA_first_err [SK ASC ASQ]
     Description                              number   (hours)
# 1  Background short  Completed                   -   37772                 - [-   -    -]
# 2  Background long   Completed                   -   37772                 - [-   -    -]
# 3  Background short  Completed                   -   37771                 - [-   -    -]
# 4  Background long   Completed                   -   37771                 - [-   -    -]

Long (extended) Self Test duration: 2070 seconds [34.5 minutes]

Další řadiče např. https://www.smartmontools.org/wiki/Supported_RAID-Controllers