RAID 1 je v MISC a nejde připojit

Martin Kamín

RAID 1 je v MISC a nejde připojit
« kdy: 14. 05. 2013, 11:06:40 »
Zdravím. Nenašel jsem vůbec nikde informaci, jak přehodit pole ze stavu misc do I apod.
Mám RAID 1, mirror. Na něm dva disky. Nyní je pole

Kód: [Vybrat]
cat /etc/mdadm.conf
DEVICE /dev/sdc1 /dev/sdb1
ARRAY /dev/md0 UUID=aaee3330:958b5c70:73db64fe:9605810c
 
/dev/md0:
        Version : 1.0
  Creation Time : Wed Jun  1 14:55:07 2011
     Raid Level : raid1
     Array Size : 1953513336 (1863.02 GiB 2000.40 GB)
  Used Dev Size : 1953513336 (1863.02 GiB 2000.40 GB)
   Raid Devices : 2
  Total Devices : 1
    Persistence : Superblock is persistent

  Intent Bitmap : Internal

    Update Time : Tue May 14 11:03:09 2013
          State : active, degraded
 Active Devices : 1
Working Devices : 1
 Failed Devices : 0
  Spare Devices : 0

           Name : nadarnas:0  (local to host nadarnas)
           UUID : aaee3330:958b5c70:73db64fe:9605810c
         Events : 221530

    Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       33        1      active sync   /dev/sdc1

Při pokusu o připojení disku /dev/sdb, který v systému běží

Kód: [Vybrat]
fdisk /dev/sdb
Disk /dev/sdb: 2000.4 GB, 2000398934016 bytes
255 heads, 63 sectors/track, 243201 cylinders, total 3907029168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x000707d9

   Device Boot      Start         End      Blocks   Id  System
/dev/sdb1            2048  3907028991  1953513472   fd  Linux raid autodetect

mi to napíše:

Kód: [Vybrat]
mdadm /dev/md0 --re-add /dev/sdb
mdadm:option --re-add not valid in misc mode

Nemůžu nikde najít, jak z toho ven??
« Poslední změna: 14. 05. 2013, 11:22:44 od Petr Krčmář »


Jim

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #1 kdy: 14. 05. 2013, 11:52:05 »
Je to jen nápad, ale zkusil bych:
Kód: [Vybrat]
mdadm --manage /dev/md0 --re-add /dev/sdb
Nemám to zde ani kde zkusit.

Martin Kamín

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #2 kdy: 14. 05. 2013, 13:06:19 »
Zkoušel jsem tuto variantu také
mdadm --manage /dev/md0 --re-add /dev/sdb
mdadm: --manage would set mdadm mode to "manage", but it is already set to "misc".

Jim

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #3 kdy: 14. 05. 2013, 13:17:20 »
To je nějaký testovací stroj, nebo je to v produkci? Zkusil bych to rebootnout. :)

Martin Kamín

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #4 kdy: 14. 05. 2013, 13:20:03 »
Vyzkoušeno nekolikrát, je to ostré pole. Data jsou, disk, co je v poli funguje normálně, druhý se zdá také, ale jak jej podhodit zpět?


dustin

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #5 kdy: 14. 05. 2013, 13:40:15 »
"misc mode" není mód toho pole, ale jeden z módů práce příkazu mdadm, viz man mdadm.

Zařízení sdb má dle výpisu fdisku jednu partišnu - sdb1 typu Linux raid autodetect. Tedy předpokládám, že se má připojit sdb1 a ne celé sdb.

Příkaz pro opětovné zasynchronizování degradovaného mirroru:

mdadm /dev/md0 --add /dev/sdb1


Jim

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #6 kdy: 14. 05. 2013, 13:40:46 »
mdadm /dev/md0 -a /dev/sdb
?

Martin Kamín

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #7 kdy: 14. 05. 2013, 13:54:06 »
Bohužel pořád stejně. Už jsem zkoušel mnohokrát

# mdadm /dev/md0 -a /dev/sdb1
mdadm: option -a not valid in misc mode

3ugeene

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #8 kdy: 14. 05. 2013, 14:08:05 »
no, ja bych ho zkusil odebrat uplne, neco jako

mdadm --fail /dev/md0 /dev/sdb1
mdadm --remove /dev/md0 /dev/sdb1


mdadm --manage /dev/md0 --add /dev/sdb1

3ugeene

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #9 kdy: 14. 05. 2013, 14:09:05 »
a jinak pomoci smartctl zkontrolovat oba disky, treba jeden odchazi

Martin Kamín

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #10 kdy: 14. 05. 2013, 14:27:02 »
Už první je problém
# mdadm --fail /dev/md0 /dev/sdb1

Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       33        1      active sync   /dev/sdc1
mdadm: /dev/sdb1 does not appear to be an md device

Martin Kamín

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #11 kdy: 14. 05. 2013, 14:46:48 »
smartcntrl

smartctl 5.40 2010-10-16 r3189 [x86_64-unknown-linux-gnu] (SUSE RPM)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST2000VX002-1AH166
Serial Number:    5YD3LRKY
Firmware Version: CV01
User Capacity:    2,000,398,934,016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Tue May 14 14:46:10 2013 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                 ( 623) seconds.
Offline data collection
capabilities:                    (0x73) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        No Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        ( 255) minutes.
Conveyance self-test routine
recommended polling time:        (   2) minutes.
SCT capabilities:              (0x10b3) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   114   099   006    Pre-fail  Always       -       59247416
  3 Spin_Up_Time            0x0003   093   092   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       171
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   072   060   030    Pre-fail  Always       -       19001578
  9 Power_On_Hours          0x0032   085   085   000    Old_age   Always       -       13805
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       178
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   013   013   000    Old_age   Always       -       87
190 Airflow_Temperature_Cel 0x0022   068   057   045    Old_age   Always       -       32 (Min/Max 17/32)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       42
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       1046
194 Temperature_Celsius     0x0022   032   043   000    Old_age   Always       -       32 (0 10 0 0)
195 Hardware_ECC_Recovered  0x001a   018   004   000    Old_age   Always       -       59247416
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%     13792         -
# 2  Short offline       Completed without error       00%     13775         -
# 3  Extended offline    Completed without error       00%     13770         -
# 4  Short offline       Completed without error       00%     13759         -
# 5  Short offline       Completed without error       00%     13735         -
# 6  Short offline       Completed without error       00%     13713         -
# 7  Short offline       Completed without error       00%     13695         -
# 8  Short offline       Completed without error       00%     13675         -
# 9  Extended offline    Completed without error       00%     13673         -
#10  Short offline       Completed without error       00%     13651         -
#11  Short offline       Completed without error       00%     13627         -
#12  Short offline       Completed without error       00%     13603         -
#13  Extended offline    Completed without error       00%     13582         -
#14  Short offline       Completed without error       00%     13569         -
#15  Short offline       Completed without error       00%     13551         -
#16  Short offline       Completed without error       00%     13536         -
#17  Short offline       Completed without error       00%     13531         -
#18  Extended offline    Interrupted (host reset)      00%     13529         -
#19  Short offline       Completed without error       00%     13524         -
#20  Short offline       Completed without error       00%     13501         -
#21  Short offline       Completed without error       00%     13483         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

samalama

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #12 kdy: 14. 05. 2013, 15:05:57 »
Už první je problém
# mdadm --fail /dev/md0 /dev/sdb1

Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       33        1      active sync   /dev/sdc1
mdadm: /dev/sdb1 does not appear to be an md device

zle poradie parametrov:

Kód: [Vybrat]
mdadm /dev/md0 --fail /dev/sdb1 --remove /dev/sdb1
pripadne ak nepomoze, tak este najprv toto:

Kód: [Vybrat]
mdadm --zero-superblock /dev/sdb1
a znova pridat disk do pola

3ugeene

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #13 kdy: 14. 05. 2013, 15:12:57 »
aha, pardon  :-X

Martin Kamín

Re:RAID 1 je v MISC a nejde připojit
« Odpověď #14 kdy: 14. 05. 2013, 15:24:51 »
Už první je problém
# mdadm --fail /dev/md0 /dev/sdb1

Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       33        1      active sync   /dev/sdc1
mdadm: /dev/sdb1 does not appear to be an md device

zle poradie parametrov:

Kód: [Vybrat]
mdadm /dev/md0 --fail /dev/sdb1 --remove /dev/sdb1
pripadne ak nepomoze, tak este najprv toto:

Kód: [Vybrat]
mdadm --zero-superblock /dev/sdb1
a znova pridat disk do pola

 mdadm /dev/md0 --fail /dev/sdb1
mdadm:option --remove not valid in misc mode