Fórum Root.cz
Hlavní témata => Server => Téma založeno: Martin Kamín 14. 05. 2013, 11:06:40
-
Zdravím. Nenašel jsem vůbec nikde informaci, jak přehodit pole ze stavu misc do I apod.
Mám RAID 1, mirror. Na něm dva disky. Nyní je pole
cat /etc/mdadm.conf
DEVICE /dev/sdc1 /dev/sdb1
ARRAY /dev/md0 UUID=aaee3330:958b5c70:73db64fe:9605810c
/dev/md0:
Version : 1.0
Creation Time : Wed Jun 1 14:55:07 2011
Raid Level : raid1
Array Size : 1953513336 (1863.02 GiB 2000.40 GB)
Used Dev Size : 1953513336 (1863.02 GiB 2000.40 GB)
Raid Devices : 2
Total Devices : 1
Persistence : Superblock is persistent
Intent Bitmap : Internal
Update Time : Tue May 14 11:03:09 2013
State : active, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 0
Spare Devices : 0
Name : nadarnas:0 (local to host nadarnas)
UUID : aaee3330:958b5c70:73db64fe:9605810c
Events : 221530
Number Major Minor RaidDevice State
0 0 0 0 removed
1 8 33 1 active sync /dev/sdc1
Při pokusu o připojení disku /dev/sdb, který v systému běží
fdisk /dev/sdb
Disk /dev/sdb: 2000.4 GB, 2000398934016 bytes
255 heads, 63 sectors/track, 243201 cylinders, total 3907029168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x000707d9
Device Boot Start End Blocks Id System
/dev/sdb1 2048 3907028991 1953513472 fd Linux raid autodetect
mi to napíše:
mdadm /dev/md0 --re-add /dev/sdb
mdadm:option --re-add not valid in misc mode
Nemůžu nikde najít, jak z toho ven??
-
Je to jen nápad, ale zkusil bych:
mdadm --manage /dev/md0 --re-add /dev/sdb
Nemám to zde ani kde zkusit.
-
Zkoušel jsem tuto variantu také
mdadm --manage /dev/md0 --re-add /dev/sdb
mdadm: --manage would set mdadm mode to "manage", but it is already set to "misc".
-
To je nějaký testovací stroj, nebo je to v produkci? Zkusil bych to rebootnout. :)
-
Vyzkoušeno nekolikrát, je to ostré pole. Data jsou, disk, co je v poli funguje normálně, druhý se zdá také, ale jak jej podhodit zpět?
-
"misc mode" není mód toho pole, ale jeden z módů práce příkazu mdadm, viz man mdadm.
Zařízení sdb má dle výpisu fdisku jednu partišnu - sdb1 typu Linux raid autodetect. Tedy předpokládám, že se má připojit sdb1 a ne celé sdb.
Příkaz pro opětovné zasynchronizování degradovaného mirroru:
mdadm /dev/md0 --add /dev/sdb1
-
mdadm /dev/md0 -a /dev/sdb
?
-
Bohužel pořád stejně. Už jsem zkoušel mnohokrát
# mdadm /dev/md0 -a /dev/sdb1
mdadm: option -a not valid in misc mode
-
no, ja bych ho zkusil odebrat uplne, neco jako
mdadm --fail /dev/md0 /dev/sdb1
mdadm --remove /dev/md0 /dev/sdb1
mdadm --manage /dev/md0 --add /dev/sdb1
-
a jinak pomoci smartctl zkontrolovat oba disky, treba jeden odchazi
-
Už první je problém
# mdadm --fail /dev/md0 /dev/sdb1
Number Major Minor RaidDevice State
0 0 0 0 removed
1 8 33 1 active sync /dev/sdc1
mdadm: /dev/sdb1 does not appear to be an md device
-
smartcntrl
smartctl 5.40 2010-10-16 r3189 [x86_64-unknown-linux-gnu] (SUSE RPM)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net
=== START OF INFORMATION SECTION ===
Device Model: ST2000VX002-1AH166
Serial Number: 5YD3LRKY
Firmware Version: CV01
User Capacity: 2,000,398,934,016 bytes
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: 8
ATA Standard is: ATA-8-ACS revision 4
Local Time is: Tue May 14 14:46:10 2013 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 623) seconds.
Offline data collection
capabilities: (0x73) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
No Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 255) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SCT capabilities: (0x10b3) SCT Status supported.
SCT Feature Control supported.
SCT Data Table supported.
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 114 099 006 Pre-fail Always - 59247416
3 Spin_Up_Time 0x0003 093 092 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 171
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 072 060 030 Pre-fail Always - 19001578
9 Power_On_Hours 0x0032 085 085 000 Old_age Always - 13805
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 178
184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Command_Timeout 0x0032 100 100 000 Old_age Always - 0
189 High_Fly_Writes 0x003a 013 013 000 Old_age Always - 87
190 Airflow_Temperature_Cel 0x0022 068 057 045 Old_age Always - 32 (Min/Max 17/32)
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always - 0
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 42
193 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 1046
194 Temperature_Celsius 0x0022 032 043 000 Old_age Always - 32 (0 10 0 0)
195 Hardware_ECC_Recovered 0x001a 018 004 000 Old_age Always - 59247416
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 13792 -
# 2 Short offline Completed without error 00% 13775 -
# 3 Extended offline Completed without error 00% 13770 -
# 4 Short offline Completed without error 00% 13759 -
# 5 Short offline Completed without error 00% 13735 -
# 6 Short offline Completed without error 00% 13713 -
# 7 Short offline Completed without error 00% 13695 -
# 8 Short offline Completed without error 00% 13675 -
# 9 Extended offline Completed without error 00% 13673 -
#10 Short offline Completed without error 00% 13651 -
#11 Short offline Completed without error 00% 13627 -
#12 Short offline Completed without error 00% 13603 -
#13 Extended offline Completed without error 00% 13582 -
#14 Short offline Completed without error 00% 13569 -
#15 Short offline Completed without error 00% 13551 -
#16 Short offline Completed without error 00% 13536 -
#17 Short offline Completed without error 00% 13531 -
#18 Extended offline Interrupted (host reset) 00% 13529 -
#19 Short offline Completed without error 00% 13524 -
#20 Short offline Completed without error 00% 13501 -
#21 Short offline Completed without error 00% 13483 -
SMART Selective self-test log data structure revision number 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
-
Už první je problém
# mdadm --fail /dev/md0 /dev/sdb1
Number Major Minor RaidDevice State
0 0 0 0 removed
1 8 33 1 active sync /dev/sdc1
mdadm: /dev/sdb1 does not appear to be an md device
zle poradie parametrov:
mdadm /dev/md0 --fail /dev/sdb1 --remove /dev/sdb1
pripadne ak nepomoze, tak este najprv toto:
mdadm --zero-superblock /dev/sdb1
a znova pridat disk do pola
-
aha, pardon :-X
-
Už první je problém
# mdadm --fail /dev/md0 /dev/sdb1
Number Major Minor RaidDevice State
0 0 0 0 removed
1 8 33 1 active sync /dev/sdc1
mdadm: /dev/sdb1 does not appear to be an md device
zle poradie parametrov:
mdadm /dev/md0 --fail /dev/sdb1 --remove /dev/sdb1
pripadne ak nepomoze, tak este najprv toto:
mdadm --zero-superblock /dev/sdb1
a znova pridat disk do pola
mdadm /dev/md0 --fail /dev/sdb1
mdadm:option --remove not valid in misc mode
-
OK, takhle chaoticky se k ničemu nedobereš.
Co konkrétně napíše příkaz:
mdadm /dev/md0 --add /dev/sdb1
Jeho výstup jsem tu ještě nikde nezaznamenal, přitom to je přesně to, co potřebuješ. Pokud tenhle nebude fungovat, půjdeme v diagnostice problému dál.
-
OK, takhle chaoticky se k ničemu nedobereš.
Co konkrétně napíše příkaz:
mdadm /dev/md0 --add /dev/sdb1
Jeho výstup jsem tu ještě nikde nezaznamenal, přitom to je přesně to, co potřebuješ. Pokud tenhle nebude fungovat, půjdeme v diagnostice problému dál.
Ale to jsem psal, hned na začátku a to je hlavní problém.
mdadm:option --add not valid in misc mode
-
jen tak ze srandy:
spravny vystup:
$ mdadm --add
mdadm: an md device must be given in this mode
u tebe predpokladam:
$ mdadm --misc --add
mdadm:option --add not valid in misc mode
neudelal si z tebe nekdo dobry vecer a neudelal ti na mdadm alias na mdadm --misc? Zkontroluj pres
$ alias mdadm
-
jen tak ze srandy:
spravny vystup:
$ mdadm --add
mdadm: an md device must be given in this mode
u tebe predpokladam:
$ mdadm --misc --add
mdadm:option --add not valid in misc mode
neudelal si z tebe nekdo dobry vecer a neudelal ti na mdadm alias na mdadm --misc? Zkontroluj pres
$ alias mdadm
BINGO! Neudělali si srandu, ale admin je vůl zapomnětlivej, ten stroj mám tři roky a zapomněl jsem na alias!!!
Pane , smekám. Bylo to mezi klávesnicí a židlí!
Děkuji