Surveiller / reconstruire un RAID matériel (Windows)

Pour Serveur Dédié Windows avec RAID matériel

Voici comment vérifier l'état des RAID matériels et comment les reconstruire si nécessaire après un échange de disque dur.

Remarque

Les valeurs dans cet article ne sont données qu'à titre d'exemple et peuvent différer de votre RAID.

Identifier le contrôleur matériel

Deux types de contrôleurs matériels sont utilisés dans les serveurs root deIONOS : LSI 3ware et Areca.

Vous pouvez vérifier quel contrôleur est installé sur votre serveur dans le Gestionnaire de périphériques Windows dans la section Contrôleur de stockage.

LSI 3ware RAID

tw_cli

Téléchargez l'interface de ligne de commande 3ware (tw_cli) et exécutez-la sur votre serveur. (Veuillez rechercher "CLI" sur la page du fournisseur lié et sélectionner "Software" sur la page des résultats de la recherche).

La commande help retourne toutes les commandes disponibles :

# tw_cli
//XXX> help

Copyright(c) 2012 LSI

LSI/3ware CLI (version 2.00.11.022)


Commands Description
-------------------------------------------------------------------
focus Changes from one object to another. For Interactive Mode Only!
show Displays information about controller(s), unit(s) and port(s).
flush Flush write cache data to units in the system.
rescan Rescan all empty ports for new unit(s) and disk(s).
update Update controller firmware from an image file.
commit Commit dirty DCB to storage on controller(s). (Windows only)
/cx Controller specific commands.
/cx/ux Unit specific commands.
/cx/px Port specific commands.
/cx/phyx Phy specific commands.
/cx/bbu BBU specific commands. (9000 series)
/cx/ex Enclosure specific commands. (9690SA, 9750)
/ex Enclosure specific commands. (9550SX/9650SE)


Certain commands are qualified with constraints of controller type/model support.
Please consult the twi_cli documentation for explanation of the controller-qualifiers.

Type help <command> to get more details about a particular command.
For more detail information see twi_cli's documentation.

//XXX>

info affiche des informations sur le RAID et son état actuel. Il s'agit d'un RAID5 d'une capacité de 1,36 To, composé de 3 disques durs.

//XXXX> info

Ctl Model Ports Drives Units NotOpt RRate VRate BBU
------------------------------------------------------------------------
c0 9750-4i 3 3 1 0 2 1 -

//XXXX> info c0

Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
-----------------------------------------------------------------------------
u0 RAID-5 OK - - 256K 2793.95 RIW ON

VPort Status Unit Size Type Phy Encl-Slot Model
-------------------------------------------------------------------------------
p0 OK u0 1.36 TB SATA 0 ST1500L003-9VT16L
p1 OK u0 1.36 TB SATA 0 ST1500L003-9VT16L
p2 OK u0 1.36 TB SATA 0 ST1500L003-9VT16L

show alarms affiche les derniers messages d'alarme :

//XXXX> show alarms

Ctl Date Severity AEN Message
------------------------------------------------------------------------------
c0 [Wed Feb 01 2014 03:25:11] INFO Rebuild startet: unit=0
c0 [Wed Feb 01 2014 08:13:31] INFO Rebuild completed: unit=0
c0 [Wed Feb 01 2014 08:14:13] INFO Initialize started: unit=0
c0 [Wed Feb 01 2014 08:14:13] INFO Initialize completed: unit=0

En cas d'erreur, le résultat ressemblerait à ceci. Ici le troisième disque (unit=0, vport 2) a échoué :

//XXXX> show alarms

Ctl Date Severity AEN Message
------------------------------------------------------------------------------
c0 [Wed Feb 02 2014 08:22:10] INFO Rebuild started: unit=0
c0 [Wed Feb 02 2014 08:14:13] ERROR Unit degraded: unit=0, vport 2

maint remove c0 p2 supprime le disque dur défectueux sur le troisième port (p2) du RAID :

//XXXX> maint remove c0 p2
Removing port /c0/p2 ... Done.

Après avoir remplacé le disque défectueux, il est nécessaire de procéder à un maint rescan pour que le contrôleur reconnaisse le nouveau disque :

//XXXX> maint rescan
Rescanning controller /c0 for units and drives ...Done.
Found the following unit(s): [none].
Found the following drive(s): [/c0/p2].

Le disque peut alors être connecté au troisième port avec maint rebuild c0 u0 p2 et reconstruit :

//XXXX> maint rebuild c0 u0 p2
Sending rebuild start request to /c0/u0 on 1 disk(s) [2] ... Done.

Affiche l'état de la reconstruction :

//XXXX> info c0

Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------------
u0 RAID-5 REBUILDING 0 - 256k 232.885 RiW ON

Port Status Unit Size Type Phy Encl-Slot Model
------------------------------------------------------------------------------------
p0 OK u0 1.36 TB SATA 0 - ST1500L003-9VT16L
p1 OK u0 1.36 TB SATA 0 - ST1500L003-9VT16L
p2 DEGRADED u0 1.36 TB SATA 1 - ST1500L003-9VT16L
3dm2 (3ware Drive Manager)

Pour plus d'informations sur l'installation, la configuration et les applications, reportez-vous à la documentation de 3ware (http://www.3ware.com/support/userdocs.asp).

Areca RAID

Téléchargez l'utilitaire Windows - CLI et exécutez-le sur votre serveur.

Vous pouvez télécharger le manuel complet de CLI depuis Areca à l'adresse http://areca.starline.de/RaidCards/Documents/Manual_Spec/Software/.

Dans l'exemple suivant, quelques commandes sont listées :

Copyright (c) 2004 Areca, Inc. All Rights Reserved.
Areca CLI, Version: 1.71.240( Windows )


Controllers List
----------------------------------------
Controller#01(PCI): ARC-1110
Current Controller: Controller#01
----------------------------------------

CMD Description
==========================================================
main Show Command Categories.
set General Settings.
rsf RaidSet Functions.
vsf VolumeSet Functions.
disk Physical Drive Functions.
sys System Functions.
net Ethernet Functions.
event Event Functions.
hw Hardware Monitor Information.
exit Exit CLI.
==========================================================
Command Format: <CMD> [Sub-Command] [Parameters].
Note: Use <CMD> -h or -help to get details.
CLI>

Avec la commande <cmd> info, les informations du système peuvent être interrogées, par exemple les informations du moniteur matériel (température) :

CLI> hw info
The Hardware Monitor Information
===========================================
Fan#1 Speed (RPM) : 2673
HDD #1 Temp. : 48
HDD #2 Temp. : 47
HDD #3 Temp. : 51
HDD #4 Temp. : 0
===========================================
GuiErrMsg<0x00>: Success.

CLI>

disk info affiche des informations sur les disques durs :

CLI> disk info
# ModelName Serial# FirmRev Capacity State
===============================================================================
1 ST3750640AS 5QD5G7Z1 3.AAK 750.2GB RaidSet Member(1)
2 ST3750640AS 5QD5G6JR 3.AAK 750.2GB RaidSet Member(1)
3 ST3750640AS 5QD5G7XQ 3.AAK 750.2GB RaidSet Member(1)
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

sys info fournit des informations sur le contrôleur lui-même :

CLI> sys info
The System Information
===========================================
Main Processor : 500MHz
CPU ICache Size : 32KB
CPU DCache Size : 32KB
System Memory : 256MB/333MHz
Firmware Version : V1.43 2007-4-17
BOOT ROM Version : V1.43 2007-4-17
Serial Number : Y813CAAAAR101890
Controller Name : ARC-1110
===========================================
GuiErrMsg<0x00>: Success.

CLI>

event info affiche les événements en cours :

CLI> event info
Date-Time Device Event Type
===============================================================================
2013-07-09 07:23:14 H/W MONITOR Raid Powered On
2013-09-29 08:06:24 H/W MONITOR Raid Powered On
2013-09-29 07:51:37 H/W MONITOR Raid Powered On
...

rsf info affiche des informations sur le jeu de raid actuel (ici 3*750 Go sont installés) :

CLI> rsf info
 #  Name             Disks TotalCap  FreeCap DiskChannels       State
===============================================================================
 1  Raid Set # 00        3 2250.5GB    0.0GB 123                Normal
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

vsf info renvoie des informations sur les volumes RAID logiques :

CLI> vsf info
# Name Raid# Level Capacity Ch/Id/Lun State
===============================================================================
1 ARC-1110-VOL#00 1 Raid5 1500.3GB 00/00/00 Normal
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

Reconstruire un RAID défectueux sur un contrôleur Areca

Un RAID défectueux pourrait ressembler à ceci :

CLI> rsf info
# Name Disks TotalCap FreeCap DiskChannels State
===============================================================================
1 Raid Set # 00 3 2250.5GB 0.0GB 1x3 Degrade
2 Raid Set # 00 3 2250.5GB 2250.5GB x2x Incompleted
===============================================================================
GuiErrMsg<0x00>: Success.

Le Raid Set 2 a le statut incompleted.

Le mot de passe du contrôleur doit être saisi pour que vous puissiez modifier la configuration. Le mot de passe par défaut est 0000 :

<CLI> set password=0000. 

Le RAID activé avec le statut incompleted doit être supprimé. Dans cet exemple, c'est le raid #2 qui est supprimé avec la commande rsf delete raid=2 :

CLI> rsf delete raid=2
GuiErrMsg<0x00>: Success.
CLI> rsf info
# Name Disks TotalCap FreeCap DiskChannels State
===============================================================================
1 Raid Set # 00 3 2250.5GB 0.0GB 1x3 Degrade
===============================================================================
GuiErrMsg<0x00>: Success.

Ensuite, vous pouvez utiliser rsf createhs drv=2 pour monter le disque en tant que Hot Spare à nouveau :

CLI> rsf createhs drv=2
GuiErrMsg<0x00>: Success.

Le contrôleur Areca détecte automatiquement un nouveau disque. Il n'est donc pas nécessaire de lier et d'initier une reconstruction.

La reconstruction démarre automatiquement et peut être surveillée :

CLI> rsf info
# Name Disks TotalCap FreeCap DiskChannels State
===============================================================================
1 Raid Set # 00 3 2250.5GB 0.0GB 123 Rebuilding
===============================================================================

GuiErrMsg<0x00>: Success.