Surveiller / reconstruire le RAID matériel (Linux)

Pour Serveur Dédié et les Bons plans serveurs

Cet article explique comment surveiller un RAID matériel, détecter un RAID défaillant, et reconstruire le RAID si nécessaire.

Les serveurs root IONOS utilisent les contrôleurs matériels 3ware, Areca, Adaptec, Broadcom ou Dell.

Déterminer le type de contrôleur matériel

Avec la commande lspci, vous pouvez vérifier quel contrôleur matériel est installé dans votre serveur. Cette commande liste tous les périphériques du bus PCI.

Si vous utilisez un système minimal, vous devez installer ce programme manuellement. Pour ce faire, entrez la commande suivante :

CentOS 7

yum install pciutils

Ubuntu 16.04 et Ubuntu 18.04

sudo apt-get install pciutils

 

Pour vérifier quel contrôleur matériel est installé dans votre serveur, entrez la commande suivante :

lspci|grep RAID
Exemples :

[root@localhost ~]# lspci|grep RAID
01:00.0 RAID bus controller: Adaptec Series 6 - 6G SAS/PCIe 2 (rev 01)

 

[root@localhost ~]# lspci|grep RAID
02:00.0 RAID bus controller: Broadcom / LSI MegaRAID Tri-Mode SAS3408 (rev 01)

 

[root@localhost ~]# lspci|grep RAID
01:09.0 RAID bus controller: 3ware Inc 7xxx/8xxx-series PATA/SATA-RAID (rev 01)

 

[root@localhost ~]# lspci|grep RAID
02:0e.0 RAID bus controller: Areca Technology Corp. ARC-1110 4-Port PCI-X to SATA RAID Controller

Programmes de gestion des contrôleurs RAID

Le logiciel nécessaire pour gérer chaque contrôleur RAID est installé par défaut. Si nécessaire, vous pouvez télécharger le logiciel pour le contrôleur concerné ici :

Contrôleurs RAID Adaptec :

https://storage.microsemi.com/en-us/downloads/

Contrôleur RAID Broadcom :

https://www.broadcom.com/support/download-search


Contrôleurs RAID Dell :

https://www.dell.com/support/home/de-de?app=products


Contrôleurs RAID 3ware :

https://www.broadcom.com/support/knowledgebase/1211161499498/operating-systems-supported-for-the-lsi-3ware-and-megaraid-contr


Contrôleurs du RAID Areca :

https://www.areca.com.tw/support/downloads.html

Obtenir des détails sur le contrôleur RAID matériel

Contrôleur RAID Adaptec

Le contrôleur RAID Adaptec est géré avec l'outil de ligne de commande arcconf. Utilisez les commandes suivantes pour afficher des informations détaillées sur le contrôleur RAID Adaptec et sa configuration :

COMMANDE EXPLICATION
arcconf GETCONFIG 1 Cette commande affiche des informations sur le contrôleur RAID, la configuration, les matrices RAID et les disques durs disponibles et leur état actuel.
arcconf getconfig 1 PD Cette commande affiche des informations sur les disques disponibles.
arcconf getlogs controller-number device ¦ dead ¦ event [clear ¦ tabular] Cette commande affiche les entrées du journal. Vous pouvez utiliser les paramètres suivants pour spécifier le type d'entrées de journal affichées :
Exemple : arcconf getlogs 1 device tabular DEVICE : affiche toutes les entrées de journal comportant des erreurs que le contrôleur pourrait détecter sur tous les appareils connectés.
  DEAD : affiche toutes les entrées du journal où les défaillances des appareils et des disques ont été enregistrées.
  EVENT : affiche toutes les entrées du journal avec des informations sur les événements spéciaux (par exemple, les reconstructions, les MLD, etc.)
  Vous pouvez également spécifier les paramètres suivants :
  tabular : Affiche le journal sous forme de tableau.
  clear : Efface le journal du contrôleur spécifié.
arcconf getlogs controller-number device ¦ dead ¦ event [clear ¦ tabular] > FILENAME.log Cette commande écrit les entrées du journal dans un fichier.
Exemple : arcconf getlogs 1 device tabular > device.log  

Vous trouverez de plus amples informations ici :

Guide de l'utilisateur ARCCONF Command Line Utility

Contrôleur RAID Broadcom

Le contrôleur RAID Broadcom est géré et contrôlé à l'aide de l'outil de ligne de commande StorCLI. Vous pouvez utiliser les commandes suivantes pour afficher des informations détaillées sur le contrôleur RAID Broadcom et sa configuration :

COMMANDE EXPLICATION
storcli64 /c0 show all Cette commande affiche des informations sur le contrôleur RAID et sa configuration.
storcli64 /c0/eall/sall show Cette commande affiche des informations sur les disques existants.
storcli64 /c0/eALL/sALL show all Cette commande affiche des informations sur les disques disponibles et leur état actuel (numéro de série, température, etc.).
storcli /cx show eventloginfo Cette commande affiche les entrées du journal.

Vous trouverez de plus amples informations ici :

Guide d'utilisation de MegaRAID Tri-Mode StorCLI 12Gb/s

Contrôleur RAID Dell

Le contrôleur RAID Dell est géré à l'aide de l'interface de commande du contrôleur RAID PowerEdge (PERCCLI). Utilisez les commandes suivantes pour afficher des informations détaillées sur le contrôleur RAID Dell et sa configuration :

COMMANDE EXPLICATION
perccli64 /c0/e32/s0 show all Cette commande affiche des informations sur le disque 0.
perccli64 /c0/e32/s1 show all Cette commande affiche des informations sur le disque 1.
perccli64 /c0 show Cette commande affiche des informations sur les disques durs disponibles.
perccli /c0 show eventloginfo Cette commande affiche les entrées du journal pour le contrôleur 0.

Vous trouverez de plus amples informations ici :

Guide de référence CLI du contrôleur RAID PowerEdge EMC de Dell

Contrôleur RAID 3ware

Pour obtenir des détails sur le contrôleur RAID 3ware, entrez la commande suivante :

# dmesg|grep 3ware
3ware Storage Controller device driver for Linux v1.26.02.002.
scsi0 : 3ware Storage Controller
3w-xxxx: scsi0: Found a 3ware Storage Controller at 0xd800, IRQ: 18.
scsi 0:0:0:0: Direct-Access 3ware Logical Disk 0 1.2 PQ: 0 ANSI: 0
3ware 9000 Storage Controller device driver for Linux v2.26.02.010.
tw_cli

Le contrôleur RAID 3ware est géré avec l'interface de ligne de commande de gestion du contrôleur de stockage 3ware. Pour ouvrir l'interface de ligne de commande, entrez la commande tw_cli. Vous pouvez utiliser la commande help pour afficher toutes les commandes disponibles. Pour quitter la console, entrez exit.

# tw_cli
//XXX> help

Copyright(c) 2004-2006 Applied Micro Circuits Corporation(AMCC). All rights reserved.

AMCC/3ware CLI (version 2.00.06.007)


Commands Description
-------------------------------------------------------------------
focus Changes from one object to another. For Interactive Mode Only!
show Displays information about controller(s), unit(s) and port(s).
flush Flush write cache data to units in the system.
rescan Rescan all empty ports for new unit(s) and disk(s).
update Update controller firmware from an image file.
commit Commit dirty DCB to storage on controller(s). (Windows only)
/cx Controller specific commands.
/cx/ux Unit specific commands.
/cx/px Port specific commands.
/cx/bbu BBU specific commands. (9000 only)
/ex Enclosure specific commands. (9KSX/SE only)
/ex/slotx Enclosure Slot specific commands.
/ex/fanx Enclosure Fan specific commands.
/ex/tempx Enclosure Temperature Sensor specific commands.

Certain commands are qualified with constraints of controller type/model support.
Please consult the twi_cli documentation for explanation of the controller-qualifiers.

The controller-qualifiers of the Enclosure commands (/ex) also apply to Enclosure
Element specific commands (e.g., /ex/elementx).

Type help <command> to get more details about a particular command.
For more detail information see twi_cli's documentation.

//XXX>

Pour afficher des informations sur l'état du système RAID, entrez la commande suivante :

//XXXX> info

Ctl Model Ports Drives Units NotOpt RRate VRate BBU
------------------------------------------------------------------------
c0 8006-2LP 2 2 1 0 2 - -

//XXXX> info c0

Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-1 OK - - - 232.885 ON -

Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 232.88 GB 488397168 4ND0XYFE
p1 OK u0 232.88 GB 488397168 4ND0YH77

Pour afficher les alertes de contrôleur RAID matériel, entrez la commande suivante :

//XXXX> show alarms

Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 - INFO (0x0F:0x0007): Initialization complete: Unit #0
c0 - INFO (0x0F:0x000C): Initialization started: Unit #0

Un message d'alarme est affiché dans le format suivant :

//XXXX> show alarms

Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 - INFO (0x0F:0x000B): Rebuild started: Unit #0
c0 - ERROR (0x0F:0x0002): Unit degraded: Unit #0

Pour retirer un disque dur défectueux du RAID sur le deuxième port, entrez la commande suivante :

//XXXX> maint remove c0 p1
Removing port /c0/p1 ... Done.

Après le remplacement du disque dur défectueux, le nouveau disque dur doit être reconnu. Pour ce faire, entrez la commande suivante :

//XXXX> maint rescan
Rescanning controller /c0 for units and drives ...Done.
Found the following unit(s): [none].
Found the following drive(s): [/c0/p1].

Pour monter et reconstruire un disque sur le second port, entrez la commande suivante :

//XXXX> maint rebuild c0 u0 p1
Sending rebuild start request to /c0/u0 on 1 disk(s) [1] ... Done.

Pour afficher des informations sur la reconstruction du RAID, entrez la commande suivante :

//XXXX> info c0

Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
------------------------------------------------------------------------------
u0 RAID-1 REBUILDING 0 - - 232.885 ON -

Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 OK u0 232.88 GB 488397168 4ND0XYFE
p1 DEGRADED u0 232.88 GB 488397168 4ND0YH77
Surveiller les contrôleurs RAID 3ware avec le logiciel 3ware Disk Manager 2

3ware propose le logiciel 3ware Disk Manager 2 (3dm2). Avec ce logiciel, vous pouvez gérer et surveiller le contrôleur RAID 3ware.

Vous pouvez télécharger 3ware Disk Manager 2 ici :

https://www.broadcom.com/support/knowledgebase/1211161499498/operating-systems-supported-for-the-lsi-3ware-and-megaraid-contr

Documentation 3ware

Pour plus d'informations sur l'installation, la configuration et l'application, reportez vous à la documentation 3ware :

https://www.broadcom.com/support/knowledgebase/1211161499541/lsi-3ware-user-documentation-downloads

Contrôleurs RAID Areca

Pour obtenir des détails sur le contrôleur RAID Areca, entrez la commande suivante :

# dmesg|grep -i areca
ARECA RAID ADAPTER0: FIRMWARE VERSION V1.43 2007-4-17
scsi0 : Areca SATA Host Adapter RAID Controller
scsi 0:0:0:0: Direct-Access Areca ARC-1110-VOL#00 R001 PQ: 0 ANSI: 5
scsi 0:0:16:0: Processor Areca RAID controller R001 PQ: 0 ANSI: 0

Vous trouverez ci-dessous quelques exemples de commandes. Vous pouvez accéder au contrôleur dans le système de sauvetage :

arcmsr_cli64
Copyright (c) 2004 Areca, Inc. All Rights Reserved.
Areca CLI, Version: 1.71.240( Linux )


Controllers List
----------------------------------------
Controller#01(PCI): ARC-1110
Current Controller: Controller#01
----------------------------------------

CMD Description
==========================================================
main Show Command Categories.
set General Settings.
rsf RaidSet Functions.
vsf VolumeSet Functions.
disk Physical Drive Functions.
sys System Functions.
net Ethernet Functions.
event Event Functions.
hw Hardware Monitor Information.
exit Exit CLI.
==========================================================
Command Format: <CMD> [Sub-Command] [Parameters].
Note: Use <CMD> -h or -help to get details.
CLI>

Avec la commande <cmd> info vous pouvez demander des informations sur le système. Par exemple, après avoir entré la commande hw info, les informations sur le moniteur matériel sont affichées :

CLI> hw info
The Hardware Monitor Information
===========================================
Fan#1 Speed (RPM) : 2673
HDD #1 Temp. : 48
HDD #2 Temp. : 47
HDD #3 Temp. : 51
HDD #4 Temp. : 0
===========================================
GuiErrMsg<0x00>: Success.

CLI>

Pour afficher des informations sur les disques durs, entrez la commande suivante :

CLI> disk info
# ModelName Serial# FirmRev Capacity State
===============================================================================
1 ST3750640AS 5QD5G7Z1 3.AAK 750.2GB RaidSet Member(1)
2 ST3750640AS 5QD5G6JR 3.AAK 750.2GB RaidSet Member(1)
3 ST3750640AS 5QD5G7XQ 3.AAK 750.2GB RaidSet Member(1)
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

Utilisez la commande suivante pour afficher les informations du système concernant le contrôleur RAID Areca :

CLI> sys info
The System Information
===========================================
Main Processor : 500MHz
CPU ICache Size : 32KB
CPU DCache Size : 32KB
System Memory : 256MB/333MHz
Firmware Version : V1.43 2007-4-17
BOOT ROM Version : V1.43 2007-4-17
Serial Number : Y813CAAAAR101890
Controller Name : ARC-1110
===========================================
GuiErrMsg<0x00>: Success.

CLI>

Pour afficher les événements en cours, entrez la commande suivante :

CLI> event info
Date-Time Device Event Type
===============================================================================
2009-07-09 07:23:14 H/W MONITOR Raid Powered On
2008-09-29 08:06:24 H/W MONITOR Raid Powered On
2008-09-29 07:51:37 H/W MONITOR Raid Powered On
...

Utilisez la commande suivante pour obtenir des informations sur le jeu RAID actuel :

CLI> rsf info
# Name Disks TotalCap FreeCap DiskChannels State
===============================================================================
1 Raid Set # 00 3 2250.5GB 0.0GB 123 Normal
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

Dans cet exemple, le jeu RAID est composé de 3 x 750 Go.

Pour afficher des informations sur les volumes RAID logiques, entrez la commande suivante :

CLI> vsf info
# Name Raid# Level Capacity Ch/Id/Lun State
===============================================================================
1 ARC-1110-VOL#00 1 Raid5 1500.3GB 00/00/00 Normal
===============================================================================
GuiErrMsg<0x00>: Success.

CLI>

Si vous souhaitez apporter des modifications au RAID matériel avec les contrôleurs RAID Areca, un mot de passe est nécessaire. Le mot de passe par défaut est "0000". Exemple :

<CLI> set password=0000. 
Documentation Areca

Pour de plus amples informations sur l'installation, la configuration et l'application, reportez vous à la documentation Areca :

http://areca.starline.de/RaidCards/Documents/Manual_Spec/Software

Étapes nécessaires après le remplacement d'un disque dur

Lorsqu'un disque dur défectueux est remplacé, la reconstruction du système RAID démarre généralement automatiquement. Pour garantir la fonctionnalité du système RAID, nous recommandons de surveiller la reconstruction du système RAID.


Cette information vous a-t-elle été utile ?

Vos commentaires nous aident à améliorer nos services. Pour laisser un commentaire, connectez-vous à votre compte IONOS en cliquant sur le bouton de connexion en haut à droite. Vous pouvez ensuite soumettre votre évaluation en dessous de l'article.