Frage Wie überwacht man den Festplattenstatus hinter Dell PERC H710 Raid Controller mit CentOS 6?


Ich habe einen Dell Server läuft CentOS 6 verwenden PERC H710 Raid Controller Karte mit Raid 5 Setup und ich möchte den Festplattenausfall / Arbeitsstatus hinter dem Raid Controller überwachen.

Dann sollte ich in der Lage sein, ein Bash-Skript zu verwenden, um den Festplattenstatus zu überwachen und Alarm-E-Mails zu senden, wenn etwas schief ging.

Das LSI MegaRAID SAS Befehlswerkzeug (Über LSI MegaRAID SAS Linux Tools) für CentOS / Red Hat / Linux unterstützt KEINE PERC H710 und smartctl unterstützt es auch nicht.

Basierend auf der Dell Website CentOS IS wird für diesen Server nicht unterstützt (NX3200 PowerVault) und ich konnte kein Linux-Programm herunterladen, um die Festplatte zu überwachen.

[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               DELL
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

Weiß jemand, wie man den Festplattenstatus hinter Hardware-RAID auf Dell PERC H710 mit CentOS 6 überwacht?


20
2018-04-15 08:51


Ursprung




Antworten:


CLEVER. ist nicht das letzte Wort bei der Festplatten- oder Speicherüberwachung !! Es ist eine Komponente, aber moderne RAID-Controller verwenden sie zusammen mit anderen Methoden, um den Laufwerks- und Array-Zustand zu bestimmen.

Ich gehe davon aus, dass dies ein PERC-Controller in einem Dell PowerEdge-Server ist.

Der normale Linux-freundliche Ansatz für die Zustandsüberwachung von Dell-Hardware besteht darin, die Dell OMSA-Agenten für Linux über Yum zu installieren - http://linux.dell.com/wiki/index.php/Repository/OMSA#Yum_setup

yum install srvadmin-all wird die vollständige Suite von Agenten installieren. Sobald installiert, können Sie die verwenden omreport Befehl an Informationen bekommen über dein Array.

Beispiele:

omreport storage vdisk

omreport storage pdisk controller=0


22
2018-04-15 13:58



Dies wird zusätzliche Komponenten wie Webserver / SSL auf meinen Linux-Rechnern installieren, aber es scheint, dass ich keine andere Wahl habe! Ich hasse es unnötige Pakete auf meinem Server hinzuzufügen. - Xianlin
Hüten Sie sich vor einem möglichen Speicherverlust von einem dieser OMSA-Programme. Es passierte mir langsam im Laufe von 3-4 Wochen dann boom, keine Speicher mehr für Linux. - bksunday
Ja, das Leck ist in dsm_sa_snmpd (also laufe ich 'killall -9 dsm_sa_snmpd', gelöst). - markusN
Die PERC 7xx und 8xx Controller sind nur LSI Megaraid Controller und das LSI MegaCLI Tool wird gut funktionieren, wenn Sie Ihr System nicht mit DLL-Bibliotheken und anderen Diensten und / oder Kernel-Modulen, die sie heutzutage löschen, beschädigen wollen. Es gibt viele MegaCLI Cheat Sheets, Nagios Monitoring-Skripte und Leistungsoptimierung Tipps für die LSI-Binärdatei. Das ist natürlich nur meine persönliche Vorliebe und Meinung. Ich bin ein Minimalist. - Aaron
@Xianlin, das ist nicht ganz richtig. Ja, es wird eine Menge Müll installiert, aber ich sehe meine Antwort. Ich wollte keine unnötigen Pakete hinzufügen, also habe ich nur die gefunden, die ich zum Speichern benötige. - Mike S


Sie können den SMART-Status der Festplatten mit dem Befehl smartctl sehen -d Streit. Um beispielsweise die erste Festplatte im Array zu sehen:

# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST91000640NS
Serial Number:    ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P     showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#

Dies ist auf Scientific Linux 6 (ein anderes RHEL6-basiertes Betriebssystem) mit smartmontools-5.43-1.el6.x86_64.


18
2017-07-10 10:30





Die angenommene Antwort empfiehlt die Kühnheit, die ist yum install srvadmin-all. Blecch. Hier ist, wie man es etwas weniger bleche (aber immer noch bleche; auf HPs Plattform kann man viel schlanker werden. Aber ich schweife ab ...) Damit meine ich nur die Komponenten zu installieren, die notwendig sind, um den Speicher auf Ihrem Rechner zu verwalten .

BTW, die direkte Antwort auf die Frage des Benutzers liegt in dem Punkt "Show physische Festplatten auf vdisk 0" in der Liste unten.

wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices

Fügen Sie dem Bashrc der Wurzel hinzu:

export PATH=$PATH:/opt/dell/srvadmin/bin

Genießen:

RAID-Befehle

  • Zeigen Sie alle physischen Datenträger auf Controller 0 an

    omreport storage pdisk controller=0

  • Zeige alle logischen Laufwerke auf Controller 0

omreport storage vdisk controller=0

  • Zeigen Sie alle physischen Datenträger auf vdisk 0 an

omreport storage pdisk controller=0 vdisk=0

  • Konfigurieren Sie eine vdisk für raid1 von raid0 neu (COOL!!!!)

omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3

  • Erstellen Sie eine virtuelle Festplatte auf einer neuen Festplatte:

omconfig storage controller controller=0 action=clearforeignconfig omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2

Mehr Info

Wie konfiguriere ich mein Festplatten-Array auf einem Dell-Computer unter Linux neu?

Übrigens, da dies nichts anderes als eine LSI MegaCLI-Karte von Dell ist, könnte Han Solo's Antwort noch besser sein! Ich muss es jedoch noch versuchen.

Die Süße

Hier ist ein Beispiel für die Ausgabe von omreport, die über grep für ein köstliches Datenpaket gepinnt wurde:

# omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root

Controller PERC H700 Integrated (Embedded)
ID                              : 0:0:0
Status                          : Ok
Name                            : Physical Disk 0:0:0
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFDT
Part Number                     : CN0X162K7262213800JTA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E44C5

ID                              : 0:0:1
Status                          : Ok
Name                            : Physical Disk 0:0:1
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFEY
Part Number                     : CN0X162K7262213800FPA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E3C1D

7
2018-04-05 19:57





Ich hatte auch Probleme mit CentOS und ich fand hier ein Arbeitspaket http://mirror.ndchost.com/software/lsi/

namens "MegaCli-8.07.10-1.noarch.rpm"

Die Befehlsreferenz http://hwaid.le-vert.net/wiki/LSIMegaRAIDSAS

Ich hoffe, es hilft.


6
2018-02-16 01:15



Ich würde absolut zustimmen, verwenden Sie / opt / megacli / MegaCli64 -PDList -aALL | grep -i Firmware und es wird Ihnen sagen, ob die physikalischen Festplatten in Ordnung sind. (Befehl ist von erikimh.com/megacli-cheatsheet - Sieh es wenn ich das falsche benutzt habe). Im Grunde genommen ist die Raid Care eine großartige Sache, wenn es darum geht, die Festplatten zu überwachen, also behalte einfach die Meinung über die Betriebszustände der Festplatten im Auge. - Some Linux Nerd


smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
Device: FUJITSU  MBE2147RC        Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:

3
2017-09-15 09:44



Bitte beachten Sie das Lesen Wie schreibe ich eine gute Antwort? in unserer Hilfe und überarbeiten Sie dann die Antwort. Dein Kommando kann technisch eine Lösung sein, die auch schon in den anderen, viel älteren Antworten erwähnt wurde und einige Erklärungen sind willkommen. Danke im Voraus. - HBruijn
Die andere Antwort benutzte "sat + megaaid", was bei mir nicht funktionierte. (Richtig, ich kannte den Befehl smartctl nicht gut und wusste nicht, wie ich den Befehl ändern sollte, damit er funktioniert.) Diese Antwort führte mich auf den richtigen Weg, und das funktioniert für mich. - Yongwei Wu


Hallo Ich habe eine ähnliche Dell PERC / LSI-Karte und ich musste den RAID-Status überprüfen. LSI haben ein Dienstprogramm namens sas2ircu, das ich sehr nützlich fand, es gibt auch eine Version für Windows und Linux.


-1
2017-08-13 14:08