Frage Haben RAID-Controller häufig Kompatibilitätsprobleme mit SATA-Laufwerken?


Wir hatten Probleme mit dem RAID-Controller in unserem Datenbankserver, a Lenovo ThinkServer RD120. Es ist ein umbenanntes Adaptec, dass Lenovo / IBM den ServeRAID 8k.

Wir haben das geflickt ServeRAID 8k bis zum letzten und größten:

  • RAID-BIOS-Version
  • RAID-Backplane-BIOS-Version
  • Windows Server 2008-Treiber

Dieser RAID - Controller hat bereits in den kurzen 4 Monaten, in denen er uns gehört, mehrere kritische BIOS - Updates erhalten Geschichte verändern ist nur ... na ja, unheimlich.

Wir haben sowohl Write-Back- als auch Write-Through-Strategien auf den logischen RAID-Laufwerken ausprobiert. Wir bekommen immer noch intermittierende E / A-Fehler unter Festplattenaktivität. Sie sind nicht üblich, aber ernst, wenn sie auftreten, da sie SQL Server 2008-E / A-Zeitüberschreitungen und manchmal Fehler bei SQL-Verbindungspools verursachen.

Wir waren am Ende unseres Seils, um dieses Problem zu beheben. Abgesehen von Hardcore-Sachen wie dem Ersetzen des gesamten Servers oder dem Ersetzen der RAID-Hardware, wurden wir verzweifelt.

Als ich den Server zum ersten Mal bekam, hatte ich ein Problem, wo der Laufwerksschacht Nr. 6 nicht erkannt wurde. Das Austauschen von Festplatten auf eine andere Marke, seltsamerweise, reparierte dies - und das Aktualisieren des RAID-BIOS (für das erste von vielen Malen) reparierte es dauerhaft, so dass ich das ursprüngliche "inkompatible" Laufwerk in Schacht 6 verwenden konnte Ahnung, ich fing an, das anzunehmen die Western Digital SATA-Festplatten Ich entschied mich, irgendwie mit dem ServeRAID 8k Controller nicht kompatibel zu sein.

6 neue Festplatten zu kaufen war eine der billigeren Optionen auf dem Tisch, also ging ich 6 Festplatten von Hitachi (alias IBM, alias Lenovo) unter der Annahme, dass ein IBM / Lenovo RAID-Controller eher mit den Laufwerken arbeitet, mit denen er normalerweise verkauft wird.

Sieht so aus, als hätte sich diese Ahnung gelohnt - wir haben drei unserer schwersten Lasttage (Montag, Dienstag, Mittwoch) ohne einen einzigen E / A-Fehler durchgemacht. Zuvor hatten wir in diesem Zeitraum regelmäßig mindestens ein I / O "Event". Es sieht so aus, als ob die Marken von Festplatten gewechselt haben, hat unsere intermittierenden RAID I / O Probleme behoben!

Obwohl ich weiß, dass IBM / Lenovo ihren RAID-Controller wahrscheinlich ausschließlich mit Festplatten der eigenen Marke testet, stört mich, dass ein RAID-Controller bei bestimmten Marken von Festplatten derart subtile E / A-Probleme hat.

Also meine Frage ist, ist diese Art von SATA-Laufwerk-Inkompatibilität mit RAID-Controllern üblich? Gibt es einige Marken von Laufwerken, die besser funktionieren als andere oder gegen einen bestimmten RAID-Controller "validiert" sind? Ich war davon ausgegangen, dass alle gängigen SATA-Festplatten gleichartig sind und in jedem RAID-Controller (von ausreichender Qualität) einigermaßen gut funktionieren würden.


22
2018-04-30 07:04


Ursprung




Antworten:


Ja, Ich habe dies mit Low-End-Karten und Buggy-Treibern angetroffen. Jedoch, Neinnicht auf einer aktuellen Adaptec-Karte. Wow ist alles was ich sagen kann. Eine Sache zu beachten, vielleicht ist es mehr ein Fehler mit dem Laufwerk als der RAID-Controller.

Ich habe keine gute Antwort, aber da Sie scheinbar die meisten Optionen außer dem Ersetzen der Karte ausgeschöpft haben (und das Ersetzen der Laufwerke hat den Zweck erfüllt), hier ein paar Ideen, die Sie bei der Fehlerbehebung berücksichtigen können:

  • Die WD-Laufwerke waren RE (RAID Edition) Laufwerke, oder? Die zeitbegrenzte Fehlerkorrektur ist wichtig. Wenn Sie das nicht haben und das Laufwerk versucht, den Sektor wiederherzustellen, erhalten Sie eine lange Pause von diesem Laufwerk. Wenn der RAID-Controller geduldig ist und das Laufwerk nicht fallen lässt, haben Sie ein großes Problem mit Ihren Händen.

  • Überprüfen Sie die SMART-Daten auf den Laufwerken Sie haben entfernt und sehen, ob es etwas Interessantes gibt.

Ein weiterer Kommentar zur Bedeutung der zeitbegrenzten Fehlerbehebungsfunktion (TLER) von der NAS / RAID-Anbieterunterstützung:

Wie bereits erwähnt, empfehlen wir Kunden immer, Laufwerke auf Unternehmensebene zu verwenden, wenn sie die Laufwerke in RAID-Einstellungen verwenden. Laufwerke auf Unternehmensebene haben eine einheitlichere Antwortzeit, so dass das RAID sicherer ist. 


6
2018-04-30 16:42



nicht, aber sie hatten "RAID-spezifische zeitbegrenzte Fehlerbehebungs", wie hier auf der Registerkarte Specs gezeigt. newegg.com/Product/Product.aspx?Item=N82E16822136143 - Jeff Atwood
Ja, du hast die richtigen. (Beachten Sie die RE2 im Titel aufgeführt.) Das schießt diese Theorie! Natürlich würde ich immer noch die SMART-Daten überprüfen, nur für den Fall (ja, ich weiß, es ist selten nützlich) ... - TorgoGuy
Es stellt sich heraus, dass die Laufwerke doch irgendwie flockig waren. Brent Ozar erbte unsere alten Laufwerke und musste RMA mindestens einen von ihnen wegen Seltsamkeiten .. - Jeff Atwood
auch eine interessante Diskussion über die TLER-Funktion, die einige Anbieter als spezielles Software-Bit betrachten, das sie drehen, um die Laufwerke magisch "Enterprise" zu machen. fatwallet.com/forums/expired-deals/993547 - Jeff Atwood


Selbst für Nicht-RAID, normale Desktop-Festplatten, kann der Kauf von Laufwerken des Anbieters (bei dem zu erwartenden lächerlichen Markup) oft einen Unterschied machen. Zum Beispiel achtet Apple darauf, nur Laufwerke zu liefern, die tatsächlich dazu in der Lage sind zu Ehren von Mac OS X F_FULLSYNC  fcntl() Flagge, was einen großen Beitrag dazu leistet, dass Dinge wie ... Zeitmaschine Backups funktionieren zuverlässig.

Auch dies ist Plain Vanilla Desktop Verwenden Sie ohne RAID beteiligt. Etwas komplizierter als das und Sie wollen definitiv kaufen, wenn nicht die eigenen überteuerten Antriebe des Verkäufers, dann fahren Sie mindestens Modelle, die Sie sicher wissen, auf der "zugelassenen" Liste des Verkäufers.

Also, um deine Frage zu beantworten, ist es üblich? Ich würde sagen, ja, häufiger, als Sie vielleicht denken, sogar außerhalb des Unternehmensbereichs.


13
2018-04-30 12:41



Ich würde definitiv die Laufwerksmodelle erhalten, die der Verkäufer normalerweise verkauft, wenn Sie eine DIY-Laufwerksaktualisierung durchführen, um die Kosten zu senken. Ich würde auch empfehlen, keine Laufwerke (oder Controller) zu kaufen, mit denen das System gerade erst angefangen hat, zu liefern, so dass du nicht derjenige bist, der die Fehler findet! SATA scheint in dieser Hinsicht aus irgendeinem Grund flockiger als SAS zu sein ... - Christopher Edwards


Ich denke nicht, dass es an sich üblich ist. Sobald Sie jedoch Enterprise Storage Controller einsetzen, seien es nun SANs oder eigenständige RAID-Controller, sollten Sie im Allgemeinen die Kompatibilitätsliste genau einhalten.

Sie können vielleicht ein paar Dollars auf dem Aufkleberpreis sparen, indem Sie eine günstige Auswahl an Festplatten kaufen, aber das ist wahrscheinlich einer der letzten Bereiche, auf die ich Geld sparen möchte - angesichts der Wichtigkeit von Daten in den meisten Szenarien.

Mit anderen Worten, explizite Inkompatibilität ist sehr selten, aber explizite Kompatibilität Adhärenz ist empfehlenswert.


4
2018-04-30 07:56





Ich würde nicht davon träumen, SATA-Festplatten für einen Server zu verwenden - keiner von ihnen hat den erwarteten Arbeitszyklus eines Laufwerks mit Serverqualität und sie verfügen nicht über den umfangreichen Befehlssatz, den SCSI / SAS zur Überwachung der Laufwerksleistung und -gesundheit hat. Lenovo Server sind billig und großartig, wenn Sie viele Server haben, von denen keiner wirklich so wichtig ist, aber es gibt einen Grund, warum HPs Server der 300er Serie 40% des Marktes ausmachen - sie funktionieren. Insbesondere ihre 'SmartArray'-Festplattencontroller sind hinsichtlich Zuverlässigkeit und Leistung unübertroffen, und ihre Pre-Failure-Garantie ist eine willkommene Ergänzung. Nicht das billigste, aber wie viel ist deine Zeit wert? Ich habe ihre (gut Compaq ersten tbh) Server seit zwanzig Jahren gekauft und habe keinerlei Probleme, die 500-800 neuen, die ich pro Jahr kaufe, zu kaufen. Prüfe sie ernsthaft.


4
2018-05-04 22:51





Die Antwort lautet wie immer "es kommt darauf an".

Für bestimmte Enterprise-Speicher (z. B. EMC) wird der Anbieter Laufwerke spezifisch qualifizieren und sogar bis zum Laden benutzerdefinierter Firmware gehen.

Wie Mark sagt, finde ich es am besten, wenn Sie einer zugelassenen Liste eines Anbieters folgen, wenn es eine gibt. Die anfänglichen Kosteneinsparungen werden durch die Zeit aufgewogen, die damit verbracht wurde, Gremlins zu jagen.


2
2018-04-30 08:22



True, aber die "speziellen" Hitachi SATA-Laufwerke von Lenovo sind $ 250, und ich kann das gleiche Hitachi-Laufwerk für $ 60 kaufen. Das ist eine Differenz von fast 5x, mit anderen Worten: $ 1250 gegenüber $ 300. Ich bin bereit für ein großes Experiment zu experimentieren. - Jeff Atwood
Ich weiß, dass das Markup manchmal lächerlich ist, Sie sollten die Preise für EMC Laufwerke sehen! Aber es kommt darauf an, wie sehr Sie Ihre Daten schätzen. Zuverlässige Speicherung kostet $$$. Don MacAskill von Smugmug schwärmte von der Sun 7410 und das könnte etwas sein, das du ausprobieren möchtest. - Jauder Ho
Ich frage mich, ob es eine unterstützte 3ware-Karte gibt. Ich habe über die Jahre gute Erfahrungen mit ihnen gemacht. - Jauder Ho


Sie haben einen SAS-Controller, das könnte das Problem sein. Während das SAS-Protokoll zum Tunneln von ATA-Befehlen verwendet werden kann, ist die Signalisierung auf physikalischer Ebene etwas anders (SAS verwendet höhere Spannung und breitere Differenz). Fast alle Controller sind in der Lage, direkt mit SATA-Laufwerken zu sprechen, aber wenn es eine (große? Crappy?) Backplane in der Mitte gibt, kann das Signal gestört sein. In der Regel stecken in der Unternehmenswelt SATA-Treiber direkt zu einem SAS-Controller wird nicht offiziell unterstützt, sollten Sie ein Interposer (eine kleine Platine, die direkt an die Festplatte, die auf der einen Seite versteht das vollständige SAS-Protokoll, auf der anderen spricht ATA) - auf diese Weise die Backplane führt die höhere SAS Signalisierung).

Etwas verwandt: Das Mischen von SAS- und SATA-Laufwerken auf derselben Backplane neigt dazu, zu versagen, weil die Signalisierung aller Laufwerke (einschließlich SAS) auf SATA-Niveau verringert wird.


2
2018-05-04 14:49





Höchstwahrscheinlich Ihre WD-Laufwerke benötigen ein Firmware-Update. Sehen dieser IBM Hinweis zum Herunterladen und Anwenden des Updates. Wie du sehen kannst von der Anleitung, die WD-Laufwerke sind bei weitem nicht die einzigen mit Problemen.

Wenn Sie Ihre Laufwerke in eine Steuer-Server-Umgebung bringen, werden Sie sicherlich mehr Probleme haben als in einer typischen Desktop-Konfiguration.

Könnten Sie vielleicht einen Kommentar dazu abgeben, warum Sie sich für die Desktop-Klasse entschieden haben? Deskstar Reihe von Laufwerken anstelle der Enterprise / RAID-Klasse Ultrastar Serie? Sind Sie der Meinung, dass die zusätzlichen Kosten die zusätzliche Zuverlässigkeit und Geschwindigkeit nicht wert sind?


1
2018-06-01 08:12



wenn es um Festplatten geht, glaube ich an viele von ihnen - billig und leicht austauschbare Arrays, wo die Leistung von der Größe kommt. - Jeff Atwood
Seien Sie vorsichtig bei der Verwendung von Desktoplaufwerken mit Enterprise-Speichercontrollern. Laufwerke der Enterprise-Klasse unterstützen (normalerweise) Befehle und Anfragen, die auf Desktop-Laufwerken nicht verfügbar sind. Ein Unternehmensserver, den ich einmal geerbt hatte, verwendete Desktop-Laufwerke und sah häufige Fehler, als der Controller versuchte, die Laufwerkstemperatur und die Gesundheitsinformationen von den Laufwerken zu erhalten. Da Enterprise-Controller davon ausgehen, dass Sie Enterprise-Laufwerke verwenden, konnte der Controller ein Laufwerk, das nicht auf diese Anfragen reagiert hat, nicht ordnungsgemäß handhaben (da dies kein unterstütztes Setup war). Es ist alles sehr YMMV - bta


Als ein Ingenieur, der mit RAID-Controllern arbeitet, kann ich sagen, dass es für einige Marken von Laufwerken nicht ungewöhnlich ist, Probleme mit bestimmten RAID-Controllern zu haben. Jedes Laufwerk hat seine besonderen Eigenarten und jedes Laufwerksmodell, das in der Liste der "kompatiblen Geräte" des Controllers aufgeführt ist, wird vom Controller für seine Eigenheiten verantwortlich gemacht. Damit ein Antriebsmodell auf der Liste erscheint, muss es die Standards des Steuerungsherstellers für Leistung und Zuverlässigkeit erfüllen. Jedes Laufwerk, das nicht auf dieser Liste steht, könnte funktionieren, aber da es nicht die gleichen strengen Tests wie "zugelassene" Geräte durchlaufen hat, YMMV.

Insbesondere erlaubt das SATA-Protokoll herstellerspezifische (nicht standardisierte) Befehle, die vom Antrieb oder vom Controller definiert werden können. In Ihrem Fall sehen Sie möglicherweise einen Controller, der erwartet, dass ein Laufwerk auf einen bestimmten proprietären Befehl reagiert, oder ein Laufwerk, das einen proprietären Befehl erwartet, der nie ankommt.

Eine andere Möglichkeit besteht darin, dass sich Ihre problematischen Laufwerke unter bestimmten stressigen Arbeitslasten nicht gut verhalten, und das angezeigte Verhalten reicht aus, damit Adaptec / IBM dieses Laufwerksmodell nicht als unterstützt auflistet.

Leider sind Speicherprotokolle (SATA, SAS usw.) nicht so gut wie andere standardisierte Schnittstellen (USB, PCI, usw.), wo Sie nur einen Bus und ein Gerät benötigen, die die gleiche Sprache sprechen und alles in Ordnung ist. Besonders bei Enterprise-Geräten verbringen Gerätehersteller und Festplattenhersteller viel Zeit und Energie miteinander, um sicherzustellen, dass die Kunden die bestmögliche Leistung aus den Konfigurationen herausholen, die von den meisten Kunden verwendet werden "Unterstützte Geräte" Liste). Ein Laufwerk, das nicht auf dieser Liste steht, wurde möglicherweise so entwickelt, dass es mit einer anderen Controller-Marke optimal funktioniert, und die angezeigten Fehler sind ein Nebeneffekt der Optimierung.


0
2018-02-22 18:05