Frage Brauche ich RAID Fusion-io-Karten?


Kann ich zuverlässig mit einem einzigen laufen? Fusion-io Karte in einem Server installiert oder muss ich bereitstellen zwei Karten in einem Software-RAID-Setup? 

Fusion-io ist nicht sehr klar (fast irreführend) zu dem Thema bei der Überprüfung ihrer Marketing-Materialien Angesichts der Kosten der Karten bin ich gespannt, wie andere Ingenieure sie in realen Szenarien einsetzen.

Ich plane, das zu benutzen HP-Marke  Fusion-io iDrive2 1.2TB-Karte für eine proprietäre eigenständige Datenbanklösung, die unter Linux läuft. Dies ist ein Einzelserver-Setup ohne echte Hochverfügbarkeitsoption. Dort ist asynchrone Replikation mit einer 10-Minuten RPO Das spiegelt Transaktionsprotokolle auf einem zweiten physischen Server wider.

Traditionell würde ich ein High-End angeben HP ProLiant Server mit der obersten CPU für diese Anwendung. Ich muss zu SSD gehen, und ich kann Fusion-io zu einem niedrigeren Preis als Unternehmen SAS SSD für die erforderliche Kapazität erwerben.

  • Muss ich zwei ioDrive2-Karten laufen lassen und sie mit Software-RAID (md oder ZFS) verbinden, oder ist das unnötig?
  • Sollte ich mir Sorgen über einen Ausfall von Fusion-io machen, als wenn ich über einen Ausfall des RAID-Controllers oder einen Ausfall des Motherboards besorgt wäre?
  • Systemadministratoren mögen RAID. Erfordert dies eine andere Denkweise, angesichts der unterschiedlichen Schnittstelle und der auf der Karte verfügbaren Wear-Leveling / Fehlerkorrektur, die in diesem Formfaktor verfügbar ist?
  • Was IST die Ausfallrate dieser Geräte?

Bearbeiten: Ich lese gerade ein Fusion-io-Zuverlässigkeits-Whitepaper von Dell, und der Imbiss scheint zu sein "Fusion-io-Karten haben viele interne Redundanzen ... Mach dir keine Sorgen über RAID !!".


27
2017-07-15 01:48


Ursprung


Wird der Software-Raid und / oder der PCIe-Bus es sogar schaffen, mitzuhalten, wenn Sie das IOPS-Limit überschreiten? Ich habe ehrlich gesagt keine Ahnung, aber es ist einen Besuch wert. - pauska
Der PCIe-Bus wird mithalten. Das Software-RAID (wenn ich BRAUCHEN to) wird ZFS-basiert sein, also ist es in der Lage. Ich habe vorerst zwei Karten bestellt, aber die Fusion-io-Literatur scheint zu sagen: "Eine Karte ist gut genug". - ewwhite
Sogar ZFS muss CPU-Zyklen verwenden, um Daten zu spiegeln, so dass es Komplexität und Latenz hinzufügt - aber wie stark es Ihre spezifische Anwendung beeinflussen würde, ist unmöglich zu sagen. Fusion scheint sehr stolz auf ihre niedrigen CPU-Kosten auf der internen Spiegelung / Sicherung zu sein .. - pauska


Antworten:


Letztendlich kommt es auf Ihr Fehlermodell an. Was ist die Auswirkung eines Fehlers?

In der Vergangenheit haben wir immer alles überbucht, da die Kosten dafür vernachlässigbar waren. Weitere $ 500 für eine Festplatte zum Spiegeln? Total die Kosten wert, ohne es überhaupt in Betracht zu ziehen.

Wenn Sie über weitere 10 000 Euro sprechen, um die Spiegelung zu aktivieren, müssen Sie etwas mehr berücksichtigen.


Nein, du musst nicht spiegeln

Das Fusion-io Karten haben eine recht gute interne Redundanz. Dies ist nicht die Art von Hardware, bei der Ihre Festplatte ein einzelner Chip ist. In den meisten Situationen, in denen ich einen Fehler beobachtet habe, war es ein Firmware-Problem, das sich auf beide Mitglieder eines Spiegels auswirkte, so dass RAID keine Rolle gespielt hätte.

Stellen Sie sich eine Fusion-io-Karte als RAID-Controller mit Festplatten vor. Geht es Ihnen gut mit einem Setup mit nur einem Controller? Wahrscheinlich. Behandle es so.

In vielen Setups, in denen Sie Fusion-io-Laufwerke bereitstellen würden, sind andere Sicherheitsmechanismen integriert (Redundanz auf Knotenebene), sodass dies nicht sinnvoll ist.


Ja, du musst spiegeln

RAID erhöht Ihre Verfügbarkeit. Brauchen Sie trotz der Kosten absolute maximale Verfügbarkeit? Sind die Kosten für einen Ausfall und mögliche Ausfallzeiten teuer? Fahren Sie fort und spiegeln Sie die Laufwerke. In einem statistisch großen Setup werden trotz der internen Sicherheitsvorkehrungen Fehler in den Laufwerken auftreten.


16
2017-07-15 16:48



Aktualisieren: Ich habe die Fusion-io-Karten in den Installationen gespiegelt, in denen der Kunde mit den zusätzlichen Ausgaben einverstanden war (und um mir die Bereitstellung des Produkts zu erleichtern). Ich habe eine Reihe von Einzelkarteninstallationen in anderen Situationen installiert. Bis jetzt war alles in Ordnung ... - ewwhite


Die On-Device-Redundanz sollte bei Defekten der Flash-Chips genau funktionieren - analog zum RAID unter allen Komponenten, die tatsächlich Daten speichern.

Sollte ich mir Sorgen über einen Ausfall von Fusion-io machen, als wenn ich über einen Ausfall des RAID-Controllers oder einen Ausfall des Motherboards besorgt wäre?

Ein Ausfall des gesamten Geräts würde dem Verlust eines RAID-Controllers oder Motherboards ziemlich ähnlich sein - ich wäre ungefähr genauso besorgt über die Fusion-io-Karte wie diese anderen Single-Point-of-Failure-Komponenten, obwohl ich nicht weiß, Ich habe Erfahrung mit den Geräten in großem Maßstab, um Ausfallraten mit harten Daten vergleichen zu können.

Muss ich zwei ioDrive2-Karten laufen lassen und sie mit Software-RAID (md oder ZFS) verbinden, oder ist das unnötig?

Das Hinzufügen von Redundanz zusätzlich zu dem, was das Gerät bereits hat (z. B. Software-RAID unter mehreren Fusion-io-Karten) wäre ähnlich wie das Ausführen von Software-RAID zwischen zwei Hardware-RAID-Gruppen auf zwei verschiedenen RAID-Controllern; könnte sich für Systeme lohnen, die extreme Redundanz garantieren, um einen zusätzlichen Single Point of Failure zu entfernen, aber nicht für allgemeine Implementierungen (ein RPO von 10 Minuten auf einem Spiegel sollte für die meisten Anwendungen ausreichen?).

Sysadmins mögen RAID. Erfordert dies eine andere Denkweise, angesichts der unterschiedlichen Schnittstelle und der auf der Karte verfügbaren Wear-Leveling / Fehlerkorrektur, die in diesem Formfaktor verfügbar ist?

Ja ich glaube schon. Sie erhalten im Grunde ein Gerät, das wie ein RAID-Controller und eine Reihe von Speichergeräten in einem Paket ist. Es ist definitiv verlockend, sich Sorgen darüber zu machen, Ihre vertraulichen Daten auf einem einzigen Gerät zu speichern, aber man muss ein gewisses Maß an Vertrauen in die interne Redundanz des Geräts haben ... Was sollte mit einem gesunden Verständnis der "RAID ist kein Backup"Konzept: immer bereit sein für den Ausfall einer redundanten Komponente oder für einen Benutzer, um die Daten zu löschen, mit guten Backups.


18
2017-07-15 04:31





Wie Sie wissen, haben wir ihr Kit für eine Weile verwendet, sowohl für RAID- als auch für Nicht-RAID-Setups. Ich wünschte, ich hätte eine Ausfallerfahrung, aber ich habe es nicht. Wir hatten keine Ausfälle, bei denen RAID geholfen hätte und ihre On-Board-Ausfallsicherheitsfunktionen werden nur besser. Auch die Hauptfunktion, für die wir sie verwenden, ist jetzt horizontal skaliert / gruppiert, so dass wir noch weniger Grund haben, sie zu RAID zu machen. Tolle Karten, sehr zu empfehlen.


13
2017-07-15 08:26



Ein guter Datenpunkt. Ich kann jedoch nicht sagen, ob das Hinzufügen eines RAID-Layers übertrieben ist oder nicht. - ewwhite
Ich sehe die Technologie hier nicht als den entscheidenden Punkt an - entweder benötigen Ihre Daten die Fähigkeit, den Verlust einer einzelnen FusionIO-Karte zu unterstützen, oder sie tun es nicht - sie werden nur als schnell, teuer, Festplatten angesehen - das ändert nichts an Ihnen kann ohne RAID leben oder nicht richtig? - Chopper3
Leicht ... Ein traditioneller Ansatz wäre die Verwendung von Enterprise SAS SSDs in einem RAID 1 + 0. Hier wird nur der gleiche Standard verwendet, der für das Drehen von Festplatten auf SSDs verwendet wird. Das setzt aber auch Hot-Swappability voraus. Das trifft nicht auf eine PCIe-basierte Karte zu, insbesondere wenn ich dazu gezwungen wäre, Software-RAID zu verwenden. Da Fusion-io auch den Vorteil eines besseren Wear-Leveling und Monitoring bietet, versuche ich die realistischen Fehlermodi zu verstehen, die hier involviert sind. Behandle ich das Fusion-io wie eine Festplatte oder einen Controller? Sie würden nicht zwei Smart-Array-Karten in einen ProLiant legen, um interne Festplatten zu bedienen, oder? - ewwhite
@ewwhite Sie haben möglicherweise zwei RAID-Controller mit unterschiedlichen Festplatten und RAID1 zwischen den Festplatten der Controller, wenn Sie den Ausfall eines RAID-Controllers bewältigen müssen. Ich würde sagen, behandeln Sie die Fusion-io-Karte wie ein RAID-Controller in Bezug auf Ihre Redundanzplanung. - Shane Madden♦
@ewwhite Wenn du dir den Wortlaut anschaust, den ich benutzt habe, könntest du zwischen den Zeilen lesen, dass wir einen Ausfall auf einem einzigen mit FusionIO ausgestatteten Server hatten - wir hatten einen Mobo go Pop - einen DL580 G6 (wir haben sehr wenige davon) und so geschah mit einer ganzen Bank der Erinnerung und es nahm das Wer-Board heraus. In diesem Szenario war es RAID 1, aber offensichtlich war das egal. Bedenken Sie natürlich, dass PCIe können Hot-Swap-fähig sein, kann es eine massive Faff sein, aber es kann gut funktionieren. - Chopper3


Ich bin nicht direkt mit Fusion vertraut, aber ich habe einige PCIe-SSD-Erfahrungen, um damit zu arbeiten.

Die, mit denen ich arbeite, präsentieren dem Betriebssystem vier verschiedene LUNs und behandeln die PCIe-Karte wie einen HBA. Wenn ich RAID möchte, würde ich zwei LUNs zusammen mit dem Betriebssystem spiegeln. Dies ermöglicht mir eine Ein-Karten-Lösung für Redundanz. Wenn die Karte jedoch ausfällt, bin ich immer noch am Bach. Ich weiß nicht, ob ioDrive das Gleiche macht.


9
2017-07-15 02:14



Diese spezielle Einheit wird ein Blockgerät darstellen. - ewwhite
ioDrives präsentieren ein oder zwei unabhängige Geräte. Wenn zwei vorhanden sind, handelt es sich physikalisch um zwei separate Geräte auf einer Karte mit jeweils eigenem internen Schutz. Vergleichen Sie zum Beispiel mit dem Intel 910, der vier Geräte enthält, die jeweils als SSD behandelt werden sollen. - MikeyB


Ich habe in den letzten Monaten 6 der 1.2 TB Karten gekauft. Einer von ihnen ist bereits gescheitert. Also würde ich sie absolut überfallen. Ich habe windows active disk mirror benutzt. Das Laufwerk ist mit der Meldung "fehlende LEB-Karte" fehlgeschlagen. Mir wurde gesagt, dass es ausgetauscht werden müsste. Aber um die RMA-Genehmigung zu bekommen, müsste ich Fotos auf beiden Seiten der ausgefallenen Karte machen (was einen Produktionsausfall erfordert, um die Karte herauszunehmen). Und dann sagten sie mir, die Ersatzkarte sei ohne Eta nicht mehr vorrätig. Sie sollten also ziemlich gründlich überlegen, bevor Sie sie kaufen.


5
2017-07-02 17:29



Danke, dass Sie Ihre Erfahrungen geteilt haben. Ich ging voran und entfaltete diese 1,2 TB Karten in gespiegelten Paaren. Ich verwende HP-SKUs, daher habe ich meinen HP-Support-Vertrag, um RMA / Ersatz zu behandeln. - ewwhite