Frage Wann ist RAID die Mühe wert?


In unserem Shop verwenden wir RAID in allen unseren Workstations getreulich, wahrscheinlich nur, weil das so zu sein scheint, wie es gemacht werden sollte. Ich spreche über Workstations für wissenschaftliche Simulationen mit den integrierten RAID-Chips.

Aber ich habe eine Menge RAID-Horrorgeschichten gehört. Stackoverflow selbst hat eine Ausfall wird indirekt vom RAID-Controller verursacht.

RAID schützt Sie vor einer sehr engen Art von Fehlern - physischen Festplattenfehlern -, bringt aber gleichzeitig zusätzliche Fehlerquellen mit sich. Es kann Probleme mit dem RAID-Controller geben, und oft gibt es. Zumindest in unserem Laden scheint es, dass RAID-Controller mindestens so oft ausfallen wie Festplatten selbst. Sie können auch etwas mit dem Prozess des Austauschens eines fehlerhaften Laufwerks vermasseln.

Wann ist RAID die Mühe wert? Erhalten Sie keine bessere Rendite, indem Sie Ihren Backup-Lösungen mehr Redundanz hinzufügen? Welche Art von RAID ist in dieser Hinsicht besser oder schlechter?

Edit: Ich habe den Titel von der ursprünglichen "Ist RAID lohnt sich das Problem?", So klingt es weniger negativ


14
2018-05-30 18:34


Ursprung


Wenn Sie RAID auf Workstations verwenden, frage ich mich, was Sie unter RAID verstehen. Das RAID, das als Teil eines Motherboard-Chipsatzes der Desktop-Klasse ausgeliefert wird, ist nicht wirklich RAID. Real RAID ist eine teure (mehrere hundert, vielleicht tausende von Dollar) Option, die normalerweise als PCI-Karte eines Typs implementiert wird. Denken Sie Adaptec oder LSI, nicht versprechen. - Jason Tan
Sie haben recht, wir verwenden eine On-Board-Chipsatz-Lösung. Vielleicht sollte meine Frage ein bisschen geändert werden: Ist RAID-RAID die Mühe wert? - amarillion
Siehe auch: Was sind die weit verbreiteten RAID-Level und wann sollte ich sie berücksichtigen? - voretaq7


Antworten:


Keine Sorge, RAID wird in der Geschäftswelt aufgrund von Gruppendenken nicht verwendet! Die Chance, dass vernünftige RAID-Controller ausfallen, ist weit, weit niedriger als die Wahrscheinlichkeit eines Plattenfehlers. Ich kann mich nicht erinnern, jemals einen RAID-Controller im wirklichen Leben gescheitert zu haben, während ich viele Plattenwürfel sowohl im Büro als auch im Rechenzentrum gesehen habe.

PS: Ich sehe deine Tags. RAID ist kein Backup! :)


17
2018-05-30 18:45



Richtig, es ist kein Backup. Also ist es Redundanz? Es geht also wirklich um hohe Betriebszeiten? Wenn Sie nicht fünf Neunen benötigen, brauchen Sie RAID nicht wirklich? - amarillion
Nein, es geht um die Verfügbarkeit. Die Maschine herunterzunehmen, wenn Sie wollen, ist in Ordnung. Mit einer einzigen Festplatte entscheiden Sie, Ihre Maschine nicht zu nehmen ist nicht. Die ordnungsgemäße Verwendung von RAID verhindert dies. - Matt Simmons
@amarillion. Wow, das ist ein gefährliches Gefühl. Wie viel Erfahrung mit Festplatten haben Sie? RAID ist für gerade sogar erforderlich 2 Zuverlässigkeit (mehr, je mehr Festplatten in der Mischung sind), und RAID allein wird Sie definitiv nicht auf fünf Cent bringen. Dafür werden Sie zumindest redundante Rechenzentren brauchen. Selbst dann ist es ein Crapshoot, 5 Nines ist Management Fantasy Land BS, das ist weniger als eine Stunde Ausfallzeit pro Jahrzehnt (~ 5 min / Jahr). Nicht einmal IP-Backbones haben das. - Wedge
@amarillion: Einige meiner Kunden haben Entwickler vor Ort, die $ 200 pro Stunde berechnen. Oder Arbeiter, die auf Leben oder Tod reagieren. Diese Arbeiter für eine $ 80 Festplatte zu stören scheint für mich irgendwie dumm zu sein, YMMV. - duffbeer703
Nein. RAID schützt Sie vor Festplattenfehlern. Es schützt Sie nicht vor 'rm -rf /'. Dafür gibt es Backups! - Alex J


ZFS von SUN (ebenfalls Teil von OpenSolaris; Apples OSX - derzeit nur lesbar) führt nicht nur einen Raid mit verschiedenen Ebenen durch, sondern prüft immer, ob die auf die Platte geschriebenen Daten tatsächlich da sind. Konsistenz ist der Schlüssel! RAID ist nutzlos, wenn Sie sich nicht darauf verlassen können Integrität. Wählen Sie einen anständigen RAID-Controller (ich bevorzuge HPs) und schrubben Sie Ihr RAID, um regelmäßig Fehler zu finden.

SoftwareRaid (als ZFS) hingegen bringt Ihnen mehr Hardware-unabhängig, wenn der RAID-Controller ausfällt und Sie keinen exakten Ersatz erhalten.


9
2018-05-30 19:10





Immer. Festplatten sind billig, Ihre Informationen nicht. Verwenden Sie jedoch Software-RAID, damit Sie später flexibel vorgehen oder die Hardware wechseln können (vertrauen Sie mir, Sie werden es brauchen). Verwenden Sie auch ein Prüfsummen-Dateisystem wie ZFS, um sich gegen stille Datenkorruption zu schützen (was bei großen Festplatten heutzutage sehr wahrscheinlich ist).


8
2018-05-31 01:02





Für diejenigen von euch, die sagen, dass Sie kein Hardware-RAID verwenden werden, denn wenn der Controller ausfällt und Sie keinen Ersatz bekommen, dann sind Sie auf dem falschen Weg.

  1. Wenn die Verfügbarkeit für Sie so wichtig ist, sollten Sie KEINE billige Hardware kaufen. Wie bereits erwähnt, verwenden Sie einen guten Raid-Controller, HP, LSI, Dell usw.

  2. Wenn der Controller vom Computerhersteller, dh Dell Server, mit Dell RAID-Controller gekauft wurde, wird Dell Ihnen sagen, wie lange diese Teile in der Regel in den 4+ Jahren ab dem EOL dieses Servers gelagert werden.

  3. Wenn jemand schnell wieder läuft, bedeutet das, dass Sie nicht auf die Lieferung warten können, dann sollten Sie einen zweiten Ersatz-Controller für sich selbst kaufen, unabhängig davon, wer ihn gemacht hat.

  4. Wenn Sie als RAID 1 eingerichtet haben, können Sie manchmal dieses eine dieser Laufwerke nehmen und auf einem normalen Controller ablegen, um die Daten wiederherzustellen. Wenn das für Sie wichtig ist, bestätigen Sie dies mit Ihrem Controller, bevor Sie sich in einer kritischen Situation befinden.

Hardware-RAID speicherte meinen Hintern 2x. Sobald auf einem E-Mail-Server eines der Laufwerke fehlschlug, erhielt ich die E-Mail-Benachrichtigung von der Raid-Überwachungssoftware auf dieser Maschine, rief dell an und hatte am nächsten Tag eine neue Festplatte, poppte sie ein und baute sie ganz von alleine auf. ZERO Ausfallzeit auf diesem

Der zweite Fehler war, dass ein Laufwerk in einem alten Dateiserver fehlschlug, der innerhalb von 6 Monaten ausgetauscht werden sollte. Der Controller hat es weiter laufen lassen und wir haben den Serverwechsel auf diese Woche verschoben. Gespeichert Kauf einer neuen Festplatte (da es aus der Garantie war) und wieder NULL Ausfallzeiten.

Ich habe zuvor Software-Raids verwendet und sie sind nicht so gut wie hardware-basiert. Sie müssen Ihr Setup, Software oder Hardware testen, um sicher zu sein, dass es funktioniert und wissen, was zu tun ist, wenn das braune Zeug den Fan trifft.


8
2018-05-31 08:01



Menschen neigen dazu, RAID als eine Art von Versicherung zu betrachten. Wenn sie keinen "Unfall" bekommen, dann scheinen die Vorteile von RAID (Versicherung) nie offensichtlich. Danke, dass du deine Geschichte geteilt hast, da viele Leute (denke ich) RAID leicht nehmen, denn wenn sie nie eine schlechte Erfahrung haben, warum in etwas investieren, das vielleicht nicht passiert? Dies sollte eine Lektion für alle sein, die lesen: Ein solider Hardware-RAID-Controller wird Ihren Arsch in diesem eine in einer Million / Milliarden Chancen speichern. Überlassen Sie es nicht dem Zufall; Verwenden Sie immer einen guten Hardware-RAID-Controller speziell für Server. - osij2is


Festplattenausfälle sind in einem Server viel wahrscheinlicher als auf einer Desktop-Workstation ...

Sie können nicht einfach "mehr Fehlerpunkte hinzufügen" sagen, ohne die Wahrscheinlichkeit dieses Fehlers zu berücksichtigen. Vor allem, da diese weniger wahrscheinlichen Fehlerpunkte speziell vorhanden sind, um den wahrscheinlichen Festplattencrash zu untergraben. Wie Sie es formuliert haben, haben Sie im Grunde eine erstellt Pascal's Wettewie Trugschluss.

Die meisten RAID-Systeme auf Desktop-Motherboards sind billige Software / Hardware-Hybride mit dem größten Teil der Arbeit in ihrem Softwaretreiber. IMHO sind sie Mist, die benutzt werden, um Power-User zu verkaufen.

Auf der anderen Seite ist ein gutes Hardware-RAID recht zuverlässig, und es hat die Hardware, um sein Ding ohne (trotz?) Des Betriebssystems zu erledigen. Aber diese werden teuer, weil echte Hardware normalerweise Batterie-Backups und ein vollständiges XOR-Array zum Berechnen von Prüfsummen usw. hat. Noch teurer, wenn es mit SCSI gemacht wird.

Zusammenfassung: Wenn Sie die Motherboard-basierten RAID-Systeme ausführen, dann ist es nicht die Mühe wert.


6
2018-05-30 19:34



Ein Kollege betreibt eine große Schul-IT-Umgebung mit 180.000 Arbeitsplätzen und einem erstklassigen Helpdesk. 7% ihrer Desktops erfordern einen Hardwaretausch innerhalb ihres 5-jährigen Lebenszyklus, und 85% dieser Ersetzungen sind Festplatten. - duffbeer703
Ja, aber wenn eine Workstation ausfällt, melden Sie sich einfach bei einem anderen Rechner an, während Sie den beschädigten Rechner reparieren. Bei so vielen Workstations sollte es sich um eine zentrale Dateirepo handeln. Ich frage mich, wie die Statistik mit 180.000 Servern aussehen würde. - Ape-inago
Du hast Recht für viele Umstände - aber nicht für alle. Im Szenario meines Freundes befinden sich viele dieser PCs im Klassenzimmer, und wenn sie kaputt sind, hat diese Klasse keinen Computer und das ist eine große Sache. Bei meiner Arbeit haben wir Ersatzarbeitsplätze und kümmern uns nicht wirklich darum. - duffbeer703


Obwohl Backups und RAID Lösungen für verschiedene Probleme sind, sind die meisten "RAID-Probleme" dem häufigsten Backup-Problem sehr ähnlich (dh niemand testet eine Wiederherstellung) - niemand testet die Systemwiederherstellung. Andere RAID-Probleme sind oft ein direktes Ergebnis von Menschen, die nicht verstehen, was sie tun und was nicht. Zum Beispiel glauben viele Leute, dass RAID die Integrität ihrer Daten garantiert - es nicht.

Wenn Sie bei Workstations RAID-0 verwenden, um die Leistung von E / A-gebundenen Anwendungen zu verbessern, oder RAID-1/5/6 bei 100 $ pro Stunde arbeiten, wenn ihre 80-Dollar-Festplatte ausfällt, verwenden Sie RAID entsprechend. Nur nicht verwechseln Festplattenredundanz mit Sicherungund haben Verfahren getestet, um sicherzustellen, dass Ihre IT-Mitarbeiter die Wiederherstellung durchführen.


5
2018-05-31 01:18



Gute Anmerkung für Arbeitsplätze. Arbeitsstationsanforderungen sind völlig anders als Serveranforderungen. Und ein nachdrücklich ja auf "..verwechsle Disk-Redundanz nicht mit Backup". - osij2is


Es gibt zwei Arten von RAID

  • Eine, die billig integriert ist. Dies ist KEINE echte Razzia, die eigentliche Arbeit wird von der Software erledigt (spezieller Treiber, der die Raid-Berechnungen durchführt). Sie sollten dies vermeiden.
  • Der andere ist teuer, aber was du bekommst, ist ein echter Raid. Wenn Sie sich das leisten können, ist es das Geld wert.

Einige Betriebssysteme haben eine gute Software-Raid-Lösung (das hat nichts mit den oben erwähnten kaputten Karten zu tun). Linux-Software Raid ist besonders gut, seine Leistung ist wirklich gut.

Raid kann nur die Zuverlässigkeit verbessern, es ist keine Backup-Lösung. Dateien können versehentlich gelöscht werden, fehlerhafte Datenträger können fehlerhafte Daten auf andere Datenträger in einem RAID-Array zurückgeben (und duplizieren), sodass eine echte Sicherungslösung weiterhin benötigt wird.


4
2018-05-30 21:48





RAID eignet sich hervorragend für die Betriebszeit, ersetzt jedoch nicht die Sicherung. Wie ein Kollege einmal bemerkte: "Du weißt, dass 'Oh, sh! T' Moment, wenn du etwas versehentlich gelöscht hast? RAID bedeutet nur, dass du zu 'Oh, sh! T' mehr als einer Fahrt zur gleichen Zeit kommst."

Das heißt, an dem Tag, an dem du deinen Kopf in das Büro deines Chefs steckst und ihr sagst: "Übrigens, der Datenbankserver hatte letzte Nacht einen Festplattencrash - wir sind nie runtergegangen, es hat um 5 Uhr morgens den Umbau auf das Ersatzgerät beendet Ich habe das schlechte Laufwerk unter Garantie ausgesandt "- dann ist RAID unbezahlbar.


4
2018-06-06 03:22