Frage Können "Enterprise" -Laufwerke in einigen Situationen sicher durch Near / Midline ersetzt werden?


Bei der Spezifikation von Servern, so wie ich annehme, viele Ingenieure, die keine Experten für Speicher sind, werde ich im Allgemeinen auf Nummer sicher gehen (und vielleicht ein Sklave des Marketings sein), indem ich auf mindestens 10k SAS-Laufwerke standardisiere (und daher " Enterprise- "-grade mit einem 24x7 Arbeitszyklus, etc.) für" System "-Daten (in der Regel Betriebssystem und manchmal apps), und reservieren Sie die Verwendung von 7,2 k Mid / Nearline-Laufwerke für die Speicherung von Nicht-System-Daten, wo die Leistung ist nicht von Bedeutung Faktor. Dies ist alles unter der Annahme von 2,5 "(SFF) -Disketten, da 3,5" (LFF) -Disks nur für hohe Kapazität, niedrige IOPs-Anforderungen wirklich relevant sind.

In Situationen, in denen nicht viele Nicht-Systemdaten vorhanden sind, platziere ich diese im Allgemeinen auf den gleichen Platten / Arrays wie die Systemdaten. Das bedeutet, dass der Server nur 10k SAS-Laufwerke hat (im Allgemeinen ein "One Big RAID10" -Typ) Setup in diesen Tagen). Nur wenn die Größe der Nicht-Systemdaten signifikant ist, erwäge ich normalerweise, sie auf ein separates Array von 7,2k Mid / Nearline-Festplatten zu setzen, um die Kosten / GB niedrig zu halten.

Das hat mich dazu gebracht, mich zu wundern: in einigen Situationen konnten diese 10k-Festplatten im RAID10-Array durch 7,2k-Festplatten ohne signifikante negative Konsequenzen ersetzt werden? Mit anderen Worten, bin ich manchmal überspezifizierend (und halte die Hardware-Verkäufer glücklich), indem ich mich auf ein Minimum von 10k "Enterprise" -Grundscheiben festhalte, oder gibt es einen guten Grund, mich immer daran zu halten?

Nehmen Sie zum Beispiel einen Server, der als Hypervisor fungiert, mit ein paar VMs für ein typisches kleines Unternehmen (sagen wir 50 Benutzer). Das Unternehmen verfügt über durchschnittliche E / A-Muster ohne besondere Anforderungen. Typisch 9-5, Mo-Fr-Büro, mit Backups, die für ein paar Stunden pro Nacht laufen. Die VMs könnten vielleicht ein DC- und ein Datei / Print / App-Server sein. Der Server verfügt über ein RAID10-Array mit 6 Festplatten zum Speichern aller Daten (System- und Nicht-Systemdaten). Für meinen Nicht-Experten sieht es so aus, als könnten Mid / Nearline-Festplatten gut funktionieren. Nehmen Sie HP Festplatten als Beispiel:

  • Workload: Midline-Festplatten sind für <40% Workload ausgelegt. Da das Büro nur 9 Stunden am Tag geöffnet ist und die durchschnittliche I / O-Leistung in diesem Zeitraum wahrscheinlich nicht annähernd den Höchstwert erreicht, scheint die Arbeitslast über 40% zu liegen. Selbst mit ein paar Stunden intensiven I / O-Backups in der Nacht, würde ich sagen, dass es immer noch unter 40% liegen würde.
  • Geschwindigkeit: Obwohl die Festplatten nur 7,2 KB groß sind, wird die Leistung durch die Verteilung auf sechs Festplatten verbessert

Also, meine Frage: ist es sinnvoll, mindestens 10k SAS-Laufwerke zu kleben, oder sind 7,2k Midline / Nearline-Festplatten in vielen Situationen tatsächlich mehr als ausreichend? Wenn ja, wie kann ich feststellen, wo die Linie ist und vermeiden, ein Sklave der Ignoranz zu sein, indem ich auf Nummer Sicher gehe?

Meine Erfahrung ist hauptsächlich mit HP Servern, also kann das oben genannte ein bisschen eine Neigung zu HP haben, aber ich würde annehmen, dass die Prinzipien ziemlich vom Verkäufer unabhängig sind.


21
2018-01-17 22:02


Ursprung


SFF 7.2k Midline-Festplatten sind aufgrund von Kapazitäts- und Leistungsbeschränkungen nicht sinnvoll. Wenn Sie über HP Geräte sprechen (meine Spezialität), 900GB und 1.2TB 10k SAS-Laufwerke sind die beste Option, wenn Sie keine SSDs verwenden. Wenn Sie in den USA sind, sollte 900GB SAS ~ 300-400 sein, wenn Sie einen guten Anbieter haben. - ewwhite
Geringfügige grammatikalische Beschwerde: Wenn Sie "X für Y ersetzen" sagen, bedeutet das, dass Sie Y hatten, um damit zu beginnen und es durch X zu ersetzen. - pjc50
Sicher, du lebst 2015? Weil mein OS-Laufwerk seit einigen Jahren eine kleine SSD ist (spart Strom etc.) und ich würde keine HD für hohe Leistung berühren. - TomTom
@TomTom Nein, ich bin 2016 :) In aller Ernsthaftigkeit habe ich es nicht wirklich überlegt. Wie ich in meinem Post gesagt habe, werde ich heutzutage generell einen "Ein-Big-RAID-10" -Ansatz verfolgen, also wird das Betriebssystem dort weitergehen. Das Betriebssystem auf eine separate SSD zu trennen, erscheint verschwenderisch, wenn es nicht wirklich notwendig ist. Es würde mich interessieren, deine Gedanken zu hören. Würden Sie eine einzelne SSD oder ein gespiegeltes Paar verwenden? Vielleicht wäre das eine gute SF-Frage für sich ... - dbr
Gespiegeltes Paar für OS. HP verkauft sogar OS / bootspezifische SSDs. - ewwhite


Antworten:


Hier gibt es eine interessante Überschneidung von Serverdesign, Festplattentechnologie und Wirtschaftlichkeit:

Siehe auch: Warum sind Large Form Factor (LFF) -Disks immer noch weit verbreitet?

  • Die Umstellung auf dichte Rackmount- und Small Form-Factor-Server. Z.B. Sie sehen nicht mehr viele Tower-Angebote von den großen Herstellern, während die dichteren Produktlinien häufiger Revisionen und mehr Optionen / Verfügbarkeit haben.
  • Stagnation in 3,5 "Enterprise (15k) Festplattenentwicklung - 600GB 15k 3.5" ist ungefähr so ​​groß, wie Sie gehen können.
  • Langsame Weiterentwicklung in 2,5 "Near-Line (7,2 k) Festplattenkapazitäten - 2 TB ist die größte, die Sie dort finden.
  • Erhöhte Verfügbarkeit und niedrigere Preise für SSDs mit hoher Kapazität.
  • Speicherkonsolidierung auf freigegebenen Speicher Einzelserver-Workloads, die eine hohe Kapazität erfordern, können manchmal über SAN gewartet werden.
  • Die Reifung von All-Flash- und Hybrid-Speicher-Arrays sowie der Zustrom von Storage-Startups.

Aus diesem Grund finden Sie im Allgemeinen Hersteller, die sich auf 1U / 2U-Server mit 8-24 2,5-Zoll-Laufwerkschächten konzentrieren.

3,5-Zoll-Festplatten eignen sich für Anwendungsfälle mit geringer Auslastung (2 TB +). Sie eignen sich am besten für externe Speichergehäuse oder SAN-Speicher mit Caching-Funktion. In Unternehmensgeschwindigkeiten von 15.000 U / min sind sie nur bis zu 600 GB verfügbar.

2.5 "10k RPM rotierende Festplatten sind für höhere IOPS-Anforderungen und sind in der Regel bis zu 1,8 TB Kapazität verfügbar.

2,5 "7,2 k RPM rotierende Festplatten sind ein schlechter Ruf, da sie weder Kapazität, Leistung, Langlebigkeit noch Preisvorteile bieten. ZB Die Kosten für ein 900GB SAS 10k Laufwerk sind sehr ähnlich denen eines 1TB 7,2k RPM SAS. Angesichts des kleinen Preises Unterschied, das 900GB Laufwerk ist der bessere Kauf. Im Beispiel von 1,8 TB 10k SAS gegen 2.0TB 7.2k SASDie Preise sind auch sehr nah. Die Garantien sind 3 Jahre bzw. 1 Jahr.

Verwenden Sie für Server und internen 2,5 "-Speicher SSD oder 10k. Wenn Sie Kapazitätsbedarf haben und interne oder externe 3,5-Zoll-Laufwerkseinschübe zur Verfügung haben, verwenden Sie 7,2 km / min.

Für die beschriebenen Anwendungsfälle werden die Server nicht überkonfiguriert. Wenn sie 2,5 "Laufwerkschächte haben, sollten Sie wirklich nur 10k SAS oder SSD verwenden. Die Mittellinien Festplatten sind ein Verlust an Leistung, Kapazität, haben eine deutlich kürzere Garantie und wird nicht viel kosten sparen.


25
2018-01-17 22:22



Danke, dass Sie sich die Zeit genommen haben, dies zusammen zu stellen. Ich werde morgen Gelegenheit haben, es gründlich zu überdenken. Wenn man sich nur die Preise anschaut, sieht es nach einem 30% igen Sprung zwischen 1TB 7,2k und 900GB 10k aus, was nicht massiv ist (ich bin in Großbritannien, wenn es darauf ankommt). Könnte ein Faktor sein, wenn Sie mit einem knappen Budget sind, obwohl Sie versuchen, an mehreren Stellen vernünftige Einsparungen zu machen, und Festplattenauswahl ist nur einer von ihnen. Es würde mich interessieren, was Sie über die Frage auch aus rein technischer Sicht denken. - dbr
Aus technischer Sicht gibt es keinen Vorteil für eine 7200-RPM-2,5-Zoll-Disk. Wenn die Kosten zu weit weg erscheinen, sollten Sie einkaufen. Es gibt kaum Unterschiede in diesem Markt. Wenn dies für Boot-Disk-Zwecke ist, ist SSD eine gute Alternative Ich kann mir keinen Grund vorstellen, warum ich heute eine HP 7200 2,5 "Festplatte in einem Server verwenden würde. Lesen Sie auch Ihre HP Quickspecs genau. Midline-Laufwerk haben kürzere Garantien. - ewwhite
Im Allgemeinen ist diese Antwort großartig. Aber wie bei allem anderen "hängt es davon ab." In dem Beispiel einer 900GB 10k vs 1TB 7200 Disk wird die 1TB Disk kühler laufen und deshalb vielleicht länger dauern, und wird weniger teuer sein. Wenn Sie die zusätzliche Leistung nicht benötigen, ist es eine Geldverschwendung, sowohl die ursprünglichen Kapitalkosten als auch die Betriebskosten. Für einen Server spielt das keine Rolle. Für 10 beginnt es sich zu summieren. - Dan Pritts
Wirklich die Scheibe, die langsamer läuft, dauert länger? Irgendein Artikel, den ich vermisse? - vasin1987
Aus der Sicht eines Herstellers / Herstellers, ja. Sie sind Lenkung Sie zu 10k und SSD für 2,5 ". Wenn Sie weiß-Boxen waren, gehen Sie 7200 RPM. In der Tat, meine ZFS Storage-Anbieter, PogoSpeicherVerwenden Sie 7200 RPM 2,5 "für ihre ZFS-Arrays, da das Caching und das SSD-Tiering die Notwendigkeit zur Spezifikation schnellerer Festplatten überflüssig machen. - ewwhite


Es gibt zumindest ein paar Dinge könnte Probleme mit einigen Laufwerkstypen verursachen:

  • Laufwerke, die nicht für die Vibrationsbelastung eines Chassis mit vielen Laufwerken ausgelegt sind (unwahrscheinliches Problem mit einem als RAID / NAS-fähigen Laufwerk)

  • Firmware, die TLER nicht erlaubt oder eine zeitaufwendige manuelle Neukonfiguration des Laufwerks benötigt, um es zu aktivieren (dito)

  • Laufwerke, die noch nie mit dem verwendeten RAID-Controller getestet wurden, und möglicherweise nicht erkannte Bugs, die in einem solchen Setup auftauchen

  • Interne Laufwerkschreibcaches, die sich so verhalten (physikalisches Schreiben ist nicht in Ordnung oder sehr verzögert), was bei einem harten Herunterfahren zu Verwirrung führt (der RAID-Controller sollte so konfiguriert sein, dass er ausgeschaltet wird.) Mögliches Problem, wenn die Firmware jemals ignoriert werden sollte Das. Siehe nicht getestete Laufwerke :)

  • Laufwerk führt möglicherweise gelegentlich interne Wartungsroutinen durch, die dazu führen können, dass sich das Laufwerk langsam verhält oder mit einer ausreichenden Verzögerung reagiert, damit der RAID-Controller denkt, dass ein Fehler aufgetreten ist (bezogen auf TLER)

  • SATA im Allgemeinen, wie es normalerweise implementiert wird, hat im Vergleich zu SAS weniger Sicherheitsvorkehrungen gegen ein Laufwerk mit vollständig geschossener oder aufgehängter Elektronik alles auf dem Controller (kein theoretisches Risiko, bestimmte Disk + Controller Markenkombinationen lieben diesen Fehlermodus).


5
2018-01-18 00:37



Dies scheint Gründe dafür zu sein, Laufwerke zu verwenden, die mit der Serverhardware und dem Anwendungsstapel qualifiziert sind, aber nicht speziell mit 10k vs 7k2 rpm. - poolie
Die Frage kann leicht (falsch?) Verstanden werden für "kann eine Nicht-Enterprise-7,2-k-Festplatte oder eine, die für Single-Drive-Enterprise-Nutzung bestimmt ist, in der Anwendung verwendet werden?". Und "sicher" würde normalerweise das Risiko von Datenverlusten oder ausfallbedingten Ausfallzeiten beinhalten. - rackandboneman


ENORM Problem:

(Kann ein bisschen abseits des Themas sein - aber ich wichtig!)

Wenn Sie mit SSDs zu tun haben - (wie es oft der Fall ist oder entweder der Fall oder die Versuchung sein kann) - a Menge von SSDs haben ein unangenehmes Problem, wo sie sich nicht immer von spontanen Stromausfällen erholen können!

Das ist ein winzig Problem mit Festplatten. HDDs haben normalerweise genug Kapazität, um ihre Logik zu betreiben, und genug Drehimpuls, um die Platten zu tragen, indem sie einen 512-Byte-Block schreiben - für den Fall, dass die Energie während des Schreibens verloren geht. Einmal in einem Selten während, das wird nicht Arbeit, was zu etwas führt, das als "zerrissener Schreibvorgang" bezeichnet wird - wobei ein einzelner Block teilweise geschrieben sein kann. Das partielle Schreiben (selten) wird einen Prüfsummenfehler in dem Block verursachen, d. H. Dieser einzelne Block wird schlecht sein. Dies kann normalerweise von der Plattenschaltung selbst als schlecht erkannt und durch den vorgeschalteten RAID-Controller korrigiert werden.

SSDs sind ein anderes Tier. Die meist implementieren etwas namens "Wear Leveling" - wo sie nicht nur "Block X" an einen physischen Ort für "Block X" schreiben, wie eine HDD tut. Stattdessen versuchen sie zu schreiben Unterschied Orte auf dem Flash-Medium - und sie versuchen zu schreiben oder zu kombinieren (mit ein wenig Pufferung). Das Schreiben an die verschiedenen Orte beinhaltet das Führen einer "Landkarte", wo Dinge geschrieben werden, die ebenfalls gepuffert und auf eine Weise geschrieben wird, die das Abnutzungsleveln reduzieren soll. Ein Teil des Wear-Levels kann sogar das Verschieben von Daten beinhalten, die bereits auf dem Gerät sind und nicht einmal vor kurzem geschrieben wurden.

Dieses Problem besteht darin, dass wenn die SSD an Strom verliert - sie hat viele Daten im Speicher (unflushed), sie hat einige Daten, die an verschiedene / geänderte Speicherorte geschrieben wurden - und sie müssen diese Karten in ihrem eigenen Speicher haben Ausgespült, um einen Überblick über die Struktur aller Daten auf dem Gerät zu erhalten.

VIELE SSDs verfügen nicht über die Logik oder den Schaltkreis, um ihre Controller lange genug bei Spontan-Power-out aufrecht zu erhalten, um alle diese Daten sicher in den Flash zu speichern, bevor sie absterben. Das bedeutet nicht nur, dass dieser eine Block, den du geschrieben hast, jetzt in jeprody sein könnte - aber auch andere Blöcke - sogar alles Die Blöcke auf dem Gerät könnten in Schwierigkeiten geraten. Viele Geräte haben auch Probleme, wo sie nicht nur verlieren alles die Daten auf dem Gerät, aber das Gerät selbst wird gemauert und unbrauchbar.

Das ist alles wahre Theorie - aber (arbeiten in der Speicherindustrie) - ich / wir haben gesehen, dass dies viel zu oft auf viel zu vielen Geräten passiert ist - auch in einigen unserer eigenen, persönlichen Laptops!

Viele Anbieter haben die Entwicklung von "Enterprise-SSDs" diskutiert, bei denen die Geräte ("Super-Caps") und andere Schaltungen speziell hinzugefügt wurden, um einen sauberen "Flush" zu ermöglichen - aber es ist sehr sehr schwierig, ein Gerät zu finden speziell gibt als Teil des Datenblattes an, dass es einen ausreichenden, expliziten, getesteten Schutz vor solchen Ereignissen hat und vor solchen Ereignissen schützt.

Offensichtlich, wenn Sie ein "High-End-Speicher-Array" von einem Top-Tier-Anbieter kaufen, der Flash-Technologie verwendet, entweder ihre Laufwerke - oder ihr System insgesamt wurde mit all dem in Rechnung gestellt. Stellen Sie sicher, dass es hat!

Das Problem in Bezug auf Ihre Frage ist: Wenn Sie ein RAID-Array haben - und mehrere der Festplatten sind die "schlechten" SSDs ohne diesen Schutz - wenn Sie einen "spontanen Stromausfall" bekommen - könnten Sie verlieren ALLES die Daten auf MEHRERE Festplatten Rendering RAID-Rekonstruktion unmöglich.

"Aber ich benutze eine UPS"

Es ist auch wichtig zu beachten, dass "spontaner Stromausfall" Situationen wie BSOD und Kernel Locks / Crashs / ​​Panics beinhalten kann - wo Sie keine Möglichkeit haben sich zu erholen, um den Stecker auf das System zu ziehen.


4
2018-01-18 19:26



Es ist selten, dass jemand den Stecker eines aufgehängten Systems (es sei denn, es wird die Festplatte entsorgt) schnell genug zieht, um nicht zu erlauben, dass irgendwelche Festplatten ihre Caches spülen. Und in diesem Fall können herkömmliche HDDs mit aktivierten Cachespeichern das gleiche Durcheinander erzeugen, wenn auch mit einer geringeren Chance auf eine Datenverfälschung - aber Reiserfs, früher NTFS, haben sie daraus gedreht, weil sie Journaldaten verarbeitet haben für eine Aktivität geschrieben werden, die nicht wirklich passierte (oder umgekehrt, beide wahrscheinlich mit Cachespülung außerhalb der Reihenfolge) SEHR schlecht. - rackandboneman
Eine ordnungsgemäß gestaltete SSD beschädigt oder verliert keine Daten, wenn die Daten nicht vollständig gelöscht wurden. Da sich der physische Standort jedes logischen Sektors bei jedem Schreiben ändern kann, sollte die vorherige Version der Daten in jedem logischen Sektor noch vorhanden sein, falls das Update noch nicht geleert wurde. Sie können weiterhin Daten verlieren, wenn die Firmware an Konstruktionsfehlern oder Implementierungsfehlern leidet. - kasperd
@Kasperd Consumer-SSDs werden auf Geschwindigkeitsbasis verkauft, sie machen Kompromisse, um das zu tun. Während es möglich sein sollte, Integrität so zu halten, wie Sie es vorschlagen, ist Tatsache, dass die meisten Hersteller (zumindest auf Kundenebene) einfach nicht fahren. Auch wenn sie EoL erreichen, scheitern die meisten nicht anmutig. - JamesRyan
@JamesRyan Geschichten über Hersteller, die mit dem Durchspülen von Daten zum beständigen Speicher betrügen, um in etwas Leistungsmaß besser herauszukommen, sind nicht neu. Wir haben davon gehört, dass dies auch in den Tagen der Festplatten passiert ist. Es ist nicht, weil die Verbraucher das wollen. Das liegt daran, dass die Verbraucher nur einige der Messwerte sehen und nicht wissen, wie der Hersteller in anderen Bereichen betrogen hat, um dies zu erreichen. Manchmal kommen Hersteller mit Betrug, manchmal nicht. (Ich bin mir sicher, dass jemand eine Auto-Analogie finden könnte, die von den letzten Nachrichten inspiriert wurde.) - kasperd
SSDs sind ein anderes Tier. Sie haben Map-Tabellen, die angeben, wo die Daten sind. Sie verschieben und verlagern Daten und passen diese Karten an. Sie müssen ihre Schreibvorgänge vereinigen (d. H. Verzögern, bündeln und später schreiben), um eine Schreibverstärkung zu vermeiden. Die Karten selbst können nicht aggressiv geschrieben werden und müssen denselben Regeln folgen. Wir können über "richtige Designs" und Fehler - aber SSDs sind keine "einfachen" wie aufgezeichneten Dateisysteme (die nicht einfach sind). Ich spreche von vielen Erfahrungen, Tests, Spezifikationen und vielleicht habe ich mit einem Hersteller gesprochen - oder zwei oder drei - in meinem Job. - Brad