Frage Wichtige Punkte in einem Datencenter


Ich versuche, eine einfache Checkliste zu erstellen, um die Qualität eines Rechenzentrums zu bestimmen ... wo und wonach soll ich suchen und wie kann ich feststellen, was die Eigentümer sagen (zB "unsere USV hält das Rechenzentrum für 100 Tage ohne Macht ") ist wahr oder nicht? Was sind typische Anzeichen oder gute oder schlechte Rechenzentren?


34
2017-12-14 17:30


Ursprung




Antworten:


Hier ist eine Liste von Fragen, die ich für mich selbst gemacht habe, als ich das letzte Mal im Rechenzentrum war:

  • Erklären Sie, was Sprinkler für unsere Ausrüstung benötigen.
  • Was werden Remote-Hände tun wollen? Zum Beispiel, installieren Sie Festplatten, drehen Sie Bänder ...
  • Sind Ihre Remote-Hände 24/7/365 verfügbar, durchschnittliche Wartezeit für sie in den Käfig nach dem Einreichen eines Tickets (Wie sind Tickets eingegeben?)?
  • Sind Sie in mehreren Grids?
  • Haben Sie eine Bodenkühlung?
  • Wie viele Rechenzentren betreiben Sie außer diesem?
  • Wie lange kann das Datencenter auf Backup-Leistung ausgeführt werden?
  • Können wir Geräte direkt an das Rechenzentrum liefern lassen?
  • Gibt es einen Lieferdock und freie, nahe und verfügbare Parkplätze?
  • Wenn wir einen Händler im Rechenzentrum haben, müssen wir ihn begleiten?
  • Welche Umgebungstemperatur und Luftfeuchtigkeit wird beibehalten?
  • Wie viele ISP-Auswahlmöglichkeiten gibt es?
  • Haben Ihre Kunden jemals für einen bestimmten Zeitraum in der Geschichte des Rechenzentrums Strom verloren?
  • Wie lange ist dieses Datacenter in Betrieb?
  • Welche Zugangskontrollen gibt es sowohl für den Boden als auch für die Ausrüstung?

Wenn Sie mehrere besuchen und diese Fragen zwischen dem Preis, Ihren Besuchseindrücken und ihren Antworten stellen, wird es wahrscheinlich klar sein, welches Sie wollen. Stellen Sie sicher, dass Sie sie immer besuchen und eine gute Anzahl von ihnen besuchen.


43
2017-12-14 17:38



Gut gemacht. +1 für dich. - gWaldo
Ich würde auch nach Zugangskontrollen für den Boden und Ihre Ausrüstung fragen. - Scott Pack
Große Liste !! Ich würde hinzufügen: "Besitzen Sie das Gebäude?" Auch, wenn sie Sprinkler haben, geh weg! - JakeRobinson
@JakeRobinson Sprinkler sind erforderlich nach Feuercode, auch in Rechenzentren, an vielen Orten. Wenn Sie Sprinkler sehen, fragen Sie, ob sie es sind trockenes Rohr Sprinkler. - sysadmin1138♦
@JakeRobinson Der neue DC, den ich 2003 bezog, hatte sowohl FM200 als auch Sprinkler. Die Feuerwehrleute waren sehr fest, dass dort Sprinkler sein mussten. Wenn der FM200 das Feuer löschen kann, großartig. Aber wenn das nicht der Fall ist (UPS-Ausblasen durchbricht den FM200-Staudamm, so dass O2 nach einer Müllkippe eindringen kann), wird viel Wasser das Gebäude retten. Das richtige Dry-Pipe-System bedeutet, dass der DC nicht überschwemmt wird, wenn ein Sprinklerkopf angestoßen wird. - sysadmin1138♦


Kyle hat es ziemlich gut behandelt, aber hier sind ein paar Punkte:

Physische Sicherheit ist riesig. Es sollte fast ein Akt des Kongresses (Parlament, bürokratische Institution hier langsam einfügen), um hineinzugehen.

Es sollte Halon Feuerunterdrückung haben, keine Sprinkler; Server sollten nicht feucht sein. (Lokale Brandschutzvorschriften können außer Kraft gesetzt werden ...)

Finden Sie heraus, was ihre bevorzugten Server-Anbieter sind. Wenn es sich nicht um einen ganz bestimmten Grund handelt (z. B. um ein Google-ähnliches Datencenter zu betreiben), sollte es sich um Markennamen-Server handeln. (Dell, HP, IBM, Sun, Apple usw.) Wenn sie "White-Box" oder eine Marke, die Sie nicht erkennen, sagen, laufen. Beachten Sie, dass es einige seriöse Server-Anbieter der unteren Schicht gibt, die seriös sind (System76 zum Beispiel), aber "custom-built" bedeutet, dass sie die Dinge selbst zusammenstellen. Großartig für Ihr Zuhause, aber schlecht für Ihr Rechenzentrum. (Dies beinhaltet nicht den Kauf eines HP Proliant DL580 und die Installation von Komponenten wie den Speicheroptionen oder Laufwerkskäfigen.)

Welche Eigentumsrechte sind verfügbar? Durch sie kaufen? Kaufen Sie direkt und Drop-Ship dort? Leasing? VMs?


6
2017-12-14 17:52



Einigen Sie sich auf die Feuerunterdrückung, obwohl für "Halon" hier "Halon / FM200 / Argonit / Inergen / anderes Löschmittelgas" steht - MadHatter
Sprinkler sind eigentlich erforderlich durch Feuer-Code An vielen Orten. Das habe ich 2003 während eines DC-Builds herausgefunden. Es soll nur feuern, wenn der FM200 die Wärmequelle nicht löscht. Es sollte ein sein trockenes Rohr Sprinkleranlage, die das Inertgas unterstützt. - sysadmin1138♦


Ausgezeichnet wie immer Kyle, Ein paar Dinge, die ich aus Erfahrung gelernt habe:

  • Fragen Sie, ob es Generatoren gibt, um die USV zu sichern, wenn ja, wie oft wurden die Generatoren getestet?

  • Welche physischen Verriegelungen und Überprüfungen haben sie, um zu verhindern, dass Elektriker die Macht töten?

  • Welche Haftpflicht / Versicherungsschutz haben sie?

  • Wie gehen sie mit Situationen um, wenn sie ihr SLA nicht einhalten?

  • Wie oft haben sie kein SLA getroffen?

  • Wie viel Strom liefern sie für jedes Rack / jeden Käfig? (Wird die Stromversorgung eingeschränkt und benötigen Sie ein zusätzliches Rack / einen Käfig nur für die zusätzliche Leistung?)

  • Fragen Sie nach Referenzen, in Ihrer Branche wäre gut.

Lustige Geschichten, die zu der Zeit nicht lustig waren:

  1. Es gab ein Feuer in Vancouver in einem unterirdischen Elektrofach, 4 Blocks von meinem DC entfernt, das Feuer löschte den Strom für einen Radius von 10 Blocks. Die UPS hielt die Lichter an, bis das Gen-Set online ging. Das Aggregat blieb etwa eine Stunde lang online, bevor es zu heiß wurde. UPS konnte die Lichter noch weitere 30 Minuten anzünden, nachdem der Generator eine Sicherheitsabschaltung vorgenommen hatte. Gen-Set gehörte zu dem Gebäude, IIRC der DC konnte ihnen die Schuld geben und ihre Hände waschen.

  2. Ein Elektriker tötete die Stromversorgung für ein paar Reihen von Racks im DC, weil das Panel einige wie fiel und alle Brecher aufgeschlagen. Ich habe auch von einem Elektriker in einem anderen DC gehört, der an einer USV arbeitet, sie nicht in den Bypass-Modus versetzt und den gesamten DC abbaut.


2
2017-12-14 19:34



Ist es ratsam, eine Rack-USV für diese Fälle zu haben, oder spielt es keine Rolle, da die Verbindung normalerweise sowieso unterbrochen wird? - AX1
Es wäre schön gewesen ... Unser DC sagte, wir hätten keine UPS in unseren Regalen, sie gaben uns einen Grund, aber ich erinnere mich nicht, was es war. - Clint
Vielleicht Hitze? Ich habe nicht viel Erfahrung mit Rack-USV, aber Verbraucher USV immer heizen. - AX1
@ AX1: USVs in einer Daisy Chain-Verwirrung miteinander. Sie erwarten bestimmte Eigenschaften in der Strömung, und andere UPS können diese herausfiltern. Das Netzwerk wird wahrscheinlich ausfallen, sobald der DC Strom verliert. Selbst wenn Ihre Server aktiv sind, wird das Netzwerk nicht funktionieren. - quinnr
Könnte Feuer Code gewesen sein, wenn das EPA getroffen wird, erwarten die Feuerwehrleute, dass es keine lebende Macht gibt. - Sean Reifschneider


  • Ich würde sagen, dass wahrscheinlich ein Drittel eines Rechenzentrums die technischen Werbebuchungen sind (Haben Sie {VESDA, Betankungsverträge, von USV abgedeckte Wasserkühler, mehrere Stromnetze, diverse Glasfasereingänge).

  • Ein weiteres Drittel ist, wie sie damit umgehen, wenn die Dinge nicht gut laufen. Schlucken sie ihren Stolz, untersuchen das Versagen und finden heraus, was zu tun ist, um sicherzustellen, dass es nicht wieder passiert? Oder machen sie einfach weiter, was vorher nicht funktioniert hat?

  • Und das andere Drittel ist das Personal. Sind sie schlau, einfach zu arbeiten und nicht jeden Monat umzudrehen?

Aber noch wichtiger: Haben sie den Platz, den Sie brauchen? An einem Ort, den wir fast betreten hätten, nutzten wir innerhalb von 2 Jahren mehr Platz als zur Verfügung standen.


1
2017-12-15 07:52





Ich arbeite in einem kleinen Rechenzentrum im Silicon Valley. Ich bin der Sysadmin auf der Managed-Server-Seite des Unternehmens.

Schlechte Zeichen:

  • Fehlende redundante Überwachung und Alarmierung für Strom, Temperatur und Feuchtigkeit
  • Fehlende Überwachung von Netzwerkgeräten, Colos, Servern und anderen Geräten
  • Unordnung und keine Kabelbinder oder andere Kabelmanagement verwenden, um saubere, organisierte Racks zu halten

Gute Zeichen: - Dieselgenerator vor Ort mit automatischer Notumschaltung - Backup-Kühler und Air-Handler mit automatischem Failover - Viel Bandbreite auf Hauptträger Backbones (AT & T, XO Comm) - Redundante Netzwerkanbieter - Redundante Core-Router, Firewalls, Load Balancer und Switches - Ausführen von Speicherprüfung und Hardwarediagnose vor dem Bereitstellen von Servern

Server mit Markennamen sind in Ordnung, aber wenn sie alt sind und einige Male in der Nähe waren, sollten Sie sicherstellen, dass sie die Hardwarediagnose übergeben, bevor Sie sie verwenden.

Ein gutes Rechenzentrum sollte seinen Kunden eine Website zur Verfügung stellen, auf der sie ihren Bandbreitenverbrauch und ihre Verfügbarkeit überwachen können. Sie sollten auch alle Fragen beantworten. Fragen Sie sie nach der Marke und dem Modell ihrer UPS. Bitten Sie sie, die aktuelle Belastung der USV zu sehen. Mit diesen Informationen können Sie überprüfen, wie lange es ohne Strom gehen kann.

Aber ehrlich gesagt, sollte die UPS nicht Ihre Sorge sein. Eine USV bietet nur eine kurze Betriebszeit (30 Minuten oder so). Eine viel bessere Sorge ist, wenn der DC einen Backup-Generator hat. Es lohnt sich auch zu fragen, auf welchem ​​Gitter der DC ist. In Bezug auf Spannungsabfälle und Stromausfälle werden verschiedenen Rastern verschiedene Prioritäten zugewiesen. Erraten Sie, was? Krankenhäuser und Feuerwachen haben hohe Priorität (Strom wird nie unterbrochen). Wenn sich das Rechenzentrum im selben Raster befindet, ist dessen zuverlässige Leistung gewährleistet.

Fragen Sie sie, wie viel Strom pro Rack verfügbar ist. Wo ich arbeite, liefern wir jedes Rack mit 3x 25amp Schaltungen. Ein typischer 1u Server verbraucht 1-3 Ampere.


1
2017-12-16 17:15



Der, zu dem ich versucht bin, hat 40 Amp pro Rack. Ist das zu niedrig? Es ist fast die Hälfte von dem, was Sie sagen (75amp). - AX1
@ AX1, 40A bei 110V ist 4400W; Bei 230V ist es 9200W. Es sei denn, es ist eine hohe Dichte (Twin / Twin ^ 2 / Blade) oder HPC / GPU, das ist PLENTY. - Mircea Chirea