Frage Best Practices für die Sicherungsprüfung?


Es ist eine häufige Situation, wenn der Administrator ein System für die automatische Sicherung erstellt und es vergisst. Erst nachdem ein System ausfällt, bemerkt das Administrator-System, dass das Backup-System bereits defekt ist oder Backups aufgrund eines Fehlers nicht wiederherstellbar sind und er kein aktuelles Backup zur Wiederherstellung von ... hat. Was sind die Best Practices, um solche Situationen zu vermeiden?


21
2018-05-05 22:29


Ursprung


Wir haben Backup-Überwachung in einem Skript ... es wird mit anderen Monitoring konsolidiert und wird jeden Tag an den Admin gesendet. Wenn die vollständige Sicherung übersprungen wurde (oder nur teilweise abgeschlossen wurde), würde die E-Mail dies anzeigen. - Beep beep


Antworten:


Führe Feuerübungen aus ... alle paar Monate ist es eine gute Idee zu sagen, dass das XYZ-System ausgefallen ist ... und dann die Bewegungen wieder online zu einer neuen VM usw. zu bringen. Es hält die Dinge ehrlich und hilft dir beim Fangen Fehler.


27
2018-05-05 22:33



Wir haben das bei der Arbeit gemacht, um zu testen, ob unsere visuellen quellsicheren Backups richtig funktionieren, zum Glück waren sie es auch. - Jared


Seifenkistenmodus: ON

Ich würde sagen, dass es so einfach ist, dass Backups, die nicht regelmäßig getestet werden, wertlos sind.

Bei meiner vorherigen Arbeit hatten wir eine Richtlinie, nach der jedes System (Produktion, Test, Entwicklungsüberwachung usw.) alle 6 Monate testweise wiederhergestellt werden sollte.

Dies war auch die Aufgabe des Junior-Administrators, so dass die Dokumentation aktuell war. Junior wird dadurch definiert, wie viel Arbeit er / sie auf dem spezifischen System hatte, manchmal (ziemlich oft tatsächlich) war es der "Gruppenmanager", der es tat

Wir hatten dafür spezielle Hardware (eine Intel- und eine IBM / AIX-Box), die für alles außer Festplattenplatz niedrig war, da wir auf dem wiederhergestellten Host nichts Echtes ausführen mussten.

In den ersten paar Runden war es ziemlich viel Arbeit, aber es hat uns dazu gebracht, den Wiederherstellungsprozess zu rationalisieren, der ein wichtiger Teil des Backups ist.


10
2018-05-14 11:55





Da Sie scheinbar auf die Tatsache hinweisen, dass der Administrator nicht bemerkt, dass der Sicherungsjob "bricht", und nicht so sehr, dass ein funktionierendes Backup nicht richtig funktioniert, würde ich vorschlagen, eine Art von Überwachungsskripten um die Backups herum aufzubauen.

Beim Erstellen einer selbst erstellten Backup-Lösung würde ich Folgendes tun:

  • Erstellen Sie ein Skript zum Sichern Ihrer Daten.
  • Führen Sie die Testwiederherstellung durch, um sicherzustellen, dass das Skript ordnungsgemäß funktioniert.
  • Implementieren Sie im Skript oder auf andere Weise eine Methode zum Verfolgen des Status der Sicherungen (Erfolg, Fehler, Ausführen, wurde nicht ausgeführt).
  • Lassen Sie diesen Tracking-Status überwachen (E-Mail, Datenbank, etwas)

Sobald alles fertig ist, sollte es dir gut gehen. Eine zusätzliche Sache zu tun wäre, regelmäßige Testwiederherstellungen durchzuführen. Wenn Sie zusätzliche Hardware haben, um für die Ursache zu spenden.

Wo ich arbeite, haben wir eine warme Seite. Einmal im Monat wählen wir zufällig ein System oder eine Datenbank aus und gehen zu unserer warmen Seite und führen eine Testwiederherstellung auf Bare-Metal durch, um sicherzustellen, dass wir unsere Daten wiederherstellen können.

Ehrlich gesagt, wenn Daten für Sie sehr wichtig sind, wäre es in Ihrem Interesse, in eine Software zu investieren, um Ihre Backups für Sie zu verwalten. Dafür gibt es hunderte von Produkten, von den billigen und einfachen bis hin zur Enterprise-Klasse.

Wenn Sie sich auf eine Reihe handgeschriebener Skripte verlassen, die in der Crontab für Ihre Unternehmenssicherungen laufen, werden Sie früher oder später wahrscheinlich gebrannt.


7
2018-05-13 16:53





Wir haben 60% -ige 'Referenz' Versionen unserer 'Production' Systeme, wir verwenden sie für das abschließende Testen von Änderungen, wir stellen 'Production' Backups auf diese Systeme her - es testet das Backup und stellt sicher, dass beide Umgebungen miteinander im Einklang stehen .


4
2018-05-05 22:37





Ein Ansatz besteht darin, einen regelmäßig wiederkehrenden Wiederherstellungsjob zu skripten, der beispielsweise eine bestimmte Textdatei aus der letzten Sicherung abruft und Ihnen den Inhalt per E-Mail sendet. Wenn es möglich ist, sollte dies - zumindest manchmal - mit einer anderen Box erfolgen als derjenigen, die die Daten erstellt oder gesichert hat, nur um sicherzustellen, dass es funktioniert, wenn Sie dies tun sollten. Der Vorteil besteht darin, dass Sie sicher sein können, dass Ihre Verschlüsselungs- / Entschlüsselungs-, Komprimierungs- und Speichermechanismen funktionieren.

Dies ist bei spezialisierten Backups wie E-Mail- und Datenbankservern etwas komplizierter, obwohl eine kleine Wiederherstellung in einem kleinen DB- oder Brick-Level-Mailbox-Backup und die Überprüfung der Inhalte durchaus möglich ist, nur ein wenig aufwendiger.

Dieser Ansatz sollte auch eine regelmäßige vollständige Wiederherstellung nicht ersetzen, um sicherzustellen, dass Sie im Notfall Daten wiederherstellen können. So können Sie die Integrität Ihres täglichen Sicherungsjobs besser einschätzen.


1
2018-05-11 06:30





  1. Feuer Übungen.
  2. Eine Richtlinie zum Testen aller Backups alle 6 Monate ist eine sehr gute Idee
  3. Wenn es um Tests geht, müssen Sie sich jede Anwendung oder jedes System ansehen, das Sie sichern. Im Idealfall sollte ein "erfolgreiches" oder "wiederherstellbares" Backup in der Servicebeschreibung oder SOP (Betriebsdokumentation) für Ihre Sicherung aufgeführt werden, zusammen mit anderen Details wie der Aufbewahrungszeit, bladibla.

Sie werden wahrscheinlich feststellen, dass einige Sicherungstypen leicht durch Skripts (z. B. Datenbanken) wiederhergestellt werden können, während andere manuelle Eingaben erfordern (Active Directory-Wiederherstellung). Automatisieren Sie so viel wie möglich, stellen Sie sicher, dass eine Art von Berichterstellung vorhanden ist, und stellen Sie sicher, dass "jemand" die manuellen Tests auch in regelmäßigen Abständen durchführt. Eine isolierte Umgebung (herunterskalierte Kopie von prod) erleichtert die Durchführung von Wiederherstellungstests.


1
2017-10-18 10:05



Verzeihen Sie die Frage, aber fügt diese Antwort alles hinzu, was noch nicht gesagt wurde? - MadHatter
Alle 6 Monate? Ich mache kleine alle paar Wochen. - tombull89


Bei der Testwiederherstellung fühle ich mich an dem Punkt nicht wirklich wohl "Das sieht gut aus, Dateien werden wiederhergestellt, es scheint, dass keine Datei fehlt, sogar die Größen stimmen überein", oder an dem Punkt "das sieht gut aus, habe ich meine Anwendung gestartet. .. stürzt nicht ab, zeigt einige anständige Daten ".

Ich möchte Server / Cluster von Grund auf wiederherstellen und dann tatsächlich für verwenden Produktion. Nicht für eine Minute, nicht für eine Stunde, aber permanent. Wenn Sie behaupten, dass Ihre Wiederherstellung erfolgreich war, gibt es keinen Grund, keine Produktion zu starten. Dies ist kein "schmutziges" System, das sollte vergessen werden. Dies ist das System, dem Sie nach einer echten Katastrophe begegnen werden. Also, wenn es "gut aussieht" Bühne passiert, damit leben. Unterstütze es nächste Nacht. Vergiss das Original. Du wahrscheinlich werden entdecken Sie einige Störungen mit diesem Ansatz, und Sie werden sein gezwungen zu repariere alle von ihnen. Die nächste Wiederherstellung desselben Systems hat eine gute Chance, zu 100% erfolgreich zu sein.

Dies beinhaltet Ihre Backup-Software und Ihren Server. Ja, Sie müssen diese auch wiederherstellen.


Haben Sie kein Budget, um dedizierte Hardware für die Wiederherstellung zu kaufen?

  • Erklären Sie, dass Sie unbedingt ein Budget benötigen. Merken Sie zu jeder Gelegenheit den Entscheidungsträgern, dass ein gültiger, durchgehender Wiederherstellungstest noch nicht stattgefunden hat. (Und ja, sammle die Beweise, um deinen Arsch zu bedecken. Harte Welt.)
  • In den meisten Unternehmen besteht gelegentlich die Notwendigkeit, ein System auf eine andere Hardware zu migrieren. Nutzen Sie die Gelegenheit. Wählen Sie für die Migration immer die Methode "Von Backup wiederherstellen", und geben Sie so an, als hätten Sie gerade die ursprüngliche Hardware verloren. Ja, es bedeutet mehr Ausfallzeiten, tut mir leid. Zumindest werden Sie darauf vertrauen können, dass Ihr Backup nützlich ist.
  • Keine Migration? Vielleicht können Sie für zwei Wochen etwas Hardware ausleihen und zwei Wiederherstellungen durchführen Tests (Wiederherstellung auf geliehene Hardware, warten Sie mehr als eine Woche, Wiederherstellung von geliehenen zum Original, leben damit). Normalerweise, wenn eine neue Hardware für ein neues System gekauft wurde und Sie die Dinge richtig arrangieren, können Sie es leicht ausleihen - indem Sie es für zwei Wochen ausgiebig testen. Wenn die neue Hardware nicht zu 100% mit der alten identisch ist, wird Ihr Test noch besser. Woher weißt du, ob du im Falle einer echten Katastrophe identische Hardware bekommst?
  • Wird gerade ein neues System von Ihnen implementiert? Können Sie die Wiederherstellung sofort testen? Verwenden Sie keine zusätzliche Hardware, überschreiben Sie einfach das neue System, da Sie über neues Wissen verfügen, wie Sie es schnell umsetzen können. Dies funktioniert, wenn noch keine signifikanten Daten vorliegen. Gehen Sie wieder zur Produktion in der wiederhergestellten Version, nicht in der frisch neu installierten Version.

0
2018-06-15 22:42





Während wir Backups nicht testen, haben wir die zentrale Backup-Prüf- und Reporting-Komponente in dem von uns entwickelten System BackupRadar.com. Fühlen Sie sich frei, es zu überprüfen, ob es mit dieser Komponente hilft. Es fügt eine Kopie der Erfolg / Misserfolg-E-Mails an die Backup-Richtlinie an und fügt Screenshots hinzu, wenn Ihre Backup-Software diese ebenfalls senden kann.

Vielen Dank, Patrick


0
2017-09-30 19:28