Backups

Backups sind für den Betrieb produktiver oder längerfristig genutzter virtueller Maschinen ein zentrales Thema. Das gilt insbesondere für persistente VMs, Forschungs-VMs mit langer Laufzeit, Websites sowie andere Systeme, bei denen Datenverlust, längerer Ausfall oder eine langsame Wiederherstellung problematisch wären.

Für rein kurzlebige Test- oder Experimentier-VMs ist der Bedarf oft geringer. Sobald eine VM jedoch wichtige Daten enthält oder im Fehlerfall schnell wiederhergestellt werden muss, ist ein eigenes Backup-Konzept erforderlich.

Verantwortung für Backups

Für Backups Ihrer Daten sind Sie selbst verantwortlich. In CloudStack werden weder automatische Backups noch automatische Snapshots Ihrer virtuellen Maschinen erstellt. Auch die Cloud-Administration erstellt keine Backups für Ihre VMs, Volumes oder deren Inhalte.

Das bedeutet insbesondere:

  • Es gibt keine automatische Datensicherung durch CloudStack.
  • Snapshots werden nicht automatisch für Sie erstellt.
  • Die Cloud-Administration übernimmt keine Wiederherstellung aus nicht vorhandenen Backups.

Snapshots sind keine Offsite-Backups

Snapshots in CloudStack können im Einzelfall hilfreich sein, um einen Zustand einer VM oder eines Volumes festzuhalten. Sie sind jedoch kein Ersatz für ein echtes Offsite-Backup.

Der entscheidende Unterschied ist, dass Snapshots innerhalb derselben Infrastruktur liegen, auf der auch die betroffenen virtuellen Maschinen betrieben werden. Kommt es zu einem größeren Problem in der CloudStack-Umgebung oder in der zugrunde liegenden Infrastruktur, können auch diese Snapshots betroffen, nicht konsistent nutzbar oder vorübergehend nicht verfügbar sein.

Das Ceph-gestützte Storage-System kann zwar eine gewisse Redundanz der Daten innerhalb der SPARCI-Cloud bereitstellen. Diese Redundanz ist jedoch kein Ersatz für ein separates Backup. Auch bei redundanter Speicherung können Datenverluste durch Stromausfälle oder andere unvorhergesehene Ereignisse innerhalb der SPARCI-Cloud nicht vollständig ausgeschlossen werden.

In der Vergangenheit gab es nach unserem Kenntnisstand keine entsprechenden Vorfälle. Dennoch bleibt ein Restrisiko bestehen. Gerade deshalb sind externe Backups wichtig.

Snapshots können daher bei operativen Aufgaben nützlich sein, etwa vor bestimmten Änderungen oder für kurzfristige Sicherungszwecke. Sie eignen sich aber nicht als alleinige Strategie zum Schutz wichtiger Daten.

Was sollte gesichert werden?

In vielen Fällen ist es nicht notwendig, die gesamte VM vollständig zu sichern. Häufig reicht es aus, die wirklich relevanten Daten regelmäßig zu sichern, zum Beispiel:

  • fachliche Nutzdaten
  • Datenbanken
  • Konfigurationsdateien
  • Anwendungsstände und Inhalte von Websites
  • Skripte und andere reproduktionskritische Arbeitsstände

Gerade bei Forschungs-VMs oder dauerhaft betriebenen Diensten ist es sinnvoll, die Daten so zu sichern, dass eine Wiederherstellung schnell und mit vertretbarem Aufwand möglich bleibt.

Wo sollten Backups liegen?

Wichtige Daten sollten nicht ausschließlich innerhalb von CloudStack gespeichert werden. Wir empfehlen, Backups außerhalb der CloudStack-Infrastruktur abzulegen, zum Beispiel:

  • lokal auf eigenen Systemen oder Servern
  • in einer anderen Cloud im universitären Umfeld
  • in einer vom ZIMT betriebenen Nextcloud
  • bei externen Offsite-Anbietern, sofern dies organisatorisch und datenschutzrechtlich zulässig ist

Entscheidend ist, dass Ihre wichtigen Daten nicht nur innerhalb derselben Cloud-Umgebung vorgehalten werden, in der auch die produktive VM läuft.

Empfehlung der Cloud-Administration

Wenn eine VM oder ihr Inhalt relevant genug ist, dass ein Verlust oder längerer Ausfall problematisch wäre, dann sollte sie ein separates externes Backup erhalten. Verlassen Sie sich bei wichtigen Daten nicht allein auf den Betrieb innerhalb von CloudStack und auch nicht allein auf dort erzeugte Snapshots.

Backups sollten regelmäßig erstellt, sinnvoll versioniert und stichprobenartig auf Wiederherstellbarkeit geprüft werden. Ein Backup ist nur dann hilfreich, wenn im Ernstfall auch tatsächlich eine Wiederherstellung möglich ist.