Tippfehler sorgt für Störungen bei Amazons S3

4.3.2017 - Anfgang März soll es wegen eines Tippfehlers bei Debugging Arbeiten zu einem Ausfall bei Amazons Simple Storage Services (S3) gekommen sein.

Wie heise berichtet, kam es Anfang März zu einer massien Störung in Amazons S3 - Rechenzentrum. Laut Amazon war die Störung Folge von Arbeiten am Rechnungsstellungssystem des Simple Storage Service. Im Rahmen dieser wollte eines der Teammitglieder wohl ein paar Server des S3-Subsystems entfernen, auf welches der Rechnungsstellungsprozess zugreift. Zwar gibt es dafür in einem der verwendeten Playbooks einen Befehl, allerdings gab er einen der Parameter falsch ein und entfernte damit mehr Server als geplant.

Der Wegfall dieser Server wirkte sich auf das Index- und das Placement-Untersystem aus, die für die Verarbeitung von GET-, LIST-, PUT- und DELETE-Anfragen beziehungsweise das Allozieren von Speicherplatz nötig sind. Die betreffenden Server mussten neu gestartet werden und während dieser Zeit konnte S3 keine Service-Anfragen bearbeiten.

Das Unternehmen entschuldigte sich bei seinen Nutzern für den Vorfall und versprach, alles dafür zu tun, um aus den Vorfällen zu lernen und die Verfügbarkeit weiter zu verbessern.