Information & Cyber Security, Privacy,
Von Michel Brunner, Teilnehmer des CAS DevOps Leadership and Agile Methods
Erinnern Sie sich noch, als Netflix ein DVD-Vertreiber war? Damals im Jahr 2008 hatte er seine erste grössere Störung. Wegen einer Datenbank-Korruption fiel sein Versandsystem aus. Ein Drittel der 8.4 Millionen Kundinnen und Kunden wartete frustrierend lange auf seine Filme.
Was für ein Weckruf! Als sich das Unternehmen 24 Monate später mitten in seiner Umwandlung zur Streaming-Plattform befand, war eines klar: Es musste starke Resilienz ins System eingebaut werden. Bloss wie?
Chaos Engineering zeigt ein enormes Potenzial, um robustere und widerstandsfähigere Systeme zu schaffen. In unserem CAS vermitteln wir innovative Methoden. Wir zeigen, wie man sie sicher und effektiv im eigenen Unternehmen einsetzt.
Oliver Gilbert, Programmleiter des CAS DevOps Leadership and Agile Methods
Die Lösung war keine technische Meisterleistung, sondern eine vermeintlich verrückte Idee: absichtlich Störungen in der Produktionsumgebung produzieren, um potenzielle Schwachstellen zu identifizieren. Diese können dann behoben werden, bevor sie schwerwiegende Probleme verursachen.
Absichtliche System-Störungen: der Aufstieg der Affen
Zu diesem Zweck entwickelte Netflix «Chaos Monkey». Das ist eine Software, die nach dem Zufallsprinzip einen Server während seiner normalen Laufzeit abschaltet. Die Chaos-Affen schlugen also zu. Das Netflix-Betriebsteam war herausgefordert. Rasch zeigten sich daraufhin die positiven Auswirkungen auf die Zuverlässigkeit und Robustheit der Systeme.
Der Erfolg war so gross, dass Netflix mit der Zeit eine ganze Werkzeugsammlung entwickelte: «The Simian Army». Damit testet der Streaming-Dienstleister seine Infrastruktur gegenüber einer noch grösseren Auswahl an Ausfällen und Störungen.
Pionierarbeit: Affen als Vorreiter im Chaos Engineering
Netflix hat mit seiner Affen-Armee Pionierarbeit geleistet. Daraus ist eine neue Disziplin im Bereich der Software- und Systementwicklung formalisiert worden: Chaos Engineering, die Kunst, resiliente Systeme zu schaffen.
Wenn Sie gemäss dem dritten Weg von DevOps eine Kultur des stetigen Lernens in Ihrem Unternehmen einführen möchten, ist Chaos Engineering genau das, was Sie brauchen.
So organisieren Sie Affen-Chaos:
Natürlich sollten Sie nicht planlos in der Produktionsanlage irgendwelche Server deaktivieren oder Netzwerkverbindungen unterbrechen. Ein ordentliches Vorgehen ist zwingend, wenn Sie aussagekräftige Erkenntnisse zum System gewinnen wollen.
Idealerweise gehen Sie in vier Schritten vor:
Chaos ja … aber sicher!
Chaos Engineering muss sorgfältig und verantwortungsvoll durchgeführt werden. Folgendes bewährtes Verfahren hilft, gröbere Probleme zu vermeiden:
Einst verrückt, heute eine systematisch strukturierte Disziplin
Das Beispiel von Netflix zeigt, wie mächtig der dritte Weg von DevOps – kontinuierliches Experimentieren und Lernen – sein kann. Aus einer vermeintlich verrückten Idee entstand eine systematisch strukturierte Disziplin. Mittlerweile praktizieren sie zahlreiche renommierte Unternehmen wie etwa LinkedIn, Google oder Microsoft.
Heute kann man sich sogar schon als Chaos Engineer zertifizieren lassen. Wie cool ist das denn?! Sie sind vielleicht nur einen Schritt davon entfernt, die Macht des dritten Weges freizusetzen.
Frage in die Runde: Welche Erfahrungen haben Sie mit Chaos Engineering? Bitte schreiben Sie Ihren Kommentar unten ins Kommentarfeld.
Veröffentlicht: August 2024
Hinweis: Dieser Blogbeitrag wurde im Rahmen eines Leistungsnachweises für
das CAS DevOps Leadership and Agile Methods verfasst. Er wurde geprüft und redaktionell aufbereitet.
Sorgt für Sicherheit: Michel Brunner bloggt aus dem Unterricht des CAS DevOps Leadership and Agile Methods. Er ist Team- und Projektleiter beim Bundesamt für Rüstung armasuisse. Michel Brunner ist seit über 15 Jahren im Sicherheitsumfeld tätig und leitet agile Entwicklungsprojekte. Resilienz ist jeweils eine wichtige Anforderung an Systeme, die auch in degradierten Lagen weiterhin einsatzfähig bleiben müssen.
Bilden Sie sich weiter: Im CAS DevOps Leadership and Agile Methods rüsten Sie sich für die wachsenden Anforderungen an die moderne Softwareentwicklung in agilen Systemen. Sie lernen die wichtigen Prinzipien, Erfolgsfaktoren und Werkzeuge kennen. Noch vertiefter bilden sich die Teilnehmenden im MAS Agile DevOps & Cloud Transformation weiter. Hier lernen Sie, die Chancen von Agilität mit den Möglichkeiten moderner Cloud-Technologien zu verbinden.
🚀 Besuchen Sie unsere (Online-)Info-Veranstaltungen!
Welche Weiterbildung passt zu mir? Der Weiterbildungs-Finder verschafft Ihnen den Durchblick.
Informatik-Blog abonnieren: In diesem Blog erfahren Sie mehr über Trends aus der Welt der Informatik. Wir bieten Einsichten in unser Departement und Porträts von IT-Vordenkerinnen, Visionären und spannenden Menschen: Jetzt abonnieren.
Im Weiterbildungs-Blog stöbern: Was lernen unsere CAS-Teilnehmenden? Was machen sie beruflich? In unserem Weiterbildungs-Blog erfahren Sie mehr. Hier bloggen aktuelle CAS-Teilnehmende aus ihren Weiterbildungsprogrammen heraus. Wir unterstützen und fördern die Bloggenden aktiv in diesem Qualifikationsschritt.
Aktuelles aus unserem Departement auf LinkedIn. 👀 Jetzt folgen!
Kommentare
0 Kommentare
Danke für Ihren Kommentar, wir prüfen dies gerne.