Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

Wie Amazon denselben Fehler nie zweimal macht

Eine Fehlerkultur kann den Unterschied zwischen wiederholten Ausfällen und dauerhaftem Erfolg ausmachen. Amazon zeigt, wie organisierte Fehleranalyse zu Verbesserungen führt.
© (Quelle: EMGenie)

"Erfolg besteht nicht darin, keine Fehler zu machen, sondern darin, den gleichen Fehler kein zweites Mal zu machen." Offenbar hat sich Amazon für seine Web Services (AWS) diesen Spruch von George Bernhard Shaw zu Herzen genommen. Im Juni 2023 waren hier viele Kunden von erhöhten Fehlerquoten und überdurchschnittlichen Latenzen betroffen. Insbesondere AWS Lambda war betroffen, was nicht nur die direkten Anwendungen, sondern auch andere verbundene Dienste wie ECS, AppRunner und Cloudwatch beeinträchtigte.

Jedes Mal, wenn solche Vorfälle eintreten, bietet sich die Möglichkeit zur sorgfältigen Analyse. Statt in Scham zu versinken, dokumentiert Amazon systematisch, was schiefgelaufen ist, um sicherzustellen, dass ähnliche Fehler in Zukunft vermieden werden.

Der zentralisierte Ansatz zur Analyse von Vorfällen wird durch das sogenannte Correction-of-Error-Dokument (CoE) unterstützt. Diese Dokumente sind meist zwischen vier und sechs Seiten lang und bieten eine umfassende Analyse der Situation, die zu einem signifikanten Kundenimpact führte. Zu den wesentlichen Komponenten eines CoE-Dokuments gehören der Titel, eine Zusammenfassung des Vorfalls, relevante Metriken und Grafiken, eine detaillierte Beschreibung der Auswirkungen, die Reaktion auf den Vorfall, eine chronologische Zeitleiste von Ereignissen und eine gründliche Untersuchung der Ursachen über die sogenannten '5 Why´s'. Dieser Ansatz fördert die tiefgreifende Untersuchung der Ursachen und hilft bei der Festlegung spezifischer Massnahmen zur Vermeidung ähnlicher Vorfälle in der Zukunft.

Ein weiteres bemerkenswertes Merkmal der CoE-Prozesse bei Amazon ist die betonte Teamkommunikation während der Erstellung des Dokuments. Das Schreiben eines CoEs wird nicht als Bestrafung betrachtet, sondern als wertvolle Gelegenheit zur Verbesserung. Es zeigt, dass sowohl Ingenieure als auch Manager die Verantwortung übernehmen, um wertvolle Erkenntnisse zu gewinnen, und bietet eine transparente Plattform, um voneinander zu lernen.

Die Vorteile der Einführung von CoEs in die Unternehmenskultur sind erheblich. Sie fördern nicht nur die kontinuierliche Verbesserung, sondern ermöglichen es auch, einen umfassenden Überblick über vergangene Probleme zu erhalten. Durch das Teilen und Diskutieren dieser Dokumente können ganze Teams und letztendlich das Unternehmen als Ganzes aus vorangegangenen Herausforderungen profitieren.

Detaillierte Informationen, wie ein CoEs-Dokument aussieht

Kommentare

Softwareentwicklung
Anzeige
Anzeige

Neueste Beiträge

ggs netz übernimmt sämtliche Kommunikationsnetze der GIB-Solutions
Die ggs netz ag übernahm per 1. Mai 2026 sämtliche Kommunikations-netze der GIB-Solutions AG. Mit der Transaktion kommen rund 10’000 Digitalanschlüsse hinzu. Die übernommenen Netze werden künftig über die neu gegründete Tochtergesell-schaft ggs plus ag betrieben.
3 Minuten
Echtzeittext - Bundesrat schafft Grundlage für neue Notruffunktion
Der Bundesrat hat mehrere Verordnungen angepasst, um ein sicheres Notrufsystem zu fördern. In Zukunft können Menschen in Notlage die Notdienste von Polizei, Feuerwehr und Sanität per Echtzeittext auf den Smartphones auch schriftlich erreichen. 
3 Minuten
Stromverbrauch und Effizienzpotenziale von Rechenzentren in der Schweiz
2024 betrug der Stromverbrauch der Rechenzentren in der Schweiz 2,1 TWh, was ungefähr 3,6 Prozent des Gesamtverbrauchs entspricht. Bis 2030 wird ein Anstieg des Stromverbrauchs der inländischen Rechenzentren auf 2,5 bis 3,2 TWh erwartet. 
3 Minuten

Das könnte Sie auch interessieren

Publireportage
Ist öffentliches WLAN sicher? Das solltest du wissen
Öffentliche WLAN-Netze sind überall: in Flughäfen, Hotels, Bibliotheken, Einkaufszentren und vielen anderen Orten. Sich schnell und kostenlos mit dem Internet zu verbinden, war noch nie so einfach. Doch so praktisch diese Netzwerke auch sind – für Cyberkriminelle sind sie ein echtes Einfallstor.
3 Minuten
Vergabe der UKW-Konzessionen für Radios 2027 bis 2034
Das Bundesamt für Kommunikation BAKOM hat das Verfahren für die Vergabe der UKW-Funkkonzessionen zur Verbreitung von Radioprogrammen ab 2027 festgelegt. Die SRG und Privatradios mit Leistungsauftrag können auf Gesuch hin ihre bisherigen Frequenzen weiter nutzen. SRG vor UKW-Rückkehr?
3 Minuten
21. Apr 2026
Lederarmbänder werden zu Stromspeichern
Forscher der Jilin-Universität machen aus ledernen Jacken, Trachtenhosen und Uhrarmbändern Batterien. Dabei bleibt ihre ursprüngliche Funktion erhalten.
3 Minuten
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige

Kommentare