Tipps für die Umsetzung des »Null-Fehler-Prinzips«.
Zero Outage ist der Inbegriff dessen, wie sich eine Organisation im Hinblick auf eine systematische und effiziente Bearbeitung qualitätsrelevanter Aufgabenstellungen verhält – mit dem Ziel, die Qualität kontinuierlich zu steigern. Zero Outage betrifft daher den Betrieb von Telekommunikation und IT, die Lieferung von Services und die Durchführung von Projekten sowie die Optimierung der Kundenschnittstelle und Einbindung weiterer ICT-Lieferanten. Wichtig dabei ist: Zero Outage bezieht auch das Verhalten aller Mitarbeiter einer Organisation mit ein – vom Topmanagement bis zum Mitarbeiter an der Basis.
Das vom TÜV Rheinland zertifizierte Zero-Outage-Programm umfasst Maßnahmen auf allen Ebenen – von modernsten Plattformen über reibungslose, global einheitliche Prozesse mit kurzen Entstörzeiten bis hin zu speziell ausgebildetem Personal. Denn: Erst ein optimales Zusammenspiel von Mensch und Technik ermöglicht eine stabile und sichere ICT. Die wichtigste Grundlage von Zero Outage ist dabei immer ein übergreifendes und proaktives Risiko-Management. Es gilt das Motto: Prävention statt Reaktion. Es geht nicht nur darum, der Schnellste zu sein, um im Falle eines Falles das Feuer zu löschen, sondern Risiken vorher zu sehen, den Plan B und C vorab zu entwickeln und so zu verhindern, dass der Brandherd überhaupt erst entsteht. Einer flächendeckenden Qualitätssicherung schon in der Planungsphase von Veränderungen oder Projekten beziehungsweise einem allgemein hohen Standardisierungsgrad von Prozessen und Technologie kommen hierbei eine große Bedeutung zu.
Zero Outage beinhaltet unter anderem spezifische Regelungen und Handlungsanweisungen für verschiedene Störfälle, beispielsweise im Falle defekter Systemkomponenten, für Netzwerk-, Strom- oder VoIP-Ausfälle oder auch für Incidents während einer Change-Implementierung. Ein aktives Risiko-Management bildet dabei die Grundlage für alle Zero-Outage-Initiativen: Jeder einzelne Risikocluster wird genau auf den Eintritt von Risiken in Form von beispielsweise Incidents überwacht und die eingeleiteten Maßnahmen werden stetig optimiert und weiterentwickelt. Auf diese Weise wird dank Zero Outage 99,999 Prozent höchste Verfügbarkeit im ICT-Betrieb erreicht: Das entspricht einer Ausfallszeit von nur wenigen Minuten im Jahr.
Vier Säulen für die Sicherheit
Die Zero-Outage-Strategie umfasst folgende grundlegende Punkte, um die Prozesslandschaft im Unternehmen sicherer zu machen:
- Einfache Prozessbeschreibungen
- Verantwortlichkeiten und Abläufe klar definieren
- Regelmäßig den Ernstfall simulieren
- Störfälle konsequent dokumentieren und auswerten
Anleitung zur Sicherheit
-
Um eine Zero-Outage-Kultur im Unternehmen zu etablieren, spielen viele Faktoren zusammen. Als wesentliche Hebel zum Erfolg und zum nachhaltigen Verankern dieser Kultur haben sich aber folgende Maßnahmen etabliert:
-
»Practice what you preach«: Wenn eine Führungskraft Werte und Standards selbst vorlebt und als Vorbild auftritt, sind deren Mitarbeiter eher gewillt, diese zu übernehmen und verbinden sie mit dem positiven Vorbild. Eine solche Haltung ist insbesondere dann essenziell, wenn die Organisation sich auf hohe Qualitätsstandards hin ausrichten will.
-
Das Unternehmen hat Zero Outage als eine der Topprioritäten für das laufende und die kommenden Jahre definiert. Es gibt eine Mission, die von allen getragen, und eine Strategie, die von allen verfolgt wird.
-
Es gibt klare, messbare KPIs und einen Plan, was in den kommenden zwölf Monaten erreicht werden soll, ebenso wie eine langfristig ausgelegte strategische Zielsetzung. Übergreifende Ziele, wie zum Beispiel die Reduktion der Major Incidents um einen Prozentsatz X, sind in den persönlichen Zielvereinbarungen des Topmanagement und Senior Managements enthalten.
-
Für das Gelingen eines kompletten Kulturwandels ist nicht nur ein einzelner Bereich auf Zero Outage verpflichtet, sondern alle, inklusive derer, von denen Widerstand zu erwarten ist.
-
Im Management Board ist wöchentlich ein Slot für das Quality Update reserviert: Der Leiter Qualität berichtet über die aktuell wichtigsten Quality KPIs und High- und Lowlights der vergangenen Woche sowie den Status wichtiger Verbesserungsprogramme. Wenn nötig, werden in dieser Runde zudem direkt Beschlüsse gefasst. Danach wird gehandelt und nachverfolgt, ob Verbesserungen eintreten – mit einer Wiedervorlage für die kommende Woche.
-
Aus allen Bereichen der operativen IT und unter allen Führungskräften werden zusätzlich »Managers on Duty« benannt. Die Manager werden ebenfalls geschult und sind im Sinne eines Rotationsprinzips nach einem Plan auch nachts und am Wochenende erreichbar – für den Störungsfall oder um zum Beispiel ein Change-Wochenende zu begleiten. So steht mit wechselnder Verantwortung zu jeder Tages- und Nachtzeit auch ein Ansprechpartner aus dem Management zur Verfügung, der mit entsprechender Eskalation die Lösungsfindung unterstützen kann.
-
Bei einem Major Incident steigt der Manager on Duty als Erster mit in die Telefonkonferenz ein und forciert und unterstützt die Ursachenforschung so lange, bis die Störung gelöst ist. Er lebt den Sense of Urgency für alle beteiligten Mitarbeiter vor.
-
Auch die Abteilungs- und Teamleiter im mittleren und unteren Management sind im täglichen Business für die Qualität verantwortlich. Ihnen steht eine Checkliste zur Verfügung, die sie bei täglichen Qualitäts-Checks mit dem Team unterstützt und eine Leitlinie vorgibt, wie hoch die Messlatte für die Qualität hängt.
-
Feedback-Kultur: Es ist wichtig, die Key Player aus den operativen Bereichen in die Weiterentwicklung der Prozessstandards und Policies mit einzubeziehen. Es sollte, wann immer möglich, auch Gelegenheit zu direktem Feedback geben. Das kann eine Fragerunde sein, die im Anschluss des Mitarbeiter-Calls stattfindet, eine anonyme Feedback-Umfrage oder auch Standortfrühstücke, bei denen die Mitarbeiter in zwangloser Atmosphäre über die Qualitätsstrategie diskutieren können.
Mehr zur Initiative Zero Outage finden Sie unter: www.zero-outage.com