IT-Chaos kann eine Chance sein, Lehren zu ziehen, kommentiert Nora Jones, Senior Product Manager bei PagerDuty. IT chaos can be an opportunity to learn lessons, says Nora Jones, senior product manager at PagerDuty.
Obwohl sie unangenehm sind, Stress verursachen und Kommunikationsprobleme innerhalb einer Organisation aufdecken können, können Sicherheitsvorfälle ein wirksames Instrument für organisationales Lernen und Wachstum sein.

Bei einem IT-Vorfall stehen oft zwei Dinge im Vordergrund: Zum einen die Stabilisierung der Situation und zum anderen die Kontrolle über die Berichterstattung. Leider verpassen Unternehmen oft die Chance, die sich aus dieser Situation ergibt: Das Lernen, um beim nächsten Vorfall besser reagieren zu können und den Schaden so gering wie möglich zu halten.

Zwar kommunizieren Unternehmen meist, dass sie das Lernen unterstützen. Viele haben aber noch nicht erkannt, welches spezielle IT-Wissen erforderlich ist, um die notwendigen Kennzahlen zu ermitteln, die rund um einen IT-Vorfall entscheidend sind. Genauso wichtig ist es, dieses Wissen im Unternehmen zu verbreiten, damit Mitarbeiter und Führungskräfte daraus lernen können und die Chance auf Wachstum besteht.

Unternehmen verlassen sich bei IT-Vorfällen meist auf eine kleine Gruppe von Personen, die sofort eingreifen und die Situation klären. Es sind Experten, die wissen, was zu tun ist und an wen sie sich wenden müssen.  Sich nur auf wenige Spezialisten zu verlassen, birgt aber große Gefahren.

Zudem neigen Unternehmen dazu, Mitarbeiter durch GenAI zu ersetzen. Eine weitaus bessere Strategie wäre es, GenAI zu nutzen, um mehr Mitarbeiter zu schulen und zu entwickeln, so dass im Ernstfall mehr Experten für das Incident Management zur Verfügung stehen.

Mit diesen drei Tipps können sich Unternehmen besser auf einen IT-Vorfall vorbereiten:

  1. Bei der Untersuchung von IT-Vorfällen empfiehlt es sich, die öffentliche Untersuchung von Vorfällen von der internen Untersuchung zu trennen. Erstere hat zum Ziel, das Vertrauen der Kunden zurückzugewinnen, die interne Aufarbeitung dient dem Lernprozess. So können die Erkenntnisse aus dem internen Lernprozess später auch in die externe Kommunikation einfließen. Wichtig ist, dass am Tag 1 keine Versprechungen gemacht werden, um den späteren Lernprozess nicht zu gefährden.
  2. Der IT-Vorfall sollte von einem neutralen IT-Spezialisten untersucht werden, der nicht an dem Vorfall beteiligt war. Dies gewährleistet einen unvoreingenommenen und offenen Blick auf den Vorfall, um ein besseres Gesamtbild zu erhalten.
  3. Unternehmen sollten sich die Zeit nehmen, die jeweiligen Perspektiven der IT-Mitarbeiter und des Managements einzunehmen und ein Verständnis für die unterschiedlichen Positionen zu entwickeln. Ein schwerwiegender IT-Vorfall kann diese Kluft noch vergrößern, daher sollte der IT-Experte, der den IT-Vorfall untersucht, in seinen Interviews und Berichten beide Seiten gleichermaßen berücksichtigen. Daraus können dann entsprechende Empfehlungen für ein verbessertes Incident Management und damit einen höheren ROI abgeleitet werden.
While they are untimely, stressful, and likely to highlight communication breakdowns within an organization, incidents can be a powerful tool for organizational learning and growth.

When a high impact incident occurs, which seems to be a weekly occurrence in the news, the focus is often on two things: stabilizing the situation and controlling the narrative. Organizations often miss the opportunity that incidents present: learning.

While all organizations will say they support learning, many simply haven’t realized the expertise it takes to both uncover the necessary data points and disseminate those insights so employees (and leaders) can use them for growth.

Most organizations rely on a small group of people to jump in and fix the situation-they are the experts and can often figure out what needs to be done and who to call. One of the best opportunities you have after an incident? Build more experts.

As an industry, we know that we tend to over-rely on the expertise of a few engineers and individuals to help with a situation. In fact, I bet if I asked you right now, you could easily rattle off five names of people you would call on in a major incident. My concern is that the way we’re approaching this problem is to replace those people with GenAI, instead of using GenAI to teach more people in our organizations and grow beyond that group of five people.

Typically, the expert in solving a situation doesn’t even realize why or how they’re doing what they’re doing – it’s second nature to them. If we can elicit the why and the how, we can use incidents to build a larger group of experts.

„Some expert system developers have observed that highly skilled experts can perform tasks without being aware of how or why they do what they do.“

Here are some quick tips for organizations following a major incident (I highly recommend reading our HOWIE post-incident guide for thorough recommendations):

  1. Separate the public incident review (with the motive of demonstrating customer trust) from the internal learning review. Yes, it’s important to share things immediately – a „day 1 flash“ of sorts. However, there is also a „day 5 flash“ and a „day 30 flash“ where you learn more (the 30-day flash can include learning from the internal post-incident review). It’s important not to make promises in the Day 1 Flash – you’re still in „learning mode“ and if you do, it can distract from how your organization is improving.
  2. Use a technical person who was not involved in the incident to conduct the internal incident review, interviews, and recommendations. This is important. Often the people involved in the incident have too much tunnel vision to really see the big picture. (With PagerDuty, you can work with us on this, no product attached – just incident analysis experts who can help you gain insights that may be hard to see when you’re in the middle of it).
  3. Take the time to really understand the gaps and perspectives between executives and front-line technical staff. These can be exacerbated after a major event, and it’s imperative that the person from #2 capture both perspectives through their cognitive interviews. An accurate assessment of this relationship will allow the incident analyst to make recommendations that will shed light on the best ROI.
Arne Lehfeldt, Systems Engineer und CTO Ambassador bei Dell Technologies, erklärt im Podcast Security, Storage und Channel Germany mit Carolina Heyder, warum Unternehmen keine Angst vor KI haben sollten. Arne Lehfeldt, Systems Engineer and CTO Ambassador at Dell Technologies, explains why companies shouldn’t be afraid of AI in the Security, Storage and Channel Germany podcast with Carolina Heyder.

Von Jakob Jung

Dr. Jakob Jung ist Chefredakteur Security Storage und Channel Germany. Er ist seit mehr als 20 Jahren im IT-Journalismus tätig. Zu seinen beruflichen Stationen gehören Computer Reseller News, Heise Resale, Informationweek, Techtarget (Storage und Datacenter) sowie ChannelBiz. Darüber hinaus ist er für zahlreiche IT-Publikationen freiberuflich tätig, darunter Computerwoche, Channelpartner, IT-Business, Storage-Insider und ZDnet. Seine Themenschwerpunkte sind Channel, Storage, Security, Datacenter, ERP und CRM. Dr. Jakob Jung is Editor-in-Chief of Security Storage and Channel Germany. He has been working in IT journalism for more than 20 years. His career includes Computer Reseller News, Heise Resale, Informationweek, Techtarget (storage and data center) and ChannelBiz. He also freelances for numerous IT publications, including Computerwoche, Channelpartner, IT-Business, Storage-Insider and ZDnet. His main topics are channel, storage, security, data center, ERP and CRM. Kontakt – Contact via Mail: jakob.jung@security-storage-und-channel-germany.de

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

WordPress Cookie Hinweis von Real Cookie Banner