Risky Business – jak zapanować nad kryzysem

Written by Wanda | 9/18/17 7:39 AM

Podczas wrześniowego spotkania CIONET w Warszawie, w gościnnych progach Agory, rozmawialiśmy o sytuacjach kryzysowych w IT: jak nad nimi zapanować i zminimalizować straty.

[gallery ids="24006,24007,24008,24010,24011,24013,24014,24015,24016,24017,24018,24019,24020,24021,24022,24023,24024,24025,24026,24027,24028,24029,24030,24031,24032,24033,24034"]

Maciej Oleksowicz (prezes zarządu) i Robert Kucharczyk (CIO) z Inter Cars bardzo szczerze i otwarcie opowiedzieli o ataku PETYA, którego ich firma padła ofiarą 27 czerwca 2017 r. W pierwszych godzinach nawet nie zdawali sobie sprawy ze skali awarii. Wirus zablokował wszystkie serwery, firma, która ma bardzo rozczłonkowaną strukturę, została odcięta od wszystkich systemów, także od komunikacji. Brakowało planu awaryjnego – jak się porozumiewać, gdy zabraknie narzędzi używanych na co dzień? Został powołany sztab kryzysowy, który pracował non stop przez dwie doby, pomogli także eksperci zewnętrzni. Całą firmę trzeba było odtworzyć z backupu.

Maciej Oleksowicz bardzo szybko zdecydował, że będzie bardzo otwarcie mówił o zdarzeniu i to okazało się bardzo dobrym posunięciem z wizerunkowego punktu widzenia.

Pracownicy stanęli na wysokości zadania i sytuację udało się opanować – po tygodniu klienci już mogli znowu korzystać z systemów Inter Cars.

Robert Kucharczyk uważa, że w firmie niezbędna jest funkcja oficera bezpieczeństwa, który będzie mógł z neutralnej pozycji przyglądać się wszystkim działaniom.

Marcin Mazurek z Allegro podkreślał, jak bardzo skomplikowana jest architektura tego serwisu – składa się z ok. 500 mikroserwisów, a w ciągu doby jest wprowadzanych bardzo wiele nowych wersji. Zmiany wprowadzane są właściwie w sposób ciągły i jest to duży obszar dla potencjalnej awarii. Zespół IT stara się robić wszystko, żeby poszczególne elementy działały, przeprowadzane są też ciągłe testy bezpieczeństwa. Klasyczny podział na development i operacje nie mógłby się sprawdzić w takiej sytuacji, za to doskonale funkcjonuje model DevOps. Za każdą usługę odpowiada konkretny zespół. Można działać szybko, nie obniżając jakości. Bardzo przydatny jest komunikator, na którym pojawiają się wszystkie informacje także związane z bezpieczeństwem – często anomalie wyłapywane są dzięki temu szybciej niż przez system. Po każdej awarii powstaje podsumowanie, które pozwala przeanalizować problem i wyciągnąć z niego wnioski.

Adam Łaszyn, którego firma Alert Media Communications, specjalizuje się w komunikacji kryzysowej, opowiadał o mechanizmach kryzysu w mediach oraz o skutecznych metodach postępowania w podbramkowych sytuacjach. Przede wszystkim, to media decydują o tym, że mamy kryzys – jeśli w mediach pojawia się problem, nawet nierzeczywisty, to rozdmuchany może spowodować ogromne straty. Kryzysy karmią się błędami, trzeba szybko naprawić problemy, a nie brnąć dalej. Firmy, które stawiają na szybki rozwój są bardziej narażone na kryzysy – im większy sukces i rozpoznawalność, tym są atrakcyjniejsze dla mediów.

Kluczowa zasada kryzysowa: często nie mamy wpływu na to, co się wydarzyło, ale mamy wpływ na to, jak zareagujemy i od tego bardzo dużo zależy. W każdej kryzysowej narracji można wyróżnić trzy klasyczne postaci: zły, dobry i ofiara. Bardzo ważne jest zdiagnozowanie, w którym miejscu na tym schemacie jesteśmy i jak poszczególne działania będą nas na nim przesuwać.