Cechą nowoczesnych systemów IT jest ich ciągle pogłębiająca się złożoność, zarówno na poziomie infrastruktury sprzętowej i sieciowej, jak i aplikacji. To utrudnia spełnienie wymagań biznesowych dotyczących ciągłości i niezakłóconego działania w świadczeniu usług.
Ważnym zadaniem działu IT staje się zapobieganie awariom, które mogłyby prowadzić do niedostępności usług. Tradycyjnie w tym celu stosowano monitoring logów, śladów i kluczowych metryk, ale w złożonych środowiskach, przy ogromnej liczbie spływających danych stosowane dotąd metody nie wystarczą, aby w czasie rzeczywistym zbudować faktyczny obraz funkcjonowania systemów i przewidzieć, gdzie mogą pojawić się problemy. Zdolność do wykrycia przeciążeń na poziomie infrastruktury i oprogramowania, zanim dotkną one klientów może szybko stać się priorytetem na poziomie zarządów firm.
W trakcie kameralnego spotkania CIONET Vision chcemy porozmawiać o nowym podejściu do monitoringu i analizy działania systemów, określanym jako observability, czyli obserwowalność. Jego celem jest uzyskania lepszego wglądu w istotne parametry pracy całego systemu, które decydują o jego zachowaniu oczami użytkowników.
Zastanowimy się:
• dlaczego obserwacja metryk, zdarzeń, logów przestała być wystarczającym sposobem oceny działania systemów?
• jak zbudować skuteczne mechanizmy monitorowania i analizowania pracy złożonych środowisk?
• jakie wskaźniki brać pod uwagę, aby zapewnić jak największą dostępność usług?
• jak wprowadzenie nowych metodyk, takich jak Site Reliability Engineering może poprawić efektywność systemów i zmniejszyć zapotrzebowanie na wsparcie?
• czy SLA może pozostać najważniejszym parametrem przy ocenie usług?
Dołącz do kameralnej dyskusji w gronie ekspertów!
• dlaczego obserwacja metryk, zdarzeń, logów przestała być wystarczającym sposobem oceny działania systemów?
• jak zbudować skuteczne mechanizmy monitorowania i analizowania pracy złożonych środowisk?
• jakie wskaźniki brać pod uwagę, aby zapewnić jak największą dostępność usług?
• jak wprowadzenie nowych metodyk, takich jak Site Reliability Engineering może poprawić efektywność systemów i zmniejszyć zapotrzebowanie na wsparcie?
• czy SLA może pozostać najważniejszym parametrem przy ocenie usług?