Podziel się

mierzenie SLA Zagadnienie jak mierzyć parametry SLA jest bardzo rozległe i jego rzetelne przedstawienie, wymagało podzielenia materiału na dwie części. W pierwszej części opisałem parametry SLA związane z dostępnością i czasem rozwiązania. W części drugiej rozwinę temat czasu rozwiązania i czasu reakcji oraz wydajności.

Czas rozwiązania

Czas rozwiązania może dotyczyć zarówno incydentów, problemów jak i service requestów. Zasady związane z mierzeniem czasu rozwiązania są dla wszystkich analogicznie. Kluczowe jest ustalenie:

czasu rozpoczęcia
czasu zakończenia
zatrzymania czasu rozwiązania

Przykładowe zdarzenia rozpoczynające i kończące czas rozwiązania, podałem w części pierwszej. Oczywiście, które powinny być użyte do mierzenia czasu rozwiązania zależy, kto ten parametr definiuje. Dostawca, czy to w postaci wewnętrznego działu IT czy firmy zewnętrznej, będzie dążył do „skracania” początku i końca związanego z czasem rozwiązania. Oznacza to, że będzie wybierał te zdarzenia, które są korzystne dla niego. Jako rozpoczęcie będzie wskazywał, potwierdzenie przez Service Desk przyjęcia zgłoszenia, a jako zakończenie, rozwiązanie zgłoszenia przez zespoły wsparcia.

Klient, nazywany również biznesem, będzie chciał aby czas rozwiązania obejmował jak najszerszy przedział czasu. Jest to jak najbardziej naturalne postępowanie obu stron :-).

Do wyjaśnienia pozostaje jeszcze kwestia zatrzymywania czasu rozwiązania. Jest to sposób na wydłużanie czasu rozwiązania, w sytuacji gdy zespoły wsparcia nie mogą rozwiązywać zgłoszenia, ponieważ:

Nie mogą odtworzyć błędu i potrzebują kontaktu ze zgłaszającym
Brakuje im wymaganych w zgłoszeniu danych
Do rozwiązania potrzebują interakcji ze zgłaszającym

Oczywiście mówimy tu o zatrzymywaniu czasu rozwiązania, tylko w uzasadnionych przypadkach. Nie można dopuścić do sytuacji, w której zatrzymywany jest czas rozwiązania, aby „sztucznie” wydłużyć jego trwanie. Z drugiej strony, nie może być wliczane do czasu rozwiązania oczekiwanie na kontakt, ze zgłaszającym, który jest zajęty lub nieobecny w pracy.

Czas reakcji

Z czasem reakcji jest trochę łatwiej, niż z czasem rozwiązania, jednak musimy uważać na jego rozpoczęcie. Zakończenie czasu reakcji jest mniej problematyczne i przeważnie jest nim potwierdzenie przez Service Desk przyjęcia zgłoszenia. Bardzo często to potwierdzenie jest automatyczne, po zarejestrowaniu zgłoszenia w systemie ITSM lub wysłaniu emaila na określony adres.

Zwrócić należy uwagę na rozpoczęcie czasu reakcji, który może być mierzony od:

Odebrania zgłoszenia telefonicznego przez operatora Service Desk
Wysłania emaila na wskazany adres
Zarejestrowania zgłoszenia w systemie klasy ITSM

W zależności, które zdarzenie wybierzemy, będziemy mieli inną wartość czasu reakcji.

Bardzo ważne jest, aby ustalić z biznesem, początek i koniec czasu reakcji i rozwiązania, aby nie było później nieporozumień, co do ich mierzenia i rozliczania.

Wydajność

Jak mierzyć parametry SLA dla wydajności, wolumetrii i czasu odpowiedzi, jest bardzo złożonym zagadnieniem obszaru SLA.

Po pierwsze, należy zwrócić uwagę, czy pomiar jest wykonywany z perspektywy systemy czy użytkownika końcowego. Bardzo często mierzymy czas odpowiedzi na serwerze aplikacyjnym, nie uwzględniając opóźnień sieciowych i innych występujących pomiędzy użytkownikiem końcowym a systemem/aplikacją IT.
Po drugie, jakie operacje, czynności podlegają pomiarowi. Aby optymalizować kosztowo testy wydajnościowe, uwzględnia się tylko najważniejsze i najczęściej wykorzystywane ścieżki działania użytkownika. Może to prowadzić do nie mierzenia w ogóle, pewnych aktywności w systemie.
Po trzecie, testy wydajnościowe przeprowadzane są najczęściej na środowisku testowym, które nie odzwierciedla w 100% środowiska produkcyjnego, co może skutkować niedokładnością pomiaru. Dodatkowo, testy wydajnościowe przeprowadzane są przeważnie raz, podczas tworzenia systemu/aplikacji. Aby weryfikacja podczas testów wydajnościowych była wiarygodna, powinno się je powtarzać okresowe co 3 lub 6 miesięcy.
Po czwarte, testy wydajnościowe nie mierzą rzeczywistej wolumetrii i czasów odpowiedzi, tylko wyznaczają wartości w środowisku laboratoryjnym. Aby mierzyć wartości rzeczywiste, w środowisku produkcyjnym, należy wybrać jedną z możliwości:
- Uruchomić i skonfigurować narzędzie monitorowania wydajności, np. appDynamics aby móc na bieżąco, mierzyć parametry wydajnościowe
- Zaprojektować i wdrożyć mechanizm, wyznaczania czasów pojedynczych wywołań, dla poszczególnych usług. Czasy te powinny być zapisywane w dedykowanej tabeli, na podstawie której można będzie wyliczyć, wymagane parametry wydajnościowe

Zagadnienia pomiaru wydajności są bardzo ciekawe i wielowątkowe, dlatego pomyślę aby opisać je bardziej szczegółowo w oddzielnym artykule.

Tak naprawdę, to przedstawiłem tylko najważniejsze kwestie związane z mierzeniem wybranych, najczęściej stosowanych parametrów SLA. Mam nadzieję, że zainteresowałem Ciebie tą wiedzą. Jeżeli masz pytania, napisz je w komentarzu. Chętnie na wszystkie odpowiem. Na koniec pytanie ode mnie.

Pytanie: Jak mierzysz rzeczywiste wartości parametrów wydajnościowych?

Podziel się

Discover more from Mariusz Siek

Subscribe to get the latest posts sent to your email.

Mariusz Siek

Knowledge and Experience in ITSM and more

Jak mierzyć parametry SLA – część 2

Czas rozwiązania

Czas reakcji

Wydajność

Related

Discover more from Mariusz Siek

Dodaj komentarz Anuluj pisanie odpowiedzi