Zagadnienie jak mierzyć parametry SLA jest bardzo rozległe i jego rzetelne przedstawienie, wymagało podzielenia materiału na dwie części. W pierwszej części opisałem parametry SLA związane z dostępnością i czasem rozwiązania. W części drugiej rozwinę temat czasu rozwiązania i czasu reakcji oraz wydajności.
Czas rozwiązania
Czas rozwiązania może dotyczyć zarówno incydentów, problemów jak i service requestów. Zasady związane z mierzeniem czasu rozwiązania są dla wszystkich analogicznie. Kluczowe jest ustalenie:
- czasu rozpoczęcia
- czasu zakończenia
- zatrzymania czasu rozwiązania
Przykładowe zdarzenia rozpoczynające i kończące czas rozwiązania, podałem w części pierwszej. Oczywiście, które powinny być użyte do mierzenia czasu rozwiązania zależy, kto ten parametr definiuje. Dostawca, czy to w postaci wewnętrznego działu IT czy firmy zewnętrznej, będzie dążył do „skracania” początku i końca związanego z czasem rozwiązania. Oznacza to, że będzie wybierał te zdarzenia, które są korzystne dla niego. Jako rozpoczęcie będzie wskazywał, potwierdzenie przez Service Desk przyjęcia zgłoszenia, a jako zakończenie, rozwiązanie zgłoszenia przez zespoły wsparcia.
Klient, nazywany również biznesem, będzie chciał aby czas rozwiązania obejmował jak najszerszy przedział czasu. Jest to jak najbardziej naturalne postępowanie obu stron :-).
Do wyjaśnienia pozostaje jeszcze kwestia zatrzymywania czasu rozwiązania. Jest to sposób na wydłużanie czasu rozwiązania, w sytuacji gdy zespoły wsparcia nie mogą rozwiązywać zgłoszenia, ponieważ:
- Nie mogą odtworzyć błędu i potrzebują kontaktu ze zgłaszającym
- Brakuje im wymaganych w zgłoszeniu danych
- Do rozwiązania potrzebują interakcji ze zgłaszającym
Oczywiście mówimy tu o zatrzymywaniu czasu rozwiązania, tylko w uzasadnionych przypadkach. Nie można dopuścić do sytuacji, w której zatrzymywany jest czas rozwiązania, aby „sztucznie” wydłużyć jego trwanie. Z drugiej strony, nie może być wliczane do czasu rozwiązania oczekiwanie na kontakt, ze zgłaszającym, który jest zajęty lub nieobecny w pracy.
Czas reakcji
Z czasem reakcji jest trochę łatwiej, niż z czasem rozwiązania, jednak musimy uważać na jego rozpoczęcie. Zakończenie czasu reakcji jest mniej problematyczne i przeważnie jest nim potwierdzenie przez Service Desk przyjęcia zgłoszenia. Bardzo często to potwierdzenie jest automatyczne, po zarejestrowaniu zgłoszenia w systemie ITSM lub wysłaniu emaila na określony adres.
Zwrócić należy uwagę na rozpoczęcie czasu reakcji, który może być mierzony od:
- Odebrania zgłoszenia telefonicznego przez operatora Service Desk
- Wysłania emaila na wskazany adres
- Zarejestrowania zgłoszenia w systemie klasy ITSM
W zależności, które zdarzenie wybierzemy, będziemy mieli inną wartość czasu reakcji.
Bardzo ważne jest, aby ustalić z biznesem, początek i koniec czasu reakcji i rozwiązania, aby nie było później nieporozumień, co do ich mierzenia i rozliczania.
Wydajność
Jak mierzyć parametry SLA dla wydajności, wolumetrii i czasu odpowiedzi, jest bardzo złożonym zagadnieniem obszaru SLA.
- Po pierwsze, należy zwrócić uwagę, czy pomiar jest wykonywany z perspektywy systemy czy użytkownika końcowego. Bardzo często mierzymy czas odpowiedzi na serwerze aplikacyjnym, nie uwzględniając opóźnień sieciowych i innych występujących pomiędzy użytkownikiem końcowym a systemem/aplikacją IT.
- Po drugie, jakie operacje, czynności podlegają pomiarowi. Aby optymalizować kosztowo testy wydajnościowe, uwzględnia się tylko najważniejsze i najczęściej wykorzystywane ścieżki działania użytkownika. Może to prowadzić do nie mierzenia w ogóle, pewnych aktywności w systemie.
- Po trzecie, testy wydajnościowe przeprowadzane są najczęściej na środowisku testowym, które nie odzwierciedla w 100% środowiska produkcyjnego, co może skutkować niedokładnością pomiaru. Dodatkowo, testy wydajnościowe przeprowadzane są przeważnie raz, podczas tworzenia systemu/aplikacji. Aby weryfikacja podczas testów wydajnościowych była wiarygodna, powinno się je powtarzać okresowe co 3 lub 6 miesięcy.
- Po czwarte, testy wydajnościowe nie mierzą rzeczywistej wolumetrii i czasów odpowiedzi, tylko wyznaczają wartości w środowisku laboratoryjnym. Aby mierzyć wartości rzeczywiste, w środowisku produkcyjnym, należy wybrać jedną z możliwości:
- Uruchomić i skonfigurować narzędzie monitorowania wydajności, np. appDynamics aby móc na bieżąco, mierzyć parametry wydajnościowe
- Zaprojektować i wdrożyć mechanizm, wyznaczania czasów pojedynczych wywołań, dla poszczególnych usług. Czasy te powinny być zapisywane w dedykowanej tabeli, na podstawie której można będzie wyliczyć, wymagane parametry wydajnościowe
Zagadnienia pomiaru wydajności są bardzo ciekawe i wielowątkowe, dlatego pomyślę aby opisać je bardziej szczegółowo w oddzielnym artykule.
Tak naprawdę, to przedstawiłem tylko najważniejsze kwestie związane z mierzeniem wybranych, najczęściej stosowanych parametrów SLA. Mam nadzieję, że zainteresowałem Ciebie tą wiedzą. Jeżeli masz pytania, napisz je w komentarzu. Chętnie na wszystkie odpowiem. Na koniec pytanie ode mnie.
Pytanie: Jak mierzysz rzeczywiste wartości parametrów wydajnościowych?