Znów o Administratorach Pierwszej Linii Wsparcia?!

O stażu w zespole pisała już Paulina w artykule Staż w Onet.pl, Łukasz pokazał jak wyglądały jego pierwsze dni pracy w zespole.
No dobrze, o Rock&Roll’u nie będę jednak pisał, ale pozostałe tematy postaram się poruszyć tym razem od trochę innej, choć równie ciekawej strony.

ITIL a sprawa Onetowa

Dobry mechanizm działa bez zarzutu jeśli funkcjonują wszystkie jego poszczególne części – największa zębatka w zegarze nie będzie samodzielnie poruszać wskazówkami i podawać godziny jeśli nie pomoże jej w tym dużo mniejszy, ale jakże ważny trybik.
Takim mechanizmem jest współczesne IT i tak stara się działać IT Onet.pl. No tak… łatwo napisać, ale jak sprawić by wszystkie te elementy współgrały ze sobą? Z pomocą przychodzą nam może nie starożytni filozofowie, ale całkiem niedawno zbudowane zasady zawarte w Information Technology Infrastructure Library (skrót ITIL), więcej w Wikipedii.
Ich ostatnia wersja składa się między innymi z najlepszych zasad opisujących procesy Incident Management, Request Fulfilment, Problem Management oraz Change Management. Spróbuję pokazać jak trybik „A1LW” pomaga działać tej maszynie złożonej z naprawdę wielu elementów.

Incident Management

Tam gdzie pracują ludzie, zwłaszcza przy często zmiennych środowiskach, zdarzają się incydenty zaburzające prawidłowe działanie systemów, nie wspominając o zawodności sprzętu. Monitoringiem działania usług, systemów oraz sprzętu pozwalającym na najszybsze wykrycie podobnych sytuacji zajmuje się właśnie Administrator Pierwszej Linii Wsparcia.
Przez 24 godziny na dobę, 7 dni w tygodniu, 365 dni w roku dbamy o to, by sytuacje zagrażające działaniu infrastruktury czy usług wychwycić jak najwcześniej. Usuwanie takich usterek nie jest łatwe – posiadając nawet bardzo szerokie kompetencje, czasem trudno znaleźć jej przyczynę. W sytuacji gdy rozwiązanie awarii wymaga dogłębnej wiedzy z zakresu zaimplementowanego rozwiązania lub zastosowanej technologii przekazujemy ją do zespołów Drugiej Linii Wsparcia, gdzie pracują specjaliści z bardzo wąskiego wycinku portalu np.: bazy danych, poczta czy sieć.

Problem Management

Analiza incydentów usuniętych przez współpracujących ze sobą specjalistów wielu linii wsparcia (pierwszej, drugiej czy trzeciej), patrz „Proces obsługi awarii implementacja dobrych praktyk ITIL„, może czasem wskazywać na głębsze podłoża ich występowania. I tu pojawia się kolejny proces – zarządzanie problemami. Problem można opisać jako „nieznaną przyczynę powstawania wielu incydentów”. Kłopotem w definiowaniu tak rozumianych problemów jest umiejętność powiązania na pozór różnych incydentów ze wspólną przyczyną – tu jedna głowa to często za mało. Problem Management Board to zespół ludzi, który ma „nosa” do takich spraw. W jego skład wchodzą specjaliści z poszczególnych dziedzin jak również osoby, które na co dzień mają styczność z przeróżnymi incydentami rejestrując je, a także rozwiązując na samym początku. Cyklicznie analizując incydenty można dojść do przeróżnych wniosków.

Change Management

Czasem rozwiązanie problemu musi wymagać przygotowania określonych zmian w kodzie aplikacji. Tu wsparcie otrzymujemy od Dreamlabu. Niekiedy zmiana to kilka poprawionych warunków w pętli, zdarza się również, że to konieczność przepisania pokaźnej ilości kodu lub nawet napisania na nowo aplikacji. Nie mniej na końcu tego procesu, po odpowiednim przetestowaniu i serii akceptacji (dotyczących np.: planowania zasobów czy miejsca i czasu wdrożenia) kod zostaje przekazany do zaimplementowania. I tu znów wracamy do Administratorów Pierwszej Linii Wsparcia! Jako członkowie zespołu wdrożeniowego A1LW realizują setki wdrożeń miesięcznie. Oczywiście gros z nich to zmiany związane z rozwojem portalu, a nie usuwaniem problemów.

Request Fulfilment

Na szczęście nie samymi problemami i ich rozwiązywaniem człowiek w IT żyje. Administrator (co zresztą dziwić nie powinno biorąc pod uwagę samą nazwę) – zajmuje się administracją. Realizacja próśb o administrację (z ang. Request for Administration w skrócie RFA) to właśnie zmiany związane ze sprzętem, instalacje systemów, szeroko rozumiany „tuning” aplikacji czy przygotowanie monitoringu.

Podsumowując – kto tu kręci czyli Rock&Roll…

Od monitoringu portalu, usuwania usterek sprzętu i awarii systemów przez definiowanie problemów, wdrażanie ich rozwiązań, do zarządzania infrastrukturą i potężną ilością sprzętu serwerowego (o tym już na pewno czytałeś – Onet Data Center) – wszędzie pracują Administratorzy z zespołu Administratorów Pierwszej Linii Wsparcia.
Niekiedy jako mały trybik, niejednokrotnie jako koło zamachowe – w każdym z opisanych powyżej procesów są oni nieodzowni.

Paweł Czarny
Kierownik Zespołu Administratorów Pierwszej Linii Wsparcia