5 kluczowych błędów popełnianych przez Administratorów Systemów

Po kilku latach pracy w charakterze Administratora Systemów i obracania się w towarzystwie podobnych do siebie osobników – zarówno z dużych korporacji jak i małych firemek w kraju i za granicą, dochodzę do kilku intrygujących spostrzeżeń, które niestety naszego fachu nie stawiają w dobrym świetle. Jak w każdym zawodzie, również w administrowaniu systemami zdarzają się fuszerki. Oto lista częstych wpadek, które mam nadzieję odbierzecie jako okazję do sprawdzenia swojego poletka – i jeśli jest taka potrzeba, – do poprawy 🙂

Zaczynamy:

1. Brak działających backupów!!!

Słowo „działający” w zestawieniu ze słowem „backup ” to kluczowa sprawa i w moim zestawieniu miejsce pierwsze. Niestety nawet jeśli posiadamy „jakieś” zapisy, to zdarza się, że nie umiemy ich odzyskać. Nierzadko zapominamy o testowaniu backupów, a gdy zdarzy się najgorsze, z przerażeniem odkrywamy, że przechowywane kopie są bezużyteczne: …a bo nośnik był wadliwy, …a bo nie skopiowaliśmy tego, co trzeba, albo z powodu jakiegoś błędu kopia wcale się nie wykonała, a my nie powtórzyliśmy backupu…

Warto wprowadzić w życie procedurę odzyskiwania losowych danych, lub nawet całych serwerów, aby upewnić się że proces tworzenia kopii bezpieczeństwa jest sensowny i skuteczny.

Równie istotne jest cykliczne sprawdzanie, czy backupujemy wszystko. Głupio przecież tłumaczyć się, że nie wiedzieliśmy o nowym serwerze i nie mamy jego kopii 🙂

2. Brak dokumentacji

Każdy od czasu do czasu lubi sobie psioczyć na zbędną papierkową robotę – należy jednak pokornie przyznać, że jakieś niezbędne minimum dokumentów trzeba utrzymywać. Wielu naszych kolegów z branży gubi się w skomplikowanej infrastrukturze, którą paradoksalnie sami przez lata komplikowali 🙂 Tradycją też w naszym zawodzie jest psioczenie na poprzedniego administratora, który zostawił nam bałagan.

Obywatele admini! Twórzmy layouty, aktualizujmy spisy, a czas, który oszczędzimy sami sobie będzie nagrodą. Jeśli nas kiedyś zabraknie (i w niewytłumaczalny sposób firma jakoś przetrwa) – to nasi następcy będą czcili nasze imiona i dziękowali nam za zostawienie porządku 🙂

3.  Bezmyślny restart dobry na wszystko

Ponowny rozruch, czyli restart („-Czy ponownie rozruszałeś swój komputer? „) to coś, co w życiu admina odgrywa ogromną rolę i potencjalnie jako słowo pada każdego dnia częściej niż słowo „kawa”. Stąd też nadużycia i wpadki…

Jak mawiał Abraham Maslow,

Gdy w ręku masz tylko młotek, wszystkie problemy zaczynają wyglądać jak gwoździe.

Stąd też moi mili, zaobserwowałem tendencję restartowania wszystkiego co się da – nawet wielokrotnego – bez analizowania dlaczego ten restart jest w ogóle potrzebny…

Ale to nie koniec! Ilu z Was zdarzyło się zrestartować nie to co trzeba? Paluszek się omsknął? Ok, każdemu się może zdarzyć.

Głupio jednak restartować to samo, co kolega zrobił 3 minuty wcześniej. A wystarczyłoby przed restartem sprawdzić uptime na zdalnej maszynie: działającej od 3 minut zazwyczaj nie trzeba restartować, prawda?

4.  Wszystko na raz

..czyli „Trzymanie Wielu srok za ogon” . Ta ludowa mądrość dotyczy wielowątkowości, a wymyślono ją zanim wynaleziono procesory 🙂 Często sam się łapię na tym, że wykonywanie kilku czynności na raz wcale nie przyśpiesza pracy, a już na pewno nie poprawia jej jakości.
Tak, zgadzam się, każdy z nas jest inny, i owszem pisanie maila, w czasie gdy coś w tle się restartuje to nie jest jakieś wybitne osiągnięcie. Ale wiecie co mam na myśli: skupienie się na jednym problemie nie raz daje lepsze efekty, niż próba zrobienia wszystkiego na raz, a już na pewno zmniejsza szansę na popełnienie błędu:)

5. Kontrola wersji i update’y.

Zacznijmy od poprawek: czy to mówimy o update’ach Microsoftu, czy nowych wersjach Javy i FlashPlayera, ich ważność polega na łataniu coraz to nowych dziur bezpieczeństwa. Jeżeli Wasz admin nie instaluje poprawek, to znaczy, że to lama lub obibok, a Wasze systemy trzymają się kupy siłą przyzwyczajenia…

A co z nowymi wersjami softu? To jest odwieczna zagwozdka administratora systemów. Czy nowe jest lepsze? Czy Lepsze jest wrogiem dobrego?

Choć nieraz wygląda to tak, jakby miały nas zmusić do kupowania coraz to lepszego sprzętu, to nowe wersje programów i systemów generalnie powstają również po to, by działały lepiej niż poprzednie. Prawdziwy problem pojawia się gdy administrator długo upiera się przy starym, co owocuje posiadaniem niewspieranych aplikacji i systemów, do których nie wychodzą poprawki bezpieczeństwa, a każdy haker na świecie zna ich słabości. Niestety w IT nie ma miejsca na sentymentalność i muzea: trzeba iść z postępem…

No i oczywiście przegięcie w drugą stronę: upgrade wszystkiego bez czasu na testy. Niejeden admin wdrażał poprawki i nowe wersje softu, które producent po chwili wycofywał. Warto mieć program testów kluczowych systemów w firmie, po to, by nowa wersja tej firmy nie rozłożyła na łopatki.

Oczywiście błędów jakie popełniają admini, również ci bardzo doświadczeni, są tysiące. Ja wybrałem 5, które według mnie są kluczowe (pewnie tych 5 wystarczy, aby Gildia Administratorów ochrzicła mnie ZDRAJCĄ i rozesłała za mną listy gończe).

A Wy co byście dodali do listy?

Łukasz Skalikow

Obecnie Manager IT. Przez lata byłem Inżynierem systemów. Jestem entuzjastą i specem od vSphere, Windows serwer, GPO. Od zawsze byłem zwolennikiem wiersza poleceń i automatyzacji. Obecnie, ze względu na pracę, rodzinę i wyjazdy służbowe, dużo mniej udzielam się na blogu, ale mam nadzieję, że pośród kilkuset porad opublikowanych na spece.it, wiele osób znajdzie dla siebie coś przydatnego :)

Przeczytaj także...

5 komentarzy

  1. psvmware napisał(a):

    Ja bym dodal do tej listy jeszcze jedno. Mianowicie obowiazkowy restart serwerow raz na jakis czas, aby wiadomo bylo ze serwer potrafi wykonac restart, a wszystkie uslugi wstaja tak jak nalezy. Wiele razy widzialem jak byly restarty maszyn a te o dziwo nie potrafily sie podniesc z powodu wadliwej konfiguracji itp. Czesto jest tak ze admini boja restartowac sie serwerow bo nikt nie wie czy to ‚jeszcze wstanie’ 😉 Co z tego ze mozemy trzymac serwery w klastrach itd itp, jak podczas restartu serwer nie wstanie z powodu blednej konfiguracji.
    Tak jak Lukasz zauwazyles sporo bledow jest popelniach przez ludzi czasami nieswiadomie/niechcaco. W duzych srodowiskach warto wprowadzac orkiestracje/automatyzacje powtarzalnych zadan. Czasami czlowiek sie zapetli i skoro robil to 1000 razy i nie skojarzy ze w jakims przypadku trzeba bylo zrobic inaczej. Wtedy warto np. miec jakas orkiestracje do takich powtarzalnych zadan aby minimalizowac bledy ktore mozemy popelnic.

  2. Andrzej napisał(a):

    Ja bym dodał trzymanie haseł i dostępu tylko dla jednego admina, a drugi niech się wozi …..

  3. Marek napisał(a):

    Nieskończenie długa lista TODO 🙂
    Zamiast zrobić, lepiej dopisać do listy i czekać na jeszcze więcej wolnego czasu 😉

  4. Adam napisał(a):

    Hasła typu admin1 😉

Dodaj komentarz