Podstawy SRE czyli tworzenie i utrzymanie wysoce-niezawodnych systemów.

#SRE. Site Reliability Engineering

to dążenie do tworzenia i utrzymania skalowalnych i wysoce-niezawodnych systemów. Wykorzystywane przez takie organizacje jak Google czy Red Hat.

Site Reliability Engineering to zespół specjalistów, który poświęca ~50% czasu na wykonywanie manualnych prac w systemach IT i rozwiązywanie bieżących problemów z wydajnością. Kolejne ~50% czasu poświęca na systematyczne identyfikowanie, optymalizowanie i automatyzowanie zadań, których nikt nie lubi robić. Przypomina to trochę zachowanie systmów HIDS (Host Intrusion Detection System) pracujących w modelu Search & Destroy

Zespoły SRE nie są alternatywą dla zwinnych, cross-funkcjonalnych, samo-organizujących się zespołów DevOps, zbudowanych wokół mikro-serwisów, lecz z nim współpracują. Zespoły DevOps tworzą i dostarczają mikro-serwisy, dbając o ich niezawodność (w myśl zasady ‘You build It, You Run It’). Inżynierowie SRE odpowiadają zaś za dostępność całego systemu (sumy wszystkich mikro-serwisów) oraz MIM ( Major Incident Management) – (by ITIL4).

SRE pomaga zespołom znaleźć równowagę między udostępnianiem nowych funkcji a upewnianiem się, że są one niezawodne dla użytkowników.

Co robi SRE

Inżynier niezawodności witryny to wyjątkowa rola, która wymaga albo doświadczenia jako programista z dodatkowym doświadczeniem operacyjnym albo roli DevOpsa, która ma również umiejętności tworzenia oprogramowania.

Zespoły SRE są odpowiedzialne za sposób wdrażania, konfigurowania i monitorowania kodu, a także za dostępność, opóźnienia, zarządzanie zmianami, reagowanie na sytuacje awaryjne i zarządzanie wydajnością usług w środowisku produkcyjnym.

Inżynieria niezawodności witryny pomaga zespołom określić, jakie nowe funkcje można uruchomić i kiedy, korzystając z umów dotyczących poziomu usług (SLA) w celu określenia wymaganej niezawodności systemu za pomocą wskaźników poziomu usług (SLI) i celów poziomu usług (SLO).

Wsparcie SRE

SRE opiera się na automatyzacji rutynowych zadań operacyjnych i standaryzacji w całym cyklu obsługi zmian. System 99NET Inventory wspiera SRE poprzez funkcjonalność zadań powtarzalnych, przypomnień i powiadomień. Dodatkowo, umożliwia automatyzację poprzez zestaw predefiniowanych reguł.

Demo

Oceń przydatność posta
[Łącznie: 0 Średnio: 0]
99NET - Łączymy Ludzi i Technologie
© Prawa autorskie zastrzeżone