Site Reliability Engineering. Jak Google zarządza systemami producyjnymi
- Autorzy:
- Betsy Beyer, Chris Jones, Jennifer Petoff, Niall Richard Murphy
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 504
- Druk:
- oprawa miękka
- Dostępne formaty:
-
PDFePubMobi
Opis ebooka: Site Reliability Engineering. Jak Google zarządza systemami producyjnymi
Historia firmy Google może być analizowana na wiele sposobów. Można podziwiać jej błyskawiczny rozwój i niesamowitą umiejętność skalowania usług. Na uwagę zasługuje jej innowacyjność i zaangażowanie w rozwijanie technologii, które jeszcze wczoraj wydawały się fikcją. Nie możemy traktować tradycji jako autorytetu, musimy nauczyć się myśleć od nowa i nie mamy czasu na czekanie — tak brzmi filozofia firmy, która przyświeca jej ogromnemu sukcesowi. W ten sposób narodziły się praktyki z obszarów rozwoju oprogramowania, ale i zarządzania zwane SRE: Site Reliability Engineering. Każda firma może je zastosować, ale tylko Google mógł je wymyślić.
Jeśli chcesz zrozumieć filozofię SRE, trzymasz w ręku właściwą, choć nietypową książkę. Jest to zbiór najciekawszych esejów i artykułów autorstwa osób odpowiedzialnych za SRE w Google. Z lektury tych esejów dowiesz się, w jaki sposób zaangażowanie w cały cykl życia oprogramowania umożliwił skuteczne budowanie, wdrażanie, monitorowanie i konserwowanie jednych z największych systemów informatycznych świata. Poznasz zasady i praktyki, które pozwalają inżynierom z Google tworzyć bardziej skalowalne i niezawodne oraz wydajniejsze systemy. Zaprezentowane tu podejście SRE możesz naturalnie bezpośrednio wdrożyć w swojej organizacji.
W tej książce:
- wyjaśniono, czym jest Site Reliability Engineering (SRE) i dlaczego podejście to różni się od tradycyjnych praktyk z branży IT,
- opisano wzorce, operacje i obszary zainteresowania wpływające na pracę inżynierów SRE,
- przedstawiono zasady codziennej pracy inżynierów SRE,
- pokazano, jak budować duże rozproszone systemy informatyczne i nimi zarządzać,
- skomentowano stosowane w Google dobre praktyki z obszaru szkoleń, komunikacji i spotkań.
SRE — niezbędne, gdy podstawą sukcesu jest niezawodność systemu!
Betsy Beyer pisze dokumentacje techniczne dla Google. Specjalizuje się w podejściu SRE. Kilka lat temu była wykładowcą na Stanford University.
Chris Jones jest inżynierem SRE odpowiedzialnym za Google App Engine. Wcześniej odpowiadał za statystyki reklam, hurtownie danych i system pomocy technicznej w Google.
Jennifer Petoff jest menedżerem programu w zespole SRE w Google. Zarządzała dużymi globalnymi projektami z wielu dziedzin, takich jak badania naukowe, inżynieria czy kadry.
Niall Murphy kieruje zespołem SRE odpowiedzialnym za reklamy w Google. Przewodniczy organizacji INEX — irlandzkiego huba internetowego. Jest też autorem lub współautorem wielu prac i książek technicznych.
Zdecydowana większość czasu życia systemu informatycznego jest on używany, a nie projektowany lub implementowany. Dlaczego więc zgodnie z tradycyjną mądrością inżynierowie oprogramowania koncentrują się głównie na etapach projektowania i pisania systemów informatycznych działających na dużą skalę?
W tym zbiorze esejów i artykułów ważni członkowie jednostki SRE z Google’a wyjaśniają, jak i dlaczego ich zaangażowanie w cały cykl życia umożliwił firmie skuteczne budowanie, wdrażanie, monitorowanie i konserwowanie jednych z największych systemów informatycznych świata. Poznasz tu zasady i praktyki, które pozwalają inżynierom z Google’a tworzyć bardziej skalowalne i niezawodne oraz wydajniejsze systemy. Lekcje te możesz bezpośrednio wykorzystać w swojej firmie.
Ta książka jest podzielona na cztery części:
- Wprowadzenie — Z tej części dowiesz się, czym jest Site Reliability Engineering (SRE) i dlaczego podejście to różni się od tradycyjnych praktyk z branży IT.
- Zasady — W tej części opisane są wzorce, operacje i obszary zainteresowania wpływające na pracę inżynierów SRE.
- Praktyki — Dzięki tej części zrozumiesz teorię i praktykę codziennej pracy inżynierów SRE, polegającej na budowaniu dużych rozproszonych systemów informatycznych i zarządzaniu nimi.
- Zarządzanie — Tu poznasz stosowane w Google’u dobre praktyki z obszaru szkoleń, komunikacji i spotkań. Możesz wykorzystać te praktyki w swojej firmie.
Betsy Beyer, Chris Jones, Jennifer Petoff i Niall Richard Murphy są pracownikami jednostki SRE w Google’u. Jednostka ta odpowiada za opiekę nad systemami produkcyjnymi tej firmy.
„Szczegółowe omówienie praktyk technicznych i z obszaru zarządzania. Każda firma może je zastosować, ale tylko Google mógł je wymyślić”.
— Thomas A. Limoncelli. Były inżynier SRE z Google’a i współautor książki The Practice of Cloud System Administration (Addison-Wesley)
„Lektura obowiązkowa dla każdego, kto zarządza wysoce dostępnymi usługami sieciowymi działającymi w dużej skali”.
— Adrian Cockcroft. Battery Ventures, były architekt ds. chmury w firmie Netflix
„Jesteś winien samemu sobie i swojej organizacji przeczytanie tej książki i samodzielne wypróbowanie opisanych tu pomysłów”.
— Jez Humble. Współautor książek Ciągłe dostarczanie oprogramowania (Addison-Wesley) i Lean Enterprise (O’Reilly)
Wybrane bestsellery
-
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(57.84 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Publikacjami poświęconymi zarządzaniu projektami można wypełnić całe biblioteki. Dostępne są niemal encyklopedyczne kompendia wiedzy na ten temat, wyjaśniające metodologie prowadzenia projektów, sposoby ich klasyfikacji czy też przewagi i niedociągnięcia poszczególnych z nich. Z licznych pozycji ...
10 zasad dowożenia projektów nierealnych. Jak odnosić sukcesy w trudnych i złożonych projektach informatycznych 10 zasad dowożenia projektów nierealnych. Jak odnosić sukcesy w trudnych i złożonych projektach informatycznych
(35.40 zł najniższa cena z 30 dni)41.30 zł
59.00 zł(-30%) -
Oto zwięzłe i równocześnie praktyczne kompendium, w którym znajdziesz 20 praktyk udanego planowania, analizy, specyfikacji, walidacji i zarządzania wymaganiami. Praktyki te są odpowiednie dla projektów zarządzanych zarówno w tradycyjny, jak i zwinny sposób, niezależnie od branży. Sprawią, że zesp...
Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej
(40.20 zł najniższa cena z 30 dni)46.90 zł
67.00 zł(-30%) -
Funkcjonujemy w rzeczywistości, którą cechują wysoka zmienność i niepewność. Otoczenie biznesowe i społeczne przedsiębiorstw w Polsce i na świecie jest złożone, bardzo niejednoznaczne ― o wiele bardziej, niż miało to miejsce jeszcze trzydzieści, dwadzieścia, a nawet dziesięć lat temu. Dlate...
Modelowanie procesów biznesowych. BPMN 2.0 od podstaw Modelowanie procesów biznesowych. BPMN 2.0 od podstaw
(32.94 zł najniższa cena z 30 dni)38.43 zł
54.90 zł(-30%) -
Agile i Scrum, Scrum i Agile. Opanowawszy branżę IT, powoli, ale konsekwentnie, zdobywają inne biznesowe przyczółki i rozgaszczają się w firmach na dobre… Albo niedobre, gdy budzą niezrozumienie, protesty, a czasem nawet chęć ucieczki! Agile i Scrum brzmią tak nowocześnie, w teorii świetnie...(23.94 zł najniższa cena z 30 dni)
27.93 zł
39.90 zł(-30%) -
Zostań mistrzem zarządzania czasem i zdobądź niezwykle ważne umiejętności przekładające się na jakość wykonywanej pracy. Utrata kontroli nad cyklem dnia i brak planowania zadań często prowadzą do większego stresu, zaniedbywania obowiązków i niedotrzymywania terminów. Zwłaszcza w dynamicznym środo...
Zarządzanie czasem w IT. Kurs video. Zwiększ swoją produktywność w pracy Zarządzanie czasem w IT. Kurs video. Zwiększ swoją produktywność w pracy
(39.90 zł najniższa cena z 30 dni)39.59 zł
99.00 zł(-60%) -
Głębokie sieci neuronowe mają niesamowity potencjał. Osiągnięcia ostatnich lat nadały procesom uczenia głębokiego zupełnie nową jakość. Obecnie nawet programiści niezaznajomieni z tą technologią mogą korzystać z prostych i niezwykle skutecznych narzędzi, pozwalających na sprawne implementowanie p...
Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III
(107.40 zł najniższa cena z 30 dni)125.30 zł
179.00 zł(-30%) -
Ta książka jest trzecim, starannie zaktualizowanym wydaniem wyczerpującego przewodnika po narzędziach analitycznych Pythona. Uwzględnia Pythona 3.0 i bibliotekę pandas 1.4. Została napisana w przystępny sposób, a poszczególne zagadnienia bogato zilustrowano przykładami, studiami rzeczywistych prz...
Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III
(71.40 zł najniższa cena z 30 dni)83.30 zł
119.00 zł(-30%) -
Tę książkę docenią programiści, menedżerowie, inżynierowie i liderzy techniczni. Znajdziesz w niej cenne informacje o filozofii inżynierii oprogramowania, jak również o postępach w sposobie myślenia na jej temat. Na tej bazie oparto zestaw zasad ułatwiających skuteczne radzenie sobie z dwoma pods...
Nowoczesna inżynieria oprogramowania. Stosowanie skutecznych technik szybszego rozwoju oprogramowania wyższej jakości Nowoczesna inżynieria oprogramowania. Stosowanie skutecznych technik szybszego rozwoju oprogramowania wyższej jakości
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Początkowo DevOps dotyczyło branży IT i miało zapobiegać konfliktom zespołów w ramach firmy. Dziś zasady i wzorce DevOps pozwalają na przełamanie problemów, które bez interwencji powodowały opóźnienia w dostarczaniu produktów, ich niską jakość i powiększanie się...
DevOps. Światowej klasy zwinność, niezawodność i bezpieczeństwo w Twojej organizacji. Wydanie II DevOps. Światowej klasy zwinność, niezawodność i bezpieczeństwo w Twojej organizacji. Wydanie II
Gene Kim, Jez Humble, Patrick Debois, John Willis, Nicole Forsgren, PhD
(59.40 zł najniższa cena z 30 dni)69.30 zł
99.00 zł(-30%)
O autorze ebooka
Chris Jones jest inżynierem SRE odpowiedzialnym za Google App Engine. Wcześniej odpowiadał za statystyki reklam, hurtownie danych i system pomocy technicznej w Google.
Betsy Beyer, Chris Jones, Jennifer Petoff, Niall Richard Murphy - pozostałe książki
-
W tej książce znajdziesz wszystkie informacje, które są Ci potrzebne do stworzenia środowiska sprzyjającego tworzeniu innowacyjnych rozwiązań. Dowiesz się, jak dostrzegać i wykorzystywać naturalne talenty każdego członka zespołu. Zapoznasz się z szeregiem praktycznych wskazówek, dzięki którym zid...
Decyzyjni. Jak zwykli ludzie kreują niezwykłe produkty Decyzyjni. Jak zwykli ludzie kreują niezwykłe produkty
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
The overwhelming majority of a software systemâ??s lifespan is spent in use, not in design or implementation. So, why does conventional wisdom insist that software engineers focus primarily on the design and development of large-scale computing systems?In this collection of essays and articl...
Site Reliability Engineering. How Google Runs Production Systems Site Reliability Engineering. How Google Runs Production Systems
(186.15 zł najniższa cena z 30 dni)186.15 zł
219.00 zł(-15%) -
Whether you're part of a small startup or a multinational corporation, this practical book shows data scientists, software and site reliability engineers, product managers, and business owners how to run and establish ML reliably, effectively, and accountably within your organization. You'll gain...(211.65 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%) -
Can a system be considered truly reliable if it isn't fundamentally secure? Or can it be considered secure if it's unreliable? Security is crucial to the design and operation of scalable systems in production, as it plays an important part in product quality, performance, and availability. In thi...
Building Secure and Reliable Systems. Best Practices for Designing, Implementing, and Maintaining Systems Building Secure and Reliable Systems. Best Practices for Designing, Implementing, and Maintaining Systems
(211.65 zł najniższa cena z 30 dni)220.15 zł
259.00 zł(-15%) -
In 2016, Google’s Site Reliability Engineering book ignited an industry discussion on what it means to run production services today—and why reliability considerations are fundamental to service design. Now, Google engineers who worked on that bestseller introduce The Site Reliability...
The Site Reliability Workbook. Practical Ways to Implement SRE The Site Reliability Workbook. Practical Ways to Implement SRE
(152.15 zł najniższa cena z 30 dni)160.65 zł
189.00 zł(-15%) -
What once seemed nearly impossible has turned into reality. The number of available Internet addresses is now nearly exhausted, due mostly to the explosion of commercial websites and entries from an expanding number of countries. This growing shortage has effectively put the Internet community--...(143.65 zł najniższa cena z 30 dni)
152.15 zł
179.00 zł(-15%)
Zobacz pozostałe książki z serii O'Reilly
-
To drugie, zaktualizowane wydanie przewodnika po systemie Prometheus. Znajdziesz w nim wyczerpujące wprowadzenie do tego oprogramowania, a także wskazówki dotyczące monitorowania aplikacji i infrastruktury, tworzenia wykresów, przekazywania ostrzeżeń, bezpośredniej instrumentacji kodu i pobierani...
Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II Prometheus w pełnej gotowości. Jak monitorować pracę infrastruktury i wydajność działania aplikacji. Wydanie II
(53.40 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Dzięki tej książce zrozumiesz bazowe koncepcje programowania funkcyjnego i przekonasz się, że możesz włączać je do kodu bez rezygnacji z paradygmatu obiektowego. Dowiesz się również, kiedy w swojej codziennej pracy używać takich opcji jak niemutowalność i funkcje czyste i dlaczego warto to robić....
Java. Podejście funkcyjne. Rozszerzanie obiektowego kodu Javy o zasady programowania funkcyjnego Java. Podejście funkcyjne. Rozszerzanie obiektowego kodu Javy o zasady programowania funkcyjnego
(52.20 zł najniższa cena z 30 dni)60.90 zł
87.00 zł(-30%) -
Ta książka będzie świetnym uzupełnieniem wiedzy o Flutterze i Darcie, sprawdzi się również jako wsparcie podczas rozwiązywania konkretnych problemów. Znalazło się tu ponad sto receptur, dzięki którym poznasz tajniki pisania efektywnego kodu, korzystania z narzędzi udostępnianych przez framework F...
Flutter i Dart. Receptury. Tworzenie chmurowych aplikacji full stack Flutter i Dart. Receptury. Tworzenie chmurowych aplikacji full stack
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Ten przewodnik, który docenią programiści i architekci, zawiera wyczerpujące omówienie zagadnień projektowania, funkcjonowania i modyfikowania architektury API. Od strony praktycznej przedstawia strategie budowania i testowania API REST umożliwiającego połączenie oferowanej funkcjonalności na poz...
Architektura API. Projektowanie, używanie i rozwijanie systemów opartych na API Architektura API. Projektowanie, używanie i rozwijanie systemów opartych na API
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
W tej książce omówiono ponad 20 najprzydatniejszych wzorców projektowych, dzięki którym tworzone aplikacje internetowe będą łatwe w późniejszej obsłudze technicznej i w trakcie skalowania. Poza wzorcami projektowymi przedstawiono wzorce generowania i wydajności działania, których znaczenie dla uż...
Wzorce projektowe w JavaScripcie. Przewodnik dla programistów JavaScriptu i Reacta. Wydanie II Wzorce projektowe w JavaScripcie. Przewodnik dla programistów JavaScriptu i Reacta. Wydanie II
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
To gruntownie zaktualizowane i uzupełnione wydanie praktycznego przewodnika po wdrażaniu i testowaniu kontenerów Dockera. Przedstawia proces przygotowania pakietu aplikacji ze wszystkimi ich zależnościami, a także jego testowania, wdrażania, skalowania i utrzymywania w środowiskach produkcyjnych....
Docker. Niezawodne kontenery produkcyjne. Praktyczne zastosowania. Wydanie III Docker. Niezawodne kontenery produkcyjne. Praktyczne zastosowania. Wydanie III
(52.20 zł najniższa cena z 30 dni)60.90 zł
87.00 zł(-30%) -
To książka przeznaczona dla osób, które pracują ze zbiorami danych. Jest praktycznym przewodnikiem po koncepcjach algebry liniowej, pomyślanym tak, by ułatwić ich zrozumienie i zastosowanie w użytecznych obliczeniach. Poszczególne zagadnienia przedstawiono za pomocą kodu Pythona, wraz z przykłada...
Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie
(46.20 zł najniższa cena z 30 dni)53.90 zł
77.00 zł(-30%) -
Ta książka stanowi wszechstronne omówienie wszystkich bibliotek Pythona, potrzebnych naukowcom i specjalistom pracującym z danymi. Znalazł się tu dokładny opis IPythona, NumPy, Pandas, Matplotlib, Scikit-Learn i innych narzędzi. Podręcznik uwzględnia przede wszystkim ich aspekty praktyczne, dzięk...
Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II
(77.40 zł najniższa cena z 30 dni)90.30 zł
129.00 zł(-30%) -
Oto kolejne wydanie zwięzłego podręcznika dla programistów Javy, który ma ułatwić maksymalne wykorzystanie technologii tego języka w wersji 17. Treść została skrupulatnie przejrzana i uzupełniona o materiał dotyczący nowości w obiektowym modelu Javy. Pierwsza część książki obejmuje wprowadzenie d...(53.40 zł najniższa cena z 30 dni)
62.30 zł
89.00 zł(-30%) -
Oto zwięzły i praktyczny przewodnik po usłudze GA4 i jej integracji z chmurą. Szczególnie skorzystają z niego analitycy danych, biznesu i marketingu. Opisano tu wszystkie istotne kwestie dotyczące tego nowego, potężnego modelu analitycznego. Szczególną uwagę poświęcono bardziej zaawansowanym funk...
Google Analytics od podstaw. Analiza wpływu biznesowego i wyznaczanie trendów Google Analytics od podstaw. Analiza wpływu biznesowego i wyznaczanie trendów
(41.40 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%)
Ebooka "Site Reliability Engineering. Jak Google zarządza systemami producyjnymi" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Site Reliability Engineering. Jak Google zarządza systemami producyjnymi" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Site Reliability Engineering. Jak Google zarządza systemami producyjnymi" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- Tytuł oryginału:
- Site Reliability Engineering: How Google Runs Production Systems
- Tłumaczenie:
- Tomasz Walczak
- ISBN Książki drukowanej:
- 978-83-283-3730-5, 9788328337305
- Data wydania książki drukowanej:
- 2017-11-13
- ISBN Ebooka:
- 978-83-283-3731-2, 9788328337312
- Data wydania ebooka:
- 2017-11-10 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Format:
- 168x237
- Numer z katalogu:
- 65103
- Rozmiar pliku Pdf:
- 7.5MB
- Rozmiar pliku ePub:
- 7.3MB
- Rozmiar pliku Mobi:
- 14.7MB
- Zgłoś erratę
- Serie wydawnicze: O'Reilly
Spis treści ebooka
- Zarządzanie usługami przez administratorów systemów (25)
- Podejście do zarządzania usługami w Google'u - Site Reliability Engineering (26)
- Założenia podejścia SRE (29)
- Koniec początku (34)
- Sprzęt (35)
- Oprogramowanie "organizujące" pracę sprzętu (37)
- Inne systemy oprogramowania (40)
- Infrastruktura dla oprogramowania (40)
- Nasze środowisko programistyczne (41)
- Shakespeare - przykładowa usługa (42)
- Zarządzanie ryzykiem (47)
- Pomiar ryzyka związanego z usługą (48)
- Tolerancja ryzyka dla usługi (50)
- Uzasadnienie stosowania budżetu błędów (54)
- Terminologia związana z poziomem usług (59)
- Wskaźniki w praktyce (62)
- Cele w praktyce (65)
- Umowy w praktyce (68)
- Definicja harówki (69)
- Dlaczego ograniczenie harówki jest korzystne? (71)
- Co kwalifikuje się jako prace inżynieryjne? (72)
- Czy harówka zawsze jest czymś złym? (72)
- Wniosek (74)
- Definicje (75)
- Po co monitorować? (76)
- Wyznaczanie rozsądnych oczekiwań względem monitorowania (77)
- Symptomy a przyczyny (78)
- Monitorowanie czarnoskrzynkowe i białoskrzynkowe (79)
- Cztery złote sygnały (79)
- Uwzględnianie wartości skrajnych (lub narzędzia pomiarowe i sprawność) (81)
- Określanie odpowiedniej szczegółowości pomiarów (81)
- Tak proste jak to możliwe, ale nie prostsze (82)
- Łączenie opisanych zasad (82)
- Monitorowanie długoterminowe (83)
- Wnioski (86)
- Wartość automatyzacji (87)
- Wartość dla zespołów SRE w Google'u (89)
- Przypadki zastosowania automatyzacji (90)
- Wyautomatyzuj się z pracy - automatyzuj WSZYSTKO! (93)
- Łagodzenie problemów - stosowanie automatyzacji do uruchamiania klastrów (95)
- Borg - narodziny komputera na skalę hurtowni (101)
- Podstawową cechą jest niezawodność (102)
- Zalecenia (103)
- Rola inżyniera udostępniania (105)
- Filozofia (106)
- Ciągłe budowanie i wdrażanie (108)
- Zarządzanie konfiguracją (111)
- Wnioski (112)
- Stabilność a elastyczność systemu (115)
- Cnota nudy (116)
- Nie oddam mojego kodu! (116)
- Wskaźnik "negatywne wiersze kodu" (117)
- Minimalne interfejsy API (117)
- Modułowość (117)
- Udostępnianie prostych zmian (118)
- Prosty wniosek (118)
- Powstanie systemu Borgmon (124)
- Narzędzia pomiarowe w aplikacji (125)
- Zbieranie eksportowanych danych (126)
- Przechowywanie danych w obszarze szeregów czasowych (126)
- Sprawdzanie reguł (129)
- Alarmy (132)
- Podział systemu monitorowania (133)
- Monitorowanie czarnoskrzynkowe (134)
- Zarządzanie konfiguracją (135)
- Dziesięć lat później... (136)
- Wprowadzenie (139)
- Życie inżyniera dyżurnego (140)
- Zrównoważone dyżury (141)
- Poczucie bezpieczeństwa (142)
- Unikanie nieodpowiedniego obciążenia operacyjnego (144)
- Wnioski (145)
- Teoria (148)
- Praktyka (150)
- Wyniki negatywne to magia (156)
- Studium przypadku (158)
- Ułatwianie rozwiązywania problemów (162)
- Wnioski (162)
- Co robić, gdy w systemie wystąpi awaria? (163)
- Kryzys wywołany testami (164)
- Sytuacje kryzysowe spowodowane zmianami (165)
- Sytuacje kryzysowe spowodowane procesem (167)
- Dla każdego problemu istnieje rozwiązanie (169)
- Wyciągaj wnioski z przeszłości i nie powtarzaj tych samych błędów (170)
- Wnioski (170)
- Niezarządzane incydenty (173)
- Anatomia niezarządzanego incydentu (174)
- Aspekty procesu zarządzania incydentami (175)
- Zarządzany incydent (176)
- Kiedy ogłaszać incydent? (177)
- Podsumowanie (178)
- Filozofia analizy zdarzeń w Google'u (179)
- Współpracuj i dziel się wiedzą (181)
- Wprowadzanie kultury analizy zdarzeń (182)
- Wnioski i wprowadzane usprawnienia (184)
- Escalator (185)
- Outalator (186)
- Rodzaje testów oprogramowania (192)
- Tworzenie środowiska testowania i środowiska budowania (198)
- Testowanie w dużej skali (199)
- Wnioski (210)
- Dlaczego inżynieria oprogramowania w zespołach SRE ma znaczenie? (211)
- Studium przypadku. Auxon - wprowadzenie do projektu i przestrzeń problemowa (213)
- Planowanie przepustowości na podstawie celów (215)
- Wspomaganie inżynierii oprogramowania w SRE (223)
- Wnioski (227)
- Moc nie jest rozwiązaniem (229)
- Równoważenie obciążenia z użyciem systemu DNS (230)
- Równoważenie obciążenia na poziomie wirtualnych adresów IP (232)
- Scenariusz idealny (236)
- Identyfikowanie problematycznych zadań - kontrola przepływu i "kulawe kaczki" (237)
- Ograniczanie puli połączeń za pomocą tworzenia podzbiorów (239)
- Reguły równoważenia obciążenia (244)
- Pułapki związane z "liczbą zapytań na sekundę" (251)
- Limity na klienta (252)
- Ograniczanie liczby żądań po stronie klienta (253)
- Poziom krytyczności (255)
- Sygnały poziomu wykorzystania (256)
- Obsługa błędów przeciążenia (257)
- Obciążenie wynikające z połączeń (260)
- Wnioski (261)
- Przyczyny awarii kaskadowych i projektowanie z myślą o ich uniknięciu (264)
- Zapobieganie przeciążeniu serwerów (268)
- Powolny rozruch i pusta pamięć podręczna (276)
- Warunki wywołujące awarie kaskadowe (279)
- Testowanie pod kątem awarii kaskadowych (280)
- Pierwsze kroki w obliczu awarii kaskadowych (283)
- Uwagi końcowe (285)
- Uzasadnienie uzgadniania konsensusu - niepowodzenie koordynacji systemów rozproszonych (289)
- Jak działa konsensus w środowisku rozproszonym? (291)
- Wzorce architektury systemu związane z konsensusem w środowisku rozproszonym (292)
- Wydajność uzgadniania konsensusu w środowisku rozproszonym (297)
- Wdrażanie rozproszonego systemu opartego na konsensusie (305)
- Monitorowanie rozproszonych systemów uzgadniania konsensusu (312)
- Wnioski (314)
- cron (315)
- Prace crona a idempotencja (316)
- cron w dużej skali (317)
- Budowanie crona w Google'u (318)
- Podsumowanie (325)
- Początki wzorca projektowego "potok danych" (327)
- Początkowy wpływ big data na prosty wzorzec potoku danych (327)
- Wyzwania związane ze wzorcem "okresowo uruchamiany potok danych" (328)
- Problemy powodowane przez nierównomierny podział pracy (328)
- Wady okresowo uruchamianych potoków w środowiskach rozproszonych (329)
- Wprowadzenie do systemu Workflow Google'a (332)
- Etapy wykonywania w systemie Workflow (334)
- Zapewnianie ciągłości biznesowej (335)
- Podsumowanie i uwagi końcowe (336)
- Ścisłe wymagania z zakresu integralności danych (338)
- Cele zespołów SRE w Google'u w zakresie integralności i dostępności danych (342)
- Jak zespoły SRE Google'a radzą sobie z problemami z integralnością danych? (346)
- Studia przypadków (357)
- Ogólne zasady SRE stosowane w obszarze integralności danych (363)
- Wnioski (365)
- Inżynieria koordynowania udostępniania (368)
- Konfigurowanie procesu udostępniania (370)
- Tworzenie listy kontrolnej udostępniania (373)
- Wybrane techniki niezawodnego udostępniania (377)
- Powstawanie zespołu LCE (381)
- Wnioski (384)
- Zatrudniłeś nowych inżynierów SRE. Co dalej? (387)
- Początkowe pouczające doświadczenia - argument na rzecz przewagi struktury nad chaosem (389)
- Rozwój świetnych ekspertów od inżynierii odwrotnej i improwizatorów (393)
- Pięć praktyk dla przyszłych dyżurnych (395)
- Dyżury i inne zadania - rytuał przejścia i ciągłe uczenie się (400)
- Końcowe myśli (401)
- Zarządzanie obciążeniem operacyjnym (404)
- Czynniki wpływające na sposób zarządzania zakłóceniami (404)
- Niedoskonałe maszyny (405)
- Etap 1. Poznaj usługę i kontekst (412)
- Etap 2. Przedstawianie kontekstu (414)
- Etap 3. Motywowanie do zmian (415)
- Wnioski (417)
- Komunikacja - spotkania produkcyjne (420)
- Współpraca w ramach zespołów SRE (423)
- Studium przypadku z obszaru współpracy w zespołach SRE - Viceroy (425)
- Współpraca z zespołami innymi niż SRE (429)
- Studium przypadku - przeniesienie DFP do F1 (430)
- Wnioski (432)
- Zaangażowanie zespołów SRE - co, jak i dlaczego? (433)
- Model PGP (434)
- Model angażowania się zespołów SRE (434)
- Przeglądy gotowości produkcyjnej - prosty model oparty na PGP (436)
- Ewolucja prostego modelu opartego na PGP - wczesne zaangażowanie (439)
- Zmiany w rozwoju usług - frameworki i platforma SRE (441)
- Wnioski (446)
- Poznaj naszych branżowych weteranów (450)
- Testowanie gotowości i odporności na katastrofy (451)
- Kultura analizy zdarzeń (454)
- Eliminowanie powtarzalnej pracy i kosztów operacyjnych dzięki automatyzacji (456)
- Ustrukturyzowane i racjonalne podejmowanie decyzji (457)
- Wnioski (459)
Przedmowa (13)
Wstęp (15)
CZĘŚĆ I. WPROWADZENIE (23)
1. Wprowadzenie (25)
2. Środowisko produkcyjne w Google'u z perspektywy SRE (35)
CZĘŚĆ II. ZASADY (45)
3. Akceptowanie ryzyka (47)
4. Poziomy SLO (59)
5. Eliminowanie harówki (69)
6. Monitorowanie systemów rozproszonych (75)
7. Ewolucja automatyzacji w Google'u (87)
8. Inżynieria udostępniania (105)
9. Prostota (115)
CZĘŚĆ III. PRAKTYKI (119)
10. Praktyczne alarmy na podstawie szeregów czasowych (123)
11. Dyżury na wezwanie (139)
12. Skuteczne rozwiązywanie problemów (147)
13. Reagowanie kryzysowe (163)
14. Zarządzanie incydentami (173)
15. Kultura analizy zdarzeń - wyciąganie wniosków z niepowodzeń (179)
16. Śledzenie przestojów (185)
17. Testowanie niezawodności (191)
18. Inżynieria oprogramowania w SRE (211)
19. Równoważenie obciążenia na poziomie frontonu (229)
20. Równoważenie obciążenia w centrum danych (235)
21. Obsługa przeciążenia (251)
22. Radzenie sobie z awariami kaskadowymi (263)
23. Zarządzanie krytycznym stanem - zapewnianie niezawodności za pomocą konsensusu w środowisku rozproszonym (287)
24. Okresowe szeregowanie prac w środowisku rozproszonym za pomocą crona (315)
25. Potoki przetwarzania danych (327)
26. Integralność danych - wczytywanie tego, co zostało zapisane (337)
27. Niezawodne udostępnianie produktów w dużej skali (367)
CZĘŚĆ IV. ZARZĄDZANIE (385)
28. Szybkie przygotowywanie inżynierów SRE do dyżurów i innych zadań (387)
29. Radzenie sobie z zakłóceniami (403)
30. Angażowanie inżyniera SRE w celu wyeliminowania przeciążenia operacyjnego (411)
31. Komunikacja i współpraca w zespołach SRE (419)
32. Zmiany w modelu angażowania się zespołów SRE (433)
CZĘŚĆ V. WNIOSKI (447)
33. Lekcje z innych branż (449)
34. Podsumowanie (461)
A. Tabela dostępności (465)
B. Zbiór dobrych praktyk dotyczących usług produkcyjnych (467)
C. Przykładowy dokument ze stanem incydentu (473)
D. Przykładowa analiza zdarzenia (475)
E. Lista kontrolna LCE (479)
F. Przykładowe notatki ze spotkania produkcyjnego (481)
Bibliografia (483)
Skorowidz (494)
Oceny i opinie klientów: Site Reliability Engineering. Jak Google zarządza systemami producyjnymi Betsy Beyer, Chris Jones, Jennifer Petoff, Niall Richard Murphy (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.