Baza danych od środka. Analiza działania rozproszonych systemów danych
- Wydawnictwo:
- Helion
- Wydawnictwo:
- Helion
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 328
- Druk:
- oprawa miękka
- Dostępne formaty:
-
PDFePubMobi
Opis ebooka: Baza danych od środka. Analiza działania rozproszonych systemów danych
W ciągu ostatnich 15 lat powstało tak wiele baz danych i narzędzi, że łatwo się pogubić, jeśli próbuje się zrozumieć przypadki użycia, szczegóły i specyfiki. Większość opracowań na temat systemów baz danych nie opisuje implementacji mechanizmu pamięci masowej. Tymczasem znajomość tych wewnętrznych aspektów jest bardzo ważna dla programistów, inżynierów, architektów i menedżerów.
Aby wybrać odpowiednie narzędzie do pracy, musisz zrozumieć idee i algorytmy stojące za ich projektem.
Michael Klishin, współpracownik RabbitMQ
Ta książka ułatwi Ci zgłębienie koncepcji kryjących się za działaniem nowoczesnych baz danych. Dzięki niej zrozumiesz, w jaki sposób struktury dyskowe różnią się od tych w pamięci i jak działają algorytmy efektywnego utrzymywania struktur B drzewa na dysku. Poznasz implementacje pamięci masowej o strukturze dziennika. Znajdziesz tu również wyjaśnienie zasad organizacji węzłów w klaster baz danych i specyfiki środowisk rozproszonych. Dowiesz się, jak algorytmy rozproszone poprawiają wydajność i stabilność systemu i jak uzyskać ostateczną spójność danych. Ponadto w książce zaprezentowano koncepcje antyentropii i plotek, służące do zapewniania zbieżności i rozpowszechniania danych, a także mechanizm transakcji utrzymujący spójność logiczną bazy.
Najważniejsze zagadnienia:
- klasyfikacja i taksonomia pamięci masowej
- silniki pamięci masowej oparte na B-drzewie i niezmienna struktura dziennika
- struktura plików bazy danych
- pamięć podręczna stron i pule buforów
- systemy rozproszone: złożone wzorce komunikacji węzłów i procesów
- klastry baz danych
Obowiązkowa lektura dla każdego, kto korzysta z jakiejkolwiek bazy danych!
Nate McCall, przewodniczący PMC
Zrozumienie wewnętrznych elementów bazy danych jest niezbędne przy jej wyborze, używaniu i utrzymywaniu. Jednak przy tak wielu dostępnych obecnie rozproszonych bazach danych i narzędziach często trudno się dowiedzieć, co każde z nich oferuje i czym się różnią. W tym praktycznym przewodniku Alex Petrov prowadzi programistów przez koncepcje kryjące się za nowoczesnymi bazami danych i wewnętrznymi mechanizmami pamięci masowej.
Książka zawiera istotne materiały zebrane z licznych książek, artykułów, wpisów na blogach i kodu źródłowego kilku baz danych typu open source. Dzięki tej lekturze można się przekonać, iż najważniejsze różnice między wieloma nowoczesnymi bazami danych tkwią w podsystemach, które określają sposób organizacji pamięci masowej i dystrybucji danych.
Poznasz następujące zagadnienia:
- Mechanizmy pamięci masowej: Poznasz klasyfikację i taksonomię pamięci masowej oraz przeanalizujesz silniki pamięci masowej oparte na drzewie B i niezmiennej strukturze dziennika.
- Bloki konstrukcyjne pamięci masowej: Zrozumiesz, w jaki sposób pliki bazy danych są zorganizowane, aby zbudować wydajną pamięć masową przy użyciu pomocniczych struktur danych, takich jak pamięć podręczna stron i pule buforów.
- Systemy rozproszone: Poznasz krok po kroku, w jaki sposób węzły i procesy łączą się ze sobą i tworzą złożone wzorce komunikacji.
- Klastry baz danych: Dowiedz się, jakie modele spójności są powszechnie stosowane w nowoczesnych bazach danych i jak rozproszone systemy pamięci masowej osiągają spójność.
"Aby wybrać odpowiednie narzędzie do pracy, musimy zrozumieć idee i algorytmy stojące za ich projektem. Ta książka jest przystępnym wprowadzeniem dla początkujących do wielu istotnych tematów, napisanym przez praktyka z branży".
Michael Klishin, wieloletni współpracownik RabbitMQ
"Jest to obowiązkowa lektura dla każdego, kto korzysta z jakiejkolwiek technologii związanej z bazami danych, zwłaszcza gdy musi podejmować decyzje dotyczące wyboru systemów".
Nate McCall, przewodniczący PMC, aktywnie wspierający modyfikacje kodu Apache Cassandra
Wybrane bestsellery
-
When it comes to choosing, using, and maintaining a database, understanding its internals is essential. But with so many distributed databases and tools available today, it’s often difficult to understand what each one offers and how they differ. With this practical guide, Alex Petrov guide...(151.88 zł najniższa cena z 30 dni)
151.83 zł
209.00 zł(-27%) -
W tym przewodniku opisano zagadnienia związane z podstawami nauki o danych. Wyjaśniono niezbędne elementy matematyki i statystyki. Przedstawiono także techniki budowy potrzebnych narzędzi i sposoby działania najistotniejszych algorytmów. Książka została skonstruowana tak, aby poszczególne impleme...(47.40 zł najniższa cena z 30 dni)
63.20 zł
79.00 zł(-20%) -
This guide helps you master DynamoDB, the serverless NoSQL database built for high performance at any scale. Authored by AWS experts, it covers core features, data modeling, and advanced topics, enabling you to build state-of-the-art applications.
-
Learn how to implement and manage a modern customer data platform (CDP) through the Salesforce Data Cloud platform. This practical book provides a comprehensive overview that shows architects, administrators, developers, data engineers, and marketers how to ingest, store, and manage real-time cus...(189.72 zł najniższa cena z 30 dni)
189.62 zł
249.00 zł(-24%) -
Real-time applications are becoming the norm today. But building a model that works properly requires real-time data from the source, in-flight stream processing, and low latency serving of its analytics. With this practical book, data engineers, data architects, and data analysts will learn how ...(214.46 zł najniższa cena z 30 dni)
214.26 zł
279.00 zł(-23%) -
Mówi się, że Scrum Master to lider służebny. Nazwa ta wynika wprost z koncepcji zarządzania, w której lider wspomaga swój zespół, zamiast nad nim dominować. To osoba, która usuwa przeszkody i pomaga zespołowi w stosowaniu zasad Scruma. Scrum to metoda zarządzania projektami, zgodna z manifestem A...(52.15 zł najniższa cena z 30 dni)
59.59 zł
149.00 zł(-60%) -
This book provides a highly focused view of real business outcomes powered by data governance, that resonate with non-data executives such as CFOs and CEOs. You’ll also find useful insights into how to implement data governance initiatives.
-
This book shows you how to use Apache Spark, Delta Lake, and Databricks to build data pipelines, manage and transform data, optimize performance, and more. Additionally, you’ll implement DataOps and DevOps practices, and orchestrate data workflows.
O autorze ebooka
Alex Petrov jest inżynierem infrastruktury danych, entuzjastą baz danych i systemów pamięci masowej. Jako członek PMC aktywnie wspiera rozwój projektu Apache Cassandra. Specjalizuje się w pamięciach masowych, systemach rozproszonych i algorytmach.
Ebooka "Baza danych od środka. Analiza działania rozproszonych systemów danych" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Baza danych od środka. Analiza działania rozproszonych systemów danych" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Baza danych od środka. Analiza działania rozproszonych systemów danych" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- Tytuł oryginału:
- Database Internals: A Deep Dive into How Distributed Data Systems Work
- Tłumaczenie:
- Małgorzata Dąbkowska-Kowalik, Witold Sikorski
- ISBN Książki drukowanej:
- 978-83-289-1332-5, 9788328913325
- ISBN Ebooka:
- 978-83-289-1333-2, 9788328913332
- Format:
- 165x235
- Numer z katalogu:
- 233725
- Rozmiar pliku Pdf:
- 6.4MB
- Rozmiar pliku ePub:
- 8.8MB
- Rozmiar pliku Mobi:
- 20.3MB
- Pobierz przykładowy rozdział PDF
Spis treści ebooka
- Architektura DBMS
- Systemy DBMS oparte na pamięci kontra systemy oparte na dyskach
- Trwałość w magazynach opartych na pamięci
- Kolumnowe i wierszowe systemy DBMS
- Wierszowy układ danych
- Kolumnowy układ danych
- Rozróżnienia i optymalizacje
- Magazyny z szerokimi kolumnami
- Pliki danych i pliki indeksowe
- Pliki danych
- Pliki indeksowe
- Indeks główny jako pośrednik
- Buforowanie, niezmienność i porządkowanie
- Podsumowanie
- Drzewa wyszukiwania binarnego
- Równoważenie drzewa
- Drzewa dla pamięci masowych opartych na dyskach
- Struktury oparte na dyskach
- Dyski twarde
- Dyski półprzewodnikowe
- Struktury na dysku
- Wszechobecne B-drzewa
- Hierarchia B-drzewa
- Klucze oddzielające
- Złożoność przeszukiwania B-drzewa
- Algorytm przeszukiwania B-drzewa
- Liczenie kluczy
- Dzielenie węzłów B-drzewa
- Scalanie węzłów B-drzewa
- Podsumowanie
- Motywacje
- Kodowanie binarne
- Typy podstawowe
- Ciągi znaków i dane o zmiennym rozmiarze
- Dane upakowane bitowo: wartości logiczne, wyliczenia i flagi
- Zasady ogólne
- Struktura strony
- Strony podzielone na obszary
- Układ komórek
- Łączenie komórek w strony podzielone na obszary
- Zarządzanie danymi o zmiennym rozmiarze
- Wersjonowanie
- Sumy kontrolne
- Podsumowanie
- Nagłówek strony
- Magiczne liczby
- Powiązania między rodzeństwem
- Skrajne prawe wskaźniki
- Najwyższe klucze węzłów
- Strony przepełnienia
- Wyszukiwanie binarne
- Wyszukiwanie binarne ze wskaźnikami kierunku
- Propagowanie podziałów i scaleń
- Okruszki
- Przywracanie równowagi
- Dołączanie tylko z prawej strony
- Ładowanie masowe
- Kompresja
- Odkurzanie i konserwacja
- Fragmentacja spowodowana aktualizacjami i usunięciami
- Defragmentacja stron
- Podsumowanie
- Zarządzanie buforami
- Semantyka buforowania
- Zwalnianie pamięci podręcznej
- Blokowanie stron w pamięci podręcznej
- Zastępowanie stron
- Przywracanie poprzedniego stanu
- Semantyka dziennika
- Działanie a dziennik danych
- Zasady kradzieży i wymuszania
- ARIES
- Kontrola współbieżności
- Serializowalność
- Izolacja transakcji
- Anomalie odczytu i zapisu
- Poziomy izolacji
- Optymistyczna kontrola współbieżności
- Wielowersyjna kontrola współbieżności
- Pesymistyczna kontrola współbieżności
- Kontrola współbieżności oparta na blokadach
- Podsumowanie
- Kopiowanie przy zapisie
- Implementowanie kopiowania przy zapisie: LMDB
- Abstrakcja aktualizacji węzłów
- Leniwe B-drzewa
- WiredTiger
- Drzewo z leniwą adaptacją
- Drzewa FD
- Kaskadowanie ułamkowe
- Przebiegi logarytmiczne
- Drzewa Bw
- Łańcuchy aktualizacji
- Ograniczanie współbieżności za pomocą porównywania i zamiany
- Modyfikacje strukturalne
- Konsolidacja i zbieranie śmieci
- B-drzewa nieświadome pamięci podręcznej
- Układ van Emde Boasa
- Podsumowanie
- Drzewa LSM
- Struktura drzewa LSM
- Aktualizacje i usuwanie
- Wyszukiwanie w drzewie LSM
- Iteracja przez scalanie
- Uzgadnianie
- Konserwacja w drzewach LSM
- Odczyt, zapis i wzmocnienie przestrzenne
- Hipoteza RUM
- Szczegóły implementacji
- Posortowane tabele ciągów
- Filtry Blooma
- Lista z przeskokami
- Dostęp do dysku
- Kompresja
- Nieuporządkowana pamięć masowa LSM
- Bitcask
- WiscKey
- Współbieżność w drzewach LSM
- Układanie dzienników w stos
- Warstwa translacji pamięci flash
- Rejestrowanie systemu plików
- LLAMA i uważne układanie na stosie
- Dyski SSD z otwartym kanałem
- Podsumowanie
- Współbieżne wykonywanie
- Współdzielony stan w systemie rozproszonym
- Błędy obliczeń rozproszonych
- Przetwarzanie
- Zegary i czas
- Spójność stanu
- Wykonywanie lokalne i zdalne
- Potrzeba radzenia sobie z awariami
- Partycje sieciowe i częściowe awarie
- Awarie kaskadowe
- Abstrakcje systemów rozproszonych
- Łącza
- Problem dwóch generałów
- Niemożność FLP
- Synchronizacja systemu
- Modele awarii
- Awaria systemu
- Błędy pominięcia
- Przypadkowe błędy
- Radzenie sobie z awariami
- Podsumowanie
- Puls i pingi
- Detektor awarii bez limitu czasu
- Zewnętrzne sprawdzanie pulsu
- Detektor awarii Phi-Accural
- Plotki i wykrywanie awarii
- Odwracanie problemu wykrywania awarii
- Podsumowanie
- Algorytm tyrana
- Przełączanie awaryjne na następny w kolejności proces
- Zwykła optymalizacja kandydata
- Algorytm zapraszania
- Algorytm pierścieniowy
- Podsumowanie
- Osiąganie dostępności
- Niesławny CAP
- Ostrożne korzystanie z CAP
- Zbiór i uzysk
- Pamięć współdzielona
- Porządkowanie
- Modele spójności
- Ścisła spójność
- Linearyzowalność
- Spójność sekwencyjna
- Spójność przyczynowo-skutkowa
- Modele sesji
- Ostateczna spójność
- Dostrajana spójność
- Repliki świadków
- Silna ostateczna spójność i typy CRDT
- Podsumowanie
- Naprawa odczytu
- Skrócone odczyty
- Przekazanie ze wskazówką
- Drzewa Merkle'a
- Wektory wersji bitmapowej
- Rozpowszechnianie plotek
- Mechanika plotki
- Sieci nakładkowe
- Plotki hybrydowe
- Widoki częściowe
- Podsumowanie
- Sprawianie, aby działania wyglądały na niepodzielne
- Zatwierdzanie dwufazowe
- Awarie w grupach w 2PC
- Awarie koordynatora w 2PC
- Zatwierdzanie trójfazowe
- Awarie koordynatora w 3PC
- Transakcje rozproszone z użyciem Calvina
- Transakcje rozproszone z użyciem Spannera
- Podział bazy danych na partycje
- Spójne obliczanie skrótów
- Transakcje rozproszone z rozprzestrzenianiem
- Unikanie koordynacji
- Podsumowanie
- Rozgłaszanie
- Niepodzielne rozgłaszanie
- Synchroniczność wirtualna
- Niepodzielne rozgłoszenie Zookeeper (ZAB)
- Paxos
- Algorytm Paxos
- Kworum w Paxosie
- Scenariusze awarii
- Multi-Paxos
- Fast Paxos
- Egalitarian Paxos
- Flexible Paxos
- Uogólnione rozwiązanie konsensusu
- Raft
- Rola lidera w algorytmie Raft
- Scenariusze awarii
- Konsensus bizantyński
- Algorytm PBFT
- Odzyskiwanie i punkty kontrolne
- Podsumowanie
Przedmowa
CZĘŚĆ I. Mechanizmy pamięci masowej
1. Wprowadzenie i ogólny zarys
2. Podstawy B-drzew
3. Formaty plików
4. Implementowanie B-drzew
5. Przetwarzanie transakcji i przywracanie poprzedniego stanu
6. Odmiany B-drzewa
7. Pamięć masowa o strukturze dziennika
Podsumowanie części I
CZĘŚĆ II. Systemy rozproszone
8. Wprowadzenie i przegląd
9. Wykrywanie awarii
10. Wybór lidera
11. Replikacja i spójność
12. Antyentropia i rozpowszechnianie
13. Transakcje rozproszone
14. Konsensus
Podsumowanie części II
Bibliografia
Oceny i opinie klientów: Baza danych od środka. Analiza działania rozproszonych systemów danych Alex Petrov (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.