Big Data. Najlepsze praktyki budowy skalowalnych systemów obsługi danych w czasie rzeczywistym Nathan Marz, James Warren

Czasowo niedostępna
Promocja 2za1
+53 pkt

Big Data. Najlepsze praktyki budowy skalowalnych systemów obsługi danych w czasie rzeczywistym Nathan Marz, James Warren - okladka książki

Zajrzyj do książki

Autorzy:: Nathan Marz, James Warren
Serie wydawnicze:: W Akcji
Wydawnictwo:: Helion
Wydawnictwo:: Helion
Ocena:: 6.0/6 Opinie: 3
Stron:: 352
Druk:: oprawa miękka
Dostępne formaty::      PDF

     ePub

     Mobi

Czytaj fragment

Książka

89,00 zł

Powiadom mnie, gdy książka będzie dostępna

Ebook

53,40 zł ~~89,00 zł~~ (-40%)

44,50 zł najniższa cena z 30 dni

(2za1 » dobierz ebook GRATIS)

Dodaj do koszyka Dostępny natychmiast po opłaceniu zakupu lub Kup na prezent Kup 1-kliknięciem

Przenieś na półkę

Do przechowalni

Powiadom o dostępności audiobooka »

Czego się nauczysz?

Skalowania tradycyjnych baz danych za pomocą kolejek i shardingu
Projektowania architektury Big Data odpornej na błędy i łatwej w utrzymaniu
Wdrażania architektury lambda z warstwą wsadową, obsługującą i czasu rzeczywistego
Modelowania danych w systemach Big Data z wykorzystaniem modelu opartego na faktach
Wykorzystywania frameworków serializacji, takich jak Apache Thrift
Przechowywania danych w rozproszonych systemach plików i bazach klucz-wartość
Realizacji przetwarzania wsadowego z użyciem Hadoop i biblioteki Pail
Tworzenia złożonych zapytań wsadowych z wykorzystaniem JCascalog
Projektowania i implementacji warstwy przetwarzania wsadowego na przykładzie SuperWebAnalytics.com
Budowania warstwy obsługującej z użyciem ElephantDB
Przetwarzania i przechowywania danych w czasie rzeczywistym z wykorzystaniem Cassandry
Implementowania kolejkowania i przetwarzania strumieniowego z Apache Storm
Osiągania semantyki ,,dokładnie raz" dzięki mikrowsadowemu przetwarzaniu strumieniowemu
Rozszerzania diagramów potokowych na potrzeby przetwarzania mikrowsadowego
Optymalizacji i pomiaru wydajności poszczególnych warstw systemu Big Data
Rozwiązywania praktycznych problemów skalowalności i niezawodności w systemach Big Data

Obsługa aplikacji, które operują na ogromnych zbiorach danych, czyli na przykład portali społecznościowych, przekracza możliwości zwykłych relacyjnych baz. Praca ze złożonymi zbiorami danych wymaga architektury obejmującej wielomaszynowe klastry, dzięki którym możliwe jest przechowywanie i przesyłanie informacji praktycznie dowolnej wielkości. Architektura taka powinna dodatkowo być prosta w użyciu, niezawodna i skalowalna.

Dzięki tej książce nauczysz się budować tego rodzaju architekturę. Zapoznasz się z technologią wykorzystywania klastrów maszyn. Dowiesz się, jak działają narzędzia przeznaczone specjalnie do przechwytywania i analizy danych na wielką skalę. W książce zaprezentowano łatwe do zrozumienia podejście do obsługi systemów wielkich zbiorów danych, które mogą być budowane i uruchamiane przez niewielki zespół. Nie zabrakło też wyczerpującego opisu praktycznej implementacji systemu Big Data z wykorzystaniem rzeczywistego przykładu.

W tej książce znajdziesz:

teoretyczne podstawy koncepcji systemów Big Data
wskazówki umożliwiające optymalne wykorzystanie zasobów do obsługi danych
wybór technik przetwarzania i obsługi wielkich ilości danych w czasie rzeczywistym
zagadnienia dotyczące baz danych NoSQL, przetwarzania strumieniowego i zarządzania złożonością obliczeń przyrostowych
informacje o praktycznym stosowaniu takich narzędzi jak Hadoop, Cassandra i Storm
wskazówki umożliwiające poszerzenie wiedzy o zwykłych bazach danych

Big Data — to skalowalność i prostota obsługi wielkich ilości danych!

Pokaż opis z okładki oryginału »

Aplikacje internetowe, takie jak portale społecznościowe, analizy czasu rzeczywistego lub strony e-commerce, mają do czynienia z dużą ilością danych, których wolumen i prędkość przekraczają limity tradycyjnych systemów bazodanowych. Te aplikacje wymagają architektur zbudowanych wokół klastrów maszyn, aby przechowywać i przetwarzać dane o dowolnym rozmiarze lub dowolnej prędkości. Na szczęście skalowalność i prostota nie wykluczają się wzajemnie.

Big Data uczy budowania systemów wielkich zbiorów danych przy użyciu architektury zaprojektowanej specjalnie do przechwytywania i analizowania danych na skalę internetową. Ta książka prezentuje architekturę lambda, czyli skalowalne, łatwe do zrozumienia podejście umożliwiające budowanie i uruchamianie systemów danych przez niewielki zespół. Poznasz teorię systemów Big Data i sposoby implementacji ich w praktyce. Poza odkryciem ogólnego frameworku do przetwarzania wielkich zbiorów danych, nauczysz się konkretnych technologii, takich jak Hadoop, Storm oraz bazy danych NoSQL.

Co znajdziesz w środku:

wprowadzenie do systemów Big Data;
przetwarzanie w czasie rzeczywistym danych na skalę internetową;
narzędzia, takie jak Hadoop, Cassandra i Storm;
poszerzenie umiejętności związanych z tradycyjnymi bazami danych.

Ta książka nie wymaga wcześniejszego doświadczenia z analizą danych na dużą skalę lub narzędziami NoSQL. Znajomość tradycyjnych baz danych jest pomocna.
Nathan Marz jest twórcą projektu Apache Storm i autorem architektury lambda dla systemów Big Data. James Warren jest architektem analityki z doświadczeniem w uczeniu maszynowym i obliczeniach naukowych.

„Przewyższa indywidualne narzędzia lub platformy. Lektura obowiązkowa dla każdego, kto pracuje z systemami Big Data”.

Jonathan Esterhazy, Groupon

„Wyczerpująca tematycznie, oparta na przykładach podróż po architekturze lambda, z jej autorem w roli przewodnika”.

Mark Fisher, Pivotal

„Zawiera wiedzę, którą można nabyć tylko podczas pracy nad wieloma projektami Big Data. Lektura obowiązkowa”.

Pere Ferrera Bertran, Datasalt

„De facto przewodnik po optymalizowaniu potoków danych w przetwarzaniu wsadowym i zbliżonym do czasu rzeczywistego”.

Alex Holmes, autor książki Hadoop in Practice

Wybrane bestsellery

Zobacz pozostałe książki z serii W Akcji

Ebooka "Big Data. Najlepsze praktyki budowy skalowalnych systemów obsługi danych w czasie rzeczywistym" przeczytasz na:

czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
systemach Windows, MacOS i innych

systemach Windows, Android, iOS, HarmonyOS
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi

Masz pytania? Zajrzyj do zakładki Pomoc »

Oceny i opinie klientów: Big Data. Najlepsze praktyki budowy skalowalnych systemów obsługi danych w czasie rzeczywistym Nathan Marz, James Warren

(3)

6
(3)
5
(0)
4
(0)
3
(0)
2
(0)
1
(0)

6.0

Pozycja, która proponuje architekturę, dzięki której systemy klasy Big Data mogą posiadać z pozoru niemożliwe do spełnienia własności. Można znać, wiele cegiełek z narzędzi Big Data, to jednak nie wystarcza, trzeba wiedzieć jak je ze sobą połączyć - i o tym jest ta pozycja.

Opinia: anonimowa Opinia dodana: 2017-11-17 Ocena: 6

Opinia niepotwierdzona zakupem

Opinia dotyczy produktu: ksiązka drukowana

Czy opinia była pomocna:

TAK (0) NIE (0)
Świetna! Nauczyła mnie bardzo dużo, polecam każdemu.

Opinia: Kacper Pikulski Opinia dodana: 2017-02-10 Ocena: 6

Opinia potwierdzona zakupem

Opinia dotyczy produktu: ksiązka drukowana

Czy opinia była pomocna:

TAK (0) NIE (0)
Świetna książka - czytelny układ, jasny przekaz, dużo konkretów i przykładów. Bardzo treściwa i rzeczowa, zdecydowanie polecam.

Opinia: Tomasz Lewowski Opinia dodana: 2016-06-04 Ocena: 6

Opinia niepotwierdzona zakupem

Opinia dotyczy produktu: ksiązka drukowana

Czy opinia była pomocna:

TAK (0) NIE (0)

więcej opinii

Szczegóły książki

Dane producenta: »
Tytuł oryginału:: Big Data: Principles and best practices of scalable realtime data systems
Tłumaczenie:: Lech Lachowski
ISBN Książki drukowanej:: 978-83-283-1892-2, 9788328318922
Data wydania książki drukowanej :: 2016-02-18
ISBN Ebooka:: 978-83-283-1895-3, 9788328318953
Data wydania ebooka :: 2016-02-18 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
Format:: 168x237
Numer z katalogu:: 42001
druk na żądanie!: dnż
Rozmiar pliku Pdf:: 7.9MB
Rozmiar pliku ePub:: 6.8MB
Rozmiar pliku Mobi:: 16.3MB
Pobierz przykładowy rozdział PDF »
Przykłady na ftp » 65.3kB

Zgłoś erratę
Serie wydawnicze: W Akcji

Kategorie

Kliknij, aby zgłosić błędnie przypisaną kategorię »

Informatyka » Biznes IT » Big data
Informatyka » IT w ekonomii
Informatyka » Biznes IT » Big data » Analiza danych

Dostępność produktu

Produkt nie został jeszcze oceniony pod kątem ułatwień dostępu lub nie podano żadnych informacji o ułatwieniach dostępu lub są one niewystarczające. Prawdopodobnie Wydawca/Dostawca jeszcze nie umożliwił dokonania walidacji produktu lub nie przekazał odpowiednich informacji na temat jego dostępności.

Spis treści książki

Przedmowa (11)

Podziękowania (13)

O książce (17)

Rozdział 1. Nowy paradygmat dla Big Data (19)

1.1. Zawartość książki (20)
1.2. Skalowanie tradycyjnej bazy danych (21)
- 1.2.1. Skalowanie za pomocą kolejki (22)
- 1.2.2. Skalowanie przez sharding bazy danych (22)
- 1.2.3. Rozpoczynają się problemy z odpornością na błędy (23)
- 1.2.4. Problemy z uszkodzeniem danych (24)
- 1.2.5. Co poszło nie tak? (24)
- 1.2.6. W jaki sposób techniki Big Data mogą pomóc? (24)
1.3. NoSQL nie jest panaceum (25)
1.4. Pierwsze zasady (25)
1.5. Wymagane właściwości systemu Big Data (26)
- 1.5.1. Niezawodność i odporność na błędy (26)
- 1.5.2. Odczytywanie i aktualizowanie z niską latencją (27)
- 1.5.3. Skalowalność (27)
- 1.5.4. Uogólnienie (27)
- 1.5.5. Rozszerzalność (27)
- 1.5.6. Zapytania ad hoc (28)
- 1.5.7. Minimalna konserwacja (28)
- 1.5.8. Debugowalność (28)
1.6. Problemy z architekturami w pełni przyrostowymi (29)
- 1.6.1. Złożoność operacyjna (29)
- 1.6.2. Ekstremalna złożoność osiągania spójności ostatecznej (30)
- 1.6.3. Brak odporności na ludzkie błędy (32)
- 1.6.4. Rozwiązanie w pełni przyrostowe w porównaniu z architekturą lambda (32)
1.7. Architektura lambda (34)
- 1.7.1. Warstwa przetwarzania wsadowego (36)
- 1.7.2. Warstwa obsługująca (37)
- 1.7.3. Warstwy przetwarzania wsadowego i obsługująca zapewniają niemal wszystkie właściwości (37)
- 1.7.4. Warstwa przetwarzania czasu rzeczywistego (39)
1.8. Najnowsze trendy w technologii (41)
- 1.8.1. Procesory nie stają się coraz szybsze (42)
- 1.8.2. Elastyczne chmury (42)
- 1.8.3. Dynamiczny ekosystem open source dla Big Data (42)
1.9. Przykładowa aplikacja: SuperWebAnalytics.com (44)
1.10. Podsumowanie (44)

CZĘŚĆ I. WARSTWA PRZETWARZANIA WSADOWEGO (47)

Rozdział 2. Model danych dla Big Data (49)

2.1. Właściwości danych (51)
- 2.1.1. Dane są surowe (53)
- 2.1.2. Dane są niemutowalne (56)
- 2.1.3. Dane są wiecznie prawdziwe (59)
2.2. Reprezentacja danych za pomocą modelu opartego na faktach (60)
- 2.2.1. Przykładowe fakty i ich właściwości (60)
- 2.2.2. Korzyści ze stosowania modelu opartego na faktach (62)
2.3. Schematy graficzne (66)
- 2.3.1. Elementy schematu graficznego (66)
- 2.3.2. Potrzeba zapewnienia egzekwowalności schematu (67)
2.4. Kompletny model danych dla aplikacji SuperWebAnalytics.com (68)
2.5. Podsumowanie (70)

Rozdział 3. Model danych dla Big Data: ilustracja (71)

3.1. Dlaczego framework serializacji? (72)
3.2. Apache Thrift (72)
- 3.2.1. Węzły (73)
- 3.2.2. Krawędzie (73)
- 3.2.3. Właściwości (74)
- 3.2.4. Połączenie wszystkich elementów w obiekty danych (75)
- 3.2.5. Ewolucja schematu (75)
3.3. Ograniczenia frameworku serializacji (76)
3.4. Podsumowanie (78)

Rozdział 4. Przechowywanie danych w warstwie przetwarzania wsadowego (79)

4.1. Wymagania dotyczące przechowywania głównego zbioru danych (80)
4.2. Wybór rozwiązania pamięci masowej dla warstwy przetwarzania wsadowego (81)
- 4.2.1. Użycie magazynu danych klucz-wartość dla głównego zbioru danych (82)
- 4.2.2. Rozproszone systemy plików (82)
4.3. Sposób działania rozproszonych systemów plików (83)
4.4. Przechowywanie głównego zbioru danych z wykorzystaniem rozproszonego systemu plików (85)
4.5. Partycjonowanie pionowe (86)
4.6. Niskopoziomowy charakter rozproszonych systemów plików (87)
4.7. Przechowywanie głównego zbioru danych aplikacji SuperWebAnalytics.com w rozproszonym systemie plików (89)
4.8. Podsumowanie (90)

Rozdział 5. Przechowywanie danych w warstwie przetwarzania wsadowego: ilustracja (91)

5.1. Korzystanie z Hadoop Distributed File System (92)
- 5.1.1. Problem małych plików (93)
- 5.1.2. Dążenie do wyższego poziomu abstrakcji (93)
5.2. Przechowywanie danych w warstwie przetwarzania wsadowego z wykorzystaniem biblioteki Pail (94)
- 5.2.1. Podstawowe operacje biblioteki Pail (95)
- 5.2.2. Serializacja i umieszczanie obiektów w wiaderkach (96)
- 5.2.3. Operacje przetwarzania wsadowego z wykorzystaniem biblioteki Pail (98)
- 5.2.4. Partycjonowanie pionowe z wykorzystaniem biblioteki Pail (99)
- 5.2.5. Formaty plików i kompresja biblioteki Pail (100)
- 5.2.6. Podsumowanie zalet biblioteki Pail (101)
5.3. Przechowywanie głównego zbioru danych dla aplikacji SuperWebAnalytics.com (102)
- 5.3.1. Ustrukturyzowane wiaderko dla obiektów Thrift (103)
- 5.3.2. Podstawowe wiaderko dla aplikacji SuperWebAnalytics.com (104)
- 5.3.3. Podział wiaderka w celu pionowego partycjonowania zbioru danych (104)
5.4. Podsumowanie (107)

Rozdział 6. Warstwa przetwarzania wsadowego (109)

6.1. Przykłady do rozważenia (110)
- 6.1.1. Liczba odsłon w czasie (110)
- 6.1.2. Inferencja płci (111)
- 6.1.3. Punkty wpływu (111)
6.2. Obliczenia w warstwie przetwarzania wsadowego (112)
6.3. Porównanie algorytmów ponownego obliczania z algorytmami przyrostowymi (114)
- 6.3.1. Wydajność (116)
- 6.3.2. Odporność na ludzkie błędy (117)
- 6.3.3. Ogólność algorytmów (117)
- 6.3.4. Wybór stylu algorytmu (118)
6.4. Skalowalność w warstwie przetwarzania wsadowego (119)
6.5. MapReduce: paradygmat dla obliczeń Big Data (119)
- 6.5.1. Skalowalność (121)
- 6.5.2. Odporność na błędy (123)
- 6.5.3. Ogólność MapReduce (123)
6.6. Niskopoziomowy charakter MapReduce (125)
- 6.6.1. Wieloetapowe obliczenia są nienaturalne (125)
- 6.6.2. Operacje łączenia są bardzo skomplikowane do ręcznej implementacji (126)
- 6.6.3. Wykonywanie logiczne jest ściśle powiązane z fizycznym (128)
6.7. Diagramy potokowe: wyższy poziom sposobu myślenia na temat obliczeń wsadowych (129)
- 6.7.1. Koncepcje diagramów potokowych (129)
- 6.7.2. Wykonywanie diagramów potokowych poprzez MapReduce (134)
- 6.7.3. Agregator łączący (134)
- 6.7.4. Przykłady diagramów potokowych (136)
6.8. Podsumowanie (136)

Rozdział 7. Warstwa przetwarzania wsadowego: ilustracja (139)

7.1. Przykład ilustracyjny (140)
7.2. Typowe pułapki narzędzi do przetwarzania danych (142)
- 7.2.1. Języki niestandardowe (142)
- 7.2.2. Słabo komponowalne abstrakcje (143)
7.3. Wprowadzenie do JCascalog (144)
- 7.3.1. Model danych JCascalog (144)
- 7.3.2. Struktura zapytania JCascalog (145)
- 7.3.3. Kwerendowanie wielu zbiorów danych (147)
- 7.3.4. Grupowanie i agregatory (150)
- 7.3.5. Analiza przykładowego zapytania (150)
- 7.3.6. Niestandardowe operacje predykatów (153)
7.4. Kompozycja (158)
- 7.4.1. Łączenie podzapytań (158)
- 7.4.2. Podzapytania tworzone dynamicznie (159)
- 7.4.3. Makra predykatów (162)
- 7.4.4. Makra predykatów tworzone dynamicznie (164)
7.5. Podsumowanie (166)

Rozdział 8. Przykładowa warstwa przetwarzania wsadowego: architektura i algorytmy (167)

8.1. Projekt warstwy przetwarzania wsadowego aplikacji SuperWebAnalytics.com (168)
- 8.1.1. Obsługiwane zapytania (168)
- 8.1.2. Obrazy wsadowe (169)
8.2. Przegląd przepływu pracy (172)
8.3. Przyjmowanie nowych danych (174)
8.4. Normalizacja adresów URL (174)
8.5. Normalizacja identyfikatorów użytkowników (175)
8.6. Usuwanie zduplikowanych odsłon (180)
8.7. Obliczanie obrazów wsadowych (180)
- 8.7.1. Liczba odsłon w czasie (180)
- 8.7.2. Liczba unikatowych użytkowników w czasie (181)
- 8.7.3. Analiza współczynnika odrzuceń (182)
8.8. Podsumowanie (183)

Rozdział 9. Przykładowa warstwa przetwarzania wsadowego: implementacja (185)

9.1. Punkt startowy (186)
9.2. Przygotowanie przepływu pracy (187)
9.3. Przyjmowanie nowych danych (187)
9.4. Normalizacja adresów URL (191)
9.5. Normalizacja identyfikatorów użytkowników (192)
9.6. Usuwanie zduplikowanych odsłon (197)
9.7. Obliczanie obrazów wsadowych (197)
- 9.7.1. Liczba odsłon w czasie (197)
- 9.7.2. Liczba unikatowych użytkowników w czasie (200)
- 9.7.3. Analiza współczynnika odrzuceń (201)
9.8. Podsumowanie (204)

CZĘŚĆ II. WARSTWA OBSŁUGUJĄCA (205)

Rozdział 10. Warstwa obsługująca (207)

10.1. Metryki wydajności dla warstwy obsługującej (209)
10.2. Rozwiązanie warstwy obsługującej dotyczące problemu wyboru między normalizacją a denormalizacją (211)
10.3. Wymagania względem bazy danych warstwy obsługującej (213)
10.4. Projektowanie warstwy obsługującej dla aplikacji SuperWebAnalytics.com (215)
- 10.4.1. Liczba odsłon w czasie (215)
- 10.4.2. Liczba użytkowników w czasie (216)
- 10.4.3. Analiza współczynnika odrzuceń (217)
10.5. Porównanie z rozwiązaniem w pełni przyrostowym (217)
- 10.5.1. W pełni przyrostowe rozwiązanie problemu liczby unikatowych użytkowników w czasie (218)
- 10.5.2. Porównanie z rozwiązaniem opartym na architekturze lambda (224)
10.6. Podsumowanie (224)

Rozdział 11. Warstwa obsługująca: ilustracja (227)

11.1. Podstawy ElephantDB (228)
- 11.1.1. Tworzenie obrazu w ElephantDB (228)
- 11.1.2. Serwowanie obrazu w ElephantDB (229)
- 11.1.3. Korzystanie z ElephantDB (229)
11.2. Budowanie warstwy obsługującej dla aplikacji SuperWebAnalytics.com (231)
- 11.2.1. Liczba odsłon w czasie (231)
- 11.2.2. Liczba unikatowych użytkowników w czasie (234)
- 11.2.3. Analiza współczynnika odrzuceń (235)
11.3. Podsumowanie (236)

CZĘŚĆ III. WARSTWA PRZETWARZANIA CZASU RZECZYWISTEGO (237)

Rozdział 12. Obrazy czasu rzeczywistego (239)

12.1. Obliczanie obrazów czasu rzeczywistego (241)
12.2. Przechowywanie obrazów czasu rzeczywistego (242)
- 12.2.1. Dokładność ostateczna (243)
- 12.2.2. Ilość stanu przechowywanego w warstwie przetwarzania czasu rzeczywistego (244)
12.3. Wyzwania obliczeń przyrostowych (245)
- 12.3.1. Słuszność twierdzenia CAP (245)
- 12.3.2. Kompleksowa interakcja między twierdzeniem CAP a algorytmami przyrostowymi (247)
12.4. Porównanie aktualizacji asynchronicznych z synchronicznymi (249)
12.5. Wygaszanie obrazów czasu rzeczywistego (250)
12.6. Podsumowanie (253)

Rozdział 13. Obrazy czasu rzeczywistego: ilustracja (255)

13.1. Model danych Cassandry (256)
13.2. Korzystanie z bazy danych Cassandra (257)
- 13.2.1. Zaawansowane funkcje Cassandry (259)
13.3. Podsumowanie (259)

Rozdział 14. Kolejkowanie i przetwarzanie strumieniowe (261)

14.1. Kolejkowanie (262)
- 14.1.1. Serwery kolejek pojedynczego konsumenta (263)
- 14.1.2. Kolejki wielu konsumentów (264)
14.2. Przetwarzanie strumieniowe (265)
- 14.2.1. Kolejki i procesy robocze (266)
- 14.2.2. Pułapki paradygmatu "kolejki i procesy robocze" (267)
14.3. Pojedyncze przetwarzanie strumieniowe wyższego poziomu (268)
- 14.3.1. Model Storm (268)
- 14.3.2. Zapewnianie przetwarzania komunikatów (272)
14.4. Warstwa przetwarzania czasu rzeczywistego dla aplikacji SuperWebAnalytics.com (274)
- 14.4.1. Struktura topologii (277)
14.5. Podsumowanie (278)

Rozdział 15. Kolejkowanie i przetwarzanie strumieniowe: ilustracja (281)

15.1. Definiowanie topologii za pomocą Apache Storm (281)
15.2. Klastry Apache Storm i wdrażanie topologii (284)
15.3. Gwarantowanie przetwarzania komunikatów (286)
15.4. Implementacja warstwy przetwarzania czasu rzeczywistego aplikacji SuperWebAnalytics.com dla liczby unikatowych użytkowników w czasie (288)
15.5. Podsumowanie (292)

Rozdział 16. Mikrowsadowe przetwarzanie strumieniowe (293)

16.1. Osiąganie semantyki "dokładnie raz" (294)
- 16.1.1. Ściśle uporządkowane przetwarzanie (294)
- 16.1.2. Mikrowsadowe przetwarzanie strumieniowe (295)
- 16.1.3. Topologie przetwarzania mikrowsadowego (296)
16.2. Podstawowe koncepcje mikrowsadowego przetwarzania strumieniowego (299)
16.3. Rozszerzanie diagramów potokowych dla przetwarzania mikrowsadowego (300)
16.4. Dokończenie warstwy przetwarzania czasu rzeczywistego dla aplikacji SuperWebAnalytics.com (302)
- 16.4.1. Liczba odsłon w czasie (302)
- 16.4.2. Analiza współczynnika odrzuceń (302)
16.5. Inne spojrzenie na przykład analizy współczynnika odrzuceń (307)
16.6. Podsumowanie (308)

Rozdział 17. Mikrowsadowe przetwarzanie strumieniowe: ilustracja (309)

17.1. Korzystanie z interfejsu Trident (310)
17.2. Dokończenie warstwy przetwarzania czasu rzeczywistego dla aplikacji SuperWebAnalytics.com (313)
- 17.2.1. Liczba odsłon w czasie (314)
- 17.2.2. Analiza współczynnika odrzuceń (316)
17.3. W pełni odporne na błędy przetwarzanie mikrowsadowe z utrzymywaniem stanu w pamięci (322)
17.4. Podsumowanie (323)

Rozdział 18. Tajniki architektury lambda (325)

18.1. Definiowanie systemów danych (325)
18.2. Warstwa przetwarzania wsadowego i warstwa obsługująca (327)
- 18.2.1. Przyrostowe przetwarzanie wsadowe (328)
- 18.2.2. Pomiar i optymalizacja wykorzystania zasobów przez warstwę przetwarzania wsadowego (335)
18.3. Warstwa przetwarzania czasu rzeczywistego (339)
18.4. Warstwa zapytań (340)
18.5. Podsumowanie (341)

Skorowidz (343)

pokaż cały spis treści

Helion - inne książki

Nowość Promocja Promocja 2za1

Automatyka przemysłowa i systemy sterowania stanowią fundament współczesnego przemysłu. Dzięki ich zastosowaniu możliwe jest precyzyjne planowanie, prowadzenie i koordynowanie procesów technologicznych. Znajomość zasad rządzących zarówno automatyką, jak i sterowaniem pozostaje obowiązkowa dla projektantów, osób uruchamiających i obsługujących urządzenia przemysłowe.
- ebook
- książka
Automatyka przemysłowa i systemy sterowania w pigułce

Witold Krieser

(29,95 zł najniższa cena z 30 dni)

35.94 zł ~~59.90 zł (-40%)~~
Nowość Promocja Promocja 2za1

Książka stanowi kompleksowe wprowadzenie do stosowanego wnioskowania bayesowskiego i jego implementacji w Pythonie. Autor używa nowoczesnej biblioteki PyMC do programowania probabilistycznego, a ArviZ do analizy i diagnostyki modeli. Omawia także inne narzędzia ekosystemu bayesowskiego, takie jak Bambi, PreliZ i Kulprit. Zapoznasz się z zagadnieniami bayesowskich addytywnych drzew regresyjnych (BART), selekcji zmiennych, konstrukcji rozkładów a priori i porównywania modeli. Ponadto dowiesz się, jak budować, analizować i interpretować modele probabilistyczne w projektach z zakresu data science.
- ebook
- książka
Analiza bayesowska w Pythonie. Praktyczny przewodnik po modelowaniu probabilistycznym. Wydanie III

Osvaldo Martin

(44,50 zł najniższa cena z 30 dni)

53.40 zł ~~89.00 zł (-40%)~~
Nowość Promocja Promocja 2za1

W tej książce znajdziesz sposób na zapanowanie nad złożonością integracji AI. Poznasz koncepcje i procesy architektoniczne kluczowe dla budowania skalowalnych, solidnych systemów AI przy jednoczesnej minimalizacji ryzyka związanego z ich rozwojem i konserwacją. Poszczególne zagadnienia zostały zilustrowane rzeczywistymi przykładami i wzbogacone o praktyczne ćwiczenia, co pozwoli Ci pogłębić zrozumienie omawianych tematów. Krok po kroku nauczysz się budować kluczowe komponenty architektoniczne wspierające systemy AI. Książkę w szczególności docenią architekci i doświadczeni programiści, którzy chcą budować systemy AI w sposób uporządkowany, przewidywalny i zgodny z zasadami inżynierii oprogramowania.
- ebook
- książka
Architektura systemów AI. Projektowanie skalowalnego i niezawodnego oprogramowania

Richard D Avila, Imran Ahmad

(34,50 zł najniższa cena z 30 dni)

41.40 zł ~~69.00 zł (-40%)~~
Bestseller Nowość Promocja Promocja 2za1

Najpierw był wizjonerem technologicznym. Później, jako założyciel Microsoftu, przeobraził się w wyrachowanego kapitalistę, by po latach powrócić na scenę jako globalny filantrop. Nazywano go genialnym, bajecznie bogatym, hojnym. Czczono niemal jak króla. Aż w końcu na tym idealnym wizerunku pojawiła się głęboka rysa. I to nie jedna.
- ebook
- książka
Bill Gates. Wizja. Władza. Pieniądze. O wpływach, biznesie i tym, co niejawne

Anupreeta Das

(29,95 zł najniższa cena z 30 dni)

35.94 zł ~~59.90 zł (-40%)~~
Nowość Promocja Promocja 2za1

Systemy bazodanowe Oracle stanowią jeden z filarów infrastruktury IT w dużych organizacjach. Wspierają systemy biznesowe, zapewniając wysoką dostępność, wydajność i bezpieczeństwo przetwarzanych danych. Administrowanie takimi środowiskami to nie tylko utrzymanie ciągłości ich działania, ale również optymalizacja, automatyzacja i rozwiązywanie złożonych problemów w systemach o dużej skali. Kompetencje w tym obszarze są wysoko cenione na rynku i otwierają drogę do pracy przy najbardziej wymagających projektach IT.
- ebook
- książka
Administrowanie bazą danych Oracle w środowisku Linux

Karol Wieliczko

(49,50 zł najniższa cena z 30 dni)

59.40 zł ~~99.00 zł (-40%)~~
Nowość Promocja Promocja 2za1

Autorzy prowadzą czytelnika przez wszystkie aspekty profesjonalnego programowania w Node.js od fundamentów platformy i systemu modułów, przez programowanie asynchroniczne z wykorzystaniem callbacks, obietnic i async/await, aż po zaawansowane wzorce projektowe i architektury mikrousług. Szczegółowo omawiają strumienie Node.js, konstrukcyjne, strukturalne i behawioralne wzorce projektowe. Książka zawiera praktyczne receptury odpowiadające na typowe wyzwania: asynchroniczną inicjalizację, buforowanie, anulowanie operacji czy wykonywanie zadań obciążających procesor. Końcowe rozdziały koncentrują się na skalowalności przedstawiają techniki skalowania aplikacji, zastosowanie Kubernetes i wzorce komunikacji w systemach rozproszonych z użyciem Redis, RabbitMQ i ZeroMQ.
- ebook
- książka
Node.js. Wzorce projektowe i techniki tworzenia aplikacji produkcyjnych. Wydanie IV

Luciano Mammino, Mario Casciaro, Colin J. Ihrig (Foreword), Matteo Collina (Fore

(64,50 zł najniższa cena z 30 dni)

77.40 zł ~~129.00 zł (-40%)~~
Nowość Promocja Promocja 2za1

Dane są dziś powszechnie dostępne, ale rzadko w takiej formie, w jakiej ich potrzebujemy. Na szczęście z pomocą przychodzi Power Query. To nowoczesne narzędzie idealne do analityki w Excelu i Power BI, które zamienia żmudne, wielogodzinne czyszczenie danych w automatyczny, błyskawiczny proces.
- ebook
- książka
Power Query w Excelu. Analizuj dane jak profesjonalista

Adam Kopeć

(44,50 zł najniższa cena z 30 dni)

53.40 zł ~~89.00 zł (-40%)~~
Bestseller Nowość Promocja Promocja 2za1

Sztuczna inteligencja coraz silniej wpływa na nasze życie. Systemy oparte na uczeniu maszynowym decydują o przyznaniu kredytu, wspierają diagnozowanie chorób, odgrywają coraz większą rolę w odkryciach z zakresu biologii, chemii, fizyki czy medycyny. Skokowy rozwój dużych modeli językowych, takich jak ChatGPT, Gemini czy Claude, pozwala używać AI do zadań, które jeszcze niedawno były zarezerwowane wyłącznie dla ludzi.
- ebook
- książka
Dlaczego maszyny się uczą? O pięknie matematyki i działaniu współczesnej sztucznej inteligencji

Anil Ananthaswamy

(14,90 zł najniższa cena z 30 dni)

41.40 zł ~~69.00 zł (-40%)~~
Nowość Promocja Promocja 2za1

Ta przystępna i angażująca książka pomaga zrozumieć nawet złożone zagadnienia związane ze strukturami danych i z algorytmami. Przykłady zaczerpnięte z rzeczywistego świata pokazują, jak struktury danych działają w praktyce od przyspieszania wyszukiwania informacji po obsługę pacjentów w izbie przyjęć. Drzewa, kolejki, kopce i stosy nie będą miały przed Tobą żadnych tajemnic! Wizualne skojarzenia, trafne analogie i czytelne przykłady kodu w Pythonie sprawią, że abstrakcyjne pojęcia staną się intuicyjne i łatwe do zapamiętania. Jak wszystkie książki z serii Ilustrowany przewodnik, również ta pozycja jest lekka w odbiorze, praktyczna i wyjątkowo skuteczna dydaktycznie.
- ebook
- książka
Struktury danych. Ilustrowany przewodnik

Marcello La Rocca

(39,50 zł najniższa cena z 30 dni)

47.40 zł ~~79.00 zł (-40%)~~
Nowość Promocja Promocja 2za1

Terraform to oprogramowanie typu open source umożliwiające zarządzanie infrastrukturą IT jako kodem (IaC, ang. infrastructure as code). Pozwala deklaratywnie zdefiniować zasoby chmurowe - takie jak AWS, Azure czy Google Cloud a także zasoby lokalne przy użyciu języka HCL, a potem zautomatyzować ich wdrażanie, wersjonowanie i modyfikowanie.
- ebook
- książka
Terraform w praktyce. Buduj i automatyzuj infrastrukturę chmurową oraz zarządzaj nią z wykorzystaniem Dockera

Mariusz Dworniczak

(29,95 zł najniższa cena z 30 dni)

35.94 zł ~~59.90 zł (-40%)~~

Najczęściej zadawane pytania (FAQ)

1. Czy książka zawiera praktyczne przykłady wdrażania systemów Big Data?

Tak, książka prezentuje praktyczną implementację skalowalnego systemu Big Data na rzeczywistym przykładzie, co ułatwia zrozumienie omawianych koncepcji i technik.

2. Jakie technologie i narzędzia są omawiane w książce?

W książce szczegółowo opisano narzędzia takie jak Hadoop, Cassandra, Storm, ElephantDB oraz biblioteki do przetwarzania wsadowego i strumieniowego, a także zagadnienia związane z bazami NoSQL i architekturą lambda.

3. Czy książka wymaga wcześniejszej znajomości Big Data lub programowania?

Podstawowa znajomość baz danych i zagadnień informatycznych będzie pomocna, jednak książka została napisana z myślą o czytelnikach, którzy chcą uczyć się od podstaw, oferując przystępne wyjaśnienia i wprowadzenie do kluczowych pojęć.

4. Jakie zagadnienia związane ze skalowalnością i niezawodnością systemów danych są poruszane?

Książka omawia projektowanie architektur odpornych na błędy, techniki skalowania baz danych, zarządzanie złożonością obliczeń oraz zapewnianie wysokiej dostępności i minimalnej konserwacji systemów Big Data.

5. Czy książka porusza temat przetwarzania danych w czasie rzeczywistym?

Tak, znacząca część książki jest poświęcona przetwarzaniu danych w czasie rzeczywistym, w tym architekturze lambda, przetwarzaniu strumieniowemu, mikrowsadowemu oraz narzędziom takim jak Apache Storm.

6. W jaki sposób książka może pomóc w nauce projektowania i wdrażania rozproszonych systemów danych?

Książka prowadzi krok po kroku przez proces analizy, projektowania i implementacji skalowalnych systemów Big Data, oferując zarówno teoretyczne podstawy, jak i praktyczne wskazówki oraz przykłady kodu.

7. Czy publikacja nadaje się do samodzielnej nauki?

Tak, książka została napisana w sposób umożliwiający samodzielną naukę - zawiera liczne przykłady, ilustracje oraz szczegółowe omówienia zagadnień, co ułatwia przyswajanie wiedzy nawet bez wsparcia nauczyciela.

8. Czy w książce znajdę informacje o najnowszych trendach i technologiach Big Data?

Tak, autor omawia aktualne trendy, takie jak rozwój chmur obliczeniowych, dynamiczny ekosystem open source oraz ewolucję narzędzi i technik wykorzystywanych w nowoczesnych systemach Big Data.

Zamknij

Big Data. Najlepsze praktyki budowy skalowalnych systemów obsługi danych w czasie rzeczywistym Nathan Marz, James Warren

Kup w zestawie z dodatkowym rabatem

Opis książki : Big Data. Najlepsze praktyki budowy skalowalnych systemów obsługi danych w czasie rzeczywistym