Poznajemy Sparka. Błyskawiczna analiza danych
- Autorzy:
- Andy Konwinski, Karau Holden, Patrick Wendel, Matei Zaharia
- +74 pkt
- Wydawnictwo:
- Wydawnictwo Naukowe PWN
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 260
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Poznajemy Sparka. Błyskawiczna analiza danych
Ilość danych we wszystkich domenach wciąż rośnie. Jak możemy skutecznie je wykorzystywać? W książce Poznajemy Sparka przedstawiono Apache Spark, system open source do przetwarzania klastrów, dzięki któremu pisanie i uruchamianie aplikacji analizy danych jest szybsze. Za pomocą Sparka można stawić czoła dużym zbiorom danych za pośrednictwem prostych interfejsów w językach Python, Java i Scala.
Dzięki tej pracy, napisanej przez deweloperów Sparka, naukowcy zajmujący się danymi i inżynierowie dowiedzą się, jak przedstawiać równoległe zadania za pomocą kilku wierszy kodu oraz jak pisać aplikacje od prostych zdań wsadowych do przetwarzania strumieniowego i systemów uczących się. Informacje zawarte w książce pozwolą im na:.
- szybkie zgłębienie możliwości Sparka, takich jak rozproszone zbiory danych, buforowanie w pamięci oraz interaktywna powłoka
- wykorzystywanie wbudowanych bibliotek, łącznie z Spark SQL, Spark Streaming oraz MLlib
- wykorzystywanie paradygmatu programowania zamiast łączenia i dopasowywania narzędzi takich jak Hive, Hadoop, Mahout i Storm
- poznawanie sposobu wykorzystywania aplikacji interakcyjnych, wsadowych i strumieniowych dołączanie źródeł danych, np. HDFS, Hive, JSON i S3
Wybrane bestsellery
-
Learn how to use, deploy, and maintain Apache Spark with this comprehensive guide, written by the creators of the open-source cluster-computing framework. With an emphasis on improvements and new features in Spark 2.0, authors Bill Chambers and Matei Zaharia break down Spark topics into distinct ...
Spark: The Definitive Guide. Big Data Processing Made Simple Spark: The Definitive Guide. Big Data Processing Made Simple
(172.42 zł najniższa cena z 30 dni)172.37 zł
219.00 zł(-21%) -
Ta książka szczególnie przyda się osobom, które rozpoczynają pracę z Angularem. Dzięki niej szybko zaczniesz tworzyć aplikacje z wykorzystaniem wiersza poleceń (CLI), pisać testy jednostkowe i używać stylów zgodnych ze standardem Material Design. Dowiesz się również, jak wdrażać aplikacje w środo...
Poznaj Angular. Rzeczowy przewodnik po tworzeniu aplikacji webowych z użyciem frameworku Angular 15. Wydanie IV Poznaj Angular. Rzeczowy przewodnik po tworzeniu aplikacji webowych z użyciem frameworku Angular 15. Wydanie IV
(53.40 zł najniższa cena z 30 dni)57.84 zł
89.00 zł(-35%) -
Dorośli, doceniając rozrywkowe walory gry, dostrzegli także jej aspekty edukacyjne. Minecraft stał się na przykład bazą zajęć z programowania dla dzieci i młodzieży. Ta książka powstała na podstawie warsztatów dla średnio zaawansowanych i jest przeznaczona dla dzieci od dziesiątego roku życia. Uc...
Programowanie z Minecraftem dla dzieci. Poziom średnio zaawansowany. Wydanie II Programowanie z Minecraftem dla dzieci. Poziom średnio zaawansowany. Wydanie II
(32.94 zł najniższa cena z 30 dni)35.69 zł
54.90 zł(-35%) -
Jesteś początkującym programistą, poszukujesz swojej ścieżki i zastanawiasz się właśnie nad tym, czy nie skierować uwagi w stronę aplikacji mobilnych? To książka dla Ciebie. Zawarty w niej materiał jest odpowiedni dla osoby dysponującej podstawami któregoś z języków programowania i bazowym doświa...(41.40 zł najniższa cena z 30 dni)
44.85 zł
69.00 zł(-35%) -
Jednym z obszarów, w które AI wkracza coraz śmielej, jest programowanie. Tam, gdzie pracuje się z liczbami, kodem i algorytmami, pomoc sztucznej inteligencji okazuje się nieoceniona. Jak ją zaprosić do współpracy? Tego dowiesz się z naszego kursu. Jego tematyka obejmuje bowiem programowanie z wyk...
AI w praktyce. Kurs video. Narzędzia sztucznej inteligencji w programowaniu AI w praktyce. Kurs video. Narzędzia sztucznej inteligencji w programowaniu
(92.95 zł najniższa cena z 30 dni)118.30 zł
169.00 zł(-30%) -
PowerShell to zaawansowany interpreter poleceń oparty na środowisku programistycznym .NET Framework. Jest preferowanym narzędziem do kontrolowania i zarządzania środowiskiem Windows i Azure. W przeciwieństwie do większości powłok, które operują na łańcuchach znaków, PowerShell wykorzystuje obiekt...
PowerShell. Kurs video. Zarządzanie środowiskiem Windows i Azure PowerShell. Kurs video. Zarządzanie środowiskiem Windows i Azure
(92.95 zł najniższa cena z 30 dni)67.60 zł
169.00 zł(-60%) -
Trzecie wydanie Programowania z Minecraftem dla dzieci to kolejna odsłona cieszącego się uznaniem przewodnika, dzięki któremu Twoje dziecko rozpocznie przygodę z programowaniem. To książka adresowana do dzieci od ósmego roku życia, ale i starsi znajdą coś dla siebie. Przeprowadzi sprawnie młodych...
Programowanie z Minecraftem dla dzieci. Poziom podstawowy. Wydanie III Programowanie z Minecraftem dla dzieci. Poziom podstawowy. Wydanie III
(32.94 zł najniższa cena z 30 dni)35.69 zł
54.90 zł(-35%) -
Tę książkę docenią programiści, menedżerowie, inżynierowie i liderzy techniczni. Znajdziesz w niej cenne informacje o filozofii inżynierii oprogramowania, jak również o postępach w sposobie myślenia na jej temat. Na tej bazie oparto zestaw zasad ułatwiających skuteczne radzenie sobie z dwoma pods...
Nowoczesna inżynieria oprogramowania. Stosowanie skutecznych technik szybszego rozwoju oprogramowania wyższej jakości Nowoczesna inżynieria oprogramowania. Stosowanie skutecznych technik szybszego rozwoju oprogramowania wyższej jakości
(41.40 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
Internet rzeczy nadal ewoluuje - i staje się coraz powszechniejszy, a to może być zachętą do tego, by poznać go bliżej. Internet rzeczy. Podstawy programowania aplikacji i serwerów sieciowych w językach C/C++, MicroPython i Lua na urządzeniach IoT ESP8266, ESP32 i Arduino może się okazać świetną ...
Internet rzeczy. Podstawy programowania aplikacji i serwerów sieciowych w językach C/C++, MicroPython i Lua na urządzeniach IoT ESP8266, ESP32 i Arduino Internet rzeczy. Podstawy programowania aplikacji i serwerów sieciowych w językach C/C++, MicroPython i Lua na urządzeniach IoT ESP8266, ESP32 i Arduino
(59.40 zł najniższa cena z 30 dni)64.35 zł
99.00 zł(-35%) -
To drugie, zaktualizowane i uzupełnione wydanie książki poświęconej wdrażaniu najlepszych praktyk DevOps przy użyciu nowoczesnych narzędzi. Przedstawiono w niej informacje o kulturze DevOps, opisano różne narzędzia i techniki stosowane do jej wdrażania, takie jak IaC, potoki Git i CI/CD, a także ...
DevOps w praktyce. Wdrażanie narzędzi Terraform, Azure DevOps, Kubernetes i Jenkins. Wydanie II DevOps w praktyce. Wdrażanie narzędzi Terraform, Azure DevOps, Kubernetes i Jenkins. Wydanie II
(65.40 zł najniższa cena z 30 dni)70.85 zł
109.00 zł(-35%)
Ebooka "Poznajemy Sparka. Błyskawiczna analiza danych" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Poznajemy Sparka. Błyskawiczna analiza danych" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Poznajemy Sparka. Błyskawiczna analiza danych" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-83-011-8685-2, 9788301186852
- Data wydania ebooka:
- 2016-06-17 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Numer z katalogu:
- 49571
- Rozmiar pliku ePub:
- 2.8MB
- Rozmiar pliku Mobi:
- 6.8MB
Spis treści ebooka
- Okładka
- Strona tytułowa
- Strona redakcyjna
- Spis treści
- Słowo wstępne
- Wprowadzenie
- 1. Wprowadzenie do analizy danych w Sparku
- Czym jest Apache Spark?
- Ujednolicony stos
- Jądro Sparka
- Spark SQL
- Spark Streaming
- MLlib
- GraphX
- Zarządzanie klastrami
- Kto i po co korzysta ze Sparka?
- Zadania z zakresu nauki o danych
- Aplikacje przetwarzania danych
- Krótka historia Sparka
- Wersje i wydania Sparka
- Warstwy pamięci w Sparku
- 2. Pobieranie Sparka i rozpoczęcie pracy
- Pobieranie Sparka
- Wprowadzenie do powłok Sparka dla Pythona i Scali
- Wprowadzenie do podstawowych pojęć Sparka
- Niezależne aplikacje
- Inicjalizowanie kontekstu SparkContext
- Tworzenie niezależnych aplikacji
- Podsumowanie
- 3. Programowanie z rozproszonymi zbiorami danych RDD
- Podstawy RDD
- Tworzenie RDD
- Działania na RDD
- Transformacje
- Akcje
- Leniwa ewaluacja
- Przekazywanie funkcji do Sparka
- Python
- Scala
- Java
- Popularne transformacje i akcje
- Podstawowe RDD
- Przekształcenia między typami RDD
- Utrzymywanie (buforowanie)
- Podsumowanie
- 4. Praca z parami klucz-wartość
- Motywacja
- Tworzenie RDD par
- Transformacje na RDD par
- Agregacje
- Grupowanie danych
- Złączenia
- Sortowanie danych
- Działania dostępne na RDD par
- Partycjonowanie danych (zaawansowane)
- Określanie partycjonera RDD
- Działania, które zyskują dzięki partycjonowaniu
- Działania, które mają wpływ na partycjonowanie
- Przykład: PageRank
- Niestandardowe partycjonery
- Podsumowanie
- 5. Ładowanie i zapisywanie danych
- Motywacja
- Formaty plików
- Pliki tekstowe
- JSON
- Wartości oddzielane przecinkami i tabulatorami
- Pliki sekwencyjne
- Pliki obiektowe
- Formaty wejścia i wyjścia w Hadoop
- Kompresja plików
- Systemy plików
- Lokalny lub zwykły
- Amazon S3
- HDFS
- Dane strukturalne w Spark SQL
- Apache Hive
- JSON
- Bazy danych
- Łączniki z bazą danych Java
- Cassandra
- HBase
- Elasticsearch
- Podsumowanie
- 6. Zaawansowane programowanie w Sparku
- Wprowadzenie
- Akumulatory
- Akumulatory i odporność na błędy
- Akumulatory niestandardowe
- Zmienne rozgłoszeniowe
- Optymalizacja rozgłoszeń
- Praca na poszczególnych partycjach
- Potokowanie do programów zewnętrznych
- Działania liczbowe na RDD
- Podsumowanie
- 7. Uruchamianie Sparka w klastrze
- Wprowadzenie
- Spark Runtime Architecture
- Sterownik
- Wykonawcy
- Menedżer klastrów
- Uruchamianie programu
- Podsumowanie
- Wdrażanie aplikacji za pomocą spark-submit
- Pakowanie kodu i elementów zależnych
- Aplikacja Java Spark budowana za pomocą Mavena
- Aplikacja Scala Spark budowana za pomocą sbt
- Konflikty zależności
- Harmonogramowanie w aplikacjach Sparka i między nimi
- Menedżery klastrów
- Menedżer klastrów Standalone
- Hadoop YARN
- Apache Mesos
- Amazon EC2
- Którego menedżera klastrów używać?
- Podsumowanie
- 8. Dostrajanie i debugowanie Sparka
- Konfigurowanie Sparka z SparkConf
- Składniki wykonania: prace, zadania i etapy
- Znajdowanie informacji
- Sieciowy interfejs użytkownika w Sparku (Web UI)
- Dzienniki sterownika i wykonawców
- Kluczowe zagadnienia dotyczące wydajności
- Poziom równoległości
- Format serializacji
- Zarządzanie pamięcią
- Dostarczanie sprzętu
- Podsumowanie
- 9. Spark SQL
- Łączenie ze Spark SQL
- Używanie Spark SQL w aplikacjach
- Inicjalizacja Spark SQL
- Przykład podstawowych zapytań
- Elementy DataFrames
- Buforowanie
- Ładowanie i zapisywanie danych
- Apache Hive
- Źródła danych lub Parquet
- JSON
- Ze zbiorów RDD
- Serwer JDBC/ODBC
- Praca z Beeline
- Długotrwałe tablice i zapytania
- Funkcje definiowane przez użytkowników
- UDF w Spark SQL
- Funkcje UDF w Hive
- Wydajność Spark SQL
- Opcje dostrajania wydajności
- Podsumowanie
- 10. Spark Streaming
- Prosty przykład
- Architektura i abstrakcja
- Transformacje
- Transformacje bezstanowe
- Transformacje stanowe
- Operacje wyjścia
- Źródła wejściowe
- Główne źródła
- Dodatkowe źródła
- Wiele źródeł i ustawianie rozmiaru klastra
- Działanie 24/7
- Punkty kontrolne
- Odporność sterownika na błędy
- Odporność węzła roboczego na błędy
- Odporność odbiornika na błędy
- Gwarancje przetwarzania
- Interfejs użytkownika w strumieniowaniu
- Kwestie wydajności
- Rozmiary wsadu i okien
- Poziom równoległości
- Czyszczenie pamięci i jej wykorzystywanie
- Podsumowanie
- 11. Systemy uczące się w MLlib
- Przegląd
- Wymagania dotyczące systemu
- Podstawy systemów uczących się
- Przykład: klasyfikacja spamu
- Typy danych
- Praca z wektorami
- Algorytmy
- Ekstrakcja cech
- Statystyki
- Klasyfikacja i regresja
- Klastrowanie
- Wspólne filtrowanie i rekomendacje
- Zmniejszenie wymiarowości
- Ewaluacja modelu
- Wskazówki i kwestie wydajności
- Przygotowanie cech
- Konfigurowanie algorytmów
- Bufrowanie zbiorów RDD do ponownego wykorzystania
- Rozpoznawanie rzadkości
- Poziom równoległości
- API potoku
- Podsumowanie
- O autorach
- Przypisy
Wydawnictwo Naukowe PWN - inne książki
-
Czym są fale grawitacyjne, skąd pochodzą, dlaczego są tak ważne i dlaczego nikt nie mógł udowodnić, że istniały wcześniej? Odpowiedzi na wszelkie pytania dotyczące natury tych fal znajdziecie w niniejszej książce. Napisana prostym językiem i przeplatana dodatkowymi samouczkami objaśniającymi, spo...(60.83 zł najniższa cena z 30 dni)
62.71 zł
79.00 zł(-21%) -
Książka Alvina Plantingi Gdzie naprawdę jest konflikt. Nauka, religia i naturalizm kwestionuje naturalistyczny pogląd na świat i podejmuje wyzwanie rzucone religii przez nowy ateizm. W obronie racjonalności teizmu chrześcijańskiego Plantinga sięga do zdobyczy współczesnej fizyki kwantowej, kosmol...(53.13 zł najniższa cena z 30 dni)
55.20 zł
69.00 zł(-20%) -
To jedna z najważniejszych książek o inwestowaniu jakie kiedykolwiek napisano! Ponad 2 miliony sprzedanych egzemplarzy! W jaki sposób inwestować, aby było to sposobem na życie? Jakich metod używają zawodowi inwestorzy? Jak stosować analizę techniczną i fundamentalną w praktyce? Na czym pole...(76.23 zł najniższa cena z 30 dni)
76.45 zł
99.00 zł(-23%) -
Historia Ziemi jest znanym i cenionym podręcznikiem akademickim z zakresu geologii historycznej. Autorzy opisują dzieje Ziemi, od jej powstania do czasów współczesnych, oraz rozwijającego się na niej życia. Obecne wydanie, podobnie jak poprzednie, opiera się na podstawowej zasadzie najściślejszeg...(154.22 zł najniższa cena z 30 dni)
154.17 zł
199.00 zł(-23%) -
Matematyka to królowa nauk to stwierdzenie, jakże prawdziwe i uniwersalne, może również rozbudzić naszą ciekawość i chęć odkrycia tego, co tak naprawdę sprawiło, że tak cenimy tę naukę. Poznanie niesamowitej historii najwspanialszej nauki, jaką jest matematyka to rzecz, której trudno sobie odmów...(161.28 zł najniższa cena z 30 dni)
161.18 zł
209.00 zł(-23%) -
Słynny podręcznik, pierwotnie przeznaczony dla studentów Kalifornijskiego Instytutu Technologicznego, następnie przekształcony przez współpracowników autora, Roberta B. Leightona i Matthew Sandsa, w najbardziej niezwykły podręcznik fizyki, jaki został kiedykolwiek napisany. Jego oryginalność pole...
Feynmana wykłady z fizyki. Tom 1.2. Optyka, termodynamika, fale Feynmana wykłady z fizyki. Tom 1.2. Optyka, termodynamika, fale
(65.45 zł najniższa cena z 30 dni)66.35 zł
85.00 zł(-22%) -
Słynny podręcznik, pierwotnie przeznaczony dla studentów Kalifornijskiego Instytutu Technologicznego, następnie przekształcony przez współpracowników autora, Roberta B. Leightona i Matthew Sandsa, w najbardziej niezwykły podręcznik fizyki, jaki został kiedykolwiek napisany. Jego oryginalność pole...
Feynmana wykłady z fizyki. Tom 1.1. Mechanika, szczególna teoria względności Feynmana wykłady z fizyki. Tom 1.1. Mechanika, szczególna teoria względności
(57.84 zł najniższa cena z 30 dni)71.20 zł
89.00 zł(-20%) -
Jak kupujesz różne rzeczy? Na przykład mleko. Chodzi Ci o coś, co można po prostu wlać do kawy czy miski z porannymi płatkami zbożowymi. Ale kiedy stoisz przed półką w sklepie, na której jest dziesięć rodzajów mleka, które wybierzesz? Co dzieje się w Twojej głowie moment przed tym, zanim sięgnies...(47.20 zł najniższa cena z 30 dni)
47.20 zł
59.00 zł(-20%) -
Fascynujące kompendium współczesnej wiedzy na temat psychofizjologii stresu łączące perspektywy 4 dyscyplin: psychologii, neurologii, immunologii i endokrynologii. Autor wnikliwie opisał, co dzieje się z człowiekiem, gdy doświadcza stresu. Dzięki lekturze zrozumiemy, w jaki sposób oddziaływanie s...(64.35 zł najniższa cena z 30 dni)
79.20 zł
99.00 zł(-20%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Zamknij
Przeczytaj darmowy fragment
Oceny i opinie klientów: Poznajemy Sparka. Błyskawiczna analiza danych Andy Konwinski, Karau Holden, Patrick Wendel, Matei Zaharia (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.