Poznajemy Sparka. Błyskawiczna analiza danych
- Autorzy:
- Andy Konwinski, Karau Holden, Patrick Wendel, Matei Zaharia
- +74 pkt
- Wydawnictwo:
- Wydawnictwo Naukowe PWN
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 260
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Poznajemy Sparka. Błyskawiczna analiza danych
Ilość danych we wszystkich domenach wciąż rośnie. Jak możemy skutecznie je wykorzystywać? W książce Poznajemy Sparka przedstawiono Apache Spark, system open source do przetwarzania klastrów, dzięki któremu pisanie i uruchamianie aplikacji analizy danych jest szybsze. Za pomocą Sparka można stawić czoła dużym zbiorom danych za pośrednictwem prostych interfejsów w językach Python, Java i Scala.
Dzięki tej pracy, napisanej przez deweloperów Sparka, naukowcy zajmujący się danymi i inżynierowie dowiedzą się, jak przedstawiać równoległe zadania za pomocą kilku wierszy kodu oraz jak pisać aplikacje od prostych zdań wsadowych do przetwarzania strumieniowego i systemów uczących się. Informacje zawarte w książce pozwolą im na:.
- szybkie zgłębienie możliwości Sparka, takich jak rozproszone zbiory danych, buforowanie w pamięci oraz interaktywna powłoka
- wykorzystywanie wbudowanych bibliotek, łącznie z Spark SQL, Spark Streaming oraz MLlib
- wykorzystywanie paradygmatu programowania zamiast łączenia i dopasowywania narzędzi takich jak Hive, Hadoop, Mahout i Storm
- poznawanie sposobu wykorzystywania aplikacji interakcyjnych, wsadowych i strumieniowych dołączanie źródeł danych, np. HDFS, Hive, JSON i S3
Wybrane bestsellery
-
Learn how to use, deploy, and maintain Apache Spark with this comprehensive guide, written by the creators of the open-source cluster-computing framework. With an emphasis on improvements and new features in Spark 2.0, authors Bill Chambers and Matei Zaharia break down Spark topics into distinct ...
Spark: The Definitive Guide. Big Data Processing Made Simple Spark: The Definitive Guide. Big Data Processing Made Simple
(203.15 zł najniższa cena z 30 dni)203.15 zł
239.00 zł(-15%) -
W tej książce znajdziesz kompletny proces analityczny, od generowania pomysłów po przygotowanie zestawienia produktu i rynku. Dowiesz się z niej, jak zweryfikować swój pomysł, znaleźć odpowiednich klientów, zdefiniować ostateczną wersję produktu, zarobić na swojej działalności i ją wypromować. Zn...
Metoda Lean Analytics. Zbuduj sukces startupu w oparciu o analizę danych Metoda Lean Analytics. Zbuduj sukces startupu w oparciu o analizę danych
(79.00 zł najniższa cena z 30 dni)51.35 zł
79.00 zł(-35%) -
Oto pierwszy tom dzieła, które stanowi inspirujące spojrzenie na sztuczną inteligencję. Jego zrozumienie nie wymaga wybitnej znajomości informatyki i matematyki. Książka jest wspaniałą syntezą wczesnych i późniejszych koncepcji, a także technik, przeprowadzoną we frameworku idei, metod i technolo...
Sztuczna inteligencja. Nowe spojrzenie. Wydanie IV. Tom 1 Sztuczna inteligencja. Nowe spojrzenie. Wydanie IV. Tom 1
(109.85 zł najniższa cena z 30 dni)109.85 zł
169.00 zł(-35%) -
To drugi tom klasycznego podręcznika wiedzy o sztucznej inteligencji. Podobnie jak w wypadku pierwszej części, lektura tej książki nie wymaga wybitnej znajomości tematu. Dzięki przejrzystości tekstu i umiejętnemu unikaniu nadmiernego formalizmu można w dość łatwy sposób zrozumieć kluczowe idee i ...
Sztuczna inteligencja. Nowe spojrzenie. Wydanie IV. Tom 2 Sztuczna inteligencja. Nowe spojrzenie. Wydanie IV. Tom 2
(83.85 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
To kolejne wydanie lubianego samouczka, dzięki któremu w ramach 24 godzinnych lekcji przyswoisz solidne podstawy programowania. Zrozumiesz, jak działają programy, i nauczysz się reguł stosowanych przez profesjonalistów przy ich projektowaniu. Dowiesz się, jak wygląda świat programistów i na czym ...
Programowanie dla początkujących w 24 godziny. Wydanie IV Programowanie dla początkujących w 24 godziny. Wydanie IV
(34.50 zł najniższa cena z 30 dni)37.95 zł
69.00 zł(-45%) -
Ta książka powinna zostać przestudiowana przez każdego architekta nowoczesnych systemów rozproszonych. Jej celem jest pokazanie sposobów rozwiązywania trudnych problemów związanych z projektowaniem takiego oprogramowania. W krytyczny i wszechstronny sposób omówiono w niej najważniejsze problemy u...
Złożone zagadnienia architektury oprogramowania. Jak analizować kompromisy i podejmować trudne decyzje Złożone zagadnienia architektury oprogramowania. Jak analizować kompromisy i podejmować trudne decyzje
(64.35 zł najniższa cena z 30 dni)64.35 zł
99.00 zł(-35%) -
O tym, ile problemów sprawia niedbale napisany kod, wie każdy programista. Nie wszyscy jednak wiedzą, jak napisać ten świetny, „czysty” kod i czym właściwie powinien się on charakteryzować. Co więcej – jak odróżnić dobry kod od złego? Odpowiedź na te pytania oraz sposoby tworzen...(47.40 zł najniższa cena z 30 dni)
51.35 zł
79.00 zł(-35%) -
Ta książka powstała z myślą o architektach oprogramowania, projektantach, programistach i dyrektorach do spraw technicznych. Zwięźle i przystępnie opisano w niej, jak zadbać o bezpieczeństwo na wczesnym etapie projektowania oprogramowania i jak zaangażować w ten proces cały team. Najpierw zapreze...
Po pierwsze: bezpieczeństwo. Przewodnik dla twórców oprogramowania Po pierwsze: bezpieczeństwo. Przewodnik dla twórców oprogramowania
(47.40 zł najniższa cena z 30 dni)51.35 zł
79.00 zł(-35%) -
Niniejsza książka jest przeznaczona dla wszystkich osób zaangażowanych w proces projektowania najróżniejszych przekazów informacji, szczególnie serwisów internetowych. Architektura informacji jest tu traktowana jako zbiór narzędzi i technik do obsługi trudnych problemów. Można tu znaleźć uniwersa...
Architektura informacji w serwisach internetowych i nie tylko. Wydanie IV Architektura informacji w serwisach internetowych i nie tylko. Wydanie IV
(99.00 zł najniższa cena z 30 dni)64.35 zł
99.00 zł(-35%)
Ebooka przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video zobaczysz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP4 (pliki spakowane w ZIP)
Szczegóły ebooka
- ISBN Ebooka:
- 978-83-011-8685-2, 9788301186852
- Data wydania ebooka:
-
2016-06-17
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Numer z katalogu:
- 49571
- Rozmiar pliku ePub:
- 2.8MB
- Rozmiar pliku Mobi:
- 6.8MB
- Pobierz przykładowy rozdział EPUB
- Pobierz przykładowy rozdział MOBI
Spis treści ebooka
- Okładka
- Strona tytułowa
- Strona redakcyjna
- Spis treści
- Słowo wstępne
- Wprowadzenie
- 1. Wprowadzenie do analizy danych w Sparku
- Czym jest Apache Spark?
- Ujednolicony stos
- Jądro Sparka
- Spark SQL
- Spark Streaming
- MLlib
- GraphX
- Zarządzanie klastrami
- Kto i po co korzysta ze Sparka?
- Zadania z zakresu nauki o danych
- Aplikacje przetwarzania danych
- Krótka historia Sparka
- Wersje i wydania Sparka
- Warstwy pamięci w Sparku
- 2. Pobieranie Sparka i rozpoczęcie pracy
- Pobieranie Sparka
- Wprowadzenie do powłok Sparka dla Pythona i Scali
- Wprowadzenie do podstawowych pojęć Sparka
- Niezależne aplikacje
- Inicjalizowanie kontekstu SparkContext
- Tworzenie niezależnych aplikacji
- Podsumowanie
- 3. Programowanie z rozproszonymi zbiorami danych RDD
- Podstawy RDD
- Tworzenie RDD
- Działania na RDD
- Transformacje
- Akcje
- Leniwa ewaluacja
- Przekazywanie funkcji do Sparka
- Python
- Scala
- Java
- Popularne transformacje i akcje
- Podstawowe RDD
- Przekształcenia między typami RDD
- Utrzymywanie (buforowanie)
- Podsumowanie
- 4. Praca z parami klucz-wartość
- Motywacja
- Tworzenie RDD par
- Transformacje na RDD par
- Agregacje
- Grupowanie danych
- Złączenia
- Sortowanie danych
- Działania dostępne na RDD par
- Partycjonowanie danych (zaawansowane)
- Określanie partycjonera RDD
- Działania, które zyskują dzięki partycjonowaniu
- Działania, które mają wpływ na partycjonowanie
- Przykład: PageRank
- Niestandardowe partycjonery
- Podsumowanie
- 5. Ładowanie i zapisywanie danych
- Motywacja
- Formaty plików
- Pliki tekstowe
- JSON
- Wartości oddzielane przecinkami i tabulatorami
- Pliki sekwencyjne
- Pliki obiektowe
- Formaty wejścia i wyjścia w Hadoop
- Kompresja plików
- Systemy plików
- Lokalny lub zwykły
- Amazon S3
- HDFS
- Dane strukturalne w Spark SQL
- Apache Hive
- JSON
- Bazy danych
- Łączniki z bazą danych Java
- Cassandra
- HBase
- Elasticsearch
- Podsumowanie
- 6. Zaawansowane programowanie w Sparku
- Wprowadzenie
- Akumulatory
- Akumulatory i odporność na błędy
- Akumulatory niestandardowe
- Zmienne rozgłoszeniowe
- Optymalizacja rozgłoszeń
- Praca na poszczególnych partycjach
- Potokowanie do programów zewnętrznych
- Działania liczbowe na RDD
- Podsumowanie
- 7. Uruchamianie Sparka w klastrze
- Wprowadzenie
- Spark Runtime Architecture
- Sterownik
- Wykonawcy
- Menedżer klastrów
- Uruchamianie programu
- Podsumowanie
- Wdrażanie aplikacji za pomocą spark-submit
- Pakowanie kodu i elementów zależnych
- Aplikacja Java Spark budowana za pomocą Mavena
- Aplikacja Scala Spark budowana za pomocą sbt
- Konflikty zależności
- Harmonogramowanie w aplikacjach Sparka i między nimi
- Menedżery klastrów
- Menedżer klastrów Standalone
- Hadoop YARN
- Apache Mesos
- Amazon EC2
- Którego menedżera klastrów używać?
- Podsumowanie
- 8. Dostrajanie i debugowanie Sparka
- Konfigurowanie Sparka z SparkConf
- Składniki wykonania: prace, zadania i etapy
- Znajdowanie informacji
- Sieciowy interfejs użytkownika w Sparku (Web UI)
- Dzienniki sterownika i wykonawców
- Kluczowe zagadnienia dotyczące wydajności
- Poziom równoległości
- Format serializacji
- Zarządzanie pamięcią
- Dostarczanie sprzętu
- Podsumowanie
- 9. Spark SQL
- Łączenie ze Spark SQL
- Używanie Spark SQL w aplikacjach
- Inicjalizacja Spark SQL
- Przykład podstawowych zapytań
- Elementy DataFrames
- Buforowanie
- Ładowanie i zapisywanie danych
- Apache Hive
- Źródła danych lub Parquet
- JSON
- Ze zbiorów RDD
- Serwer JDBC/ODBC
- Praca z Beeline
- Długotrwałe tablice i zapytania
- Funkcje definiowane przez użytkowników
- UDF w Spark SQL
- Funkcje UDF w Hive
- Wydajność Spark SQL
- Opcje dostrajania wydajności
- Podsumowanie
- 10. Spark Streaming
- Prosty przykład
- Architektura i abstrakcja
- Transformacje
- Transformacje bezstanowe
- Transformacje stanowe
- Operacje wyjścia
- Źródła wejściowe
- Główne źródła
- Dodatkowe źródła
- Wiele źródeł i ustawianie rozmiaru klastra
- Działanie 24/7
- Punkty kontrolne
- Odporność sterownika na błędy
- Odporność węzła roboczego na błędy
- Odporność odbiornika na błędy
- Gwarancje przetwarzania
- Interfejs użytkownika w strumieniowaniu
- Kwestie wydajności
- Rozmiary wsadu i okien
- Poziom równoległości
- Czyszczenie pamięci i jej wykorzystywanie
- Podsumowanie
- 11. Systemy uczące się w MLlib
- Przegląd
- Wymagania dotyczące systemu
- Podstawy systemów uczących się
- Przykład: klasyfikacja spamu
- Typy danych
- Praca z wektorami
- Algorytmy
- Ekstrakcja cech
- Statystyki
- Klasyfikacja i regresja
- Klastrowanie
- Wspólne filtrowanie i rekomendacje
- Zmniejszenie wymiarowości
- Ewaluacja modelu
- Wskazówki i kwestie wydajności
- Przygotowanie cech
- Konfigurowanie algorytmów
- Bufrowanie zbiorów RDD do ponownego wykorzystania
- Rozpoznawanie rzadkości
- Poziom równoległości
- API potoku
- Podsumowanie
- O autorach
- Przypisy
Wydawnictwo Naukowe PWN - inne książki
-
Czy złożoność świata przyrody świadczy o istnieniu inteligentnego projektanta? Czy pewne niezwykłe zdarzenia są cudami, za którymi stoi siła wyższa? Czy wszechświat ma osobową przyczynę? na te i inne pytania od wieków stara się odpowiedzieć teologia naturalna, która dąży do rozumowego poznania i...(45.71 zł najniższa cena z 30 dni)
47.20 zł
59.00 zł(-20%) -
Pierwszy na rynku podręcznik przygotowujący do praktycznej analizy i interpretacji dzieła literackiego. Pozwala rozwijać zdolność praktycznego zastosowania materiału teoretycznego z zakresu poetyki, a także uczy rozpoznawania i interpretowania tzw. "chwytów" literackich. Książka: zawiera bogaty...(47.20 zł najniższa cena z 30 dni)
47.20 zł
59.00 zł(-20%) -
The monograph presents a review of classical and a presentation of new methodologies of non-invasive (non-contact) flow measurement techniques of nultiphase media and a number of algorithms applicable in the field. The discussed methods are mainly based on the statistical analysis of collected me...
Chosen methods determining flow parameters based on non-invasive techniques Chosen methods determining flow parameters based on non-invasive techniques
(103.20 zł najniższa cena z 30 dni)103.20 zł
129.00 zł(-20%) -
Ile królestw anglosaskich istniało we wczesnym średniowieczu? Czy Anglosasi naprawdę podbili Brytow, Celtów i Piktów? Jak przebiegał konflikt między Northumbrią a Mercją dwoma największymi królestwami? Barbara Yorke w przejrzysty sposób prezentuje porzymskie dzieje Anglii w czasach osadnictwa i...
Królowie i królestwa Anglii w czasach Anglosasów 600-900 Królowie i królestwa Anglii w czasach Anglosasów 600-900
(53.53 zł najniższa cena z 30 dni)55.20 zł
69.00 zł(-20%) -
Wydawnictwo PWN ma okazję zarekomendować publikację dotyczącą istotnej i aktualnej kwestii zestawienia działań związanych z produkcją energii a ochroną środowiska. Celem niniejszej książki jest przedstawienie Czytelnikom aktualnej wiedzy na temat wytwarzania i magazynowania energii z uwzględnie...(71.20 zł najniższa cena z 30 dni)
71.20 zł
89.00 zł(-20%) -
Książka zawiera charakterystykę monografii naukowych i podręczników wydanych przez renomowane w latach 80. XX wieku wydawnictwa, dokonaną z perspektywy recenzenta. Będąc przeglądem głównych paradygmatów naukowych charakterystycznych dla powojennego okresu rozwoju polskiej psychologii, jest zaraze...(47.20 zł najniższa cena z 30 dni)
47.20 zł
59.00 zł(-20%) -
Walory poznawacze i utylitarne monografii sprawiają, że z jednej strony stanowi ona wkład do budowania teoretycznych podstaw polityki rolnej, z drugiej zaś wyniki te mogą być wykorzystane w działalności praktycznej m. in. przez przedstawicieli władz państwowych, naukowców i analityków ekonomiczny...
Polityka wspierania rolnictwa a problem deprywacji dochodowej rolników w krajach o różnym poziomie rozwoju Polityka wspierania rolnictwa a problem deprywacji dochodowej rolników w krajach o różnym poziomie rozwoju
(51.20 zł najniższa cena z 30 dni)51.20 zł
64.00 zł(-20%) -
Wydawnictwo PWN przedstawia kolejną publikację poświęconą jednemu z ważniejszych zagadnień wyzwań XXI w. Chodzi o działania związane z ochroną zasobów wodnych tym samym ochroną środowiska naturalnego dla obecnych i przyszłych pokoleń. Retencja wody jest jednym z instrumentów kształt...(71.20 zł najniższa cena z 30 dni)
71.20 zł
89.00 zł(-20%) -
Praca dotyczy aktualnego tematu w naukach o zarządzaniu, jakim są sieci przedsiębiorstw i wpływ pozycji sieciowej na określone efekty ekonomiczne przedsiębiorstwa. Przedstawiony problem ma charakter odkrywczy i w znacznym stopniu wypełnia lukę badawczą, zwłaszcza w kontekście sieci spółek związan...
Analiza dynamiczna wpływu usieciowienia na wartość przedsiębiorstwa Analiza dynamiczna wpływu usieciowienia na wartość przedsiębiorstwa
(55.20 zł najniższa cena z 30 dni)55.20 zł
69.00 zł(-20%) -
W książce przedstawiono specyfikę zjawiska tarcia występującego w różnych procesach kształtowania blach wykonanych z podstawowych materiałów stosowanych w tłocznictwie, przede wszystkim dla potrzeb przemysłu motoryzacyjnego i lotniczego. Wobec licznych problemów towarzyszących deformacji plastycz...
Tarcie i smarowanie w procesach kształtowania blach Tarcie i smarowanie w procesach kształtowania blach
(111.20 zł najniższa cena z 30 dni)111.20 zł
139.00 zł(-20%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
W przypadku usługi "Druk na żądanie" termin dostarczenia przesyłki może obejmować także czas potrzebny na dodruk (do 10 dni roboczych)
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.


Oceny i opinie klientów: Poznajemy Sparka. Błyskawiczna analiza danych Andy Konwinski, Karau Holden, Patrick Wendel, Matei Zaharia (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.