ODBIERZ TWÓJ BONUS :: »

Spark. Zaawansowana analiza danych Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills

Autorzy:
Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills
Wydawnictwo:
Helion
Wydawnictwo:
Helion
Ocena:
Bądź pierwszym, który oceni tę książkę
Stron:
240
Druk:
oprawa miękka
Dostępne formaty:
     PDF
     ePub
     Mobi
Czytaj fragment
Książka
49,00 zł
Powiadom mnie, gdy książka będzie dostępna

Ebook
24,50 zł 49,00 zł (-50%)
24,50 zł najniższa cena z 30 dni

Dodaj do koszyka lub Kup na prezent Kup 1-kliknięciem

Przenieś na półkę

Do przechowalni

Powiadom o dostępności audiobooka »

Czego się nauczysz?

  • Przetwarzania i analizy dużych zbiorów danych z użyciem Apache Spark
  • Programowania w języku Scala na potrzeby analizy danych
  • Tworzenia i uruchamiania zadań Spark oraz korzystania z SparkContext
  • Agregowania, filtrowania i podsumowywania danych w Spark
  • Budowania systemów rekomendacyjnych na przykładzie danych Audioscrobbler
  • Stosowania algorytmu naprzemiennych najmniejszych kwadratów do rekomendacji
  • Wykorzystywania drzew i lasów decyzyjnych do prognozowania zjawisk
  • Wykrywania anomalii w danych za pomocą grupowania k-średnich
  • Przeprowadzania analizy semantycznej tekstu i wyliczania metryk TF-IDF
  • Analizowania sieci współwystępowań z użyciem biblioteki GraphX
  • Przetwarzania i analizowania danych geoprzestrzennych i temporalnych
  • Szacowania ryzyka finansowego metodą symulacji Monte Carlo
  • Przetwarzania i analizy danych genomicznych z wykorzystaniem narzędzi Spark
  • Analizy danych neuroobrazowych z użyciem pakietów PySpark i Thunder
  • Wykorzystywania podprojektów Spark: MLlib, Spark Streaming, Spark SQL, GraphX
  • Tworzenia i wdrażania procesów uczenia maszynowego z użyciem MLlib Pipelines API

Analiza ogromnych zbiorów danych nie musi być wolna!

Apache Spark to darmowy, zaawansowany szkielet i silnik pozwalający na szybkie przetwarzanie oraz analizę ogromnych zbiorów danych. Prace nad tym projektem rozpoczęły się w 2009 roku, a już rok później Spark został udostępniony użytkownikom. Jeżeli potrzebujesz najwyższej wydajności w przetwarzaniu informacji, jeżeli chcesz uzyskiwać odpowiedź na trudne pytania niemalże w czasie rzeczywistym, Spark może być odpowiedzią na Twoje oczekiwania.

Sięgnij po tę książkę i przekonaj się, czy tak jest w rzeczywistości. Autor porusza tu zaawansowane kwestie związane z analizą statystyczną danych, wykrywaniem anomalii oraz analizą obrazów. Jednak zanim przejdziesz do tych tematów, zapoznasz się z podstawami — wprowadzeniem do analizy danych za pomocą języka Scala oraz Apache Spark. Nauczysz się też przeprowadzać analizę semantyczną i zobaczysz, jak w praktyce przeprowadzić analizę sieci współwystępowań za pomocą biblioteki GraphX. Na koniec dowiesz się, jak przetwarzać dane geoprzestrzenne i genomiczne, a także oszacujesz ryzyko metodą symulacji Monte Carlo. Książka ta pozwoli Ci na wykorzystanie potencjału Apache Spark i zaprzęgnięcie go do najtrudniejszych zadań!

Przykłady prezetnowane w książce obejmują:

  • Rekomendowanie muzyki i dane Audioscrobbler
  • Prognozowanie zalesienia za pomocą drzewa decyzyjnego
  • Wykrywanie anomalii w ruchu sieciowym metodą grupowania według k-średnich
  • Wikipedia i ukryta analiza semantyczna
  • Analiza sieci współwystępowań za pomocą biblioteki GraphX
  • Geoprzestrzenna i temporalna analiza tras nowojorskich taksówek
  • Szacowanie ryzyka finansowego metodą symulacji Monte Carlo
  • Analiza danych genomicznych i projekt BDG
  • Analiza danych neuroobrazowych za pomocą pakietów PySpark i Thunder

Poznaj potencjał i wydajność Apache Spark!

Wiosna w głowie, ebook w dłoni! / do -50% na tysiące tytułów

Wybrane bestsellery

O autorach książki

Sandy Ryza jest starszym analitykiem w Cloudera i aktywnym uczestnikiem projektu Apache Spark.

Uri Laserson jest starszym analitykiem w Cloudera, gdzie pracuje nad językiem Python w środowisku Hadoop.

Sean Owen jest dyrektorem działu analiz danych na region EMEA w Cloudera i uczestnikiem projektu Apache Spark.

Josh Wills jest starszym menedżerem działu analiz danych w Cloudera i inicjatorem pakietu Apache Crunch.

Helion - inne książki

Najczęściej zadawane pytania (FAQ)
1. Czy muszę znać Apache Spark lub język Scala, żeby korzystać z tej książki?
Nie, książka wprowadza czytelnika w podstawy zarówno Apache Spark, jak i języka Scala, dzięki czemu osoby początkujące mogą swobodnie rozpocząć naukę i stopniowo przechodzić do zagadnień zaawansowanych.
2. Jakie praktyczne przykłady analizy danych znajdę w tej książce?
Książka zawiera liczne przykłady praktyczne, m.in. rekomendowanie muzyki, prognozowanie zalesienia, wykrywanie anomalii w ruchu sieciowym, analizę tras taksówek, analizę danych genomicznych i neuroobrazowych oraz szacowanie ryzyka finansowego.
3. Czy książka omawia najnowsze funkcje i narzędzia Apache Spark?
Tak, w książce znajdziesz omówienie aktualnych bibliotek i narzędzi Spark, takich jak MLlib, Spark Streaming, Spark SQL, GraphX oraz nowy interfejs MLlib Pipelines API.
4. Czy publikacja zawiera przykłady kodu i instrukcje krok po kroku?
Tak, książka prezentuje liczne fragmenty kodu z dokładnymi instrukcjami, co pozwala łatwo wdrożyć omawiane techniki w praktyce.
5. Czy mogę wykorzystać wiedzę z książki do własnych projektów analizy danych?
Zdecydowanie tak - książka nie tylko omawia teoretyczne podstawy, ale również pokazuje, jak zastosować Spark w realnych projektach, dzięki czemu zdobytą wiedzę można od razu wykorzystać w praktyce.
6. W jakim formacie dostępna jest książka na Helion.pl?
Książka dostępna jest w wersji drukowanej oraz w formatach elektronicznych (e-book: PDF, ePub, mobi), co pozwala czytać ją na różnych urządzeniach.
7. Czy po przeczytaniu książki będę w stanie samodzielnie analizować duże zbiory danych?
Tak, po zapoznaniu się z treścią książki zdobędziesz praktyczną wiedzę i umiejętności pozwalające na samodzielną analizę dużych zbiorów danych z użyciem Apache Spark.
8. Czy książka nadaje się do nauki w ramach kursów lub studiów z analizy danych?
Tak, publikacja doskonale sprawdzi się jako materiał pomocniczy do nauki na kursach, szkoleniach czy studiach związanych z analizą danych, big data i uczeniem maszynowym.

Zamknij

Przenieś na półkę
Dodano produkt na półkę
Usunięto produkt z półki
Przeniesiono produkt do archiwum
Przeniesiono produkt do biblioteki

Zamknij

Wybierz metodę płatności

Książka
49,00 zł
Czasowo niedostępna
Ebook
24,50 zł
Dodaj do koszyka
Płatności obsługuje:
Ikona płatności Alior Bank Ikona płatności Apple Pay Ikona płatności Bank PEKAO S.A. Ikona płatności Bank Pocztowy Ikona płatności Banki Spółdzielcze Ikona płatności BLIK Ikona płatności Crédit Agricole e-przelew Ikona płatności Google Pay Ikona płatności ING Bank Śląski Ikona płatności mBank Ikona płatności Millennium Ikona płatności Nest Bank Ikona płatności Paypal Ikona płatności PayPo | PayU Płacę później Ikona płatności PayU Płacę później Ikona płatności Plus Bank Ikona płatności Płacę z Citi Handlowy Ikona płatności Płać z BOŚ Ikona płatności Płatność online kartą płatniczą Ikona płatności Santander Ikona płatności Visa Mobile