ODBIERZ TWÓJ BONUS :: »

Spark. Zaawansowana analiza danych Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills

Autorzy:
Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills
Wydawnictwo:
Helion
Wydawnictwo:
Helion
Ocena:
Bądź pierwszym, który oceni tę książkę
Stron:
240
Druk:
oprawa miękka
Dostępne formaty:
     PDF
     ePub
     Mobi
Czytaj fragment
Książka
49,00 zł

Powiadom mnie, gdy książka będzie dostępna

Ebook
26,95 zł 49,00 zł (-45%)
14,90 zł najniższa cena z 30 dni

Dodaj do koszyka Dostępny natychmiast po opłaceniu zakupu lub Kup na prezent Kup 1-kliknięciem

Przenieś na półkę

Do przechowalni

Powiadom o dostępności audiobooka »

Czego się nauczysz?

  • Przetwarzania i analizy dużych zbiorów danych z użyciem Apache Spark
  • Programowania w języku Scala na potrzeby analizy danych
  • Tworzenia i uruchamiania zadań Spark oraz korzystania z SparkContext
  • Agregowania, filtrowania i podsumowywania danych w Spark
  • Budowania systemów rekomendacyjnych na przykładzie danych Audioscrobbler
  • Stosowania algorytmu naprzemiennych najmniejszych kwadratów do rekomendacji
  • Wykorzystywania drzew i lasów decyzyjnych do prognozowania zjawisk
  • Wykrywania anomalii w danych za pomocą grupowania k-średnich
  • Przeprowadzania analizy semantycznej tekstu i wyliczania metryk TF-IDF
  • Analizowania sieci współwystępowań z użyciem biblioteki GraphX
  • Przetwarzania i analizowania danych geoprzestrzennych i temporalnych
  • Szacowania ryzyka finansowego metodą symulacji Monte Carlo
  • Przetwarzania i analizy danych genomicznych z wykorzystaniem narzędzi Spark
  • Analizy danych neuroobrazowych z użyciem pakietów PySpark i Thunder
  • Wykorzystywania podprojektów Spark: MLlib, Spark Streaming, Spark SQL, GraphX
  • Tworzenia i wdrażania procesów uczenia maszynowego z użyciem MLlib Pipelines API

Analiza ogromnych zbiorów danych nie musi być wolna!

Apache Spark to darmowy, zaawansowany szkielet i silnik pozwalający na szybkie przetwarzanie oraz analizę ogromnych zbiorów danych. Prace nad tym projektem rozpoczęły się w 2009 roku, a już rok później Spark został udostępniony użytkownikom. Jeżeli potrzebujesz najwyższej wydajności w przetwarzaniu informacji, jeżeli chcesz uzyskiwać odpowiedź na trudne pytania niemalże w czasie rzeczywistym, Spark może być odpowiedzią na Twoje oczekiwania.

Sięgnij po tę książkę i przekonaj się, czy tak jest w rzeczywistości. Autor porusza tu zaawansowane kwestie związane z analizą statystyczną danych, wykrywaniem anomalii oraz analizą obrazów. Jednak zanim przejdziesz do tych tematów, zapoznasz się z podstawami — wprowadzeniem do analizy danych za pomocą języka Scala oraz Apache Spark. Nauczysz się też przeprowadzać analizę semantyczną i zobaczysz, jak w praktyce przeprowadzić analizę sieci współwystępowań za pomocą biblioteki GraphX. Na koniec dowiesz się, jak przetwarzać dane geoprzestrzenne i genomiczne, a także oszacujesz ryzyko metodą symulacji Monte Carlo. Książka ta pozwoli Ci na wykorzystanie potencjału Apache Spark i zaprzęgnięcie go do najtrudniejszych zadań!

Przykłady prezetnowane w książce obejmują:

  • Rekomendowanie muzyki i dane Audioscrobbler
  • Prognozowanie zalesienia za pomocą drzewa decyzyjnego
  • Wykrywanie anomalii w ruchu sieciowym metodą grupowania według k-średnich
  • Wikipedia i ukryta analiza semantyczna
  • Analiza sieci współwystępowań za pomocą biblioteki GraphX
  • Geoprzestrzenna i temporalna analiza tras nowojorskich taksówek
  • Szacowanie ryzyka finansowego metodą symulacji Monte Carlo
  • Analiza danych genomicznych i projekt BDG
  • Analiza danych neuroobrazowych za pomocą pakietów PySpark i Thunder

Poznaj potencjał i wydajność Apache Spark!

Wiosenne porządku na magazynach! / Ebooki -45%, książki -35%

Wybrane bestsellery

O autorach książki

Sandy Ryza jest starszym analitykiem w Cloudera i aktywnym uczestnikiem projektu Apache Spark.

Uri Laserson jest starszym analitykiem w Cloudera, gdzie pracuje nad językiem Python w środowisku Hadoop.

Sean Owen jest dyrektorem działu analiz danych na region EMEA w Cloudera i uczestnikiem projektu Apache Spark.

Josh Wills jest starszym menedżerem działu analiz danych w Cloudera i inicjatorem pakietu Apache Crunch.

Helion - inne książki

Najczęściej zadawane pytania (FAQ)
1. Czy muszę znać Apache Spark lub język Scala, żeby korzystać z tej książki?
Nie, książka wprowadza czytelnika w podstawy zarówno Apache Spark, jak i języka Scala, dzięki czemu osoby początkujące mogą swobodnie rozpocząć naukę i stopniowo przechodzić do zagadnień zaawansowanych.
2. Jakie praktyczne przykłady analizy danych znajdę w tej książce?
Książka zawiera liczne przykłady praktyczne, m.in. rekomendowanie muzyki, prognozowanie zalesienia, wykrywanie anomalii w ruchu sieciowym, analizę tras taksówek, analizę danych genomicznych i neuroobrazowych oraz szacowanie ryzyka finansowego.
3. Czy książka omawia najnowsze funkcje i narzędzia Apache Spark?
Tak, w książce znajdziesz omówienie aktualnych bibliotek i narzędzi Spark, takich jak MLlib, Spark Streaming, Spark SQL, GraphX oraz nowy interfejs MLlib Pipelines API.
4. Czy publikacja zawiera przykłady kodu i instrukcje krok po kroku?
Tak, książka prezentuje liczne fragmenty kodu z dokładnymi instrukcjami, co pozwala łatwo wdrożyć omawiane techniki w praktyce.
5. Czy mogę wykorzystać wiedzę z książki do własnych projektów analizy danych?
Zdecydowanie tak - książka nie tylko omawia teoretyczne podstawy, ale również pokazuje, jak zastosować Spark w realnych projektach, dzięki czemu zdobytą wiedzę można od razu wykorzystać w praktyce.
6. W jakim formacie dostępna jest książka na Helion.pl?
Książka dostępna jest w wersji drukowanej oraz w formatach elektronicznych (e-book: PDF, ePub, mobi), co pozwala czytać ją na różnych urządzeniach.
7. Czy po przeczytaniu książki będę w stanie samodzielnie analizować duże zbiory danych?
Tak, po zapoznaniu się z treścią książki zdobędziesz praktyczną wiedzę i umiejętności pozwalające na samodzielną analizę dużych zbiorów danych z użyciem Apache Spark.
8. Czy książka nadaje się do nauki w ramach kursów lub studiów z analizy danych?
Tak, publikacja doskonale sprawdzi się jako materiał pomocniczy do nauki na kursach, szkoleniach czy studiach związanych z analizą danych, big data i uczeniem maszynowym.

Zamknij

Przenieś na półkę
Dodano produkt na półkę
Usunięto produkt z półki
Przeniesiono produkt do archiwum
Przeniesiono produkt do biblioteki

Zamknij

Wybierz metodę płatności

Książka
49,00 zł
Czasowo niedostępna
Ebook
26,95 zł
Dodaj do koszyka
Płatności obsługuje:
Ikona płatności Alior Bank Ikona płatności Apple Pay Ikona płatności Bank PEKAO S.A. Ikona płatności Bank Pocztowy Ikona płatności Banki Spółdzielcze Ikona płatności BLIK Ikona płatności Crédit Agricole e-przelew Ikona płatności dawny BNP Paribas Bank Ikona płatności Google Pay Ikona płatności ING Bank Śląski Ikona płatności Inteligo Ikona płatności iPKO Ikona płatności mBank Ikona płatności Millennium Ikona płatności Nest Bank Ikona płatności Paypal Ikona płatności PayPo | PayU Płacę później Ikona płatności PayU Płacę później Ikona płatności Plus Bank Ikona płatności Płacę z Citi Handlowy Ikona płatności Płacę z Getin Bank Ikona płatności Płać z BOŚ Ikona płatności Płatność online kartą płatniczą Ikona płatności Santander Ikona płatności Visa Mobile
Bezpieczne płatności szyfrowane SSL