ODBIERZ TWÓJ BONUS :: »

    Spark. Zaawansowana analiza danych

    (ebook) (audiobook) (audiobook)
    Wydawnictwo:
    Helion
    Wydawnictwo:
    Helion
    Ocena:
    Bądź pierwszym, który oceni tę książkę
    Stron:
    240
    Druk:
    oprawa miękka
    Dostępne formaty:
    PDF
    ePub
    Mobi
    Czytaj fragment
    Wyłącznie

    Książka

    49,00 zł

    Powiadom mnie, gdy książka będzie dostępna

    Ebook (14,90 zł najniższa cena z 30 dni)

    49,00 zł (-50%)
    24,50 zł

    Dodaj do koszyka lub Kup na prezent
    Kup 1-kliknięciem

    ( 14,90 zł najniższa cena z 30 dni)

    Przenieś na półkę

    Do przechowalni

    Powiadom o dostępności audiobooka »

    Analiza ogromnych zbiorów danych nie musi być wolna!

    Apache Spark to darmowy, zaawansowany szkielet i silnik pozwalający na szybkie przetwarzanie oraz analizę ogromnych zbiorów danych. Prace nad tym projektem rozpoczęły się w 2009 roku, a już rok później Spark został udostępniony użytkownikom. Jeżeli potrzebujesz najwyższej wydajności w przetwarzaniu informacji, jeżeli chcesz uzyskiwać odpowiedź na trudne pytania niemalże w czasie rzeczywistym, Spark może być odpowiedzią na Twoje oczekiwania.

    Sięgnij po tę książkę i przekonaj się, czy tak jest w rzeczywistości. Autor porusza tu zaawansowane kwestie związane z analizą statystyczną danych, wykrywaniem anomalii oraz analizą obrazów. Jednak zanim przejdziesz do tych tematów, zapoznasz się z podstawami — wprowadzeniem do analizy danych za pomocą języka Scala oraz Apache Spark. Nauczysz się też przeprowadzać analizę semantyczną i zobaczysz, jak w praktyce przeprowadzić analizę sieci współwystępowań za pomocą biblioteki GraphX. Na koniec dowiesz się, jak przetwarzać dane geoprzestrzenne i genomiczne, a także oszacujesz ryzyko metodą symulacji Monte Carlo. Książka ta pozwoli Ci na wykorzystanie potencjału Apache Spark i zaprzęgnięcie go do najtrudniejszych zadań!

    Przykłady prezetnowane w książce obejmują:

    • Rekomendowanie muzyki i dane Audioscrobbler
    • Prognozowanie zalesienia za pomocą drzewa decyzyjnego
    • Wykrywanie anomalii w ruchu sieciowym metodą grupowania według k-średnich
    • Wikipedia i ukryta analiza semantyczna
    • Analiza sieci współwystępowań za pomocą biblioteki GraphX
    • Geoprzestrzenna i temporalna analiza tras nowojorskich taksówek
    • Szacowanie ryzyka finansowego metodą symulacji Monte Carlo
    • Analiza danych genomicznych i projekt BDG
    • Analiza danych neuroobrazowych za pomocą pakietów PySpark i Thunder

    Poznaj potencjał i wydajność Apache Spark!

    Wybrane bestsellery

    O autorach ebooka

    Sandy Ryza jest starszym analitykiem w Cloudera i aktywnym uczestnikiem projektu Apache Spark.

    Uri Laserson jest starszym analitykiem w Cloudera, gdzie pracuje nad językiem Python w środowisku Hadoop.

    Sean Owen jest dyrektorem działu analiz danych na region EMEA w Cloudera i uczestnikiem projektu Apache Spark.

    Josh Wills jest starszym menedżerem działu analiz danych w Cloudera i inicjatorem pakietu Apache Crunch.

    Helion - inne książki

    Zamknij

    Wybierz metodę płatności

    Zamknij Pobierz aplikację mobilną Ebookpoint