ODBIERZ TWÓJ BONUS :: »

    Spark. Błyskawiczna analiza danych. Wydanie II

    (ebook) (audiobook) (audiobook)
    Wydawnictwo:
    Helion
    Serie wydawnicze:
    O'Reilly
    Wydawnictwo:
    Helion
    Serie wydawnicze:
    O'Reilly
    Ocena:
    4.5/6  Opinie: 2
    Stron:
    360
    Druk:
    oprawa miękka
    Dostępne formaty:
    PDF
    ePub
    Mobi
    Czytaj fragment
    Wyłącznie

    Książka (53,40 zł najniższa cena z 30 dni)

    89,00 zł (-30%)
    62,30 zł

    Dodaj do koszyka Wysyłamy w 24h

    ( 53,40 zł najniższa cena z 30 dni)

    Ebook (39,90 zł najniższa cena z 30 dni)

    89,00 zł (-45%)
    48,95 zł

    Dodaj do koszyka lub Kup na prezent
    Kup 1-kliknięciem

    ( 39,90 zł najniższa cena z 30 dni)

    Przenieś na półkę

    Do przechowalni

    Do przechowalni

    Powiadom o dostępności audiobooka »

    Apache Spark jest oprogramowaniem open source, przeznaczonym do klastrowego przetwarzania danych dostarczanych w różnych formatach. Pozwala na uzyskanie niespotykanej wydajności, umożliwia też pracę w trybie wsadowym i strumieniowym. Framework ten jest również świetnie przygotowany do uruchamiania złożonych aplikacji, włączając w to algorytmy uczenia maszynowego czy analizy predykcyjnej. To wszystko sprawia, że Apache Spark stanowi znakomity wybór dla programistów zajmujących się big data, a także eksploracją i analizą danych.

    To książka przeznaczona dla inżynierów danych i programistów, którzy chcą za pomocą Sparka przeprowadzać skomplikowane analizy danych i korzystać z algorytmów uczenia maszynowego, nawet jeśli te dane pochodzą z różnych źródeł. Wyjaśniono tu, jak dzięki Apache Spark można odczytywać i ujednolicać duże zbiory informacji, aby powstawały niezawodne jeziora danych, w jaki sposób wykonuje się interaktywne zapytania SQL, a także jak tworzy się potoki przy użyciu MLlib i wdraża modele za pomocą biblioteki MLflow. Omówiono również współdziałanie aplikacji Sparka z jego rozproszonymi komponentami i tryby jej wdrażania w poszczególnych środowiskach.

    W książce:

    • API strukturalne dla Pythona, SQL, Scali i Javy
    • operacje Sparka i silnika SQL
    • konfiguracje Sparka i interfejs Spark UI
    • nawiązywanie połączeń ze źródłami danych: JSON, Parquet, CSV, Avro, ORC, Hive, S3 i Kafka
    • operacje analityczne na danych wsadowych i strumieniowanych
    • niezawodne potoki danych i potoki uczenia maszynowego

    Spark: twórz skalowalne i niezawodne aplikacje big data!

    Wybrane bestsellery

    O autorach ebooka

    Jules S. Damji - jest inżynierem oprogramowania dla wielu wiodących firm, takich jak Netscape, Sun Microsystems, Verisign i ProQuest. Zajmuje się systemami rozproszonymi.

    Brooke Wenig - kieruje zespołem, który opracowuje potoki uczenia maszynowego. Prowadzi też szkolenia z zakresu rozproszonego uczenia maszynowego.

    Tathagata Das - jest członkiem Apache Spark Project Management Committee. Pracuje nad strumieniowaniem strukturalnym i Delta Lake.

    Denny Lee - zajmuje się systemami rozproszonymi i inżynierią danych, zwłaszcza dla branży ochrony zdrowia.

    Zobacz pozostałe książki z serii O'Reilly

    Helion - inne książki

    Zamknij

    Wybierz metodę płatności

    Zamknij Pobierz aplikację mobilną Ebookpoint