Data Engineering with Scala and Spark. Build streaming and batch pipelines that process massive amounts of data using Scala Eric Tome, Rupam Bhattacharjee, David Radford

Data Engineering with Scala and Spark. Build streaming and batch pipelines that process massive amounts of data using Scala Eric Tome, Rupam Bhattacharjee, David Radford - okladka książki

Autorzy:: Eric Tome, Rupam Bhattacharjee, David Radford
Serie wydawnicze:: Hands-on
Wydawnictwo:: Packt Publishing (Z chęcią przeczytam książkę w języku polskim)
Ocena:: Bądź pierwszym, który oceni tę książkę
Stron:: 300
Dostępne formaty:: PDF

ePub

Ebook

98,10 zł ~~109,00 zł~~ (-10%)

81,75 zł najniższa cena z 30 dni

Dodaj do koszyka Dostępny natychmiast po opłaceniu zakupu lub Kup na prezent Kup 1-kliknięciem

Przenieś na półkę

Do przechowalni

Most data engineers know that performance issues in a distributed computing environment can easily lead to issues impacting the overall efficiency and effectiveness of data engineering tasks. While Python remains a popular choice for data engineering due to its ease of use, Scala shines in scenarios where the performance of distributed data processing is paramount.
This book will teach you how to leverage the Scala programming language on the Spark framework and use the latest cloud technologies to build continuous and triggered data pipelines. You’ll do this by setting up a data engineering environment for local development and scalable distributed cloud deployments using data engineering best practices, test-driven development, and CI/CD. You’ll also get to grips with DataFrame API, Dataset API, and Spark SQL API and its use. Data profiling and quality in Scala will also be covered, alongside techniques for orchestrating and performance tuning your end-to-end pipelines to deliver data to your end users.
By the end of this book, you will be able to build streaming and batch data pipelines using Scala while following software engineering best practices.

Wybrane bestsellery

Nowość Promocja Promocja 2za1

SQL pozostaje fundamentalnym narzędziem w nowoczesnej analityce danych, a jego znajomość należy do najbardziej pożądanych na rynku IT. W erze big data i podejmowania decyzji opartych na danych ważna jest umiejętność efektywnego wydobywania informacji z relacyjnych baz danych. Czwarte wydanie tej książki, zaktualizowane o najnowsze funkcje PostgreSQL i dostosowane do współczesnych przepływów pracy, łączy tradycyjne podejście SQL-owe z nowoczesnymi narzędziami, jak Python, i technikami uczenia maszynowego.
- ebook
- książka
SQL dla analityków danych. Skutecznie analizuj dane, wyciągaj wartościowe wnioski i opanuj zaawansowany SQL na potrzeby praktycznych zastosowań. Wydanie IV

Jun Shan, Haibin Li, Matt Goldwasser, Upom Malik, Benjamin Johnston

(39,50 zł najniższa cena z 30 dni)

47.40 zł ~~79.00 zł (-40%)~~
Nowość Promocja Promocja 2za1

Wyobraź sobie, że raport, który przygotowujesz dziś przez dwie godziny, jutro aktualizuje się sam po jednym kliknięciu. Bez ręcznego kopiowania danych, bez poprawiania formatów, bez łączenia kilkunastu plików Excela w środku dnia. Właśnie tak działa Power Query – narzędzie, które zmienia Excela z „arkusza do tabel” w potężne środowisko służące do automatyzacji i analizy danych.
- kurs
Power Query. Kurs video. Analizuj dane jak profesjonalista

Adam Kopeć

(224,25 zł najniższa cena z 30 dni)

239.20 zł ~~299.00 zł (-20%)~~
Promocja Promocja 2za1

Z tą książką krok po kroku zagłębisz się w metody OSINT, a także powiązane z nim zagadnienia natury prawnej i etycznej. Poznasz sposoby gromadzenia i analizowania informacji z wykorzystaniem wyszukiwarek, portali społecznościowych i innych zasobów internetowych. Zrozumiesz wagę anonimowości i technik gwarantujących bezpieczne poruszanie się po sieci, ułatwiających zarządzanie cyfrowym śladem czy tworzenie fikcyjnych tożsamości internetowych. Zdobędziesz również doświadczenie w korzystaniu z popularnych narzędzi OSINT, takich jak Recon-ng, Maltego, Shodan czy Aircrack-ng. Dowiesz się też, jak ograniczać ryzyko, przewidywać cyberataki, zapobiegać im i na nie reagować — wszystko dzięki technikom opartym na OSINT.
- ebook
- książka
OSINT w praktyce. Jak gromadzić i analizować dane dostępne w sieci

Dale Meredith

(33,50 zł najniższa cena z 30 dni)

40.20 zł ~~67.00 zł (-40%)~~
Promocja Promocja 2za1

Sztuczna inteligencja przyczyniła się do prawdziwej rewolucji technologicznej i zmieniła branżę informatyczną. Po funkcje oparte na AI chętnie sięgnął Microsoft, by udoskonalić swój wiodący produkt – Excela. AI poprzez zaawansowane algorytmy potrafi automatycznie analizować i interpretować duże zbiory danych, co przyspiesza proces podejmowania decyzji. Zastosowanie mechanizmów AI w Excelu otwiera nowe możliwości w pracy z danymi i analizie tekstowej. W efekcie integracji ChatGPT z MS Excel użytkownicy mogą uzyskać szybkie i skuteczne odpowiedzi na pytania związane z danymi bez konieczności opuszczania arkusza kalkulacyjnego. Dzięki korzystaniu z trików AI i narzędzi do automatyzacji zadań, jak Office Script i Power Query, możesz się pożegnać z traceniem dnia na rutynowe czynności. Postaw na automatyzację zadań z AI – oszczędź swój czas i zminimalizuj ryzyko manualnych błędów w pracy!
- kurs
AI w Excelu. Kurs video. Automatyzacja zadań w pracy

Zbigniew Mrozik

(186,75 zł najniższa cena z 30 dni)

199.20 zł ~~249.00 zł (-20%)~~
Nowość Promocja Promocja 2za1

The fourth edition of Microsoft Power BI Quick Start Guide helps you master data visualization and insights with ease, no experience needed. Learn Power BI fast and turn raw data into impactful decisions with hands-on, real-world examples.
- ebook
Microsoft Power BI Quick Start Guide. The Ultimate Beginner's Guide to Power BI, Data Storytelling, AI Tools, and Microsoft Fabric - Fourth Edition

Devin Knight, Erin Ostrowsky, Mitchell Pearson, Bradley Schacht

(139,00 zł najniższa cena z 30 dni)

125.10 zł ~~139.00 zł (-10%)~~
Nowość Promocja Promocja 2za1

Pass the GCP Professional Data Engineer exam with expert guidance, real-world scenarios, and web-based study aids designed to build your skills and boost your confidence.
- ebook
Google Cloud Certified Professional Data Engineer Certification Guide. Get certified and develop expert-level data engineering skills with Google Cloud Platform

Sireesha Pulipati, Juan Carlos Escalante Soto

(139,00 zł najniższa cena z 30 dni)

125.10 zł ~~139.00 zł (-10%)~~
Nowość Promocja Promocja 2za1

Leverage the power of ESQL for faster search, aggregations, and visualizations, and gain insights on real-time data processing.
- ebook
Elasticsearch Query Language the Definitive Guide. A hands-on guide to mastering ESQL for search, observability, and security

Bahaaldine Azarmi, Alexis Charveriat, Stephen Brown, Farbod Shirzadian, Alejandro Sanchez

(139,00 zł najniższa cena z 30 dni)

125.10 zł ~~139.00 zł (-10%)~~
Nowość Promocja Promocja 2za1

Hands-on and strategic recipes for the Snowflake AI Data Cloud that show not just how, but when and why to apply each capability to build governed, intelligent, AI-ready data platforms.
- ebook
Snowflake Cookbook. Strategic and practical recipes for building governed, intelligent, AI-ready data platforms - Second Edition

Keith Belanger

(129,00 zł najniższa cena z 30 dni)

116.10 zł ~~129.00 zł (-10%)~~
Nowość Promocja Promocja 2za1

This third edition teaches you to design, test, and deploy AI-driven trading systems using the 7-Stage ML4T Workflow, covering Generative AI, causal inference, and MLOps for robust, adaptive, and systematic strategies.
- ebook
Machine Learning for Trading. Integrate GenAI, Causal Inference, and Reinforcement Learning into Real World Trading Systems - Third Edition

Stefan Jansen

(139,00 zł najniższa cena z 30 dni)

125.10 zł ~~139.00 zł (-10%)~~
Nowość Promocja Promocja 2za1

Discover traits of data platforms, data mesh, automation, and observability. Design trusted data products with contracts, federated governance, and decentralized ownership, and explore how GenAI accelerates Lakehouse development and analytics.
- ebook
Building Trusted Data Platforms with Azure Databricks and GenAI. A Hands-On Guide to Creating Governed Data Products in a Lakehouse - Second Edition

Manoj Kukreja

(139,00 zł najniższa cena z 30 dni)

125.10 zł ~~139.00 zł (-10%)~~

O autorach książki

Eric Tome has over 25 years of experience working with data. He has contributed to and led teams that ingested, cleansed, standardized, and prepared data used by business intelligence, data science, and operations teams. He has a background in Mathematics and currently works as a Solutions Architect for Databricks, helping customers solve their data and AI challenges.

Rupam Bhattacharjee works as a Lead Data Engineer at IBM. He has architected and developed data pipelines processing massive structured and unstructured data using Spark and Scala for on-prem Hadoop and k8s clusters on the public cloud. He has a degree in Electrical Engineering.

David Radford has worked in big data for over ten years with a focus on cloud technologies. He led consulting teams for multiple years completing migrations from legacy systems to modern data stacks. He holds a Master's degree in Computer Science and works as a Solutions Architect at Databricks.

Ebooka "Data Engineering with Scala and Spark. Build streaming and batch pipelines that process massive amounts of data using Scala" przeczytasz na:

czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
systemach Windows, MacOS i innych

systemach Windows, Android, iOS, HarmonyOS
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi

Masz pytania? Zajrzyj do zakładki Pomoc »

Oceny i opinie klientów: Data Engineering with Scala and Spark. Build streaming and batch pipelines that process massive amounts of data using Scala Eric Tome, Rupam Bhattacharjee, David Radford

(0)

Szczegóły książki

Tytuł oryginału:: Data Engineering with Scala and Spark. Build streaming and batch pipelines that process massive amounts of data using Scala
ISBN Ebooka:: 978-18-046-1432-7, 9781804614327
Data wydania ebooka :: 2024-01-31 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
Język publikacji:: angielski
Rozmiar pliku Pdf:: 8.2MB
Rozmiar pliku ePub:: 8MB

Zgłoś erratę
Serie wydawnicze: Hands-on

Kategorie

Kliknij, aby zgłosić błędnie przypisaną kategorię »

Informatyka » Bazy danych
Informatyka » Bazy danych » Inne
Informatyka » Biznes IT » Big data » Analiza danych

Dostępność produktu

Produkt nie został jeszcze oceniony pod kątem ułatwień dostępu lub nie podano żadnych informacji o ułatwieniach dostępu lub są one niewystarczające. Prawdopodobnie Wydawca/Dostawca jeszcze nie umożliwił dokonania walidacji produktu lub nie przekazał odpowiednich informacji na temat jego dostępności.

Spis treści książki

1. Scala Essentials for Data Engineers
2. Environment Setup
3. An Introduction to Apache Spark and Its APIs – DataFrame, Dataset, and Spark SQL
4. Working with Databases
5. Object Stores and Data Lakes
6. Understanding Data Transformation
7. Data Profiling and Data Quality
8. Test-Driven Development, Code Health, and Maintainability
9. CI/CD with GitHub
10. Data Pipeline Orchestration
11. Performance Tuning
12. Building Batch Pipelines Using Spark and Scala
13. Building Streaming Pipelines Using Spark and Scala

pokaż cały spis treści

Packt Publishing - inne książki

Nowość Promocja Promocja 2za1

Properly responding to an incident can mean the difference between a short or a catastrophic outage. In this book, cyber threat responders will be shown the tools, techniques and procedures necessary for an effective threat response.
- ebook
Digital Forensics and Incident Response. Incident Response tools and techniques for effective cyber threat response - Fourth Edition

Gerard Johansen

(149,00 zł najniższa cena z 30 dni)

134.10 zł ~~149.00 zł (-10%)~~
Nowość Promocja Promocja 2za1

Master the realm of Cyber Threat Intelligence and Proactive Threat Hunting with 'Practical Threat Intelligence and Data-Driven Threat Hunting, 2nd edition'. This is your essential guide in the ever-evolving landscape of cyber threats.
- ebook
Practical Threat Intelligence and Data-Driven Threat Hunting. Elevate your cybersecurity efforts, enhance detection, and defend with ATT&CK™ & open tools - Second Edition

Valentina Costa-Gazcón

(96,75 zł najniższa cena z 30 dni)

116.10 zł ~~129.00 zł (-10%)~~
Nowość Promocja Promocja 2za1

This latest edition of Practical Hardware Pentesting features even more practical advice on how to pentest various devices, from IoT to simpler hardware. As you progress through the chapters, you'll quickly learn the most common attack techniques, as well as ways to secure embedded systems and build more secure devices.
- ebook
Practical Hardware Pentesting. Learn attack and defense techniques for embedded systems in IoT and other devices - Second Edition

Jean-Georges Valle

(104,25 zł najniższa cena z 30 dni)

125.10 zł ~~139.00 zł (-10%)~~

Zamknij

Data Engineering with Scala and Spark. Build streaming and batch pipelines that process massive amounts of data using Scala Eric Tome, Rupam Bhattacharjee, David Radford

Kup w zestawie z dodatkowym rabatem