ODBIERZ TWÓJ BONUS :: »

A Practical Guide for Building an Enterprise Data Lake Sai Srinivas Sriparasa

Język publikacji: angielski
A Practical Guide for Building an Enterprise Data Lake Sai Srinivas Sriparasa - okladka książki

A Practical Guide for Building an Enterprise Data Lake Sai Srinivas Sriparasa - okladka książki

Autor:
Sai Srinivas Sriparasa
Ocena:
Bądź pierwszym, który oceni tę książkę
Stron:
232
Dostępne formaty:
     ePub
     Mobi
Ebook
89,91 zł 99,90 zł (-10%)
85,49 zł najniższa cena z 30 dni

Dodaj do koszyka lub Kup na prezent Kup 1-kliknięciem

Przenieś na półkę

Do przechowalni

Description
Data lakes are the essential technology for tackling the explosive growth of big data volume, velocity, and variety, moving beyond traditional data warehousing to unlock advanced analytics and machine learning.

This comprehensive book begins by clearly defining the differences between the data lake, lake house, and data mesh architectures and immediately addresses critical governance pitfalls and required upskilling before diving into technical implementation. You will learn the discovery process to define data zones and master ingestion using bulk methods and streaming via Apache Kafka to build Lambda architectures. We then detail ad-hoc data discovery and cataloguing with tools like AWS Glue Data Catalog, followed by practical data transformation using PySpark ETL and orchestration tools to ensure data quality rules. The book concludes by showing you how to enable consumption layers for OLAP engines and machine learning, and finally, how to secure the entire platform with strong security, networking, and budget governance.

Upon completing this practical book, you will possess the competency to not only architect and build a scalable data lake but also to strategically expand its value by treating data as a product, making you a highly effective and confident enterprise data lake professional ready for real-world application.

What you will learn
Differentiate Data Lake, Lake House, Data Mesh, and Data Fabric semantics.
Design data zones and cost allocation during the discovery process.
Implement streaming ingestion using Apache Kafka for Lambda architecture.
Build PySpark ETL/SQL ELT pipelines with orchestration tools for quality.
Implement security, networking, and monitoring requirements for governance.

Who this book is for
This practical book is ideal for business/product leaders, architects, and solution engineers. Readers should have foundational knowledge of open-source technologies and major cloud environments like AWS, GCP, or Azure.

Table of Contents
1. Evolution Towards Modern Data Lakes
2. Understanding Common Pitfalls Making Data Lakes Unsuccessful
3. Performing a Discovery to Build Your Data Lake
4. Bringing Data into Your Data Lake
5. Understanding and Cataloguing Your Data
6. Transforming Data and Making it Consumption Ready
7. Building the Consumption Layer for Data Lake
8. Expanding Your Data Lake by Turning Your Data into a Product
9. Building Your Security and Governance Layer

BPB Publications - inne książki

Zamknij

Przenieś na półkę
Dodano produkt na półkę
Usunięto produkt z półki
Przeniesiono produkt do archiwum
Przeniesiono produkt do biblioteki

Zamknij

Wybierz metodę płatności

Ebook
89,91 zł
Dodaj do koszyka
Płatności obsługuje:
Ikona płatności Alior Bank Ikona płatności Apple Pay Ikona płatności Bank PEKAO S.A. Ikona płatności Bank Pocztowy Ikona płatności Banki Spółdzielcze Ikona płatności BLIK Ikona płatności Crédit Agricole e-przelew Ikona płatności dawny BNP Paribas Bank Ikona płatności Google Pay Ikona płatności ING Bank Śląski Ikona płatności Inteligo Ikona płatności iPKO Ikona płatności mBank Ikona płatności Nest Bank Ikona płatności Paypal Ikona płatności PayPo | PayU Płacę później Ikona płatności PayU Płacę później Ikona płatności Plus Bank Ikona płatności Płacę z Citi Handlowy Ikona płatności Płacę z Getin Bank Ikona płatności Płacę z Millennium Ikona płatności Płać z BOŚ Ikona płatności Płatność online kartą płatniczą Ikona płatności Santander Ikona płatności Visa Mobile