Opis ebooka: Deciphering Data Architectures
Data fabric, data lakehouse, and data mesh have recently appeared as viable alternatives to the modern data warehouse. These new architectures have solid benefits, but they're also surrounded by a lot of hyperbole and confusion. This practical book provides a guided tour of these architectures to help data professionals understand the pros and cons of each.
James Serra, big data and data warehousing solution architect at Microsoft, examines common data architecture concepts, including how data warehouses have had to evolve to work with data lake features. You'll learn what data lakehouses can help you achieve, as well as how to distinguish data mesh hype from reality. Best of all, you'll be able to determine the most appropriate data architecture for your needs. With this book, you'll:
- Gain a working understanding of several data architectures
- Learn the strengths and weaknesses of each approach
- Distinguish data architecture theory from reality
- Pick the best architecture for your use case
- Understand the differences between data warehouses and data lakes
- Learn common data architecture concepts to help you build better solutions
- Explore the historical evolution and characteristics of data architectures
- Learn essentials of running an architecture design session, team organization, and project success factors
Free from product discussions, this book will serve as a timeless resource for years to come.
Wybrane bestsellery
-
Reporting with Microsoft SQL Server 2012. Learn to quickly create reports in SSRS and Power View as well as understand the best use of each reporting tool Reporting with Microsoft SQL Server 2012. Learn to quickly create reports in SSRS and Power View as well as understand the best use of each reporting tool
-
Sztuczna inteligencja przyczyniła się do prawdziwej rewolucji technologicznej i zmieniła branżę informatyczną. Po funkcje oparte na AI chętnie sięgnął Microsoft, by udoskonalić swój wiodący produkt – Excela. AI poprzez zaawansowane algorytmy potrafi automatycznie analizować i interpretować ...
AI w Excelu. Kurs video. Automatyzacja zadań w pracy AI w Excelu. Kurs video. Automatyzacja zadań w pracy
(99.59 zł najniższa cena z 30 dni)112.05 zł
249.00 zł(-55%) -
Statystyka to dziedzina wiedzy, która bazuje na danych – przedmiotem jej zainteresowania są metody ich pozyskiwania i prezentacji, a przede wszystkim analizy. W ostatnich latach mocno zyskuje na popularności i dziś niemal każda uczelnia w Polsce oferuje możliwość studiowania na kierunku zwi...
Statystyka. Kurs video. Przewodnik dla studentów kierunków ścisłych Statystyka. Kurs video. Przewodnik dla studentów kierunków ścisłych
(70.95 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
Mastering Data transformation is essential for enhancing their data models and business intelligence. The Definitive Guide to Power Query equips you with the knowledge and skills to master the tool while leveraging its remarkable capabilities.
The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query
Gregory Deckler, Rick de Groot, Melissa de Korte, Brian Julius
-
Jeśli w swojej pracy masz lub miewasz do czynienia z danymi, z pewnością orientujesz się, że do tego celu stworzono dotąd całkiem sporo narzędzi. Nic dziwnego – przy tej liczbie danych, z jaką spotykamy się w dzisiejszym cyfrowym świecie, zdolność do ich sprawnego analizowania i wyciągania ...
Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym
(39.90 zł najniższa cena z 30 dni)62.55 zł
139.00 zł(-55%) -
Oto praktyczny przewodnik po nauce o danych w miejscu pracy. Dowiesz się stąd wszystkiego, co ważne na początku Twojej drogi jako danologa: od osobowości, z którymi przyjdzie Ci pracować, przez detale analizy danych, po matematykę stojącą za algorytmami i uczeniem maszynowym. Nauczysz się myśleć ...
Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym
(41.40 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
Autorzy, Joe Reis i Matt Housley, przeprowadzą Cię przez cykl życia inżynierii danych i pokażą, jak połączyć różne technologie chmurowe, aby spełnić potrzeby konsumentów danych w dolnej części strumienia przetwarzania. Dzięki lekturze tej książki dowiesz się, jak zastosować koncepcje generowania,...
Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie
(71.40 zł najniższa cena z 30 dni)71.40 zł
119.00 zł(-40%) -
Big data pokazuje, jak postęp technologiczny spowodowany rozwojem Internetu i cyfrowego wszechświata wpłynął na radykalną transformację nauki o danych. Czym są duże zbiory danych i jak zmieniają świat? Jaki mają wpływ na nasze codzienne życie, a jaki na świat biznesu? W tej książce czytelnik znaj...(19.25 zł najniższa cena z 30 dni)
12.55 zł
27.90 zł(-55%) -
W złożonej rzeczywistości myślenie systemowe jest kluczowym narzędziem pozwalającym odnieść się do licznych wyzwań: gospodarczych, ekologicznych, politycznych czy społecznych. Tylko w ten sposób w codziennych wiadomościach można dostrzec przejawy trendów, a w trendach — przeja...(29.94 zł najniższa cena z 30 dni)
29.94 zł
49.90 zł(-40%)
O autorze ebooka
James Serra ― doświadczony architekt rozwiązań w Microsofcie. Uznany lider w dziedzinie stosowania technologii big data i zaawansowanej analityki, w tym takich architektur danych jak nowoczesna hurtownia danych, siatka danych, a także data fabric i data lakehouse.
Ebooka "Deciphering Data Architectures" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Deciphering Data Architectures" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Deciphering Data Architectures" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-10-981-5072-3, 9781098150723
- Data wydania ebooka:
-
2024-02-06
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 6.3MB
- Rozmiar pliku Mobi:
- 17.4MB
Spis treści ebooka
- Foreword
- Preface
- Conventions Used in This Book
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- I. Foundation
- 1. Big Data
- What Is Big Data, and How Can It Help You?
- Data Maturity
- Stage 1: Reactive
- Stage 2: Informative
- Stage 3: Predictive
- Stage 4: Transformative
- Self-Service Business Intelligence
- Summary
- 2. Types of Data Architectures
- Evolution of Data Architectures
- Relational Data Warehouse
- Data Lake
- Modern Data Warehouse
- Data Fabric
- Data Lakehouse
- Data Mesh
- Summary
- 3. The Architecture Design Session
- What Is an ADS?
- Why Hold an ADS?
- Before the ADS
- Preparing
- Inviting Participants
- Conducting the ADS
- Introductions
- Discovery
- Whiteboarding
- After the ADS
- Tips for Conducting an ADS
- Summary
- II. Common Data Architecture Concepts
- 4. The Relational Data Warehouse
- What Is a Relational Data Warehouse?
- What a Data Warehouse Is Not
- The Top-Down Approach
- Why Use a Relational Data Warehouse?
- Drawbacks to Using a Relational Data Warehouse
- Populating a Data Warehouse
- How Often to Extract the Data
- Extraction Methods
- How to Determine What Data Has Changed Since the Last Extraction
- The Death of the Relational Data Warehouse Has Been Greatly Exaggerated
- Summary
- 5. Data Lake
- What Is a Data Lake?
- Why Use a Data Lake?
- Bottom-Up Approach
- Best Practices for Data Lake Design
- Multiple Data Lakes
- Advantages
- Organizational structure and ownership
- Compliance, governance, and security
- Cloud subscription, service limits, and policies
- Performance, availability, and disaster recovery
- Data retention and environment management
- Advantages
- Disadvantages
- Summary
- 6. Data Storage Solutions and Processes
- Data Storage Solutions
- Data Marts
- Operational Data Stores
- Use case
- Data Hubs
- Data Storage Solutions
- Data Processes
- Master Data Management
- Use case
- Master Data Management
- Data Virtualization and Data Federation
- Virtualization as a replacement for the data warehouse
- Virtualization as a replacement for ETL or data movement
- Data Catalogs
- Data Marketplaces
- Summary
- 7. Approaches to Design
- Online Transaction Processing Versus Online Analytical Processing
- Operational and Analytical Data
- Symmetric Multiprocessing and Massively Parallel Processing
- Lambda Architecture
- Kappa Architecture
- Polyglot Persistence and Polyglot Data Stores
- Summary
- 8. Approaches to Data Modeling
- Relational Modeling
- Keys
- EntityRelationship Diagrams
- Normalization Rules and Forms
- Tracking Changes
- Relational Modeling
- Dimensional Modeling
- Facts, Dimensions, and Keys
- Tracking Changes
- Denormalization
- Common Data Model
- Data Vault
- The Kimball and Inmon Data Warehousing Methodologies
- Inmons Top-Down Methodology
- Kimballs Bottom-Up Methodology
- Choosing a Methodology
- Hybrid Models
- Methodology Myths
- Summary
- 9. Approaches to Data Ingestion
- ETL Versus ELT
- Reverse ETL
- Batch Processing Versus Real-Time Processing
- Batch Processing Pros and Cons
- Real-Time Processing Pros and Cons
- Data Governance
- Summary
- III. Data Architectures
- 10. The Modern Data Warehouse
- The MDW Architecture
- Pros and Cons of the MDW Architecture
- Combining the RDW and Data Lake
- Data Lake
- Relational Data Warehouse
- Stepping Stones to the MDW
- EDW Augmentation
- How it works
- Benefits
- Challenges
- Migration
- EDW Augmentation
- Temporary Data Lake Plus EDW
- How it works
- Benefits
- Challenges
- Migration
- All-in-One
- How it works
- Benefits
- Challenges
- Migration
- Case Study: Wilson & Gunkerks Strategic Shift to an MDW
- Challenge
- Solution
- Outcome
- Summary
- 11. Data Fabric
- The Data Fabric Architecture
- Data Access Policies
- Metadata Catalog
- Master Data Management
- Data Virtualization
- Real-Time Processing
- APIs
- Services
- Products
- The Data Fabric Architecture
- Why Transition from an MDW to a Data Fabric Architecture?
- Potential Drawbacks
- Summary
- 12. Data Lakehouse
- Delta Lake Features
- Performance Improvements
- The Data Lakehouse Architecture
- What If You Skip the Relational Data Warehouse?
- Relational Serving Layer
- Summary
- 13. Data Mesh Foundation
- A Decentralized Data Architecture
- Data Mesh Hype
- Dehghanis Four Principles of Data Mesh
- Principle #1: Domain Ownership
- Principle #2: Data as a Product
- Principle #3: Self-Serve Data Infrastructure as a Platform
- Principle #4: Federated Computational Governance
- The Pure Data Mesh
- Data Domains
- Data Mesh Logical Architecture
- Different Topologies
- Data Mesh Versus Data Fabric
- Use Cases
- Summary
- 14. Should You Adopt Data Mesh? Myths, Concerns, and the Future
- Myths
- Myth: Using Data Mesh Is a Silver Bullet That Solves All Data Challenges Quickly
- Myth: A Data Mesh Will Replace Your Data Lake and Data Warehouse
- Myth: Data Warehouse Projects Are All Failing, and a Data Mesh Will Solve That Problem
- Myth: Building a Data Mesh Means Decentralizing Absolutely Everything
- Myth: You Can Use Data Virtualization to Create a Data Mesh
- Myths
- Concerns
- Philosophical and Conceptual Matters
- Combining Data in a Decentralized Environment
- Other Issues of Decentralization
- Complexity
- Duplication
- Feasibility
- People
- Domain-Level Barriers
- Organizational Assessment: Should You Adopt a Data Mesh?
- Recommendations for Implementing a Successful Data Mesh
- The Future of Data Mesh
- Zooming Out: Understanding Data Architectures and Their Applications
- Summary
- IV. People, Processes, and Technology
- 15. People and Processes
- Team Organization: Roles and Responsibilities
- Roles for MDW, Data Fabric, or Data Lakehouse
- Roles for Data Mesh
- Domain teams
- Self-service data infrastructure platform team
- Federated computational governance platform team
- Team Organization: Roles and Responsibilities
- Why Projects Fail: Pitfalls and Prevention
- Pitfall: Allowing Executives to Think That BI Is Easy
- Pitfall: Using the Wrong Technologies
- Pitfall: Gathering Too Many Business Requirements
- Pitfall: Gathering Too Few Business Requirements
- Pitfall: Presenting Reports Without Validating Their Contents First
- Pitfall: Hiring an Inexperienced Consulting Company
- Pitfall: Hiring a Consulting Company That Outsources Development to Offshore Workers
- Pitfall: Passing Project Ownership Off to Consultants
- Pitfall: Neglecting the Need to Transfer Knowledge Back into the Organization
- Pitfall: Slashing the Budget Midway Through the Project
- Pitfall: Starting with an End Date and Working Backward
- Pitfall: Structuring the Data Warehouse to Reflect the Source Data Rather Than the Businesss Needs
- Pitfall: Presenting End Users with a Solution with Slow Response Times or Other Performance Issues
- Pitfall: Overdesigning (or Underdesigning) Your Data Architecture
- Pitfall: Poor Communication Between IT and the Business Domains
- Tips for Success
- Dont Skimp on Your Investment
- Involve Users, Show Them Results, and Get Them Excited
- Add Value to New Reports and Dashboards
- Ask End Users to Build a Prototype
- Find a Project Champion/Sponsor
- Make a Project Plan That Aims for 80% Efficiency
- Summary
- 16. Technologies
- Choosing a Platform
- Open Source Solutions
- On-Premises Solutions
- Cloud Provider Solutions
- Choosing a Platform
- Cloud Service Models
- Major Cloud Providers
- Multi-Cloud Solutions
- Software Frameworks
- Hadoop
- Databricks
- Snowflake
- Summary
- Index
O'Reilly Media - inne książki
-
Keeping up with the Python ecosystem can be daunting. Its developer tooling doesn't provide the out-of-the-box experience native to languages like Rust and Go. When it comes to long-term project maintenance or collaborating with others, every Python project faces the same problem: how to build re...(201.03 zł najniższa cena z 30 dni)
200.93 zł
239.00 zł(-16%) -
Bringing a deep-learning project into production at scale is quite challenging. To successfully scale your project, a foundational understanding of full stack deep learning, including the knowledge that lies at the intersection of hardware, software, data, and algorithms, is required.This book il...(241.36 zł najniższa cena z 30 dni)
241.26 zł
289.00 zł(-17%) -
Frontend developers have to consider many things: browser compatibility, usability, performance, scalability, SEO, and other best practices. But the most fundamental aspect of creating websites is one that often falls short: accessibility. Accessibility is the cornerstone of any website, and if a...(200.59 zł najniższa cena z 30 dni)
200.09 zł
239.00 zł(-16%) -
In this insightful and comprehensive guide, Addy Osmani shares more than a decade of experience working on the Chrome team at Google, uncovering secrets to engineering effectiveness, efficiency, and team success. Engineers and engineering leaders looking to scale their effectiveness and drive tra...(114.93 zł najniższa cena z 30 dni)
114.88 zł
149.00 zł(-23%) -
Data modeling is the single most overlooked feature in Power BI Desktop, yet it's what sets Power BI apart from other tools on the market. This practical book serves as your fast-forward button for data modeling with Power BI, Analysis Services tabular, and SQL databases. It serves as a starting ...(199.08 zł najniższa cena z 30 dni)
198.88 zł
239.00 zł(-17%) -
C# is undeniably one of the most versatile programming languages available to engineers today. With this comprehensive guide, you'll learn just how powerful the combination of C# and .NET can be. Author Ian Griffiths guides you through C# 12.0 and .NET 8 fundamentals and techniques for building c...(241.02 zł najniższa cena z 30 dni)
240.92 zł
289.00 zł(-17%) -
Learn how to get started with Futures Thinking. With this practical guide, Phil Balagtas, founder of the Design Futures Initiative and the global Speculative Futures network, shows you how designers and futurists have made futures work at companies such as Atari, IBM, Apple, Disney, Autodesk, Luf...(148.10 zł najniższa cena z 30 dni)
148.00 zł
179.00 zł(-17%) -
Augmented Analytics isn't just another book on data and analytics; it's a holistic resource for reimagining the way your entire organization interacts with information to become insight-driven.Moving beyond traditional, limited ways of making sense of data, Augmented Analytics provides a dynamic,...(174.74 zł najniższa cena z 30 dni)
174.54 zł
219.00 zł(-20%) -
Learn how to prepare for—and pass—the Kubernetes and Cloud Native Associate (KCNA) certification exam. This practical guide serves as both a study guide and point of entry for practitioners looking to explore and adopt cloud native technologies. Adrián González Sánchez ...
Kubernetes and Cloud Native Associate (KCNA) Study Guide Kubernetes and Cloud Native Associate (KCNA) Study Guide
(169.14 zł najniższa cena z 30 dni)177.65 zł
199.00 zł(-11%) -
Python is an excellent way to get started in programming, and this clear, concise guide walks you through Python a step at a time—beginning with basic programming concepts before moving on to functions, data structures, and object-oriented design. This revised third edition reflects the gro...(140.34 zł najniższa cena z 30 dni)
140.14 zł
179.00 zł(-22%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
![Loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
![ajax-loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
Oceny i opinie klientów: Deciphering Data Architectures James Serra (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.