Opis ebooka: Deciphering Data Architectures
Data fabric, data lakehouse, and data mesh have recently appeared as viable alternatives to the modern data warehouse. These new architectures have solid benefits, but they're also surrounded by a lot of hyperbole and confusion. This practical book provides a guided tour of these architectures to help data professionals understand the pros and cons of each.
James Serra, big data and data warehousing solution architect at Microsoft, examines common data architecture concepts, including how data warehouses have had to evolve to work with data lake features. You'll learn what data lakehouses can help you achieve, as well as how to distinguish data mesh hype from reality. Best of all, you'll be able to determine the most appropriate data architecture for your needs. With this book, you'll:
- Gain a working understanding of several data architectures
- Learn the strengths and weaknesses of each approach
- Distinguish data architecture theory from reality
- Pick the best architecture for your use case
- Understand the differences between data warehouses and data lakes
- Learn common data architecture concepts to help you build better solutions
- Explore the historical evolution and characteristics of data architectures
- Learn essentials of running an architecture design session, team organization, and project success factors
Free from product discussions, this book will serve as a timeless resource for years to come.
Wybrane bestsellery
-
Reporting with Microsoft SQL Server 2012. Learn to quickly create reports in SSRS and Power View as well as understand the best use of each reporting tool Reporting with Microsoft SQL Server 2012. Learn to quickly create reports in SSRS and Power View as well as understand the best use of each reporting tool
-
Tę książkę docenią wszyscy zainteresowani eksploracją danych i uczeniem maszynowym, którzy chcieliby pewnie poruszać się w świecie nauki o danych. Pokazano tu, w jaki sposób Excel pozwala zobrazować proces ich eksplorowania i jak działają poszczególne techniki w tym zakresie. Przejrzyście wyjaśni...
Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku
(40.20 zł najniższa cena z 30 dni)43.55 zł
67.00 zł(-35%) -
Power Apps to platforma stworzona przez Microsoft, umożliwiająca łatwe projektowanie, tworzenie i dostosowywanie aplikacji bez konieczności posiadania głębokiej wiedzy programistycznej. Z użyciem Power Apps można budować niestandardowe aplikacje, które efektywnie wspierają i automatyzują różne pr...
Power Apps. Kurs video. Tworzenie biznesowych aplikacji no-code Power Apps. Kurs video. Tworzenie biznesowych aplikacji no-code
(39.90 zł najniższa cena z 30 dni)129.35 zł
199.00 zł(-35%) -
Oto zwięzłe i równocześnie praktyczne kompendium, w którym znajdziesz 20 praktyk udanego planowania, analizy, specyfikacji, walidacji i zarządzania wymaganiami. Praktyki te są odpowiednie dla projektów zarządzanych zarówno w tradycyjny, jak i zwinny sposób, niezależnie od branży. Sprawią, że zesp...
Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej Specyfikacja wymagań oprogramowania. Kluczowe praktyki analizy biznesowej
(40.20 zł najniższa cena z 30 dni)53.60 zł
67.00 zł(-20%) -
W dzisiejszej praktyce biznesowej duże znaczenie mają dane i ich analiza. W analizie zastosowanie znajduje wiele modeli statystycznych, implementowanych w różnych programach komputerowych. Na przykład Excel ma specjalny dodatek, nazwany po prostu Analiza Danych. Bardzo popularne narzędzie stanowi...
R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych R i pakiet shiny. Kurs video. Interaktywne aplikacje w analizie danych
(39.90 zł najniższa cena z 30 dni)74.50 zł
149.00 zł(-50%) -
Oto drugie, zaktualizowane i uzupełnione wydanie przewodnika po bibliotece Pandas. Dzięki tej przystępnej książce nauczysz się w pełni korzystać z możliwości oferowanych przez bibliotekę, nawet jeśli dopiero zaczynasz przygodę z analizą danych w Pythonie. Naukę rozpoczniesz z użyciem rzeczywisteg...
Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II
(65.40 zł najniższa cena z 30 dni)70.85 zł
109.00 zł(-35%) -
Oto praktyczny przewodnik po nauce o danych w miejscu pracy. Dowiesz się stąd wszystkiego, co ważne na początku Twojej drogi jako danologa: od osobowości, z którymi przyjdzie Ci pracować, przez detale analizy danych, po matematykę stojącą za algorytmami i uczeniem maszynowym. Nauczysz się myśleć ...
Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym
(41.40 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
Ta książka jest trzecim, starannie zaktualizowanym wydaniem wyczerpującego przewodnika po narzędziach analitycznych Pythona. Uwzględnia Pythona 3.0 i bibliotekę pandas 1.4. Została napisana w przystępny sposób, a poszczególne zagadnienia bogato zilustrowano przykładami, studiami rzeczywistych prz...
Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III
(71.40 zł najniższa cena z 30 dni)77.35 zł
119.00 zł(-35%) -
Dzięki tej książce nauczysz się przekształcać suche dane liczbowe w pełną empatii narrację! Aby spełniły one swoje zadanie, ktoś musi przedstawić zawarte w nich informacje w postaci opowieści. W tej publikacji wyczerpująco i praktycznie opisano przebieg tego procesu. Jej lektura sprawi, że rozwin...
Opowieści ukryte w danych. Wyjaśnij dane i wywołaj działania za pomocą narracji Opowieści ukryte w danych. Wyjaśnij dane i wywołaj działania za pomocą narracji
(20.90 zł najniższa cena z 30 dni)20.90 zł
67.00 zł(-69%) -
W złożonej rzeczywistości myślenie systemowe jest kluczowym narzędziem pozwalającym odnieść się do licznych wyzwań: gospodarczych, ekologicznych, politycznych czy społecznych. Tylko w ten sposób w codziennych wiadomościach można dostrzec przejawy trendów, a w trendach — przeja...(29.94 zł najniższa cena z 30 dni)
32.43 zł
49.90 zł(-35%)
O autorze ebooka
Ebooka "Deciphering Data Architectures" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Deciphering Data Architectures" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Deciphering Data Architectures" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-10-981-5072-3, 9781098150723
- Data wydania ebooka:
- 2024-02-06 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 6.3MB
- Rozmiar pliku Mobi:
- 17.4MB
Spis treści ebooka
- Foreword
- Preface
- Conventions Used in This Book
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- I. Foundation
- 1. Big Data
- What Is Big Data, and How Can It Help You?
- Data Maturity
- Stage 1: Reactive
- Stage 2: Informative
- Stage 3: Predictive
- Stage 4: Transformative
- Self-Service Business Intelligence
- Summary
- 2. Types of Data Architectures
- Evolution of Data Architectures
- Relational Data Warehouse
- Data Lake
- Modern Data Warehouse
- Data Fabric
- Data Lakehouse
- Data Mesh
- Summary
- 3. The Architecture Design Session
- What Is an ADS?
- Why Hold an ADS?
- Before the ADS
- Preparing
- Inviting Participants
- Conducting the ADS
- Introductions
- Discovery
- Whiteboarding
- After the ADS
- Tips for Conducting an ADS
- Summary
- II. Common Data Architecture Concepts
- 4. The Relational Data Warehouse
- What Is a Relational Data Warehouse?
- What a Data Warehouse Is Not
- The Top-Down Approach
- Why Use a Relational Data Warehouse?
- Drawbacks to Using a Relational Data Warehouse
- Populating a Data Warehouse
- How Often to Extract the Data
- Extraction Methods
- How to Determine What Data Has Changed Since the Last Extraction
- The Death of the Relational Data Warehouse Has Been Greatly Exaggerated
- Summary
- 5. Data Lake
- What Is a Data Lake?
- Why Use a Data Lake?
- Bottom-Up Approach
- Best Practices for Data Lake Design
- Multiple Data Lakes
- Advantages
- Organizational structure and ownership
- Compliance, governance, and security
- Cloud subscription, service limits, and policies
- Performance, availability, and disaster recovery
- Data retention and environment management
- Advantages
- Disadvantages
- Summary
- 6. Data Storage Solutions and Processes
- Data Storage Solutions
- Data Marts
- Operational Data Stores
- Use case
- Data Hubs
- Data Storage Solutions
- Data Processes
- Master Data Management
- Use case
- Master Data Management
- Data Virtualization and Data Federation
- Virtualization as a replacement for the data warehouse
- Virtualization as a replacement for ETL or data movement
- Data Catalogs
- Data Marketplaces
- Summary
- 7. Approaches to Design
- Online Transaction Processing Versus Online Analytical Processing
- Operational and Analytical Data
- Symmetric Multiprocessing and Massively Parallel Processing
- Lambda Architecture
- Kappa Architecture
- Polyglot Persistence and Polyglot Data Stores
- Summary
- 8. Approaches to Data Modeling
- Relational Modeling
- Keys
- EntityRelationship Diagrams
- Normalization Rules and Forms
- Tracking Changes
- Relational Modeling
- Dimensional Modeling
- Facts, Dimensions, and Keys
- Tracking Changes
- Denormalization
- Common Data Model
- Data Vault
- The Kimball and Inmon Data Warehousing Methodologies
- Inmons Top-Down Methodology
- Kimballs Bottom-Up Methodology
- Choosing a Methodology
- Hybrid Models
- Methodology Myths
- Summary
- 9. Approaches to Data Ingestion
- ETL Versus ELT
- Reverse ETL
- Batch Processing Versus Real-Time Processing
- Batch Processing Pros and Cons
- Real-Time Processing Pros and Cons
- Data Governance
- Summary
- III. Data Architectures
- 10. The Modern Data Warehouse
- The MDW Architecture
- Pros and Cons of the MDW Architecture
- Combining the RDW and Data Lake
- Data Lake
- Relational Data Warehouse
- Stepping Stones to the MDW
- EDW Augmentation
- How it works
- Benefits
- Challenges
- Migration
- EDW Augmentation
- Temporary Data Lake Plus EDW
- How it works
- Benefits
- Challenges
- Migration
- All-in-One
- How it works
- Benefits
- Challenges
- Migration
- Case Study: Wilson & Gunkerks Strategic Shift to an MDW
- Challenge
- Solution
- Outcome
- Summary
- 11. Data Fabric
- The Data Fabric Architecture
- Data Access Policies
- Metadata Catalog
- Master Data Management
- Data Virtualization
- Real-Time Processing
- APIs
- Services
- Products
- The Data Fabric Architecture
- Why Transition from an MDW to a Data Fabric Architecture?
- Potential Drawbacks
- Summary
- 12. Data Lakehouse
- Delta Lake Features
- Performance Improvements
- The Data Lakehouse Architecture
- What If You Skip the Relational Data Warehouse?
- Relational Serving Layer
- Summary
- 13. Data Mesh Foundation
- A Decentralized Data Architecture
- Data Mesh Hype
- Dehghanis Four Principles of Data Mesh
- Principle #1: Domain Ownership
- Principle #2: Data as a Product
- Principle #3: Self-Serve Data Infrastructure as a Platform
- Principle #4: Federated Computational Governance
- The Pure Data Mesh
- Data Domains
- Data Mesh Logical Architecture
- Different Topologies
- Data Mesh Versus Data Fabric
- Use Cases
- Summary
- 14. Should You Adopt Data Mesh? Myths, Concerns, and the Future
- Myths
- Myth: Using Data Mesh Is a Silver Bullet That Solves All Data Challenges Quickly
- Myth: A Data Mesh Will Replace Your Data Lake and Data Warehouse
- Myth: Data Warehouse Projects Are All Failing, and a Data Mesh Will Solve That Problem
- Myth: Building a Data Mesh Means Decentralizing Absolutely Everything
- Myth: You Can Use Data Virtualization to Create a Data Mesh
- Myths
- Concerns
- Philosophical and Conceptual Matters
- Combining Data in a Decentralized Environment
- Other Issues of Decentralization
- Complexity
- Duplication
- Feasibility
- People
- Domain-Level Barriers
- Organizational Assessment: Should You Adopt a Data Mesh?
- Recommendations for Implementing a Successful Data Mesh
- The Future of Data Mesh
- Zooming Out: Understanding Data Architectures and Their Applications
- Summary
- IV. People, Processes, and Technology
- 15. People and Processes
- Team Organization: Roles and Responsibilities
- Roles for MDW, Data Fabric, or Data Lakehouse
- Roles for Data Mesh
- Domain teams
- Self-service data infrastructure platform team
- Federated computational governance platform team
- Team Organization: Roles and Responsibilities
- Why Projects Fail: Pitfalls and Prevention
- Pitfall: Allowing Executives to Think That BI Is Easy
- Pitfall: Using the Wrong Technologies
- Pitfall: Gathering Too Many Business Requirements
- Pitfall: Gathering Too Few Business Requirements
- Pitfall: Presenting Reports Without Validating Their Contents First
- Pitfall: Hiring an Inexperienced Consulting Company
- Pitfall: Hiring a Consulting Company That Outsources Development to Offshore Workers
- Pitfall: Passing Project Ownership Off to Consultants
- Pitfall: Neglecting the Need to Transfer Knowledge Back into the Organization
- Pitfall: Slashing the Budget Midway Through the Project
- Pitfall: Starting with an End Date and Working Backward
- Pitfall: Structuring the Data Warehouse to Reflect the Source Data Rather Than the Businesss Needs
- Pitfall: Presenting End Users with a Solution with Slow Response Times or Other Performance Issues
- Pitfall: Overdesigning (or Underdesigning) Your Data Architecture
- Pitfall: Poor Communication Between IT and the Business Domains
- Tips for Success
- Dont Skimp on Your Investment
- Involve Users, Show Them Results, and Get Them Excited
- Add Value to New Reports and Dashboards
- Ask End Users to Build a Prototype
- Find a Project Champion/Sponsor
- Make a Project Plan That Aims for 80% Efficiency
- Summary
- 16. Technologies
- Choosing a Platform
- Open Source Solutions
- On-Premises Solutions
- Cloud Provider Solutions
- Choosing a Platform
- Cloud Service Models
- Major Cloud Providers
- Multi-Cloud Solutions
- Software Frameworks
- Hadoop
- Databricks
- Snowflake
- Summary
- Index
O'Reilly Media - inne książki
-
JavaScript gives web developers great power to create rich interactive browser experiences, and much of that power is provided by the browser itself. Modern web APIs enable web-based applications to come to life like never before, supporting actions that once required browser plug-ins. Some are s...(186.15 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
How will software development and operations have to change to meet the sustainability and green needs of the planet? And what does that imply for development organizations? In this eye-opening book, sustainable software advocates Anne Currie, Sarah Hsu, and Sara Bergman provide a unique overview...(160.65 zł najniższa cena z 30 dni)
169.14 zł
199.00 zł(-15%) -
OpenTelemetry is a revolution in observability data. Instead of running multiple uncoordinated pipelines, OpenTelemetry provides users with a single integrated stream of data, providing multiple sources of high-quality telemetry data: tracing, metrics, logs, RUM, eBPF, and more. This practical gu...(143.65 zł najniższa cena z 30 dni)
143.65 zł
169.00 zł(-15%) -
What will you learn from this book?If you're a software developer looking for a quick on-ramp to software architecture, this handy guide is a great place to start. From the authors of Fundamentals of Software Architecture, Head First Software Architecture teaches you how to think architecturally ...(245.65 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
If you use Linux in your day-to-day work, then Linux Pocket Guide is the perfect on-the-job reference. This thoroughly updated 20th anniversary edition explains more than 200 Linux commands, including new commands for file handling, package management, version control, file format conversions, an...(92.65 zł najniższa cena z 30 dni)
101.15 zł
119.00 zł(-15%) -
Interested in developing embedded systems? Since they don't tolerate inefficiency, these systems require a disciplined approach to programming. This easy-to-read guide helps you cultivate good development practices based on classic software design patterns and new patterns unique to embedded prog...(152.15 zł najniższa cena z 30 dni)
160.65 zł
189.00 zł(-15%) -
Gain the valuable skills and techniques you need to accelerate the delivery of machine learning solutions. With this practical guide, data scientists, ML engineers, and their leaders will learn how to bridge the gap between data science and Lean product delivery in a practical and simple way. Dav...(245.65 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
This practical book provides a detailed explanation of the zero trust security model. Zero trust is a security paradigm shift that eliminates the concept of traditional perimeter-based security and requires you to "always assume breach" and "never trust but always verify." The updated edition off...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Decentralized finance (DeFi) is a rapidly growing field in fintech, having grown from $700 million to $100 billion over the past three years alone. But the lack of reliable information makes this area both risky and murky. In this practical book, experienced securities attorney Alexandra Damsker ...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Whether you're a startup founder trying to disrupt an industry or an entrepreneur trying to provoke change from within, your biggest challenge is creating a product people actually want. Lean Analytics steers you in the right direction.This book shows you how to validate your initial idea, find t...(126.65 zł najniższa cena z 30 dni)
126.65 zł
149.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Deciphering Data Architectures James Serra (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.