- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 286
- Dostępne formaty:
-
ePubMobi
Opis ebooka: The Self-Service Data Roadmap
Data-driven insights are a key competitive advantage for any industry today, but deriving insights from raw data can still take days or weeks. Most organizations can’t scale data science teams fast enough to keep up with the growing amounts of data to transform. What’s the answer? Self-service data.
With this practical book, data engineers, data scientists, and team managers will learn how to build a self-service data science platform that helps anyone in your organization extract insights from data. Sandeep Uttamchandani provides a scorecard to track and address bottlenecks that slow down time to insight across data discovery, transformation, processing, and production. This book bridges the gap between data scientists bottlenecked by engineering realities and data engineers unclear about ways to make self-service work.
- Build a self-service portal to support data discovery, quality, lineage, and governance
- Select the best approach for each self-service capability using open source cloud technologies
- Tailor self-service for the people, processes, and technology maturity of your data platform
- Implement capabilities to democratize data and reduce time to insight
- Scale your self-service portal to support a large number of users within your organization
Wybrane bestsellery
-
Tę książkę docenią w szczególności analitycy danych. Wyjaśniono w niej potencjał wnioskowania przyczynowego w zakresie szacowania wpływu i efektów w biznesie. Opisano klasyczne metody wnioskowania przyczynowego, w tym testy A/B, regresja liniowa, wskaźnik skłonności, metoda syntetycznej kontroli ...(48.69 zł najniższa cena z 30 dni)
48.69 zł
74.90 zł(-35%) -
Oddajemy w Państwa ręce kompendium wiedzy, które stanowi nieocenione źródło informacji dla wszystkich zainteresowanych zgłębianiem tajników uczenia maszynowego i głębokiego uczenia. Ta obszerna publikacja, licząca ponad 800 stron, jest prawdziwą skarbnicą wiedzy teoretycznej i praktycznej, staran...
-
Statystyka to dziedzina wiedzy, która bazuje na danych – przedmiotem jej zainteresowania są metody ich pozyskiwania i prezentacji, a przede wszystkim analizy. W ostatnich latach mocno zyskuje na popularności i dziś niemal każda uczelnia w Polsce oferuje możliwość studiowania na kierunku zwi...
-
Biznes nie istnieje bez twardych danych, założeń, KPI i ich realizacji. Także ta jego część, która jest związana z promocją. Szczególnie online. Dziś nie można być marketerem z prawdziwego zdarzenia i nie znać chociażby narzędzi oferowanych przez Google ― Analytics, Tag Manager, Search Cons...(37.05 zł najniższa cena z 30 dni)
37.05 zł
57.00 zł(-35%) -
W złożonej rzeczywistości myślenie systemowe jest kluczowym narzędziem pozwalającym odnieść się do licznych wyzwań: gospodarczych, ekologicznych, politycznych czy społecznych. Tylko w ten sposób w codziennych wiadomościach można dostrzec przejawy trendów, a w trendach — przeja...(32.43 zł najniższa cena z 30 dni)
32.43 zł
49.90 zł(-35%) -
W tym przewodniku opisano zagadnienia związane z podstawami nauki o danych. Wyjaśniono niezbędne elementy matematyki i statystyki. Przedstawiono także techniki budowy potrzebnych narzędzi i sposoby działania najistotniejszych algorytmów. Książka została skonstruowana tak, aby poszczególne impleme...(51.35 zł najniższa cena z 30 dni)
51.35 zł
79.00 zł(-35%) -
BPMN pozwala na ciągłe analizowanie, monitorowanie i optymalizowanie procesów biznesowych. Jest narzędziem bardzo skutecznym, prawdziwym „świętym Graalem” współczesnego biznesu. Jednak nie jest on niestety tak przyjazny, jak mógłby oczekiwać początkujący użytkownik. Jego oryginalną sp...(31.85 zł najniższa cena z 30 dni)
31.85 zł
49.00 zł(-35%) -
Posiadanie zbiorów danych to połowa sukcesu. Druga połowa to umiejętność ich skutecznej analizy i wyciągania wniosków! Dopiero na tej podstawie będziesz w stanie właściwie ocenić kondycję Twojej firmy oraz podjąć słuszne decyzje. Wiedza zawarta w tej książce może zadecydować o sukcesie biznesowym...(51.35 zł najniższa cena z 30 dni)
51.35 zł
79.00 zł(-35%)
Ebooka "The Self-Service Data Roadmap" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "The Self-Service Data Roadmap" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "The Self-Service Data Roadmap" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-920-7520-2, 9781492075202
- Data wydania ebooka:
- 2020-09-10 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 6.6MB
- Rozmiar pliku Mobi:
- 15.9MB
Spis treści ebooka
- Preface
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- 1. Introduction
- Journey Map from Raw Data to Insights
- Discover
- Discovering a datasets metadata details
- Searching available datasets and artifacts
- Reusing or creating features for ML models
- Aggregating missing data
- Managing clickstream events
- Discover
- Prep
- Managing aggregated data within a central repository
- Structuring, cleaning, enriching, and validating data
- Ensuring data rights compliance
- Journey Map from Raw Data to Insights
- Build
- Deciding the best approach for accessing and analyzing data
- Writing transformation logic
- Training the models
- Continuously integrating ML model changes
- A/B testing of insights
- Operationalize
- Verifying and optimizing queries
- Orchestrating pipelines
- Deploying the ML models
- Monitoring the quality of the insights
- Continuous cost monitoring
- Defining Your Time-to-Insight Scorecard
- Build Your Self-Service Data Roadmap
- I. Self-Service Data Discovery
- 2. Metadata Catalog Service
- Journey Map
- Understanding Datasets
- Analyzing Datasets
- Knowledge Scaling
- Journey Map
- Minimizing Time to Interpret
- Extracting Technical Metadata
- Extracting Operational Metadata
- Gathering Team Knowledge
- Defining Requirements
- Technical Metadata Extractor Requirements
- Operational Metadata Requirements
- Team Knowledge Aggregator Requirements
- Implementation Patterns
- Source-Specific Connectors Pattern
- Lineage Correlation Pattern
- Team Knowledge Pattern
- Summary
- 3. Search Service
- Journey Map
- Determining Feasibility of the Business Problem
- Selecting Relevant Datasets for Data Prep
- Reusing Existing Artifacts for Prototyping
- Journey Map
- Minimizing Time to Find
- Indexing Datasets and Artifacts
- Ranking Results
- Access Control
- Defining Requirements
- Indexer Requirements
- Ranking Requirements
- Access Control Requirements
- Nonfunctional Requirements
- Implementation Patterns
- Push-Pull Indexer Pattern
- Hybrid Search Ranking Pattern
- Catalog Access Control Pattern
- Summary
- 4. Feature Store Service
- Journey Map
- Finding Available Features
- Training Set Generation
- Feature Pipeline for Online Inference
- Journey Map
- Minimize Time to Featurize
- Feature Computation
- Feature Serving
- Defining Requirements
- Feature Computation
- Feature Serving
- Feature groups
- Scaling
- Feature analysis
- Nonfunctional Requirements
- Implementation Patterns
- Hybrid Feature Computation Pattern
- Feature Registry Pattern
- Summary
- 5. Data Movement Service
- Journey Map
- Aggregating Data Across Sources
- Moving Raw Data to Specialized Query Engines
- Moving Processed Data to Serving Stores
- Exploratory Analysis Across Sources
- Journey Map
- Minimizing Time to Data Availability
- Data Ingestion Configuration and Change Management
- Compliance
- Data Quality Verification
- Defining Requirements
- Ingestion Requirements
- Source and target datastore technologies
- Data scale
- Acceptable refresh lag
- Ingestion Requirements
- Transformation Requirements
- Compliance Requirements
- Verification Requirements
- Nonfunctional Requirements
- Implementation Patterns
- Batch Ingestion Pattern
- Change Data Capture Ingestion Pattern
- Event Aggregation Pattern
- Summary
- 6. Clickstream Tracking Service
- Journey Map
- Minimizing Time to Click Metrics
- Managing Instrumentation
- Event Enrichment
- Building Insights
- Defining Requirements
- Instrumentation Requirements Checklist
- Enrichment Requirements Checklist
- Implementation Patterns
- Instrumentation Pattern
- Rule-Based Enrichment Patterns
- Bot-filtering pattern
- Sessionization pattern
- User context enrichment pattern
- Consumption Patterns
- Summary
- II. Self-Service Data Prep
- 7. Data Lake Management Service
- Journey Map
- Primitive Life Cycle Management
- Managing Data Updates
- Managing Batching and Streaming Data Flows
- Journey Map
- Minimizing Time to Data Lake Management
- Requirements
- Namespace zones
- Supported file formats
- Serving layers
- Key-value data model
- Wide-column data model
- Document data model
- Graph data model
- Requirements
- Implementation Patterns
- Data Life Cycle Primitives Pattern
- Schema evolution
- Data versioning
- Incremental updates
- Data Life Cycle Primitives Pattern
- Transactional Pattern
- Advanced Data Management Pattern
- Summary
- 8. Data Wrangling Service
- Journey Map
- Minimizing Time to Wrangle
- Defining Requirements
- Curating Data
- Operational Monitoring
- Defining Requirements
- Implementation Patterns
- Exploratory Data Analysis Patterns
- Analytical Transformation Patterns
- Summary
- 9. Data Rights Governance Service
- Journey Map
- Executing Data Rights Requests
- Discovery of Datasets
- Model Retraining
- Journey Map
- Minimizing Time to Comply
- Tracking the Customer Data Life Cycle
- Executing Customer Data Rights Requests
- Limiting Data Access
- Defining Requirements
- Current Pain Point Questionnaire
- Interop Checklist
- Functional Requirements
- Nonfunctional Requirements
- Implementation Patterns
- Sensitive Data Discovery and Classification Pattern
- Data Lake Deletion Pattern
- Use CaseDependent Access Control
- Summary
- III. Self-Service Build
- 10. Data Virtualization Service
- Journey Map
- Exploring Data Sources
- Picking a Processing Cluster
- Journey Map
- Minimizing Time to Query
- Picking the Execution Environment
- Formulating Polyglot Queries
- Joining Data Across Silos
- Defining Requirements
- Current Pain Point Analysis
- Operational Requirements
- Functional Requirements
- Nonfunctional Requirements
- Implementation Patterns
- Automatic Query Routing Pattern
- Unified Query Pattern
- Federated Query Pattern
- Summary
- 11. Data Transformation Service
- Journey Map
- Production Dashboard and ML Pipelines
- Data-Driven Storytelling
- Journey Map
- Minimizing Time to Transform
- Transformation Implementation
- Transformation Execution
- Transformation Operations
- Defining Requirements
- Current State Questionnaire
- Functional Requirements
- Nonfunctional Requirements
- Implementation Patterns
- Implementation Pattern
- Execution Patterns
- Summary
- 12. Model Training Service
- Journey Map
- Model Prototyping
- Continuous Training
- Model Debugging
- Journey Map
- Minimizing Time to Train
- Training Orchestration
- Tuning
- Continuous Training
- Defining Requirements
- Training Orchestration
- Tuning
- Continuous Training
- Nonfunctional Requirements
- Implementation Patterns
- Distributed Training Orchestrator Pattern
- Automated Tuning Pattern
- Data-Aware Continuous Training
- Summary
- 13. Continuous Integration Service
- Journey Map
- Collaborating on an ML Pipeline
- Integrating ETL Changes
- Validating Schema Changes
- Journey Map
- Minimizing Time to Integrate
- Experiment Tracking
- Reproducible Deployment
- Testing Validation
- Defining Requirements
- Experiment Tracking Module
- Pipeline Packaging Module
- Testing Automation Module
- Implementation Patterns
- Programmable Tracking Pattern
- Reproducible Project Pattern
- Summary
- 14. A/B Testing Service
- Journey Map
- Minimizing Time to A/B Test
- Experiment Design
- Execution at Scale
- Experiment Optimization
- Implementation Patterns
- Experiment Specification Pattern
- Metrics Definition Pattern
- Automated Experiment Optimization
- Summary
- IV. Self-Service Operationalize
- 15. Query Optimization Service
- Journey Map
- Avoiding Cluster Clogs
- Resolving Runtime Query Issues
- Speeding Up Applications
- Journey Map
- Minimizing Time to Optimize
- Aggregating Statistics
- Analyzing Statistics
- Optimizing Jobs
- Defining Requirements
- Current Pain Points Questionnaire
- Interop Requirements
- Functionality Requirements
- Nonfunctional Requirements
- Implementation Patterns
- Avoidance Pattern
- Operational Insights Pattern
- Automated Tuning Pattern
- Summary
- 16. Pipeline Orchestration Service
- Journey Map
- Invoke Exploratory Pipelines
- Run SLA-Bound Pipelines
- Journey Map
- Minimizing Time to Orchestrate
- Defining Job Dependencies
- Distributed Execution
- Production Monitoring
- Defining Requirements
- Current Pain Points Questionnaire
- Operational Requirements
- Functional Requirements
- Nonfunctional Requirements
- Implementation Patterns
- Dependency Authoring Patterns
- Orchestration Observability Patterns
- Distributed Execution Pattern
- Summary
- 17. Model Deploy Service
- Journey Map
- Model Deployment in Production
- Model Maintenance and Upgrade
- Journey Map
- Minimizing Time to Deploy
- Deployment Orchestration
- Performance Scaling
- Drift Monitoring
- Defining Requirements
- Orchestration
- Deployment endpoints
- Model formats
- Model deployment scenarios
- Orchestration
- Model Scaling and Performance
- Drift Verification
- Nonfunctional Requirements
- Implementation Patterns
- Universal Deployment Pattern
- Autoscaling Deployment Pattern
- Model Drift Tracking Pattern
- Summary
- 18. Quality Observability Service
- Journey Map
- Daily Data Quality Monitoring Reports
- Debugging Quality Issues
- Handling Low-Quality Data Records
- Journey Map
- Minimizing Time to Insight Quality
- Verify the Accuracy of the Data
- Detect Quality Anomalies
- Prevent Data Quality Issues
- Defining Requirements
- Detection and Handling Data Quality Issues
- Functional Requirements
- Nonfunctional Requirements
- Implementation Patterns
- Accuracy Models Pattern
- Profiling-Based Anomaly Detection Pattern
- Avoidance Pattern
- Summary
- 19. Cost Management Service
- Journey Map
- Monitoring Cost Usage
- Continuous Cost Optimization
- Journey Map
- Minimizing Time to Optimize Cost
- Expenditure Observability
- Matching Supply and Demand
- Continuous Cost Optimization
- Defining Requirements
- Pain Points Questionnaire
- Functional Requirements
- Nonfunctional Requirements
- Implementation Patterns
- Continuous Cost Monitoring Pattern
- Automated Scaling Pattern
- Cost Advisor Pattern
- Summary
- Index
O'Reilly Media - inne książki
-
ActivityPub is the new standard for connecting social networks together on the social web. This open, decentralized social networking protocol defines an API for sharing activities to a social network and a procedure that servers use to distribute those activities to a subscriber's feed. With thi...(140.79 zł najniższa cena z 30 dni)
140.58 zł
179.00 zł(-21%) -
Get a fascinating and disturbing look into how state and nonstate actors throughout the world use cyber attacks to gain military, political, and economic advantages. In the third edition of this book, cyber warfare researcher Jeffrey Caruso explores the latest advances in cyber espionage and warf...(154.33 zł najniższa cena z 30 dni)
154.28 zł
199.00 zł(-22%) -
Cloud native security isnâ??t a game for individual players. It requires team collaboration with a platform that can help cloud security engineers, developers, and operations people do their best work. Thatâ??s what the cloud native application protection platform (CNAPP) delivers. With...(189.05 zł najniższa cena z 30 dni)
189.00 zł
239.00 zł(-21%) -
AI has acquired startling new language capabilities in just the past few years. Driven by the rapid advances in deep learning, language AI systems are able to write and understand text better than ever before. This trend enables the rise of new features, products, and entire industries. With this...(170.88 zł najniższa cena z 30 dni)
170.68 zł
279.00 zł(-39%) -
With the increasing complexity of modern cloud-based systems, an effective enterprise architecture program is more critical than ever. In this practical book, author Tanu McCabe from Capital One provides proven frameworks and practices to define an effective enterprise architecture strategy—...(126.98 zł najniższa cena z 30 dni)
126.48 zł
209.00 zł(-39%) -
As data continues to grow and become more complex, organizations seek innovative solutions to manage their data effectively. Data mesh is one solution that provides a new approach to managing data in complex organizations. This practical guide offers step-by-step guidance on how to implement data...(171.09 zł najniższa cena z 30 dni)
171.03 zł
279.00 zł(-39%) -
Large language models (LLMs) are not just shaping the trajectory of AI, they're also unveiling a new era of security challenges. This practical book takes you straight to the heart of these threats. Author Steve Wilson, chief product officer at Exabeam, focuses exclusively on LLMs, eschewing gene...(171.17 zł najniższa cena z 30 dni)
171.07 zł
279.00 zł(-39%) -
The sheer volume of business data has reached an all-time high. Using visualizations to transform this data into useful and understandable information can facilitate better decision-making. This practical book shows data analysts as well as professionals in finance, sales, and marketing how to qu...(126.78 zł najniższa cena z 30 dni)
126.58 zł
209.00 zł(-39%) -
What will you learn from this book?The new edition of this brain-friendly guide takes you through a comprehensive journey into modern JavaScript, covering everything from core language fundamentals to today's cutting-edge features. You'll dive into the nuances of JavaScript types and the unparall...(198.68 zł najniższa cena z 30 dni)
198.63 zł
249.00 zł(-20%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: The Self-Service Data Roadmap Sandeep Uttamchandani (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.