Amazon Redshift: The Definitive Guide
- Autorzy: :
- Rajesh Francis, Rajiv Gupta, Milind Oke
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 464
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Amazon Redshift: The Definitive Guide
Amazon Redshift powers analytic cloud data warehouses worldwide, from startups to some of the largest enterprise data warehouses available today. This practical guide thoroughly examines this managed service and demonstrates how you can use it to extract value from your data immediately, rather than go through the heavy lifting required to run a typical data warehouse.
Analytic specialists Rajesh Francis, Rajiv Gupta, and Milind Oke detail Amazon Redshift's underlying mechanisms and options to help you explore out-of-the box automation. Whether you're a data engineer who wants to learn the art of the possible or a DBA looking to take advantage of machine learning-based auto-tuning, this book helps you get the most value from Amazon Redshift.
By understanding Amazon Redshift features, you'll achieve excellent analytic performance at the best price, with the least effort. This book helps you:
- Build a cloud data strategy around Amazon Redshift as foundational data warehouse
- Get started with Amazon Redshift with simple-to-use data models and design best practices
- Understand how and when to use Redshift Serverless and Redshift provisioned clusters
- Take advantage of auto-tuning options inherent in Amazon Redshift and understand manual tuning options
- Transform your data platform for predictive analytics using Redshift ML and break silos using data sharing
- Learn best practices for security, monitoring, resilience, and disaster recovery
- Leverage Amazon Redshift integration with other AWS services to unlock additional value
Wybrane bestsellery
-
Tę książkę docenią w szczególności analitycy danych. Wyjaśniono w niej potencjał wnioskowania przyczynowego w zakresie szacowania wpływu i efektów w biznesie. Opisano klasyczne metody wnioskowania przyczynowego, w tym testy A/B, regresja liniowa, wskaźnik skłonności, metoda syntetycznej kontroli ...(48.69 zł najniższa cena z 30 dni)
48.69 zł
74.90 zł(-35%) -
Oddajemy w Państwa ręce kompendium wiedzy, które stanowi nieocenione źródło informacji dla wszystkich zainteresowanych zgłębianiem tajników uczenia maszynowego i głębokiego uczenia. Ta obszerna publikacja, licząca ponad 800 stron, jest prawdziwą skarbnicą wiedzy teoretycznej i praktycznej, staran...
-
Statystyka to dziedzina wiedzy, która bazuje na danych – przedmiotem jej zainteresowania są metody ich pozyskiwania i prezentacji, a przede wszystkim analizy. W ostatnich latach mocno zyskuje na popularności i dziś niemal każda uczelnia w Polsce oferuje możliwość studiowania na kierunku zwi...(51.60 zł najniższa cena z 30 dni)
77.40 zł
129.00 zł(-40%) -
Biznes nie istnieje bez twardych danych, założeń, KPI i ich realizacji. Także ta jego część, która jest związana z promocją. Szczególnie online. Dziś nie można być marketerem z prawdziwego zdarzenia i nie znać chociażby narzędzi oferowanych przez Google ― Analytics, Tag Manager, Search Cons...(37.05 zł najniższa cena z 30 dni)
37.05 zł
57.00 zł(-35%) -
Autorzy, Joe Reis i Matt Housley, przeprowadzą Cię przez cykl życia inżynierii danych i pokażą, jak połączyć różne technologie chmurowe, aby spełnić potrzeby konsumentów danych w dolnej części strumienia przetwarzania. Dzięki lekturze tej książki dowiesz się, jak zastosować koncepcje generowania,...(77.35 zł najniższa cena z 30 dni)
77.35 zł
119.00 zł(-35%) -
W złożonej rzeczywistości myślenie systemowe jest kluczowym narzędziem pozwalającym odnieść się do licznych wyzwań: gospodarczych, ekologicznych, politycznych czy społecznych. Tylko w ten sposób w codziennych wiadomościach można dostrzec przejawy trendów, a w trendach — przeja...(32.43 zł najniższa cena z 30 dni)
32.43 zł
49.90 zł(-35%) -
W tym przewodniku opisano zagadnienia związane z podstawami nauki o danych. Wyjaśniono niezbędne elementy matematyki i statystyki. Przedstawiono także techniki budowy potrzebnych narzędzi i sposoby działania najistotniejszych algorytmów. Książka została skonstruowana tak, aby poszczególne impleme...(51.35 zł najniższa cena z 30 dni)
51.35 zł
79.00 zł(-35%) -
Posiadanie zbiorów danych to połowa sukcesu. Druga połowa to umiejętność ich skutecznej analizy i wyciągania wniosków! Dopiero na tej podstawie będziesz w stanie właściwie ocenić kondycję Twojej firmy oraz podjąć słuszne decyzje. Wiedza zawarta w tej książce może zadecydować o sukcesie biznesowym...(51.35 zł najniższa cena z 30 dni)
51.35 zł
79.00 zł(-35%)
Ebooka "Amazon Redshift: The Definitive Guide" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Amazon Redshift: The Definitive Guide" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Amazon Redshift: The Definitive Guide" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-10-981-3526-3, 9781098135263
- Data wydania ebooka:
- 2023-10-03 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 24.1MB
- Rozmiar pliku Mobi:
- 64.3MB
Spis treści ebooka
- Foreword
- Preface
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- 1. AWS for Data
- Data-Driven Organizations
- Business Use Cases
- New Business Use Cases with Generative AI
- Data-Driven Organizations
- Modern Data Strategy
- Comprehensive Set of Capabilities
- Integrated Set of Tools
- End-to-End Data Governance
- Modern Data Architecture
- Role of Amazon Redshift in a Modern Data Architecture
- Real-World Benefits of Adopting a Modern Data Architecture
- Reference Architecture for Modern Data Architecture
- Data Sourcing
- Extract, Transform, and Load
- Storage
- Storage in the data warehouse
- Storage in the data lake
- Analysis
- Comparing transactional databases, data warehouses, and data lakes
- Data Mesh and Data Fabric
- Data Mesh
- Data Fabric
- Summary
- 2. Getting Started with Amazon Redshift
- Amazon Redshift Architecture Overview
- Get Started with Amazon Redshift Serverless
- Creating an Amazon Redshift Serverless Data Warehouse
- Sample Data
- Activate Sample Data Models and Query Using the Query Editor
- When to Use a Provisioned Cluster?
- Creating an Amazon Redshift Provisioned Cluster
- Estimate Your Amazon Redshift Cost
- Amazon Redshift Managed Storage
- Amazon Redshift Serverless Compute Cost
- Setting a different value for the base capacity
- High/frequent usage
- Amazon Redshift Provisioned Compute Cost
- AWS Account Management
- Connecting to Your Amazon Redshift Data Warehouse
- Private/Public VPC and Secure Access
- Stored Password
- Temporary Credentials
- Federated User
- SAML-Based Authentication from an Identity Provider
- Native IdP Integration
- Amazon Redshift Data API
- Querying a Database Using the Query Editor V2
- Federated user
- Temporary credentials
- Database username and password
- AWS Secrets Manager
- Business Intelligence Using Amazon QuickSight
- Connecting to Amazon Redshift Using JDBC/ODBC
- Summary
- 3. Setting Up Your Data Models
and Ingesting Data
- Data Lake First Versus Data Warehouse First Strategy
- Data Lake First Strategy
- Data Warehouse First Strategy
- Deciding On a Strategy
- Data Lake First Versus Data Warehouse First Strategy
- Defining Your Data Model
- Database Schemas, Users, and Groups
- Star Schema, Denormalized, Normalized
- Student Information Learning Analytics Dataset
- Create Data Models for Student Information Learning Analytics Dataset
- Load Batch Data into Amazon Redshift
- Using the COPY Command
- Ingest Data for the Student Learning Analytics Dataset
- Building a Star Schema
- Continuous File Ingestion from Amazon S3
- Using AWS Glue for Transformations
- Manual Loading Using SQL Commands
- Using the Query Editor V2
- Load Real-Time and Near Real-Time Data
- Near Real-Time Replication Using AWS Database Migration Service
- Amazon Aurora Zero-ETL Integration with Amazon Redshift
- Using Amazon AppFlow
- Streaming Ingestion
- Steps to get started with streaming ingestion
- Important considerations and best practices
- Optimize Your Data Structures
- Automatic Table Optimization and Autonomics
- Distribution Style
- Sort Key
- Compression Encoding
- Summary
- 4. Data Transformation Strategies
- Comparing ELT and ETL Strategies
- In-Database Transformation
- Semistructured Data
- User-Defined Functions
- Stored Procedures
- Scheduling and Orchestration
- Access All Your Data
- External Amazon S3 Data
- External Operational Data
- External Amazon Redshift Data
- External Transformation
- AWS Glue
- Register Amazon Redshift target connection
- Build and run your AWS Glue job
- AWS Glue
- Summary
- 5. Scaling and Performance Optimizations
- Scale Storage
- Autoscale Your Serverless Data Warehouse
- Scale Your Provisioned Data Warehouse
- Evolving Compute Demand
- Predictable workload changes
- Evolving Compute Demand
- Unpredictable Workload Changes
- WLM, Queues, and QMR
- Queue Assignment
- Short Query Acceleration
- Query Monitoring Rules
- Automatic WLM
- Manual WLM
- Parameter Group
- WLM Dynamic Memory Allocation
- Materialized Views
- Autonomics
- Auto Table Optimizer and Smart Defaults
- Auto Vacuum
- Auto Vacuum Sort
- Auto Analyze
- Auto Materialized Views (AutoMV)
- Amazon Redshift Advisor
- Workload Isolation
- Additional Optimizations for Achieving the
Best Price and Performance
- Database Versus Data Warehouse
- Amazon Redshift Serverless
- Multi-Warehouse Environment
- AWS Data Exchange
- Table Design
- Indexes Versus Zone Maps
- Drivers
- Simplify ETL
- Query Editor V2
- Query Tuning
- Query Processing
- Query planning and execution workflow
- Query stages and system tables
- Understanding the query plan
- Factors affecting query performance
- Query Processing
- Analyzing Queries
- Reviewing query alerts
- Analyzing the query plan
- Identifying Queries for Performance Tuning
- Summary
- 6. Amazon Redshift Machine Learning
- Machine Learning Cycle
- Amazon Redshift ML
- Amazon Redshift ML Flexibility
- Getting Started with Amazon Redshift ML
- Machine Learning Techniques
- Supervised Learning Techniques
- Unsupervised Learning Techniques
- Machine Learning Algorithms
- Integration with Amazon SageMaker Autopilot
- Create Model
- Label Probability
- Explain Model
- Using Amazon Redshift ML to Predict Student Outcomes
- Amazon SageMaker Integration with Amazon Redshift
- Integration with Amazon SageMakerBring
Your Own Model (BYOM)
- BYOM Local
- BYOM Remote
- Amazon Redshift ML Costs
- Summary
- 7. Collaboration with Data Sharing
- Amazon Redshift Data Sharing Overview
- Data Sharing Use Cases
- Key Concepts of Data Sharing
- How to Use Data Sharing
- Sharing Data Within the Same Account
- Sharing Data Across Accounts Using Cross-Account Data Sharing
- Analytics as a Service Use Case with Multi-Tenant
Storage Patterns
- Scaling Your Multi-tenant Architecture Using Data Sharing
- Multi-tenant Storage Patterns Using Data Sharing
- Pool model
- Creating database views in the producer
- Creating datashares in producer and granting usage to the consumer
- Using Role-Level Security
- Pool model
- Bridge model
- Creating database schemas and tables in the producer
- Creating datashares in the producer and granting usage to the consumer
- Silo model
- Creating databases and datashares in the producer
- Creating datashares in the producer and granting usage to the consumer
- External Data Sharing with AWS ADX Integration
- Publishing a Data Product
- Subscribing to a Published Data Product
- Considerations When Using AWS Data Exchange for Amazon Redshift
- Query from the Data Lake and Unload to the Data Lake
- Amazon DataZone to Discover and Share Data
- Use Cases for a Data Mesh Architecture with Amazon DataZone
- Key Capabilities and Use Cases for Amazon DataZone
- Amazon DataZone Integrations with Amazon Redshift and Other AWS Services
- Components and Capabilities of Amazon DataZone
- Business data catalog
- Projects
- Data governance and access control
- Data portal
- Getting Started with Amazon DataZone
- Step 1: Create the domain and data portal
- Step 2: Create a producer project
- Step 3: Produce data for publishing in Amazon DataZone
- Step 4: Publish a data product to the catalog
- Step 5: Create a consumer project
- Step 6: Discovering and consuming data in Amazon DataZone
- Step 7: Approve access to a published data asset as a producer
- Step 8: Analyze a published data asset as a consumer
- Security in Amazon DataZone
- Using Lake Formation-based authorization
- Encryption
- Implement least privilege access
- Use IAM roles
- Summary
- 8. Securing and Governing Data
- Object-Level Access Controls
- Object Ownership
- Default Privileges
- Public Schema and Search Path
- Access Controls in Action
- Object-Level Access Controls
- Database Roles
- Database Roles in Action
- Row-Level Security
- Row-Level Security in Action
- Row-Level Security Considerations
- Dynamic Data Masking
- Dynamic Data Masking in Action
- Dynamic Data Masking Considerations
- External Data Access Control
- Associate IAM Roles
- Authorize Assume Role Privileges
- Establish External Schemas
- Lake Formation for Fine-Grained Access Control
- Summary
- 9. Migrating to Amazon Redshift
- Migration Considerations
- Retire Versus Retain
- Migration Data Size
- Platform-Specific Transformations Required
- Data Volatility and Availability Requirements
- Selection of Migration and ETL Tools
- Data Movement Considerations
- Domain Name System (DNS)
- Migration Considerations
- Migration Strategies
- One-Step Migration
- Two-Step Migration
- Initial data migration
- Changed data migration
- Iterative Migration
- Migration Tools and Services
- AWS Schema Conversion Tool
- SCT overview
- SCT migration assessment report
- SCT data extraction agents
- Migrating BLOBs to Amazon Redshift
- AWS Schema Conversion Tool
- Data Warehouse Migration Service
- How AWS DMS works
- DMS replication instances
- DMS replication validation
- AWS Snow Family
- AWS Snow Family key features
- AWS Snow Family devices
- AWS Snowball Edge Client
- Database Migration Process
- Step 1: Convert Schema and Subject Area
- Step 2: Initial Data Extraction and Load
- Step 3: Incremental Load Through Data Capture
- Amazon Redshift Migration Tools Considerations
- Accelerate Your Migration to Amazon Redshift
- Macro Conversion
- Case-Insensitive String Comparison
- Recursive Common Table Expressions
- Proprietary Data Types
- Summary
- 10. Monitoring and Administration
- Amazon Redshift Monitoring Overview
- Monitoring
- Troubleshooting
- Optimization
- Amazon Redshift Monitoring Overview
- Monitoring Using Console
- Monitoring and Administering Serverless
- Query and database monitoring serverless
- Serverless query and database monitoring
- Serverless query monitoring drill-down query
- Serverless query monitoring drill-down query plan
- Serverless query monitoring drill-down related metrics
- Query and database monitoring serverless
- Resource monitoring
- Monitoring and Administering Serverless
- Monitoring Provisioned Data Warehouse Using Console
- Data warehouse performance and resource utilization metrics
- View Performance Data
- CPU utilization
- Percentage disk space used
- Database connections
- Query duration
- Query throughput
- Data warehouse performance and resource utilization metrics
- Query and data ingestion performance metrics: Query Monitoring tab
- Query history at data warehouse level
- Database performance for queries
- Workload concurrency
- Monitoring Queries and Loads Across Clusters
- Monitoring queries and loads
- Monitoring top queries
- Identifying Systemic Query Performance Problems
- Monitoring Using Amazon CloudWatch
- Amazon Redshift CloudWatch Metrics
- Monitoring Using System Tables and Views
- Monitoring Serverless Using System Views
- High Availability and Disaster Recovery
- Recovery Time Objective and Recovery Point Objective Considerations
- Multi-AZ Compared to Single-AZ Deployment
- Creating or Converting a Provisioned Data Warehouse
with Multi-AZ Configuration
- Creating a new data warehouse with Multi-AZ option
- Migrating an existing data warehouse from Single-AZ to Multi-AZ
- Auto Recovery of Multi-AZ Deployment
- Snapshots, Backup, and Restore
- Snapshots for Backup
- Automated Snapshots
- Manual Snapshots
- Disaster Recovery Using Cross-Region Snapshots
- Using Snapshots for Simple-Replay
- Monitoring Amazon Redshift Using CloudTrail
- Bring Your Own Visualization Tool to Monitor
Amazon Redshift
- Monitor Operational Metrics Using System Tables and Amazon QuickSight
- Monitor Operational Metrics Using Grafana Plug-in for Amazon Redshift
- Summary
- Index
O'Reilly Media - inne książki
-
ActivityPub is the new standard for connecting social networks together on the social web. This open, decentralized social networking protocol defines an API for sharing activities to a social network and a procedure that servers use to distribute those activities to a subscriber's feed. With thi...(140.58 zł najniższa cena z 30 dni)
140.37 zł
179.00 zł(-22%) -
Get a fascinating and disturbing look into how state and nonstate actors throughout the world use cyber attacks to gain military, political, and economic advantages. In the third edition of this book, cyber warfare researcher Jeffrey Caruso explores the latest advances in cyber espionage and warf...(154.28 zł najniższa cena z 30 dni)
154.18 zł
199.00 zł(-23%) -
Cloud native security isnâ??t a game for individual players. It requires team collaboration with a platform that can help cloud security engineers, developers, and operations people do their best work. Thatâ??s what the cloud native application protection platform (CNAPP) delivers. With...(189.00 zł najniższa cena z 30 dni)
188.90 zł
239.00 zł(-21%) -
AI has acquired startling new language capabilities in just the past few years. Driven by the rapid advances in deep learning, language AI systems are able to write and understand text better than ever before. This trend enables the rise of new features, products, and entire industries. With this...(170.68 zł najniższa cena z 30 dni)
170.58 zł
279.00 zł(-39%) -
With the increasing complexity of modern cloud-based systems, an effective enterprise architecture program is more critical than ever. In this practical book, author Tanu McCabe from Capital One provides proven frameworks and practices to define an effective enterprise architecture strategy—...(126.48 zł najniższa cena z 30 dni)
126.43 zł
209.00 zł(-40%) -
As data continues to grow and become more complex, organizations seek innovative solutions to manage their data effectively. Data mesh is one solution that provides a new approach to managing data in complex organizations. This practical guide offers step-by-step guidance on how to implement data...(171.03 zł najniższa cena z 30 dni)
170.93 zł
279.00 zł(-39%) -
Large language models (LLMs) are not just shaping the trajectory of AI, they're also unveiling a new era of security challenges. This practical book takes you straight to the heart of these threats. Author Steve Wilson, chief product officer at Exabeam, focuses exclusively on LLMs, eschewing gene...(171.07 zł najniższa cena z 30 dni)
171.02 zł
279.00 zł(-39%) -
The sheer volume of business data has reached an all-time high. Using visualizations to transform this data into useful and understandable information can facilitate better decision-making. This practical book shows data analysts as well as professionals in finance, sales, and marketing how to qu...(126.58 zł najniższa cena z 30 dni)
126.48 zł
209.00 zł(-39%) -
What will you learn from this book?The new edition of this brain-friendly guide takes you through a comprehensive journey into modern JavaScript, covering everything from core language fundamentals to today's cutting-edge features. You'll dive into the nuances of JavaScript types and the unparall...(198.63 zł najniższa cena z 30 dni)
198.12 zł
249.00 zł(-20%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Amazon Redshift: The Definitive Guide Rajesh Francis, Rajiv Gupta, Milind Oke (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.