Trino: The Definitive Guide. 2nd Edition
- Autorzy:
- Matt Fuller, Manfred Moser, Martin Traverso
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 322
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Trino: The Definitive Guide. 2nd Edition
Perform fast interactive analytics against different data sources using the Trino high-performance distributed SQL query engine. In the second edition of this practical guide, you'll learn how to conduct analytics on data where it lives, whether it's a data lake using Hive, a modern lakehouse with Iceberg or Delta Lake, a different system like Cassandra, Kafka, or SingleStore, or a relational database like PostgreSQL or Oracle.
Analysts, software engineers, and production engineers learn how to manage, use, and even develop with Trino and make it a critical part of their data platform. Authors Matt Fuller, Manfred Moser, and Martin Traverso show you how a single Trino query can combine data from multiple sources to allow for analytics across your entire organization.
- Explore Trino's use cases, and learn about tools that help you connect to Trino for querying and processing huge amounts of data
- Learn Trino's internal workings, including how to connect to and query data sources with support for SQL statements, operators, functions, and more
- Deploy and secure Trino at scale, monitor workloads, tune queries, and connect more applications
- Learn how other organizations apply Trino successfully
Wybrane bestsellery
-
Za pomocą Trino, wysoce wydajnego, rozproszonego silnika zapytań SQL, przeprowadzisz szybkie, interaktywne analizy różnorodnych źródeł danych. W drugim wydaniu tego praktycznego przewodnika dowiesz się, jak analizować dane w miejscu, w którym się znajdują, niezależnie czy jest to jezioro danych o...(55.13 zł najniższa cena z 30 dni)
71.82 zł
79.80 zł(-10%) -
W świecie przepełnionym informacjami doskonała baza danych, która pozwala na ich zbieranie, organizowanie i zarządzanie nimi, to podstawa sprawnego funkcjonowania każdego przedsiębiorstwa. W tej branży od lat prym wiedzie relacyjna baza danych Oracle. Jednak aby efektywnie korzystać z jej dobrodz...(39.59 zł najniższa cena z 30 dni)
69.30 zł
99.00 zł(-30%) -
Jeśli myślisz o karierze analityka danych albo starasz się o pracę na stanowisku, na którym będziesz analizować dane, ten kurs jest specjalnie dla Ciebie. Opanujesz dzięki niemu między innymi niezbędne podstawy języka SQL i dowiesz się, jak funkcjonuje i do czego może Ci posłużyć system zarządzan...(99.59 zł najniższa cena z 30 dni)
174.30 zł
249.00 zł(-30%) -
Ludzkość od zarania dziejów miała potrzebę zapisywania i porządkowania danych – pierwsze tabliczki gliniane z zapisanymi informacjami handlowymi pochodzą z 3500 roku p.n.e. Na przestrzeni wieków pojawiło się wiele technik gromadzenia danych, jednak dopiero wraz z rozwojem technologii komput...(41.65 zł najniższa cena z 30 dni)
71.40 zł
119.00 zł(-40%) -
Firmy z branży IT prześcigają się w tworzeniu rozwiązań zwiększających wydajność pracy, jak również podnoszących poziom specjalizacji pracowników w określonych dziedzinach. Od kilku już lat pozycja full stack developera, który wykonywał wszystkie prace programistyczne, jest wielką rzadkością. Obe...(63.60 zł najniższa cena z 30 dni)
55.65 zł
159.00 zł(-65%) -
With the shift from data warehouses to data lakes, data now lands in repositories before it's been transformed, enabling engineers to model raw data into clean, well-defined datasets. dbt (data build tool) helps you take data further. This practical book shows data analysts, data engineers, BI de...(188.08 zł najniższa cena z 30 dni)
188.03 zł
239.00 zł(-21%) -
If you were handed two different but related sets of data, what tools would you use to find the matches? What if all you had was SQL SELECT access to a database? In this practical book, author Jim Lehmer provides best practices, techniques, and tricks to help you import, clean, match, score, and ...(160.99 zł najniższa cena z 30 dni)
160.49 zł
209.00 zł(-23%) -
To help you on the path to becoming a Snowflake pro, this concise yet comprehensive guide reviews fundamentals and best practices for Snowflake's SQL and Scripting languages. Developers and data professionals will learn how to generate, modify, and query data in the Snowflake relational database ...(231.09 zł najniższa cena z 30 dni)
230.88 zł
279.00 zł(-17%) -
The Presto community has mushroomed since its origins at Facebook in 2012. But ramping up this open source distributed SQL query engine can be challenging even for the most experienced engineers. With this practical book, data engineers and architects, platform engineers, cloud engineers, and sof...(189.09 zł najniższa cena z 30 dni)
188.88 zł
239.00 zł(-21%)
Ebooka "Trino: The Definitive Guide. 2nd Edition" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Trino: The Definitive Guide. 2nd Edition" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Trino: The Definitive Guide. 2nd Edition" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-10-981-3719-9, 9781098137199
- Data wydania ebooka:
- 2022-10-03 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 4.6MB
- Rozmiar pliku Mobi:
- 11.5MB
Spis treści ebooka
- Foreword
- Preface
- Conventions Used in This Book
- Code Examples, Permissions, and Attribution
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- I. Getting Started with Trino
- 1. Introducing Trino
- The Problems with Big Data
- Trino to the Rescue
- Designed for Performance and Scale
- SQL-on-Anything
- Separation of Data Storage and Query Compute Resources
- Trino Use Cases
- One SQL Analytics Access Point
- Access Point to Data Warehouse and Source Systems
- Provide SQL-Based Access to Anything
- Federated Queries
- Semantic Layer for a Virtual Data Warehouse
- Data Lake Query Engine
- SQL Conversions and ETL
- Better Insights Due to Faster Response Times
- Big Data, Machine Learning, and Artificial Intelligence
- Other Use Cases
- Trino Resources
- Website
- Documentation
- Community Chat
- Source Code, License, and Version
- Contributing
- Book Repository
- Iris Data Set
- Flight Data Set
- A Brief History of Trino
- Conclusion
- 2. Installing and Configuring Trino
- Trying Trino with the Docker Container
- Installing from the Archive File
- Java Virtual Machine
- Python
- Installation
- Configuration
- Adding a Data Source
- Running Trino
- Conclusion
- 3. Using Trino
- Trino Command-Line Interface
- Getting Started
- Pagination
- History and Completion
- Additional Diagnostics
- Executing Queries
- Output Formats
- Ignoring Errors
- Trino Command-Line Interface
- Trino JDBC Driver
- Downloading and Registering the Driver
- Establishing a Connection to Trino
- Trino and ODBC
- Client Libraries
- Trino Web UI
- SQL with Trino
- Concepts
- First Examples
- Conclusion
- II. Diving Deeper into Trino
- 4. Trino Architecture
- Coordinator and Workers in a Cluster
- Coordinator
- Discovery Service
- Workers
- Coordinator and Workers in a Cluster
- Connector-Based Architecture
- Catalogs, Schemas, and Tables
- Query Execution Model
- Query Planning
- Parsing and Analysis
- Initial Query Planning
- Optimization Rules
- Predicate Pushdown
- Cross Join Elimination
- TopN
- Partial Aggregations
- Implementation Rules
- Lateral Join Decorrelation
- Semi-Join (IN) Decorrelation
- Cost-Based Optimizer
- The Cost Concept
- Cost of the Join
- Table Statistics
- Filter Statistics
- Table Statistics for Partitioned Tables
- Join Enumeration
- Broadcast Versus Distributed Joins
- Broadcast join strategy
- Distributed join strategy
- Working with Table Statistics
- Trino ANALYZE
- Gathering Statistics When Writing to Disk
- Hive ANALYZE
- Displaying Table Statistics
- Conclusion
- 5. Production-Ready Deployment
- Configuration Details
- Server Configuration
- Logging
- Node Configuration
- JVM Configuration
- Launcher
- Cluster Installation
- RPM Installation
- Installation Directory Structure
- Configuration
- Uninstall Trino
- Installation in the Cloud
- Helm Chart for Kubernetes Deployment
- Cluster Sizing Considerations
- Conclusion
- 6. Connectors
- Configuration
- RDBMS Connector Example: PostgreSQL
- Query Pushdown
- Parallelism and Concurrency
- Other RDBMS Connectors
- Security
- Query Pass-Through
- Trino TPC-H and TPC-DS Connectors
- Hive Connector for Distributed Storage Data Sources
- Apache Hadoop and Hive
- Hive Connector
- Hive-Style Table Format
- Managed and External Tables
- Partitioned Data
- Loading Data
- File Formats and Compression
- MinIO Example
- Modern Distributed Storage Management and Analytics
- Non-Relational Data Sources
- Trino JMX Connector
- Black Hole Connector
- Memory Connector
- Other Connectors
- Conclusion
- 7. Advanced Connector Examples
- Connecting to HBase with Phoenix
- Key-Value Store Connector Example: Accumulo
- Using the Trino Accumulo Connector
- Predicate Pushdown in Accumulo
- Apache Cassandra Connector
- Streaming System Connector Example: Kafka
- Document Store Connector Example: Elasticsearch
- Overview
- Configuration and Usage
- Query Processing
- Full-Text Search
- Summary
- Query Federation in Trino
- Extract, Transform, Load and Federated Queries
- Conclusion
- 8. Using SQL in Trino
- Trino Statements
- Trino System Tables
- Catalogs
- Schemas
- Information Schema
- Tables
- Table and Column Properties
- Copying an Existing Table
- Creating a New Table from Query Results
- Modifying a Table
- Deleting a Table
- Table Limitations from Connectors
- Views
- Session Information and Configuration
- Data Types
- Collection Data Types
- Temporal Data Types
- Time zones
- Intervals
- Type Casting
- SELECT Statement Basics
- WHERE Clause
- GROUP BY and HAVING Clauses
- ORDER BY and LIMIT Clauses
- JOIN Statements
- UNION, INTERSECT, and EXCEPT Clauses
- Grouping Operations
- WITH Clause
- Subqueries
- Scalar Subquery
- EXISTS Subquery
- Quantified Subquery
- Deleting Data from a Table
- Conclusion
- 9. Advanced SQL
- Functions and Operators Introduction
- Scalar Functions and Operators
- Boolean Operators
- Logical Operators
- Range Selection with the BETWEEN Statement
- Value Detection with IS (NOT) NULL
- Mathematical Functions and Operators
- Trigonometric Functions
- Constant and Random Functions
- String Functions and Operators
- Strings and Maps
- Unicode
- Regular Expressions
- Unnesting Complex Data Types
- JSON Functions
- Date and Time Functions and Operators
- Histograms
- Aggregate Functions
- Map Aggregate Functions
- Approximate Aggregate Functions
- Window Functions
- Lambda Expressions
- Geospatial Functions
- Prepared Statements
- Conclusion
- III. Trino in Real-World Uses
- 10. Security
- Authentication
- Password and LDAP Authentication
- Other Authentication Types
- Authentication
- Authorization
- System Access Control
- Connector Access Control
- Encryption
- Encrypting Trino Client-to-Coordinator Communication
- Creating Java Keystores and Java Truststores
- Encrypting Communication Within the Trino Cluster
- Certificate Authority Versus Self-Signed Certificates
- Certificate Authentication
- Kerberos
- Prerequisites
- Kerberos Client Authentication
- Data Source Access and Configuration for Security
- Kerberos Authentication with the Hive Connector
- Hive Metastore Service Authentication
- HDFS Authentication
- Cluster Separation
- Conclusion
- 11. Integrating Trino with Other Tools
- Queries, Visualizations, and More with Apache Superset
- Performance Improvements with RubiX
- Workflows with Apache Airflow
- Embedded Trino Example: Amazon Athena
- Convenient Commercial Distributions: Starburst Enterprise and Starburst Galaxy
- Other Integration Examples
- Custom Integrations
- Conclusion
- 12. Trino in Production
- Monitoring with the Trino Web UI
- Cluster-Level Details
- Query List
- Query Details View
- Overview
- Live Plan
- Stage Performance
- Splits
- JSON
- Monitoring with the Trino Web UI
- Tuning Trino SQL Queries
- Memory Management
- Task Concurrency
- Worker Scheduling
- Network Data Exchange
- Concurrency
- Buffer Sizes
- Tuning Java Virtual Machine
- Resource Groups
- Resource Group Definition
- Scheduling Policy
- Selector Rules Definition
- Conclusion
- 13. Real-World Examples
- Deployment and Runtime Platforms
- Cluster Sizing
- Hadoop/Hive Migration Use Case
- Other Data Sources
- Users and Traffic
- Conclusion
- Conclusion
- Index
O'Reilly Media - inne książki
-
This concise yet comprehensive guide explains how to adopt a data lakehouse architecture to implement modern data platforms. It reviews the design considerations, challenges, and best practices for implementing a lakehouse and provides key insights into the ways that using a lakehouse can impact ...(193.69 zł najniższa cena z 30 dni)
193.19 zł
249.00 zł(-22%) -
In today's fast-paced world, more and more organizations require rapid application development with reduced development costs and increased productivity. This practical guide shows application developers how to use PowerApps, Microsoft's no-code/low-code application framework that helps developer...(162.47 zł najniższa cena z 30 dni)
162.27 zł
209.00 zł(-22%) -
Welcome to the systems age, where software professionals are no longer building software&emdash;we're building systems of software. Change is continuously deployed across software ecosystems coordinated by responsive infrastructure. In this world of increasing relational complexity, we need t...(152.21 zł najniższa cena z 30 dni)
152.01 zł
209.00 zł(-27%) -
This book provides an ideal guide for Python developers who want to learn how to build applications with large language models. Authors Olivier Caelen and Marie-Alice Blete cover the main features and benefits of GPT-4 and GPT-3.5 models and explain how they work. You'll also get a step-by-step g...(155.41 zł najniższa cena z 30 dni)
155.36 zł
209.00 zł(-26%) -
In today's cloud native world, where we automate as much as possible, everything is code. With this practical guide, you'll learn how Policy as Code (PaC) provides the means to manage the policies, related data, and responses to events that occur within the systems we maintain—Kubernetes, c...(212.59 zł najniższa cena z 30 dni)
212.39 zł
279.00 zł(-24%) -
Geared to intermediate- to advanced-level DBAs and IT professionals looking to enhance their MySQL skills, this guide provides a comprehensive overview on how to manage and optimize MySQL databases. You'll learn how to create databases and implement backup and recovery, security configurations, h...(221.43 zł najniższa cena z 30 dni)
221.33 zł
279.00 zł(-21%) -
Get the details, examples, and best practices you need to build generative AI applications, services, and solutions using the power of Azure OpenAI Service. With this comprehensive guide, Microsoft AI specialist Adrián González Sánchez examines the integration and utilization of Az...(162.23 zł najniższa cena z 30 dni)
162.18 zł
209.00 zł(-22%) -
Despite the increase of high-profile hacks, record-breaking data leaks, and ransomware attacks, many organizations don't have the budget for an information security (InfoSec) program. If you're forced to protect yourself by improvising on the job, this pragmatic guide provides a security-101 hand...(214.77 zł najniższa cena z 30 dni)
214.57 zł
239.00 zł(-10%) -
Keeping up with the Python ecosystem can be daunting. Its developer tooling doesn't provide the out-of-the-box experience native to languages like Rust and Go. When it comes to long-term project maintenance or collaborating with others, every Python project faces the same problem: how to build re...(189.29 zł najniższa cena z 30 dni)
188.79 zł
239.00 zł(-21%) -
Bringing a deep-learning project into production at scale is quite challenging. To successfully scale your project, a foundational understanding of full stack deep learning, including the knowledge that lies at the intersection of hardware, software, data, and algorithms, is required.This book il...(227.19 zł najniższa cena z 30 dni)
227.14 zł
279.00 zł(-19%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Trino: The Definitive Guide. 2nd Edition Matt Fuller, Manfred Moser, Martin Traverso (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.