Learning and Operating Presto
- Autorzy:
- Angelica Lo Duca, Tim Meehan, Vivek Bharathan
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 194
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Learning and Operating Presto
The Presto community has mushroomed since its origins at Facebook in 2012. But ramping up this open source distributed SQL query engine can be challenging even for the most experienced engineers. With this practical book, data engineers and architects, platform engineers, cloud engineers, and software engineers will learn how to use Presto operations at your organization to derive insights on datasets wherever they reside.
Authors Angelica Lo Duca, Tim Meehan, Vivek Bharathan, and Ying Su explain what Presto is, where it came from, and how it differs from other data warehousing solutions. You'll discover why Facebook, Uber, Alibaba Cloud, Hewlett Packard Enterprise, IBM, Intel, and many more use Presto and how you can quickly deploy Presto in production.
With this book, you will:
- Learn how to install and configure Presto
- Use Presto with business intelligence tools
- Understand how to connect Presto to a variety of data sources
- Extend Presto for real-time business insight
- Learn how to apply best practices and tuning
- Get troubleshooting tips for logs, error messages, and more
- Explore Presto's architectural concepts and usage patterns
- Understand Presto security and administration
Wybrane bestsellery
-
This book will show you how to use Comet to enhance your organization’s data science projects. It offers detailed explanations of concepts, practical use cases, and best practices for managing every aspect of your data science project through Comet, from data exploration to model deploymen...
-
W świecie przepełnionym informacjami doskonała baza danych, która pozwala na ich zbieranie, organizowanie i zarządzanie nimi, to podstawa sprawnego funkcjonowania każdego przedsiębiorstwa. W tej branży od lat prym wiedzie relacyjna baza danych Oracle. Jednak aby efektywnie korzystać z jej dobrodz...(39.59 zł najniższa cena z 30 dni)
69.30 zł
99.00 zł(-30%) -
Jeśli myślisz o karierze analityka danych albo starasz się o pracę na stanowisku, na którym będziesz analizować dane, ten kurs jest specjalnie dla Ciebie. Opanujesz dzięki niemu między innymi niezbędne podstawy języka SQL i dowiesz się, jak funkcjonuje i do czego może Ci posłużyć system zarządzan...(99.59 zł najniższa cena z 30 dni)
174.30 zł
249.00 zł(-30%) -
Ludzkość od zarania dziejów miała potrzebę zapisywania i porządkowania danych – pierwsze tabliczki gliniane z zapisanymi informacjami handlowymi pochodzą z 3500 roku p.n.e. Na przestrzeni wieków pojawiło się wiele technik gromadzenia danych, jednak dopiero wraz z rozwojem technologii komput...(41.65 zł najniższa cena z 30 dni)
71.40 zł
119.00 zł(-40%) -
Firmy z branży IT prześcigają się w tworzeniu rozwiązań zwiększających wydajność pracy, jak również podnoszących poziom specjalizacji pracowników w określonych dziedzinach. Od kilku już lat pozycja full stack developera, który wykonywał wszystkie prace programistyczne, jest wielką rzadkością. Obe...(63.60 zł najniższa cena z 30 dni)
55.65 zł
159.00 zł(-65%) -
With the shift from data warehouses to data lakes, data now lands in repositories before it's been transformed, enabling engineers to model raw data into clean, well-defined datasets. dbt (data build tool) helps you take data further. This practical book shows data analysts, data engineers, BI de...(188.08 zł najniższa cena z 30 dni)
188.03 zł
239.00 zł(-21%) -
If you were handed two different but related sets of data, what tools would you use to find the matches? What if all you had was SQL SELECT access to a database? In this practical book, author Jim Lehmer provides best practices, techniques, and tricks to help you import, clean, match, score, and ...(160.99 zł najniższa cena z 30 dni)
160.49 zł
209.00 zł(-23%) -
To help you on the path to becoming a Snowflake pro, this concise yet comprehensive guide reviews fundamentals and best practices for Snowflake's SQL and Scripting languages. Developers and data professionals will learn how to generate, modify, and query data in the Snowflake relational database ...(231.09 zł najniższa cena z 30 dni)
230.88 zł
279.00 zł(-17%) -
Ta książka stanowi świetne wprowadzenie do analizy danych. Dzięki niej nauczysz się korzystać z surowych danych, nawet jeśli nie masz odpowiedniego doświadczenia. Zaczniesz od formułowania hipotez i generowania statystyk opisowych, a następnie przystąpisz do pisania zapytań w języku SQL w celu ag...(65.40 zł najniższa cena z 30 dni)
65.40 zł
109.00 zł(-40%) -
Dzięki tej książce nauka zarządzania relacyjną bazą danych staje się łatwiejsza. Szczególnie docenią ją czytelnicy myślący o zmianie kariery zawodowej i rozpoczęciu pracy z obsługą danych. Opisano tu przede wszystkim podstawowe narzędzia SQL potrzebne do zrozumienia i wyodrębnienia przydatnych in...(35.40 zł najniższa cena z 30 dni)
35.40 zł
59.00 zł(-40%)
O autorze ebooka
Ebooka "Learning and Operating Presto" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Learning and Operating Presto" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Learning and Operating Presto" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-10-981-4181-3, 9781098141813
- Data wydania ebooka:
- 2023-09-20 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 5.6MB
- Rozmiar pliku Mobi:
- 5.6MB
Spis treści ebooka
- Preface
- Why We Wrote This Book
- Who This Book Is For
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- Angelica Lo Duca
- Tim Meehan
- Vivek Bharathan
- Ying Su
- 1. Introduction to Presto
- Data Warehouses and Data Lakes
- The Role of Presto in a Data Lake
- Presto Origins and Design Considerations
- High Performance
- High Scalability
- Compliance with the ANSI SQL Standard
- Federation of Data Sources
- Running in the Cloud
- Presto Architecture and Core Components
- Alternatives to Presto
- Apache Impala
- Apache Hive
- Spark SQL
- Trino
- Presto Use Cases
- Reporting and Dashboarding
- Ad Hoc Querying
- ETL Using SQL
- Data Lakehouse
- Real-Time Analytics with Real-Time Databases
- Introducing Our Case Study
- Conclusion
- 2. Getting Started with Presto
- Presto Manual Installation
- Running Presto on Docker
- Installing Docker
- Presto Docker Image
- Dockerfile
- The etc/ directory
- node.properties
- jvm.config
- config.properties
- log.properties
- catalog/<connector>.properties
- Building and Running Presto on Docker
- The Presto Sandbox
- Deploying Presto on Kubernetes
- Introducing Kubernetes
- Configuring Presto on Kubernetes
- presto-coordinator.yaml
- presto-workers.yaml
- presto-config-map.yaml
- presto-secrets.yaml
- Adding a New Catalog
- Running the Deployment on Kubernetes
- Querying Your Presto Instance
- Listing Catalogs
- Listing Schemas
- Listing Tables
- Querying a Table
- Conclusion
- 3. Connectors
- Service Provider Interface
- Connector Architecture
- Popular Connectors
- Thrift
- Writing a Custom Connector
- Prerequisites
- Plugin and Module
- ExamplePlugin
- ExampleConnectorFactory
- ExampleModule
- ExampleConnector
- ExampleHandleResolver
- Configuration
- ExampleConfig
- SessionProperties
- TableProperties
- Metadata
- Data model
- Handles
- ExampleMetadata
- ExampleClient
- Input/Output
- ExampleSplitManager
- ExampleSplit
- ExampleRecordSetProvider and ExampleRecordSet
- ExampleRecordCursor
- Deploying Your Connector
- Apache Pinot
- Setting Up and Configuring Presto
- Setting up Pinot
- Configuring Pinot
- Configuring Presto with Pinot
- Setting Up and Configuring Presto
- Presto-Pinot Querying in Action
- Conclusion
- 4. Client Connectivity
- Setting Up the Environment
- Presto Client
- Docker Image
- Kubernetes Node
- Setting Up the Environment
- Connectivity to Presto
- REST API
- Python
- R
- JDBC
- Node.js
- ODBC
- Other Presto Client Libraries
- Building a Client Dashboard in Python
- Setting Up the Client
- Building the Dashboard
- Connecting to and querying Presto
- Preparing the results of the query
- Building the first graph
- Building the second graph
- Conclusion
- 5. Open Data Lakehouse Analytics
- The Emergence of the Lakehouse
- Data Lakehouse Architecture
- Data Lake
- File Store
- File Format
- Table Format
- Query Engine
- Metadata Management
- Data Governance
- Data Access Control
- Building a Data Lakehouse
- Configuring MinIO
- Populating MinIO
- Configuring MinIO
- Configuring HMS
- Configuring Spark
- Registering Hudi Tables with HMS
- Connecting and Querying Presto
- Conclusion
- 6. Presto Administration
- Introducing Presto Administration
- Configuration
- Properties
- How to configure a cluster
- Properties
- Sessions
- Using sessions
- JVM
- Memory
- Out-of-memory errors
- Garbage collection
- Monitoring
- Console
- Using the console for monitoring
- Using the console for debugging
- Using the console for going over the interactive plan
- Console
- REST API
- Metrics
- JMX connector
- REST API
- JMX exporters
- Management
- Resource Groups
- Configuring resource groups
- Resource groups properties
- Example
- Resource Groups
- Verifiers
- Setting up the system
- Configuring the MySQL database
- Configuring the Presto verifier
- Running a test
- Session Properties Managers
- Configuring a session property manager
- Namespace Functions
- Setting up the system
- Configuring a function
- Running a test
- Conclusion
- 7. Understanding Security in Presto
- Introducing Presto Security
- Building Secure Communication in Presto
- Encryption
- Keystore Management
- Configuring HTTPS/TLS
- Running a Presto client
- Running the Presto console
- Authentication
- File-Based Authentication
- Running a Presto client
- Running the Presto console
- File-Based Authentication
- LDAP
- Kerberos
- Prerequisites
- Configuring the Presto coordinator and workers
- Configuring the Presto client
- Creating a Custom Authenticator
- Authorization
- Authorizing Access to the Presto REST API
- Configuring System Access Control
- Authorization Through Apache Ranger
- Building a custom audit function
- Conclusion
- 8. Performance Tuning
- Introducing Performance Tuning
- Reasons for Performance Tuning
- The Performance Tuning Life Cycle
- Introducing Performance Tuning
- Query Execution Model
- Approaches for Performance Tuning in Presto
- Resource Allocation
- Storage
- Query Optimization
- Aria Scan
- Table Scanning
- Repartitioning
- Implementing Performance Tuning
- Building and Importing the Sample CSV Table in MinIO
- Converting the CSV Table in ORC
- Defining the Tuning Parameters
- Running Tests
- Default parameters
- Reducing CPU usage
- Query optimization
- Aria scan
- Conclusion
- 9. Operating Presto at Scale
- Introducing Scalability
- Reasons to Scale Presto
- Common Issues
- Introducing Scalability
- Design Considerations
- Availability
- Manageability
- Performance
- Protection
- Configuration
- How to Scale Presto
- Multiple Coordinators
- Presto on Spark
- Spilling
- Using a Cloud Service
- Conclusion
- Index
O'Reilly Media - inne książki
-
This concise yet comprehensive guide explains how to adopt a data lakehouse architecture to implement modern data platforms. It reviews the design considerations, challenges, and best practices for implementing a lakehouse and provides key insights into the ways that using a lakehouse can impact ...(193.69 zł najniższa cena z 30 dni)
193.19 zł
249.00 zł(-22%) -
In today's fast-paced world, more and more organizations require rapid application development with reduced development costs and increased productivity. This practical guide shows application developers how to use PowerApps, Microsoft's no-code/low-code application framework that helps developer...(162.47 zł najniższa cena z 30 dni)
162.27 zł
209.00 zł(-22%) -
Welcome to the systems age, where software professionals are no longer building software&emdash;we're building systems of software. Change is continuously deployed across software ecosystems coordinated by responsive infrastructure. In this world of increasing relational complexity, we need t...(152.21 zł najniższa cena z 30 dni)
152.01 zł
209.00 zł(-27%) -
This book provides an ideal guide for Python developers who want to learn how to build applications with large language models. Authors Olivier Caelen and Marie-Alice Blete cover the main features and benefits of GPT-4 and GPT-3.5 models and explain how they work. You'll also get a step-by-step g...(155.41 zł najniższa cena z 30 dni)
155.36 zł
209.00 zł(-26%) -
In today's cloud native world, where we automate as much as possible, everything is code. With this practical guide, you'll learn how Policy as Code (PaC) provides the means to manage the policies, related data, and responses to events that occur within the systems we maintain—Kubernetes, c...(212.59 zł najniższa cena z 30 dni)
212.39 zł
279.00 zł(-24%) -
Geared to intermediate- to advanced-level DBAs and IT professionals looking to enhance their MySQL skills, this guide provides a comprehensive overview on how to manage and optimize MySQL databases. You'll learn how to create databases and implement backup and recovery, security configurations, h...(221.43 zł najniższa cena z 30 dni)
221.33 zł
279.00 zł(-21%) -
Get the details, examples, and best practices you need to build generative AI applications, services, and solutions using the power of Azure OpenAI Service. With this comprehensive guide, Microsoft AI specialist Adrián González Sánchez examines the integration and utilization of Az...(162.23 zł najniższa cena z 30 dni)
162.18 zł
209.00 zł(-22%) -
Despite the increase of high-profile hacks, record-breaking data leaks, and ransomware attacks, many organizations don't have the budget for an information security (InfoSec) program. If you're forced to protect yourself by improvising on the job, this pragmatic guide provides a security-101 hand...(214.77 zł najniższa cena z 30 dni)
214.57 zł
239.00 zł(-10%) -
Keeping up with the Python ecosystem can be daunting. Its developer tooling doesn't provide the out-of-the-box experience native to languages like Rust and Go. When it comes to long-term project maintenance or collaborating with others, every Python project faces the same problem: how to build re...(189.29 zł najniższa cena z 30 dni)
188.79 zł
239.00 zł(-21%) -
Bringing a deep-learning project into production at scale is quite challenging. To successfully scale your project, a foundational understanding of full stack deep learning, including the knowledge that lies at the intersection of hardware, software, data, and algorithms, is required.This book il...(227.19 zł najniższa cena z 30 dni)
227.14 zł
279.00 zł(-19%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Learning and Operating Presto Angelica Lo Duca, Tim Meehan, Vivek Bharathan (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.