Learning and Operating Presto
- Autorzy:
- Angelica Lo Duca, Tim Meehan, Vivek Bharathan
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 194
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Learning and Operating Presto
The Presto community has mushroomed since its origins at Facebook in 2012. But ramping up this open source distributed SQL query engine can be challenging even for the most experienced engineers. With this practical book, data engineers and architects, platform engineers, cloud engineers, and software engineers will learn how to use Presto operations at your organization to derive insights on datasets wherever they reside.
Authors Angelica Lo Duca, Tim Meehan, Vivek Bharathan, and Ying Su explain what Presto is, where it came from, and how it differs from other data warehousing solutions. You'll discover why Facebook, Uber, Alibaba Cloud, Hewlett Packard Enterprise, IBM, Intel, and many more use Presto and how you can quickly deploy Presto in production.
With this book, you will:
- Learn how to install and configure Presto
- Use Presto with business intelligence tools
- Understand how to connect Presto to a variety of data sources
- Extend Presto for real-time business insight
- Learn how to apply best practices and tuning
- Get troubleshooting tips for logs, error messages, and more
- Explore Presto's architectural concepts and usage patterns
- Understand Presto security and administration
Wybrane bestsellery
-
This book will show you how to use Comet to enhance your organization’s data science projects. It offers detailed explanations of concepts, practical use cases, and best practices for managing every aspect of your data science project through Comet, from data exploration to model deploymen...
Comet for Data Science. Enhance your ability to manage and optimize the life cycle of your data science project Comet for Data Science. Enhance your ability to manage and optimize the life cycle of your data science project
-
Firmy z branży IT prześcigają się w tworzeniu rozwiązań zwiększających wydajność pracy, jak również podnoszących poziom specjalizacji pracowników w określonych dziedzinach. Od kilku już lat pozycja full stack developera, który wykonywał wszystkie prace programistyczne, jest wielką rzadkością. Obe...
Postman i SQL. Kurs video. Metody testowania REST API i przeszukiwania baz danych Postman i SQL. Kurs video. Metody testowania REST API i przeszukiwania baz danych
(39.90 zł najniższa cena z 30 dni)103.34 zł
159.00 zł(-35%) -
Ta książka stanowi świetne wprowadzenie do analizy danych. Dzięki niej nauczysz się korzystać z surowych danych, nawet jeśli nie masz odpowiedniego doświadczenia. Zaczniesz od formułowania hipotez i generowania statystyk opisowych, a następnie przystąpisz do pisania zapytań w języku SQL w celu ag...
SQL dla analityków danych. Opanuj możliwości SQL-a, aby wydobywać informacje z danych. Wydanie III SQL dla analityków danych. Opanuj możliwości SQL-a, aby wydobywać informacje z danych. Wydanie III
(65.40 zł najniższa cena z 30 dni)70.85 zł
109.00 zł(-35%) -
To trzecie, poprawione i zaktualizowane wydanie praktycznego przewodnika po języku SQL i relacyjnych bazach danych. Przemyślana, uporządkowana struktura podręcznika sprzyja sprawnemu nabywaniu wiedzy i doskonaleniu umiejętności — pracę z nim ułatwiają przystępny sposób prezentowania materia...(41.40 zł najniższa cena z 30 dni)
44.85 zł
69.00 zł(-35%) -
Cathy Tanimura jest analityczką danych z ponad dwudziestoletnim doświadczeniem. Odnosiła również sukcesy, budując zespoły do spraw analizy danych i tworząc potrzebną infrastrukturę. Zajmowała się także zarządzaniem zespołami w kilku czołowych firmach technologicznych. Od wielu lat używa języka SQ...
Analiza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski Analiza danych z wykorzystaniem SQL-a. Zaawansowane techniki przekształcania danych we wnioski
(41.40 zł najniższa cena z 30 dni)44.85 zł
69.00 zł(-35%) -
Dla niewtajemniczonych: QGIS to otwarte, bezpłatne oprogramowanie pozwalające w intuicyjny sposób zarządzać istniejącymi zbiorami geograficznymi dostępnymi w internecie, tworzyć własne dane, wykonywać analizy przestrzenne i - przede wszystkim - publikować ciekawe mapy. Program jest niezwykle pros...(59.40 zł najniższa cena z 30 dni)
64.35 zł
99.00 zł(-35%) -
Jeśli myślisz o karierze analityka danych albo starasz się o pracę na stanowisku, na którym będziesz analizować dane, ten kurs jest specjalnie dla Ciebie. Opanujesz dzięki niemu między innymi niezbędne podstawy języka SQL i dowiesz się, jak funkcjonuje i do czego może Ci posłużyć system zarządzan...
SQL dla analityków danych. Kurs video. Kompleksowe przygotowanie do pracy SQL dla analityków danych. Kurs video. Kompleksowe przygotowanie do pracy
(202.43 zł najniższa cena z 30 dni)112.05 zł
249.00 zł(-55%) -
Ludzkość od zarania dziejów miała potrzebę zapisywania i porządkowania danych – pierwsze tabliczki gliniane z zapisanymi informacjami handlowymi pochodzą z 3500 roku p.n.e. Na przestrzeni wieków pojawiło się wiele technik gromadzenia danych, jednak dopiero wraz z rozwojem technologii komput...
SQL Server. Kurs video. Zarządzanie danymi i bazami danych krok po kroku SQL Server. Kurs video. Zarządzanie danymi i bazami danych krok po kroku
(77.35 zł najniższa cena z 30 dni)59.50 zł
119.00 zł(-50%) -
With the shift from data warehouses to data lakes, data now lands in repositories before it's been transformed, enabling engineers to model raw data into clean, well-defined datasets. dbt (data build tool) helps you take data further. This practical book shows data analysts, data engineers, BI de...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
If you were handed two different but related sets of data, what tools would you use to find the matches? What if all you had was SQL SELECT access to a database? In this practical book, author Jim Lehmer provides best practices, techniques, and tricks to help you import, clean, match, score, and ...(186.15 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%)
O autorze ebooka
Ebooka "Learning and Operating Presto" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Learning and Operating Presto" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Learning and Operating Presto" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-10-981-4181-3, 9781098141813
- Data wydania ebooka:
- 2023-09-20 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 5.6MB
- Rozmiar pliku Mobi:
- 5.6MB
Spis treści ebooka
- Preface
- Why We Wrote This Book
- Who This Book Is For
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- Angelica Lo Duca
- Tim Meehan
- Vivek Bharathan
- Ying Su
- 1. Introduction to Presto
- Data Warehouses and Data Lakes
- The Role of Presto in a Data Lake
- Presto Origins and Design Considerations
- High Performance
- High Scalability
- Compliance with the ANSI SQL Standard
- Federation of Data Sources
- Running in the Cloud
- Presto Architecture and Core Components
- Alternatives to Presto
- Apache Impala
- Apache Hive
- Spark SQL
- Trino
- Presto Use Cases
- Reporting and Dashboarding
- Ad Hoc Querying
- ETL Using SQL
- Data Lakehouse
- Real-Time Analytics with Real-Time Databases
- Introducing Our Case Study
- Conclusion
- 2. Getting Started with Presto
- Presto Manual Installation
- Running Presto on Docker
- Installing Docker
- Presto Docker Image
- Dockerfile
- The etc/ directory
- node.properties
- jvm.config
- config.properties
- log.properties
- catalog/<connector>.properties
- Building and Running Presto on Docker
- The Presto Sandbox
- Deploying Presto on Kubernetes
- Introducing Kubernetes
- Configuring Presto on Kubernetes
- presto-coordinator.yaml
- presto-workers.yaml
- presto-config-map.yaml
- presto-secrets.yaml
- Adding a New Catalog
- Running the Deployment on Kubernetes
- Querying Your Presto Instance
- Listing Catalogs
- Listing Schemas
- Listing Tables
- Querying a Table
- Conclusion
- 3. Connectors
- Service Provider Interface
- Connector Architecture
- Popular Connectors
- Thrift
- Writing a Custom Connector
- Prerequisites
- Plugin and Module
- ExamplePlugin
- ExampleConnectorFactory
- ExampleModule
- ExampleConnector
- ExampleHandleResolver
- Configuration
- ExampleConfig
- SessionProperties
- TableProperties
- Metadata
- Data model
- Handles
- ExampleMetadata
- ExampleClient
- Input/Output
- ExampleSplitManager
- ExampleSplit
- ExampleRecordSetProvider and ExampleRecordSet
- ExampleRecordCursor
- Deploying Your Connector
- Apache Pinot
- Setting Up and Configuring Presto
- Setting up Pinot
- Configuring Pinot
- Configuring Presto with Pinot
- Setting Up and Configuring Presto
- Presto-Pinot Querying in Action
- Conclusion
- 4. Client Connectivity
- Setting Up the Environment
- Presto Client
- Docker Image
- Kubernetes Node
- Setting Up the Environment
- Connectivity to Presto
- REST API
- Python
- R
- JDBC
- Node.js
- ODBC
- Other Presto Client Libraries
- Building a Client Dashboard in Python
- Setting Up the Client
- Building the Dashboard
- Connecting to and querying Presto
- Preparing the results of the query
- Building the first graph
- Building the second graph
- Conclusion
- 5. Open Data Lakehouse Analytics
- The Emergence of the Lakehouse
- Data Lakehouse Architecture
- Data Lake
- File Store
- File Format
- Table Format
- Query Engine
- Metadata Management
- Data Governance
- Data Access Control
- Building a Data Lakehouse
- Configuring MinIO
- Populating MinIO
- Configuring MinIO
- Configuring HMS
- Configuring Spark
- Registering Hudi Tables with HMS
- Connecting and Querying Presto
- Conclusion
- 6. Presto Administration
- Introducing Presto Administration
- Configuration
- Properties
- How to configure a cluster
- Properties
- Sessions
- Using sessions
- JVM
- Memory
- Out-of-memory errors
- Garbage collection
- Monitoring
- Console
- Using the console for monitoring
- Using the console for debugging
- Using the console for going over the interactive plan
- Console
- REST API
- Metrics
- JMX connector
- REST API
- JMX exporters
- Management
- Resource Groups
- Configuring resource groups
- Resource groups properties
- Example
- Resource Groups
- Verifiers
- Setting up the system
- Configuring the MySQL database
- Configuring the Presto verifier
- Running a test
- Session Properties Managers
- Configuring a session property manager
- Namespace Functions
- Setting up the system
- Configuring a function
- Running a test
- Conclusion
- 7. Understanding Security in Presto
- Introducing Presto Security
- Building Secure Communication in Presto
- Encryption
- Keystore Management
- Configuring HTTPS/TLS
- Running a Presto client
- Running the Presto console
- Authentication
- File-Based Authentication
- Running a Presto client
- Running the Presto console
- File-Based Authentication
- LDAP
- Kerberos
- Prerequisites
- Configuring the Presto coordinator and workers
- Configuring the Presto client
- Creating a Custom Authenticator
- Authorization
- Authorizing Access to the Presto REST API
- Configuring System Access Control
- Authorization Through Apache Ranger
- Building a custom audit function
- Conclusion
- 8. Performance Tuning
- Introducing Performance Tuning
- Reasons for Performance Tuning
- The Performance Tuning Life Cycle
- Introducing Performance Tuning
- Query Execution Model
- Approaches for Performance Tuning in Presto
- Resource Allocation
- Storage
- Query Optimization
- Aria Scan
- Table Scanning
- Repartitioning
- Implementing Performance Tuning
- Building and Importing the Sample CSV Table in MinIO
- Converting the CSV Table in ORC
- Defining the Tuning Parameters
- Running Tests
- Default parameters
- Reducing CPU usage
- Query optimization
- Aria scan
- Conclusion
- 9. Operating Presto at Scale
- Introducing Scalability
- Reasons to Scale Presto
- Common Issues
- Introducing Scalability
- Design Considerations
- Availability
- Manageability
- Performance
- Protection
- Configuration
- How to Scale Presto
- Multiple Coordinators
- Presto on Spark
- Spilling
- Using a Cloud Service
- Conclusion
- Index
O'Reilly Media - inne książki
-
Software as a service (SaaS) is on the path to becoming the de facto model for building, delivering, and operating software solutions. Adopting a multi-tenant SaaS model requires builders to take on a broad range of new architecture, implementation, and operational challenges. How data is partiti...(237.15 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
Great engineers don't necessarily make great leaders—at least, not without a lot of work. Finding your path to becoming a strong leader is often fraught with challenges. It's not easy to figure out how to be strategic, successful, and considerate while also being firm. Whether you're on the...(118.15 zł najniższa cena z 30 dni)
126.65 zł
149.00 zł(-15%) -
Data science happens in code. The ability to write reproducible, robust, scaleable code is key to a data science project's success—and is absolutely essential for those working with production code. This practical book bridges the gap between data science and software engineering,and clearl...(211.65 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%) -
With the massive adoption of microservices, operators and developers face far more complexity in their applications today. Service meshes can help you manage this problem by providing a unified control plane to secure, manage, and monitor your entire network. This practical guide shows you how th...(194.65 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Get practical advice on how to leverage AI development tools for all stages of code creation, including requirements, planning, design, coding, debugging, testing, and documentation. With this book, beginners and experienced developers alike will learn how to use a wide range of tools, from gener...(177.65 zł najniższa cena z 30 dni)
164.25 zł
219.00 zł(-25%) -
Rust's popularity is growing, due in part to features like memory safety, type safety, and thread safety. But these same elements can also make learning Rust a challenge, even for experienced programmers. This practical guide helps you make the transition to writing idiomatic Rust—while als...(177.65 zł najniższa cena z 30 dni)
164.25 zł
219.00 zł(-25%) -
Advance your Power BI skills by adding AI to your repertoire at a practice level. With this practical book, business-oriented software engineers and developers will learn the terminologies, practices, and strategy necessary to successfully incorporate AI into your business intelligence estate. Je...(211.65 zł najniższa cena z 30 dni)
220.15 zł
259.00 zł(-15%) -
Microservices can be a very effective approach for delivering value to your organization and to your customers. If you get them right, microservices help you to move fast by making changes to small parts of your system hundreds of times a day. But if you get them wrong, microservices will just ma...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
JavaScript gives web developers great power to create rich interactive browser experiences, and much of that power is provided by the browser itself. Modern web APIs enable web-based applications to come to life like never before, supporting actions that once required browser plug-ins. Some are s...(186.15 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
How will software development and operations have to change to meet the sustainability and green needs of the planet? And what does that imply for development organizations? In this eye-opening book, sustainable software advocates Anne Currie, Sarah Hsu, and Sara Bergman provide a unique overview...(160.65 zł najniższa cena z 30 dni)
169.14 zł
199.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Learning and Operating Presto Angelica Lo Duca, Tim Meehan, Vivek Bharathan (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.