Opis ebooka: Programming Pig
This guide is an ideal learning tool and reference for Apache Pig, the open source engine for executing parallel data flows on Hadoop. With Pig, you can batch-process data without having to create a full-fledged application—making it easy for you to experiment with new datasets.
Programming Pig introduces new users to Pig, and provides experienced users with comprehensive coverage on key features such as the Pig Latin scripting language, the Grunt shell, and User Defined Functions (UDFs) for extending Pig. If you need to analyze terabytes of data, this book shows you how to do it efficiently with Pig.
- Delve into Pig’s data model, including scalar and complex data types
- Write Pig Latin scripts to sort, group, join, project, and filter your data
- Use Grunt to work with the Hadoop Distributed File System (HDFS)
- Build complex data processing pipelines with Pig’s macros and modularity features
- Embed Pig Latin in Python for iterative processing and other advanced tasks
- Create your own load and store functions to handle data formats and storage mechanisms
- Get performance tips for running scripts on Hadoop clusters in less time
Wybrane bestsellery
-
For many organizations, Hadoop is the first step for dealing with massive amounts of data. The next step? Processing and analyzing datasets with the Apache Pig scripting platform. With Pig, you can batch-process data without having to create a full-fledged application, making it easy to experimen...
Programming Pig. Dataflow Scripting with Hadoop. 2nd Edition Programming Pig. Dataflow Scripting with Hadoop. 2nd Edition
(122.42 zł najniższa cena z 30 dni)122.37 zł
149.00 zł(-18%) -
Dzięki tej książce dowiesz się, jak pozyskiwać, analizować i wizualizować dane, a potem używać ich do rozwiązywania problemów biznesowych. Wystarczy, że znasz podstawy Pythona i matematyki na poziomie liceum, aby zacząć stosować naukę o danych w codziennej pracy. Znajdziesz tu szereg praktycznych...
Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym
(55.20 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Dzięki tej książce poznasz od podstaw Gita i GitLaba. Dowiesz się, jak skonfigurować runnery GitLaba, a także jak tworzyć i konfigurować potoki dla różnych etapów cyklu rozwoju oprogramowania. Poznasz zasady interpretacji wyników potoków w GitLabie. Nauczysz się też wdrażania kodu w różnych środo...
Automatyzacja metodyki DevOps za pomocą potoków CI/CD GitLaba. Buduj efektywne potoki CI/CD do weryfikacji, zabezpieczenia i wdrażania kodu, korzystając z rzeczywistych przykładów Automatyzacja metodyki DevOps za pomocą potoków CI/CD GitLaba. Buduj efektywne potoki CI/CD do weryfikacji, zabezpieczenia i wdrażania kodu, korzystając z rzeczywistych przykładów
(55.30 zł najniższa cena z 30 dni)55.30 zł
79.00 zł(-30%) -
ChatGPT, chatbot opracowany i udostępniony przez firmę OpenAI, szybko stał się obiektem zainteresowania internautów na całym świecie — i na nowo wzbudził gorące dyskusje wokół sztucznej inteligencji. Ludzie mediów prześcigają się w skrajnych wizjach, jedni podchodzą do tematu entuzjastyczni...(10.95 zł najniższa cena z 30 dni)
12.04 zł
21.90 zł(-45%) -
Mam wrażenie, że wokół sieci neuronowych narosło wiele mitów. Nawet niektórzy starsi członkowie mojej rodziny na hasło "sztuczna inteligencja" robią posępną minę, niezależnie od tego, czy mowa jest o generowaniu obrazów czy - na przykład - o rozpoznawaniu odręcznego pisma czy też tłumaczeniu teks...(24.57 zł najniższa cena z 30 dni)
24.57 zł
28.90 zł(-15%) -
Tę książkę docenią przede wszystkim inżynierowie oprogramowania, programiści i administratorzy systemów, którzy muszą szybko zrozumieć praktyki DevOps. Znajdziesz tu bezcenną wiedzę, która ułatwi Ci efektywną pracę z nowoczesnym stosem aplikacji i sprawne przystąpienie do zadań związanych z DevOp...
DevOps dla zdesperowanych. Praktyczny poradnik przetrwania DevOps dla zdesperowanych. Praktyczny poradnik przetrwania
(40.20 zł najniższa cena z 30 dni)46.90 zł
67.00 zł(-30%) -
Książkę szczególnie docenią analitycy bezpieczeństwa, którzy chcą się zapoznać z zestawem poleceń ARM i zdobyć wiedzę umożliwiającą im efektywne korzystanie z technik inżynierii wstecznej. Poza zestawem potrzebnych poleceń znalazło się w niej mnóstwo przydatnych informacji. Znajdziesz tu przegląd...
Niebieski lis. Polecenia procesorów Arm i inżynieria wsteczna Niebieski lis. Polecenia procesorów Arm i inżynieria wsteczna
(53.40 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Jeśli w swojej pracy masz lub miewasz do czynienia z danymi, z pewnością orientujesz się, że do tego celu stworzono dotąd całkiem sporo narzędzi. Nic dziwnego – przy tej liczbie danych, z jaką spotykamy się w dzisiejszym cyfrowym świecie, zdolność do ich sprawnego analizowania i wyciągania ...
Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym
(39.90 zł najniższa cena z 30 dni)90.34 zł
139.00 zł(-35%) -
Tę książkę docenią praktycy: inżynierowie uczenia maszynowego i analitycy danych, poszukujący sposobu praktycznego zaadaptowania modeli transformacyjnych do swoich potrzeb. Autorzy skupili się na praktycznej stronie tworzenia aplikacji językowych, a w poszczególnych rozdziałach ujęto wszystkie na...
Przetwarzanie języka naturalnego z wykorzystaniem transformerów. Budowanie aplikacji językowych za pomocą bibliotek Hugging Face Przetwarzanie języka naturalnego z wykorzystaniem transformerów. Budowanie aplikacji językowych za pomocą bibliotek Hugging Face
(59.40 zł najniższa cena z 30 dni)69.30 zł
99.00 zł(-30%) -
Wraz z rozwojem sztucznej inteligencji i modeli językowych – a niewątpliwie żyjemy w czasach eksplozji AI – rośnie znaczenie osób będących w stanie w praktyce sięgać po zasoby, jakie oferuje nam ta nowoczesna technologia. Okazuje się, że pośród rozmaitych innych umiejętności potrafi o...
Prompt engineering. Kurs video. Precyzyjne tworzenie zapytań dla modeli AI Prompt engineering. Kurs video. Precyzyjne tworzenie zapytań dla modeli AI
(67.60 zł najniższa cena z 30 dni)109.85 zł
169.00 zł(-35%)
Ebooka "Programming Pig" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Programming Pig" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Programming Pig" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-493-1768-3, 9781449317683
- Data wydania ebooka:
-
2011-09-29
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 2.3MB
- Rozmiar pliku Mobi:
- 2.3MB
Spis treści ebooka
- Programming Pig
- SPECIAL OFFER: Upgrade this ebook with OReilly
- Preface
- Data Addiction
- Who Should Read This Book
- Conventions Used in This Book
- Code Examples in This Book
- Using Code Examples
- Safari Books Online
- How to Contact Us
- Acknowledgments
- 1. Introduction
- What Is Pig?
- Pig on Hadoop
- MapReduces hello world
- Pig on Hadoop
- Pig Latin, a Parallel Dataflow Language
- Comparing query and dataflow languages
- How Pig differs from MapReduce
- What Is Pig?
- What Is Pig Useful For?
- Pig Philosophy
- Pigs History
- 2. Installing and Running Pig
- Downloading and Installing Pig
- Downloading the Pig Package from Apache
- Downloading Pig from Cloudera
- Downloading Pig Artifacts from Maven
- Downloading the Source
- Downloading and Installing Pig
- Running Pig
- Running Pig Locally on Your Machine
- Running Pig on Your Hadoop Cluster
- Running Pig in the Cloud
- Command-Line and Configuration Options
- Return Codes
- 3. Grunt
- Entering Pig Latin Scripts in Grunt
- HDFS Commands in Grunt
- Controlling Pig from Grunt
- 4. Pigs Data Model
- Types
- Scalar Types
- Complex Types
- Map
- Tuple
- Bag
- Nulls
- Types
- Schemas
- Casts
- 5. Introduction to Pig Latin
- Preliminary Matters
- Case Sensitivity
- Comments
- Preliminary Matters
- Input and Output
- Load
- Store
- Dump
- Relational Operations
- foreach
- Expressions in foreach
- UDFs in foreach
- Naming fields in foreach
- foreach
- Filter
- Group
- Order by
- Distinct
- Join
- Limit
- Sample
- Parallel
- User Defined Functions
- Registering UDFs
- Registering Python UDFs
- Registering UDFs
- define and UDFs
- Calling Static Java Functions
- 6. Advanced Pig Latin
- Advanced Relational Operations
- Advanced Features of foreach
- flatten
- Nested foreach
- Advanced Features of foreach
- Using Different Join Implementations
- Joining small to large data
- Joining skewed data
- Joining sorted data
- Advanced Relational Operations
- cogroup
- union
- cross
- Integrating Pig with Legacy Code and MapReduce
- stream
- mapreduce
- Nonlinear Data Flows
- Controlling Execution
- set
- Setting the Partitioner
- Pig Latin Preprocessor
- Parameter Substitution
- Macros
- Including Other Pig Latin Scripts
- 7. Developing and Testing Pig Latin Scripts
- Development Tools
- Syntax Highlighting and Checking
- describe
- explain
- illustrate
- Pig Statistics
- MapReduce Job Status
- Debugging Tips
- Development Tools
- Testing Your Scripts with PigUnit
- 8. Making Pig Fly
- Writing Your Scripts to Perform Well
- Filter Early and Often
- Project Early and Often
- Set Up Your Joins Properly
- Use Multiquery When Possible
- Choose the Right Data Type
- Select the Right Level of Parallelism
- Writing Your Scripts to Perform Well
- Writing Your UDF to Perform
- Tune Pig and Hadoop for Your Job
- Using Compression in Intermediate Results
- Data Layout Optimization
- Bad Record Handling
- 9. Embedding Pig Latin in Python
- Compile
- Bind
- Binding Multiple Sets of Variables
- Run
- Running Multiple Bindings
- Utility Methods
- 10. Writing Evaluation and Filter Functions
- Writing an Evaluation Function in Java
- Where Your UDF Will Run
- Evaluation Function Basics
- Interacting with Pig values
- Input and Output Schemas
- Error Handling and Progress Reporting
- Constructors and Passing Data from Frontend to Backend
- Loading the distributed cache
- UDFContext
- Writing an Evaluation Function in Java
- Overloading UDFs
- Memory Issues in Eval Funcs
- Algebraic Interface
- Accumulator Interface
- Python UDFs
- Writing Filter Functions
- 11. Writing Load and Store Functions
- Load Functions
- Frontend Planning Functions
- Determining InputFormat
- Determining the location
- Getting the casting functions
- Frontend Planning Functions
- Passing Information from the Frontend to the Backend
- Backend Data Reading
- Getting ready to read
- Reading records
- Load Functions
- Additional Load Function Interfaces
- Loading metadata
- Using partitions
- Casting bytearrays
- Pushing down projections
- Store Functions
- Store Function Frontend Planning
- Determining OutputFormat
- Setting the output location
- Checking the schema
- Store Function Frontend Planning
- Store Functions and UDFContext
- Writing Data
- Preparing to write
- Writing records
- Failure Cleanup
- Storing Metadata
- 12. Pig and Other Members of the Hadoop Community
- Pig and Hive
- Cascading
- NoSQL Databases
- HBase
- Cassandra
- Metadata in Hadoop
- A. Built-in User Defined Functions and Piggybank
- Built-in UDFs
- Built-in Load and Store Functions
- Built-in Evaluation and Filter Functions
- Built-in math UDFs
- Built-in aggregate UDFs
- Built-in chararray and bytearray UDFs
- Built-in complex type UDFs
- Built-in filter functions
- Miscellaneous built-in UDF
- Built-in UDFs
- Piggybank
- B. Overview of Hadoop
- MapReduce
- Map Phase
- Combiner Phase
- Shuffle Phase
- Reduce Phase
- Output Phase
- Distributed Cache
- Handling Failure
- MapReduce
- Hadoop Distributed File System
- Index
- About the Author
- Colophon
- SPECIAL OFFER: Upgrade this ebook with OReilly
O'Reilly Media - inne książki
-
Keeping up with the Python ecosystem can be daunting. Its developer tooling doesn't provide the out-of-the-box experience native to languages like Rust and Go. When it comes to long-term project maintenance or collaborating with others, every Python project faces the same problem: how to build re...(203.15 zł najniższa cena z 30 dni)
208.69 zł
249.00 zł(-16%) -
Bringing a deep-learning project into production at scale is quite challenging. To successfully scale your project, a foundational understanding of full stack deep learning, including the knowledge that lies at the intersection of hardware, software, data, and algorithms, is required.This book il...(237.15 zł najniższa cena z 30 dni)
250.10 zł
289.00 zł(-13%) -
Frontend developers have to consider many things: browser compatibility, usability, performance, scalability, SEO, and other best practices. But the most fundamental aspect of creating websites is one that often falls short: accessibility. Accessibility is the cornerstone of any website, and if a...(194.65 zł najniższa cena z 30 dni)
207.65 zł
249.00 zł(-17%) -
In this insightful and comprehensive guide, Addy Osmani shares more than a decade of experience working on the Chrome team at Google, uncovering secrets to engineering effectiveness, efficiency, and team success. Engineers and engineering leaders looking to scale their effectiveness and drive tra...(118.15 zł najniższa cena z 30 dni)
121.64 zł
149.00 zł(-18%) -
Data modeling is the single most overlooked feature in Power BI Desktop, yet it's what sets Power BI apart from other tools on the market. This practical book serves as your fast-forward button for data modeling with Power BI, Analysis Services tabular, and SQL databases. It serves as a starting ...(194.65 zł najniższa cena z 30 dni)
207.05 zł
249.00 zł(-17%) -
C# is undeniably one of the most versatile programming languages available to engineers today. With this comprehensive guide, you'll learn just how powerful the combination of C# and .NET can be. Author Ian Griffiths guides you through C# 12.0 and .NET 8 fundamentals and techniques for building c...(228.65 zł najniższa cena z 30 dni)
250.54 zł
289.00 zł(-13%) -
Learn how to get started with Futures Thinking. With this practical guide, Phil Balagtas, founder of the Design Futures Initiative and the global Speculative Futures network, shows you how designers and futurists have made futures work at companies such as Atari, IBM, Apple, Disney, Autodesk, Luf...(152.15 zł najniższa cena z 30 dni)
155.95 zł
189.00 zł(-17%) -
Augmented Analytics isn't just another book on data and analytics; it's a holistic resource for reimagining the way your entire organization interacts with information to become insight-driven.Moving beyond traditional, limited ways of making sense of data, Augmented Analytics provides a dynamic,...(177.65 zł najniższa cena z 30 dni)
181.85 zł
219.00 zł(-17%) -
Learn how to prepare for—and pass—the Kubernetes and Cloud Native Associate (KCNA) certification exam. This practical guide serves as both a study guide and point of entry for practitioners looking to explore and adopt cloud native technologies. Adrián González Sánchez ...
Kubernetes and Cloud Native Associate (KCNA) Study Guide Kubernetes and Cloud Native Associate (KCNA) Study Guide
(169.14 zł najniższa cena z 30 dni)177.65 zł
209.00 zł(-15%) -
Python is an excellent way to get started in programming, and this clear, concise guide walks you through Python a step at a time—beginning with basic programming concepts before moving on to functions, data structures, and object-oriented design. This revised third edition reflects the gro...(149.32 zł najniższa cena z 30 dni)
148.82 zł
179.00 zł(-17%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
![Loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
![ajax-loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
Oceny i opinie klientów: Programming Pig Alan Gates (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.