Building Machine Learning Pipelines
- Autorzy:
- Hannes Hapke, Catherine Nelson
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 366
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Building Machine Learning Pipelines
Companies are spending billions on machine learning projects, but it’s money wasted if the models can’t be deployed effectively. In this practical guide, Hannes Hapke and Catherine Nelson walk you through the steps of automating a machine learning pipeline using the TensorFlow ecosystem. You’ll learn the techniques and tools that will cut deployment time from days to minutes, so that you can focus on developing new models rather than maintaining legacy systems.
Data scientists, machine learning engineers, and DevOps engineers will discover how to go beyond model development to successfully productize their data science projects, while managers will better understand the role they play in helping to accelerate these projects.
- Understand the steps to build a machine learning pipeline
- Build your pipeline using components from TensorFlow Extended
- Orchestrate your machine learning pipeline with Apache Beam, Apache Airflow, and Kubeflow Pipelines
- Work with data using TensorFlow Data Validation and TensorFlow Transform
- Analyze a model in detail using TensorFlow Model Analysis
- Examine fairness and bias in your model performance
- Deploy models with TensorFlow Serving or TensorFlow Lite for mobile devices
- Learn privacy-preserving machine learning techniques
Wybrane bestsellery
-
Przetwarzanie języka naturalnego w akcji autorstwa Hobsona Lanea, Hannesa Maxa Hapke i Colea Howarda to przewodnik po tworzeniu maszyn, które potrafią czytać i interpretować ludzki język. Użyjecie w nim łatwo dostępnych pakietów Pythona, aby wychwycić znaczenie tekstu i odpowiednio zareagować. Ks...(103.20 zł najniższa cena z 30 dni)
103.20 zł
129.00 zł(-20%) -
Data science happens in code. The ability to write reproducible, robust, scaleable code is key to a data science project's success—and is absolutely essential for those working with production code. This practical book bridges the gap between data science and software engineering,and clearl...(211.65 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(57.84 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Odkryj fascynujący świat sztucznej inteligencji (AI) bez zbędnych komplikacji! Ta książka to idealny przewodnik dla każdego, kto chce zrozumieć, jak AI zmienia nasz świat, od podstawowych pojęć po zaawansowane technologie. Dzięki jasnym wyjaśnieniom i przystępnemu językowi, autor demistyfikuje sk...
AI bez tajemnic. Sztuczna Inteligencja od podstaw po zaawansowane techniki AI bez tajemnic. Sztuczna Inteligencja od podstaw po zaawansowane techniki
-
Tę książkę docenią wszyscy zainteresowani eksploracją danych i uczeniem maszynowym, którzy chcieliby pewnie poruszać się w świecie nauki o danych. Pokazano tu, w jaki sposób Excel pozwala zobrazować proces ich eksplorowania i jak działają poszczególne techniki w tym zakresie. Przejrzyście wyjaśni...
Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku Eksploracja danych za pomocą Excela. Metody uczenia maszynowego krok po kroku
(43.55 zł najniższa cena z 30 dni)46.90 zł
67.00 zł(-30%) -
Oto praktyczny przewodnik po nauce o danych w miejscu pracy. Dowiesz się stąd wszystkiego, co ważne na początku Twojej drogi jako danologa: od osobowości, z którymi przyjdzie Ci pracować, przez detale analizy danych, po matematykę stojącą za algorytmami i uczeniem maszynowym. Nauczysz się myśleć ...
Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym
(44.85 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Książka jest adresowana do wszystkich, którzy chcą budować, rozwijać i skalować systemy NLP w środowisku biznesowym, a także dostosowywać je do swojej branży. Opisuje tworzenie rzeczywistych aplikacji NLP. Omawia pełny cykl życia typowego projektu NLP, od zbierania danych po wdrożenie i monitorow...
Przetwarzanie języka naturalnego w praktyce. Przewodnik po budowie rzeczywistych systemów NLP Przetwarzanie języka naturalnego w praktyce. Przewodnik po budowie rzeczywistych systemów NLP
Sowmya Vajjala, Bodhisattwa Majumder, Anuj Gupta, Harshit Surana
(70.85 zł najniższa cena z 30 dni)76.30 zł
109.00 zł(-30%) -
Głębokie sieci neuronowe mają niesamowity potencjał. Osiągnięcia ostatnich lat nadały procesom uczenia głębokiego zupełnie nową jakość. Obecnie nawet programiści niezaznajomieni z tą technologią mogą korzystać z prostych i niezwykle skutecznych narzędzi, pozwalających na sprawne implementowanie p...
Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III
(116.35 zł najniższa cena z 30 dni)125.30 zł
179.00 zł(-30%) -
Książka stanowi kompendium wiedzy na temat tej niesłychanie szybko rozwijającej się i dynamicznie wkraczającej w nasze życie dziedziny. Została napisana tak, aby była przystępna dla osób posiadających podstawowe umiejętności matematyczne. Może stanowić podręcznik dla studentów takich kierunków ja...(31.85 zł najniższa cena z 30 dni)
34.30 zł
49.00 zł(-30%) -
Sztuczna inteligencja staje się powoli nieodzownym składnikiem naszego życia. Przeszła długą drogę od modnego hasła pojawiającego się głównie w specjalistycznych publikacjach do technologii mającej realny wpływ na naszą codzienność. Z każdym dniem lepiej radzi sobie z coraz bardziej zaawansowanym...(48.30 zł najniższa cena z 30 dni)
48.30 zł
69.00 zł(-30%)
Ebooka "Building Machine Learning Pipelines" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Building Machine Learning Pipelines" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Building Machine Learning Pipelines" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-920-5314-9, 9781492053149
- Data wydania ebooka:
- 2020-07-13 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 8.8MB
- Rozmiar pliku Mobi:
- 20.2MB
Spis treści ebooka
- Foreword
- Preface
- What Are Machine Learning Pipelines?
- Who Is This Book For?
- Why TensorFlow and TensorFlow Extended?
- Overview of the Chapters
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- 1. Introduction
- Why Machine Learning Pipelines?
- When to Think About Machine Learning Pipelines
- Overview of the Steps in a Machine Learning Pipeline
- Data Ingestion and Data Versioning
- Data Validation
- Data Preprocessing
- Model Training and Tuning
- Model Analysis
- Model Versioning
- Model Deployment
- Feedback Loops
- Data Privacy
- Pipeline Orchestration
- Why Pipeline Orchestration?
- Directed Acyclic Graphs
- Our Example Project
- Project Structure
- Our Machine Learning Model
- Goal of the Example Project
- Summary
- 2. Introduction to TensorFlow Extended
- What Is TFX?
- Installing TFX
- Overview of TFX Components
- What Is ML Metadata?
- Interactive Pipelines
- Alternatives to TFX
- Introduction to Apache Beam
- Setup
- Basic Data Pipeline
- Basic collection example
- Basic transformation example
- Putting it all together
- Executing Your Basic Pipeline
- Summary
- 3. Data Ingestion
- Concepts for Data Ingestion
- Ingesting Local Data Files
- Converting comma-separated data to tf.Example
- Importing existing TFRecord Files
- Converting Parquet-serialized data to tf.Example
- Converting Avro-serialized data to tf.Example
- Converting your custom data to TFRecord data structures
- Ingesting Local Data Files
- Ingesting Remote Data Files
- Ingesting Data Directly from Databases
- Google Cloud BigQuery
- Presto databases
- Concepts for Data Ingestion
- Data Preparation
- Splitting Datasets
- Splitting one dataset into subsets
- Preserving existing splits
- Splitting Datasets
- Spanning Datasets
- Versioning Datasets
- Ingestion Strategies
- Structured Data
- Text Data for Natural Language Problems
- Image Data for Computer Vision Problems
- Summary
- 4. Data Validation
- Why Data Validation?
- TFDV
- Installation
- Generating Statistics from Your Data
- Generating Schema from Your Data
- Recognizing Problems in Your Data
- Comparing Datasets
- Updating the Schema
- Data Skew and Drift
- Biased Datasets
- Slicing Data in TFDV
- Processing Large Datasets with GCP
- Integrating TFDV into Your Machine Learning Pipeline
- Summary
- 5. Data Preprocessing
- Why Data Preprocessing?
- Preprocessing the Data in the Context of the Entire Dataset
- Scaling the Preprocessing Steps
- Avoiding a Training-Serving Skew
- Deploying Preprocessing Steps and the ML Model as One Artifact
- Checking Your Preprocessing Results in Your Pipeline
- Why Data Preprocessing?
- Data Preprocessing with TFT
- Installation
- Preprocessing Strategies
- Best Practices
- TFT Functions
- Text data for natural language problems
- Image data for computer vision problems
- Standalone Execution of TFT
- Integrate TFT into Your Machine Learning Pipeline
- Summary
- 6. Model Training
- Defining the Model for Our Example Project
- The TFX Trainer Component
- run_fn() Function
- Load the data
- Compile and train the model
- Model export
- run_fn() Function
- Running the Trainer Component
- Other Trainer Component Considerations
- Using the Trainer component with an Estimator model
- Using the SavedModel outside a pipeline
- Using TensorBoard in an Interactive Pipeline
- Distribution Strategies
- Model Tuning
- Strategies for Hyperparameter Tuning
- Hyperparameter Tuning in TFX Pipelines
- Summary
- 7. Model Analysis and Validation
- How to Analyze Your Model
- Classification Metrics
- Regression Metrics
- How to Analyze Your Model
- TensorFlow Model Analysis
- Analyzing a Single Model in TFMA
- Analyzing Multiple Models in TFMA
- Model Analysis for Fairness
- Slicing Model Predictions in TFMA
- Checking Decision Thresholds with Fairness Indicators
- Going Deeper with the What-If Tool
- Model Explainability
- Generating Explanations with the WIT
- Other Explainability Techniques
- Analysis and Validation in TFX
- ResolverNode
- Evaluator Component
- Validation in the Evaluator Component
- TFX Pusher Component
- Summary
- 8. Model Deployment with TensorFlow Serving
- A Simple Model Server
- The Downside of Model Deployments with Python-Based APIs
- Lack of Code Separation
- Lack of Model Version Control
- Inefficient Model Inference
- TensorFlow Serving
- TensorFlow Architecture Overview
- Exporting Models for TensorFlow Serving
- Model Signatures
- Inspecting Exported Models
- Setting Up TensorFlow Serving
- Docker Installation
- Native Ubuntu Installation
- Building TensorFlow Serving from Source
- Configuring a TensorFlow Server
- REST Versus gRPC
- Making Predictions from the Model Server
- Getting Model Predictions via REST
- URL structure
- Payloads
- Getting Model Predictions via REST
- Using TensorFlow Serving via gRPC
- Getting predictions from classification and regression models
- Payloads
- Model A/B Testing with TensorFlow Serving
- Requesting Model Metadata from the Model Server
- REST Requests for Model Metadata
- gRPC Requests for Model Metadata
- Batching Inference Requests
- Configuring Batch Predictions
- Other TensorFlow Serving Optimizations
- TensorFlow Serving Alternatives
- BentoML
- Seldon
- GraphPipe
- Simple TensorFlow Serving
- MLflow
- Ray Serve
- Deploying with Cloud Providers
- Use Cases
- Example Deployment with GCP
- Model deployment
- Model inference
- Model Deployment with TFX Pipelines
- Summary
- 9. Advanced Model Deployments with TensorFlow Serving
- Decoupling Deployment Cycles
- Workflow Overview
- Accessing private models from AWS S3
- Accessing private models from GCP Buckets
- Workflow Overview
- Optimization of Remote Model Loading
- Decoupling Deployment Cycles
- Model Optimizations for Deployments
- Quantization
- Pruning
- Distillation
- Using TensorRT with TensorFlow Serving
- TFLite
- Steps to Optimize Your Model with TFLite
- Serving TFLite Models with TensorFlow Serving
- Monitoring Your TensorFlow Serving Instances
- Prometheus Setup
- TensorFlow Serving Configuration
- Simple Scaling with TensorFlow Serving and Kubernetes
- Summary
- 10. Advanced TensorFlow Extended
- Advanced Pipeline Concepts
- Training Multiple Models Simultaneously
- Exporting TFLite Models
- Warm Starting Model Training
- Advanced Pipeline Concepts
- Human in the Loop
- Slack Component Setup
- How to Use the Slack Component
- Custom TFX Components
- Use Cases of Custom Components
- Writing a Custom Component from Scratch
- Component specifications
- Component channels
- Component executors
- Component drivers
- Assembling the custom component
- Using our basic custom component
- Implementation review
- Reusing Existing Components
- Using our custom executor
- Summary
- 11. Pipelines Part 1: Apache Beam and Apache Airflow
- Which Orchestration Tool to Choose?
- Apache Beam
- Apache Airflow
- Kubeflow Pipelines
- Kubeflow Pipelines on AI Platform
- Which Orchestration Tool to Choose?
- Converting Your Interactive TFX Pipeline to a Production Pipeline
- Simple Interactive Pipeline Conversion for Beam and Airflow
- Introduction to Apache Beam
- Orchestrating TFX Pipelines with Apache Beam
- Introduction to Apache Airflow
- Installation and Initial Setup
- Basic Airflow Example
- Project-specific configurations
- Task definitions
- Task dependencies
- Putting it all together
- Orchestrating TFX Pipelines with Apache Airflow
- Pipeline Setup
- Pipeline Execution
- Summary
- 12. Pipelines Part 2: Kubeflow Pipelines
- Introduction to Kubeflow Pipelines
- Installation and Initial Setup
- Accessing Your Kubeflow Pipelines Installation
- Introduction to Kubeflow Pipelines
- Orchestrating TFX Pipelines with Kubeflow Pipelines
- Pipeline Setup
- Executing the Pipeline
- Useful Features of Kubeflow Pipelines
- Restart failed pipelines
- Recurring runs
- Collaborating and reviewing pipeline runs
- Auditing the pipeline lineage
- Pipelines Based on Google Cloud AI Platform
- Pipeline Setup
- TFX Pipeline Setup
- Use Cloud Storage buckets for data exchange
- Training models with an AI Platform job
- Serving models through AI Platform endpoints
- Scaling with Googles Dataflow
- Pipeline Execution
- Summary
- 13. Feedback Loops
- Explicit and Implicit Feedback
- The Data Flywheel
- Feedback Loops in the Real World
- Explicit and Implicit Feedback
- Design Patterns for Collecting Feedback
- Users Take Some Action as a Result of the Prediction
- Users Rate the Quality of the Prediction
- Users Correct the Prediction
- Crowdsourcing the Annotations
- Expert Annotations
- Producing Feedback Automatically
- How to Track Feedback Loops
- Tracking Explicit Feedback
- Tracking Implicit Feedback
- Summary
- 14. Data Privacy for Machine Learning
- Data Privacy Issues
- Why Do We Care About Data Privacy?
- The Simplest Way to Increase Privacy
- What Data Needs to Be Kept Private?
- Data Privacy Issues
- Differential Privacy
- Local and Global Differential Privacy
- Epsilon, Delta, and the Privacy Budget
- Differential Privacy for Machine Learning
- Introduction to TensorFlow Privacy
- Training with a Differentially Private Optimizer
- Calculating Epsilon
- Federated Learning
- Federated Learning in TensorFlow
- Encrypted Machine Learning
- Encrypted Model Training
- Converting a Trained Model to Serve Encrypted Predictions
- Other Methods for Data Privacy
- Summary
- 15. The Future of Pipelines and Next Steps
- Model Experiment Tracking
- Thoughts on Model Release Management
- Future Pipeline Capabilities
- TFX with Other Machine Learning Frameworks
- Testing Machine Learning Models
- CI/CD Systems for Machine Learning
- Machine Learning Engineering Community
- Summary
- A. Introduction to Infrastructure for Machine Learning
- What Is a Container?
- Introduction to Docker
- Introduction to Docker Images
- Building Your First Docker Image
- Diving into the Docker CLI
- Introduction to Kubernetes
- Some Kubernetes Definitions
- Getting Started with Minikube and kubectl
- Interacting with the Kubernetes CLI
- Defining a Kubernetes Resource
- Deploying Applications to Kubernetes
- B. Setting Up a Kubernetes Cluster on Google Cloud
- Before You Get Started
- Kubernetes on Google Cloud
- Selecting a Google Cloud Project
- Setting Up Your Google Cloud Project
- Creating a Kubernetes Cluster
- Accessing Your Kubernetes Cluster with kubectl
- Using Your Kubernetes Cluster with kubectl
- Persistent Volume Setups for Kubeflow Pipelines
- C. Tips for Operating Kubeflow Pipelines
- Custom TFX Images
- Exchange Data Through Persistent Volumes
- TFX Command-Line Interface
- TFX and Its Dependencies
- TFX Templates
- Publishing Your Pipeline with TFX CLI
- Index
O'Reilly Media - inne książki
-
Software as a service (SaaS) is on the path to becoming the de facto model for building, delivering, and operating software solutions. Adopting a multi-tenant SaaS model requires builders to take on a broad range of new architecture, implementation, and operational challenges. How data is partiti...(237.15 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
Great engineers don't necessarily make great leaders—at least, not without a lot of work. Finding your path to becoming a strong leader is often fraught with challenges. It's not easy to figure out how to be strategic, successful, and considerate while also being firm. Whether you're on the...(126.65 zł najniższa cena z 30 dni)
126.65 zł
149.00 zł(-15%) -
With the massive adoption of microservices, operators and developers face far more complexity in their applications today. Service meshes can help you manage this problem by providing a unified control plane to secure, manage, and monitor your entire network. This practical guide shows you how th...(203.15 zł najniższa cena z 30 dni)
203.15 zł
239.00 zł(-15%) -
Get practical advice on how to leverage AI development tools for all stages of code creation, including requirements, planning, design, coding, debugging, testing, and documentation. With this book, beginners and experienced developers alike will learn how to use a wide range of tools, from gener...(164.25 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
Rust's popularity is growing, due in part to features like memory safety, type safety, and thread safety. But these same elements can also make learning Rust a challenge, even for experienced programmers. This practical guide helps you make the transition to writing idiomatic Rust—while als...(164.25 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
Advance your Power BI skills by adding AI to your repertoire at a practice level. With this practical book, business-oriented software engineers and developers will learn the terminologies, practices, and strategy necessary to successfully incorporate AI into your business intelligence estate. Je...(211.65 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Microservices can be a very effective approach for delivering value to your organization and to your customers. If you get them right, microservices help you to move fast by making changes to small parts of your system hundreds of times a day. But if you get them wrong, microservices will just ma...(203.15 zł najniższa cena z 30 dni)
203.15 zł
239.00 zł(-15%) -
JavaScript gives web developers great power to create rich interactive browser experiences, and much of that power is provided by the browser itself. Modern web APIs enable web-based applications to come to life like never before, supporting actions that once required browser plug-ins. Some are s...(186.15 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
How will software development and operations have to change to meet the sustainability and green needs of the planet? And what does that imply for development organizations? In this eye-opening book, sustainable software advocates Anne Currie, Sarah Hsu, and Sara Bergman provide a unique overview...(169.14 zł najniższa cena z 30 dni)
169.14 zł
199.00 zł(-15%) -
What will you learn from this book?If you're a software developer looking for a quick on-ramp to software architecture, this handy guide is a great place to start. From the authors of Fundamentals of Software Architecture, Head First Software Architecture teaches you how to think architecturally ...(245.65 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Building Machine Learning Pipelines Hannes Hapke, Catherine Nelson (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.