- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 226
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Scaling Python with Dask
Modern systems contain multi-core CPUs and GPUs that have the potential for parallel computing. But many scientific Python tools were not designed to leverage this parallelism. With this short but thorough resource, data scientists and Python programmers will learn how the Dask open source library for parallel computing provides APIs that make it easy to parallelize PyData libraries including NumPy, pandas, and scikit-learn.
Authors Holden Karau and Mika Kimmins show you how to use Dask computations in local systems and then scale to the cloud for heavier workloads. This practical book explains why Dask is popular among industry experts and academics and is used by organizations that include Walmart, Capital One, Harvard Medical School, and NASA.
With this book, you'll learn:
- What Dask is, where you can use it, and how it compares with other tools
- How to use Dask for batch data parallel processing
- Key distributed system concepts for working with Dask
- Methods for using Dask with higher-level APIs and building blocks
- How to work with integrated libraries such as scikit-learn, pandas, and PyTorch
- How to use Dask with GPUs
Wybrane bestsellery
-
Czy chcesz odkryć świat kodowania i stać się młodym programistą w zaledwie jeden dzień? Czy chcesz nauczyć się języka, który otworzy przed tobą drzwi do fascynującego świata technologii? Czy chcesz tworzyć własne gry, aplikacje i nie tylko, korzystając z Pythona, jednego z najbardziej przyjaz...
Python w 1 dzień dla najmłodszych. Naucz się kodowania w Pythonie w 12 godzin Python w 1 dzień dla najmłodszych. Naucz się kodowania w Pythonie w 12 godzin
-
Oto uzupełnione i zaktualizowane wydanie bestsellerowego przewodnika dla inżynierów sieci. Dzięki niemu przejdziesz trudną (ale ekscytującą!) drogę od tradycyjnej platformy do platformy sieciowej opartej na najlepszych praktykach programistycznych. Zaczniesz od zagadnień podstawowych, aby następn...
Zaawansowana inżynieria sieci w Pythonie. Automatyzacja, monitorowanie i zarządzanie chmurą. Wydanie IV Zaawansowana inżynieria sieci w Pythonie. Automatyzacja, monitorowanie i zarządzanie chmurą. Wydanie IV
(77.40 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
Oto drugie, zaktualizowane i uzupełnione wydanie przewodnika po bibliotece Pandas. Dzięki tej przystępnej książce nauczysz się w pełni korzystać z możliwości oferowanych przez bibliotekę, nawet jeśli dopiero zaczynasz przygodę z analizą danych w Pythonie. Naukę rozpoczniesz z użyciem rzeczywisteg...
Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II Jak analizować dane z biblioteką Pandas. Praktyczne wprowadzenie. Wydanie II
(65.40 zł najniższa cena z 30 dni)70.85 zł
109.00 zł(-35%) -
Zanurz się w fascynujący świat programowania w języku Python i osiągnij imponujący poziom umiejętności w zaledwie 24 godziny! Oto kilka zalet, które sprawiają, że ta książka jest niezbędna dla każdego aspirującego programisty: Szybki start: podstawy Pythona już w pierwszych godzinach nauki ...
Python w 1 dzień. Nauka programowania w Pythonie w 24 godziny od A do Z Python w 1 dzień. Nauka programowania w Pythonie w 24 godziny od A do Z
-
To książka przeznaczona dla osób, które pracują ze zbiorami danych. Jest praktycznym przewodnikiem po koncepcjach algebry liniowej, pomyślanym tak, by ułatwić ich zrozumienie i zastosowanie w użytecznych obliczeniach. Poszczególne zagadnienia przedstawiono za pomocą kodu Pythona, wraz z przykłada...
Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie
(46.20 zł najniższa cena z 30 dni)50.05 zł
77.00 zł(-35%) -
Ta książka stanowi wszechstronne omówienie wszystkich bibliotek Pythona, potrzebnych naukowcom i specjalistom pracującym z danymi. Znalazł się tu dokładny opis IPythona, NumPy, Pandas, Matplotlib, Scikit-Learn i innych narzędzi. Podręcznik uwzględnia przede wszystkim ich aspekty praktyczne, dzięk...
Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II Python Data Science. Niezbędne narzędzia do pracy z danymi. Wydanie II
(77.40 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
To trzecie, zaktualizowane i uzupełnione wydanie bestsellerowego podręcznika programowania w Pythonie. Naukę rozpoczniesz od podstawowych koncepcji programowania. Poznasz takie pojęcia jak zmienne, listy, klasy i pętle, a następnie utrwalisz je dzięki praktycznym ćwiczeniom. Dowiesz się, jak zape...(71.40 zł najniższa cena z 30 dni)
77.35 zł
119.00 zł(-35%) -
Django służy do tworzenia aplikacji internetowych w Pythonie. Pozwala w pełni skorzystać z zalet tego języka, a przy tym jest łatwy do nauki. Praca z Django jest atrakcyjna dla programistów o różnym stopniu zaawansowania, co potwierdzają badania ankietowe serwisu Stack Overflow. Aby...
Django 4. Praktyczne tworzenie aplikacji sieciowych. Wydanie IV Django 4. Praktyczne tworzenie aplikacji sieciowych. Wydanie IV
(77.40 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
Dzięki tej książce zrozumiesz, że w rekurencji nie kryje się żadna magia. Dowiesz się, na czym polega jej działanie i kiedy warto zastosować algorytm rekursywny, a kiedy lepiej tego nie robić. Poznasz szereg klasycznych i mniej znanych algorytmów rekurencyjnych. Pracę z zawartym tu materiałem uła...
Rekurencyjna książka o rekurencji. Zostań mistrzem rozmów kwalifikacyjnych poświęconych językom Python i JavaScript Rekurencyjna książka o rekurencji. Zostań mistrzem rozmów kwalifikacyjnych poświęconych językom Python i JavaScript
(47.40 zł najniższa cena z 30 dni)51.35 zł
79.00 zł(-35%) -
Ta książka jest trzecim, starannie zaktualizowanym wydaniem wyczerpującego przewodnika po narzędziach analitycznych Pythona. Uwzględnia Pythona 3.0 i bibliotekę pandas 1.4. Została napisana w przystępny sposób, a poszczególne zagadnienia bogato zilustrowano przykładami, studiami rzeczywistych prz...
Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III Python w analizie danych. Przetwarzanie danych za pomocą pakietów pandas i NumPy oraz środowiska Jupyter. Wydanie III
(71.40 zł najniższa cena z 30 dni)77.35 zł
119.00 zł(-35%)
O autorze ebooka
Holden Karau, Mika Kimmins - pozostałe książki
-
Serverless computing enables developers to concentrate solely on their applications rather than worry about where they've been deployed. With the Ray general-purpose serverless implementation in Python, programmers and data scientists can hide servers, implement stateful applications, support dir...(186.15 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
If you're training a machine learning model but aren't sure how to put it into production, this book will get you there. Kubeflow provides a collection of cloud native tools for different stages of a model's lifecycle, from data exploration, feature preparation, and model training to model servin...(143.65 zł najniższa cena z 30 dni)
143.65 zł
169.00 zł(-15%) -
Apache Spark is amazing when everything clicks. But if you haven’t seen the performance improvements you expected, or still don’t feel confident enough to use Spark in production, this practical book is for you. Authors Holden Karau and Rachel Warren demonstrate performance optimizati...
High Performance Spark. Best Practices for Scaling and Optimizing Apache Spark High Performance Spark. Best Practices for Scaling and Optimizing Apache Spark
(143.65 zł najniższa cena z 30 dni)143.65 zł
169.00 zł(-15%) -
When people want a way to process big data at speed, Spark is invariably the solution. With its ease of development (in comparison to the relative complexity of Hadoop), it’s unsurprising that it’s becoming popular with data analysts and engineers everywhere. Beginning with the fund...
Fast Data Processing with Spark 2. Accelerate your data for rapid insight - Third Edition Fast Data Processing with Spark 2. Accelerate your data for rapid insight - Third Edition
Ebooka "Scaling Python with Dask" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Scaling Python with Dask" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Scaling Python with Dask" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-10-981-1983-6, 9781098119836
- Data wydania ebooka:
- 2023-07-19 Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 8.6MB
- Rozmiar pliku Mobi:
- 20.1MB
Spis treści ebooka
- Preface
- A Note on Responsibility
- Conventions Used in This Book
- Online Figures
- License
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- 1. What Is Dask?
- Why Do You Need Dask?
- Where Does Dask Fit in the Ecosystem?
- Big Data
- Data Science
- Parallel to Distributed Python
- Dask Community Libraries
- Accelerated Python
- SQL engines
- Workflow scheduling
- What Dask Is Not
- Conclusion
- 2. Getting Started with Dask
- Installing Dask Locally
- Hello Worlds
- Task Hello World
- Sleepy task
- Nested tasks
- Task Hello World
- Distributed Collections
- Dask arrays
- Dask bags and a word count
- Dask DataFrame (Pandas/What People Wish Big Data Was)
- Conclusion
- 3. How Dask Works: The Basics
- Execution Backends
- Local Backends
- Distributed (Dask Client and Scheduler)
- Auto-scaling
- Important limitations with the Dask client
- Libraries and dependencies in distributed clusters
- Execution Backends
- Dasks Diagnostics User Interface
- Serialization and Pickling
- Partitioning/Chunking Collections
- Dask Arrays
- Dask Bags
- Dask DataFrames
- Shuffles
- Partitions During Load
- Tasks, Graphs, and Lazy Evaluation
- Lazy Evaluation
- Task Dependencies
- visualize
- Intermediate Task Results
- Task Sizing
- When Task Graphs Get Too Large
- Combining Computation
- Persist, Caching, and Memoization
- Fault Tolerance
- Conclusion
- 4. Dask DataFrame
- How Dask DataFrames Are Built
- Loading and Writing
- Formats
- Filesystems
- Indexing
- Shuffles
- Rolling Windows and map_overlap
- Aggregations
- Full Shuffles and Partitioning
- Partitioning
- Embarrassingly Parallel Operations
- Working with Multiple DataFrames
- Multi-DataFrame Internals
- Missing Functionality
- What Does Not Work
- Whats Slower
- Handling Recursive Algorithms
- Re-computed Data
- How Other Functions Are Different
- Data Science with Dask DataFrame: Putting It Together
- Deciding to Use Dask
- Exploratory Data Analysis with Dask
- Loading Data
- Plotting Data
- Inspecting Data
- Conclusion
- 5. Dasks Collections
- Dask Arrays
- Common Use Cases
- When Not to Use Dask Arrays
- Loading/Saving
- Whats Missing
- Special Dask Functions
- Dask Arrays
- Dask Bags
- Common Use Cases
- Loading and Saving Dask Bags
- Loading Messy Data with a Dask Bag
- Limitations
- Conclusion
- 6. Advanced Task Scheduling:
Futures and Friends
- Lazy and Eager Evaluation Revisited
- Use Cases for Futures
- Launching Futures
- Future Life Cycle
- Fire-and-Forget
- Retrieving Results
- Nested Futures
- Conclusion
- 7. Adding Changeable/Mutable State
with Dask Actors
- What Is the Actor Model?
- Dask Actors
- Your First Actor (Its a Bank Account)
- Scaling Dask Actors
- Limitations
- When to Use Dask Actors
- Conclusion
- 8. How to Evaluate Dasks
Components and Libraries
- Qualitative Considerations for Project Evaluation
- Project Priorities
- Community
- Dask-Specific Best Practices
- Up-to-Date Dependencies
- Documentation
- Openness to Contributions
- Extensibility
- Qualitative Considerations for Project Evaluation
- Quantitative Metrics for Open Source Project Evaluation
- Release History
- Commit Frequency (and Volume)
- Library Usage
- Code and Best Practices
- Conclusion
- 9. Migrating Existing Analytic Engineering
- Why Dask?
- Limitations of Dask
- Migration Road Map
- Types of Clusters
- Development: Considerations
- DataFrame performance
- Porting SQL to Dask
- Deployment Monitoring
- Conclusion
- 10. Dask with GPUs and Other
Special Resources
- Transparent Versus Non-transparent Accelerators
- Understanding Whether GPUs or TPUs Can Help
- Making Dask Resource-Aware
- Installing the Libraries
- Using Custom Resources Inside Your Dask Tasks
- Decorators (Including Numba)
- GPUs
- GPU Acceleration Built on Top of Dask
- cuDF
- BlazingSQL
- cuStreamz
- Freeing Accelerator Resources
- Design Patterns: CPU Fallback
- Conclusion
- 11. Machine Learning with Dask
- Parallelizing ML
- When to Use Dask-ML
- Getting Started with Dask-ML and XGBoost
- Feature Engineering
- Model Selection and Training
- When There Is No Dask-ML Equivalent
- Use with Dasks joblib
- XGBoost with Dask
- ML Models with Dask-SQL
- Inference and Deployment
- Distributing Data and Models Manually
- Large-Scale Inferences with Dask
- Conclusion
- 12. Productionizing Dask: Notebooks, Deployment, Tuning, and Monitoring
- Factors to Consider in a Deployment Option
- Building Dask on a Kubernetes Deployment
- Dask on Ray
- Dask on YARN
- Dask on High-Performance Computing
- Setting Up Dask in a Remote Cluster
- Connecting a Local Machine to an HPC Cluster
- Dask JupyterLab Extension and Magics
- Installing JupyterLab Extensions
- Launching Clusters
- UI
- Watching Progress
- Understanding Dask Performance
- Metrics in Distributed Computing
- The Dask Dashboard
- Task stream
- Memory
- Task progress
- Task graph
- Saving and Sharing Dask Metrics/Performance Logs
- Advanced Diagnostics
- Scaling and Debugging Best Practices
- Manual Scaling
- Adaptive/Auto-scaling
- Persist and Delete Costly Data
- Dask Nanny
- Worker Memory Management
- Cluster Sizing
- Chunking, Revisited
- Avoid Rechunking
- Scheduled Jobs
- Deployment Monitoring
- Conclusion
- A. Key System Concepts for Dask Users
- Testing
- Manual Testing
- Unit Testing
- Integration Testing
- Test-Driven Development
- Property Testing
- Working with Notebooks
- Out-of-Notebook Testing
- In-Notebook Testing: In-Line Assertions
- Testing
- Data and Output Validation
- Peer-to-Peer Versus Centralized Distributed
- Methods of Parallelism
- Task Parallelism
- Data Parallelism
- Shuffles and narrow versus wide transformations
- Limitations
- Load Balancing
- Network Fault Tolerance and CAP Theorem
- Recursion (Tail and Otherwise)
- Versioning and Branching: Code and Data
- Isolation and Noisy Neighbors
- Machine Fault Tolerance
- Scalability (Up and Down)
- Cache, Memory, Disk, and Networking: How the Performance Changes
- Hashing
- Data Locality
- Exactly Once Versus At Least Once
- Conclusion
- B. Scalable DataFrames: A Comparison
and Some History
- Tools
- One Machine Only
- Pandas
- H2Os DataTable
- Polars
- One Machine Only
- Distributed
- ASF Spark DataFrame
- SparklingPandas
- Spark Koalas/Spark pandas DataFrames
- Cylon
- Ibis
- Modin
- Vanilla Dask DataFrame
- cuDF
- Tools
- Conclusion
- C. Debugging Dask
- Using Debuggers
- General Debugging Tips with Dask
- Native Errors
- Some Notes on Official Advice for Handling Bad Records
- Dask Diagnostics
- Conclusion
- D. Streaming with Streamz and Dask
- Getting Started with Streamz on Dask
- Streaming Data Sources and Sinks
- Word Count
- GPU Pipelines on Dask Streaming
- Limitations, Challenges, and Workarounds
- Conclusion
- Index
O'Reilly Media - inne książki
-
JavaScript gives web developers great power to create rich interactive browser experiences, and much of that power is provided by the browser itself. Modern web APIs enable web-based applications to come to life like never before, supporting actions that once required browser plug-ins. Some are s...(186.15 zł najniższa cena z 30 dni)
186.15 zł
219.00 zł(-15%) -
How will software development and operations have to change to meet the sustainability and green needs of the planet? And what does that imply for development organizations? In this eye-opening book, sustainable software advocates Anne Currie, Sarah Hsu, and Sara Bergman provide a unique overview...(160.65 zł najniższa cena z 30 dni)
169.14 zł
199.00 zł(-15%) -
OpenTelemetry is a revolution in observability data. Instead of running multiple uncoordinated pipelines, OpenTelemetry provides users with a single integrated stream of data, providing multiple sources of high-quality telemetry data: tracing, metrics, logs, RUM, eBPF, and more. This practical gu...(143.65 zł najniższa cena z 30 dni)
143.65 zł
169.00 zł(-15%) -
What will you learn from this book?If you're a software developer looking for a quick on-ramp to software architecture, this handy guide is a great place to start. From the authors of Fundamentals of Software Architecture, Head First Software Architecture teaches you how to think architecturally ...(245.65 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
If you use Linux in your day-to-day work, then Linux Pocket Guide is the perfect on-the-job reference. This thoroughly updated 20th anniversary edition explains more than 200 Linux commands, including new commands for file handling, package management, version control, file format conversions, an...(92.65 zł najniższa cena z 30 dni)
101.15 zł
119.00 zł(-15%) -
Interested in developing embedded systems? Since they don't tolerate inefficiency, these systems require a disciplined approach to programming. This easy-to-read guide helps you cultivate good development practices based on classic software design patterns and new patterns unique to embedded prog...(152.15 zł najniższa cena z 30 dni)
160.65 zł
189.00 zł(-15%) -
Gain the valuable skills and techniques you need to accelerate the delivery of machine learning solutions. With this practical guide, data scientists, ML engineers, and their leaders will learn how to bridge the gap between data science and Lean product delivery in a practical and simple way. Dav...(245.65 zł najniższa cena z 30 dni)
245.65 zł
289.00 zł(-15%) -
This practical book provides a detailed explanation of the zero trust security model. Zero trust is a security paradigm shift that eliminates the concept of traditional perimeter-based security and requires you to "always assume breach" and "never trust but always verify." The updated edition off...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Decentralized finance (DeFi) is a rapidly growing field in fintech, having grown from $700 million to $100 billion over the past three years alone. But the lack of reliable information makes this area both risky and murky. In this practical book, experienced securities attorney Alexandra Damsker ...(203.15 zł najniższa cena z 30 dni)
211.65 zł
249.00 zł(-15%) -
Whether you're a startup founder trying to disrupt an industry or an entrepreneur trying to provoke change from within, your biggest challenge is creating a product people actually want. Lean Analytics steers you in the right direction.This book shows you how to validate your initial idea, find t...(126.65 zł najniższa cena z 30 dni)
126.65 zł
149.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
Oceny i opinie klientów: Scaling Python with Dask Holden Karau, Mika Kimmins (0) Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.