Data Wrangling with Python. Tips and Tools to Make Your Life Easier
![Język publikacji: angielski Język publikacji: angielski](https://static01.helion.com.pl/global/flagi/1.png)
- Autorzy:
- Jacqueline Kazil, Katharine Jarmul
![Data Wrangling with Python. Tips and Tools to Make Your Life Easier Jacqueline Kazil, Katharine Jarmul - okładka ebooka](https://static01.helion.com.pl/global/okladki/326x466/e_2gjn.png)
![Data Wrangling with Python. Tips and Tools to Make Your Life Easier Jacqueline Kazil, Katharine Jarmul - tył okładki ebooka](https://static01.helion.com.pl/global/okladki-tyl/326x466/e_2gjn.png)
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 508
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Data Wrangling with Python. Tips and Tools to Make Your Life Easier
How do you take your data analysis skills beyond Excel to the next level? By learning just enough Python to get stuff done. This hands-on guide shows non-programmers like you how to process information that’s initially too messy or difficult to access. You don't need to know a thing about the Python programming language to get started.
Through various step-by-step exercises, you’ll learn how to acquire, clean, analyze, and present data efficiently. You’ll also discover how to automate your data process, schedule file- editing and clean-up tasks, process larger datasets, and create compelling stories with data you obtain.
- Quickly learn basic Python syntax, data types, and language concepts
- Work with both machine-readable and human-consumable data
- Scrape websites and APIs to find a bounty of useful information
- Clean and format data to eliminate duplicates and errors in your datasets
- Learn when to standardize data and when to test and script data cleanup
- Explore and analyze your datasets with new Python libraries and techniques
- Use Python solutions to automate your entire data-wrangling process
Wybrane bestsellery
-
This book is the ultimate guide to using latest features of Python 3.x to scrape data from websites. Learn right from extracting data from static web pages to creating class-based scrapers with Scrapy libraries. This book will also help you build crawlers and determine how to scrape data from Jav...
Python Web Scraping. Hands-on data scraping and crawling using PyQT, Selnium, HTML and Python - Second Edition Python Web Scraping. Hands-on data scraping and crawling using PyQT, Selnium, HTML and Python - Second Edition
-
Between major privacy regulations like the GDPR and CCPA and expensive and notorious data breaches, there has never been so much pressure to ensure data privacy. Unfortunately, integrating privacy into data systems is still complicated. This essential guide will give you a fundamental understandi...(203.15 zł najniższa cena z 30 dni)
204.94 zł
239.00 zł(-14%) -
Dzięki tej książce dowiesz się, jak pozyskiwać, analizować i wizualizować dane, a potem używać ich do rozwiązywania problemów biznesowych. Wystarczy, że znasz podstawy Pythona i matematyki na poziomie liceum, aby zacząć stosować naukę o danych w codziennej pracy. Znajdziesz tu szereg praktycznych...
Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym Data science i Python. Stawianie czoła najtrudniejszym wyzwaniom biznesowym
(55.20 zł najniższa cena z 30 dni)48.30 zł
69.00 zł(-30%) -
Pytest – nowoczesny framework do uruchamiania testów automatycznych w języku Python. Można używać tej platformy do przeprowadzania testów jednostkowych, ale sprawdzi się świetnie także podczas konstruowania rozbudowanych testów wyższego poziomu (integracyjnych, end-to-end) dla całych aplika...
Pytest. Kurs video. Automatyzacja testów w Pythonie Pytest. Kurs video. Automatyzacja testów w Pythonie
(44.70 zł najniższa cena z 30 dni)96.85 zł
149.00 zł(-35%) -
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(53.40 zł najniższa cena z 30 dni)62.30 zł
89.00 zł(-30%) -
Sposobów na naukę Pythona jest sporo i powstało na ten temat mnóstwo publikacji. Jeżeli ten wybór jest właśnie przed Tobą, rozważ naukę Pythona poprzez tworzenie prostych gier. Ich programowanie to nie tylko świetna zabawa, ale też doskonała metoda rozwijania umiejętności algorytmicznych, kreatyw...
Python od podstaw. Kurs video. Tworzenie pierwszych gier w PyCharm Python od podstaw. Kurs video. Tworzenie pierwszych gier w PyCharm
(51.60 zł najniższa cena z 30 dni)64.50 zł
129.00 zł(-50%) -
To trzecie, zaktualizowane i uzupełnione wydanie bestsellerowego podręcznika programowania w Pythonie. Naukę rozpoczniesz od podstawowych koncepcji programowania. Poznasz takie pojęcia jak zmienne, listy, klasy i pętle, a następnie utrwalisz je dzięki praktycznym ćwiczeniom. Dowiesz się, jak zape...(71.40 zł najniższa cena z 30 dni)
83.30 zł
119.00 zł(-30%) -
Głębokie sieci neuronowe mają niesamowity potencjał. Osiągnięcia ostatnich lat nadały procesom uczenia głębokiego zupełnie nową jakość. Obecnie nawet programiści niezaznajomieni z tą technologią mogą korzystać z prostych i niezwykle skutecznych narzędzi, pozwalających na sprawne implementowanie p...
Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III
(107.40 zł najniższa cena z 30 dni)125.30 zł
179.00 zł(-30%) -
Ta książka stanowi przystępne wprowadzenie do świata projektantów i budowniczych robotów. Dzięki niej dowiesz się, jak wybrać potrzebne podzespoły, jak je ze sobą połączyć i jak wykorzystywać poszczególne urządzenia wejścia i wyjścia. Posłużysz się w tym celu płytką Raspberry Pi i kompatybilnymi ...
Jak zaprogramować robota. Zastosowanie Raspberry Pi i Pythona w tworzeniu autonomicznych robotów. Wydanie II Jak zaprogramować robota. Zastosowanie Raspberry Pi i Pythona w tworzeniu autonomicznych robotów. Wydanie II
(59.40 zł najniższa cena z 30 dni)69.30 zł
99.00 zł(-30%) -
Fachowcy z branży IT, by dobrze wykonywać swoją pracę, muszą w niej zwykle używać od kilku do kilkunastu narzędzi. Z drugiej strony nikt nie jest w stanie dobrze poznać nawet wycinka wszystkich technologii, języków programowania czy aplikacji, które powstają każdego roku. Czy wśród tego bogactwa,...
Receptura na Python. Kurs Video. 54 praktyczne porady dla programistów Receptura na Python. Kurs Video. 54 praktyczne porady dla programistów
(39.90 zł najniższa cena z 30 dni)129.35 zł
199.00 zł(-35%)
O autorze ebooka
Katharine Jarmul jest znaną badaczką, programistką i wykładowczynią. W swojej pracy koncentruje się na zapewnianiu prywatności i bezpieczeństwa w przepływie danych. Z powodzeniem wdraża systemy przetwarzania danych zapewniające wysoki stopień ich prywatności i bezpieczeństwa.
Ebooka "Data Wrangling with Python. Tips and Tools to Make Your Life Easier" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Data Wrangling with Python. Tips and Tools to Make Your Life Easier" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Data Wrangling with Python. Tips and Tools to Make Your Life Easier" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-919-4877-4, 9781491948774
- Data wydania ebooka:
-
2016-02-04
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 6.0MB
- Rozmiar pliku Mobi:
- 6.0MB
Spis treści ebooka
- Preface
- Who Should Read This Book
- Who Should Not Read This Book
- How This Book Is Organized
- What Is Data Wrangling?
- What to Do If You Get Stuck
- Conventions Used in This Book
- Using Code Examples
- Safari Books Online
- How to Contact Us
- Acknowledgments
- 1. Introduction to Python
- Why Python
- Getting Started with Python
- Which Python Version
- Setting Up Python on Your Machine
- Mac OS X
- Windows 8 and 10
- Test Driving Python
- Install pip
- Install a Code Editor
- Optional: Install IPython
- Summary
- 2. Python Basics
- Basic Data Types
- Strings
- Integers and Floats
- Integers
- Floats, decimals, and other nonwhole number types
- Basic Data Types
- Data Containers
- Variables
- Lists
- Dictionaries
- What Can the Various Data Types Do?
- String Methods: Things Strings Can Do
- Numerical Methods: Things Numbers Can Do
- List Methods: Things Lists Can Do
- Dictionary Methods: Things Dictionaries Can Do
- Helpful Tools: type, dir, and help
- type
- dir
- help
- Putting It All Together
- What Does It All Mean?
- Summary
- 3. Data Meant to Be Read by Machines
- CSV Data
- How to Import CSV Data
- Saving the Code to a File; Running from Command Line
- CSV Data
- JSON Data
- How to Import JSON Data
- XML Data
- How to Import XML Data
- Summary
- 4. Working with Excel Files
- Installing Python Packages
- Parsing Excel Files
- Getting Started with Parsing
- Summary
- 5. PDFs and Problem Solving in Python
- Avoid Using PDFs!
- Programmatic Approaches to PDF Parsing
- Opening and Reading Using slate
- Converting PDF to Text
- Parsing PDFs Using pdfminer
- Learning How to Solve Problems
- Exercise: Use Table Extraction, Try a Different Library
- Exercise: Clean the Data Manually
- Exercise: Try Another Tool
- Uncommon File Types
- Summary
- 6. Acquiring and Storing Data
- Not All Data Is Created Equal
- Fact Checking
- Readability, Cleanliness, and Longevity
- Where to Find Data
- Using a Telephone
- US Government Data
- Government and Civic Open Data Worldwide
- EU and UK
- Africa
- Asia
- Non-EU Europe, Central Asia, India, the Middle East, and Russia
- South America and Canada
- Organization and Non-Government Organization (NGO) Data
- Education and University Data
- Medical and Scientific Data
- Crowdsourced Data and APIs
- Case Studies: Example Data Investigation
- Ebola Crisis
- Train Safety
- Football Salaries
- Child Labor
- Storing Your Data: When, Why, and How?
- Databases: A Brief Introduction
- Relational Databases: MySQL and PostgreSQL
- MySQL and Python
- PostgreSQL and Python
- Relational Databases: MySQL and PostgreSQL
- Non-Relational Databases: NoSQL
- MongoDB with Python
- Setting Up Your Local Database with Python
- When to Use a Simple File
- Cloud-Storage and Python
- Local Storage and Python
- Alternative Data Storage
- Summary
- 7. Data Cleanup: Investigation, Matching, and Formatting
- Why Clean Data?
- Data Cleanup Basics
- Identifying Values for Data Cleanup
- Replacing headers
- Zipping questions and answers
- Identifying Values for Data Cleanup
- Formatting Data
- Finding Outliers and Bad Data
- Finding Duplicates
- Fuzzy Matching
- RegEx Matching
- What to Do with Duplicate Records
- Summary
- 8. Data Cleanup: Standardizing and Scripting
- Normalizing and Standardizing Your Data
- Saving Your Data
- Determining What Data Cleanup Is Right for Your Project
- Scripting Your Cleanup
- Testing with New Data
- Summary
- 9. Data Exploration and Analysis
- Exploring Your Data
- Importing Data
- Exploring Table Functions
- Joining Numerous Datasets
- Identifying Correlations
- Identifying Outliers
- Creating Groupings
- Further Exploration
- Exploring Your Data
- Analyzing Your Data
- Separating and Focusing Your Data
- What Is Your Data Saying?
- Drawing Conclusions
- Documenting Your Conclusions
- Summary
- 10. Presenting Your Data
- Avoiding Storytelling Pitfalls
- How Will You Tell the Story?
- Know Your Audience
- Avoiding Storytelling Pitfalls
- Visualizing Your Data
- Charts
- Charting with matplotlib
- Charting with Bokeh
- Charts
- Time-Related Data
- Time series data
- Timeline data
- Maps
- Interactives
- Words
- Images, Video, and Illustrations
- Presentation Tools
- Publishing Your Data
- Using Available Sites
- Medium
- Easy-to-start sites: WordPress, Squarespace
- Your own blog
- Using Available Sites
- Open Source Platforms: Starting a New Site
- Ghost
- GitHub Pages and Jekyll
- One-click deploys
- Jupyter (Formerly Known as IPython Notebooks)
- Shared Jupyter notebooks
- Summary
- 11. Web Scraping: Acquiring and Storing Data from the Web
- What to Scrape and How
- Analyzing a Web Page
- Inspection: Markup Structure
- Network/Timeline: How the Page Loads
- Console: Interacting with JavaScript
- Style basics
- jQuery and JavaScript
- In-Depth Analysis of a Page
- Getting Pages: How to Request on the Internet
- Reading a Web Page with Beautiful Soup
- Reading a Web Page with LXML
- A Case for XPath
- Summary
- 12. Advanced Web Scraping: Screen Scrapers and Spiders
- Browser-Based Parsing
- Screen Reading with Selenium
- Selenium and headless browsers
- Screen Reading with Selenium
- Screen Reading with Ghost.Py
- Browser-Based Parsing
- Spidering the Web
- Building a Spider with Scrapy
- Crawling Whole Websites with Scrapy
- Networks: How the Internet Works and Why Its Breaking Your Script
- The Changing Web (or Why Your Script Broke)
- A (Few) Word(s) of Caution
- Summary
- 13. APIs
- API Features
- REST Versus Streaming APIs
- Rate Limits
- Tiered Data Volumes
- API Keys and Tokens
- Creating a Twitter API key and access token
- API Features
- A Simple Data Pull from Twitters REST API
- Advanced Data Collection from Twitters REST API
- Advanced Data Collection from Twitters Streaming API
- Summary
- 14. Automation and Scaling
- Why Automate?
- Steps to Automate
- What Could Go Wrong?
- Where to Automate
- Special Tools for Automation
- Using Local Files, argv, and Config Files
- Local files
- Config files
- Command-line arguments
- Using Local Files, argv, and Config Files
- Using the Cloud for Data Processing
- Using Git to deploy Python
- Using Parallel Processing
- Using Distributed Processing
- Simple Automation
- CronJobs
- Web Interfaces
- Jupyter Notebooks
- Large-Scale Automation
- Celery: Queue-Based Automation
- Ansible: Operations Automation
- Monitoring Your Automation
- Python Logging
- Adding Automated Messaging
- SMS and voice
- Chat integration
- Uploading and Other Reporting
- Logging and Monitoring as a Service
- Logging and exceptions
- Logging and monitoring
- No System Is Foolproof
- Summary
- 15. Conclusion
- Duties of a Data Wrangler
- Beyond Data Wrangling
- Become a Better Data Analyst
- Become a Better Developer
- Become a Better Visual Storyteller
- Become a Better Systems Architect
- Where Do You Go from Here?
- A. Comparison of Languages Mentioned
- C, C++, and Java Versus Python
- R or MATLAB Versus Python
- HTML Versus Python
- JavaScript Versus Python
- Node.js Versus Python
- Ruby and Ruby on Rails Versus Python
- B. Python Resources for Beginners
- Online Resources
- In-Person Groups
- C. Learning the Command Line
- Bash
- Navigation
- Modifying Files
- Executing Files
- Searching with the Command Line
- More Resources
- Bash
- Windows CMD/Power Shell
- Navigation
- Modifying Files
- Executing Files
- Searching with the Command Line
- More Resources
- D. Advanced Python Setup
- Step 1: Install GCC
- Step 2: (Mac Only) Install Homebrew
- Step 3: (Mac Only) Tell Your System Where to Find Homebrew
- Step 4: Install Python 2.7
- Step 5: Install virtualenv (Windows, Mac, Linux)
- Step 6: Set Up a New Directory
- Step 7: Install virtualenvwrapper
- Installing virtualenvwrapper (Mac and Linux)
- Updating your .bashrc
- Installing virtualenvwrapper (Mac and Linux)
- Installing virtualenvwrapper-win (Windows)
- Testing Your Virtual Environment (Windows, Mac, Linux)
- Learning About Our New Environment (Windows, Mac, Linux)
- Advanced Setup Review
- E. Python Gotchas
- Hail the Whitespace
- The Dreaded GIL
- = Versus == Versus is, and When to Just Copy
- Default Function Arguments
- Python Scope and Built-Ins: The Importance of Variable Names
- Defining Objects Versus Modifying Objects
- Changing Immutable Objects
- Type Checking
- Catching Multiple Exceptions
- The Power of Debugging
- F. IPython Hints
- Why Use IPython?
- Getting Started with IPython
- Magic Functions
- Final Thoughts: A Simpler Terminal
- G. Using Amazon Web Services
- Spinning Up an AWS Server
- AWS Step 1: Choose an Amazon Machine Image (AMI)
- AWS Step 2: Choose an Instance Type
- AWS Step 7: Review Instance Launch
- AWS Extra Question: Select an Existing Key Pair or Create a New One
- Spinning Up an AWS Server
- Logging into an AWS Server
- Get the Public DNS Name of the Instance
- Prepare Your Private Key
- Log into Your Server
- Summary
- Index
O'Reilly Media - inne książki
-
Keeping up with the Python ecosystem can be daunting. Its developer tooling doesn't provide the out-of-the-box experience native to languages like Rust and Go. When it comes to long-term project maintenance or collaborating with others, every Python project faces the same problem: how to build re...(203.15 zł najniższa cena z 30 dni)
206.29 zł
239.00 zł(-14%) -
Bringing a deep-learning project into production at scale is quite challenging. To successfully scale your project, a foundational understanding of full stack deep learning, including the knowledge that lies at the intersection of hardware, software, data, and algorithms, is required.This book il...(237.15 zł najniższa cena z 30 dni)
248.30 zł
289.00 zł(-14%) -
Frontend developers have to consider many things: browser compatibility, usability, performance, scalability, SEO, and other best practices. But the most fundamental aspect of creating websites is one that often falls short: accessibility. Accessibility is the cornerstone of any website, and if a...(194.65 zł najniższa cena z 30 dni)
206.20 zł
239.00 zł(-14%) -
In this insightful and comprehensive guide, Addy Osmani shares more than a decade of experience working on the Chrome team at Google, uncovering secrets to engineering effectiveness, efficiency, and team success. Engineers and engineering leaders looking to scale their effectiveness and drive tra...(118.15 zł najniższa cena z 30 dni)
120.29 zł
149.00 zł(-19%) -
Data modeling is the single most overlooked feature in Power BI Desktop, yet it's what sets Power BI apart from other tools on the market. This practical book serves as your fast-forward button for data modeling with Power BI, Analysis Services tabular, and SQL databases. It serves as a starting ...(194.65 zł najniższa cena z 30 dni)
205.54 zł
239.00 zł(-14%) -
C# is undeniably one of the most versatile programming languages available to engineers today. With this comprehensive guide, you'll learn just how powerful the combination of C# and .NET can be. Author Ian Griffiths guides you through C# 12.0 and .NET 8 fundamentals and techniques for building c...(228.65 zł najniższa cena z 30 dni)
248.59 zł
289.00 zł(-14%) -
Learn how to get started with Futures Thinking. With this practical guide, Phil Balagtas, founder of the Design Futures Initiative and the global Speculative Futures network, shows you how designers and futurists have made futures work at companies such as Atari, IBM, Apple, Disney, Autodesk, Luf...(152.15 zł najniższa cena z 30 dni)
153.85 zł
179.00 zł(-14%) -
Augmented Analytics isn't just another book on data and analytics; it's a holistic resource for reimagining the way your entire organization interacts with information to become insight-driven.Moving beyond traditional, limited ways of making sense of data, Augmented Analytics provides a dynamic,...(180.20 zł najniższa cena z 30 dni)
180.15 zł
219.00 zł(-18%) -
Learn how to prepare for—and pass—the Kubernetes and Cloud Native Associate (KCNA) certification exam. This practical guide serves as both a study guide and point of entry for practitioners looking to explore and adopt cloud native technologies. Adrián González Sánchez ...
Kubernetes and Cloud Native Associate (KCNA) Study Guide Kubernetes and Cloud Native Associate (KCNA) Study Guide
(169.14 zł najniższa cena z 30 dni)177.65 zł
209.00 zł(-15%) -
Python is an excellent way to get started in programming, and this clear, concise guide walks you through Python a step at a time—beginning with basic programming concepts before moving on to functions, data structures, and object-oriented design. This revised third edition reflects the gro...(147.71 zł najniższa cena z 30 dni)
147.51 zł
179.00 zł(-18%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
![Loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
![ajax-loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
Oceny i opinie klientów: Data Wrangling with Python. Tips and Tools to Make Your Life Easier Jacqueline Kazil, Katharine Jarmul (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.