Practical Python Data Wrangling and Data Quality
![Język publikacji: angielski Język publikacji: angielski](https://static01.helion.com.pl/global/flagi/1.png)
- Autor:
- Susan E. McGregor
![Practical Python Data Wrangling and Data Quality Susan E. McGregor - okładka ebooka](https://static01.helion.com.pl/global/okladki/326x466/e_2qmr.png)
![Practical Python Data Wrangling and Data Quality Susan E. McGregor - tył okładki ebooka](https://static01.helion.com.pl/global/okladki-tyl/326x466/e_2qmr.png)
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 416
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Practical Python Data Wrangling and Data Quality
The world around us is full of data that holds unique insights and valuable stories, and this book will help you uncover them. Whether you already work with data or want to learn more about its possibilities, the examples and techniques in this practical book will help you more easily clean, evaluate, and analyze data so that you can generate meaningful insights and compelling visualizations.
Complementing foundational concepts with expert advice, author Susan E. McGregor provides the resources you need to extract, evaluate, and analyze a wide variety of data sources and formats, along with the tools to communicate your findings effectively. This book delivers a methodical, jargon-free way for data practitioners at any level, from true novices to seasoned professionals, to harness the power of data.
- Use Python 3.8+ to read, write, and transform data from a variety of sources
- Understand and use programming basics in Python to wrangle data at scale
- Organize, document, and structure your code using best practices
- Collect data from structured data files, web pages, and APIs
- Perform basic statistical analyses to make meaning from datasets
- Visualize and present data in clear and compelling ways
Wybrane bestsellery
-
Oto zaktualizowane wydanie popularnego przewodnika, dzięki któremu skorzystasz z ponad dwustu sprawdzonych receptur bazujących na najnowszych wydaniach bibliotek Pythona. Wystarczy, że skopiujesz i dostosujesz kod do swoich potrzeb. Możesz też go uruchamiać i testować za pomocą przykładowego zbio...
Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II Uczenie maszynowe w Pythonie. Receptury. Od przygotowania danych do deep learningu. Wydanie II
(53.40 zł najniższa cena z 30 dni)53.40 zł
89.00 zł(-40%) -
Sposobów na naukę Pythona jest sporo i powstało na ten temat mnóstwo publikacji. Jeżeli ten wybór jest właśnie przed Tobą, rozważ naukę Pythona poprzez tworzenie prostych gier. Ich programowanie to nie tylko świetna zabawa, ale też doskonała metoda rozwijania umiejętności algorytmicznych, kreatyw...
Python od podstaw. Kurs video. Tworzenie pierwszych gier w PyCharm Python od podstaw. Kurs video. Tworzenie pierwszych gier w PyCharm
(39.90 zł najniższa cena z 30 dni)51.60 zł
129.00 zł(-60%) -
To książka przeznaczona dla osób, które pracują ze zbiorami danych. Jest praktycznym przewodnikiem po koncepcjach algebry liniowej, pomyślanym tak, by ułatwić ich zrozumienie i zastosowanie w użytecznych obliczeniach. Poszczególne zagadnienia przedstawiono za pomocą kodu Pythona, wraz z przykłada...
Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie Praktyczna algebra liniowa dla analityków danych. Od podstawowych koncepcji do użytecznych aplikacji w Pythonie
(46.20 zł najniższa cena z 30 dni)46.20 zł
77.00 zł(-40%) -
To trzecie, zaktualizowane i uzupełnione wydanie bestsellerowego podręcznika programowania w Pythonie. Naukę rozpoczniesz od podstawowych koncepcji programowania. Poznasz takie pojęcia jak zmienne, listy, klasy i pętle, a następnie utrwalisz je dzięki praktycznym ćwiczeniom. Dowiesz się, jak zape...(71.40 zł najniższa cena z 30 dni)
71.40 zł
119.00 zł(-40%) -
Głębokie sieci neuronowe mają niesamowity potencjał. Osiągnięcia ostatnich lat nadały procesom uczenia głębokiego zupełnie nową jakość. Obecnie nawet programiści niezaznajomieni z tą technologią mogą korzystać z prostych i niezwykle skutecznych narzędzi, pozwalających na sprawne implementowanie p...
Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wydanie III
(107.40 zł najniższa cena z 30 dni)107.40 zł
179.00 zł(-40%) -
Zawód programisty jest coraz popularniejszym życiowym wyborem - wciąż bowiem rośnie zapotrzebowanie na pracowników IT, a branża oferuje absolwentom informatyki satysfakcjonujące pensje, atrakcyjne warunki pracy, często też możliwość działania zdalnego. Jeśli myślisz o obraniu tej właśnie ścieżki ...
Selenium. Kurs video. Twój pierwszy automatyczny test w Python Selenium. Kurs video. Twój pierwszy automatyczny test w Python
(55.60 zł najniższa cena z 30 dni)69.50 zł
139.00 zł(-50%) -
Ta książka stanowi przystępne wprowadzenie do świata projektantów i budowniczych robotów. Dzięki niej dowiesz się, jak wybrać potrzebne podzespoły, jak je ze sobą połączyć i jak wykorzystywać poszczególne urządzenia wejścia i wyjścia. Posłużysz się w tym celu płytką Raspberry Pi i kompatybilnymi ...
Jak zaprogramować robota. Zastosowanie Raspberry Pi i Pythona w tworzeniu autonomicznych robotów. Wydanie II Jak zaprogramować robota. Zastosowanie Raspberry Pi i Pythona w tworzeniu autonomicznych robotów. Wydanie II
(59.40 zł najniższa cena z 30 dni)59.40 zł
99.00 zł(-40%) -
Python nie jest językiem idealnym, jednak przybywa programistów, którzy uważają go za bliski ideału. Wyróżnia się prostotą i wszechstronnością. Jest wdzięcznym narzędziem do badania danych i tworzenia systemów sztucznej inteligencji, uwielbiają go analitycy, ekonomiści i naukowcy. Może posłużyć d...
Python. Nowoczesne programowanie w prostych krokach. Wydanie II Python. Nowoczesne programowanie w prostych krokach. Wydanie II
(53.40 zł najniższa cena z 30 dni)53.40 zł
89.00 zł(-40%)
Ebooka "Practical Python Data Wrangling and Data Quality" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Practical Python Data Wrangling and Data Quality" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Practical Python Data Wrangling and Data Quality" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-14-920-9145-5, 9781492091455
- Data wydania ebooka:
-
2021-12-03
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 7.4MB
- Rozmiar pliku Mobi:
- 14.2MB
Spis treści ebooka
- Preface
- Who Should Read This Book?
- Who Shouldnt Read This Book?
- What to Expect from This Volume
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- 1. Introduction to Data Wrangling
and Data Quality
- What Is Data Wrangling?
- What Is Data Quality?
- Data Integrity
- Data Fit
- Why Python?
- Versatility
- Accessibility
- Readability
- Community
- Python Alternatives
- Writing and Running Python
- Working with Python on Your Own Device
- Getting Started with the Command Line
- Installing Python, Jupyter Notebook, and a Code Editor
- Chromebook
- Installing Python and Jupyter Notebook
- Installing Atom
- Chromebook
- macOS
- Installing Python and Jupyter Notebook
- Installing Atom
- Windows 10+
- Installing Python and Jupyter Notebook
- Installing Atom
- Testing your setup
- Working with Python Online
- Hello World!
- Using Atom to Create a Standalone Python File
- Using Jupyter to Create a New Python Notebook
- Using Google Colab to Create a New Python Notebook
- Adding the Code
- In a Standalone File
- In a Notebook
- Running the Code
- In a Standalone File
- In a Notebook
- Documenting, Saving, and Versioning Your Work
- Documenting
- Saving
- Versioning
- Getting started with GitHub
- For backing up local files: installing and configuring Git
- Tying it all together
- For backing up online Python files: connecting Google Colab to GitHub
- Tying it all together
- Getting started with GitHub
- Conclusion
- 2. Introduction to Python
- The Programming Parts of Speech
- Nouns Variables
- Whats in a name?
- Best practices for naming variables
- Nouns Variables
- Verbs Functions
- Cooking with Custom Functions
- Libraries: Borrowing Custom Functions from Other Coders
- The Programming Parts of Speech
- Taking Control: Loops and Conditionals
- In the Loop
- One Condition
- Understanding Errors
- Syntax Snafus
- Runtime Runaround
- Logic Loss
- Hitting the Road with Citi Bike Data
- Starting with Pseudocode
- Seeking Scale
- Conclusion
- 3. Understanding Data Quality
- Assessing Data Fit
- Validity
- Reliability
- Representativeness
- Assessing Data Fit
- Assessing Data Integrity
- Necessary, but Not Sufficient
- Of known provenance
- Well-annotated
- Necessary, but Not Sufficient
- Important
- Timely
- Complete
- High volume
- Multivariate
- Atomic
- Achievable
- Consistent
- Clear
- Dimensionally structured
- Improving Data Quality
- Data Cleaning
- Data Augmentation
- Conclusion
- 4. Working with File-Based and Feed-Based Data in Python
- Structured Versus Unstructured Data
- Working with Structured Data
- File-Based, Table-Type DataTake It to Delimit
- When to work with table-type data
- Where to find table-type data
- File-Based, Table-Type DataTake It to Delimit
- Wrangling Table-Type Data with Python
- Reading data from CSVs
- Reading data from TSV and TXT files
- Real-World Data Wrangling: Understanding Unemployment
- XLSX, ODS, and All the Rest
- Finally, Fixed-Width
- Feed-Based DataWeb-Driven Live Updates
- When to work with feed-type data
- Where to find feed-type data
- Wrangling Feed-Type Data with Python
- XML: One markup to rule them all
- JSON: Web data, the next generation
- Working with Unstructured Data
- Image-Based Text: Accessing Data in PDFs
- When to work with text in PDFs
- Where to find PDFs
- Image-Based Text: Accessing Data in PDFs
- Wrangling PDFs with Python
- Accessing PDF Tables with Tabula
- Conclusion
- 5. Accessing Web-Based Data
- Accessing Online XML and JSON
- Introducing APIs
- Basic APIs: A Search Engine Example
- Specialized APIs: Adding Basic Authentication
- Getting a FRED API Key
- Using Your API key to Request Data
- Reading API Documentation
- Protecting Your API Key When Using Python
- Creating Your Credentials File
- Using Your Credentials in a Separate Script
- Getting Started with .gitignore
- Specialized APIs: Working With OAuth
- Applying for a Twitter Developer Account
- Creating Your Twitter App and Credentials
- Encoding Your API Key and Secret
- Requesting an Access Token and Data from the Twitter API
- Requesting an access token: get versus post
- API Ethics
- Web Scraping: The Data Source of Last Resort
- Carefully Scraping the MTA
- Using Browser Inspection Tools
- The Python Web Scraping Solution: Beautiful Soup
- Conclusion
- 6. Assessing Data Quality
- The Pandemic and the PPP
- Assessing Data Integrity
- Is It of Known Pedigree?
- Is It Timely?
- Is It Complete?
- Is It Well-Annotated?
- Is It High Volume?
- Is It Consistent?
- Is It Multivariate?
- Is It Atomic?
- Is It Clear?
- Is It Dimensionally Structured?
- Assessing Data Fit
- Validity
- Reliability
- Representativeness
- The denominator problem
- Conclusion
- 7. Cleaning, Transforming,
and Augmenting Data
- Selecting a Subset of Citi Bike Data
- A Simple Split
- Regular Expressions: Supercharged String Matching
- Making a Date
- Selecting a Subset of Citi Bike Data
- De-crufting Data Files
- Decrypting Excel Dates
- Generating True CSVs from Fixed-Width Data
- Correcting for Spelling Inconsistencies
- The Circuitous Path to Simple Solutions
- Gotchas That Will Get Ya!
- Augmenting Your Data
- Conclusion
- 8. Structuring and Refactoring Your Code
- Revisiting Custom Functions
- Will You Use It More Than Once?
- Is It Ugly and Confusing?
- Do You Just Really Hate the Default Functionality?
- Revisiting Custom Functions
- Understanding Scope
- Defining the Parameters for Function Ingredients
- What Are Your Options?
- Getting Into Arguments?
- Return Values
- Climbing the Stack
- Refactoring for Fun and Profit
- A Function for Identifying Weekdays
- Metadata Without the Mess
- Documenting Your Custom Scripts and Functions with pydoc
- The Case for Command-Line Arguments
- Where Scripts and Notebooks Diverge
- Conclusion
- 9. Introduction to Data Analysis
- Context Is Everything
- Same but Different
- Whats Typical? Evaluating Central Tendency
- Whats That Mean?
- Embrace the Median
- Think Different: Identifying Outliers
- Visualization for Data Analysis
- Whats Our Datas Shape? Understanding Histograms
- The Significance of Symmetry
- Counting Clusters
- The $2 Million Question
- Proportional Response
- Conclusion
- 10. Presenting Your Data
- Foundations for Visual Eloquence
- Making Your Data Statement
- Charts, Graphs, and Maps: Oh My!
- Pie Charts
- Bar and Column Charts
- Line Charts
- Scatter Charts
- Maps
- Elements of Eloquent Visuals
- The Finicky Details Really Do Make a Difference
- Trust Your Eyes (and the Experts)
- Selecting Scales
- Choosing Colors
- Above All, Annotate!
- From Basic to Beautiful: Customizing a Visualization with seaborn and matplotlib
- Beyond the Basics
- Conclusion
- 11. Beyond Python
- Additional Tools for Data Review
- Spreadsheet Programs
- OpenRefine
- Additional Tools for Data Review
- Additional Tools for Sharing and Presenting Data
- Image Editing for JPGs, PNGs, and GIFs
- Software for Editing SVGs and Other Vector Formats
- Reflecting on Ethics
- Conclusion
- A. More Python Programming Resources
- Official Python Documentation
- Installing Python Resources
- Where to Look for Libraries
- Keeping Your Tools Sharp
- Where to Learn More
- B. A Bit More About Git
- You Run git push/pull and End Up in a Weird Text Editor
- Your git push/pull Command Gets Rejected
- Run git pull
- Fixing conflicts manually
- Fixing conflicts by forcing an overwrite
- Run git pull
- Git Quick Reference
- C. Finding Data
- Data Repositories and APIs
- Subject Matter Experts
- FOIA/L Requests
- Custom Data Collection
- D. Resources for Visualization and Information Design
- Foundational Books on Information Visualization
- The Quick Reference Youll Reach For
- Sources of Inspiration
- Index
O'Reilly Media - inne książki
-
Python is an excellent way to get started in programming, and this clear, concise guide walks you through Python a step at a time—beginning with basic programming concepts before moving on to functions, data structures, and object-oriented design. This revised third edition reflects the gro...(151.60 zł najniższa cena z 30 dni)
151.55 zł
179.00 zł(-15%) -
Developers with the ability to operate, troubleshoot, and monitor applications in Kubernetes are in high demand today. To meet this need, the Cloud Native Computing Foundation created a certification exam to establish a developer's credibility and value in the job market for work in a Kubernetes ...
Certified Kubernetes Application Developer (CKAD) Study Guide. 2nd Edition Certified Kubernetes Application Developer (CKAD) Study Guide. 2nd Edition
(185.60 zł najniższa cena z 30 dni)185.40 zł
219.00 zł(-15%) -
The surging predictive analytics market is expected to grow from $10.5 billion today to $28 billion by 2026. With the rise in automation across industries, the increase in data-driven decision-making, and the proliferation of IoT devices, predictive analytics has become an operational necessity i...(194.65 zł najniższa cena z 30 dni)
210.44 zł
249.00 zł(-15%) -
How do some organizations maintain 24-7 internet-scale operations? How can organizations integrate security while continuously deploying new features? How do organizations increase security within their DevOps processes?This practical guide helps you answer those questions and more. Author Steve ...(169.14 zł najniższa cena z 30 dni)
177.20 zł
209.00 zł(-15%) -
Many organizations today analyze and share large, sensitive datasets about individuals. Whether these datasets cover healthcare details, financial records, or exam scores, it's become more difficult for organizations to protect an individual's information through deidentification, anonymization, ...(237.15 zł najniższa cena z 30 dni)
253.90 zł
289.00 zł(-12%) -
Large language models (LLMs) and diffusion models such as ChatGPT and Stable Diffusion have unprecedented potential. Because they have been trained on all the public text and images on the internet, they can make useful contributions to a wide variety of tasks. And with the barrier to entry great...(245.65 zł najniższa cena z 30 dni)
253.50 zł
289.00 zł(-12%) -
Filled with tips, tricks, and techniques, this easy-to-use book is the perfect resource for intermediate to advanced users of Excel. You'll find complete recipes for more than a dozen topics covering formulas, PivotTables, charts, Power Query, and more. Each recipe poses a particular problem and ...(203.15 zł najniższa cena z 30 dni)
211.30 zł
249.00 zł(-15%) -
Traditional data architecture patterns are severely limited. To use these patterns, you have to ETL data into each tool—a cost-prohibitive process for making warehouse features available to all of your data. The lack of flexibility with these patterns requires you to lock into a set of prio...(211.65 zł najniższa cena z 30 dni)
219.54 zł
259.00 zł(-15%) -
In today's data-driven world, understanding statistical models is crucial for effective analysis and decision making. Whether you're a beginner or an experienced user, this book equips you with the foundational knowledge to grasp and implement statistical models within Tableau. Gain the confidenc...(185.60 zł najniższa cena z 30 dni)
185.10 zł
219.00 zł(-15%) -
If you haven't modernized your data cleaning and reporting processes in Microsoft Excel, you're missing out on big productivity gains. And if you're looking to conduct rigorous data analysis, more can be done in Excel than you think. This practical book serves as an introduction to the modern Exc...(185.94 zł najniższa cena z 30 dni)
185.44 zł
219.00 zł(-15%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
![Loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
![ajax-loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
Oceny i opinie klientów: Practical Python Data Wrangling and Data Quality Susan E. McGregor (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.