Learning Data Science
![Język publikacji: angielski Język publikacji: angielski](https://static01.helion.com.pl/global/flagi/1.png)
- Autorzy:
- Sam Lau, Joseph Gonzalez, Deborah Nolan
![Learning Data Science Sam Lau, Joseph Gonzalez, Deborah Nolan - okładka ebooka](https://static01.helion.com.pl/global/okladki/326x466/e_3njz.png)
![Learning Data Science Sam Lau, Joseph Gonzalez, Deborah Nolan - tył okładki ebooka](https://static01.helion.com.pl/global/okladki-tyl/326x466/e_3njz.png)
- Ocena:
- Bądź pierwszym, który oceni tę książkę
- Stron:
- 596
- Dostępne formaty:
-
ePubMobi
Opis ebooka: Learning Data Science
As an aspiring data scientist, you appreciate why organizations rely on data for important decisions--whether it's for companies designing websites, cities deciding how to improve services, or scientists discovering how to stop the spread of disease. And you want the skills required to distill a messy pile of data into actionable insights. We call this the data science lifecycle: the process of collecting, wrangling, analyzing, and drawing conclusions from data.
Learning Data Science is the first book to cover foundational skills in both programming and statistics that encompass this entire lifecycle. It's aimed at those who wish to become data scientists or who already work with data scientists, and at data analysts who wish to cross the "technical/nontechnical" divide. If you have a basic knowledge of Python programming, you'll learn how to work with data using industry-standard tools like pandas.
- Refine a question of interest to one that can be studied with data
- Pursue data collection that may involve text processing, web scraping, etc.
- Glean valuable insights about data through data cleaning, exploration, and visualization
- Learn how to use modeling to describe the data
- Generalize findings beyond the data
Wybrane bestsellery
-
Statystyka to dziedzina wiedzy, która bazuje na danych – przedmiotem jej zainteresowania są metody ich pozyskiwania i prezentacji, a przede wszystkim analizy. W ostatnich latach mocno zyskuje na popularności i dziś niemal każda uczelnia w Polsce oferuje możliwość studiowania na kierunku zwi...
Statystyka. Kurs video. Przewodnik dla studentów kierunków ścisłych Statystyka. Kurs video. Przewodnik dla studentów kierunków ścisłych
(70.95 zł najniższa cena z 30 dni)83.85 zł
129.00 zł(-35%) -
Mastering Data transformation is essential for enhancing their data models and business intelligence. The Definitive Guide to Power Query equips you with the knowledge and skills to master the tool while leveraging its remarkable capabilities.
The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query The Definitive Guide to Power Query (M). Mastering complex data transformation with Power Query
Gregory Deckler, Rick de Groot, Melissa de Korte, Brian Julius
-
Jeśli w swojej pracy masz lub miewasz do czynienia z danymi, z pewnością orientujesz się, że do tego celu stworzono dotąd całkiem sporo narzędzi. Nic dziwnego – przy tej liczbie danych, z jaką spotykamy się w dzisiejszym cyfrowym świecie, zdolność do ich sprawnego analizowania i wyciągania ...
Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym Grafana. Kurs video. Monitorowanie, analiza i wizualizacja danych w czasie rzeczywistym
(39.90 zł najniższa cena z 30 dni)62.55 zł
139.00 zł(-55%) -
Oto praktyczny przewodnik po nauce o danych w miejscu pracy. Dowiesz się stąd wszystkiego, co ważne na początku Twojej drogi jako danologa: od osobowości, z którymi przyjdzie Ci pracować, przez detale analizy danych, po matematykę stojącą za algorytmami i uczeniem maszynowym. Nauczysz się myśleć ...
Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym Analityk danych. Przewodnik po data science, statystyce i uczeniu maszynowym
(41.40 zł najniższa cena z 30 dni)41.40 zł
69.00 zł(-40%) -
Autorzy, Joe Reis i Matt Housley, przeprowadzą Cię przez cykl życia inżynierii danych i pokażą, jak połączyć różne technologie chmurowe, aby spełnić potrzeby konsumentów danych w dolnej części strumienia przetwarzania. Dzięki lekturze tej książki dowiesz się, jak zastosować koncepcje generowania,...
Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie Inżynieria danych w praktyce. Kluczowe koncepcje i najlepsze technologie
(71.40 zł najniższa cena z 30 dni)71.40 zł
119.00 zł(-40%) -
Big data pokazuje, jak postęp technologiczny spowodowany rozwojem Internetu i cyfrowego wszechświata wpłynął na radykalną transformację nauki o danych. Czym są duże zbiory danych i jak zmieniają świat? Jaki mają wpływ na nasze codzienne życie, a jaki na świat biznesu? W tej książce czytelnik znaj...(19.25 zł najniższa cena z 30 dni)
12.55 zł
27.90 zł(-55%) -
W złożonej rzeczywistości myślenie systemowe jest kluczowym narzędziem pozwalającym odnieść się do licznych wyzwań: gospodarczych, ekologicznych, politycznych czy społecznych. Tylko w ten sposób w codziennych wiadomościach można dostrzec przejawy trendów, a w trendach — przeja...(29.94 zł najniższa cena z 30 dni)
29.94 zł
49.90 zł(-40%)
Ebooka "Learning Data Science" przeczytasz na:
-
czytnikach Inkbook, Kindle, Pocketbook, Onyx Boox i innych
-
systemach Windows, MacOS i innych
-
systemach Windows, Android, iOS, HarmonyOS
-
na dowolnych urządzeniach i aplikacjach obsługujących formaty: PDF, EPub, Mobi
Masz pytania? Zajrzyj do zakładki Pomoc »
Audiobooka "Learning Data Science" posłuchasz:
-
w aplikacji Ebookpoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych
-
na dowolnych urządzeniach i aplikacjach obsługujących format MP3 (pliki spakowane w ZIP)
Masz pytania? Zajrzyj do zakładki Pomoc »
Kurs Video "Learning Data Science" zobaczysz:
-
w aplikacjach Ebookpoint i Videopoint na Android, iOS, HarmonyOs
-
na systemach Windows, MacOS i innych z dostępem do najnowszej wersji Twojej przeglądarki internetowej
Szczegóły ebooka
- ISBN Ebooka:
- 978-10-981-1295-0, 9781098112950
- Data wydania ebooka:
-
2023-09-15
Data wydania ebooka często jest dniem wprowadzenia tytułu do sprzedaży i może nie być równoznaczna z datą wydania książki papierowej. Dodatkowe informacje możesz znaleźć w darmowym fragmencie. Jeśli masz wątpliwości skontaktuj się z nami sklep@ebookpoint.pl.
- Język publikacji:
- angielski
- Rozmiar pliku ePub:
- 15.7MB
- Rozmiar pliku Mobi:
- 27.9MB
Spis treści ebooka
- Preface
- Expected Background Knowledge
- Organization of the Book
- Conventions Used in This Book
- Using Code Examples
- OReilly Online Learning
- How to Contact Us
- Acknowledgments
- I. The Data Science Lifecycle
- 1. The Data Science Lifecycle
- The Stages of the Lifecycle
- Examples of the Lifecycle
- Summary
- 2. Questions and Data Scope
- Big Data and New Opportunities
- Example: Google Flu Trends
- Big Data and New Opportunities
- Target Population, Access Frame, and Sample
- Example: What Makes Members of an Online Community Active?
- Example: Who Will Win the Election?
- Example: How Do Environmental Hazards Relate to an Individuals Health?
- Instruments and Protocols
- Measuring Natural Phenomena
- Example: What Is the Level of CO2 in the Air?
- Accuracy
- Types of Bias
- Types of Variation
- Summary
- 3. Simulation and Data Design
- The Urn Model
- Sampling Designs
- Sampling Distribution of a Statistic
- Simulating the Sampling Distribution
- Simulation with the Hypergeometric Distribution
- The Urn Model
- Example: Simulating Election Poll Bias and Variance
- The Pennsylvania Urn Model
- An Urn Model with Bias
- Conducting Larger Polls
- Example: Simulating a Randomized Trial for a Vaccine
- Scope
- The Urn Model for Random Assignment
- Example: Measuring Air Quality
- Summary
- 4. Modeling with Summary Statistics
- The Constant Model
- Minimizing Loss
- Mean Absolute Error
- Mean Squared Error
- Choosing Loss Functions
- Summary
- 5. Case Study: Why Is My Bus Always Late?
- Question and Scope
- Data Wrangling
- Exploring Bus Times
- Modeling Wait Times
- Summary
- II. Rectangular Data
- 6. Working with Dataframes Using pandas
- Subsetting
- Data Scope and Question
- Dataframes and Indices
- Slicing
- Filtering Rows
- Example: How Recently Has Luna Become a Popular Name?
- Subsetting
- Aggregating
- Basic Group-Aggregate
- Example: Using .value_counts()
- Basic Group-Aggregate
- Grouping on Multiple Columns
- Custom Aggregation Functions
- Pivoting
- Joining
- Inner Joins
- Left, Right, and Outer Joins
- Example: Popularity of NYT Name Categories
- Transforming
- Apply
- Example: Popularity of L Names
- The Price of Apply
- How Are Dataframes Different from Other Data Representations?
- Dataframes and Spreadsheets
- Dataframes and Matrices
- Dataframes and Relations
- Summary
- 7. Working with Relations Using SQL
- Subsetting
- SQL Basics: SELECT and FROM
- Whats a Relation?
- Slicing
- Filtering Rows
- Example: How Recently Has Luna Become a Popular Name?
- Subsetting
- Aggregating
- Basic Group-Aggregate Using GROUP BY
- Grouping on Multiple Columns
- Other Aggregation Functions
- Joining
- Inner Joins
- Left and Right Joins
- Example: Popularity of NYT Name Categories
- Transforming and Common Table Expressions
- SQL Functions
- Multistep Queries Using a WITH Clause
- Example: Popularity of L Names
- Summary
- III. Understanding The Data
- 8. Wrangling Files
- Data Source Examples
- Drug Abuse Warning Network (DAWN) Survey
- San Francisco Restaurant Food Safety
- Data Source Examples
- File Formats
- Delimited Format
- Fixed-Width Format
- Hierarchical Formats
- Loosely Formatted Text
- File Encoding
- File Size
- The Shell and Command-Line Tools
- Table Shape and Granularity
- Granularity of Restaurant Inspections and Violations
- DAWN Survey Shape and Granularity
- Summary
- 9. Wrangling Dataframes
- Example: Wrangling CO2 Measurements from the Mauna Loa Observatory
- Quality Checks
- Addressing Missing Data
- Reshaping the Data Table
- Example: Wrangling CO2 Measurements from the Mauna Loa Observatory
- Quality Checks
- Quality Based on Scope
- Quality of Measurements and Recorded Values
- Quality Across Related Features
- Quality for Analysis
- Fixing the Data or Not
- Missing Values and Records
- Transformations and Timestamps
- Transforming Timestamps
- Piping for Transformations
- Modifying Structure
- Example: Wrangling Restaurant Safety Violations
- Narrowing the Focus
- Aggregating Violations
- Extracting Information from Violation Descriptions
- Summary
- 10. Exploratory Data Analysis
- Feature Types
- Example: Dog Breeds
- Transforming Qualitative Features
- Relabel categories
- Collapse categories
- Convert quantitative to ordinal
- The Importance of Feature Types
- Feature Types
- What to Look For in a Distribution
- What to Look For in a Relationship
- Two Quantitative Features
- One Qualitative and One Quantitative Variable
- Two Qualitative Features
- Comparisons in Multivariate Settings
- Guidelines for Exploration
- Example: Sale Prices for Houses
- Understanding Price
- What Next?
- Examining Other Features
- Delving Deeper into Relationships
- Fixing Location
- EDA Discoveries
- Summary
- 11. Data Visualization
- Choosing Scale to Reveal Structure
- Filling the Data Region
- Including Zero
- Revealing Shape Through Transformations
- Banking to Decipher Relationships
- Revealing Relationships Through Straightening
- Choosing Scale to Reveal Structure
- Smoothing and Aggregating Data
- Smoothing Techniques to Uncover Shape
- Smoothing Techniques to Uncover Relationships and Trends
- Smoothing Techniques Need Tuning
- Reducing Distributions to Quantiles
- When Not to Smooth
- Facilitating Meaningful Comparisons
- Emphasize the Important Difference
- Ordering Groups
- Avoid Stacking
- Selecting a Color Palette
- Guidelines for Comparisons in Plots
- Incorporating the Data Design
- Data Collected Over Time
- Observational Studies
- Unequal Sampling
- Geographic Data
- Adding Context
- Example: 100m Sprint Times
- Creating Plots Using plotly
- Figure and Trace Objects
- Modifying Layout
- Plotting Functions
- Annotations
- Other Tools for Visualization
- matplotlib
- Grammar of Graphics
- Summary
- 12. Case Study: How Accurate Are Air Quality Measurements?
- Question, Design, and Scope
- Finding Collocated Sensors
- Wrangling the List of AQS Sites
- Wrangling the List of PurpleAir Sites
- Matching AQS and PurpleAir Sensors
- Wrangling and Cleaning AQS Sensor Data
- Checking Granularity
- Removing Unneeded Columns
- Checking the Validity of Dates
- Checking the Quality of PM2.5 Measurements
- Wrangling PurpleAir Sensor Data
- Checking the Granularity
- Visualizing timestamps
- Checking the sampling rate
- Checking the Granularity
- Handling Missing Values
- Exploring PurpleAir and AQS Measurements
- Creating a Model to Correct PurpleAir Measurements
- Summary
- IV. Other Data Sources
- 13. Working with Text
- Examples of Text and Tasks
- Convert Text into a Standard Format
- Extract a Piece of Text to Create a Feature
- Transform Text into Features
- Text Analysis
- Examples of Text and Tasks
- String Manipulation
- Converting Text to a Standard Format with Python String Methods
- String Methods in pandas
- Splitting Strings to Extract Pieces of Text
- Regular Expressions
- Concatenation of Literals
- Character classes
- Wildcard character
- Negated character classes
- Shorthands for character classes
- Anchors and boundaries
- Escaping metacharacters
- Concatenation of Literals
- Quantifiers
- Alternation and Grouping to Create Features
- Reference Tables
- Text Analysis
- Summary
- 14. Data Exchange
- NetCDF Data
- JSON Data
- HTTP
- REST
- XML, HTML, and XPath
- Example: Scraping Race Times from Wikipedia
- XPath
- Example: Accessing Exchange Rates from the ECB
- Summary
- V. Linear Modeling
- 15. Linear Models
- Simple Linear Model
- Example: A Simple Linear Model for Air Quality
- Interpreting Linear Models
- Assessing the Fit
- Fitting the Simple Linear Model
- Multiple Linear Model
- Fitting the Multiple Linear Model
- Example: Where Is the Land of Opportunity?
- Explaining Upward Mobility Using Commute Time
- Relating Upward Mobility Using Multiple Variables
- Feature Engineering for Numeric Measurements
- Feature Engineering for Categorical Measurements
- Summary
- 16. Model Selection
- Overfitting
- Example: Energy Consumption
- Overfitting
- Train-Test Split
- Cross-Validation
- Regularization
- Model Bias and Variance
- Summary
- 17. Theory for Inference and Prediction
- Distributions: Population, Empirical, Sampling
- Basics of Hypothesis Testing
- Example: A Rank Test to Compare Productivity of Wikipedia Contributors
- Example: A Test of Proportions for Vaccine Efficacy
- Bootstrapping for Inference
- Basics of Confidence Intervals
- Basics of Prediction Intervals
- Example: Predicting Bus Lateness
- Example: Predicting Crab Size
- Example: Predicting the Incremental Growth of a Crab
- Probability for Inference and Prediction
- Formalizing the Theory for Average Rank Statistics
- General Properties of Random Variables
- Probability Behind Testing and Intervals
- Probability Behind Model Selection
- Summary
- 18. Case Study: How to Weigh a Donkey
- Donkey Study Question and Scope
- Wrangling and Transforming
- Exploring
- Modeling a Donkeys Weight
- A Loss Function for Prescribing Anesthetics
- Fitting a Simple Linear Model
- Fitting a Multiple Linear Model
- Bringing Qualitative Features into the Model
- Model Assessment
- Summary
- VI. Classification
- 19. Classification
- Example: Wind-Damaged Trees
- Modeling and Classification
- A Constant Model
- Examining the Relationship Between Size and Windthrow
- Modeling Proportions (and Probabilities)
- A Logistic Model
- Log Odds
- Using a Logistic Curve
- A Loss Function for the Logistic Model
- From Probabilities to Classification
- The Confusion Matrix
- Precision Versus Recall
- Summary
- 20. Numerical Optimization
- Gradient Descent Basics
- Minimizing Huber Loss
- Convex and Differentiable Loss Functions
- Variants of Gradient Descent
- Stochastic Gradient Descent
- Mini-Batch Gradient Descent
- Newtons Method
- Summary
- 21. Case Study: Detecting Fake News
- Question and Scope
- Obtaining and Wrangling the Data
- Exploring the Data
- Exploring the Publishers
- Exploring Publication Date
- Exploring Words in Articles
- Modeling
- A Single-Word Model
- Multiple-Word Model
- Predicting with the tf-idf Transform
- Summary
- Additional Material
- Data Sources
- Index
O'Reilly Media - inne książki
-
Keeping up with the Python ecosystem can be daunting. Its developer tooling doesn't provide the out-of-the-box experience native to languages like Rust and Go. When it comes to long-term project maintenance or collaborating with others, every Python project faces the same problem: how to build re...(201.03 zł najniższa cena z 30 dni)
200.93 zł
239.00 zł(-16%) -
Bringing a deep-learning project into production at scale is quite challenging. To successfully scale your project, a foundational understanding of full stack deep learning, including the knowledge that lies at the intersection of hardware, software, data, and algorithms, is required.This book il...(241.36 zł najniższa cena z 30 dni)
241.26 zł
289.00 zł(-17%) -
Frontend developers have to consider many things: browser compatibility, usability, performance, scalability, SEO, and other best practices. But the most fundamental aspect of creating websites is one that often falls short: accessibility. Accessibility is the cornerstone of any website, and if a...(200.59 zł najniższa cena z 30 dni)
200.09 zł
239.00 zł(-16%) -
In this insightful and comprehensive guide, Addy Osmani shares more than a decade of experience working on the Chrome team at Google, uncovering secrets to engineering effectiveness, efficiency, and team success. Engineers and engineering leaders looking to scale their effectiveness and drive tra...(114.93 zł najniższa cena z 30 dni)
114.88 zł
149.00 zł(-23%) -
Data modeling is the single most overlooked feature in Power BI Desktop, yet it's what sets Power BI apart from other tools on the market. This practical book serves as your fast-forward button for data modeling with Power BI, Analysis Services tabular, and SQL databases. It serves as a starting ...(199.08 zł najniższa cena z 30 dni)
198.88 zł
239.00 zł(-17%) -
C# is undeniably one of the most versatile programming languages available to engineers today. With this comprehensive guide, you'll learn just how powerful the combination of C# and .NET can be. Author Ian Griffiths guides you through C# 12.0 and .NET 8 fundamentals and techniques for building c...(241.02 zł najniższa cena z 30 dni)
240.92 zł
289.00 zł(-17%) -
Learn how to get started with Futures Thinking. With this practical guide, Phil Balagtas, founder of the Design Futures Initiative and the global Speculative Futures network, shows you how designers and futurists have made futures work at companies such as Atari, IBM, Apple, Disney, Autodesk, Luf...(148.10 zł najniższa cena z 30 dni)
148.00 zł
179.00 zł(-17%) -
Augmented Analytics isn't just another book on data and analytics; it's a holistic resource for reimagining the way your entire organization interacts with information to become insight-driven.Moving beyond traditional, limited ways of making sense of data, Augmented Analytics provides a dynamic,...(174.74 zł najniższa cena z 30 dni)
174.54 zł
219.00 zł(-20%) -
Learn how to prepare for—and pass—the Kubernetes and Cloud Native Associate (KCNA) certification exam. This practical guide serves as both a study guide and point of entry for practitioners looking to explore and adopt cloud native technologies. Adrián González Sánchez ...
Kubernetes and Cloud Native Associate (KCNA) Study Guide Kubernetes and Cloud Native Associate (KCNA) Study Guide
(169.14 zł najniższa cena z 30 dni)177.65 zł
199.00 zł(-11%) -
Python is an excellent way to get started in programming, and this clear, concise guide walks you through Python a step at a time—beginning with basic programming concepts before moving on to functions, data structures, and object-oriented design. This revised third edition reflects the gro...(140.34 zł najniższa cena z 30 dni)
140.14 zł
179.00 zł(-22%)
Dzieki opcji "Druk na żądanie" do sprzedaży wracają tytuły Grupy Helion, które cieszyły sie dużym zainteresowaniem, a których nakład został wyprzedany.
Dla naszych Czytelników wydrukowaliśmy dodatkową pulę egzemplarzy w technice druku cyfrowego.
Co powinieneś wiedzieć o usłudze "Druk na żądanie":
- usługa obejmuje tylko widoczną poniżej listę tytułów, którą na bieżąco aktualizujemy;
- cena książki może być wyższa od początkowej ceny detalicznej, co jest spowodowane kosztami druku cyfrowego (wyższymi niż koszty tradycyjnego druku offsetowego). Obowiązująca cena jest zawsze podawana na stronie WWW książki;
- zawartość książki wraz z dodatkami (płyta CD, DVD) odpowiada jej pierwotnemu wydaniu i jest w pełni komplementarna;
- usługa nie obejmuje książek w kolorze.
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka, którą chcesz zamówić pochodzi z końcówki nakładu. Oznacza to, że mogą się pojawić drobne defekty (otarcia, rysy, zagięcia).
Co powinieneś wiedzieć o usłudze "Końcówka nakładu":
- usługa obejmuje tylko książki oznaczone tagiem "Końcówka nakładu";
- wady o których mowa powyżej nie podlegają reklamacji;
Masz pytanie o konkretny tytuł? Napisz do nas: sklep[at]helion.pl.
Książka drukowana
![Loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
![ajax-loader](https://static01.helion.com.pl/ebookpoint/img/ajax-loader.gif)
Oceny i opinie klientów: Learning Data Science Sam Lau, Joseph Gonzalez, Deborah Nolan (0)
Weryfikacja opinii następuję na podstawie historii zamówień na koncie Użytkownika umieszczającego opinię. Użytkownik mógł otrzymać punkty za opublikowanie opinii uprawniające do uzyskania rabatu w ramach Programu Punktowego.